大家好,欢迎来到IT知识分享网。
一、导数的定义
导数是微积分中的一个基本概念,用于衡量一个函数在某一点处的变化率。对于一个给定的函数 f ( x ) f(x) f(x),其在点 x x x的导数可以定义为该函数在 x x x 点的瞬时变化率,也就是曲线在该点的切线斜率。
如图对 x 0 x_0 x0求导可写成如下表达式:
d y d x ∣ x = x 0 \left.\frac{d y}{d x}\right |_{x=x_0} dxdy
x=x0
或
y ′ ∣ x = x 0 \left.y^{\prime}\right|_{x=x_0} y′∣x=x0
或
f ′ ( x 0 ) = l i m Δ x → 0 f ( x 0 + Δ x ) − f ( x ) Δ x f^{\prime}(x_0) = \substack{lim\\ \Delta_x\rightarrow0} \frac{f(x_0 + \Delta_x) – f(x)}{\Delta_x} f′(x0)=limΔx→0Δxf(x0+Δx)−f(x)
二、导函数运算
当 x 0 x_0 x0发生变化时,函数 y = f ( x ) 在 x 0 y=f(x)在x_0 y=f(x)在x0点的导数也会发生相应的变化,所以函数 y = f ( x ) y = f(x) y=f(x)的导数本身也是 x x x的函数,我们称为函数 y = f ( x ) y= f(x) y=f(x) 的导函数, 记作:
d y d x \frac{d y}{d x} dxdy 或 y ′ y^{\prime} y′ 或 f ′ ( x ) f^{\prime}(x) f′(x)
函数的导数是函数的一个重要性质,它表示的是函数在 x 0 x_0 x0的瞬间变化率,从其几何意义上来说,它表示的是函数的曲线在 x 0 x_0 x0的切线的斜率。
根据导数的定义,我们很容易得到以下的结论:
(1)函数 y = C y=C y=C(其中 C C C是常数)的导函数是 y = 0 y=0 y=0。
(2)函数 y = C x y= Cx y=Cx(其中 C C C 是常数)的导函数是 y = C y=C y=C。
(3)函数 y = C x 2 y=Cx^2 y=Cx2(其中 C C C是常数)的导函数是 y = 2 C x y=2Cx y=2Cx.
(4) ( s i n x ) ′ = c o s x (sinx)^{\prime} =cosx (sinx)′=cosx
(5) ( c o s x ) ′ = − s i n x (cosx)^{\prime} =−sinx (cosx)′=−sinx
(6) ( e x ) ′ = e x (e^x) ^{\prime} =e^x (ex)′=ex
导数四则运算法则
(1) [ u ( x ) ± v ( x ] ′ = u ′ ( x ) ± v ( x ) [u(x)± v(x]’= u'(x)± v(x) [u(x)±v(x]′=u′(x)±v(x)
(2) [ u ( x ) υ ( x ) ] ′ = u ′ ( x ) v ( x ) + u ( x ) v ′ ( x ) [u(x)υ(x)]’= u'(x)v(x)+u(x)v'(x) [u(x)υ(x)]′=u′(x)v(x)+u(x)v′(x)
(3) [ u ( x ) v ( x ) ] ′ = u ′ ( x ) v ( x ) − u ( x ) v ′ ( x ) [ v ( x ) ] 2 , v ( x ) ≠ 0 \left.\right[\frac{u(x)}{v(x)}]^ {\prime} =\frac{u'(x)v(x)-u(x)v'(x)}{[v(x)]^2},v(x) \neq0 [v(x)u(x)]′=[v(x)]2u′(x)v(x)−u(x)v′(x),v(x)=0
(4) 复合函数求导法则
f [ g ( x ) ] ′ = f ′ ( u ) g ′ ( x ) , 其中 u = g ( x ) {f[g(x)]}^{\prime}=f^{\prime}(u)g^{\prime}(x),其中u=g(x) f[g(x)]′=f′(u)g′(x),其中u=g(x)
复合函数的求导法则是理解反向传播机制的重要基础
复合函数求导举例:
我们需要求复合函数 f ( g ( x ) ) f(g(x)) f(g(x))的导数。首先,我们计算 f ( g ( x ) ) f(g(x)) f(g(x)):
f ( g ( x ) ) f(g(x)) f(g(x)) = f ( 2 x + 3 ) = ( 2 x + 3 ) 2 f(2x+3) = (2x+3)^2 f(2x+3)=(2x+3)2
首先求 g ( x ) g(x) g(x)的导数 g ′ ( x ) g'(x) g′(x)
g ′ ( x ) = d d x ( 2 x + 3 ) = 2 g'(x)=\frac{d}{d_x}(2x+3)=2 g′(x)=dxd(2x+3)=2
接着求 f ( u ) f(u) f(u)在 u = g ( x ) u=g(x) u=g(x)处的导数 f ′ ( g ( x ) ) f^{\prime}(g(x)) f′(g(x))。由于 f ( u ) = u 2 f(u)=u^2 f(u)=u2,我们有:
f ′ ( u ) = d d u ( u 2 ) = 2 u f^{\prime}(u) = \frac{d}{d_u}(u^2)=2u f′(u)=dud(u2)=2u
将 u u u替换为 g ( x ) g(x) g(x),得到 f [ g ( x ) ] ′ {f[g(x)]}’ f[g(x)]′:
f [ g ( x ) ] ′ = 2 ( 2 x + 3 ) {f[g(x)]}’ = 2(2x+3) f[g(x)]′=2(2x+3)
现在,我们可以将 f ′ ( g ( x ) ) f^{\prime}(g(x)) f′(g(x))和 g ′ ( x ) g'(x) g′(x)相乘得到 f [ g ( x ) ] ′ {f[g(x)]}’ f[g(x)]′:
f [ g ( x ) ] ′ = f ′ ( g ( x ) ) ∗ g ′ ( x ) = 2 ( 2 x + 3 ) ∗ 2 {f[g(x)]}’=f^{\prime}(g(x))*g'(x) =2(2x+3) * 2 f[g(x)]′=f′(g(x))∗g′(x)=2(2x+3)∗2
三、极值附近导数的性质
设函数 f ( x ) f(x) f(x)在 x 0 x_0 x0 的某邻域 U ( x 0 ) U(x_0) U(x0)内有定义,在 x 0 x_0 x0处取得极值,且 f ( x 0 ) ′ f(x_0)^{\prime} f(x0)′存在,则 f ( x 0 ) ′ = 0 f(x_0)^{\prime}= 0 f(x0)′=0。
此处也称之为费马定理。
函数 f ( x ) f(x) f(x)在 A , B , C A,B,C A,B,C 出取得极值,此时 f ′ ( x A ) = f ′ ( x B ) = f ′ ( x C ) = 0 f^{\prime}(x_A)= f^{\prime}(x_B)= f^{\prime}(x_C)= 0 f′(xA)=f′(xB)=f′(xC)=0。
性质归纳:
以上结论在学习梯度下降算法时有极重要的作用。
四、泰勒展式
f ( x ) = f ( x 0 ) + f ′ ( x 0 ) 1 ! ( x − x 0 ) + f ′ ′ ( x 0 ) 2 ! ( x − x 0 ) 2 + . . . + f n ( x 0 ) n ! ( x − x 0 ) n + R n f(x) = f(x_0) + \frac{f^\prime(x_0)}{1!}(x-x_0) +\frac{f^{”} (x_0)}{2!}(x-x_0)^2+…+\frac{f^{n} (x_0)}{n!}(x-x_0)^n+R_n f(x)=f(x0)+1!f′(x0)(x−x0)+2!f′′(x0)(x−x0)2+…+n!fn(x0)(x−x0)n+Rn
泰勒展式的一个重要应用是在物理学和工程学中,它可以用来近似计算复杂函数的值,尤其是在数值分析和计算科学中非常有用。此外,泰勒展式也是研究函数局部行为的重要工具,比如通过泰勒展式可以分析函数在某点的凹凸性、极值等性质。
五、多元函数的偏导数(以二元函数为例)
对于二元函数 z = f ( x , y ) z=f(x,y) z=f(x,y)来说,它有2个自变量: x , y x,y x,y。我们可以求这个函数在 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)点的导数,该导数可以对变量 x x x来求,也可以对变量 y y y来求。
对变量 x x x来求导数就是
l i m Δ x → 0 f ( x 0 + Δ x , y 0 ) − f ( x 0 , y 0 ) Δ x \substack{lim\\ \Delta_x\rightarrow0} \frac{f(x_0 +\Delta_x,y_0 ) -f(x_0,y_0)}{\Delta_x} limΔx→0Δxf(x0+Δx,y0)−f(x0,y0)
它称为函数 z = f ( x , y ) z=f(x,y) z=f(x,y)在 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)点对于 x x x的偏导数,记作
∂ z ∂ x ∣ x = x 0 , y = y 0 \left.\frac{\partial z}{\partial x}\right|_{x=x_0,y=y_0} ∂x∂z
x=x0,y=y0
或
z x ∣ x = x 0 , y = y 0 z_x|_{x=x_0,y=y_0} zx∣x=x0,y=y0
或
f x ( x 0 , y 0 ) f_x(x_0,y_0) fx(x0,y0)
对于变量 y y y来求导数就是
l i m Δ x → 0 f ( x 0 , y 0 + Δ y ) − f ( x 0 , y 0 ) Δ y \substack{lim\\ \Delta_x\rightarrow0} \frac{f(x_0 ,y_0+\Delta_y ) – f(x_0,y_0)}{\Delta_y} limΔx→0Δyf(x0,y0+Δy)−f(x0,y0)
它称为函数 z = f ( x , y ) z=f(x,y) z=f(x,y)在 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)点对于 y y y的偏导数,记作
∂ z ∂ y ∣ x = x 0 , y = y 0 \left.\frac{\partial z}{\partial y}\right|_{x=x_0,y=y_0} ∂y∂z
x=x0,y=y0
或
z y ∣ x = x 0 , y = y 0 z_y|_{x=x_0,y=y_0} zy∣x=x0,y=y0
或
f y ( x 0 , y 0 ) f_y(x_0,y_0) fy(x0,y0)
偏导函数
与导数类似,函数 z = f ( x , y ) z=f(x,y) z=f(x,y) 对于变量 x x x的偏导数也是 x , y x,y x,y的函数,称为函数 z = f ( x , y ) z=f(x,y) z=f(x,y)对于变量 x x x的偏导函数,记作
∂ z ∂ x \frac{\partial z}{\partial x} ∂x∂z 或 z x z_x zx 或 f x ( x , y ) f_x(x,y) fx(x,y)
同样 函数 z = f ( x , y ) z=f(x,y) z=f(x,y) 对于变量 x x x的偏导数也是 x , y x,y x,y的函数,称为函数 z = f ( x , y ) z=f(x,y) z=f(x,y)对于变量 y y y 的偏导函数,记作
∂ z ∂ y \frac{\partial z}{\partial y} ∂y∂z 或 z y z_y zy 或 f y ( x , y ) f_y(x,y) fy(x,y)
梯度
多元函数的梯度是一个向量,包含了函数对所有变量的偏导数。对于函数 f ( x , y ) f(x,y) f(x,y),梯度 ∇ f \nabla f ∇f定义为:
∇ f = ( ∂ f ∂ x , ∂ f ∂ y ) \nabla f=(\frac{\partial f }{\partial x},\frac{\partial f }{\partial y}) ∇f=(∂x∂f,∂y∂f)
偏导数的意义
函数 z = f ( x , y ) z= f(x,y) z=f(x,y)在 ( x o , y o ) (xo,yo) (xo,yo)点对于变量 x x x的偏导数是变量 y y y不变情况下变量 x x x在(x_0,y_0)点的瞬间变化率;函数 z = f ( x , y ) z=f(x,y) z=f(x,y)在 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)点对于变量 y y y的偏导数是变量 x x x不变情况下变量 y y y在 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)点的瞬间变化率。
多元函数的偏导数同样是理解梯度下降算法的重要基础
二元函数的求导举例
假设我们有一个二元函数 f = ( x , y ) = x 2 y f=(x,y)=x^2y f=(x,y)=x2y,我们要求它在 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)的偏导数和梯度。
1.关于 x x x的偏导数:
此时将 y y y当作常数
∂ f ∂ x = ∂ ∂ x ( x 2 y ) = 2 x y \frac{\partial f}{\partial x}=\frac{\partial }{\partial x}(x^2y) = 2xy ∂x∂f=∂x∂(x2y)=2xy
2.关于 y y y的偏导数:
此时将 x x x当作常数
∂ f ∂ y = ∂ ∂ y ( x 2 y ) = x 2 \frac{\partial f}{\partial y}=\frac{\partial }{\partial y}(x^2y) = x^2 ∂y∂f=∂y∂(x2y)=x2
3.梯度向量:
∇ f = ( ∂ f ∂ x , ∂ f ∂ y ) = ( 2 x y , x 2 ) \nabla f=(\frac{\partial f }{\partial x},\frac{\partial f }{\partial y})= (2xy,x^2) ∇f=(∂x∂f,∂y∂f)=(2xy,x2)
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/140053.html