微积分概述

微积分概述本文简单阐述了微积分常见知识点 导数定义 导函数的求导法则 费马定理 极值性质 泰勒展式 多元函数的偏导数 并举例说明可复合函数求导和多元函数求导

大家好,欢迎来到IT知识分享网。

一、导数的定义

导数是微积分中的一个基本概念,用于衡量一个函数在某一点处的变化率。对于一个给定的函数 f ( x ) f(x) f(x),其在点 x x x的导数可以定义为该函数在 x x x 点的瞬时变化率,也就是曲线在该点的切线斜率。
在这里插入图片描述
如图对 x 0 x_0 x0求导可写成如下表达式:
d y d x ∣ x = x 0 \left.\frac{d y}{d x}\right |_{x=x_0} dxdy
x=x0


y ′ ∣ x = x 0 \left.y^{\prime}\right|_{x=x_0} yx=x0

f ′ ( x 0 ) = l i m Δ x → 0 f ( x 0 + Δ x ) − f ( x ) Δ x f^{\prime}(x_0) = \substack{lim\\ \Delta_x\rightarrow0} \frac{f(x_0 + \Delta_x) – f(x)}{\Delta_x} f(x0)=limΔx0Δxf(x0+Δx)f(x)






二、导函数运算

x 0 x_0 x0发生变化时,函数 y = f ( x ) 在 x 0 y=f(x)在x_0 y=f(x)x0点的导数也会发生相应的变化,所以函数 y = f ( x ) y = f(x) y=f(x)的导数本身也是 x x x的函数,我们称为函数 y = f ( x ) y= f(x) y=f(x) 的导函数, 记作:

          d y d x \frac{d y}{d x} dxdy 或   y ′ y^{\prime} y 或   f ′ ( x ) f^{\prime}(x) f(x)

函数的导数是函数的一个重要性质,它表示的是函数在 x 0 x_0 x0的瞬间变化率,从其几何意义上来说,它表示的是函数的曲线在 x 0 x_0 x0的切线的斜率。

根据导数的定义,我们很容易得到以下的结论:
(1)函数 y = C y=C y=C(其中 C C C是常数)的导函数是 y = 0 y=0 y=0
(2)函数 y = C x y= Cx y=Cx(其中 C C C 是常数)的导函数是 y = C y=C y=C
(3)函数 y = C x 2 y=Cx^2 y=Cx2(其中 C C C是常数)的导函数是 y = 2 C x y=2Cx y=2Cx.
(4) ( s i n x ) ′ = c o s x (sinx)^{\prime} =cosx (sinx)=cosx
(5) ( c o s x ) ′ = − s i n x (cosx)^{\prime} =−sinx (cosx)=sinx
(6) ( e x ) ′ = e x (e^x) ^{\prime} =e^x (ex)=ex





导数四则运算法则

(1) [ u ( x ) ± v ( x ] ′ = u ′ ( x ) ± v ( x ) [u(x)± v(x]’= u'(x)± v(x) [u(x)±v(x]=u(x)±v(x)

   (2) [ u ( x ) υ ( x ) ] ′ = u ′ ( x ) v ( x ) + u ( x ) v ′ ( x ) [u(x)υ(x)]’= u'(x)v(x)+u(x)v'(x) [u(x)υ(x)]=u(x)v(x)+u(x)v(x)

   (3) [ u ( x ) v ( x ) ] ′ = u ′ ( x ) v ( x ) − u ( x ) v ′ ( x ) [ v ( x ) ] 2 , v ( x ) ≠ 0 \left.\right[\frac{u(x)}{v(x)}]^ {\prime} =\frac{u'(x)v(x)-u(x)v'(x)}{[v(x)]^2},v(x) \neq0 [v(x)u(x)]=[v(x)]2u(x)v(x)u(x)v(x),v(x)=0

   (4) 复合函数求导法则
      f [ g ( x ) ] ′ = f ′ ( u ) g ′ ( x ) , 其中 u = g ( x ) {f[g(x)]}^{\prime}=f^{\prime}(u)g^{\prime}(x),其中u=g(x) f[g(x)]=f(u)g(x),其中u=g(x)

复合函数的求导法则是理解反向传播机制的重要基础

复合函数求导举例:

我们需要求复合函数 f ( g ( x ) ) f(g(x)) f(g(x))的导数。首先,我们计算 f ( g ( x ) ) f(g(x)) f(g(x)):
f ( g ( x ) ) f(g(x)) f(g(x)) = f ( 2 x + 3 ) = ( 2 x + 3 ) 2 f(2x+3) = (2x+3)^2 f(2x+3)=(2x+3)2

首先求 g ( x ) g(x) g(x)的导数 g ′ ( x ) g'(x) g(x)
g ′ ( x ) = d d x ( 2 x + 3 ) = 2 g'(x)=\frac{d}{d_x}(2x+3)=2 g(x)=dxd(2x+3)=2

接着求 f ( u ) f(u) f(u) u = g ( x ) u=g(x) u=g(x)处的导数 f ′ ( g ( x ) ) f^{\prime}(g(x)) f(g(x))。由于 f ( u ) = u 2 f(u)=u^2 f(u)=u2,我们有:
f ′ ( u ) = d d u ( u 2 ) = 2 u f^{\prime}(u) = \frac{d}{d_u}(u^2)=2u f(u)=dud(u2)=2u

u u u替换为 g ( x ) g(x) g(x),得到 f [ g ( x ) ] ′ {f[g(x)]}’ f[g(x)]:
f [ g ( x ) ] ′ = 2 ( 2 x + 3 ) {f[g(x)]}’ = 2(2x+3) f[g(x)]=2(2x+3)

现在,我们可以将 f ′ ( g ( x ) ) f^{\prime}(g(x)) f(g(x)) g ′ ( x ) g'(x) g(x)相乘得到 f [ g ( x ) ] ′ {f[g(x)]}’ f[g(x)]:
f [ g ( x ) ] ′ = f ′ ( g ( x ) ) ∗ g ′ ( x ) = 2 ( 2 x + 3 ) ∗ 2 {f[g(x)]}’=f^{\prime}(g(x))*g'(x) =2(2x+3) * 2 f[g(x)]=f(g(x))g(x)=2(2x+3)2

三、极值附近导数的性质

设函数 f ( x ) f(x) f(x) x 0 x_0 x0 的某邻域 U ( x 0 ) U(x_0) U(x0)内有定义,在 x 0 x_0 x0处取得极值,且 f ( x 0 ) ′ f(x_0)^{\prime} f(x0)存在,则 f ( x 0 ) ′ = 0 f(x_0)^{\prime}= 0 f(x0)=0
此处也称之为费马定理。
在这里插入图片描述
函数 f ( x ) f(x) f(x) A , B , C A,B,C A,B,C 出取得极值,此时 f ′ ( x A ) = f ′ ( x B ) = f ′ ( x C ) = 0 f^{\prime}(x_A)= f^{\prime}(x_B)= f^{\prime}(x_C)= 0 f(xA)=f(xB)=f(xC)=0


性质归纳:

以上结论在学习梯度下降算法时有极重要的作用

四、泰勒展式

f ( x ) = f ( x 0 ) + f ′ ( x 0 ) 1 ! ( x − x 0 ) + f ′ ′ ( x 0 ) 2 ! ( x − x 0 ) 2 + . . . + f n ( x 0 ) n ! ( x − x 0 ) n + R n f(x) = f(x_0) + \frac{f^\prime(x_0)}{1!}(x-x_0) +\frac{f^{”} (x_0)}{2!}(x-x_0)^2+…+\frac{f^{n} (x_0)}{n!}(x-x_0)^n+R_n f(x)=f(x0)+1!f(x0)(xx0)+2!f′′(x0)(xx0)2++n!fn(x0)(xx0)n+Rn

泰勒展式的一个重要应用是在物理学和工程学中,它可以用来近似计算复杂函数的值,尤其是在数值分析和计算科学中非常有用。此外,泰勒展式也是研究函数局部行为的重要工具,比如通过泰勒展式可以分析函数在某点的凹凸性、极值等性质。 

五、多元函数的偏导数(以二元函数为例)

   对于二元函数 z = f ( x , y ) z=f(x,y) z=f(x,y)来说,它有2个自变量: x , y x,y x,y。我们可以求这个函数在 ( x 0 , y 0 ) (x_0,y_0) x0,y0点的导数,该导数可以对变量 x x x来求,也可以对变量 y y y来求。

对变量 x x x来求导数就是
l i m Δ x → 0 f ( x 0 + Δ x , y 0 ) − f ( x 0 , y 0 ) Δ x \substack{lim\\ \Delta_x\rightarrow0} \frac{f(x_0 +\Delta_x,y_0 ) -f(x_0,y_0)}{\Delta_x} limΔx0Δxf(x0+Δx,y0)f(x0,y0)
它称为函数 z = f ( x , y ) z=f(x,y) z=f(x,y) ( x 0 , y 0 ) (x_0,y_0) x0,y0点对于 x x x的偏导数,记作
∂ z ∂ x ∣ x = x 0 , y = y 0 \left.\frac{\partial z}{\partial x}\right|_{x=x_0,y=y_0} xz
x=x0,y=y0


z x ∣ x = x 0 , y = y 0 z_x|_{x=x_0,y=y_0} zxx=x0,y=y0

f x ( x 0 , y 0 ) f_x(x_0,y_0) fx(x0,y0)






对于变量 y y y来求导数就是
l i m Δ x → 0 f ( x 0 , y 0 + Δ y ) − f ( x 0 , y 0 ) Δ y \substack{lim\\ \Delta_x\rightarrow0} \frac{f(x_0 ,y_0+\Delta_y ) – f(x_0,y_0)}{\Delta_y} limΔx0Δyf(x0,y0+Δy)f(x0,y0)
它称为函数 z = f ( x , y ) z=f(x,y) z=f(x,y) ( x 0 , y 0 ) (x_0,y_0) x0,y0点对于 y y y的偏导数,记作
∂ z ∂ y ∣ x = x 0 , y = y 0 \left.\frac{\partial z}{\partial y}\right|_{x=x_0,y=y_0} yz
x=x0,y=y0


z y ∣ x = x 0 , y = y 0 z_y|_{x=x_0,y=y_0} zyx=x0,y=y0

f y ( x 0 , y 0 ) f_y(x_0,y_0) fy(x0,y0)

偏导函数









   与导数类似,函数 z = f ( x , y ) z=f(x,y) z=f(x,y) 对于变量 x x x的偏导数也是 x , y x,y x,y的函数,称为函数 z = f ( x , y ) z=f(x,y) z=f(x,y)对于变量 x x x的偏导函数,记作

            ∂ z ∂ x \frac{\partial z}{\partial x} xz   或 z x z_x zx   或   f x ( x , y ) f_x(x,y) fx(x,y)

   同样 函数 z = f ( x , y ) z=f(x,y) z=f(x,y) 对于变量 x x x的偏导数也是 x , y x,y x,y的函数,称为函数 z = f ( x , y ) z=f(x,y) z=f(x,y)对于变量 y y y 的偏导函数,记作

            ∂ z ∂ y \frac{\partial z}{\partial y} yz   或 z y z_y zy   或   f y ( x , y ) f_y(x,y) fy(x,y)

梯度

     多元函数的梯度是一个向量,包含了函数对所有变量的偏导数。对于函数 f ( x , y ) f(x,y) f(x,y),梯度 ∇ f \nabla f f定义为:
∇ f = ( ∂ f ∂ x , ∂ f ∂ y ) \nabla f=(\frac{\partial f }{\partial x},\frac{\partial f }{\partial y}) f=(xf,yf)

偏导数的意义

      函数 z = f ( x , y ) z= f(x,y) z=f(x,y) ( x o , y o ) (xo,yo) (xo,yo)点对于变量 x x x的偏导数是变量 y y y不变情况下变量 x x x在(x_0,y_0)点的瞬间变化率;函数 z = f ( x , y ) z=f(x,y) z=f(x,y) ( x 0 , y 0 ) (x_0,y_0) (x0,y0)点对于变量 y y y的偏导数是变量 x x x不变情况下变量 y y y ( x 0 , y 0 ) (x_0,y_0) (x0,y0)点的瞬间变化率。

多元函数的偏导数同样是理解梯度下降算法的重要基础

二元函数的求导举例
假设我们有一个二元函数 f = ( x , y ) = x 2 y f=(x,y)=x^2y f=(x,y)=x2y,我们要求它在 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)的偏导数和梯度。

1.关于 x x x的偏导数:

     此时将 y y y当作常数
      ∂ f ∂ x = ∂ ∂ x ( x 2 y ) = 2 x y \frac{\partial f}{\partial x}=\frac{\partial }{\partial x}(x^2y) = 2xy xf=x(x2y)=2xy

2.关于 y y y的偏导数:

     此时将 x x x当作常数
      ∂ f ∂ y = ∂ ∂ y ( x 2 y ) = x 2 \frac{\partial f}{\partial y}=\frac{\partial }{\partial y}(x^2y) = x^2 yf=y(x2y)=x2

3.梯度向量:

      ∇ f = ( ∂ f ∂ x , ∂ f ∂ y ) = ( 2 x y , x 2 ) \nabla f=(\frac{\partial f }{\partial x},\frac{\partial f }{\partial y})= (2xy,x^2) f=(xf,yf)=(2xy,x2)


免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/140053.html

(0)
上一篇 2025-05-30 22:20
下一篇 2025-05-30 22:26

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信