导数、微分、偏导数、全微分、方向导数、梯度的定义与关系

导数、微分、偏导数、全微分、方向导数、梯度的定义与关系学习到机器学习线性回归和逻辑回归时遇到了梯度下降算法 然后顺着扯出了一堆高数的相关概念理论 导数 偏导数 全微分 方向导数 梯度 重新回顾它们之间的一些关系 从网上和教材中摘录相关知识点 通过函数的极限定义出导数 以一元函数为例 函数 f x 在点 x0 可微的充分必要条件是函数 f x 在点 x0 处可导扩展到多元函数时 衍生出偏导数导数定义 设函数 y f x y f x y f x

学习到机器学习线性回归和逻辑回归时遇到了梯度下降算法,然后顺着扯出了一堆高数的相关概念理论:导数、偏导数、全微分、方向导数、梯度,重新回顾它们之间的一些关系,从网上和教材中摘录相关知识点。

  1. 通过函数的极限定义出导数(以一元函数为例)
  2. 函数f(x)在点x0可微的充分必要条件是函数f(x)在点x0处可导
  3. 扩展到多元函数时,衍生出偏导数

导数

定义:设函数 y = f ( x ) y=f(x) y=f(x)在点 x 0 x_0 x0的某个领域内有定义,如果 Δ y Δ x \frac{Δy}{Δx} ΔxΔy在当 Δ x Δx Δx->0时极限存在,则称函数 y = f ( x ) y=f(x) y=f(x) x 0 x_0 x0处可导,这个极限是函数 y = f ( x ) y=f(x) y=f(x) x 0 x_0 x0处的导数
f ′ ( x 0 ) = lim ⁡ Δ x → 0 Δ y Δ x = lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x f'(x_0)=\lim \limits_{Δx \to 0} \frac{Δy}{Δx}=\lim \limits_{Δx \to 0} \frac{f(x_0+Δx)-f(x_0)}{Δx} f(x0)=Δx0limΔxΔy=Δx0limΔxf(x0+Δx)f(x0)

根据导数的定义,从某种意义上说导数的本质是一种极限

导数与导函数的关系是局部与整体的关系,导数通常是指一点,导函数则是指一个区间上的

  • 在直线运动场景中,若x表示时刻,y表示距离,函数f表示时间与距离的关系 y = f ( x ) y=f(x) y=f(x),那么导数的含义就是在 x 0 x_0 x0时刻的瞬时速度
  • 在直角坐标系中, y = f ( x ) y=f(x) y=f(x)表示一个曲线,导数的含义表示的是曲线在点 x 0 x_0 x0处的切线的斜率

微分

定义:设函数 y = f ( x ) y=f(x) y=f(x)在某个领域内有定义, x 0 x_0 x0 x 0 + Δ x x_0+Δx x0+Δx在这区间内,如果增量
Δ y = f ( x 0 + x ) − f ( x 0 ) Δy=f(x_0+x)-f(x_0) Δy=f(x0+x)f(x0)
可表示为
Δ y = A Δ x + o ( Δ x ) Δy=AΔx+o(Δx) Δy=AΔx+o(Δx)
其中A是不依赖 Δ x Δx Δx的常数, o ( Δ x ) o(Δx) o(Δx)是指 Δ x Δx Δx趋于0时的高阶无穷小,那么称函数 y = f ( x ) y=f(x) y=f(x)在点 x 0 x_0 x0可微的,而 A Δ x AΔx AΔx叫做函数在点 x 0 x_0 x0相应于自变量增量 Δ x Δx Δx微分,记作 d y \mathrm{d} y dy,记作
d y = A Δ x \mathrm{d}y=AΔx dy=AΔx




高阶无穷小的定义:如果 lim ⁡ β α = 0 \lim \limits \frac{\beta}{\alpha}=0 limαβ=0,就说 β \beta β是比 α \alpha α高阶的无穷小,记作 β = o ( α ) \beta=o(\alpha) β=o(α)

微分与导数的关系

上式 Δ y = A Δ x + o ( Δ x ) Δy=AΔx+o(Δx) Δy=AΔx+o(Δx)两边同时除以 Δ x Δx Δx得到
Δ y Δ x = A + o ( Δ x ) Δ x \frac{Δy}{Δx}=A+\frac{o(Δx)}{Δx} ΔxΔy=A+Δxo(Δx)
Δ x → 0 Δx \to 0 Δx0时,上式左边就是导数的定义,而右边的 o ( Δ x ) Δ x \frac{o(Δx)}{Δx} Δxo(Δx)因为是高阶无穷小,所以会趋向于0,得到以下等式
A = lim ⁡ Δ x → 0 Δ y Δ x = f ′ ( x 0 ) A=\lim \limits_{Δx \to 0}\frac{Δy}{Δx}=f'(x_0) A=Δx0limΔxΔy=f(x0)
因此,如果函数 f ( x ) f(x) f(x)在点 x 0 x_0 x0可微,则 f ( x ) f(x) f(x)在点 x 0 x_0 x0也一定可导,且 A = f ′ ( x 0 ) A=f'(x_0) A=f(x0),反之,如果 f ( x ) f(x) f(x)在点 x 0 x_0 x0可导,存在下式
lim ⁡ Δ x → 0 Δ y Δ x = f ′ ( x 0 ) \lim \limits_{Δx \to 0}\frac{Δy}{Δx}=f'(x_0) Δx0limΔxΔy=f(x0)
根据极限与无穷小的关系转化上式,当 Δ x → 0 Δx \to 0 Δx0
Δ y Δ x = f ′ ( x 0 ) + α \frac{Δy}{Δx}=f'(x_0)+\alpha ΔxΔy=f(x0)+α
其中 lim ⁡ Δ x → 0 a = 0 \lim \limits_{Δx \to 0}a=0 Δx0lima=0,即 lim ⁡ Δ x → 0 a Δ x Δ x = 0 \lim \limits_{Δx \to 0}\frac{aΔx}{Δx}=0 Δx0limΔxaΔx=0, a Δ x = o ( Δ x ) aΔx=o(Δx) aΔx=o(Δx),上式转化为下式(又回到了微分的定义)
Δ y = f ′ ( x 0 ) Δ x + o ( Δ x ) Δy=f'(x_0)Δx+o(Δx) Δy=f(x0)Δx+o(Δx)
因此,函数 f ( x ) f(x) f(x)在点 x 0 x_0 x0可微的充分必要条件是函数 f ( x ) f(x) f(x)在点 x 0 x_0 x0可导
d y = f ′ ( x 0 ) Δ x \mathrm{d}y=f'(x_0)Δx dy=f(x0)Δx










偏导数

偏导数的几何意义
这里写图片描述

  • 偏导数 f x ( x 0 , y 0 ) f_{x} (x_{0},y_{0} ) fx(x0,y0)就是曲面被平面 y = y 0 y=y_{0} y=y0所截得的曲线在点 M 0 M_{0} M0处的切线 M 0 T x M_{0}T_{x} M0Tx x x x轴的斜率
  • 偏导数 f y ( x 0 , y 0 ) f_{y} (x_{0},y_{0} ) fy(x0,y0)就是曲面被平面 x = x 0 x=x_{0} x=x0所截得的曲线在点 M 0 M_{0} M0处的切线 M 0 T y M_{0}T_{y} M0Ty y y y轴的斜率

很多时候要考虑多元函数沿任意方向的变化率,那么就引出了方向导数

全微分

参考上文微分的定义,与一元函数的情形一样,希望用自变量增量 Δ x , Δ y Δx,Δy Δx,Δy来线性函数来代替函数的全增量 Δ z Δz Δz,从而减化计算
定义:设函数 z = f ( x , y ) z=f(x,y) z=f(x,y)在点 ( x , y ) (x,y) (x,y)的某领域内有定义如果函数在点 ( x , y ) (x,y) (x,y)的全增量
Δ z = f ( x + Δ x , y + Δ y ) − f ( x , y ) Δz=f(x+Δx,y+Δy)-f(x,y) Δz=f(x+Δx,y+Δy)f(x,y)
可心表示为
Δ z = A Δ x + B Δ y + o ( ρ ) Δz=AΔx+BΔy+o(\rho) Δz=AΔx+BΔy+o(ρ)
其中 A , B A,B A,B不依赖于 Δ x , Δ y Δx,Δy Δx,Δy ρ = ( Δ x ) 2 + ( Δ y ) 2 \rho=\sqrt{(Δx)^2+(Δy)^2} ρ=(Δx)2+(Δy)2
,则称函数 z = f ( x , y ) z=f(x,y) z=f(x,y)在点 ( x , y ) (x,y) (x,y)可微分,而 A Δ x + B Δ y AΔx+BΔy AΔx+BΔy称为函数在点 ( x , y ) (x,y) (x,y)全微分
d z = A Δ x + B Δ y \mathrm{d}z=AΔx+BΔy dz=AΔx+BΔy





可微分与偏导数关系

基于上述全微分定义成立,存在某一点 p ′ ( x + Δ x , y + Δ y ) p'(x+Δx,y+Δy) p(x+Δx,y+Δy)对于式子 Δ z = A Δ x + B Δ y + o ( ρ ) Δz=AΔx+BΔy+o(\rho) Δz=AΔx+BΔy+o(ρ)也成立,当 Δ y = 0 Δy=0 Δy=0
f ( Δ x + x , y ) − f ( x , y ) = A Δ X + o ( ∣ Δ x ∣ ) f(Δx+x,y)-f(x,y)=AΔX+o(|Δx|) f(Δx+x,y)f(x,y)=AΔX+o(∣Δx)
两边除以 Δ x Δx Δx并且令 Δ x → 0 Δx \to 0 Δx0取极限
lim ⁡ Δ x → 0 f ( x + Δ x , y ) − f ( x , y ) Δ x = A \lim \limits_{Δx \to 0}\frac{f(x+Δx,y)-f(x,y)}{Δx}=A Δx0limΔxf(x+Δx,y)f(x,y)=A
这式子就是偏导数的定义形式啊,所以这说明了偏导数 f x ( x , y ) f_x(x,y) fx(x,y)存在且等于 A A A,同理也可证 f y ( x , y ) = B f_y(x,y)=B fy(x,y)=B,由此推导出以下公式
d z = f x ( x , y ) Δ x + f y ( x , y ) Δ y \mathrm{d}z=f_x(x,y)Δx+f_y(x,y)Δy dz=fx(x,y)Δx+fy(x,y)Δy




各偏导数的存在只是全微分存在的必要条件而非充分条件,即由全微分可证各偏导数存在,反之则不行

如果函数的各个偏数在点 ( x , y ) (x,y) (x,y)是连续的,则函数可微分

方向导数

定义导数、偏导数、方向导数都是说如果说某条件下极限存在,谨记导数的本质是极限及代表函数的变化率,偏导数反映的是函数沿坐标轴方向的变化率,有所限制,所以引入方向导数表示沿任意一方向的变化率
定义:设 l l l x O y xOy xOy平面以 P 0 ( x 0 , y 0 ) P_0(x_0,y_0) P0(x0,y0)为始点的一条射线, e i = ( c o s α , c o s β ) e_i=(cos\alpha,cos\beta) ei=(cosα,cosβ)是以射线同方向的单位向量
这里写图片描述

射线 l l l的参数方程为
{ x = x 0 + t c o s α , t ≥ 0 y = y 0 + t c o s β , t ≥ 0 \begin{cases}x=x_0+tcos\alpha ,t\geq0\\ y=y_0+tcos\beta,t\geq0 \end{cases} {
x=x0+tcosαt0y=y0+tcosβt0

如果函数增量 f ( x 0 + t c o s α , y 0 + t c o s β ) − f ( x 0 , y 0 ) f(x_0+tcos\alpha,y_0+tcos\beta)-f(x_0,y_0) f(x0+tcosα,y0+tcosβ)f(x0,y0) P P P P 0 P_0 P0的距离 ∣ P P 0 ∣ = t |PP_0|=t PP0=t的比值,当点 P P P沿着 l l l趋于 P 0 ( 即 t → 0 + ) P_0(即t \to 0^+) P0(t0+)极限存在,则称此极限为函数在点 P 0 P_0 P0沿方向 l l l的方向导数
∂ f ∂ l ∣ ( x 0 , y 0 ) = lim ⁡ t → 0 + f ( x 0 + t c o s α , y 0 + t c o s β ) − f ( x 0 , y 0 ) t \frac{\partial f}{\partial l}|_{(x_0,y_0)}=\lim \limits_{t \to 0^+}\frac{f(x_0+tcos\alpha,y_0+tcos\beta)-f(x_0,y_0)}{t} lf(x0,y0)=t0+limtf(x0+tcosα,y0+tcosβ)f(x0,y0)


方向导数与全微分的关系

由此得到定理,如果函数 f ( x , y ) f(x,y) f(x,y)在点 P 0 ( x 0 , y 0 ) P_0(x_0,y_0) P0(x0,y0)可微分,那么函数在该点沿任一方向 l l l的方向导数存在
∂ f ∂ l ∣ ( x 0 , y 0 ) = f x ( x 0 , y 0 ) c o s α + f y ( x 0 , y 0 ) c o s β \frac{\partial f}{\partial l}|_{(x_0,y_0)}=f_x(x_0,y_0)cos\alpha+f_y(x_0,y_0)cos\beta lf(x0,y0)=fx(x0,y0)cosα+fy(x0,y0)cosβ

梯度

如果函数 f ( x , y ) f(x,y) f(x,y)在点 P 0 ( x 0 , y 0 ) P_0(x_0,y_0) P0(x0,y0)可微分, e l = ( c o s α , c o s β ) e_l=(cos\alpha,cos\beta) el=(cosα,cosβ)是方向 l l l的方向向量(方向未确定)
∂ f ∂ l ∣ ( x 0 , y 0 ) = f x ( x 0 , y 0 ) c o s α + f y ( x 0 , y 0 ) c o s β = g r a d   f ( x 0 , y 0 ) . e l = ∣ g r a d   f ( x 0 , y 0 ) ∣ c o s θ \frac{\partial f}{\partial l}|_{(x_0,y_0)}=f_x(x_0,y_0)cos\alpha+f_y(x_0,y_0)cos\beta=grad\ f(x_0,y_0).e_l=|grad\ f(x_0,y_0)|cos\theta lf(x0,y0)=fx(x0,y0)cosα+fy(x0,y0)cosβ=grad f(x0,y0).el=grad f(x0,y0)cosθ
其中 θ \theta θ为向量 g r a d   f ( x 0 , y 0 ) {grad\ f(x_0,y_0)} grad f(x0,y0)与向量 e l e_l el的夹角,当 θ = 0 \theta=0 θ=0时,即方向 e l e_l el与梯度 g r a d   f ( x 0 , y 0 ) {grad\ f(x_0,y_0)} grad f(x0,y0)的方向时,函数 f ( x , y ) f(x,y) f(x,y)增加最快,函数在这个方向的方向导数达到最大值,这个值就是梯度 g r a d   f ( x 0 , y 0 ) {grad\ f(x_0,y_0)} grad f(x0,y0)的模,即
∂ f ∂ l ∣ ( x 0 , y 0 ) = ∣ g r a d   f ( x 0 , y 0 ) ∣ \frac{\partial f}{\partial l}|_{(x_0,y_0)}=|grad \ f(x_0,y_0)| lf(x0,y0)=grad f(x0,y0)


所以可以用沿梯度方向的方向导数来描述是函数最大变化率,即梯度方向是函数变化率最大的方向,在梯度定义的时候就已经赋予了它这个特性。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/231490.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Unity AssetBundle介绍

    Unity AssetBundle介绍1.什么是AssetBundle?AssetBundle是一种资源压缩包。资源打包AssetBundle有两个好处:减小安装包的大小,资源可以在进入游戏时候,网络下载。 热更资源,方便修复线上资源问题引起的Bug,或新增加游戏内容。AssetBundle分为两种类型:场景AssetBundle&非场景AssetBundle。2.AssetBundle结构2.1As…

    2022年6月18日
    33
  • WAR包补丁工具_修改war包配置文件

    WAR包补丁工具_修改war包配置文件简要:因目前处于运维历史悠久的WEB项目中,每次需求开发完成需要更打补丁文件,因此编写打补丁工具,以解决手动查找补丁文件的繁琐且重复操作。纯Java代码编写,使用Swing作为界面UI,原有代码只针对特殊使用场景,可以适当加以修改。适用:编译工具:EclipseLunaRelease(4.4.0)运行环境:JDK1.7代码:界面GUI部分:使用JSplitPane…

    2022年10月5日
    1
  • 盘点开发中那些常用的MySQL优化

    盘点开发中那些常用的MySQL优化

    2022年2月15日
    32
  • JAVA 找不到符号

    JAVA 找不到符号写了一个新接口后莫名其妙报找不到符号,但是代码又看出任何问题,上网查了半天也没找到解决方法,然后把这个项目关了重开……顺利运行

    2022年7月9日
    21
  • 智能手机功能_android是什么品牌手机

    智能手机功能_android是什么品牌手机标签:小米(194)HTC(27)三星(1202)手机(807)打开各手机论坛,看到许多朋友在问usb调试在哪?usb调试模式怎么打开?“USB调试”是Android系统提供的一个用于开发工作的功能软件,在每个Android系统上都会自带,“USB调试”主要作用是在在计算机和Android设备之间复制数据、移动设备上安装应用程序。所以在我们联接电脑时,系统都会提示我们要打开“USB调试”。今天,…

    2025年11月4日
    2
  • Docker 入门看这一篇就够了,万字详解!「建议收藏」

    Docker 入门看这一篇就够了,万字详解!

    2022年2月15日
    55

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号