矩阵求导总结

矩阵求导总结数据按照不同的维度 可以划分为标量 向量 矩阵 所以矩阵求导可以划分为三个组 其中每组三个 共九种情况 标量 标量 frac partial 标量 partial 标量 标量 标量 标量 向量 frac partial 标量 partial 向量 向量 标量 标量 矩阵 frac partial 标量 partial 矩阵 矩阵 标量 向量 标量 fr

  数据按照不同的维度,可以划分为标量、向量、矩阵。所以矩阵求导可以划分为三个组,其中每组三个,共九种情况:

  1. ∂ 标量 ∂ 标量 \frac{\partial 标量}{\partial标量} 标量标量 ∂ 标量 ∂ 向量 \frac{\partial 标量}{\partial向量} 向量标量 ∂ 标量 ∂ 矩阵 \frac{\partial 标量}{\partial矩阵} 矩阵标量
  2. ∂ 向量 ∂ 标量 \frac{\partial 向量}{\partial标量} 标量向量 ∂ 向量 ∂ 向量 \frac{\partial 向量}{\partial向量} 向量向量 ∂ 向量 ∂ 矩阵 \frac{\partial 向量}{\partial矩阵} 矩阵向量
  3. ∂ 矩阵 ∂ 标量 \frac{\partial 矩阵}{\partial标量} 标量矩阵 ∂ 矩阵 ∂ 向量 \frac{\partial 矩阵}{\partial向量} 向量矩阵 ∂ 矩阵 ∂ 矩阵 \frac{\partial 矩阵}{\partial矩阵} 矩阵矩阵

  分子指的是函数空间,在某些情况下为单个函数,分母指的是基向量,尤其是向量和标量的时候最容易理解。

1.分子为标量

1.1 ∂ 标量 ∂ 标量 \frac{\partial 标量}{\partial标量} 标量标量

  此时分子为单个函数,而基变量只有一个,所以结果也是标量。这种情况最简单。

1.2 ∂ 标量 ∂ 向量 \frac{\partial 标量}{\partial向量} 向量标量

  此时分子为单个函数,而基变量有多个,结果是向量。本质上就是偏导数。如果分母为行向量,则结果就为行向量。如果分母为列向量,则结果为列向量。

1.3 ∂ 标量 ∂ 矩阵 \frac{\partial 标量}{\partial矩阵} 矩阵标量

  此时分子为单个函数,而基变量为矩阵,结果是矩阵。具体含义不明。

2.分子为向量

2.1 ∂ 向量 ∂ 标量 \frac{\partial 向量}{\partial标量} 标量向量

  此时分子为函数空间,而基变量只有一个,所以结果也是向量

2.2 ∂ 向量 ∂ 向量 \frac{\partial 向量}{\partial向量} 向量向量

  此时分子为函数空间,而基变量有多个,所以结果是矩阵。可以看作是标量对向量求导的扩展。这里所指的是向量和向量的求导,根据Jacobi矩阵的定义,默认指的是列向量对行向量求导。

2.3 ∂ 向量 ∂ 矩阵 \frac{\partial 向量}{\partial矩阵} 矩阵向量

  这里是标量对矩阵求导的扩展。但是具体物理意义不明。

3.分子为矩阵

3.1 ∂ 矩阵 ∂ 标量 \frac{\partial 矩阵}{\partial标量} 标量矩阵

  此时分子为矩阵函数空间,而基变量只有一个,所以结果也是矩阵

3.2 ∂ 矩阵 ∂ 向量 \frac{\partial 矩阵}{\partial向量} 向量矩阵

  此时分子为矩阵函数空间,而基变量有多个,所以结果是矩阵。可以看做是向量对向量求导的扩展。

3.3 ∂ 矩阵 ∂ 矩阵 \frac{\partial 矩阵}{\partial矩阵} 矩阵矩阵

  这里是向量对矩阵求导的扩展。但是具体物理意义不明。

下载文档为:https://download.csdn.net/download/herosunly/

矩阵运算验证网址为:http://www.matrixcalculus.org/

4. 常用求导公式

  求导不仅要满足链式法则,也要满足矩阵的乘法准则。

∂ ∂ w ( A ⋅ w ) = A \frac{\partial{}}{\partial w}(A \cdot w)=A w(Aw)=A

在这里插入图片描述
∂ ∂ w ( w T ⋅ A ) = A T \frac{\partial{}}{\partial w}(w^T \cdot A)=A^T w(wTA)=AT
在这里插入图片描述
∂ ∂ w ( w T ⋅ A ) = A T ≠ A \frac{\partial{}}{\partial w}(w^T \cdot A)=A^T\neq A w(wTA)=AT=A,为什么不等于A,而是等于 A T A^T AT呢?


∂ ∂ w ( w T ⋅ A ⋅ w ) = A ⋅ w + A T ⋅ w \frac{\partial{}}{\partial w}(w^T \cdot A \cdot w)=A \cdot w+A^T \cdot w w(wTAw)=Aw+ATw

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/209874.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 上午8:16
下一篇 2026年3月19日 上午8:16


相关推荐

  • shell中find的用法_grep用法linux

    shell中find的用法_grep用法linuxfind命令的一般格式:findpathname-options[-exec]pathname是find命令所查找的目录路径-exec对匹配的文件执行该参数所给出的shell命令-options选项参数:-name按照文件名查找文件-perm按照文件权限来查找文件-user按照文件属主来

    2022年10月15日
    4
  • XAMPP安装配置(最)详细教程图解

    XAMPP安装配置(最)详细教程图解XAMPPXampp 安装及使用 XAMPP 包括 Aache MySQL PHP PERL 直接解压缩 没有复杂的安装过程 强烈推荐初学者使用 文章目录 XAMPP 一 XAMPP 简介二 Xampp 安装及使用三 XAMPP 控制面板四 XAMPP 的基本常见使用方法五 卸载 XAMPP 注意事项六 附 xampp 的默认密码七 常见问题一 XAMPP 简介 XAMPP Apache MySQ

    2026年3月17日
    2
  • python和c语言相通吗_C语言和Python有什么区别呢?

    python和c语言相通吗_C语言和Python有什么区别呢?展开全部 python 与 C 的区别如下 1 语言类型不同 Python 是一种动态类型语言 又是强类型语言 它们确定一个变量的类型是在 e69da5e887aa 您第一次给它赋值的时候 C 是静态类型语言 一种在编译期间就确定数据类型的语言 大多数静态类型语言是通过要求在使用任一变量之前声明其数据类型来保证这一点的

    2025年6月19日
    4
  • dotnet core 命令详解

    dotnet core 命令详解本篇博客来了解一下 dotnet 这个神奇的命令 我会依次对 dotnet dotnetnew dotnetrestor dotnetbuild dotnettest dotnetrun dotnetpack dotnetpublis 这些个命令的用法做个简单的介绍以及演示

    2026年3月19日
    2
  • 5大优秀黑客必逛技术网站

    5大优秀黑客必逛技术网站5大优秀黑客必逛技术网站HackForums最理想的黑客技术学习技术根据地,也适用于开发人员游戏开发者,程序员,图形设计师以及网络营销人士HackThisSite提供合法而安全的网络安全资源,可以通过·各类挑战题目测试自己的黑客技能EnilZone一个专门面向黑科群体的论坛,其中也涉及科学,编程以及艺术等领域的内容Exploit-DB提供一整套庞大的归档体…

    2022年7月15日
    26
  • Ubuntu 18.04安装OpenCV4.0和环境配置

    Ubuntu 18.04安装OpenCV4.0和环境配置下载源文件可以在官网下载相应版本的 OpenCVSource 源文件 但因为官方版本是 git 上的 有时候可能出现下载失败的情况 所有我将官网下载的源文件分享到百度网盘链接 https pan baidu com s 1Bu4xOiz8zWU R8Me0T SIg 提取码 s4sy 将 zip 文件解压到当前目录 unzipopencv 4 0 0 zip d 进入解压后的文

    2026年3月17日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号