不同维度矩阵相乘[通俗易懂]

不同维度矩阵相乘[通俗易懂]在深度学习中经常会遇到不同维度的矩阵相乘的情况,本文会通过一些例子来展示不同维度矩阵乘法的过程。总体原则:在高维矩阵中取与低维矩阵相同维度的分片来与低维矩阵相乘,结果再按分片时的顺序还原为高维矩阵。相乘结果的维度与原来的高维矩阵一致。二维乘一维三维乘一维三维乘二维…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

前言

在深度学习中经常会遇到不同维度的矩阵相乘的情况,本文会通过一些例子来展示不同维度矩阵乘法的过程。

总体原则:在高维矩阵中取与低维矩阵相同维度的子矩阵来与低维矩阵相乘,结果再按子矩阵的排列顺序还原为高维矩阵。相乘结果的维度与原来的高维矩阵一致。
具体来说,当一方为一维矩阵时,另一方取其最后一维子矩阵来做乘法;当两方都是大于等于2维的矩阵时,取各自的最后两维构成的子矩阵来做乘法,其他维度体现结果的拼接信息,不参与运算(为batch训练提供了便利,batch中各样本的顺序在矩阵运算前后保持一致)。

实例:下面我们从低维到高维,依次演示不同维度矩阵相乘的结果。

二维乘一维

二维矩阵依次取出一维的行向量与一维矩阵做内积

#二维乘一维
import numpy as np

a = np.linspace(1,4,4).reshape(2,2)
b = np.array([1,1])
c = np.matmul(a,b)
print('a:\n',a)
print('b:\n',b)
print('ab:\n',c)

Jetbrains全家桶1年46,售后保障稳定

在这里插入图片描述

三维乘一维

三维矩阵包含两个二维矩阵,分别将这两个二维矩阵与一维矩阵相乘(乘积为一维),结果按原来的顺序拼接起来,构成一个二维矩阵

#三维乘一维
import numpy as np

a = np.linspace(1,8,8).reshape(2,2,2)
b = np.array([1,1])
c = np.matmul(a,b)
print('a:\n',a)
print('b:\n',b)
print('ab:\n',c)

在这里插入图片描述

二维乘二维

最常见的矩阵相乘形式

#二维乘二维
import numpy as np

a = np.linspace(1,4,4).reshape(2,2)
b = np.ones((2,2))
c = np.matmul(a,b)
print('a:\n',a)
print('b:\n',b)
print('ab:\n',c)

在这里插入图片描述

三维乘二维

将三维矩阵中的后两维组成的二维子矩阵分别与二维矩阵相乘(二维),结果再按原顺序拼接起来(三维)

#相当于三维矩阵里的二维分量分别与二维矩阵相乘,再拼接起来
import numpy as np

a=np.linspace(1,8,8).reshape(2,2,2)
# print(a)
b = np.array([[1,0],[0,1]]) #单位矩阵
c = np.matmul(a,b)
print('a:\n',a)
print('b:\n',b)
print('ab:\n',c)

在这里插入图片描述

三维乘三维

两个三维矩阵中对应位置的二维子矩阵分别相乘,结果按第0维分量更多的那个矩阵的结构拼接。
注意:,并不是任意两个三维矩阵都能相乘,其必须满足两个条件:

1:两个矩阵的后两个维度构成的二维矩阵之间必须满足二维矩阵相乘的条件,即第一个矩阵的列数等于第二个矩阵的行数
2:两个矩阵的第0维分量数必须相等(每个分量对应相乘) 或 有一方为1(broadcast-广播机制) —-反例见下方第3种情况

1-(2,2,2)*(2,2,2)

#三维乘三维 (2,2,2)*(2,2,2)
#计算时都是二维乘二维,第三维度反映二维矩阵的拼接信息;对应位置二维矩阵相乘
import numpy as np

a=np.linspace(1,8,8).reshape(2,2,2)
# print(a)
e = np.array([[[1,0],[0,1]]])
f = np.array([[[0,1],[1,0]]])
b = np.vstack((e,f))
c = np.matmul(a,b)
print('a:\n',a)
print('b:\n',b)
print('ab:\n',c)

在这里插入图片描述

2-(2,2,2)*(1,2,2)

#三维乘三维 (2,2,2)*(1,2,2)
#广播机制(broadcast)
import numpy as np

a=np.linspace(1,8,8).reshape(2,2,2)
# print(a)
b = np.array([[[0,1],[1,0]]])
c = np.matmul(a,b)
print('a:\n',a)
print('b:\n',b)
print('ab:\n',c)

在这里插入图片描述

3-(3,2,2)*(2,2,2)–失败

第0维分量数不满足条件2,不能相乘

# 三维乘三维--不同形状:(4,2,2)*(2,2,2)
import numpy as np

a=np.linspace(1,16,16).reshape(4,2,2)
# print(a)
e = np.array([[[1,0],[0,1]]])
f = np.array([[[0,1],[1,0]]])
b = np.vstack((e,f))
c = np.matmul(a,b)
print('a:\n',a)
print('b:\n',b)
print('c:\n',c)

在这里插入图片描述

多维乘多维

与三维乘三维类似,可乘条件2改为:除最后两维外,每一维的分量数必须对应相等(每个分量对应相乘) 或 有一方为1(broadcast-广播机制)

#各维度的分量相互对应,最终仍是计算二维乘二维
import numpy as np

a=np.linspace(1,16,16).reshape(2,2,2,2)
b = np.ones((2,2,2,2)) #全1矩阵
c = np.matmul(a,b)
print('a:\n',a)
print('b:\n',b)
print('ab:\n',c)

在这里插入图片描述

参考资料

知乎:多维矩阵相乘的可视化

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/230764.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Java基础之int和Integer有什么区别

    Java基础之int和Integer有什么区别1int与Integer的基本使用对比(1)Integer是int的包装类;int是基本数据类型;(2)Integer变量必须实例化后才能使用;int变量不需要;(3)Integer实际是对象的引用,指向此new的Integer对象;int是直接存储数据值;(4)Integer的默认值是null;int的默认值是0。2int与Integer的深入对比(1)由于In…

    2022年7月16日
    16
  • Spatial Transformer Networks(STN)详解

    Spatial Transformer Networks(STN)详解目录1、STN的作用1.1灵感来源1.2什么是STN?2、STN网络架构![在这里插入图片描述](https://img-blog.csdnimg.cn/20190908104416274.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L…

    2022年10月10日
    3
  • sqlhelper 下载 使用指南 代码

    sqlhelper 下载 使用指南 代码

    2021年7月27日
    57
  • 【机房重构】“ConnectionString属性尚未初始化”「建议收藏」

    【机房重构】“ConnectionString属性尚未初始化”「建议收藏」机房重构ing。在每个学习中一直陪伴我们左右的,还是那些大大小小的问题,正因为它们的存在,才让我们的学习有了收获,有了纠结,也有了乐趣。这几天一直在研究sqlhelper和泛型集合的使用,很那什么的说,纠结了几天,今天算是有点结果了,但是结果永远不会轻松而至,看,问题又来了。

    2022年7月15日
    17
  • 动态创建数组[通俗易懂]

    动态创建数组[通俗易懂]使用运算符new也可以创建数组类型的对象,这时需要给出数组的结构说明。用new运算符动态创建一维数组的语法形式为:new类型名【数组长度】;其中数组长度指出了数组元素的个数,它可以是任何能够得到正整数值的表达式。细节:用new动态创建一维数组时,在方括号后仍然可以加小括号“()”,但小括号内不能带任何参数。是否加“()”的区别在于,不加“()”,则对数组每个元素的初始化,与执行

    2022年5月2日
    43
  • plc梯形图编程入门基础知识_plc梯形图实例详解

    plc梯形图编程入门基础知识_plc梯形图实例详解​上升沿下降沿梯形图解析上升沿:上升沿就是此点从不通到通的过程,在PLC里面表现就是只通一次。举例:上图,当按钮1未按下的时候按钮1是断开的,此点不通,当按钮1被按下,按钮1导通,上面上升沿指令表示当按钮1按下去后,PLC只通一次,后面不管按钮1是否按下,整条线路都不通。下降沿:下降沿就是此点从通到不通的过程,在PLC里面就表现就是只通一次。举例:上图,当按钮1已经按下,按钮1已经导通,在按一次使按钮1瑞口,当按钮1从导通到断开,这条线路通一次,通了以后按钮1不管是通…

    2025年10月25日
    11

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号