格拉姆矩阵(Gram matrix)详细解读

格拉姆矩阵(Gram matrix)详细解读目录基础知识-向量的内积Grammatrix介绍Grammatrix的应用-风格迁移一、基础知识-向量的内积1.1向量的内积定义:也叫向量的点乘,对两个向量执行内积运算,就是对这两个向

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

目录

  • 基础知识-向量的内积
  • Gram matrix介绍
  • Gram matrix的应用-风格迁移

一、基础知识向量的内积

1.1 向量的内积定义:也叫向量的点乘,对两个向量执行内积运算,就是对这两个向量对应位一一相乘之后求和的操作,内积的结果是一个标量。

1.2 实例

格拉姆矩阵(Gram matrix)详细解读

ab的内积公式为:

格拉姆矩阵(Gram matrix)详细解读

1.3 作用

内积判断向量a和向量b之间的夹角和方向关系

  • a·b>0    方向基本相同,夹角在90°之间
  • a·b=0    正交,相互垂直  
  • a·b<0    方向基本相反,夹角在90°180°之间 

Gram矩阵是两两向量的内积组成,所以Gram矩阵可以反映出该组向量中各个向量之间的某种关系

二、Gram matrix介绍

2.1 定义

n维欧式空间中任意k个向量之间两两的内积所组成的矩阵,称为这k个向量的格拉姆矩阵(Gram matrix),很明显,这是一个对称矩阵。

格拉姆矩阵(Gram matrix)详细解读

更加直观的理解:

格拉姆矩阵(Gram matrix)详细解读

2.2 计算和特征表示

输入图像的feature map[ ch, h, w]。我们经过flatten(即是将h*w进行平铺成一维向量)和矩阵转置操作,可以变形为[ ch, h*w][ h*w, ch]的矩阵。再对两个作内积得到Gram Matrices。 (蓝色条表示每个通道flatten后特征点,最后得到 [ch *ch ]的G矩阵)

格拉姆矩阵(Gram matrix)详细解读

2.3 进一步理解

格拉姆矩阵(Gram matrix)详细解读

格拉姆矩阵可以看做feature之间的偏心协方差矩阵(即没有减去均值的协方差矩阵),在feature map中,每个数字都来自于一个特定滤波器在特定位置的卷积,因此每个数字代表一个特征的强度,而Gram计算的实际上是两两特征之间的相关性,哪两个特征是同时出现的,哪两个是此消彼长的等等。

格拉姆矩阵用于度量各个维度自己的特性以及各个维度之间的关系。内积之后得到的多尺度矩阵中,对角线元素提供了不同特征图各自的信息,其余元素提供了不同特征图之间的相关信息。这样一个矩阵,既能体现出有哪些特征,又能体现出不同特征间的紧密程度。

关键点:gram矩阵是计算每个通道 i 的feature map与每个通道 j 的feature map的内积。gram matrix的每个值可以说是代表 I 通道的feature map与 j 通道的feature map的互相关程度。

三、Gram matrix的应用风格迁移

深度学习中经典的风格迁移大体流程是:

1. 准备基准图像和风格图像

2. 使用深层网络分别提取基准图像(加白噪声)和风格图像的特征向量(或者说是特征图feature map

3. 分别计算两个图像的特征向量的Gram矩阵,以两个图像的Gram矩阵的差异最小化为优化目标,不断调整基准图像,使风格不断接近目标风格图像

关键的一个是在网络中提取的特征图,一般来说浅层网络提取的是局部的细节纹理特征,深层网络提取的是更抽象的轮廓、大小等信息。这些特征总的结合起来表现出来的感觉就是图像的风格,由这些特征向量计算出来的的Gram矩阵,就可以把图像特征之间隐藏的联系提取出来,也就是各个特征之间的相关性高低。

格拉姆矩阵(Gram matrix)详细解读

如果两个图像的特征向量的Gram矩阵的差异较小,就可以认定这两个图像风格是相近的。有了表示风格的Gram Matrix,要度量两个图像风格的差异,只需比较他们Gram Matrix的差异即可。

格拉姆矩阵(Gram matrix)详细解读

具体可见另一篇文章《风格迁移论文理解–A Neural Algorithm of Artistic Style》展开的介绍。

附件:手写图例辅助理解:

格拉姆矩阵(Gram matrix)详细解读

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/167695.html原文链接:https://javaforall.net

(0)
上一篇 2022年8月2日 下午8:00
下一篇 2022年8月2日 下午8:00


相关推荐

  • stuffing list_difflib

    stuffing list_difflibhttps://blog.csdn.net/heimu24/article/details/535813621.2创建图片列表清单这一步我们需要创建自己图片数据集的清单txt文件,这里提供两种方法。方法1:创建一个sh文件cd~/caffe-master/sudogeditexamples/images/create_filelist.shsudo就是获取管理员权限,gedit…

    2026年4月18日
    4
  • 披荆斩棘、共赴未来-2020总结及2021年计划

    披荆斩棘、共赴未来-2020总结及2021年计划一 前言在繁忙的工作中不知不觉又迎来了新的一年 2020 年这一年是有意义的 有价值的 有收获的 回顾这一年的工作历程 你是否让自己满意 让老板满意 有没有达到自己的要求 如果说要给自己过往一年的工作打个分数的话 你会打多少分呢 我给自己打了一个分数 打 75 分 扣掉的那 25 分算是今年在选择上的一个重大失误吧 之前一直没有写年终总结的习惯 受这两年接触企业及人员影响的原因 从去年开始写了第一篇年终总结 2019 年总结与 2020 年展望 突然发现 自己也挺喜欢在年底的时候复盘一下过往一年的工作 同时制定未

    2026年3月20日
    3
  • mysql批量写入_mysql insert多条数据

    mysql批量写入_mysql insert多条数据最近新的项目写了不少各种insertBatch的代码,一直有人说,批量插入比循环插入效率高很多,那本文就来实验一下,到底是不是真的?测试环境:SpringBoot2.5 Mysql8 JDK8 Docker首先,多条数据的插入,可选的方案:foreach循环插入 拼接sql,一次执行 使用批处理功能插入搭建测试环境`sql文件:dropdatabaseIFEXISTStest;CREATEDATABASEtest;usetest;DROPT

    2022年10月6日
    3
  • k8s监控工具(k8s工具)

    工具集合:后渗透:Kubesploit:https://github.com/cyberark/kubesploit安全评估:RedKube:https://github.com/lightspin-tech/red-kube容器攻击工具:ccat:https://github.com/RhinoSecurityLabs/ccat安全测试:Kubestriker:https://github.com/vchinnipilli/kubestriker地址GitHub-aqu

    2022年4月17日
    62
  • Golang int 转换 string

    Golang int 转换 stringps 同样是开发刚好使用到所以随手记了下来以下是错误的方法 funcmain num string 100 3 fmt Println num 结果竟然是一个 正确的方法 funcmain num fmt Sprintf d 100 3 fmt Printf num 结果 33 fmt Sprintf d 100 3 Sprintf 根据格式说明符格式化并返回字符串结果

    2026年3月26日
    2
  • activeMq与rabbitmq端口冲突

    activeMq与rabbitmq端口冲突activeMq 与 rabbitmq 端口冲突当安装 activeMq 时出现如下错误修改方法将安装目录下的 xml 配置修改下的端口号修改为 5673

    2026年3月16日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号