SRGAN简记

全栈程序员-站长 • 2026年3月16日下午9:11 • 未分类 • 阅读 2

SRGAN简记SRGAN 简记文章目录 SRGAN 简记模型结构 LOSS 定义 ContentLossA 实验它是第一个能够推断 4 放大因子的照片真实自然图像的框架作者将 GAN 的思想用于 SR 任务虽然 PSNR 还比不上此前提出的方式但是在 MOS 这一评价维度上达到了 state of the art 作者的贡献是提出了 SRResNet SRCNN 的增强版提出了 SRGAN 主要内容引入 GAN 来做超分引入 MOS 评价指标并说明 PSNR 的一些问题图像过于平滑缺少高频细节信息所谓高频

SRGAN简记

文章目录

- - SRGAN简记

它是第一个能够推断4×放大因子的照片真实自然图像的框架
作者将GAN的思想用于SR任务，虽然PSNR还比不上此前提出的方式，但是在MOS这一评价维度上达到了state-of-the-art
作者的贡献是：
- 提出了SRResNet（SRCNN的增强版）
- 提出了SRGAN（主要内容，引入GAN来做超分）
- 引入MOS评价指标，并说明PSNR的一些问题（图像过于平滑，缺少高频细节信息，所谓高频即在频域中频率较高的部分，通常认为这部分用于保存图像细节信息）

参考

pytorch代码
原文

模型结构

GAN分为Generator和Discriminator两个部分，其中Generator用于图像超分，Discriminator用于判定超分图和原图

LOSS定义

整体的LOSS分为两个部分，分别是Content Loss 和adversarial loss，

Content Loss

内容损失loss，此前用的一般是MSE，这种LOSS拥有比较好的PSNR（峰值信噪比），但是通常来说回丢失高频信息，导致图像过于平滑（一般我们认为图像中的细节信息大部分存在高频部分），因此作者由欧几里得距离提出了 $I_{X}^{SR}$ ，如下所示
其中X替代为VGG（意思是Backbone用的VGG，可替换）， $\phi_{i,j}表示第i_{th}个maxpool之前的第j_{th}个conv lotion$ ，然后H和W表示feature map的空间维度。

Adversarial loss

为对抗loss，是生成器和检测器之间的loss，类似交叉熵但好像并不是，这里由于我们希望生成器的结果被检测器误认为是nature的图片，所以希望最小化检测器认为是生成器生成的概率（也就是使得D的结果趋向于1）

实验

有关于MOS的结果，SR GAN在Set5和Set14数据集上的MOS分数均比SRResNet（可以看作SR CNN的增强版）高不少
MOS评级分布，可以看到SRResNet高于此前的方法，而SRGAN又超过了SRResnet。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/227493.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

GMap 初步使用

上一篇 2026年3月16日下午9:11

Murmurhash介绍与实现

下一篇 2026年3月16日下午9:12

用C语言来分割字符串

相关:http://www.cnblogs.com/roucheng/p/cfenge.html

全栈程序员-站长
2021年12月27日
48
数据库置疑的解决方法_msdb数据库置疑的解决方法

数据库置疑的解决方法_msdb数据库置疑的解决方法在没有数据库日志的情况下数据的恢复:由于误删的事务日志文件，导致数据库无法启动（置疑状态），数据无法取去，方法：新建一个同名数据库，把数据文件copy覆盖打开系统表的操作权限UseMasterGosp_configure’allowupdates’,1reconfigurewithoverrideGo设置成为紧急状态updatesysdatabasessetstatus=32…

全栈程序员-站长
2022年8月20日
8
Pycharm运行python程序时提示:PermissionError: [Errno 13] Permission denied

Pycharm运行python程序时提示:PermissionError: [Errno 13] Permission denied凡是涉及 win 系统组件的程序都要以管理员身份运行 PyCharmPermi Errno13 Permissionde 就是用户权限不够 PermissionEr Errno13 Permissionde 就是用户权限不够 PermissionEr Errno13 Permissionde 就是用户权限不够

全栈程序员-站长
2026年3月17日
2
关于静态方法与非静态方法的执行效率

关于静态方法与非静态方法的执行效率以前看到许多网友认为静态方法要比实例方法在执行效率上要快一些当初不敢苟同自己亲自试了一把发现静态方法确实要快一些想要比较静态方法与非静态方法的执行效率需要对 CLR 在调用静态方法与非静态方法时的不同之处要有一个了解静态方法是与类相关联的 CLR 在调用一个静态方法时需要做的事情就是找到定义该方法的类型即可实现调用而在调用非静态方法时为了保证运行安全 CLR 会对我们的源代码进行

全栈程序员-站长
2026年1月23日
2
openclaw

手把手教你搭建 OpenClaw AI 私人助理（保姆级教程）

手把手教你搭建 OpenClaw AI 私人助理（保姆级教程）

Ai探索者
2026年3月13日
2
gpt

如何在中国使用支付宝进行GPT付费

如何在中国使用支付宝进行GPT付费

全栈程序员-站长
2026年3月15日
1

发表回复

关注全栈程序员社区公众号