pytorch 如何finetune

全栈程序员-站长 • 2026年3月18日下午10:01 • 未分类 • 阅读 2

pytorch 如何finetune局部微调有时候我们加载了训练模型后只想调节最后的几层其他层不训练其实不训练也就意味着不进行梯度计算 PyTorch 中提供的 requires grad 使得对训练的控制变得非常简单 model torchvision models resnet18 pretrained True forparaminmo parameters param requires grad False 替换最后的全连接层改为训练 100 类新构造的模块的参数默认 requires

用pytorch实现预训练网络的finetune

局部微调

有时候我们加载了训练模型后，只想调节最后的几层，其他层不训练。其实不训练也就意味着不进行梯度计算，PyTorch中提供的requires_grad使得对训练的控制变得非常简单。

model = torchvision.models.resnet18(pretrained=True) for param in model.parameters(): param.requires_grad = False # 替换最后的全连接层， 改为训练100类 # 新构造的模块的参数默认requires_grad为True model.fc = nn.Linear(512, 100) # 只优化最后的分类层 optimizer = optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9)

全局微调，不同学习率

有时候我们需要对全局都进行finetune，只不过我们希望改换过的层和其他层的学习速率不一样，这时候我们可以把其他层和新层在optimizer中单独赋予不同的学习速率。比如：

ignored_params = list(map(id, model.fc.parameters())) base_params = filter(lambda p: id(p) not in ignored_params, model.parameters()) optimizer = torch.optim.SGD([ { 
   'params': base_params}, { 
   'params': model.fc.parameters(), 'lr': 1e-2} ], lr=1e-3, momentum=0.9)

其中base_params使用1e-3来训练，model.fc.parameters使用1e-2来训练，momentum是二者共有的。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/211617.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

python冒泡排序原理_python冒泡排序详解

上一篇 2026年3月18日下午10:01

Fusion 360的快捷键大全

下一篇 2026年3月18日下午10:01

因子分析模型 – 因子分析法原理与代码实现 -（Python，R）

因子分析模型 – 因子分析法原理与代码实现 -（Python，R）因子分析基本思想和主成分分析相似首先从原理上说主成分分析是试图寻找原有自变量的一个线性组合取出对线性关系影响较大的原始数据作为主要成分因子分析是假设所有的自变量可以通过若干个因子中间量被观察到什么意思呢举个例子比如一个学生的考试成绩语文 80 数学 95 英语 79 物理 97 化学 94 那么我们认为这个学生理性思维较强语言组织能力较弱其中理性思维和语

全栈程序员-站长
2026年3月16日
3
PLSQL Developer连接Oracle11g 64位数据库配置详解

PLSQL Developer连接Oracle11g 64位数据库配置详解最近换了台64bit的电脑，所以oracle数据库也跟着换成了64bit的，不过问题也随之产生，由于plsqldeveloper暂时没有64bit版本的，所以无法连接到64bit的oracle上，经过一番折腾，终于成功连接到数据库上，现记录下配置过程，以便查看。

全栈程序员-站长
2022年5月26日
58
中国名言警句

中国名言警句中国名言警句一初高中课本名言警句一初中课本名言警句按课本 1 nbsp 6 册顺序排列 1 天下事有难易乎为之则难者亦易矣不为则易者亦难矣人之为学有难易乎学之则难者亦易矣不学则易者亦难矣 nbsp 清彭端淑为学 2 我亦无他惟手熟尔 nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp 宋欧阳修卖油翁 3 敕勒川阴山下下似穹庐笼盖四野天苍苍野茫茫风

全栈程序员-站长
2026年3月17日
2
gpt

GPT 被激活成功教程？DeepSeek 提示词攻击揭秘与终极防御指南

GPT 被激活成功教程？DeepSeek 提示词攻击揭秘与终极防御指南

Ai探索者
2026年3月16日
2
51单片机系列有哪些类型_51单片机1602液晶显示原理

51单片机系列有哪些类型_51单片机1602液晶显示原理Lcd液晶屏幕带有背光显示，可选择蓝光白光黄光三种背光颜色的屏幕，它更具有美光性，在实际生活中有广泛的应用。实物图原理图RS:1为数据/0为指令；RW:1为读/0为写；E1为数据有效，下降沿执行指令示例代码main.c#include”reg52.h” //此文件中定义了单片机的一些特殊功能寄存器#include”lcd.h”typedefunsignedintu16; //对数据类型进行声明定义typedefunsignedcharu8;u8Disp

全栈程序员-站长
2025年12月11日
4
android 常用加密,分享一下Android各种类型的加密

android 常用加密,分享一下Android各种类型的加密以下内容仅供参考具体情况以实际为准360加固assets/.appkeyassets/libjiagu.so爱加密lib/armeabi/libexecmain.soassets/ijiami.ajmassets/af.binassets/signed.binassets/ijm_lib/armeabi/libexec.soassets/ijm_lib/X86/libexec.so几维安全asse…

全栈程序员-站长
2022年5月16日
50

发表回复

关注全栈程序员社区公众号