pytorch 如何finetune

pytorch 如何finetune局部微调有时候我们加载了训练模型后 只想调节最后的几层 其他层不训练 其实不训练也就意味着不进行梯度计算 PyTorch 中提供的 requires grad 使得对训练的控制变得非常简单 model torchvision models resnet18 pretrained True forparaminmo parameters param requires grad False 替换最后的全连接层 改为训练 100 类 新构造的模块的参数默认 requires

用pytorch实现预训练网络的finetune

局部微调

有时候我们加载了训练模型后,只想调节最后的几层,其他层不训练。其实不训练也就意味着不进行梯度计算,PyTorch中提供的requires_grad使得对训练的控制变得非常简单。

model = torchvision.models.resnet18(pretrained=True) for param in model.parameters(): param.requires_grad = False # 替换最后的全连接层, 改为训练100类 # 新构造的模块的参数默认requires_grad为True model.fc = nn.Linear(512, 100) # 只优化最后的分类层 optimizer = optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9) 

全局微调,不同学习率

有时候我们需要对全局都进行finetune,只不过我们希望改换过的层和其他层的学习速率不一样,这时候我们可以把其他层和新层在optimizer中单独赋予不同的学习速率。比如:

ignored_params = list(map(id, model.fc.parameters())) base_params = filter(lambda p: id(p) not in ignored_params, model.parameters()) optimizer = torch.optim.SGD([ { 
   'params': base_params}, { 
   'params': model.fc.parameters(), 'lr': 1e-2} ], lr=1e-3, momentum=0.9) 

其中base_params使用1e-3来训练,model.fc.parameters使用1e-2来训练,momentum是二者共有的。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/211617.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 下午10:01
下一篇 2026年3月18日 下午10:01


相关推荐

  • 因子分析模型 – 因子分析法原理与代码实现 -(Python,R)

    因子分析模型 – 因子分析法原理与代码实现 -(Python,R)因子分析基本思想和主成分分析相似 首先从原理上说 主成分分析是试图寻找原有自变量的一个线性组合 取出对线性关系影响较大的原始数据 作为主要成分 因子分析 是假设所有的自变量可以通过若干个因子 中间量 被观察到 什么意思呢 举个例子 比如一个学生的考试成绩 语文 80 数学 95 英语 79 物理 97 化学 94 那么我们认为这个学生理性思维较强 语言组织能力较弱 其中理性思维和语

    2026年3月16日
    3
  • PLSQL Developer连接Oracle11g 64位数据库配置详解

    PLSQL Developer连接Oracle11g 64位数据库配置详解最近换了台64bit的电脑,所以oracle数据库也跟着换成了64bit的,不过问题也随之产生,由于plsqldeveloper暂时没有64bit版本的,所以无法连接到64bit的oracle上,经过一番折腾,终于成功连接到数据库上,现记录下配置过程,以便查看。

    2022年5月26日
    58
  • 中国名言警句

    中国名言警句中国名言警句一 初高中课本名言警句 一 初中课本名言警句 按课本 1 nbsp 6 册顺序排列 1 天下事有难易乎 为之 则难者亦易矣 不为 则易者亦难矣 人之为学有难易乎 学之 则难者亦易矣 不学 则易者亦难矣 nbsp 清 彭端淑 为学 2 我亦无他 惟手熟尔 nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp 宋 欧阳修 卖油翁 3 敕勒川 阴山下 下似穹庐 笼盖四野 天苍苍 野茫茫 风

    2026年3月17日
    2
  • GPT 被激活成功教程?DeepSeek 提示词攻击揭秘与终极防御指南

    GPT 被激活成功教程?DeepSeek 提示词攻击揭秘与终极防御指南

    2026年3月16日
    2
  • 51单片机系列有哪些类型_51单片机1602液晶显示原理

    51单片机系列有哪些类型_51单片机1602液晶显示原理Lcd液晶屏幕带有背光显示,可选择蓝光白光黄光三种背光颜色的屏幕,它更具有美光性,在实际生活中有广泛的应用。实物图原理图RS:1为数据/0为指令;RW:1为读/0为写;E1为数据有效,下降沿执行指令示例代码main.c#include”reg52.h” //此文件中定义了单片机的一些特殊功能寄存器#include”lcd.h”typedefunsignedintu16; //对数据类型进行声明定义typedefunsignedcharu8;u8Disp

    2025年12月11日
    4
  • android 常用加密,分享一下Android各种类型的加密

    android 常用加密,分享一下Android各种类型的加密以下内容仅供参考具体情况以实际为准360加固assets/.appkeyassets/libjiagu.so爱加密lib/armeabi/libexecmain.soassets/ijiami.ajmassets/af.binassets/signed.binassets/ijm_lib/armeabi/libexec.soassets/ijm_lib/X86/libexec.so几维安全asse…

    2022年5月16日
    50

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号