深度学习中模型计算量(FLOPs)和参数量(Params)的理解以及四种计算方法总结

全栈程序员-站长 • 2026年3月19日上午8:36 • 未分类 • 阅读 2

深度学习中模型计算量(FLOPs)和参数量(Params)的理解以及四种计算方法总结深度学习中模型参数量和计算量的理解与计算首先什么是计算量什么是参数量如何计算参数量计算量对于换算计算量对于各个经典网络计算量与参数量对于硬件要求 6 计算量 FLOPs 和参数量 Params 第一步安装模块第二步计算参考资料接下来要分别概述以下内容首先什么是参数量什么是计算量如何计算参数量如何统计计算量换算参数量把他换算成我们常用的单位比如 mb 对于各个经典网络论述他们是计算量大还是参数两有什么好处计算量参数量分别对显存芯

接下来要分别概述以下内容：

１　首先什么是参数量，什么是计算量

２　如何计算　参数量，如何统计　计算量

３　换算参数量，把他换算成我们常用的单位，比如:mb

４　对于各个经典网络，论述他们是计算量大还是参数量，有什么好处

1 首先什么是计算量，什么是参数量

计算量对应我们之前的时间复杂度，参数量对应于我们之前的空间复杂度，这么说就很明显了

也就是计算量要看网络执行时间的长短，参数量要看占用显存的量

2 如何计算：参数量，计算量

对于卷积层：

参数量就是

(kernel*kernel) *channel_input*channel_output kernel*kernel 就是 weight * weight 其中kernel*kernel ＝ 1个feature的参数量

计算量就是

(kernel*kernel*map*map) *channel_input*channel_output kernel*kernel 就是weight*weight map*map是下个featuremap的大小，也就是上个weight*weight到底做了多少次运算 其中kernel*kernel*map*map＝　1个feature的计算量

（２）针对于池化层：

无参数

（３）针对于全连接层：

参数量＝计算量＝weight_in*weight_out

3 对于换算计算量

一般一个参数是值一个float，也就是４个字节
1kb=1024字节

4 对于各个经典网络：

在这里插入图片描述
(1)换算

以alexnet为例：

参数量：6000万

设每个参数都是float,也就是一个参数是4字节，

总的字节数是24000万字节

24000万字节= 24000万/1024/1024=228mb

(2)为什么模型之间差距这么大

这个关乎于模型的设计了，其中模型里面最费参数的就是全连接层，这个可以看alex和vgg,

alex,vgg有很多fc(全连接层)

resnet就一个fc

inceptionv1(googlenet)也是就一个fc

(3)计算量

densenet其实这个模型不大，也就是参数量不大，因为就1个fc

但是他的计算量确实很大，因为每一次都把上一个feature加进来，所以计算量真的很大

5 计算量与参数量对于硬件要求

计算量，参数量对于硬件的要求是不同的

计算量的要求是在于芯片的floaps（指的是gpu的运算能力）

参数量取决于显存大小

6 计算量(FLOPs)和参数量(Params)

6.1 第一种方法：thop

第一步：安装模块

pip install thop

第二步：计算

# -- coding: utf-8 -- import torch import torchvision from thop import profile # Model print('==> Building model..') model = torchvision.models.alexnet(pretrained=False) dummy_input = torch.randn(1, 3, 224, 224) flops, params = profile(model, (dummy_input,)) print('flops: ', flops, 'params: ', params) print('flops: %.2f M, params: %.2f M' % (flops / .0, params / .0))

结果

==> Building model.. [INFO] Register count_convNd() for <class 'torch.nn.modules.conv.Conv2d'>. [INFO] Register zero_ops() for <class 'torch.nn.modules.activation.ReLU'>. [INFO] Register zero_ops() for <class 'torch.nn.modules.pooling.MaxPool2d'>. [WARN] Cannot find rule for <class 'torch.nn.modules.container.Sequential'>. Treat it as zero Macs and zero Params. [INFO] Register count_adap_avgpool() for <class 'torch.nn.modules.pooling.AdaptiveAvgPool2d'>. [INFO] Register zero_ops() for <class 'torch.nn.modules.dropout.Dropout'>. [INFO] Register count_linear() for <class 'torch.nn.modules.linear.Linear'>. [WARN] Cannot find rule for <class 'torchvision.models.alexnet.AlexNet'>. Treat it as zero Macs and zero Params. flops: .0 params: .0 flops: 714.69 M, params: 61.10 M

注意：

输入input的第一维度是批量(batch size)，批量的大小不回影响参数量，计算量是batch_size=1的倍数
profile(net, (inputs,))的 (inputs,)中必须加上逗号，否者会报错

6.2 第二种方法：ptflops

# -- coding: utf-8 -- import torchvision from ptflops import get_model_complexity_info model = torchvision.models.alexnet(pretrained=False) flops, params = get_model_complexity_info(model, (3, 224, 224), as_strings=True, print_per_layer_stat=True) print('flops: ', flops, 'params: ', params)

结果

AlexNet( 61.101 M, 100.000% Params, 0.716 GMac, 100.000% MACs, (features): Sequential( 2.47 M, 4.042% Params, 0.657 GMac, 91.804% MACs, (0): Conv2d(0.023 M, 0.038% Params, 0.07 GMac, 9.848% MACs, 3, 64, kernel_size=(11, 11), stride=(4, 4), padding=(2, 2)) (1): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.027% MACs, inplace=True) (2): MaxPool2d(0.0 M, 0.000% Params, 0.0 GMac, 0.027% MACs, kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False) (3): Conv2d(0.307 M, 0.503% Params, 0.224 GMac, 31.316% MACs, 64, 192, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2)) (4): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.020% MACs, inplace=True) (5): MaxPool2d(0.0 M, 0.000% Params, 0.0 GMac, 0.020% MACs, kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False) (6): Conv2d(0.664 M, 1.087% Params, 0.112 GMac, 15.681% MACs, 192, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)) (7): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.009% MACs, inplace=True) (8): Conv2d(0.885 M, 1.448% Params, 0.15 GMac, 20.902% MACs, 384, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)) (9): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.006% MACs, inplace=True) (10): Conv2d(0.59 M, 0.966% Params, 0.1 GMac, 13.936% MACs, 256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)) (11): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.006% MACs, inplace=True) (12): MaxPool2d(0.0 M, 0.000% Params, 0.0 GMac, 0.006% MACs, kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False) ) (avgpool): AdaptiveAvgPool2d(0.0 M, 0.000% Params, 0.0 GMac, 0.001% MACs, output_size=(6, 6)) (classifier): Sequential( 58.631 M, 95.958% Params, 0.059 GMac, 8.195% MACs, (0): Dropout(0.0 M, 0.000% Params, 0.0 GMac, 0.000% MACs, p=0.5, inplace=False) (1): Linear(37.753 M, 61.788% Params, 0.038 GMac, 5.276% MACs, in_features=9216, out_features=4096, bias=True) (2): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.001% MACs, inplace=True) (3): Dropout(0.0 M, 0.000% Params, 0.0 GMac, 0.000% MACs, p=0.5, inplace=False) (4): Linear(16.781 M, 27.465% Params, 0.017 GMac, 2.345% MACs, in_features=4096, out_features=4096, bias=True) (5): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.001% MACs, inplace=True) (6): Linear(4.097 M, 6.705% Params, 0.004 GMac, 0.573% MACs, in_features=4096, out_features=1000, bias=True) ) ) flops: 0.72 GMac params: 61.1 M

6.3 第三种方法：pytorch_model_summary

import torch import torchvision from pytorch_model_summary import summary # Model print('==> Building model..') model = torchvision.models.alexnet(pretrained=False) dummy_input = torch.randn(1, 3, 224, 224) print(summary(model, dummy_input, show_input=False, show_hierarchical=False))

结果

==> Building model.. ----------------------------------------------------------------------------- Layer (type) Output Shape Param # Tr. Param # ============================================================================= Conv2d-1 [1, 64, 55, 55] 23,296 23,296 ReLU-2 [1, 64, 55, 55] 0 0 MaxPool2d-3 [1, 64, 27, 27] 0 0 Conv2d-4 [1, 192, 27, 27] 307,392 307,392 ReLU-5 [1, 192, 27, 27] 0 0 MaxPool2d-6 [1, 192, 13, 13] 0 0 Conv2d-7 [1, 384, 13, 13] 663,936 663,936 ReLU-8 [1, 384, 13, 13] 0 0 Conv2d-9 [1, 256, 13, 13] 884,992 884,992 ReLU-10 [1, 256, 13, 13] 0 0 Conv2d-11 [1, 256, 13, 13] 590,080 590,080 ReLU-12 [1, 256, 13, 13] 0 0 MaxPool2d-13 [1, 256, 6, 6] 0 0 AdaptiveAvgPool2d-14 [1, 256, 6, 6] 0 0 Dropout-15 [1, 9216] 0 0 Linear-16 [1, 4096] 37,752,832 37,752,832 ReLU-17 [1, 4096] 0 0 Dropout-18 [1, 4096] 0 0 Linear-19 [1, 4096] 16,781,312 16,781,312 ReLU-20 [1, 4096] 0 0 Linear-21 [1, 1000] 4,097,000 4,097,000 ============================================================================= Total params: 61,100,840 Trainable params: 61,100,840 Non-trainable params: 0 -----------------------------------------------------------------------------

6.4 第四种方法：参数总量和可训练参数总量

import torch import torchvision from pytorch_model_summary import summary # Model print('==> Building model..') model = torchvision.models.alexnet(pretrained=False) pytorch_total_params = sum(p.numel() for p in model.parameters()) trainable_pytorch_total_params = sum(p.numel() for p in model.parameters() if p.requires_grad) print('Total - ', pytorch_total_params) print('Trainable - ', trainable_pytorch_total_params)

结果

==> Building model.. Total -  Trainable -

7 输入数据对模型的参数量和计算量的影响

# -- coding: utf-8 -- import torch import torchvision from thop import profile # Model print('==> Building model..') model = torchvision.models.alexnet(pretrained=False) dummy_input = torch.randn(1, 3, 224, 224) flops, params = profile(model, (dummy_input,)) print('flops: ', flops, 'params: ', params) print('flops: %.2f M, params: %.2f M' % (flops / .0, params / .0))

输入数据：(1, 3, 224, 224)，一张224*224的RGB图像

flops: .0 params: .0 flops: 714.69 M, params: 61.10 M

输入数据：(1, 3, 512, 512)，一张512*512的RGB图像

flops: .0 params: .0 flops: 3710.03 M params: 61.10 M

输入数据：(8, 3, 224, 224)，八张224*224的RGB图像

flops: .0 params: .0 flops: 5717.54 M params: 61.10 M

输入数据	计算量（flops）	参数量（params）
(1, 3, 224, 224)	714.69 M	61.10 M
(1, 3, 512, 512)	3710.03 M	61.10 M
(8, 3, 224, 224)	5717.54 M	61.10 M

参考资料

https://www.cnblogs.com/lllcccddd/p/10671879.html
https://blog.csdn.net/Caesar6666/article/details/

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/209710.html原文链接：https://javaforall.net

学习

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

2022见证中国崛起从Python绘制中国地图开始：使用pyecharts最新版本绘制中国地图实例详解，个性化地图定制及常用参数解析

上一篇 2026年3月19日上午8:36

简单说一下寄存器寻址

下一篇 2026年3月19日上午8:36

java山寨qq_java图形界面之山寨QQ登陆界面

java山寨qq_java图形界面之山寨QQ登陆界面要山寨出登陆界面首先要对 java 的图形界面有一定的了解在 jdk1 4 之前图形界面所用到的所有类和接口都在 javax awt 之下在其之后就都在 javax swing 里了关于图形界面的开发其实就类似于搭积木的过程我们把所需要的控件一个一个的摆放到窗口里面我们所需要的位置一个图形界面就算基本完成了下面我们就拿的登陆界面做一个示范首先我们先了解一下图形界面中所用到的一些基本的控件

全栈程序员-站长
2026年3月18日
2
java打印数组元素_java Arrays快速打印数组的数据元素列表案例

java打印数组元素_java Arrays快速打印数组的数据元素列表案例1、Arrays.toString用来快速打印一维数组的数据元素列表2、Arrays.deepToString快速打印一个二维数组的数据元素列表publicstaticstrictfpvoidmain(String[]args){String[][]arr={{“aaa”,”bbb”},{“ccc”}};for(intx=0;xfor(inty=0;ySystem.out….

全栈程序员-站长
2022年5月6日
43
LPCTSTR类型

LPCTSTR类型如何理解LPCTSTR类型？L表示long指针这是为了兼容Windows3.1等16位操作系统遗留下来的，在win32中以及其他的32为操作系统中，long指针和near指针及far修饰符都是为了兼容的作用。没有实际意义。P表示这是一个指针C表示是一个常量T表示在Win32环境中，有一个_T宏这个宏用来表示你的字符是否使用UNICODE,如果你的

全栈程序员-站长
2025年7月23日
3
数据结构（严蔚敏版）与算法的实现（含全部代码）

数据结构（严蔚敏版）与算法的实现（含全部代码）目录基础c/c++代码优化及常见错误c语言位运算的妙用-程序优化c/c++进制转换方法汇总（含全部代码）二进制数-北邮2012研究生复试质因子分解除树和图外的数据结构可以使用STL:C++STL的使用数据结构线性表顺序表循环左移（2010联考真题）单链表单链表相邻结点逆置(2019北邮考研真…

全栈程序员-站长
2022年6月28日
25
分布式列式数据库HBase

分布式列式数据库HBase本文概述 1 HBase 概述 2 HBase 特点 3 HBase 和 RDBMS 以及 HDFS 的对比区别 4 HBase 核心术语 5 HBase 物理模型 6 HBase 架构 7 HBase 容错 8 HBase 环境搭建 HBase 官网 http hbase apache org ApacheHBase 是一个开源分布式版本化的非关系型数据库 HBase 概述 1 构建在 HDFS 之上的分布式面向列的开源数据库

全栈程序员-站长
2026年3月17日
2
基于SSM框架的毕业设计管理系统的设计与实现（附资源下载）

基于SSM框架的毕业设计管理系统的设计与实现（附资源下载）我的毕业设计就叫毕业设计管理系统的设计与实现，哈哈目录1.摘要2.需求分析3.数据库设计4.功能模块的设计与实现5.项目截图6.项目源码1.摘要毕业设计是本科教育的最后一个环节，整个过程包括课题拟定与审核、师生双选、开题报告、文档审核、中期检查、毕业答辩等多个环节，是一项系统而复杂的工作。开发一个适合本校的毕业设计管理系统，不仅能够极大地减少教务管理人员的…

全栈程序员-站长
2022年7月12日
21

深度学习中模型计算量(FLOPs)和参数量(Params)的理解以及四种计算方法总结

深度学习中模型参数量和计算量的理解与计算

1 首先什么是计算量，什么是参数量

2 如何计算：参数量，计算量

3 对于换算计算量

4 对于各个经典网络：

5 计算量与参数量对于硬件要求

6 计算量(FLOPs)和参数量(Params)

6.1 第一种方法：thop

第一步：安装模块

第二步：计算

6.2 第二种方法：ptflops

6.3 第三种方法：pytorch_model_summary

6.4 第四种方法：参数总量和可训练参数总量

7 输入数据对模型的参数量和计算量的影响

参考资料

关于作者

全栈程序员-站长

相关推荐

java山寨qq_java图形界面之 山寨QQ登陆界面

java打印数组元素_java Arrays快速打印数组的数据元素列表案例

LPCTSTR类型

数据结构（严蔚敏版）与算法的实现（含全部代码）

分布式列式数据库HBase

基于SSM框架的毕业设计管理系统的设计与实现（附资源下载）

发表回复

java山寨qq_java图形界面之山寨QQ登陆界面