ILSVRC-ImageNet历年竞赛冠军

ILSVRC-ImageNet历年竞赛冠军ImageNet 是一个超过 15million 的图像数据集 大约有 22 000 类 是由李飞飞团队从 2007 年开始 耗费大量人力 通过各种方式 网络抓取 人工标注 亚马逊众包平台 收集制作而成 它作为论文在 CVPR 2009 发布 当时人们还很怀疑通过更多数据就能改进算法的看法 深度学习发展起来有几个关键的因素 一个就是庞大的数据 比如说 ImageNet 一个是 GPU 的出现 还有更优的深度模型 更好的优化算法 可以说数据和 GPU 推动了这些的产生 这些产生继续推动深度学习的发展 ILSVRC 是一个

ImageNet

ILSVRC

ILSVRC从2010年开始举办,到2017年是最后一届(在算法层面已经刷过拟合了,再比下去意义不是很大了)。ILSVRC-2012的数据集被用在2012-2014年的挑战赛中(VGG论文中提到)。ILSVRC-2010是唯一提供了test set的一年。
ImageNet可能是指整个数据集(15 million),也可能指比赛用的那个子集(1000类,大约每类1000张),也可能指ILSVRC这个比赛。需要根据语境自行判断。
12-15年期间在ImageNet比赛上提出了一些经典网络,比如AlexNet,ZFNet,OverFeat,VGG,Inception,ResNet。
16年之后也有一些经典网络,比如WideResNet,FractalNet,DenseNet,ResNeXt,DPN,SENet。


2012年

AlexNet是2012年ImageNet竞赛冠军获得者Hinton和他的学生Alex Krizhevsky设计的。也是在那年之后,更多的更深的神经网络被提出,比如优秀的vgg,GoogLeNet。AlexNet中包含了几个比较新的技术点,也首次在CNN中成功应用了ReLU、Dropout和LRN等Trick。

2013年

OverFeat:OverFeat是早期经典的one-stage Object Detection的方法,基于AlexNet,实现了识别、定位、检测共用同一个网络框架;获得了2013年ILSVRC定位比赛的冠军。

OverFeat方法的主要创新点是 multiscale 、sliding window、offset pooling,以及基于AlexNet的识别、定位和检测方法的融合。

2014年

GoogLeNet 冠军:从Inception v1到v4。引入稀疏特性和将全连接层转换成稀疏连接。在inception结构中,大量采用了1×1的矩阵,主要是两点作用:1)对数据进行降维;2)引入更多的非线性,提高泛化能力,因为卷积后要经过ReLU激活函数。

VGG(亚军):VGG模型在多个迁移学习任务中的表现要优于googLeNet。而且,从图像中提取CNN特征,VGG模型是首选算法。它的缺点在于,参数量有140M之多,需要更大的存储空间。

2015年

生成了ResNet-50,ResNet-101,ResNet-152. 随着深度增加,因为解决了退化问题,性能不断提升。作者最后在Cifar-10上尝试了1202层的网络,结果在训练误差上与一个较浅的110层的相近,但是测试误差要比110层大1.5%。作者认为是采用了太深的网络,发生了过拟合

2016年

Trimps-Soushen冠军

ResNeXt(亚军):
ResNeXt是ResNet[2]和Inception[3]的结合体,不同于Inception v4[4]的是,ResNext不需要人工设计复杂的Inception结构细节,而是每一个分支都采用相同的拓扑结构。ResNeXt的本质是分组卷积(Group Convolution)[5],通过变量基数(Cardinality)来控制组的数量。组卷机是普通卷积和深度可分离卷积的一个折中方案,即每个分支产生的Feature Map的通道数为 [公式]

2017年

SENet
SENet是ImageNet 2017(ImageNet收官赛)的冠军模型,和ResNet的出现类似,都在很大程度上减小了之前模型的错误率),并且复杂度低,新增参数和计算量小。下面就来具体介绍一些SENet的神奇之处。

SENet的全称是Squeeze-and-Excitation Networks,中文可以翻译为压缩和激励网络。主要由两部分组成:

  1. Squeeze部分。即为压缩部分,原始feature map的维度为HWC,其中H是高度(Height),W是宽度(width),C是通道数(channel)。Squeeze做的事情是把HWC压缩为11C,相当于把HW压缩成一维了,实际中一般是用global average pooling实现的。HW压缩成一维后,相当于这一维参数获得了之前H*W全局的视野,感受区域更广。
  2. Excitation部分。得到Squeeze的11C的表示后,加入一个FC全连接层(Fully Connected),对每个通道的重要性进行预测,得到不同channel的重要性大小后再作用(激励)到之前的feature map的对应channel上,再进行后续操作。

在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/178444.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月26日 下午5:17
下一篇 2026年3月26日 下午5:17


相关推荐

  • java实现数据库同步的方法_java数据库同步中间层使用

    java实现数据库同步的方法_java数据库同步中间层使用之前也有用过数据库的同步中间件比如阿里的canal,最近突发奇想,自己使用Java进行不同数据库品牌的数据库同步,比如Oracle同步到MySQL,等等;正文…

    2022年10月15日
    6
  • 全息投影技术的实现_自制全息投影视频素材

    全息投影技术的实现_自制全息投影视频素材今天自己亲自动手制作了一个全息投影仪,智能手机早就具备投射出全息影像的潜质,现在Mrwhosetheboss就将这段教程上传到网上,看起来简直酷极了。

    2022年8月5日
    11
  • ADFS配置

    ADFS配置https blog joden123 top 2019 03 11 sso adfs adfs install

    2025年6月13日
    7
  • JavaScript split() 方法的第二个参数

    JavaScript split() 方法的第二个参数记录目的补充记录冷门知识点 记录日常工作使用 split 将字符串分割为数组 基本只会使用一个参数 即分割字符串的字符 如空字符 空格 逗号 特殊符号 amp 等等 查看官方 api 可以看到此方法拥有第二个参数 howmany 根据传入的 howmany 数值 返回切割后的长度为 howmany 的数组 使用场景比较少 但懂得多一点总归是好的 示例场景 只需要切割后的前 n 项 数据存在规律性 从某个分割点之后无效 获取有效数据 或是装 x 显摆 或是欺负小白 你

    2026年3月19日
    3
  • aria2 bt tracker_ar接入路由器产品文档

    aria2 bt tracker_ar接入路由器产品文档vi/root/trackers-list-aria2.sh内容如下:#!/bin/bash#/usr/sbin/servicearia2stoplist=`wget-qO-https://raw.githubusercontent.com/ngosang/trackerslist/master/trackers_all.txt|awkNF|sed”:a;N;s/…

    2026年4月17日
    7
  • offsetWidth,clientWidth的区别

    offsetWidth,clientWidth的区别offsetWidth offsetHeight ,offsetLeft offsetTopscrollWidth scrollHeight ,scrollLeft scrollTopclientWidth clientHeight 对象的实际宽度和高度      offsetWidth,offsetHeight  offsetWidth=width+padd

    2022年7月22日
    13

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号