siamFC_silvahound

siamFC_silvahound一SiamFC++网络结构及处理流程如下:注意大多数算法对于分类损失都采用交叉熵损失,而SiamFC++在分类分支中计算cls_score与center-nessscore采用了不同的损失函数,cls_score采用focalloss,这样做是为了缓解正负样本不均衡问题;center-nessscore则采用交叉熵loss。最终用这两部分对应元素相乘得到的结果得到更加合理的分类结果,center_ness的作用就是对每一个正样本位置施加权重,离中心进的权重高,离中心远的权重低使得分类更加合

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

一 SiamFC++

网络结构及处理流程如下:
在这里插入图片描述

注意

  • 大多数算法对于分类损失都采用交叉熵损失,而SiamFC++在分类分支中计算cls_score与center-ness score采用了不同的损失函数,cls_score采用focal loss,这样做是为了缓解正负样本不均衡问题;center-ness score则采用交叉熵loss。最终用这两部分对应元素相乘得到的结果是更加合理的分类结果,center_ness的作用就是对每一个正样本位置施加权重,离中心近的权重高,离中心远的权重低使得分类更加合理,增强了鲁棒性。
  • 对于feature map映射问题,由于采用改进的Alexnet(no-padding),所以得到的feature map是中心对称的,而feature map上的一个像素的移动对应原图上8个像素移动(网络步长是8),因此只需计算feature map上所有像素在原图所占的区域,然后用原图大小减去映射回去的尺寸大小再除以2得到了offset,这样就确定了每一个点的位置,方便计算,至于映射回去的点是感受野的中心,验证过程如下:

在这里插入图片描述最终的感受野是175,中心是87.5,这与代码中是相对应的。

二 SiamBAN

网络结构及处理流程如下:
在这里插入图片描述
注意

  • 首先这篇文章的backbone与SiamRPN++是一样的,Resnet50,设置后2层stride为1,conv4 atrous rate=2,conv5 atrous rate=4,并且后续的处理也一致,都对后三层的特征进行融合。
  • 不同之处就在于SiamBAN是anchor-free,不需要设置anchor,那么自然正负样本的判别也要改变,在基于anchor-based的方法中,正负样本的判定依据是anchor与GT之间的IOU,若满足一个阈值就判定为正样本;而对于anchor-free,比如SIamFC++中,若feature map上的像素点映射回原图上落在了GT中则判定为正样本;本文创新点就在于对正负样本的判别,如图:
    在这里插入图片描述
    作者提出新的正负样本判别方法,使得划分更加准确,提升了性能;当feature map上的像素映射回原图落在椭圆E2中则判别为正样本,落在椭圆E1之外判为负样本,落在E1和E2之间则忽略。
  • 对于feature map映射问题,SiamBAN的映射回原图的计算与SiamFC++的映射计算不同,根据代码得到的第一个映射点为31,计算感受野:
    在这里插入图片描述
    可与看到感受野的大小已经超过了原图,但在计算感受野中心的时候需要注意网络的padding,这是我之前忽略的点,由于Resnet的网络特性,padding是必要的,所以在计算的时候需要考虑全局padding,计算得到的全局padding为206,所以相当于输入尺寸为255+2062=667,最终的1717的feature map也就相当于是在尺寸为667大小的输入上以感受野大小475为kernel,全局stride=8为步长进行卷积运算。与SiamFC++处理方法不同的主要原因还是因为padding的问题。此外在该网络的template分支的neck部分对15×15的feature map进行了crop操作,只取中间7×7的部分,这么做就是为了消除padding的影响。而对于search分支没有这一步,个人理解为:网络从template分支提取特征,而search分支只是用来搜索相应的特征,有padding的地方自然不会存在相应的特征,就不会对结果产生影响,因此也就不需要crop操作。

三 个人想法

对于Siamese网络,目前的方法都是想办法提高分类分支的性能,比如用更深的网络,增加center-ness分支,精细正负样本的划分等,而对于回归分支都是计算映射点与GT四条边之间的offsetm,没有太大改变,思考对于网络更进一步的改进的想法,则还需要更多的积累。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/189134.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • c获取网卡序列号_win10查看序列号命令

    c获取网卡序列号_win10查看序列号命令privatevoidbutton1_Click(objectsender,EventArgse){textBox1.Text=””;foreach(stringsinlistBox1.SelectedItems){ManagementObjectSearchersearche…

    2022年10月2日
    6
  • 在 Word 中插入域代码并设置域代码的格式(转)「建议收藏」

    在 Word 中插入域代码并设置域代码的格式(转)「建议收藏」MicrosoftOfficeWord中的域用作文档中可能会改变的数据的占位符,并用于在邮件合并文档中创建套用信函和标签。这些种类的域也称为域代码,它们不同于那些用于输入信息的域类型,如在表单上。有关向文档中添加表单域的信息,请参阅创建打印表单、创建用户在Word中填写的表单或在Word中制作核对清单使用特定命令时(如插入页码时、插入封面等文档构建基块时或创建目录时),…

    2022年5月1日
    949
  • 网站的栏目页是什么_栏目页

    网站的栏目页是什么_栏目页功能说明栏目子分类列表,栏目导航适用范围首页模板,列表模板,内容模板基本语法[NT:unLoop,NT:SiteID=0,NT:LabelType=ClassNavi,NT:ClassID=ClassID,NT:HrefCSS=HrefCSS,NT:NaviChar=NaviChar,NT:isDiv=false,NT:Cols=1][/NT:unLoop…

    2022年9月28日
    4
  • 微信公众号推广_微信公众号评论点赞

    微信公众号推广_微信公众号评论点赞原标题:微信公众号分享集赞吸粉方案,人人可复制分享集赞这种方式很早就有了,不仅在微信公众号运营圈子里面盛行,很多做微商、代购的都很喜欢用这种方式吸粉,其优点是操作简单,可行性佳,获粉成本低。小编在自己博客分享了一些吸粉的文章,但很多同学反馈大多数方法操作难度大,需要很大的工作量,其中80%的朋友还觉得不擅长去做这些事情,需要对这些领域有一定的认识,并且不知道这些事情做了之后有没有效果,其实有这种担…

    2025年9月22日
    10
  • html+css网页开发 之 头部导航条(logo、导航栏、搜索框)

    html+css网页开发 之 头部导航条(logo、导航栏、搜索框)页面布局整体思路:确定页面的版心(可视区),测量可知。 分析页面中的行模块,以及每个行模块中的列模块。 一行中列模块常用浮动布局,先确定每个列的大小,之后确定列的位置。 制作HTML结构。遵循先有结构,后有样式的原则。头部制作1号是版心盒子header1200*42的盒子水平居中对齐 版心盒子内包含2号盒子logo 版心盒子内包含3号盒子nav导航栏 版心盒子内包含4号盒子search搜索框 版心盒子内包含5号盒子user个人信息 注意4个盒子都必须是浮动style.c..

    2022年5月28日
    50
  • vscode html注释快捷键_宇宙最强vscode教程(基础篇)

    vscode html注释快捷键_宇宙最强vscode教程(基础篇)本文主要介绍vscode在工作中常用的快捷键及插件,目标在于提高工作效率本文的快捷键是基于mac的,windows下的快捷键放在括号里Cmd+Shift+P(winCtrl+Shift+P)零、快速入门有经验的可以跳过快速入门或者大致浏览一遍1.命令面板命令面板是vscode快捷键的主要交互界面,可以使用f1或者Cmd+Shift+P(winCtrl+Shift+P)打开。在命令…

    2022年6月9日
    52

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号