softmax损失函数理解「建议收藏」

softmax损失函数理解「建议收藏」softmaxsoftmax的定义假设有一个数组V,ViVi表示V中的第i个元素,那么这个元素的softmax值为:SoftmaxLayer和SoftmaxLossLayersoftmaxLayersoftmax实际上就是logistic的扩展,后者只能二分类,前者则能多分类,实际上都是返回每一类的概率值。在caffe里面softmax的实现分为以下几步(加入输入到softmax里面…

大家好,又见面了,我是你们的朋友全栈君。

softmax
softmax的定义
在这里插入图片描述
假设有一个数组V,ViVi表示V中的第i个元素,那么这个元素的softmax值为:
在这里插入图片描述
SoftmaxLayer和SoftmaxLossLayer

softmaxLayer
softmax实际上就是logistic的扩展,后者只能二分类,前者则能多分类,实际上都是返回每一类的概率值。在caffe里面softmax的实现分为以下几步(加入输入到softmax里面的结点数为10):
1)找出输入的最大值,输入的每个变量减去最大值,取指数(e为底);
2)对1)中结果归一化,得出的结果就是每一类的分类概率。

softmaxLoss
实际上就是个代价函数,我们要让分类正确的概率最大,然后我们对这个概率取log对数,由于代价函数都是最小化,所以我们在log前面加个负号。caffe中都是以batch为单位进行训练的,所以计算loss的时候都是以batch为单位求和取平均。

softmax loss是我们最熟悉的loss之一了,分类任务中使用它,分割任务中依然使用它。softmax loss实际上是由softmax和cross-entropy loss组合而成,两者放一起数值计算更加稳定。这里我们将其数学推导一起回顾一遍。

令z是softmax层的输入,f(z)是softmax的输出,则

单个像素i的softmax loss等于cross-entropy error如下:

展开上式:

softmaxLoss
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/153117.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月26日 下午5:36
下一篇 2022年6月26日 下午5:46


相关推荐

  • Linux FTP服务搭建(完整步骤)

    Linux FTP服务搭建(完整步骤)1 安装 vsftpd 使用静默模式直接安装 yum yinstallvsft 2 新增 FTP 用户默认仅允许用户使用 FTP 不允许登录系统 如要允许登录请使用 usermod 命令 useradd d home ftpftp user 增加用户 ftp user 并指定用户的主目录为 home ftpusermod s bin bashftp user 恢复用户 ftp user 的 ssh 登录权限 3 设置用户登录密码执行命令后根据提示输入两次密码即可完成

    2026年3月17日
    2
  • Java Web显示用户上次访问时间(实例一)

    Java Web显示用户上次访问时间(实例一)**利用Cookie技术实现显示用户上次访问的功能**importjava.io.IOException;importjava.text.SimpleDateFormat;importjava.util.Date;importjavax.servlet.ServletException;importjavax.servlet.http.C…

    2022年7月8日
    21
  • JavaScript模板字符串

    JavaScript模板字符串JavaScript 模板字符串字符串插值模板字符串标签函数

    2025年11月16日
    6
  • 树莓派3B 系统安装及初始化配置教程[通俗易懂]

    树莓派3B 系统安装及初始化配置教程[通俗易懂]本文仅供学习交流使用,如侵立删!企鹅:1033383881相关软件下载链接SD卡格式化工具、系统烧录工具、Raspbian系统镜像https://pan.baidu.com/s/1o5j_uD31hxLsPP–GRZ4Bw提取码:9nhv1.烧录系统1.1SD卡格式化安装SD卡格式化工具,格式化SD卡1.2写入系统镜像至SD卡点击写入后会有个确认覆盖弹窗提示,YES即…

    2022年6月25日
    33
  • js中join方法

    js中join方法js中的join方法join方法用于把数组中的所有元素放入一个字符串。元素是通过指定的分隔符进行分隔的。大白话:join方法可以用符不同的分隔符来构建这个字串。join方法值接受一个参数,即用作分隔符的字符串,然后返回所有数组项的字符串。vararr=["red","yellow","blue"];vararray=[];下面开始调用join方法1a…

    2022年4月29日
    84
  • glance基础命令

    glance基础命令glance 相关命令 glancehelp grepimage 创建镜像 glanceimage createnamece 8 x86 64disk format qcow2contain format bare is public Truefile

    2026年3月19日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号