损失函数loss大大总结_logloss 损失函数

损失函数loss大大总结_logloss 损失函数1.损失函数:损失函数(lossfunction)是用来评测模型的预测值f(x)与真实值Y的相似程度,损失函数越小,就代表模型的鲁棒性越好,损失函数指导模型学习。根据损失函数来做反向传播修改模型参数。机器学习的目的就是学习一组参数,使得预测值与真值无限接近。2.softmaxloss:它是损失函数的一种,是softmax和cross-entropyloss组合而成的损失函数。先看softmax,其函数形式如下:其中zj就是某个神经网络全连…

大家好,又见面了,我是你们的朋友全栈君。

1.损失函数:

        损失函数(loss function)是用来评测模型的预测值f(x)与真实值Y的相似程度,损失函数越小,就代表模型的鲁棒性越好,损失函数指导模型学习。根据损失函数来做反向传播修改模型参数。机器学习的目的就是学习一组参数,使得预测值与真值无限接近。

2.softmax loss:

        它是损失函数的一种,是softmax和cross-entropy loss组合而成的损失函数。

        先看softmax,其函数形式如下:其中z就是某个神经网络全连接层输出的一组结果,例如分类问题,做4分类,z就是一个1*4的向量。j就是0~3下标号。zk就是全连接层第k个值。

                                                                               损失函数loss大大总结_logloss 损失函数(1)

 全连接输出向量z的每个值没有大小限制,显然通过(1)后就强制将它给限制在0~1之间了,变成概率值。

        cross-entropy loss 交叉熵损失函数在我的博客详细写了下:https://blog.csdn.net/gbz3300255/article/details/106810047

这里就直接上交叉熵的公式了:

                                                                  损失函数loss大大总结_logloss 损失函数(2)

f(zc)就是上面的f(fzk),就是 softmax函数的输出值。yc就是样本真值喽。公式(2)就是最终的损失函数值了。

举例说明:例如真实样本标签为

yc = [0, 0, 1, 0]。  

而第一个预测结果为

f(z1) = [0.1, 0.1,  0.7, 0.1]

f(z2) = [0.25, 0.2, 0.3, 0.35]

f(z3) = [0.15, 0.2, 0.1, 0.55]

显然第一个预测结果是对的,第二个,第三个都是错的。他们的损失函数值分别为

Lz1 = -log0.7

Lz2 = -log0.3

Lz3 = -log0.1

L函数图像如下:

                              损失函数loss大大总结_logloss 损失函数

显然,与真值越接近,损失函数越小,与真值相去越远 ,损失函数越大。优化过程就是不断的将与真值接近的那个概率值提升,提升,再提升,让损失函数降低,降低,再降低。

 

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/124893.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • pytest指定用例_测试用例怎么编写

    pytest指定用例_测试用例怎么编写前言测试用例在设计的时候,我们一般要求不要有先后顺序,用例是可以打乱了执行的,这样才能达到测试的效果.有些同学在写用例的时候,用例写了先后顺序,有先后顺序后,后面还会有新的问题(如:上个用例返回

    2022年7月31日
    5
  • 搭建WAP应用开发程序

    搭建WAP应用开发程序http://www.bitscn.com/java/wireless/200611/82102.h…J2ME开发网最近开辟了Java技术与WAP开发专题,专题将主要讲述WAP开发和Java技术

    2022年8月4日
    8
  • api接口token验证

    api接口token验证

    2021年10月13日
    119
  • python urlopen 乱码[通俗易懂]

    1234567importurllib2importsys content=urllib2.urlopen(‘http://xxx.com’).read()#thewebpageisencodedbyuft-8 type=sys.getfilesystemencodin

    2022年4月16日
    52
  • iphone12屏幕尺寸「建议收藏」

    iphone12屏幕尺寸「建议收藏」各种消息都显示今年苹果的iPhone12系列会有四款机型,分别为5.4英寸的iPhone12、6.1英寸的iPhone12Max、6.1英寸的iPhone12Pro、6.7英寸的iPhone12ProMax。6.1英寸的iPhone12e.苹果京东旗舰店:https://mall.jd.com/index-1000000127.html?5.4英寸iPhone12的机模尺寸在4英寸的iPhoneSE和4.7英寸的iPhone7之间。也就是说5.4英寸的iPhone12机身尺寸比4.7英寸的

    2022年5月15日
    48
  • flask框架菜鸟教程_flask框架是用来干什么的

    flask框架菜鸟教程_flask框架是用来干什么的文章目录前言Flask基础概念和安装Flask快速入门小应用Flask之模板的使用后续,待更新。。。。前言最近开始学习flask框架,本文用于flask框架的基础入门学习,版本使用的是py3.7,学习内容相对比较简单,后续再扩充高级知识。Flask基础概念和安装首先我们得清楚,flask具体是个什么东东?我们学了flask有啥用?这里给出维基百科的解释:Flask是一个使…

    2022年8月29日
    8

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号