mse函数(均方误差函数)_二次代价函数有什么用

mse函数(均方误差函数)_二次代价函数有什么用MSE均方误差(L2loss)1.代码展示MAE和MSE图片特性importtensorflowastfimportmatplotlib.pyplotaspltsess=tf.Session()x_val=tf.linspace(-1.,-1.,500)target=tf.constant(0.)#计算L2_lossl2_y_val=tf…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

MSE均方误差(L2 loss)

1.代码展示MAE和MSE图片特性
import tensorflow as tf
import matplotlib.pyplot as plt
sess = tf.Session()
x_val = tf.linspace(-1.,-1.,500)
target = tf.constant(0.)

#计算L2_loss
l2_y_val = tf.square(target - x_val)
l2_y_out = sess.run(l2_y_val)#用这个函数打开计算图

#计算L1_loss
l1_y_val = tf.abs(target - x_val)
l1_y_out = sess.run(l1_y_val)#用这个函数打开计算图

#打开计算图输出x_val,用来画图
#用画图来体现损失函数的特点
x_array = sess.run(x_val)
plt.plot(x_array, l1_y_out, 'b--', lable = 'L1_loss')
plt.plot(x_array, l2_y_out, 'r--', lable = 'L2_loss')

这里写图片描述

2.MSE公式及导数推导

损失函数:

mse函数(均方误差函数)_二次代价函数有什么用

以单个样本举例:
[外链图片转存失败(img-PAQ9mnqd-1562394972088)(http://i.imgur.com/D4n2Dsz.jpg)] ,a=σ(z), where z=wx+b

利用SGD算法优化损失函数,通过梯度下降法改变参数从而最小化损失函数:
对两个参数权重和偏置进行求偏导(这个过程相对较容易):
这里写图片描述

参数更新:
这边就说一种简单的更新策略(随机梯度下降):
[外链图片转存失败(img-pTU7Q58r-1562394972090)(http://image107.360doc.com/DownloadImg/2017/06/1400/101675026_3)]

3.分析L2 Loss的特点

根据上面的损失函数对权重和偏置求导的公式我们发现:

这里写图片描述

其中,z表示神经元的输入,σ表示激活函数。从以上公式可以看出,w和b的梯度跟激活函数的梯度成正比,激活函数的梯度越大,w和b的大小调整得越快,训练收敛得就越快。但是L2 Loss的这个特点存在的缺陷在于,对于我们常用的sigmoid激活函数来说,并不是很符合我们的实际需求。
先介绍下sigmoid激活函数的特性:
sigmoid函数就是损失函数的输入:a=σ(z) 中的σ()的一种。这是一个激活函数,该函数的公式,导数以及导数的分布图如下图所示:
mse函数(均方误差函数)_二次代价函数有什么用
mse函数(均方误差函数)_二次代价函数有什么用
mse函数(均方误差函数)_二次代价函数有什么用
mse函数(均方误差函数)_二次代价函数有什么用

我们可以从sigmoid激活函数的导数特性图中发现,当激活值很大的时候,sigmoid的梯度(就是曲线的斜率)会比较小,权重更新的步幅会比较小,这时候网络正处在误差较大需要快速调整的阶段,而上述特性会导致网络收敛的会比较慢;而当激活值很小的时候,sigmoid的梯度会比较大,权重更新的步幅也会比较大,这时候网络的预测值正好在真实值的边缘,太大的步幅也会导致网络的震荡。这我们的期望不符,即:不能像人一样,错误越大,改正的幅度越大,从而学习得越快。而错误越小,改正的幅度小一点,从而稳定的越快。而交叉熵损失函数正好可以解决这个问题。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/187690.html原文链接:https://javaforall.net

(0)
上一篇 2026年4月18日 下午8:25
下一篇 2026年4月18日 下午8:31


相关推荐

  • oracle数据库运维流程,oracle数据库运维主要做什么?.docx

    oracle数据库运维流程,oracle数据库运维主要做什么?.docxoracle 数据库运维主要做什么 3 oracle 数据库运维主要做什么 一 数据库运维工作总原则 1 能不给数据库做的事情不要给数据库 数据库只做数据容器 2 对于数据库的变更必须有记录 可以回滚 二 权限相关总原则 以最低粒度控制权限 SELECT 权限 所有开发人员均可拥有自己业务范围内的表权限 INSERT UPDATE DELETE 权限 所有项目经理可以拥有自己业务范围内的表权限 Stru

    2026年3月19日
    3
  • java中import作用详解

    java中import作用详解java中import详解import与package机制相关,这里先从package入手,再讲述import以及staticimport的作用。

    2022年6月7日
    28
  • CString::ReverseFind()和CString::Find()区别「建议收藏」

    CString::ReverseFind()和CString::Find()区别「建议收藏」Find()是从左往右查找;ReverseFind()是从右边往左查找,但是他们返回的地址都是从左往右数的。示例:[cpp]#include“stdafx.h”#include”afx.h”intmain(intargc,char*argv){CStringstr=”abcdabcd”;inta=str.Find(‘b’);printf(“

    2022年6月16日
    33
  • 单片机应用基础知识_51单片机基础知识总结

    单片机应用基础知识_51单片机基础知识总结单片机——硬件基础知识宗旨:技术的学习是有限的,分享的精神是无限的。1、单片机内部资源STC89C52:8KFLASH、512字节RAM、32个IO口、3个定时器、1个UART、8个中断源(1)Flash(硬盘)——程序存储空间——擦写10万次,断电数据不丢失,读写速度慢(2)RAM(内存)——数据存储空间——断电数据丢失

    2025年10月3日
    5
  • Android利用网络编程HttpClient批量上传(一个)

    Android利用网络编程HttpClient批量上传(一个)

    2022年1月3日
    40
  • Linux系统查看CPU使用率的几个命令

    Linux系统查看CPU使用率的几个命令在 linux 的系统维护中 可能需要经常查看 cpu 使用率 分析系统整体的运行情况 而监控 CPU 的性能一般包括以下 3 点 运行队列 CPU 使用率和上下文切换 对于每一个 CPU 来说运行队列最好不要超过 3 例如 如果是双核 CPU 就不要超过 6 如果队列长期保持在 3 以上 说明任何一个进程运行时都不能马上得到 cpu 的响应 这时可能需要考虑升级 cpu 另外满负荷运行 cpu 的使用率最好是 user 空间保持在 65

    2026年3月18日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号