深度学习基础之-2.6标签值归一化

深度学习基础之-2.6标签值归一化提出问题在计算Loss时,会达到172.287,337.246这样大的数值,一般Loss都应该小于1.解决问题标签值也归一化公式如下:(1)ynew=y−yminymax−ymin=y−yminyrangey_{new}=\frac{y-y_{min}}{y_{max}-y_{min}}=\frac{y-y_{min}}{y_{range}}\tag{1}ynew​=ymax​−…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

提出问题

在计算Loss时,会达到172.287,337.246这样大的数值,一般Loss都应该小于1.

解决问题

标签值也归一化公式如下:

(1) y n e w = y − y m i n y m a x − y m i n = y − y m i n y r a n g e y_{new} = \frac{y-y_{min}}{y_{max}-y_{min}} = \frac{y-y_{min}}{y_{range}} \tag{1} ynew=ymaxyminyymin=yrangeyymin(1)

将标签归一化之后进行训练其他操作保持不变,会得到非常小的W,B值:

w=0.01374991 -0.09151012  0.90392058
b=0.08233892
z=0.62474539

这样在预测时,z值也会非常小,只有0.62,一套房子不可能6000块钱,一平米都买不到。所以要把预测出来的值也要做反归一化。根据公式1:
(2) y = y n e w ∗ y r a n g e + y m i n y = y_{new}*y_{range}+y_{min} \tag{2} y=ynewyrange+ymin(2)

归一化和反归一化的关系

归一化 Weight Bias 预测值Xt 预测方法
只归一化X W n o r m W_{norm} Wnorm反归一化为 W r e a l W_{real} Wreal W n o r m W_{norm} Wnorm反归一化为 B r e a l B_{real} Breal 不归一化 X t Xt Xt W r e a l , B r e a l W_{real},B_{real} Wreal,Breal预测
只归一化Y 使用训练结果 W n o r m W_{norm} Wnorm 使用训练结果 B n o r m B_{norm} Bnorm 归一化为 X t n o r m Xt_{norm} Xtnorm W n o r m , B n o r m W_{norm},B_{norm} Wnorm,Bnorm预测
同时归一化X和Y 使用训练结果 W n o r m W_{norm} Wnorm 使用训练结果 B n o r m B_{norm} Bnorm 归一化为 X t n o r m Xt_{norm} Xtnorm W n o r m , B n o r m W_{norm},B_{norm} Wnorm,Bnorm预测,再反归一化结果
  • X必须归一化,否则无法训练
  • 训练出的结果W和B,在推理时有两种使用方式:
    • a. 直接使用,此时必须把预测时输入的X也做相同规则的归一化
    • b. 反归一化为W,B的本来值 W R e a l , B R e a l W_{Real},B_{Real} WReal,BReal,推理时输入的X不需要改动
  • Y可以归一化,好处是迭代次数少。如果结果收敛,也可以不归一化,如果不收敛(数值过大),就必须归一化
  • 如果Y归一化,先沿袭第2步的做法,对得出来的结果做关于Y的反归一化
标签值归一化 标签值不归一化
在这里插入图片描述 在这里插入图片描述
Loss初始值只有0.04 oss初始值达到4000
迭代次数1000次 迭代次数2000次

https://github.com/microsoft/ai-edu/blob/master/B-教学案例与实践/B6-神经网络基本原理简明教程/05.6-归一化标签值.md

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/183684.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • VC6的SDK:Microsoft Platform SDK February 2003下载地址「建议收藏」

    VC6的SDK:Microsoft Platform SDK February 2003下载地址「建议收藏」据说是最后一个支持VC6R的SDK,我在项目中出现如下错误:errorLNK2001:unresolvedexternalsymbol_CLSID_ConnectionManager明明包含了这些头文件,也链接了LIB。。。#include//启用、禁用网卡#pragmacomment(lib,”ole32.lib”)VC6使用WMI

    2022年6月4日
    131
  • 易百教程wxpython_WxPython教程

    易百教程wxpython_WxPython教程wxPython是一个Python包装wxWidgets(这是用C++编写),一个流行的跨平台GUI工具包。由RobinDunn以及HarriPasanen开发,wxPython是作为一个Python扩展模块。就像wxWidgets,wxPython也是一个免费的软件。它可以从官方网站下载:http://wxpython.org.在本网站上可下载wxPython对应操作系统平台二进…

    2022年5月22日
    40
  • zigbee协议栈工作流程 From zigbee菜鸟笔记(十 一)

    zigbee协议栈工作流程 From zigbee菜鸟笔记(十 一)一.ZigBee协议栈简介什么是ZigBee协议栈呢?它和ZigBee协议有什么关系呢?协议是一系列的通信标准,通信双方需要共同按照这一标准进行正常的数据发射和接收。协议栈是协议的具体实现形式,通俗点来理解就是协议栈是协议和用户之间的一个接口,开发人员通过使用协议栈来使用个协议的,进而实现无线数据收发。ZigBee的协议分为两部分,IEEE802.15.4定义了PHY(物理层)和MAC(介质访问层)技术规范;ZigBee联盟定义了NWK(网络层)、APS(应用程序支持子层)、APL(应用层

    2022年5月28日
    45
  • python如何生成随机数_Python生成50个随机数

    python如何生成随机数_Python生成50个随机数1.使用random包生成随机数可以生成均匀分布,高斯分布,(包括正态分布)指数分布,(与泊松分布有区别:泊松分布表示一段时间发生多少次,而指数分布表示两次发生的时间间隔)贝塔分布,韦布尔分布的随机数由此可见,random包支持的随机分布比较有限,功能较少.例如:(1)生成[1,10]内的均匀分布随机数random.uniform(1,10)Out[29]:……

    2022年10月5日
    1
  • 微信看一看有访客记录吗_微信到底能不能看访客

    微信看一看有访客记录吗_微信到底能不能看访客这个访客神器,不仅可以看到多少人看了你的朋友圈。还可以知道他们是谁,看了多久…

    2022年9月18日
    2
  • 妇产科护理学试题库及答案_妇产科护理学题库集各章节

    妇产科护理学试题库及答案_妇产科护理学题库集各章节试题一1.关于子宫的位置与形态,正确的为DA.位于盆腔下方B.形如扁梨形C.容积为2mlD.前与膀胱,后与直肠为邻E.子宫峡部非孕时长3cm2.保持子宫前倾位置的一对主要韧带是CA.圆韧带B.阔韧带C.主韧带D.骨盆漏斗韧带E.子宫骶骨韧带3.与后穹隆顶端贴接的部分为EA.宫颈口B.附件C.膀胱D.直肠E.直肠子宫陷凹4.关于骨盆外测量径线的描述,错误的是BA.髂棘间径为两侧髂前上棘外缘间的距离B.坐骨结节间径为两侧坐骨结节外缘间的距离C

    2025年7月10日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号