深度学习基础之-2.6标签值归一化

深度学习基础之-2.6标签值归一化提出问题在计算Loss时,会达到172.287,337.246这样大的数值,一般Loss都应该小于1.解决问题标签值也归一化公式如下:(1)ynew=y−yminymax−ymin=y−yminyrangey_{new}=\frac{y-y_{min}}{y_{max}-y_{min}}=\frac{y-y_{min}}{y_{range}}\tag{1}ynew​=ymax​−…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

提出问题

在计算Loss时,会达到172.287,337.246这样大的数值,一般Loss都应该小于1.

解决问题

标签值也归一化公式如下:

(1) y n e w = y − y m i n y m a x − y m i n = y − y m i n y r a n g e y_{new} = \frac{y-y_{min}}{y_{max}-y_{min}} = \frac{y-y_{min}}{y_{range}} \tag{1} ynew=ymaxyminyymin=yrangeyymin(1)

将标签归一化之后进行训练其他操作保持不变,会得到非常小的W,B值:

w=0.01374991 -0.09151012  0.90392058
b=0.08233892
z=0.62474539

这样在预测时,z值也会非常小,只有0.62,一套房子不可能6000块钱,一平米都买不到。所以要把预测出来的值也要做反归一化。根据公式1:
(2) y = y n e w ∗ y r a n g e + y m i n y = y_{new}*y_{range}+y_{min} \tag{2} y=ynewyrange+ymin(2)

归一化和反归一化的关系

归一化 Weight Bias 预测值Xt 预测方法
只归一化X W n o r m W_{norm} Wnorm反归一化为 W r e a l W_{real} Wreal W n o r m W_{norm} Wnorm反归一化为 B r e a l B_{real} Breal 不归一化 X t Xt Xt W r e a l , B r e a l W_{real},B_{real} Wreal,Breal预测
只归一化Y 使用训练结果 W n o r m W_{norm} Wnorm 使用训练结果 B n o r m B_{norm} Bnorm 归一化为 X t n o r m Xt_{norm} Xtnorm W n o r m , B n o r m W_{norm},B_{norm} Wnorm,Bnorm预测
同时归一化X和Y 使用训练结果 W n o r m W_{norm} Wnorm 使用训练结果 B n o r m B_{norm} Bnorm 归一化为 X t n o r m Xt_{norm} Xtnorm W n o r m , B n o r m W_{norm},B_{norm} Wnorm,Bnorm预测,再反归一化结果
  • X必须归一化,否则无法训练
  • 训练出的结果W和B,在推理时有两种使用方式:
    • a. 直接使用,此时必须把预测时输入的X也做相同规则的归一化
    • b. 反归一化为W,B的本来值 W R e a l , B R e a l W_{Real},B_{Real} WReal,BReal,推理时输入的X不需要改动
  • Y可以归一化,好处是迭代次数少。如果结果收敛,也可以不归一化,如果不收敛(数值过大),就必须归一化
  • 如果Y归一化,先沿袭第2步的做法,对得出来的结果做关于Y的反归一化
标签值归一化 标签值不归一化
在这里插入图片描述 在这里插入图片描述
Loss初始值只有0.04 oss初始值达到4000
迭代次数1000次 迭代次数2000次

https://github.com/microsoft/ai-edu/blob/master/B-教学案例与实践/B6-神经网络基本原理简明教程/05.6-归一化标签值.md

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/183684.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 学习:imfill[通俗易懂]

    学习:imfill[通俗易懂]Matlab函数imfill简介  函数功能:该函数用于填充图像区域和“空洞”。  语法格式:  BW2=imfill(BW)  这种格式将一张二值图像显示在屏幕上,允许用户使用鼠标在图像上点几个点,这几个点围成的区域即要填充的区域。要以这种交互方式操作,BW必须是一个二维的图像。用户可以通过按Backspace键或者Delete键来取消之前选择的区域;通过shift+鼠标左键

    2025年11月6日
    3
  • 安装SQL Server2008的示例数据库AdventureWorks 2008「建议收藏」

    安装SQL Server2008的示例数据库AdventureWorks 2008「建议收藏」在安装SQLServer2008时,默认是不安装示例数据库的,如果要用到的话,就得自行下载相应的数据库,然后安装,当然,安装也还是要有一定的方法的,不然装不上。1、检查安装环境,下载安装包首先,检查你电脑的环境,是否有安装SQLServer2008,并且打了SQL2008SP1补丁。然后去官网下载AdventureWorks2008示例数据库安装包。下载地址是:http://msft

    2025年9月7日
    5
  • html+css唯美登录页面,代码提供(效果展示)「建议收藏」

    html+css唯美登录页面,代码提供(效果展示)「建议收藏」效果图所有代码<!DOCTYPEhtml><htmllang=”en”><head><metacharset=”UTF-8″><metahttp-equiv=”X-UA-Compatible”content=”IE=edge”><metaname=”viewport”content=”width=device-width,initial-scale=1.0″><ti

    2022年5月23日
    41
  • java 异常分类和处理机制

    java 异常分类和处理机制一、背景介绍程序在运行过程中发生错误或异常情况是不可避免的,如果每一个运行时错误都由程序员手动控制和处理,其工作量是不可想象的。Java语言中的异常处理机制就解决的上述问题,把错误与异常的管理带到了面向对象的世界Java语言定义了很多异常类,将运行错误和异常的信息和处理方法封装在了异常类中,帮助程序员检查和控制异常。即J…

    2022年5月13日
    47
  • mysql配置参数详解[通俗易懂]

    mysql配置参数详解[通俗易懂]mysql配置参数详解

    2022年4月24日
    35
  • 基于人脸识别的考勤系统:Python3 + Qt5 + OpenCV3 + FaceNet + MySQL

    基于人脸识别的考勤系统:Python3 + Qt5 + OpenCV3 + FaceNet + MySQL本项目使用Python3.8编写,QtDesigner(QT5)设计主界面,PyQt5库编写控件的功能,使用开源FaceNet人脸识别算法进行人脸识别,使用眨眼检测来实现活体识别,使用OpenCV3实现实时人脸识别。同时,将班级学生信息,各班级学生人数、考勤信息录入到MySQL数据库中,方便集中统一化管理。因为本项目仅由我一个人开发,能力精力有限,实现了预期的绝大多数功能,但是活体检测功能还存在bug,如果小伙伴对本项目中有不懂的地方或者发现问题,欢迎提出。

    2022年5月13日
    44

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号