线性回归 均方误差_线性回归模型中随机误差项的意义

线性回归 均方误差_线性回归模型中随机误差项的意义刚开始学习机器学习的时候就接触了均方误差(MSE,MeanSquaredError),当时就有疑惑,这个式子是怎么推导的,但是因为懒没有深究。今天看到了唐宇迪老师的机器学习课程,终于理解他是怎么推导的了。问题描述我们有工资和年龄两个特征,要预测银行会带宽给我们多少钱。1.拟合函数假设:年龄:x1x_1x1​工资:x2x_2x2​年龄的参数:θ1θ_1θ1​工资的参数:θ2θ_2θ2​那么有拟合函数:(1)将它转化为矩阵表达形式为:(2)其中x0全为1。2.误差真实值和预

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

刚开始学习机器学习的时候就接触了均方误差(MSE,Mean Squared Error),当时就有疑惑,这个式子是怎么推导的,但是因为懒没有深究。今天看到了唐宇迪老师的机器学习课程,终于理解他是怎么推导的了。一定要一步一步看下去,别看他公式这么多,随便认真看一下就能理解的!

问题描述

我们有工资和年龄两个特征,要预测银行会贷款给我们多少钱?

1. 拟合函数

假设:
年龄: x 1 x_1 x1
工资: x 2 x_2 x2
年龄的参数: θ 1 θ_1 θ1
工资的参数: θ 2 θ_2 θ2
那么有拟合函数:
在这里插入图片描述(1)

将它转化为矩阵表达形式为:
在这里插入图片描述(2)
其中x0全为1。

2. 误差

真实值和预测值之间通常情况下是会存在误差的,我们用ε来表示误差,对于每个样本都有:
在这里插入图片描述(3)
上标i表示第i个样本。
误差ε是独立并且具有相同的分布,并且服从均值为0,方差为 θ 2 θ^2 θ2的正态分布。
由于误差服从正态分布,那么有:
在这里插入图片描述(4)
将(3)带入(4)中有:
在这里插入图片描述(5)

3. 似然函数

似然函数用于参数估计,即求出什么样的参数跟我们给出的数据组合后能更好的预测真实值,有:
在这里插入图片描述(6)
取(6)式对数,将连乘转化为加法,这也是一般似然函数的求解方法:
在这里插入图片描述(7)
将(7)式展开并化简有:
在这里插入图片描述(8)
(8)式等式右侧的第一项为一个常量,似然函数要取最大值,因而第二项越小越好,有:
在这里插入图片描述(9)
(9)式相当于最小二乘法的式子,即是均方误差的表达式。下一步我们要解出 θ θ θ的表达式

4. 求导

我们将(9)时表示为矩阵的形式,有:
在这里插入图片描述(10)
接下来需要对矩阵求偏导,矩阵求偏导方法移至矩阵求偏导,过程如下:
在这里插入图片描述(11)
最后解出:
在这里插入图片描述(12)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/187664.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Error: Program type already present: android.support.design.widget.CoordinatorLayout$1

    Error: Program type already present: android.support.design.widget.CoordinatorLayout$1

    2021年10月1日
    42
  • 机房搬迁是什么意思_计算机机房管理规定

    机房搬迁是什么意思_计算机机房管理规定原标题:盘点机房搬迁中最容易出现的五个问题企业要更换办公地址的时候,最头疼的问题就是搬迁机房,机房的搬迁可不是搬家那么简单,是否能顺利搬迁,将成为保障企业业务连续性的关键要素。在企业机房的搬迁中,最容易出现哪些问题?盘点机房搬迁中最容易出现的五个问题(1)领导不明确在规划阶段最常见的错误是未能建立明确的领导。这意味着在迁移过程中的各个阶段中要确定谁负责明确的沟通,带领团队。在一个单一的部门,默认…

    2025年6月26日
    1
  • 如何用burpsuite抓包[通俗易懂]

    如何用burpsuite抓包[通俗易懂]首先:使用火狐浏览器,并下载插件proxy点击上图右边的按钮并选择附加组件查询并下载插件配置代理点击options,然后add需要抓包时点击绿色的就行了burpsuite首先我们来到proxy界面在开启插件代理和interceptison的情况下点击某个链接即可抓取数据包需要改包发包的话可以直接在这里修改后直接forward或者同时按ctrl和r在下图…

    2022年5月20日
    64
  • websocket token认证(https 不验证证书)

    直接上代码publicstaticStringtest(Stringurl,Stringhead,Stringbody)throwsException{//创建okHttpClient实例,忽略https证书验证OkHttpClientclient=newOkHttpClient().newBuilder().sslSocketFactory(getSSLSocketFactory())

    2022年4月18日
    214
  • fpga以太网通信例程_verilog参数传递

    fpga以太网通信例程_verilog参数传递1本实验将实现FPGA芯片和PC之间进行千兆以太网数据通信,通信协议采用Ethernet UDP通信协议。FPGA通过GMII总线和开发板上的GigabitPHY芯片通信,GigabitPHY芯片把数据通过网线发给PC。在上次的实验中,我们详细讲解了网络传输的过程中如何对数据进行传输,以及数据传输的格式,这次实验中,我们详细讲解如何使用Verilog语言

    2022年10月24日
    0
  • 线程池介绍及创建线程池的4种方式是什么_程序可以创建几个线程池

    线程池介绍及创建线程池的4种方式是什么_程序可以创建几个线程池1.什么是线程池Java中的线程池是运用场景最多的并发框架,几乎所有需要异步或并发执行任务的程序都可以使用线程池。在开发过程中,合理地使用线程池能够带来3个好处。第一:降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二:提高响应速度。当任务到达时,任务可以不需要等到线程创建就能立即执行。第三:提高线程的可管理性。线程是稀缺资源,如果无限制地创建,不仅会消耗系统资源…

    2022年10月1日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号