最小二乘法详细推导过程

最小二乘法详细推导过程转载自:http://blog.csdn.net/marsjohn/article/details/54911788在数据的统计分析中,数据之间即变量x与Y之间的相关性研究非常重要,通过在直角坐标系中做散点图的方式我们会发现很多统计数据近似一条直线,它们之间或者正相关或者负相关。虽然这些数据是离散的,不是连续的,我们无法得到一个确定的描述这种相关性的函数方程,但既然在直角坐标系中数据分布接近一…

大家好,又见面了,我是你们的朋友全栈君。

转载自:http://blog.csdn.net/marsjohn/article/details/54911788

在数据的统计分析中,数据之间即变量x与Y之间的相关性研究非常重要,通过在直角坐标系中做散点图的方式我们会发现很多统计数据近似一条直线,它们之间或者正相关或者负相关。虽然这些数据是离散的,不是连续的,我们无法得到一个确定的描述这种相关性的函数方程,但既然在直角坐标系中数据分布接近一条直线,那么我们就可以通过画直线的方式得到一个近似的描述这种关系的直线方程。当然,从前面的描述中不难看出,所有数据都分布在一条直线附近,因此这样的直线可以画出很多条,而我们希望找出其中的一条,能够最好地反映变量之间的关系。换言之,我们要找出一条直线,使这条直线“最贴近”已知的数据点,设此直线方程为:
最小二乘法详细推导过程

这里的最小二乘法详细推导过程是为了区分Y的实际值y(这里的实际值就是统计数据的真实值,我们称之为观察值),当x取值最小二乘法详细推导过程(i=1,2,3……n)时,Y的观察值为最小二乘法详细推导过程,近似值为最小二乘法详细推导过程(或者说对应最小二乘法详细推导过程的纵坐标是最小二乘法详细推导过程)。

其中最小二乘法详细推导过程式叫做Y对x的回归直线方程,b叫做回归系数。要想确定回归直线方程最小二乘法详细推导过程,我们只需确定a与回归系数b即可。

 设x,Y的一组观察值为:
最小二乘法详细推导过程   i = 1,2,3……n

其回归直线方程为:
最小二乘法详细推导过程

当x取值最小二乘法详细推导过程(i=1,2,3……n)时,Y的观察值为最小二乘法详细推导过程,差最小二乘法详细推导过程刻画了实际观察值最小二乘法详细推导过程与回归直线上相应点纵坐标之间的偏离程度,见下图:
最小二乘法详细推导过程

 实际上我们希望这n个离差构成的总离差越小越好,只有如此才能使直线最贴近已知点。换句话说,我们求回归直线方程的过程其实就是求离差最小值的过程。

一个很自然的想法是把各个离差加起来作为总离差。可是,由于离差有正有负,直接相加会互相抵消,如此就无法反映这些数据的贴近程度,即这个总离差不能用n个离差之和来表示,见下图:
最小二乘法详细推导过程
 
一般做法是我们用离差的平方和,即:
最小二乘法详细推导过程

作为总离差 ,并使之达到最小。这样回归直线就是所有直线中Q取最小值的那一条。由于平方又叫二乘方,所以这种使“离差平方和为最小”的方法,叫做最小二乘法
用最小二乘法求回归直线方程中的a、b的公式如下:
最小二乘法详细推导过程

其中,最小二乘法详细推导过程最小二乘法详细推导过程最小二乘法详细推导过程最小二乘法详细推导过程的均值,a、b的上方加“︿”表示是由观察值按最小二乘法求得的估计值,a、b求出后,回归直线方程也就建立起来了。

当然,我们肯定不能满足于直接得到公式,我们只有理解这个公式怎么来的才能记住它,用好它,因此给出上面两个公式的推导过程更加重要。在给出上述公式的推导过程之前,我们先给出推导过程中用到的两个关键变形公式的推导过程。首先是第一个公式:
 最小二乘法详细推导过程
 

接着是第二个公式:
最小二乘法详细推导过程
 
 基本变形公式准备完毕,我们可以开始最小二乘法求回归直线方程公式的推导了:
最小二乘法详细推导过程
最小二乘法详细推导过程
 
 至此,公式变形部分结束,从最终式子我们可以看到后两项
最小二乘法详细推导过程

与a、b无关,属于常数项,我们只需
最小二乘法详细推导过程

即可得到最小的Q值,因此:
最小二乘法详细推导过程

至此,公式推导完毕。
 

最小二乘法求回归直线方程可用于所有数据分布近似直线的数据统计、分析问题,其用程序实现非常简便,属于基础统计分析算法,必须能够熟练掌握应用。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/145253.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月13日 上午6:40
下一篇 2022年5月13日 上午6:40


相关推荐

  • Linux-配置网络的四种方法

    Linux-配置网络的四种方法设定网络的几种方法 一 ifconfig 命令用法 nbsp nbsp nbsp nbsp ifconfig DEVICE nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp 查看网络信息 nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp ifconfigDEVI nbsp nbsp nbsp nbsp nbsp nbsp nbsp 设置 ip 地址临时生效 重启服务后失效 2 nm connection editor 图形界面网

    2026年3月18日
    2
  • 使用ROW_NUMBER()查询:列名 ‘RowNumber’ 无效。(转载)

    使用ROW_NUMBER()查询:列名 ‘RowNumber’ 无效。(转载)原文地址:https://my.oschina.net/wangzan/blog/202456使用ROW_NUMBER()方法查询结果集;语句如下: selectROW_NUMBER()OVER(ORDERBYdbo.OrderOutProduct.ID)ASRowNumber,dbo.Order.ID,Telephone,AddressCity,Province,fromdbo…

    2022年6月7日
    62
  • 10. solt 插槽

    10. solt 插槽solt 定义 slot 目的 有配置 没配置走默认 引入子组件 如果不定义某个默认的结构或者样式 那么直接写子组件的名称即可 如果要自定义 1 子组件必须为双标签 2 子组件内写上自定义的结构或者样式并且加上 slot 的属性 而这个属性名要对应默

    2026年3月17日
    2
  • Oracle11g安装教程

    Oracle11g安装教程在oracle11g的几个版本中,企业版安装的选项比较全面,所以我们选择企业版安装一、官方的下载地址:https://www.oracle.com/technetwork/database/enterprise-edition/downloads/index.html勾选AcceptLicenseAgreement选择适合自己电脑版本的oracle安装包,然后下载。二、具体…

    2022年5月30日
    48
  • instanceof 和 isInstance 区别

    instanceof 和 isInstance 区别其实二者的功能是一致的 isInstance 源码中有说明 Thismethodis codeinstance operator 对应的翻译 这个方法是 Java 语言 instanceof 操作符的动态等价物 下面具体介绍一下二者 1 instanceofin

    2026年3月17日
    2
  • 【数学基础】矩阵的特征向量、特征值及其含义

    【数学基础】矩阵的特征向量、特征值及其含义在线代课上 老师会教我们怎么求矩阵的特征值与特征向量 但是并不会讲特征值与特征向量到底有着什么样的几何意义或者物理意义 或许讲了但也比较模糊 矩阵的特征值与特征向量在各种机器学习算法与应用场景中都有出现 每次出现都有着其独特的意义 在这里也只是简述一二 一 方阵的特征值与特征向量 1 特征值与特征向量的定义 定义 1 设是阶方阵 若数和维非零列向量 使得成立 则称是方阵的一个特征值 为方阵

    2026年3月18日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号