最小二乘法求回归直线方程的推导过程

最小二乘法求回归直线方程的推导过程在数据的统计分析中,数据之间即变量x与Y之间的相关性研究非常重要,通过在直角坐标系中做散点图的方式我们会发现很多统计数据近似一条直线,它们之间或者正相关或者负相关。虽然这些数据是离散的,不是连续的,我们无法得到一个确定的描述这种相关性的函数方程,但既然在直角坐标系中数据分布接近一条直线,那么我们就可以通过画直线的方式得到一个近似的描述这种关系的直线方程。当然,从前面的描述中不难看出,所有数据都分布

大家好,又见面了,我是你们的朋友全栈君。

 在数据的统计分析中,数据之间即变量x与Y之间的相关性研究非常重要,通过在直角坐标系中做散点图的方式我们会发现很多统计数据近似一条直线,它们之间或者
正相关或者
负相关。虽然这些数据是离散的,不是连续的,我们无法得到一个确定的描述这种相关性的函数方程,但既然在直角坐标系中数据分布接近一条直线,那么我们就可以通过画直线的方式得到一个近似的描述这种关系的直线方程。当然,从前面的描述中不难看出,所有数据都分布在一条直线附近,因此这样的直线可以画出很多条,而我们希望找出其中的一条,能够最好地反映变量之间的关系。换言之,我们要找出一条直线,使这条直线“最贴近”已知的数据点,设此直线方程为:


最小二乘法求回归直线方程的推导过程

这里的
最小二乘法求回归直线方程的推导过程是为了区分Y的实际值y(这里的实际值就是统计数据的真实值,我们称之为
观察值),当x取值
最小二乘法求回归直线方程的推导过程(i=1,2,3……n)时,Y的观察值为
最小二乘法求回归直线方程的推导过程,近似值为
最小二乘法求回归直线方程的推导过程(或者说对应
最小二乘法求回归直线方程的推导过程的纵坐标是
最小二乘法求回归直线方程的推导过程)。

其中
最小二乘法求回归直线方程的推导过程式叫做Y对x的回归直线方程,b叫做回归系数。要想确定回归直线方程
最小二乘法求回归直线方程的推导过程,我们只需确定a与回归系数b即可。

 设x,Y的一组观察值为:


最小二乘法求回归直线方程的推导过程   i = 1,2,3……n

其回归直线方程为:


最小二乘法求回归直线方程的推导过程

当x取值
最小二乘法求回归直线方程的推导过程(i=1,2,3……n)时,Y的观察值为
最小二乘法求回归直线方程的推导过程,差
最小二乘法求回归直线方程的推导过程刻画了实际观察值
最小二乘法求回归直线方程的推导过程与回归直线上相应点纵坐标之间的偏离程度,见下图:


最小二乘法求回归直线方程的推导过程

 实际上我们希望这n个离差构成的总离差越小越好,只有如此才能使直线最贴近已知点。换句话说,我们求回归直线方程的过程其实就是求离差最小值的过程。

一个很自然的想法是把各个离差加起来作为总离差。可是,由于离差有正有负,直接相加会互相抵消,如此就无法反映这些数据的贴近程度,即这个总离差不能用n个离差之和来表示,见下图:


最小二乘法求回归直线方程的推导过程

 

一般做法是我们用离差的平方和,即:


最小二乘法求回归直线方程的推导过程

作为总离差 ,并使之达到最小。这样回归直线就是所有直线中Q取最小值的那一条。由于平方又叫二乘方,所以这种使“离差平方和为最小”的方法,叫做
最小二乘法

用最小二乘法求回归直线方程中的a、b的公式如下:


最小二乘法求回归直线方程的推导过程

其中,
最小二乘法求回归直线方程的推导过程
最小二乘法求回归直线方程的推导过程
最小二乘法求回归直线方程的推导过程
最小二乘法求回归直线方程的推导过程的均值,a、b的上方加“
︿”表示是由观察值按最小二乘法求得的估计值,a、b求出后,回归直线方程也就建立起来了。

当然,我们肯定不能满足于直接得到公式,我们只有理解这个公式怎么来的才能记住它,用好它,因此给出上面两个公式的推导过程更加重要。在给出上述公式的推导过程之前,我们先给出推导过程中用到的两个关键变形公式的推导过程。首先是第一个公式:

 
最小二乘法求回归直线方程的推导过程

 

接着是第二个公式:


最小二乘法求回归直线方程的推导过程

 

 基本变形公式准备完毕,我们可以开始最小二乘法求回归直线方程公式的推导了:


最小二乘法求回归直线方程的推导过程


最小二乘法求回归直线方程的推导过程

 

 至此,公式变形部分结束,从最终式子我们可以看到后两项


最小二乘法求回归直线方程的推导过程

与a、b无关,属于常数项,我们只需


最小二乘法求回归直线方程的推导过程

即可得到最小的Q值,因此:


最小二乘法求回归直线方程的推导过程

至此,公式推导完毕。

 

最小二乘法求回归直线方程可用于所有数据分布近似直线的数据统计、分析问题,其用程序实现非常简便,属于基础统计分析算法,必须能够熟练掌握应用。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/145610.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • pcanywhere设置主控端_redis修改端口

    pcanywhere设置主控端_redis修改端口  有些防火墙只允许一个pcAnywhere被控端使用一个IP端口。而防火墙后面的其它pcAnywhere被控端必须使用另外的端口。希望知道如何更改这些端口。   更改pcAnywhereIP端口需要编辑Windows注册表。如果需要频繁的执行此操作,创建.reg文件是最安全也是最方便的更改方法。尤其对于那些可能需要连接_blank”>防火墙后多个被控端的主控端而

    2025年11月4日
    2
  • 关于docker中执行docker命令的实践

    关于docker中执行docker命令的实践最近在制作给kubernetesjenkinsplugin调用的jenkinsslave(默认情况下,kubernetesjenkins插件使用的是jenkinsci/jnlp-slave)容器镜像,以供自动创建的pod使用。对这个镜像的需求是:希望在pod运行的容器内,执行docker命令,完成dockerbuild,push等一些操作,即dockerindocker。首先,需要在

    2022年5月13日
    43
  • transparentblt[通俗易懂]

    transparentblt[通俗易懂]透明位图的显示作者:王骏下载本文示例代码包含透明色的位图的绘制方法有多种,最简单的方法是调用现成的函数:TransparentBlt,也可以通过自己的代码实现类似TransparentBlt的功能,实现过程也有两种形式,一种是事先做一张掩码位图,另一种是动态生成掩码位图。本文将介绍动态生成掩码位图绘制具有透明区域位图的方法。一、TransparentBlt函数的使用TransparentBlt

    2025年8月25日
    2
  • 很震撼的HTML5视频播放器,电影院的感觉建议收藏

    效果很震撼!有电影院的感觉了。呵呵。看了下代码,依然是在一个canvas里嵌入然后getImageData点击这里查看效果代码:varcanvas=document.createElement

    2021年12月20日
    46
  • 计算机网络基础谢希仁第七版答案(计算机网络第七版答案pdf)

    写在前面这篇博客是当时在大二的时候为了学习计网总结的一篇学习笔记,其实当时的做法和抄书差不多,但是时隔两年的时间没想到有这么多的同学会来关注学习,实在受宠若惊;现在我已经大四,而且刚刚经历过秋招(2019/12),并且签约了一家薪资待遇不错的Java开发岗,所以在闲下来的时候准备将这篇博客重新整理一下,主要为了几方面:一·将之前没有整理到的内容补充详细;二·为重难点的部分加上详…

    2022年4月18日
    55
  • Matlab画图线型、符号及颜色汇总[通俗易懂]

    Matlab画图线型、符号及颜色汇总[通俗易懂]【1】线型、标记符、颜色的说明【2】对于坐标轴的注释内容xlabel,ylabel的属性说明figure,plot(Seg1,SS1_QJ1,’k’);holdonplot(Seg1,SS1_QJ1,’ks’)plot(Seg1,Q1*ones(length(Seg1)),’r’)xlabel(‘\bf{安装角}(°)’,’FontS…

    2022年5月31日
    70

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号