最小二乘法详细推导过程

最小二乘法详细推导过程转载自:http://blog.csdn.net/marsjohn/article/details/54911788在数据的统计分析中,数据之间即变量x与Y之间的相关性研究非常重要,通过在直角坐标系中做散点图的方式我们会发现很多统计数据近似一条直线,它们之间或者正相关或者负相关。虽然这些数据是离散的,不是连续的,我们无法得到一个确定的描述这种相关性的函数方程,但既然在直角坐标系中数据分布接近一…

大家好,又见面了,我是你们的朋友全栈君。

转载自:http://blog.csdn.net/marsjohn/article/details/54911788

在数据的统计分析中,数据之间即变量x与Y之间的相关性研究非常重要,通过在直角坐标系中做散点图的方式我们会发现很多统计数据近似一条直线,它们之间或者正相关或者负相关。虽然这些数据是离散的,不是连续的,我们无法得到一个确定的描述这种相关性的函数方程,但既然在直角坐标系中数据分布接近一条直线,那么我们就可以通过画直线的方式得到一个近似的描述这种关系的直线方程。当然,从前面的描述中不难看出,所有数据都分布在一条直线附近,因此这样的直线可以画出很多条,而我们希望找出其中的一条,能够最好地反映变量之间的关系。换言之,我们要找出一条直线,使这条直线“最贴近”已知的数据点,设此直线方程为:
最小二乘法详细推导过程

这里的最小二乘法详细推导过程是为了区分Y的实际值y(这里的实际值就是统计数据的真实值,我们称之为观察值),当x取值最小二乘法详细推导过程(i=1,2,3……n)时,Y的观察值为最小二乘法详细推导过程,近似值为最小二乘法详细推导过程(或者说对应最小二乘法详细推导过程的纵坐标是最小二乘法详细推导过程)。

其中最小二乘法详细推导过程式叫做Y对x的回归直线方程,b叫做回归系数。要想确定回归直线方程最小二乘法详细推导过程,我们只需确定a与回归系数b即可。

 设x,Y的一组观察值为:
最小二乘法详细推导过程   i = 1,2,3……n

其回归直线方程为:
最小二乘法详细推导过程

当x取值最小二乘法详细推导过程(i=1,2,3……n)时,Y的观察值为最小二乘法详细推导过程,差最小二乘法详细推导过程刻画了实际观察值最小二乘法详细推导过程与回归直线上相应点纵坐标之间的偏离程度,见下图:
最小二乘法详细推导过程

 实际上我们希望这n个离差构成的总离差越小越好,只有如此才能使直线最贴近已知点。换句话说,我们求回归直线方程的过程其实就是求离差最小值的过程。

一个很自然的想法是把各个离差加起来作为总离差。可是,由于离差有正有负,直接相加会互相抵消,如此就无法反映这些数据的贴近程度,即这个总离差不能用n个离差之和来表示,见下图:
最小二乘法详细推导过程
 
一般做法是我们用离差的平方和,即:
最小二乘法详细推导过程

作为总离差 ,并使之达到最小。这样回归直线就是所有直线中Q取最小值的那一条。由于平方又叫二乘方,所以这种使“离差平方和为最小”的方法,叫做最小二乘法
用最小二乘法求回归直线方程中的a、b的公式如下:
最小二乘法详细推导过程

其中,最小二乘法详细推导过程最小二乘法详细推导过程最小二乘法详细推导过程最小二乘法详细推导过程的均值,a、b的上方加“︿”表示是由观察值按最小二乘法求得的估计值,a、b求出后,回归直线方程也就建立起来了。

当然,我们肯定不能满足于直接得到公式,我们只有理解这个公式怎么来的才能记住它,用好它,因此给出上面两个公式的推导过程更加重要。在给出上述公式的推导过程之前,我们先给出推导过程中用到的两个关键变形公式的推导过程。首先是第一个公式:
 最小二乘法详细推导过程
 

接着是第二个公式:
最小二乘法详细推导过程
 
 基本变形公式准备完毕,我们可以开始最小二乘法求回归直线方程公式的推导了:
最小二乘法详细推导过程
最小二乘法详细推导过程
 
 至此,公式变形部分结束,从最终式子我们可以看到后两项
最小二乘法详细推导过程

与a、b无关,属于常数项,我们只需
最小二乘法详细推导过程

即可得到最小的Q值,因此:
最小二乘法详细推导过程

至此,公式推导完毕。
 

最小二乘法求回归直线方程可用于所有数据分布近似直线的数据统计、分析问题,其用程序实现非常简便,属于基础统计分析算法,必须能够熟练掌握应用。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/145253.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • mac系统下mysql开机启动总是3307

    mac系统下mysql开机启动总是3307

    2021年9月9日
    52
  • java字符串转换为json对象6_Json对象与Json字符串的转化、JSON字符串与Java对象的转换…

    java字符串转换为json对象6_Json对象与Json字符串的转化、JSON字符串与Java对象的转换…一.Json对象与Json字符串的转化1.jQuery插件支持的转换方式:$.parseJSON(jsonstr);//jQuery.parseJSON(jsonstr),可以将json字符串转换成json对象2.浏览器支持的转换方式(Firefox,chrome,opera,safari,ie9,ie8)等浏览器:JSON.stringify(obj)将JSON转为字符串。JSON.par…

    2022年10月6日
    0
  • 微信公众平台开发教程Java版(二) 接口配置

    微信公众平台开发教程Java版(二) 接口配置微信公众账号申请完成后,默认开启的是编辑模式。我们需要修改为开发模式。登陆微信公众平台》功能》高级功能先关闭编辑模式,再开启开发模式。申请成为开发者,如果是服务号,需要则会有开发者凭证信息如图如果是订阅号,则只显示服务器配置。下一步就是配置接口服务器了。在公众平台网站的高级功能–开发模式页,点击“成为开发者”按钮,填写U…

    2022年6月29日
    22
  • coturn 搭建 stun turn 服务器

    coturn 搭建 stun turn 服务器coturn搭建stun/trun服务器分享经验总结,欢迎加入简介STUN,首先在RFC3489中定义,作为一个完整的NAT穿透解决方案,英文全称是SimpleTraversalofUDPThroughNATs,即简单的用UDP穿透NAT。STUN(SimpleTraversalofUserDatagramProtocolThroughNetworkAddressTranslators),即简单的用UDP穿透NAT,是个轻量级的协议,是基于UDP的完整的穿

    2022年7月16日
    38
  • 手机游戏开发综述[通俗易懂]

    手机游戏开发综述[通俗易懂]一、背景介绍  现在的移动电话是小型的计算机,它的处理能力与台式机的标准处理能力相比很有限,但是足够运行一个小型的游戏。  现在的手机的一个特性就是它们还是网络计算机,能够高速发送和接收数字数据。除了语音数据以外,它们还可以发送和接收其它类型的数据。所以类似《传奇》、《千年》这样的网络游戏也可以在手机上实现。当然就处理能力和性能而言,当前阶段的支持Java的手机很接近第二代控制台游戏机、80年

    2022年6月7日
    36
  • linux中getchar函数用法,linux getchar函数使用

    linux中getchar函数用法,linux getchar函数使用1函数介绍1)函数原型intgetchar(void);2)函数功能从stdin中读取一个字符。3)返回值返回读取字符的ASCII值或者EOF字符或者出错值。4)头文件#include2函数使用2.1getchar函数的特点Linux下编写的一个例子:#includeintmain(void){charch;intnum;num=0;printf…

    2022年10月18日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号