数据分析——多重共线性检验

数据分析——多重共线性检验在做线性回归的时候,一般分为以下几个步骤:1、画散点图,简单的查看是否存在线性关系(3D以下)2、线性模型跑一遍试试效果3、其中需要查看以下几个指标:3.1正太分布检验3.1多重共线性3.2变量显著性3.4拟合效果4、解释变量上面一篇文章了解了如何利用t检验进行变量的显著性检验,下面着重学习如何进行多重共线性的检验一、辅助…

大家好,又见面了,我是你们的朋友全栈君。

在做线性回归的时候,一般分为以下几个步骤:
1、画散点图,简单的查看是否存在线性关系(3D以下)
2、线性模型跑一遍试试效果
3、其中需要查看以下几个指标:
    3.1 正太分布检验
    3.1 多重共线性、异方差性、自相关性
    3.2 变量显著性  
    3.4 拟合效果
 4、解释变量

 上面一篇文章了解了如何利用t检验进行变量的显著性检验,下面着重学习如何进行多重共线性的检验

零、可决系数R方

数据分析——多重共线性检验

一、辅助回归模型检验

数据分析——多重共线性检验

二、方差膨胀系数(VIF)

VIF的取值大于1,VIF值越接近于1,多重共线性越轻,反之越重。通常以10作为判断边界。当VIF<10,不存在多重共线性;当10<=VIF<100,存在较强的多重共线性;当VIF>=100, 存在严重多重共线性。

容忍度的值界于0至1之间,当容忍度值较小时,表示此自变量与其他自变量之间存在共线性。

容忍度~VIF的倒数

数据分析——多重共线性检验

数据分析——多重共线性检验

数据分析——多重共线性检验

三、皮尔逊相关系数 判断多重共线性

皮尔逊相关系数是余弦相似度在维度值缺失情况下的一种改进;
要理解Pearson相关系数,首先要理解协方差(Covariance),协方差是一个反映两个随机变量相关程度的指标,如果一个变量跟随着另一个变量同时变大或者变小,那么这两个变量的协方差就是正值,反之相反,公式如下:

数据分析——多重共线性检验

Pearson相关系数公式如下:

数据分析——多重共线性检验

由公式可知,Pearson相关系数是用协方差除以两个变量的标准差得到的,虽然协方差能反映两个随机变量的相关程度(协方差大于0的时候表示两者正相关,小于0的时候表示两者负相关),但是协方差值的大小并不能很好地度量两个随机变量的关联程度,为了更好的度量两个随机变量的相关程度,引入了Pearson相关系数,其在协方差的基础上除以了两个随机变量的标准差,容易得出,pearson是一个介于-1和1之间的值,当两个变量的线性关系增强时,相关系数趋于1或-1;当一个变量增大,另一个变量也增大时,表明它们之间是正相关的,相关系数大于0;如果一个变量增大,另一个变量却减小,表明它们之间是负相关的,相关系数小于0;如果相关系数等于0,表明它们之间不存在线性相关关系。

四、解决办法

1. 手动移除出共线性的自变量

2. 逐步回归法

3. 增加样本容量

4. 岭回归

5. 利用因子分析合并变量

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/144771.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • LoopBox 用于包装循环的盒子

    LoopBox 用于包装循环的盒子LoopBox 用于包装循环的盒子

    2022年4月22日
    54
  • java 代码中sql模糊查询Like拼接

    java 代码中sql模糊查询Like拼接Like模糊查询拼接:StringBuilderstringBuilder=newStringBuilder();stringBuilder.append(“selectu.*fromepai_sys_useru”);//写?是可以的是没问题的stringBuilder.append(“whereu.display_nameLikeconcat(‘%’,…

    2022年6月1日
    134
  • smtp搭建_smtp服务器指的是什么服务器

    smtp搭建_smtp服务器指的是什么服务器应用目标:更稳定地发送邮件实现难度:★★☆☆☆我们在发送电子邮件的时候,这封E-mail首先来到ISP提供的邮件服务器,再通过它发送出去。但如果ISP因为网络出现一些问题,则可能会耽搁邮件的发送,甚至可能会造成邮件丢失。如果用自己的机器做SMTP服务器来发邮件,那肯定不会出现上述情况啦!怎么样,心动了吧?下面咱们就一起来架设一个属于自己的SMTP服务器,让你的E-mail发送更安全。一、SMTP服…

    2022年10月3日
    7
  • sql 修改语句「建议收藏」

    sql 修改语句「建议收藏」update(修改)select*fromTablenamewherefield1=‘*****’(确定修改的数据)begintran–rollback(开启一个事务,以便失误后回滚)updateTablenamesetfield2=‘*****’wherefiled1=’*****’commit(提交)…

    2022年6月29日
    41
  • compound extreme_particular conditions

    compound extreme_particular conditions在看SpringSide代码过程中,发现SS使用了extremecomponents于是,今天看了看extremecomponents的使用,发觉extremecomponents真是个好用西。可以直接接受response的数据。按照test例子自己做的:效果不错哟eXtremeTable是一个可扩展的用于以表格的形式来显示数据的一组JSP标签库.网站:http://www.extreme…

    2022年8月20日
    7
  • PyCharm激活码永久有效PyCharm2018.3.7激活码教程-持续更新,一步到位[通俗易懂]

    PyCharm激活码永久有效PyCharm2018.3.7激活码教程-持续更新,一步到位[通俗易懂]PyCharm激活码永久有效2018.3.7激活码教程-Windows版永久激活-持续更新,Idea激活码2018.3.7成功激活

    2022年6月19日
    35

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号