数据分析——多重共线性检验

数据分析——多重共线性检验在做线性回归的时候,一般分为以下几个步骤:1、画散点图,简单的查看是否存在线性关系(3D以下)2、线性模型跑一遍试试效果3、其中需要查看以下几个指标:3.1正太分布检验3.1多重共线性3.2变量显著性3.4拟合效果4、解释变量上面一篇文章了解了如何利用t检验进行变量的显著性检验,下面着重学习如何进行多重共线性的检验一、辅助…

大家好,又见面了,我是你们的朋友全栈君。

在做线性回归的时候,一般分为以下几个步骤:
1、画散点图,简单的查看是否存在线性关系(3D以下)
2、线性模型跑一遍试试效果
3、其中需要查看以下几个指标:
    3.1 正太分布检验
    3.1 多重共线性、异方差性、自相关性
    3.2 变量显著性  
    3.4 拟合效果
 4、解释变量

 上面一篇文章了解了如何利用t检验进行变量的显著性检验,下面着重学习如何进行多重共线性的检验

零、可决系数R方

数据分析——多重共线性检验

一、辅助回归模型检验

数据分析——多重共线性检验

二、方差膨胀系数(VIF)

VIF的取值大于1,VIF值越接近于1,多重共线性越轻,反之越重。通常以10作为判断边界。当VIF<10,不存在多重共线性;当10<=VIF<100,存在较强的多重共线性;当VIF>=100, 存在严重多重共线性。

容忍度的值界于0至1之间,当容忍度值较小时,表示此自变量与其他自变量之间存在共线性。

容忍度~VIF的倒数

数据分析——多重共线性检验

数据分析——多重共线性检验

数据分析——多重共线性检验

三、皮尔逊相关系数 判断多重共线性

皮尔逊相关系数是余弦相似度在维度值缺失情况下的一种改进;
要理解Pearson相关系数,首先要理解协方差(Covariance),协方差是一个反映两个随机变量相关程度的指标,如果一个变量跟随着另一个变量同时变大或者变小,那么这两个变量的协方差就是正值,反之相反,公式如下:

数据分析——多重共线性检验

Pearson相关系数公式如下:

数据分析——多重共线性检验

由公式可知,Pearson相关系数是用协方差除以两个变量的标准差得到的,虽然协方差能反映两个随机变量的相关程度(协方差大于0的时候表示两者正相关,小于0的时候表示两者负相关),但是协方差值的大小并不能很好地度量两个随机变量的关联程度,为了更好的度量两个随机变量的相关程度,引入了Pearson相关系数,其在协方差的基础上除以了两个随机变量的标准差,容易得出,pearson是一个介于-1和1之间的值,当两个变量的线性关系增强时,相关系数趋于1或-1;当一个变量增大,另一个变量也增大时,表明它们之间是正相关的,相关系数大于0;如果一个变量增大,另一个变量却减小,表明它们之间是负相关的,相关系数小于0;如果相关系数等于0,表明它们之间不存在线性相关关系。

四、解决办法

1. 手动移除出共线性的自变量

2. 逐步回归法

3. 增加样本容量

4. 岭回归

5. 利用因子分析合并变量

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/144771.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月18日 下午7:20
下一篇 2022年5月18日 下午7:20


相关推荐

  • orical数据库

    orical数据库truncate 和 delete table 表名 前面效率比后面高 而且前面执行后无法停止 前面会将 orical 查找数据时使用的节点删除 后面不会 select from 表名会消耗大量资源不建议使用了 creattable 表名 asselect from 表名 只产生数据 任何的索引 拘束 主键都没有 selectcolumn 表明 join 表名 on 条件 join 表明 on 条件 groupbycolum having

    2026年3月18日
    1
  • matlab灰度化处理函数_matlab中imfinfo的用法

    matlab灰度化处理函数_matlab中imfinfo的用法Matlabinfl()依次使用函数IM=imreconstruct(marker,mask)有关算法的详细信息,请参见Soille,P.,《形态图像分析:原理和应用》,SpringerVerlag,1999年,第208-209页。第6.3.7节“填充孔”部分importnumpyasnpfromskimage.morphologyimportreconstructionimpor…

    2025年11月10日
    8
  • 栈溢出

    栈溢出Author:Liedrahttps://www.cnblogs.com/LieDra/入门介绍学习自https://zhuanlan.zhihu.com/p/25816426对部分内容进行

    2022年7月4日
    28
  • db2top命令详解「建议收藏」

    db2top命令详解「建议收藏」目录1.db2top命令语法2.db2top运行模式2.1交互模式2.2批量模式3.db2top监控模式3.1数据库监控(d)3.2表空间监控(t)3.3动态SQL监控(D)3.4会话监控(l)3.5缓存池监控(b)3.6锁监控(U)3.7表监控(T)3.8瓶颈监控(B)4.其他1.db2top命令语法可使用命令行db2top–h查看,这里就不做赘述了。2.db2top运行模式db2t…

    2025年12月7日
    4
  • js弹出确认取消对话框_vs点击按钮弹出对话框

    js弹出确认取消对话框_vs点击按钮弹出对话框if(window.confirm(‘你确定要执行删除操作吗?’)){alert(“您点击了确定”);}else{alert(“您点击了取消”);returnfalse;}

    2025年7月27日
    5
  • 京东签到在哪儿_python爬虫教程

    京东签到在哪儿_python爬虫教程京东签到在哪里?有哪些步骤呢?最近很多朋友都在咨询小编京东签到在哪里,其实这个问题很简单,但是为了能够使更多的亲们了解京东签到在哪里,小编专门整理了这篇文章,希望阅读过后的亲们可以明确京东签到这个问题的答案。京东签到是为了给京东会员提供购物赠京豆、生日礼包、自营免运费、专享礼包等权益。提高京东商城会员之间的互动,增加用户粘性。一、京东签到在哪里,可以签到的入口1、京东金融APP打开后,右上角那个日…

    2026年1月15日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号