VIF检验相关性「建议收藏」

VIF检验相关性「建议收藏」VIF可以用来度量多重共线性问题,VIFj=11−Rj2\quad\mathrm{VIF}_{j}=\frac{1}{1-R_{j}^{2}}VIFj​=1−Rj2​1​式子中,Rj2R_{j}^{2}Rj2​是第jjj个变量在所有变量上回归时的确定系数。如果VIF过大(比如大于5或10),则意味着存在多重共线性问题。#数据df=pd.read_excel(io=’数据.xlsx’,sheet_name=0,usecols=range(1,5))#务必注意:一定要加上常数项,#如果没

大家好,又见面了,我是你们的朋友全栈君。

VIF可以用来度量多重共线性问题, V I F j = 1 1 − R j 2 \quad \mathrm{VIF}_{j}=\frac{1}{1-R_{j}^{2}} VIFj=1Rj21
式子中, R j 2 R_{j}^{2} Rj2是第 j j j个变量在所有变量上回归时的确定系数。
如果VIF过大(比如大于5或10),则意味着存在多重共线性问题。关于多重共线性更多内容可以参考往期文章https://blog.csdn.net/weixin_45288557/article/details/111769464

(由于没有VIF临界值表,我们只能使用经验法则:若VIF>5,则存在严重多重共线性。也有人建议用VIF>10作为存在严重多重共线性的标准,特别在解释变量多的情形应当如此。)

#数据
df = pd.read_excel(io='数据.xlsx', sheet_name=0, usecols=range(1,5))

# 务必注意:一定要加上常数项,#如果没有常数项列,计算结果天差地别,可能VIF等于好几千
df['Constant Value']=1 #添加常数项
df.head()

from statsmodels.stats.outliers_influence import variance_inflation_factor
# 这里可以选择想要判断的变量列
df_tezheng=df[["var1","var2","var3","var4","var5", 'Constant Value']]

# 进行vif检验
vif=[]
for i in range(df_tezheng.shape[1]-1):
    #计算第i+1个变量的(第i+1列)的方差膨胀因子
    vif.append(variance_inflation_factor(df_tezheng.values,i))
#result_out
yy=pd.DataFrame(df_tezheng.columns[:-1,])
yy.rename(columns={ 
   0:"var_name"},inplace=True) 
yy["vif"]=vif
print(yy)
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/130507.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 2022年想做后端开发学Java还是C++更有前景?

    2022年想做后端开发学Java还是C++更有前景?不知道大家在大学的时候有没有这样的疑惑,做后端开发学Java还是C++呢?可能大家和我一样,都有过这种二选一的疑惑,如果我毕业后想从事Java后端开发,那么应该按照怎么样的路线学习呢?网上关于这个话题的文章很多,但是大部分只是对知识点和模块的简单罗列,只是让大家知道有这么些东西要学,我从校招生的角度来谈一下这个话题,介绍一下我从学习C++转向学习Java的学习历程,主要讨论Java的学习路线和找工作相关的情况,谈谈我是如何在短时间内通过自学Java进入阿里和美团的。当初选择语言的纠结我大一大二的

    2022年7月17日
    47
  • TDD、FDD是什么意思?

    TDD、FDD是什么意思?TDD、FDD指第三代移动通信技术(3G)中的两种双工通信模式。TDD(Time-divisionDuplex)模式指时分双工模式,3G标准中的TD-SCDMA采用此双工模式;FDD(Frequency-divisionDuplex)模式指频分双工模式,3G标准中的WCDMA和CDMA2000采用此模式。一、工作原理TDD是一种通信系统的双工方式,在移动通信系统中用于分离接收…

    2022年4月27日
    48
  • IIS、nginx、apache只允许域名访问配置

    IIS、nginx、apache只允许域名访问配置

    2021年10月8日
    35
  • 漯河恢复常态化疫情防控工作_你尝试使用的应用程序

    漯河恢复常态化疫情防控工作_你尝试使用的应用程序问题:windows平台怎么运行.netcore控制台解决一:.netcore跨平台,控制台在生成后并不会生成exe文件直接在生成目录启用cmd,或者直接cd到相应目录startdotnet你的控制台名字.dll 问题:强制生成exe文件在控制台项目管理文件 xxx.csproj 添加下面一行<PropertyGroup>  <Outp…

    2025年5月28日
    3
  • 中文人物关系图谱构建与应用项目(人物关系抽取,关系抽取评测)

    中文人物关系图谱构建与应用项目(人物关系抽取,关系抽取评测)ChinesePersonRelationGraphChinesePersonRelationGraph,personrelationshipextractionbasedonnlpmethods.中文人物关系知识图谱项目,内容包括中文人物关系图谱构建,基于知识库的数据回标,基于远程监督与bootstrapping方法的人物关系抽取,基于知识图谱的知识问答等应用.项目地址:htt…

    2022年6月26日
    52
  • 活动图学习笔记

    活动图学习笔记活动图学习笔记活动图基本概念事件流除了用文本形式来表示外,还经常用活动图来表示。为什么有了文本形式以后还要开发这种框图形式呢?这是因为利用文本形式虽然很有用,但是如果事件流逻辑复杂,则文本形式比较难阅读和理解,利用框图将比文本形式来得更加有效。活动图显示与文本事件流相同的信息。我们在业务模型中用活动框图描述业务过程的工作流。活动图的组成要素活动图的组成要素主要有:起始点和终止点、活动、迁移、决策框、

    2022年5月3日
    45

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号