VIF检验相关性「建议收藏」

VIF检验相关性「建议收藏」VIF可以用来度量多重共线性问题,VIFj=11−Rj2\quad\mathrm{VIF}_{j}=\frac{1}{1-R_{j}^{2}}VIFj​=1−Rj2​1​式子中,Rj2R_{j}^{2}Rj2​是第jjj个变量在所有变量上回归时的确定系数。如果VIF过大(比如大于5或10),则意味着存在多重共线性问题。#数据df=pd.read_excel(io=’数据.xlsx’,sheet_name=0,usecols=range(1,5))#务必注意:一定要加上常数项,#如果没

大家好,又见面了,我是你们的朋友全栈君。

VIF可以用来度量多重共线性问题, V I F j = 1 1 − R j 2 \quad \mathrm{VIF}_{j}=\frac{1}{1-R_{j}^{2}} VIFj=1Rj21
式子中, R j 2 R_{j}^{2} Rj2是第 j j j个变量在所有变量上回归时的确定系数。
如果VIF过大(比如大于5或10),则意味着存在多重共线性问题。关于多重共线性更多内容可以参考往期文章https://blog.csdn.net/weixin_45288557/article/details/111769464

(由于没有VIF临界值表,我们只能使用经验法则:若VIF>5,则存在严重多重共线性。也有人建议用VIF>10作为存在严重多重共线性的标准,特别在解释变量多的情形应当如此。)

#数据
df = pd.read_excel(io='数据.xlsx', sheet_name=0, usecols=range(1,5))

# 务必注意:一定要加上常数项,#如果没有常数项列,计算结果天差地别,可能VIF等于好几千
df['Constant Value']=1 #添加常数项
df.head()

from statsmodels.stats.outliers_influence import variance_inflation_factor
# 这里可以选择想要判断的变量列
df_tezheng=df[["var1","var2","var3","var4","var5", 'Constant Value']]

# 进行vif检验
vif=[]
for i in range(df_tezheng.shape[1]-1):
    #计算第i+1个变量的(第i+1列)的方差膨胀因子
    vif.append(variance_inflation_factor(df_tezheng.values,i))
#result_out
yy=pd.DataFrame(df_tezheng.columns[:-1,])
yy.rename(columns={ 
   0:"var_name"},inplace=True) 
yy["vif"]=vif
print(yy)
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/130507.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • (转载)LaTeX实战经验:从零开始快速入门

    (转载)LaTeX实战经验:从零开始快速入门对于理工科的学生来说,尤其是从研究生阶段开始,LaTeX应该会是日常中必不可少的写作工具。毕竟要写什么公式的话,不用LaTeX实在是不知道要怎么办。况且要是投稍微专业一点的论文,LaTeX是必须的,没人会接收Word文件。此篇为写给一些想快速入门LaTeX的朋友,至于为什么要叫从零开始,因为我就是从零开始学会的LaTeX。如果你不是那么“聪慧”,LaTeX可能的学习曲线会显得比较曲折。但熟能生…

    2022年5月25日
    115
  • leetcode 792_单词编码

    leetcode 792_单词编码给定一个 m x n 二维字符网格 board 和一个字符串单词 word 。如果 word 存在于网格中,返回 true ;否则,返回 false 。单词必须按照字母顺序,通过相邻的单元格内的字母构成,其中“相邻”单元格是那些水平相邻或垂直相邻的单元格。同一个单元格内的字母不允许被重复使用。示例 1:输入:board = [[“A”,“B”,“C”,“E”],[“S”,“F”,“C”,“S”],[“A”,“D”,“E”,“E”]], word = “ABCCED”输出:true示例 2:输

    2022年8月8日
    9
  • 电子商务网站安全_跨境电商有哪些平台

    电子商务网站安全_跨境电商有哪些平台电商网站安全应对之道(电商网站安全的威胁类型:https://blog.csdn.net/qq_29039705/article/details/80486795)一、预防逻辑漏洞进行业务流程梳理接口会发加签名和超时机制避免通过前端进行验证和现在减少暴露给用户的参数增加共享数据互斥机制不要相信用户输入检查用户输入二、预防越权操作任何涉及用户权限的操作均匀会话关联参数的加密及模糊化严格验证程序逻辑顺…

    2022年10月1日
    3
  • linux环境变量的配置_centos环境变量配置文件

    linux环境变量的配置_centos环境变量配置文件前言在自定义安装软件的时候,经常需要配置环境变量,下面进行详细解析 环境变量配置文件|用户|配置文件||:|:||系统环境|/ect/profil

    2022年7月29日
    12
  • layer 弹出层传递参数

    layer 弹出层传递参数layer弹出层轻量好用,一直喜欢用,但是却没有弹出层传参的接口,迫于无奈只能Url地址传参,总所周知,这个可是限制大小的,百度一番,看看大神们怎么处理,结果就感觉所有回答都是Ctrl+C加Ctrl+V,全是地址栏传参,页面缓存、cookie、localstorage,本着不甘心的原则,就想为什么不能在open的时候把参数一起作为属性传递了,强行看了layer源码(扒光慢慢看),于是乎…

    2022年7月13日
    13
  • 一款漂亮的网址永久发布页源码

    一款漂亮的网址永久发布页源码介绍:好看导航页面可自动测域名延迟html页面,可以做个网址导航引导页面!网盘下载地址:http://www.zijiepan2.xyz/XR7VmgADZXm正文:公众号投票系统,暂不支持小程序注:只支持认证服务号和认证订阅号借权支付,非认证公众号无法使用礼物功能1,域名自动切换,随机域名,炮灰域名(启用随机域名时,简介:没有后台直接html修改自己的资料就行网盘地址:http://zijiepan2.xyz/vJMdhdMSBuE图片:…

    2022年10月21日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号