VIF检验相关性「建议收藏」

VIF检验相关性「建议收藏」VIF可以用来度量多重共线性问题,VIFj=11−Rj2\quad\mathrm{VIF}_{j}=\frac{1}{1-R_{j}^{2}}VIFj​=1−Rj2​1​式子中,Rj2R_{j}^{2}Rj2​是第jjj个变量在所有变量上回归时的确定系数。如果VIF过大(比如大于5或10),则意味着存在多重共线性问题。#数据df=pd.read_excel(io=’数据.xlsx’,sheet_name=0,usecols=range(1,5))#务必注意:一定要加上常数项,#如果没

大家好,又见面了,我是你们的朋友全栈君。

VIF可以用来度量多重共线性问题, V I F j = 1 1 − R j 2 \quad \mathrm{VIF}_{j}=\frac{1}{1-R_{j}^{2}} VIFj=1Rj21
式子中, R j 2 R_{j}^{2} Rj2是第 j j j个变量在所有变量上回归时的确定系数。
如果VIF过大(比如大于5或10),则意味着存在多重共线性问题。关于多重共线性更多内容可以参考往期文章https://blog.csdn.net/weixin_45288557/article/details/111769464

(由于没有VIF临界值表,我们只能使用经验法则:若VIF>5,则存在严重多重共线性。也有人建议用VIF>10作为存在严重多重共线性的标准,特别在解释变量多的情形应当如此。)

#数据
df = pd.read_excel(io='数据.xlsx', sheet_name=0, usecols=range(1,5))

# 务必注意:一定要加上常数项,#如果没有常数项列,计算结果天差地别,可能VIF等于好几千
df['Constant Value']=1 #添加常数项
df.head()

from statsmodels.stats.outliers_influence import variance_inflation_factor
# 这里可以选择想要判断的变量列
df_tezheng=df[["var1","var2","var3","var4","var5", 'Constant Value']]

# 进行vif检验
vif=[]
for i in range(df_tezheng.shape[1]-1):
    #计算第i+1个变量的(第i+1列)的方差膨胀因子
    vif.append(variance_inflation_factor(df_tezheng.values,i))
#result_out
yy=pd.DataFrame(df_tezheng.columns[:-1,])
yy.rename(columns={ 
   0:"var_name"},inplace=True) 
yy["vif"]=vif
print(yy)
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/130507.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 基于51单片机步进电机控制[通俗易懂]

    基于51单片机步进电机控制[通俗易懂]实现功能:1、用矩阵键盘设定电机目标转速及旋转方向,范围100~300转/分;2、测量、显示电机实际转速和方向(正转显示“P”,反转显示“N”);从实现功能上分析,软件可以分解3个功能模块:1,步进电机控制模块2,矩阵键盘输入模块3,显示输出模块步进电机工作原理步进电机通过输入脉冲信号进行控制,即电机的总转动角度由输入脉冲总数决定,而电机的转速…

    2022年5月31日
    33
  • jQuery使用经验建议

    在开发过很多jQuery插件以后,我慢慢的摸索出了一套开发jQuery插件比较标准的结构和模式。这样我就可以复制并粘贴大部分的代码结构,只要专注最主要的逻辑代码就行了。 使用相同的设计模

    2021年12月25日
    60
  • jquery中的$()是什么_js简单特效

    jquery中的$()是什么_js简单特效在设计前端页面时,会用到很多效果,我们可以采用CSS样式或JavaScript来实现,在这里给大家介绍JS动画

    2022年10月16日
    2
  • PROXY SERVER 代理服务器[通俗易懂]

    Proxy是什么呢,是代理。普通的因特网访问是一个典型的客户机与服务器结构:用户利用计算机上的客户端程序,如浏览器发出请求,远端WWW服务器程序响应请求并提供相应的数据。而Proxy处于客户机与服务器之间,对于服务器来说,Proxy是客户机,Proxy提出请求,服务器响应;对于客户机来说,Proxy是服务器,它接受客户机的请求,并将服务器上传来的数据转给客户机。它的作用很象现实生活中的代理服务商…

    2022年4月18日
    43
  • 二叉树层序遍历 java

    二叉树层序遍历 java层序遍历1.把根结点放到队列中2.循环直到?1.从队列取出队首元素2.孩子入队列​publicstaticvoidlevelOrder1(TreeNoderoot){if(root==null){return;}Queue<TreeNode>queue…

    2022年5月21日
    31
  • hbase列表排序

    hbase列表排序

    2021年12月17日
    178

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号