多重共线性:python计算VIF以及使用vif做因子独立性检验的方法「建议收藏」

多重共线性:python计算VIF以及使用vif做因子独立性检验的方法「建议收藏」转自:https://blog.csdn.net/ab1112221212/article/details/100133066多重共线性在python中的解决方法本文将讨论多重共线性的相关概念及利用python自动化消除多重共线性的方法,以供参考,欢迎拍砖线性模型与非线性模型关于线性模型与非线性模型的定义,似乎并没有确切的定论,但是个人认为建模首先得清楚地认识样本,样本有线性可分与线性不可分两种,所谓是否线性可分,是指是否存在一条直线(或平面)将样本分开。上图中y=0和y=1的样本可以由一

大家好,又见面了,我是你们的朋友全栈君。

参考:https://www.zhihu.com/question/270451437/answer/405814593

https://www.cnpython.com/qa/38203

import numpy as np
import scipy as sp

a = [1, 1, 2, 3, 4]
b = [2, 2, 3, 2, 1]
c = [4, 6, 7, 8, 9]
d = [4, 3, 4, 5, 4]

ck = np.column_stack([a, b, c, d])
cc = sp.corrcoef(ck, rowvar=False)
VIF = np.linalg.inv(cc)
VIF.diagonal()

 

from statsmodels.stats.outliers_influence import variance_inflation_factor
from statsmodels.tools.tools import add_constant

df = pd.DataFrame(
    {'a': [1, 1, 2, 3, 4],
     'b': [2, 2, 3, 2, 1],
     'c': [4, 6, 7, 8, 9],
     'd': [4, 3, 4, 5, 4]}
)

X = add_constant(df)
>>> pd.Series([variance_inflation_factor(X.values, i) 
               for i in range(X.shape[1])], 
              index=X.columns)

 

参考:https://zhuanlan.zhihu.com/p/56468729

       使用VIF进行检验的方法主要为,对某一因子和其余因子进行回归,得到R^2,计算VIF,剔除因子中VIF高的因子,保留VIF较低的因子,以此类推,直到得到一个相关性较低的因子组合来增强模型的解释能力。

  在实际测试过程中,并非要指定一个VIF阈值,比如某因子的VIF值超过阈值才剔除,而是通过观察所有因子值的VIF值,如果发现该值较大(显著离群),剔除该因子即可。本次我们的几个因子表现都非常出色,VIF值稳定且没有离群较大值,因此,没能找到任何一个需要剔除的因子。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/135202.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 读写锁属性[通俗易懂]

    读写锁属性[通俗易懂]本文转载自zfy3000《读写锁属性》通过读写锁,可以对受保护的共享资源进行并发读取和独占写入。读写锁是可以在读取或写入模式下锁定的单一实体。要修改资源,线程必须首先获取互斥写锁。必须释放所有读锁之后,才允许使用互斥写锁。有关Solaris线程所实现的读写锁,请参见相似的同步函数-读写锁。对数据库的访问可以使用读写锁进行同步。读写锁支持并发读取数据库记录,因为读操作

    2022年8月12日
    7
  • git 修改用户名密码「建议收藏」

    在控制面板修改凭证就可以进行修改用户名密码。 

    2022年4月8日
    60
  • handlersocket php,handlersocket安装配置

    handlersocket php,handlersocket安装配置一、安装handlersocket下载地址:https://nodeload.github.com/ahiguti/HandlerSocket-Plugin-for-MySQL/tarball/mastertarxfahiguti-HandlerSocket-Plugin-for-MySQL-1.0.6-88-gefd9972.tar.gzcdahiguti-HandlerSocket-…

    2022年8月24日
    8
  • Linux Kernel 5.2 将进一步支持 AMD FreeSync

    Linux Kernel 5.2 将进一步支持 AMD FreeSync开发四年只会写业务代码,分布式高并发都不会还做程序员?>>>不久前发布的Linux5.0内…

    2022年6月10日
    26
  • vue父组件调用子组件方法返回值_vue子组件修改父组件值

    vue父组件调用子组件方法返回值_vue子组件修改父组件值子组件调用父组件方法,父组件执行完后,进行回调,代码如下:子组件this.$emit(‘change’,this.dataList,(loading)=>{this.loading=loading})父组件@change=”onChange”………………………………..

    2022年10月2日
    1
  • vue.js和react.js_vue和jquery

    vue.js和react.js_vue和jqueryjquery和框架的区别框架:数据和视图分离,以数据驱动视图,只关心数据变化,dom操作被封装。数据驱动jquery:依靠dom操作去组合业务逻辑。事件驱动React和Vue对比两者本质区别Vue—本质是MVVM框架,由MVC发展而来React—本质是前端组件化框架,由后端组件化发展而来模板的区别Vue—使用模板(最初由Angular提出)React—使用JSX模板语法…

    2022年9月25日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号