Python statsmodel包训练LR模型

Python statsmodel包训练LR模型Python中训练LR模型一般使用sklearn包,输出模型报告和其他机器学习方法一样。但从统计背景出发,想看更详细的报告,statsmodel包可以帮助实现。1.训练模型importstatsmodels.apiassmfromstatsmodels.stats.outliers_influenceimportvariance_inflation_factor#tr…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

Python中训练LR模型一般使用sklearn包,输出模型报告和其他机器学习方法一样。但从统计背景出发,想看更详细的报告,statsmodel包可以帮助实现。

1.训练模型

import statsmodels.api as sm
from statsmodels.stats.outliers_influence import variance_inflation_factor

    #train样本上训练模型
    y = trainData[y_name]
    X = trainData[model_list]
    X['intercept'] = [1] * X.shape[0]
    
    LR = sm.Logit(y, X).fit()

2.模型报告

	#LR自带的summary报告,直接输出到excel不方便
    summary = LR.summary()

    #查看VIF
    X_m = np.matrix(X)
    VIF_list = [variance_inflation_factor(X_m, i) for i in range(X_m.shape[1])]
    #varname_list = [X.columns[i] for i in range(len(VIF_list))]
    
    #计算标准化系数
    X_new = X.drop(['intercept'],axis = 1)
    X_new2 = X_new.apply(lambda x: (x - np.mean(x)) / np.std(x))
    LR_N = sm.Logit(trainData[y_name], X_new2).fit()

    #wald检验
    wald_test = LR.wald_test_terms().table

    #拼接report
    model_rpt1 = pd.concat([LR.params,LR.pvalues,wald_test['statistic'],LR_N.params],sort = False,axis = 1)
    model_rpt1.columns = ['params','pvals','wald','normal_params']
    model_rpt1['VIF'] = VIF_list
    model_rpt1.sort_values(['normal_params'],ascending = True,inplace = True)
    model_rpt1.fillna(0,inplace = True)
    
    #计算模型变量间的相关系数
    corr = X.drop(['intercept'],axis = 1).corr()
    corr2 = corr.reset_index()    

3.其他

1.statsmodel训练模型过程不涉及筛选变量,所有送进去的模型变量都会参与拟合;
2.LR.predict(X_test) 可以给其他样本打分,其结果是p,而根据系数得到的结果是log(p/1-p)。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/182541.html原文链接:https://javaforall.net

(0)
上一篇 2022年10月13日 上午9:00
下一篇 2022年10月13日 上午9:00


相关推荐

  • 内网IP和公网IP的区别

    内网IP和公网IP的区别IP地址对于经常上网的人应该都不陌生,ip地址又可以分成内网ip地址和公网ip地址,今天就来简单介绍下这两者的区别。通常我们所说的内网也就是局域网,是内网的计算机以网络地址转换协议,通过一个公共的网关访问Internet。而内网的计算机也可以向Internet上的其他计算机发送连接请求。但是但Internet上其他的计算机无法向内网的计算机发送连接请求。为了简单理解我们就以网吧的网络举个列子,网吧的网线都是连接在同一个交换机上面的,也就是说它们的IP地址是由交换机或者路由器进行分配的。而且每…

    2022年4月29日
    50
  • Arduino文档阅读笔记-RFID工作原理及RC522模块介绍

    RFID工作原理RFID(RadioFrequencyIdentification):无线射频识别RFID由2个部分组成:应答器/标签被贴在某个物体上的东东。无线接收器用于读取应答器/标签上的数据。读卡器由频射模块及高平磁场组成。Tag/应答器为待感应设备,此设备不包含电池。他只包含微型集成电路芯片及存储数据的介质以及接收和发送信号的天线。读取tag中的数据,首先要放…

    2022年4月8日
    88
  • n8n实践-使用n8n搭建一个定时发送天气预报邮件的工作流

    n8n实践-使用n8n搭建一个定时发送天气预报邮件的工作流

    2026年3月15日
    2
  • 3-1.Django快速搭建和项目配置(虚拟环境的创建)

    3-1.Django快速搭建和项目配置(虚拟环境的创建)一 Django 快速搭建 1 在 pycharm 页面下 点击 file gt newproject 在弹出框的左边选择 Django 然后在右边 location 一栏反斜杠的后面输入项目名称 在 interperter 解释器 一栏中或者在后面的 addlocal 中配置虚拟环境 这样 Django 项目搭建完成 二 项目配置 1 manage py 项目管理器 启动 Django 的主要文件 主要 D

    2026年3月27日
    1
  • Manus被Reverse CFIUS调查,“AI套壳”类产品要注意些什么?

    Manus被Reverse CFIUS调查,“AI套壳”类产品要注意些什么?

    2026年3月15日
    2
  • kafka基本命令_kafka controller

    kafka基本命令_kafka controllerkafka-console-producer.sh脚本通过调用kafka.tools.ConsoleProducer类加载命令行参数的方式,在控制台生产消息的脚本。本文是基于Kafka_2.12-2.5.0版本编写的,–bootstrap-server参数于此版本开始被使用,而–broker-list也是在此版本开始被置为过时,但其属性值依旧保持不变。在使用较旧版本时,注意…

    2022年10月14日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号