Python statsmodel包训练LR模型

Python statsmodel包训练LR模型Python中训练LR模型一般使用sklearn包,输出模型报告和其他机器学习方法一样。但从统计背景出发,想看更详细的报告,statsmodel包可以帮助实现。1.训练模型importstatsmodels.apiassmfromstatsmodels.stats.outliers_influenceimportvariance_inflation_factor#tr…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

Python中训练LR模型一般使用sklearn包,输出模型报告和其他机器学习方法一样。但从统计背景出发,想看更详细的报告,statsmodel包可以帮助实现。

1.训练模型

import statsmodels.api as sm
from statsmodels.stats.outliers_influence import variance_inflation_factor

    #train样本上训练模型
    y = trainData[y_name]
    X = trainData[model_list]
    X['intercept'] = [1] * X.shape[0]
    
    LR = sm.Logit(y, X).fit()

2.模型报告

	#LR自带的summary报告,直接输出到excel不方便
    summary = LR.summary()

    #查看VIF
    X_m = np.matrix(X)
    VIF_list = [variance_inflation_factor(X_m, i) for i in range(X_m.shape[1])]
    #varname_list = [X.columns[i] for i in range(len(VIF_list))]
    
    #计算标准化系数
    X_new = X.drop(['intercept'],axis = 1)
    X_new2 = X_new.apply(lambda x: (x - np.mean(x)) / np.std(x))
    LR_N = sm.Logit(trainData[y_name], X_new2).fit()

    #wald检验
    wald_test = LR.wald_test_terms().table

    #拼接report
    model_rpt1 = pd.concat([LR.params,LR.pvalues,wald_test['statistic'],LR_N.params],sort = False,axis = 1)
    model_rpt1.columns = ['params','pvals','wald','normal_params']
    model_rpt1['VIF'] = VIF_list
    model_rpt1.sort_values(['normal_params'],ascending = True,inplace = True)
    model_rpt1.fillna(0,inplace = True)
    
    #计算模型变量间的相关系数
    corr = X.drop(['intercept'],axis = 1).corr()
    corr2 = corr.reset_index()    

3.其他

1.statsmodel训练模型过程不涉及筛选变量,所有送进去的模型变量都会参与拟合;
2.LR.predict(X_test) 可以给其他样本打分,其结果是p,而根据系数得到的结果是log(p/1-p)。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/182541.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 开启Scrapy爬虫之路

    开启Scrapy爬虫之路七夜大佬的《python爬虫开发与项目实战》,买了好多年了,学习了好多东西,基本上爬虫都是在这里面学的,后期的scrapy框架爬虫一直不得门而入,前段时间补了下面向对象的知识,今天突然顿悟了!写个笔记记录下学习过程

    2022年6月26日
    21
  • spring任务调度scheduled_golang 任务调度

    spring任务调度scheduled_golang 任务调度1、任务调度接口TaskScheduler提供了多种方法来调度将来某个时间点要运行的任务。2、触发器Trigger实现PeriodicTrigger和CronTrigger。3、@Scheduled注解创建定时任务4、@Async注解异步方法执行,value属性指定任务执行器。5、task:scheduler、task:executor创建调度器和执行器…

    2022年10月11日
    0
  • java 唯一随机数_JAVA随机数

    java 唯一随机数_JAVA随机数每篇一句稍待秋风凉冷后,高寻白帝问真源。《望岳三首·其二》-唐代-杜甫获取随机数的方式经常使用的大概就下面5种①Math.random():获取随机小数范围:[0.0,1.0)返回的值是double类型②Random类构造方法:Random():建议使用无参构造方法方法:intnextInt(intn):获取[0,n)范围的随机整数③ThreadLocalRan…

    2022年7月26日
    4
  • No mapping found for HTTP request with URI [xxxx] in DispatcherServlet with name ‘xxx’「建议收藏」

    No mapping found for HTTP request with URI [xxxx] in DispatcherServlet with name ‘xxx’「建议收藏」搭建SSM环境时测试springMVC时出现个很有趣的问题: 测试webapp下的index.jsp没问题,但是测试hello就出现问题。当访问hello时出现如下问题:解决方案:         之前扫描包时这样:           <context:component-scan base-package="com.itshenjin.controller.*…

    2022年6月13日
    29
  • python stdout

    python stdoutpythonstdout

    2025年5月26日
    1
  • 分区容错性和可用性的区别

    分区容错性和可用性的区别分区容错性:因为网络等硬件引起的问题,一台服务器崩溃了,保证能在其他服务器上也能顺利完成业务。可用性:因为软件代码层面的问题,一台服务器上的服务崩溃了,保证能在其他服务器上完成该业务。区别:分区容错性更偏向于硬件引起的问题可用性更偏向于软件代码层面的问题…

    2022年7月25日
    21

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号