拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」

拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」模拟假数据集set.seed(0820)n<-50p<-25beta<-rep(0,p)beta[1:5]<-1:5/5X<-matrix(rnorm(n*p),n,p)X<-scale(X)Xb<-X%*%betaY<-X%*%b…

大家好,又见面了,我是你们的朋友全栈君。

原文链接:http://tecdat.cn/?p=10997

原文出处:拓端数据部落公众号

模拟假数据集

 set.seed(0820) n <- 50 p <- 25 beta <- rep(0,p) beta[1:5] <- 1:5/5 X <- matrix(rnorm(n*p),n,p) X <- scale(X) Xb <- X%*%beta Y <- X%*%beta+rnorm(n) Y <- Y-mean(Y) plot(cor(X,Y),xlab="j",ylab="Cor(Y,X_j)",main="Sample correlations",cex=2) 

拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」

标准最小二乘法

 summary(ols) 
## ## Call: ## ## Residuals: ## Min 1Q Median 3Q Max ## -2.54540 -0.38971 -0.00738 0.49058 1.90900 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) -3.914e-16 1.648e-01 0.000 1.00000 ## X1 6.020e-01 2.097e-01 2.871 0.00841 ** ## X2 5.924e-01 2.013e-01 2.944 0.00709 ** ## X3 -1.106e-01 2.290e-01 -0.483 0.63363 ## X4 1.117e+00 2.058e-01 5.427 1.42e-05 *** ## X5 1.234e+00 2.190e-01 5.633 8.46e-06 *** ## X6 -3.225e-01 2.322e-01 -1.389 0.17755 ## X7 -1.954e-01 2.150e-01 -0.909 0.37231 ## X8 1.466e-01 2.532e-01 0.579 0.56803 ## X9 4.678e-02 2.353e-01 0.199 0.84409 ## X10 -2.779e-01 2.151e-01 -1.292 0.20864 ## X11 -7.308e-02 2.553e-01 -0.286 0.77717 ## X12 -4.424e-02 2.642e-01 -0.167 0.86839 ## X13 -1.078e-01 2.101e-01 -0.513 0.61270 ## X14 3.000e-01 2.263e-01 1.326 0.19743 ## X15 2.396e-01 2.480e-01 0.966 0.34365 ## X16 -1.178e-01 2.285e-01 -0.515 0.61100 ## X17 -2.409e-01 2.280e-01 -1.057 0.30104 ## X18 -3.191e-01 2.396e-01 -1.332 0.19551 ## X19 -1.207e-01 2.372e-01 -0.509 0.61553 ## X20 1.721e-01 2.179e-01 0.790 0.43733 ## X21 -1.677e-02 2.144e-01 -0.078 0.93831 ## X22 3.706e-02 2.145e-01 0.173 0.86426 ## X23 3.233e-02 2.108e-01 0.153 0.87938 ## X24 -1.541e-01 2.343e-01 -0.658 0.51691 ## X25 -1.970e-01 1.965e-01 -1.002 0.32622 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 1.166 on 24 degrees of freedom ## Multiple R-squared: 0.8416, Adjusted R-squared: 0.6767 ## F-statistic: 5.102 on 25 and 24 DF, p-value: 7.861e-05 

 LASSO

 相关 视频:Lasso回归、岭回归等正则化回归数学原理及R语言实例

Lasso回归、岭回归等正则化回归数学原理及R语言实例

 

 plot(lasso) 

拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」

使用BIC选择路径上的最佳点

 
## df MSE bic ## Intercept 1 4.1174138 74.67329 ## 2 3.8224639 74.86881 ## 3 1.9171062 44.27691 ## 4 1.9136899 48.09976 ## 5 1.5118875 40.22806 ## 6 1.3016560 36.65400 ## 7 1.2693779 39.31051 ## 8 1.2124870 40.92986 ## 9 1.1814011 43.54326 ## 10 1.1728179 47.09070 ## 11 1.1016346 47.87201 ## 12 1.0050559 47.19643 ## 13 0.9867377 50.18875 ## 14 0.9636054 52.91465 ## 15 0.8686856 51.64164 ## 16 0.7777734 50.02637 ## 17 0.7700763 53.44111 ## 18 0.7663544 57.11089 ## 19 0.7510361 60.01336 ## 20 0.7451598 63.53263 ## 19 0.7196873 57.88151 ## 20 0.7149486 61.46323 ## 21 0.7141592 65.32002 ## 20 0.7051259 60.77152 ## 21 0.6875391 63.42065 ## 22 0.6764241 66.51776 ## 23 0.6739037 70.24313 ## 24 0.6570954 72.89225 ## 25 0.6564105 76.75213 ## 26 0.6520870 80.33373 
 

拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」

 

结果

 # beta真值 
## [1] 0.2 0.4 0.6 0.8 1.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 ## [18] 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 
 #使用最小二乘预测beta round(beta_ols,3) 
## X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 ## 0.602 0.592 -0.111 1.117 1.234 -0.323 -0.195 0.147 0.047 -0.278 ## X11 X12 X13 X14 X15 X16 X17 X18 X19 X20 ## -0.073 -0.044 -0.108 0.300 0.240 -0.118 -0.241 -0.319 -0.121 0.172 ## X21 X22 X23 X24 X25 ## -0.017 0.037 0.032 -0.154 -0.197 
 # LASSO预测beta round(beta_lasso,3) 
## [1] 0.238 0.238 0.000 0.900 0.786 0.000 0.000 0.000 0.000 0.000 ## [11] 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 ## [21] 0.000 0.000 0.000 0.000 -0.075 
 #MSE - OLS mean((beta-beta_ols)^2) 
## [1] 0.06204978 
 #MSE - LASSO mean((beta-beta_lasso)^2) 
## [1] 0.01795647


拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」

最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/136385.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 批处理字符串截取_批处理 字符串 比较大小

    批处理字符串截取_批处理 字符串 比较大小解决批处理for体内的字符串截取问题背景:笔记想读取bat同目录下a文件夹下的所有文件名,并在for循环体下截取前两位字符串,如图代码块@echooff&setlocalenabledelayedexpansionsetfa=C:\Users\GilbertXiao\Desktop\a\afor/f”delims=”%%ain(‘dir/b/on%fa%\*.

    2022年10月12日
    4
  • mysql中OPTIMIZE TABLE的作用

    mysql中OPTIMIZE TABLE的作用

    2021年9月18日
    53
  • 茜在人名可以读xi吗_茜读xi还是qian?

    茜在人名可以读xi吗_茜读xi还是qian?01茜可以读xi,也可以读qian,通常用于外国女子名字译音时多读xī,而qiàn多用于中国名。茜,本义是草名即“茜草”读音为qiàn时,指茜草,在古汉语中也指“深红”。读xī时,多为音译用字,多用于人名。茜汉语常用字,读作qiàn或者xī,最早见于《说文》小篆。本义是指一种草名,即茜草,为多年生草本植物,可作红色染料,后引申为大红色、秀美、生动等。茜草【qiàncǎo】,多年生草本植物,根圆锥…

    2022年6月21日
    77
  • RabbitMQ基础介绍与在java中使用-入门「建议收藏」

    RabbitMQ基础介绍与在java中使用-入门「建议收藏」前言:MQ做应用解耦,流量削峰这些是常识,RabbitMQ是实现了高级消息队列协议(AMQP)的开源消息代理软件(亦称面向消息的中间件)。RabbitMQ服务器是用Erlang语言编写的,而集群和故障转移是构建在开放电信平台框架上的。所有主要的编程语言均有与代理接口通讯的客户端库常用的主流的MQ有四个ActiveMQ:Apache下的一个子项目。使用Java完全支持JMS1.1和J2EE1.4规范的JMSProvider实现,少量代码就可以高效地实现高级应用场景。可插拔的传输协议支持,比如:

    2022年10月3日
    8
  • 猴子摘香蕉问题c语言_c语言人工智能算法

    猴子摘香蕉问题c语言_c语言人工智能算法问题说明:房间内有一只猴子,一个箱子和一个挂在天花板上的香蕉。三者的位置如下图所示:初始状态:三者在输入的初始位置,猴子手上无香蕉,猴子不在箱子上。目标状态:三者均在香蕉对应的位置,猴子手上有香蕉,且在箱子上。实现步骤:猴子走到箱子处猴子将箱子推到香蕉处猴子爬上箱子猴子摘香蕉程序内容:本程序主要实现猴子摘香蕉的过程,即从初始状态到目标状态。程序运行后,根据用户输入的三者的位置,按照实现步骤更新每一过程后的状态变量,并将过程输出。本程序使用以下函数:main():主函数

    2022年9月26日
    4
  • 适合做回归分析的数据_时序数据库与实时数据库

    适合做回归分析的数据_时序数据库与实时数据库JTSGeometry关系分析:缓冲区分析(Buffer)包含所有的点在一个指定距离内的多边形和多多边形凸壳分析(ConvexHull)包含几何形体的所有点的最小凸壳多边形(外包多边形)交叉分析(Intersection)A∩B交叉操作就是多边形AB中所有共同点的集合联合分析(Union)AUBAB的联合操作就是AB所有点的集合差异分析(Diff…

    2025年6月1日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号