拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」

拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」模拟假数据集set.seed(0820)n<-50p<-25beta<-rep(0,p)beta[1:5]<-1:5/5X<-matrix(rnorm(n*p),n,p)X<-scale(X)Xb<-X%*%betaY<-X%*%b…

大家好,又见面了,我是你们的朋友全栈君。

原文链接:http://tecdat.cn/?p=10997

原文出处:拓端数据部落公众号

模拟假数据集

 set.seed(0820) n <- 50 p <- 25 beta <- rep(0,p) beta[1:5] <- 1:5/5 X <- matrix(rnorm(n*p),n,p) X <- scale(X) Xb <- X%*%beta Y <- X%*%beta+rnorm(n) Y <- Y-mean(Y) plot(cor(X,Y),xlab="j",ylab="Cor(Y,X_j)",main="Sample correlations",cex=2) 

拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」

标准最小二乘法

 summary(ols) 
## ## Call: ## ## Residuals: ## Min 1Q Median 3Q Max ## -2.54540 -0.38971 -0.00738 0.49058 1.90900 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) -3.914e-16 1.648e-01 0.000 1.00000 ## X1 6.020e-01 2.097e-01 2.871 0.00841 ** ## X2 5.924e-01 2.013e-01 2.944 0.00709 ** ## X3 -1.106e-01 2.290e-01 -0.483 0.63363 ## X4 1.117e+00 2.058e-01 5.427 1.42e-05 *** ## X5 1.234e+00 2.190e-01 5.633 8.46e-06 *** ## X6 -3.225e-01 2.322e-01 -1.389 0.17755 ## X7 -1.954e-01 2.150e-01 -0.909 0.37231 ## X8 1.466e-01 2.532e-01 0.579 0.56803 ## X9 4.678e-02 2.353e-01 0.199 0.84409 ## X10 -2.779e-01 2.151e-01 -1.292 0.20864 ## X11 -7.308e-02 2.553e-01 -0.286 0.77717 ## X12 -4.424e-02 2.642e-01 -0.167 0.86839 ## X13 -1.078e-01 2.101e-01 -0.513 0.61270 ## X14 3.000e-01 2.263e-01 1.326 0.19743 ## X15 2.396e-01 2.480e-01 0.966 0.34365 ## X16 -1.178e-01 2.285e-01 -0.515 0.61100 ## X17 -2.409e-01 2.280e-01 -1.057 0.30104 ## X18 -3.191e-01 2.396e-01 -1.332 0.19551 ## X19 -1.207e-01 2.372e-01 -0.509 0.61553 ## X20 1.721e-01 2.179e-01 0.790 0.43733 ## X21 -1.677e-02 2.144e-01 -0.078 0.93831 ## X22 3.706e-02 2.145e-01 0.173 0.86426 ## X23 3.233e-02 2.108e-01 0.153 0.87938 ## X24 -1.541e-01 2.343e-01 -0.658 0.51691 ## X25 -1.970e-01 1.965e-01 -1.002 0.32622 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 1.166 on 24 degrees of freedom ## Multiple R-squared: 0.8416, Adjusted R-squared: 0.6767 ## F-statistic: 5.102 on 25 and 24 DF, p-value: 7.861e-05 

 LASSO

 相关 视频:Lasso回归、岭回归等正则化回归数学原理及R语言实例

Lasso回归、岭回归等正则化回归数学原理及R语言实例

 

 plot(lasso) 

拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」

使用BIC选择路径上的最佳点

 
## df MSE bic ## Intercept 1 4.1174138 74.67329 ## 2 3.8224639 74.86881 ## 3 1.9171062 44.27691 ## 4 1.9136899 48.09976 ## 5 1.5118875 40.22806 ## 6 1.3016560 36.65400 ## 7 1.2693779 39.31051 ## 8 1.2124870 40.92986 ## 9 1.1814011 43.54326 ## 10 1.1728179 47.09070 ## 11 1.1016346 47.87201 ## 12 1.0050559 47.19643 ## 13 0.9867377 50.18875 ## 14 0.9636054 52.91465 ## 15 0.8686856 51.64164 ## 16 0.7777734 50.02637 ## 17 0.7700763 53.44111 ## 18 0.7663544 57.11089 ## 19 0.7510361 60.01336 ## 20 0.7451598 63.53263 ## 19 0.7196873 57.88151 ## 20 0.7149486 61.46323 ## 21 0.7141592 65.32002 ## 20 0.7051259 60.77152 ## 21 0.6875391 63.42065 ## 22 0.6764241 66.51776 ## 23 0.6739037 70.24313 ## 24 0.6570954 72.89225 ## 25 0.6564105 76.75213 ## 26 0.6520870 80.33373 
 

拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」

 

结果

 # beta真值 
## [1] 0.2 0.4 0.6 0.8 1.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 ## [18] 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 
 #使用最小二乘预测beta round(beta_ols,3) 
## X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 ## 0.602 0.592 -0.111 1.117 1.234 -0.323 -0.195 0.147 0.047 -0.278 ## X11 X12 X13 X14 X15 X16 X17 X18 X19 X20 ## -0.073 -0.044 -0.108 0.300 0.240 -0.118 -0.241 -0.319 -0.121 0.172 ## X21 X22 X23 X24 X25 ## -0.017 0.037 0.032 -0.154 -0.197 
 # LASSO预测beta round(beta_lasso,3) 
## [1] 0.238 0.238 0.000 0.900 0.786 0.000 0.000 0.000 0.000 0.000 ## [11] 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 ## [21] 0.000 0.000 0.000 0.000 -0.075 
 #MSE - OLS mean((beta-beta_ols)^2) 
## [1] 0.06204978 
 #MSE - LASSO mean((beta-beta_lasso)^2) 
## [1] 0.01795647


拓端tecdat|基于R语言实现LASSO回归分析「建议收藏」

最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/136385.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • oracle分页查询解释

    oracle分页查询解释select*fromt_userorderbyuser_id;——————————————–分页的必须参数–当前页–每页几条数据–一共多少页–总记录数————对于分页查询而言,最终需要两个参数(一个是开始条数,一个是结束条数)———select*from(SELEC…

    2022年5月28日
    39
  • VS 2017安装教程

    VS 2017安装教程 1、首先下载安装包,地址是:https://www.microsoft.com/zh-cn/download/,进入首页后选择开发人员工具,进入开发人员工具后即可下载VS,VS有三个版本,分别是社区版、专业版、企业版。我选择的是社区版。点击下载VisualStudio(蓝色底纹)左下侧的发行说明,即可下载以前的旧版本(https://my.visualstudio.com/download…

    2022年6月9日
    44
  • 金融公司2014年度工作总结与2015年度工作计划

    金融公司2014年度工作总结与2015年度工作计划正文:一、 员工个人对全年重点工作、核心绩效指标进行罗列。自6月入职以来参加730、825、917、1015、1126的版本测试,测试的各个功能点,前台涉及的测试功能点包括广发、汇添富的申购、赎回,基金双持,票据购买、冻结收银台、理财管理、后台功能点包括用户开户信息查询等各种报表处理、申购异常处理、赎回异常处理、强制赎回等异常处理、定时任务管理、日常管理包括基础配置管理、基金管理中的…

    2022年7月26日
    7
  • linuxiostat命令详解_ifstat命令

    linuxiostat命令详解_ifstat命令Linuxiostat命令详解iostat主要用于监控系统设备的IO负载情况,根据这个可以看出当前系统的写入量和读取量,CPU负载和磁盘负载。1.命令格式:iostat参数时间次数2.命令参数:-C显示CPU使用情况-d显示磁盘使用情况-k以KB为单位显示-m以M为单位显示-N显示磁盘阵列(LVM)信息-n显示NFS使用情况-p[磁盘]显示磁盘和分区的情况-t显示终端和CPU的信息-x显示详细信息-V显示版本信息3.常用

    2022年10月6日
    2
  • 安装VM虚拟机教程

    安装VM虚拟机教程虚拟机安装及新建指南安装 VM 虚拟机创建虚拟机开启虚拟机安装 VM 虚拟机待定创建虚拟机 1 新建虚拟机 2 默认选择自定义 直接下一步 3 默认点击下一步 4 默认点击下一步 5 这里我选择的是 Linux 系统 默认点击下一步 6 更改虚拟机名称及安装位置 7 选择处理器数量 8 选择虚拟机内存 9 默认下一步 10 默认下一步 11 默认下一步 12 默认下一步 13 分配磁盘大小 14 磁盘文件名 默认下一步 15 选择自定义硬件 16 选择使用的镜像文件 17 点击完成

    2025年8月18日
    4
  • win10-linux双系统安装教程

    win10-linux双系统安装教程需要的工具UltralSO:制作启动盘DiskGenius:划分磁盘空间EasyUEFI:修改启动引导,Windows自带引导不能修改,因此要用Linux的引导(一般默认就是linux的)1、制作启动U盘用UltralSO做,教程很多2、划分磁盘空间用DiskGenius将匀出一块空间做linux系统空间100MBESP分区8GB交换分区自定义容量:根目录分区自定义容量:\home分区3、安装系统U盘启动,安装操作系统4、修改启动顺序…

    2022年7月24日
    10

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号