为什么L1正则化导致稀疏解「建议收藏」

全栈程序员-站长 • 2022年4月12日下午6:40 • 未分类 • 阅读 71

一、从数据先验的角度首先你要知道L1范式和L2范式是怎么来的,然后是为什么要把L1或者L2正则项加到代价函数中去.L1,L2范式来自于对数据的先验知识.如果你认为,你现有的数据来自于高斯分布,那么就应该在代价函数中加入数据先验P(x),一般由于推导和计算方便会加入对数似然,也就是log(P(x)),然后再去优化,这样最终的结果是,由于你的模型参数考虑了数据先验,模型效果当然就更好.哦对了,如果你…

大家好，又见面了，我是你们的朋友全栈君。

一、从数据先验的角度
首先你要知道L1范式和L2范式是怎么来的,然后是为什么要把L1或者L2正则项加到代价函数中去.L1,L2范式来自于对数据的先验知识.如果你认为,你现有的数据来自于高斯分布,那么就应该在代价函数中加入数据先验P(x),一般由于推导和计算方便会加入对数似然,也就是log(P(x)),然后再去优化,这样最终的结果是,由于你的模型参数考虑了数据先验,模型效果当然就更好.哦对了,如果你去看看高斯分布的概率密度函数P(x),你会发现取对数后的log(P(x))就剩下一个平方项了,这就是L2范式的由来–高斯先验.同样,如果你认为你的数据是稀疏的,不妨就认为它来自某种laplace分布.不知你是否见过laplace分布的概率密度函数,我贴出一张维基上的图
在这里插入图片描述

作者：amnesia
链接：https://www.zhihu.com/question/37096933/answer/70668476
来源：知乎

二、从数据计算的角度

但为什么L1正则会产生稀疏解呢？这里利用公式进行解释。
假设只有一个参数为w，损失函数为L(w)，分别加上L1正则项和L2正则项后有：

假设L(w)在0处的倒数为d0，即
在这里插入图片描述

则可以推导使用L1正则和L2正则时的导数。
引入L2正则项，在0处的导数

引入L1正则项，在0处的导数
在这里插入图片描述

可见，引入L2正则时，代价函数在0处的导数仍是d0，无变化。而引入L1正则后，代价函数在0处的导数有一个突变。从d0+λ到d0−λ，若d0+λ和d0−λ异号，则在0处会是一个极小值点。因此，优化时，很可能优化到该极小值点上，即w=0处。
这里只解释了有一个参数的情况，如果有更多的参数，也是类似的。因此，用L1正则更容易产生稀疏解。

来自https://blog.csdn.net/f156207495/article/details/82794151?utm_source=copy

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/128768.html原文链接：https://javaforall.net

赞 (0)

全栈程序员-站长

0 0

蓝屏终止代码KMODE_windows10重置电脑

蓝屏终止代码KMODE_windows10重置电脑安装双系统后，Windows10时常出现蓝屏

全栈程序员-站长
2022年10月14日
4
ICMP详解「建议收藏」

ICMP详解「建议收藏」ICMP（InternetControlMessageProtocol）网际控制报文协议。它是TCP/IP协议簇的一个子协议，用于在IP主机、路由器之间传递控制消息。控制消息是指网络通不通、主机是否可达、路由是否可用等网络本身的消息。这些控制消息虽然并不传输用户数据，但是对于用户数据的传递起着重要的作用。ICMP使用IP的基本支持，就像它是一个更高级别的协议，但是，ICMP实际上是IP的…

全栈程序员-站长
2022年7月12日
21
查看Linux内核版本的命令_查看redhat版本命令

查看Linux内核版本的命令_查看redhat版本命令有朋友在使用Linux的过程中要查看Linux的内核版本号，这要怎么看呢？也有朋友文要怎么查看linux系统版本信息呢？下面和小编一起了解一下吧。一、查看linux内核版本号1：登录linux，在终端输入cat/proc/version2：登录linux，在终端输入uname-a即列出linux的内核版本号。二、查看linux系统版本信息1：登录到linux服务器执行lsb_rele…

全栈程序员-站长
2022年10月13日
3
静态测试和动态测试的区别在哪里?_软件测试中的静态测试

静态测试和动态测试的区别在哪里?_软件测试中的静态测试1.静态测试静态测试（statictesting）就是不实际运行被测软件，而只是静态地检查程序代码、界面或文档中可能存在的错误的过程。包括对代码测试、界面测试和文档测试三个方面：对于代码测试，主要测试代码是否符合相应的标准和规范。对于界面测试，主要测试软件的实际界面与需求中的说明是否相符。对于文档测试，主要测试用户手册和需求说明是否符合用户的实际需求。…

全栈程序员-站长
2025年7月29日
8
linux文本编辑器

linux文本编辑器linux常见服务一.文本编辑器vivim是vi增强版vim需要安装sudoapt-get-yinstallvimvim的三种工作模式1编辑模式命令模式=>编辑模式iaos按键作用i在光标当前位置插入文本a光标的下一个位置插入文本A当前行的行尾插入文本S…

全栈程序员-站长
2022年6月10日
53
pycharm如何调试代码_pycharm怎么分段运行代码

pycharm如何调试代码_pycharm怎么分段运行代码最全Pycharm教程（1）——定制外观　　最全Pycharm教程（2）——代码风格　　1、准备工作　　（1）Python版本为2.7或者更高版本　　（2）已经创建了一个python工程并且添加了内容，具体参考： GettingStartedtutorial　　2、第一步——运行代码　　打开之前编写的Solver.py文件，在编辑框中右键，选

全栈程序员-站长
2022年8月27日
6

发表回复

关注全栈程序员社区公众号