为什么L1正则化导致稀疏解「建议收藏」

一、从数据先验的角度首先你要知道L1范式和L2范式是怎么来的,然后是为什么要把L1或者L2正则项加到代价函数中去.L1,L2范式来自于对数据的先验知识.如果你认为,你现有的数据来自于高斯分布,那么就应该在代价函数中加入数据先验P(x),一般由于推导和计算方便会加入对数似然,也就是log(P(x)),然后再去优化,这样最终的结果是,由于你的模型参数考虑了数据先验,模型效果当然就更好.哦对了,如果你…

大家好,又见面了,我是你们的朋友全栈君。

一、从数据先验的角度
首先你要知道L1范式和L2范式是怎么来的,然后是为什么要把L1或者L2正则项加到代价函数中去.L1,L2范式来自于对数据的先验知识.如果你认为,你现有的数据来自于高斯分布,那么就应该在代价函数中加入数据先验P(x),一般由于推导和计算方便会加入对数似然,也就是log(P(x)),然后再去优化,这样最终的结果是,由于你的模型参数考虑了数据先验,模型效果当然就更好.哦对了,如果你去看看高斯分布的概率密度函数P(x),你会发现取对数后的log(P(x))就剩下一个平方项了,这就是L2范式的由来–高斯先验.同样,如果你认为你的数据是稀疏的,不妨就认为它来自某种laplace分布.不知你是否见过laplace分布的概率密度函数,我贴出一张维基上的图
在这里插入图片描述

作者:amnesia
链接:https://www.zhihu.com/question/37096933/answer/70668476
来源:知乎

二、从数据计算的角度

但为什么L1正则会产生稀疏解呢?这里利用公式进行解释。
假设只有一个参数为w,损失函数为L(w),分别加上L1正则项和L2正则项后有:
在这里插入图片描述
假设L(w)在0处的倒数为d0,即
在这里插入图片描述

则可以推导使用L1正则和L2正则时的导数。
引入L2正则项,在0处的导数
在这里插入图片描述
引入L1正则项,在0处的导数
在这里插入图片描述

可见,引入L2正则时,代价函数在0处的导数仍是d0,无变化。而引入L1正则后,代价函数在0处的导数有一个突变。从d0+λ到d0−λ,若d0+λ和d0−λ异号,则在0处会是一个极小值点。因此,优化时,很可能优化到该极小值点上,即w=0处。
这里只解释了有一个参数的情况,如果有更多的参数,也是类似的。因此,用L1正则更容易产生稀疏解。

来自https://blog.csdn.net/f156207495/article/details/82794151?utm_source=copy

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/128768.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 调用企业微信API发送文本,图片,文件消息[通俗易懂]

    调用企业微信API发送文本,图片,文件消息[通俗易懂]简单封装一个调用企业微信API程序发送文本,图片,及文件消息。

    2022年10月2日
    0
  • 物联网架构在现有互联网_物联网行业发展现状及整体体系结构

    物联网架构在现有互联网_物联网行业发展现状及整体体系结构1.说明  这一小节,也不具体讲些什么了。最近一个半月都在摸鱼,没什么事做,慢慢学习着SpringBoot和SpringCloud。下面两张图是进行的一次小结。以后随着深入,整个架构肯定是会变的。现在记录一下,每个项目成长都是有一个过程的。…

    2022年9月18日
    0
  • vue devtools如何使用调试_千牛提示opendevtools

    vue devtools如何使用调试_千牛提示opendevtoolsWriteByMonkeyfly以下内容均为原创,如需转载请注明出处。前提今天准备开始学vue.js了,不为别的,只是因为我女朋友毕设项目的前端是使用vue开发的,而我作为一个前端开发却无能为力,你说可不可笑。她需要一个会vue的前端帮她做界面,而我虽然身为一个前端开发,但是并不会vue,所以作为男朋友的我本身就很自责。现阶段的情况是:我只是知道有这些框架,再加上公司的项…

    2022年10月6日
    0
  • stm32直流电机控制—PID算法篇

    stm32直流电机控制—PID算法篇stm32直流电机控制—PID算法篇提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章Python机器学习入门之pandas的使用**加粗样式*提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录stm32直流电机控制—PID算法篇前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了

    2022年5月7日
    46
  • c#窗体应用程序怎么保存_importedfile用什么打开

    c#窗体应用程序怎么保存_importedfile用什么打开选择保存文件时先将文件名生成传入,点击OK和取消使用FileOK委托。///<summary>///另存文件对话框///</summary>///<paramname=”fileName”>想命名的文件名</param>///<returns>&lt…

    2022年10月8日
    0
  • 图片转换成html代码_java html转图片

    图片转换成html代码_java html转图片1.页面上的图片,转换成base64格式,可以通过canvas的toDataURL例子:给定图片的url将图片转换为base64varimageSrc="../images/

    2022年8月6日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号