[经验分享] 【统计小百科】你知道AIC准则么?[通俗易懂]

[经验分享] 【统计小百科】你知道AIC准则么?[通俗易懂]2019独角兽企业重金招聘Python工程师标准>>>…

大家好,又见面了,我是你们的朋友全栈君。

  AIC信息准则即Akaike information criterion,是衡量统计模型拟合优良性的一种标准,又由与它为日本统计学家赤池弘次创立和发展的,因此又称赤池信息量准则。它建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。

       在一般的情况下,AIC可以表示为: AIC=2k-2ln(L),其中:k是参数的数量,L是似然函数。 假设条件是模型的误差服从独立正态分布。 让n为观察数,RSS为剩余平方和,那么AIC变为: AIC=2k+nln(RSS/n)。

       增加自由参数的数目提高了拟合的优良性,AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合(Overfitting)的情况。所以优先考虑的模型应是AIC值最小的那一个。赤池信息准则的方法是寻找可以最好地解释数据但包含最少自由参数的模型。

       经常地,对一堆数据进行建模的时候,特别是分类和回归模型,我们有很多的变量可供使用,选择不同的变量组合可以得到不同的模型,例如我们有5个变量,2的5次方,我们将有32个变量组合,可以训练出32个模型。但是哪个模型更加的好呢?目前常用有如下方法:
AIC=-2 ln(L) + 2 k  中文名字:赤池信息量 akaike information criterion
BIC=-2 ln(L) + ln(n)*k 中文名字:贝叶斯信息量 bayesian information criterion
HQ=-2 ln(L) + ln(ln(n))*k  hannan-quinn criterion

       构造这些统计量所遵循的统计思想是一致的,就是在考虑拟合残差的同时,依自变量个数施加“惩罚”。但,倘若因此就说它们是同一个指标,恐怕还是有些不妥,毕竟“惩罚”的力度还是不尽相同的。此外,这些信息量的用途不仅限于选择模型,还能用于选取合适的变换等等。而在那些时候,这些信息量又是另一个模样,也就是说它们有许多变体。因此,它们也被称为AIC准则、BIC准则等等。它们中的每一个体现的都是一系列的标准,而非单独的一个简单式子。

       注意这些规则只是刻画了用某个模型之后相对“真实模型”的信息损失(因为不知道真正的模型是什么样子,所以训练得到的所有模型都只是真实模型的一个近似模型),所以用这些规则不能说明某个模型的精确度,即三个模型A, B, C,在通过这些规则计算后,我们知道B模型是三个模型中最好的,但是不能保证B这个模型就能够很好地刻画数据,因为很有可能这三个模型都是非常糟糕的,B只是烂苹果中的相对好的苹果而已。

       这些规则理论上是比较漂亮的,但是实际在模型选择中应用起来还是有些困难的,例如上面我们说了5个变量就有32个变量组合,如果是10个变量呢?2的10次方,我们不可能对所有这些模型进行一一验证AIC, BIC,HQ规则来选择模型,工作量太大。

 

 

因为AIC和BIC一般为负值 也就是绝对值越大 负得越多越好 你可以查一下AIC和BIC的计算公式 一般都是分为两个部分 一部分是度量拟合效果,另一部分是对参数个数增加的惩罚

转载于:https://my.oschina.net/u/1161889/blog/1549141

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/142463.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 图解转置卷积原理[通俗易懂]

    图解转置卷积原理[通俗易懂]声明:本文大部分搬运自【机器学习】详解转置卷积(TransposeConvolution)感谢博主花与人间事同,本人只是在博主原创文章上做补充以及添加一些自己的理解。1转置卷积的背景通常,对图像进行多次卷积运算后,特征图的尺寸会不断缩小。而对于某些特定任务(如图像分割和图像生成等),需将图像恢复到原尺寸再操作。这个将图像由小分辨率映射到大分辨率的尺寸恢复操作,称为上采样(Upsample),如下图所示:上采样方法有很多,详见【图像处理】详解最近邻插值、线性插值、双线性插值、双三次插值

    2022年6月21日
    31
  • 微服务架构基础之API网关

    微服务架构基础之API网关

    2021年6月12日
    110
  • Android 加载串口通信读取信息时 AndroidStudio loadLibrary失败「建议收藏」

    Android 加载串口通信读取信息时 AndroidStudio loadLibrary失败「建议收藏」static{ System.loadLibrary(“serial_port”); }今天想连接串口做一个新功能但是连接串口加载库的时候总是找不到serial_port库1:项目结构是这样的库文件不多说github很多Android.mk##Copyright2009CedricPriscal##LicensedundertheApacheLicense,Version2.0(the”License”);#you…

    2022年7月15日
    21
  • 神经网络之反向传播算法实现

    1神经网络模型以下面神经网络模型为例,说明神经网络中正向传播和反向传播过程及代码实现1.1正向传播(1)输入层神经元$i_1,i_2$,输入层到隐藏层处理过程$$HiddenNeth_1

    2021年12月30日
    35
  • mongovue mysql_mongoVUE的增删改查操作使用说明(转)「建议收藏」

    mongovue mysql_mongoVUE的增删改查操作使用说明(转)「建议收藏」1、精确查询1)右键点击集合名,再左键点击Find或者直接点击工具栏上的Find2)查询界面,包括四个区域{Find}区,查询条件格式{“sendId”:”000101″}表示查询sendId=000101的记录,(注:MongoDB区分大小写,写成{“sendid”:”000101″}会查询不到)查询条件包含and时,格式为:{“sendId”:”000101″,”operParam5″:”v…

    2022年8月21日
    10
  • win7系统中安装苹果 Mountain Lion 双系统的图文教程

    win7系统中安装苹果 Mountain Lion 双系统的图文教程如果对 PC 机安装黑苹果有兴趣的朋友 请详细观看本教程 以免带来不必要的麻烦 在安装苹果 MACOSX 双系统之前 确认 BIOS 可以开启 AHCI 必须 安装苹果 MACOSX 双系统步骤 A 工具准备 B 制作维护盘 C 分区并写入维护盘镜像 MacPED 安装 windows 版变色龙 E 变色龙引导制作完整安装盘 F 变色龙引导完整安装盘安装 Lion 系统 A

    2025年8月16日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号