最大似然函数

最大似然函数似然函数似然函数在给定参数的条件下就是观测到一组数据概率密度函数 连续分布 或概率聚集函数 离散分布 在统计学中 似然函数 likelihoodfu 通常简写为 likelihood 似然 是一个非常重要的内容 在非正式场合似然和概率 Probability 几乎是一对同义词 但是在统计学中似然和概率却是两个不同的概念 概率是在特定环境下某件事情发生的可能性 也就是结果没有产生之前依据环

似然函数

似然函数在给定参数的条件下就是观测到一组数据概率密度函数(连续分布)或概率聚集函数(离散分布)

在统计学中,似然函数(likelihood function,通常简写为likelihood,似然)是一个非常重要的内容,在非正式场合似然和概率(Probability)几乎是一对同义词,但是在统计学中似然和概率却是两个不同的概念。概率是在特定环境下某件事情发生的可能性,也就是结果没有产生之前依据环境所对应的参数来预测某件事情发生的可能性,比如抛硬币,抛之前我们不知道最后是哪一面朝上,但是根据硬币的性质我们可以推测任何一面朝上的可能性均为50%,这个概率只有在抛硬币之前才是有意义的,抛完硬币后的结果便是确定的;而似然刚好相反,是在确定的结果下去推测产生这个结果的可能环境(参数),还是抛硬币的例子,假设我们随机抛掷一枚硬币1,000次,结果500次人头朝上,500次数字朝上(实际情况一般不会这么理想,这里只是举个例子),我们很容易判断这是一枚标准的硬币,两面朝上的概率均为50%,这个过程就是我们根据结果来判断这个事情本身的性质(参数),也就是似然。

最大似然估计原理

最大似然估计是一种统计方法,最大似然估计的思想就是最大似然函数取什么样的参数才能使我们观测到目前这组数据的概率是最大的。而似然描述的是结果已知的情况下,该事件在不同条件下发生的可能性,似然函数的值越大说明该事件在对应的条件下发生的可能性越大。

最大似然原理解决的问题

已知该事件的结果,以及事件的概率密度函数(连续分布)或概率聚集函数(离散分布)。求此函数的参数。(在此参数下,该事件发生的可能性最大)。

举例说明

离散分布,离散有限参数空间

考虑一个抛硬币的例子。假设这个硬币正面跟反面轻重不同。我们把这个硬币抛80次(即,我们获取一个采样 x1=H,x2=T,,x80=T 并把正面的次数记下来,正面记为H,反面记为T)。并把抛出一个正面的概率记为p,抛出一个反面的概率记为1 − p(因此,这裡的p即相当于上边的θ)。假设我们抛出了49个正面,31个反面,即49次H,31次T。假设这个硬币是我们从一个装了三个硬币的盒子里头取出的。这三个硬币抛出正面的概率分别为p = 1 / 3, p = 1 / 2, p = 2 / 3.这些硬币没有标记,所以我们无法知道哪个是哪个。使用最大似然估计,通过这些试验数据(即采样数据),我们可以计算出哪个硬币的可能性最大。这个似然函数取以下三个值中的一个:
P(H=49, T=31 p=1/3)=(8049)(1/3)49(11/3)310.000
P(H=49, T=31 p=1/2)=(8049)(1/2)49(11/2)310.012
P(H=49, T=31 p=2/3)=(8049)(2/3)49(12/3)310.054


我们可以看到当 pˆ=2/3 时,似然函数取得最大值。这就是p的最大似然估计。

连续分布

现在假设例子1中的盒子中有无数个硬币,对于 0p1 中的任何一个p, 都有一个抛出正面概率为p的硬币对应,我们来求其似然函数的最大值:
lik(θ)=fD(H=49,T=80-49p)=(8049)p49(1p)31

其中 0p1 . 我们可以使用微分法来求最值。方程两边同时对p取微分,并使其为零。
0=ddp((8049)p49(1p)31)

=49p48(1p)3131p49(1p)30

=p48(1p)30[49(1p)31p]

其解为p = 0, p = 1,以及p = 49 / 80.使可能性最大的解显然是p = 49 / 80(因为p = 0和p = 1这两个解会使可能性为零)。因此我们说最大似然估计值为 pˆ=49/80 .

连续分布,连续参数空间

=μ(log(12πσ2)n2ni=1(xix¯)2+n(x¯μ)22σ2)

=02n(x¯μ)2σ2
这个方程的解是 μˆ=x¯=ni=1xi/n .这的确是这个函数的最大值,因为它是μ里头惟一的一阶导数等于零的点并且二阶导数严格小于零。
同理,我们对σ求导,并使其为零。
0=σlog((12πσ2)n2eni=1(xix¯)2+n(x¯μ)22σ2)
=σ(n2log(12πσ2)ni=1(xix¯)2+n(x¯μ)22σ2)
=nσ+ni=1(xix¯)2+n(x¯μ)2σ3
这个方程的解是 σˆ2=ni=1(xiμˆ)2/n .





因此,其关于 θ=(μ,σ2 )的最大似然估计为:

θˆ=(μˆ,σˆ2)=(x¯,ni=1(xix¯)2/n).

性质

泛函不变性(Functional invariance)

如果 θˆ 是θ的一个最大似然估计,那么α = g(θ)的最大似然估计是 αˆ=g(θˆ) .函数g无需是一个一一映射。请参见George Casella与Roger L. Berger所著的Statistical Inference定理Theorem 7.2.10的证明。(中国大陆出版的大部分教材上也可以找到这个证明。)

渐近线行为

偏差

最大似然估计的偏差是非常重要的。考虑这样一个例子,标有1到n的n张票放在一个盒子中。从盒子中随机抽取票。如果n是未知的话,那么n的最大似然估计值就是抽出的票上标有的n,尽管其期望值的只有(n + 1) / 2.为了估计出最高的n值,我们能确定的只能是n值不小于抽出来的票上的值。

参见

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/232454.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • sencha touch 在线实战培训 第一期 第五节

    sencha touch 在线实战培训 第一期 第五节

    2021年8月27日
    101
  • era教程_erdas2015使用教程

    era教程_erdas2015使用教程SpringCloudEureka配置文件详解本篇内容用来说明Eureka常用配置的含义。以下配置都是以eureka.server开头:参数 描述 备注 eureka.server.eviction-interval-timer-in-ms server清理无效节点的时间间隔 默认60秒 eureka.server.enable-self-preservation 是否开启自我保护,默认true truefalse eureka.ser..

    2022年8月21日
    9
  • 如何使用maven搭建web项目「建议收藏」

    博客园注册了有二十多天了,还没有写过博客,今天就发一篇,也便于后面查找笔记。我个人已经做了几年的javaweb开发了,由于所在的公司是业务型公司,用的都是一些老旧的稳定技术,很少接触到稍微新点的内

    2022年2月16日
    46
  • LAMP配置点滴[通俗易懂]

    LAMP配置点滴[通俗易懂]第一次配编译安装LAMP足足弄了两天,各种折腾。参考http://www.lamphowto.com/,其他的可以看源码的README,或官方文档其中让浏览器自动提示语法错误的方法是改php.ini:装好后打开网页:localhost/index.html居然显示:TherequestedURL/index.htmlwasnotfoundon

    2022年5月10日
    40
  • linux文件属性644到755,linux系统文件夹数字权限设置详解644、755、777

    linux文件属性644到755,linux系统文件夹数字权限设置详解644、755、777linux系统文件夹数字权限设置详解644、755、777,左至右,第一位数字代表文件所有者的权限,第二位数字代表同组用户的权限,第三位数字代表其他用户的权限。而具体的权限是由数字来表示的,读取的权限等于4,用r表示;写入的权限等于2,用w表示;执行的权限等于1,用x表示;通过4、2、1的组合,得到以下几种权限:0(没有权限);4(读取权限);5(4+1|读取+执行);6(4+2|读取+…

    2022年6月18日
    43
  • linux 主机支持远程唤醒_LINUX 远程开机

    linux 主机支持远程唤醒_LINUX 远程开机linux远程开机1、主机bios设置支持lan启动2、查看机器是否支持服务器远程唤醒ethtooleth0Settingsforeth0:Supportedports:[TPMII]Supportedlinkmodes:10baseT/Half10baseT/Full100baseT/Half100baseT/FullSupportsauto-negotiat…

    2022年6月2日
    38

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号