最大似然函数

最大似然函数似然函数似然函数在给定参数的条件下就是观测到一组数据概率密度函数 连续分布 或概率聚集函数 离散分布 在统计学中 似然函数 likelihoodfu 通常简写为 likelihood 似然 是一个非常重要的内容 在非正式场合似然和概率 Probability 几乎是一对同义词 但是在统计学中似然和概率却是两个不同的概念 概率是在特定环境下某件事情发生的可能性 也就是结果没有产生之前依据环

似然函数

似然函数在给定参数的条件下就是观测到一组数据概率密度函数(连续分布)或概率聚集函数(离散分布)

在统计学中,似然函数(likelihood function,通常简写为likelihood,似然)是一个非常重要的内容,在非正式场合似然和概率(Probability)几乎是一对同义词,但是在统计学中似然和概率却是两个不同的概念。概率是在特定环境下某件事情发生的可能性,也就是结果没有产生之前依据环境所对应的参数来预测某件事情发生的可能性,比如抛硬币,抛之前我们不知道最后是哪一面朝上,但是根据硬币的性质我们可以推测任何一面朝上的可能性均为50%,这个概率只有在抛硬币之前才是有意义的,抛完硬币后的结果便是确定的;而似然刚好相反,是在确定的结果下去推测产生这个结果的可能环境(参数),还是抛硬币的例子,假设我们随机抛掷一枚硬币1,000次,结果500次人头朝上,500次数字朝上(实际情况一般不会这么理想,这里只是举个例子),我们很容易判断这是一枚标准的硬币,两面朝上的概率均为50%,这个过程就是我们根据结果来判断这个事情本身的性质(参数),也就是似然。

最大似然估计原理

最大似然估计是一种统计方法,最大似然估计的思想就是最大似然函数取什么样的参数才能使我们观测到目前这组数据的概率是最大的。而似然描述的是结果已知的情况下,该事件在不同条件下发生的可能性,似然函数的值越大说明该事件在对应的条件下发生的可能性越大。

最大似然原理解决的问题

已知该事件的结果,以及事件的概率密度函数(连续分布)或概率聚集函数(离散分布)。求此函数的参数。(在此参数下,该事件发生的可能性最大)。

举例说明

离散分布,离散有限参数空间

考虑一个抛硬币的例子。假设这个硬币正面跟反面轻重不同。我们把这个硬币抛80次(即,我们获取一个采样 x1=H,x2=T,,x80=T 并把正面的次数记下来,正面记为H,反面记为T)。并把抛出一个正面的概率记为p,抛出一个反面的概率记为1 − p(因此,这裡的p即相当于上边的θ)。假设我们抛出了49个正面,31个反面,即49次H,31次T。假设这个硬币是我们从一个装了三个硬币的盒子里头取出的。这三个硬币抛出正面的概率分别为p = 1 / 3, p = 1 / 2, p = 2 / 3.这些硬币没有标记,所以我们无法知道哪个是哪个。使用最大似然估计,通过这些试验数据(即采样数据),我们可以计算出哪个硬币的可能性最大。这个似然函数取以下三个值中的一个:
P(H=49, T=31 p=1/3)=(8049)(1/3)49(11/3)310.000
P(H=49, T=31 p=1/2)=(8049)(1/2)49(11/2)310.012
P(H=49, T=31 p=2/3)=(8049)(2/3)49(12/3)310.054


我们可以看到当 pˆ=2/3 时,似然函数取得最大值。这就是p的最大似然估计。

连续分布

现在假设例子1中的盒子中有无数个硬币,对于 0p1 中的任何一个p, 都有一个抛出正面概率为p的硬币对应,我们来求其似然函数的最大值:
lik(θ)=fD(H=49,T=80-49p)=(8049)p49(1p)31

其中 0p1 . 我们可以使用微分法来求最值。方程两边同时对p取微分,并使其为零。
0=ddp((8049)p49(1p)31)

=49p48(1p)3131p49(1p)30

=p48(1p)30[49(1p)31p]

其解为p = 0, p = 1,以及p = 49 / 80.使可能性最大的解显然是p = 49 / 80(因为p = 0和p = 1这两个解会使可能性为零)。因此我们说最大似然估计值为 pˆ=49/80 .

连续分布,连续参数空间

=μ(log(12πσ2)n2ni=1(xix¯)2+n(x¯μ)22σ2)

=02n(x¯μ)2σ2
这个方程的解是 μˆ=x¯=ni=1xi/n .这的确是这个函数的最大值,因为它是μ里头惟一的一阶导数等于零的点并且二阶导数严格小于零。
同理,我们对σ求导,并使其为零。
0=σlog((12πσ2)n2eni=1(xix¯)2+n(x¯μ)22σ2)
=σ(n2log(12πσ2)ni=1(xix¯)2+n(x¯μ)22σ2)
=nσ+ni=1(xix¯)2+n(x¯μ)2σ3
这个方程的解是 σˆ2=ni=1(xiμˆ)2/n .





因此,其关于 θ=(μ,σ2 )的最大似然估计为:

θˆ=(μˆ,σˆ2)=(x¯,ni=1(xix¯)2/n).

性质

泛函不变性(Functional invariance)

如果 θˆ 是θ的一个最大似然估计,那么α = g(θ)的最大似然估计是 αˆ=g(θˆ) .函数g无需是一个一一映射。请参见George Casella与Roger L. Berger所著的Statistical Inference定理Theorem 7.2.10的证明。(中国大陆出版的大部分教材上也可以找到这个证明。)

渐近线行为

偏差

最大似然估计的偏差是非常重要的。考虑这样一个例子,标有1到n的n张票放在一个盒子中。从盒子中随机抽取票。如果n是未知的话,那么n的最大似然估计值就是抽出的票上标有的n,尽管其期望值的只有(n + 1) / 2.为了估计出最高的n值,我们能确定的只能是n值不小于抽出来的票上的值。

参见

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/232454.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 根据eia/tia接线标准,简述双绞线的线序_rj45接线图

    根据eia/tia接线标准,简述双绞线的线序_rj45接线图今日看到一篇文章    〈巧识妙记双绞线〉原文:http://www.szerc.com/blog/more.asp?name=goodchun&id=3791 作者总结的两句口决真的很妙,不愧是工作在教育第一线的人民教师。以前我也自己写了个口诀,是“A绿B橙,中蓝尾褐,边白先中白后”现在看起来真实迂腐可陈。自己在大春老师的口诀上改了改,将双单、单双——双色在单位,单色在双位,即花线在前也总结进

    2025年12月14日
    4
  • 修改ligerui的display内容

    修改ligerui的display内容一般的 display 显示内容如下 display 手机号码 IMSI name imsi align left width 100 但是如果需要对内容进行操作后再显示 应该怎么样呢 可以使用如下的方式 render function 如 display 总流量 M name flowused align left widt

    2026年1月28日
    1
  • Snmp学习笔记

    Snmp学习笔记

    2021年12月1日
    46
  • 利用ffmpeg将H264解码为RGB

    利用ffmpeg将H264解码为RGB由于公司买到了一个不提供解码器的设备,我不得已还要做解码的工作。在网上找了一圈,H264解码比较方便的也就是ffmpeg一系列的函数库了,原本设备中也是用这套函数库解码,但厂家不给提供,没办法,只得自己搞了。

    2022年6月23日
    48
  • 常见分布式文件存储介绍、选型比较、架构设计

    常见分布式文件存储介绍、选型比较、架构设计Hello,我是瓜哥:之前在进行对接存储项目的时候,对公司内部使用的文件系统进行了梳理,当前公司内部使用的文件系统有GlusterFS,FastDFS等,由于文件系统在海量小文件和高并发之下性能急剧下降,性能遭遇瓶颈,因此打算建设分布式对象存储平台。下面对市面上比较流行的非结构化文件存储产品进行相关整理和比较。分布式文件存储的来源在这个数据爆炸的时代,产生的数据量不断地在攀升,从GB,…

    2022年6月10日
    48
  • Vue(3)webstorm代码格式规范设置与vue模板配置

    Vue(3)webstorm代码格式规范设置与vue模板配置编译器代码格式规范设置通常我们写代码时,代码缩进都是4个空格,但是在前端中,据全球投票统计,建议使用2个空格来进行代码缩进。首先我们打开webstorm中的设置,如果使用的是mac的同学直接使用c

    2022年7月30日
    68

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号