最大似然估计详解

最大似然估计详解&nbsp&nbsp最大似然估计是建立在最大似然原理的基础之上。最大似然原理的直观理解是:设一个随机试验有若干个可能的结果A1,A2,…,An,在一次试验中,结果Ak出现,则一般认为实验对Ak的出现最有利,即Ak出现的概率较大。这里用到了”概率最大的事件最可能出现”的直观想法,然后对Ak出现的概率公式求极大值,这样便可解未知参数。下面用一个例子说明最大似然估计的思想方法。&nbsp&nbsp假设一个

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

1.引入概念

  最大似然估计是建立在最大似然原理的基础之上。最大似然原理的直观理解是:设一个随机试验有若干个可能的结果 A1,A2,...,An ,在一次试验中,结果 Ak 出现,则一般认为实验对 Ak 的出现最有利,即 Ak 出现的概率较大。这里用到了”概率最大的事件最可能出现”的直观想法,然后对 Ak 出现的概率公式求极大值,这样便可解未知参数。下面用一个例子说明最大似然估计的思想方法。

  假设一个服从离散型分布的总体X,不妨设 XB(4,p) ,其中参数 p 未知.现抽取容量为3的样本,

X1,X2,X3
,如果出现的样本观测值为1,2,1,此时 p 的取值如何估计比较合理?注:

B(n,p)
为二项分布,二项分布指每一次实验只有0和1两个结果,其中 n 表示实验次数,

p
表示每次结果为1的概率,概率求解公式为:
     P(x=k)=Cknpk(1p)nk   (1.1)

  考虑这样一个问题,为什么样本结果是1,2,1,而不是另外一组 x1,x2,x3 呢?设事件 A={
X1=1,X2=2,X3=1}
,事件 B={
X1=x1,X2=x2,X3=x3}
,应用概率论的思想,大概率事件发生的可能性比小概率事件发生的可能性要大,即A发生的概率较大,套用公式1.1可以得出:
   P(A)=C14p(1p)3C24p2(1p)2C14p(1p)3=96p4(1p)8

应该让P(A)的取值应该尽可能大。对P(A)进行求导取极值可知,当p=1/3时,P(A)取到最大值,所有有理由认为p=1/3有利于事件A发生,所有p应该取值为1/3比较合理。

2.给出似然函数定义

  设 X1,X2,...,Xn 为来自总体 X 的简单随机样本,

x1,x2,...,xn
为样本观测值.称

L(θ)=i=1np(xi,θ)



为参数

θ
的似然函数。其中,当总体

X
为离散型随机变量时,



p(xi,θ)

表示X的分布列

P{
X=xi}=p(xi,θ)

;当总体

X
为连续性型随机变量时,



p(xi,θ)

表示

X
的密度函数



f(x,θ)



xi
处的取值

f(xi,θ)=p(xi,θ)

  参数 θ 的似然函数 L(θ) 实际上就是样本 X1,X2,...,Xn 恰好取观察值 x1,x2,...,xn() 的概率。如果总体 X 为离散型随机变量时,


L(θ)=P{X1=x1,X2=x2,...,Xn=xn}=P{X1=x1}P{X2=x2}...P{Xn=xn}=

i=1np(xi,θ)



如果总体

X
为连续性型随机变量,由于当



Δxi

非常小时,



P{
xiΔxi2<Xi<xi+Δxi2}=P{
xiΔxi2<X<xi+Δxi2}=xi+Δxi2xiΔxi2f(x,θ)dx
f(xi,θ)Δxi

于是

P{
x1Δx12<X1<x1+Δx12,x2Δx22<X2<x2+Δx22,...,xnΔxn2<Xn
<xn+Δxn2}=

i=1nP{
xiΔxi2<Xi<xi+Δxi2}i=1nf(xi,θ)Δxi=L(θ)i=1nΔxi

注意我们求的是样本落在区间 [xiΔxi,xi+Δxi] 的概率,而不是样本落在点 xi 的概率,现在我们求出了落在区间的概率为

L(θ)i=1nΔxi


又该区间的概率应该近视等于 P{
X=xi}Δxi
,即用点 xi 的发生概率代表区间平均概率密度
,所以

L(θ)
代表的是一组点对应的概率的乘积,即样本

X1,X2,...,Xn
落在观测值

x1,x2,...,xn
附近的概率。

3.最大似然估计

  设

L(θ)=i=1np(xi,θ)

为参数

θ
的似然函数,若存在一个只与样本观察值

x1,x2,...,xn
有关的实数

θ^(x1,x2,...,xn),使


    

L(θ^)=maxL(θ)


则称

θ^(x1,x2,...,xn)
为参数

θ
的最大似然估计值,称

θ^(X1,X2,...,Xn)
为参数

θ
的最大估计量。
注意 θ^(x1,x2,...,xn) 仅仅是一个实数值,后面带的 (x1,x2,...,xn) 表示这个值的取值与它们有关。

  由上可知,所谓最大似然估计是指通过求似然函数

L(θ)
的最大(或极大)值点来估计参数

θ
的一种方法。
另外,最大似然估计对总体中未知参数的个数没有要求,可以求一个未知参数的最大似然估计,也可以一次求多个未知参数的最大似然估计,这个通过对多个未知参数求偏导来实现,因为多变量极值就是偏导运算。需要注意的是,似然函数 L(θ) 不一定有极大值点,但是未必没有最大值点,所以对于有些问题,求导求极大值可能会失效,这时需要考虑边界点。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/222948.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Java实现并查集

    Java实现并查集喝杯 82 年的 Java 压压惊这次需要介绍的就是并查集并查集的简单应用就是连通图 网络通信连接等等总之很重要那么先说一下这次的算法是 1 union find 简单并查集 2 quick union 优化的并查集 3 加权值 quick union 处理了 2 的最坏情况 4 路径压缩加权值 quick union 如果只是想要一下算法 你可以直接跳到最后看第 4 个算法接下来 我

    2025年6月1日
    0
  • JVM垃圾回收机制【简单介绍】[通俗易懂]

    JVM垃圾回收机制【简单介绍】[通俗易懂]Java虚拟机(JVM)垃圾回收机制JVM中的垃圾回收计数是采用的一种自适应的技术(可以通过其工作方式将它“啰嗦地”称为:自适的、分代的、停止-复制、标记-清扫式垃圾回收器)在讲Java虚拟机的自适应回收机制前,有必要说一下其他比较单纯的垃圾回收机制,然后会比较容易地理解JVM的垃圾回收:1、引用计数一种简单但速度很慢的垃圾回收计数。​ 每个对象都含有一个引用计数器,当有引用连接至对…

    2022年6月8日
    42
  • 使用Python暴力激活成功教程密码

    使用Python暴力激活成功教程密码由于业务需求,今天项目对接了百度云智能的风控系统,注册和登陆保护,想来测试一下性能,用python写了一个脚本,暴力激活成功教程密码,看看会不会触发风控一、首先在本地新建了一个数据库,保存已经试错过的密码CREATETABLE`test`.`pwd`(`id`int(10)NOTNULLAUTO_INCREMENT,`passwod`varchar(20)CHARACTERSETutf8COLLATEutf8_general_ciNOTNULLDEFAULT’…

    2022年8月22日
    6
  • Oracle 创建用户及模式

    Oracle 创建用户及模式Oracle创建用户及模式1.简言2.创建表空间3.创建用户与上面创建的文件形成映射关系4.添加权限1.简言Oracle创建数据库与用户一般一一对应,准确的说可以Oracle中的Schema相当于MySQL中的数据库.Oracle不支持创建自定义模式的,想要创建模式的话只能新建一个用户,每个用户会有一个默认的和用户名相同的模式.Oracle默认已有两个建好的用户:system和sys,system有创建其他用户的权限.先看一看整体命令:

    2022年5月19日
    31
  • matlab中imfilter函数是什么意思_matlab中bwlabel函数

    matlab中imfilter函数是什么意思_matlab中bwlabel函数Matlab函数imfill简介函数功能:该函数用于填充图像区域和“空洞”。语法格式:BW2=imfill(BW)这种格式将一张二值图像显示在屏幕上,允许用户使用鼠标在图像上点几个点,这几个点围成的区域即要填充的区域。要以这种交互方式操作,BW必须是一个二维的图像。用户可以通过按Backspace键或者Delete键来取消之前选择的区域;通过shift+鼠标左键单击或者鼠…

    2022年9月13日
    0
  • 一致性(Consistency),可用性(Avilable),分区容错性(Tolerance of network Partition)

    一致性(Consistency),可用性(Avilable),分区容错性(Tolerance of network Partition)网络摘抄理解:一致性:读操作总是能读取到之前完成的写操作结果,满足这个条件的系统称为强一致系统,这里的“之前”一般对同一个客户端而言;可用性:读写操作在单台机器发生故障的情况下仍然能够正常执行,而不需要等待发生故障的机器重启或者其上的服务迁移到其他机器;分区可容忍性:机器故障、网络故障、机房停电等异常情况下仍然能够满足一致性和可用性。自己的理解:一致性:如下图1中所示,Clie

    2022年7月25日
    18

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号