最大熵模型中的对数似然函数的解释

最大熵模型中的对数似然函数的解释最大熵模型中的对数似然函数的解释最近在学习最大熵模型 看到极大似然估计这部分 没有看明白条件概率分布 p y x p y x p y x 的对数似然函数 上网查了很多资料都没有一个合理的解释 基本直接给出对数似然函数的一般形式 Lp xp x p x Lp xp x p x L overline p prod x p x overline p x

最大熵模型中的对数似然函数的解释

最近在学习最大熵模型,看到极大似然估计这部分,没有看明白条件概率分布 p ( y ∣ x ) p(y|x) p(yx)的对数似然函数。上网查了很多资料都没有一个合理的解释。基本直接给出对数似然函数的一般形式:
L p ‾ = ∏ x p ( x ) p ‾ ( x ) . L_{\overline{p}}=\prod_{x} p(x)^{\overline{p}(x)}. Lp=xp(x)p(x).
其实并没有解决问题。为了方便以后其他人的学习和理解,我结合自己的理解给出完整的解释。
其实第一眼之所以不理解,因为这是最大似然函数的另外一种形式。一般书上描述的最大似然函数的一般形式是各个样本集 X X X中各个样本的联合概率:
L ( x 1 , x 2 , . . . , x n ; θ ) = ∏ i = 1 n p ( x i ; θ ) . L(x_1,x_2,…,x_n;\theta)=\prod_{i=1}^{n} p(x_i;\theta). L(x1,x2,...,xn;θ)=i=1np(xi;θ).
其实这个公式和上式是等价的。 x 1 , x 2 , . . . , x n x_1,x_2,…,x_n x1,x2,...,xn是样本具体观测值。随机变量 X X X是离散的,所以它的取值范围是一个集合,假设样本集的大小为 n n n X X X的取值有 k k k个,分别是 v 1 , v 2 , . . . , v k v_1,v_2,…,v_k v1,v2,...,vk。用 C ( X = v i C(X=v_i C(X=vi)表示在观测值中样本 v i v_i vi出现的频数。所以 L ( x 1 , x 2 , . . . , x n ; θ ) L(x_1,x_2,…,x_n;\theta) L(x1,x2,...,xn;θ)可以表示为:
L ( x 1 , x 2 , . . . , x n ; θ ) = ∏ i = 1 k p ( v i ; θ ) C ( X = v i ) . L(x_1,x_2,…,x_n;\theta)=\prod_{i=1}^{k} p(v_i;\theta)^{C(X=v_i)}. L(x1,x2,...,xn;θ)=i=1kp(vi;θ)C(X=vi).
对等式两边同时开 n n n次方,可得
L ( x 1 , x 2 , . . . , x n ; θ ) 1 n = ∏ i = 1 k p ( v i ; θ ) C ( X = v i ) n . L(x_1,x_2,…,x_n;\theta)^{\frac{1}{n}}=\prod_{i=1}^{k} p(v_i;\theta)^{\frac{C(X=v_i)}{n}}. L(x1,x2,...,xn;θ)n1=i=1kp(vi;θ)nC(X=vi).
因为经验概率 p ‾ ( x ) = C ( X = v i ) n \overline{p}(x)=\frac{C(X=v_i)}{n} p(x)=nC(X=vi),所以简写得到:
L ( x 1 , x 2 , . . . , x n ; θ ) 1 n = ∏ x p ( x ; θ ) p ‾ ( x ) . L(x_1,x_2,…,x_n;\theta)^{\frac{1}{n}}=\prod_{x} p(x;\theta)^{\overline{p}(x)}. L(x1,x2,...,xn;θ)n1=xp(x;θ)p(x).
很明显对 L ( x 1 , x 2 , . . . , x n ; θ ) L(x_1,x_2,…,x_n;\theta) L(x1,x2,...,xn;θ)求最大值和对 L ( x 1 , x 2 , . . . , x n ; θ ) 1 n L(x_1,x_2,…,x_n;\theta)^{\frac{1}{n}} L(x1,x2,...,xn;θ)n1求最大值的优化的结果是一样的。整理上式所以最终的最大似然函数可以表示为:
L ( x ; θ ) = ∏ x p ( x : θ ) p ‾ ( x ) . L(x;\theta)=\prod_{x} p(x:\theta)^{\overline{p}(x)}. L(x;θ)=xp(x:θ)p(x).
忽略 θ \theta θ,更一般的公式就是本文的第一个公式。结合公式一,参考v_JULY_v博客中的最大熵模型中的数学推导(http://m.blog.csdn.net/v_july_v/article/details/),可得到联合概率密度的似然函数,即最大熵中的对数似然函数:
L p ‾ = log ⁡ ∏ x , y p ( x , y ) p ‾ ( x , y ) = ∑ x , y p ‾ ( x , y ) log ⁡ p ( x , y ) = ∑ x , y p ‾ ( x , y ) log ⁡ [ p ‾ ( x ) p ( y ∣ x ) ] = ∑ x , y p ‾ ( x , y ) log ⁡ p ( y ∣ x ) + ∑ x , y p ‾ ( x , y ) log ⁡ p ‾ ( x ) \begin{aligned} L_{\overline{p}} &=\log\prod_{x,y} p(x,y)^{\overline{p}(x,y)} \\ &=\sum_{x,y}{\overline{p}(x,y)}\log p(x,y)\\ &=\sum_{x,y}{\overline{p}(x,y)}\log [{\overline{p}(x)}p(y|x)] \\ &=\sum_{x,y}{\overline{p}(x,y)}\log p(y|x)+\sum_{x,y}{\overline{p}(x,y)}\log {\overline{p}(x)} \end{aligned} Lp=logx,yp(x,y)p(x,y)=x,yp(x,y)logp(x,y)=x,yp(x,y)log[p(x)p(yx)]=x,yp(x,y)logp(yx)+x,yp(x,y)logp(x)
上述公式第二项是一个常数项(都是样本的经验概率),一旦样本集确定,就是个常数,可以忽略。所以最终的对数似然函数为:
L p ‾ = ∑ x , y p ‾ ( x , y ) log ⁡ p ( y ∣ x ) . L_{\overline{p}}=\sum_{x,y}{\overline{p}(x,y)}\log p(y|x). Lp=x,yp(x,y)logp(yx).
上式就是最大熵模型中用到的对数似然函数。
















版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/206236.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 下午4:09
下一篇 2026年3月19日 下午4:09


相关推荐

  • TLD(Tracking-Learning-Detection)一种目标跟踪算法

    TLD(Tracking-Learning-Detection)一种目标跟踪算法原文:http://blog.csdn.net/mysniper11/article/details/8726649视频介绍网址:http://www.cvchina.info/2011/04/05

    2022年8月5日
    9
  • Decorator 单一职责模式[通俗易懂]

    Decorator 单一职责模式[通俗易懂]单一职责模式动机模式定义案例结构要点总结笔记动机在某些情况下我们可能会“过度地使用继承来扩展对象的功能”,由于继承为类型引入的静态特质,使得这种扩展方式缺乏灵活性;并且随着子类的增多(扩展功能的增多),各种子类的组合(扩展功能的组合)会导致更多的子类的膨胀如何使“对象功能的扩展”能够根据需要来动态实现?同时避免”扩展功能的增多“带来的子类膨胀问题?从而使得任何任何”功能扩展变化“所导致的影响将为最低?模式定义动态(组合)地给一个对象增加一些额外的职责。就增加功能而言Decorator模式比生成子类

    2022年8月9日
    5
  • ANT安装(亲测可用)「建议收藏」

    ANT安装(亲测可用)「建议收藏」ANT在win10x64系统上进行安装,安装步骤如下。1、打开官网2、选择要下载版本3、配置环境变量在path里配置ant安装地址\binant安装地址\lib4、在cmd里验证:Linux上安装ANT:1、下载apache-ant-1.10.5-bin.tar.gz到home目录2、cpapache-ant-1.10.5-bin.tar.gz/usr/local3、cd/usr/local4、tar-zxvfapache-ant-1.10.5-bin.ta

    2022年7月18日
    20
  • 小米BL不解锁刷机「建议收藏」

    小米BL不解锁刷机「建议收藏」关于小米NOTE顶配近期解锁的问题中发现还有很多人不会用9008模式刷机,现出个简单教程方便米粉们救砖。硬件:小米NOTE顶配手机win10系统的电脑手机与电脑相连的数据线软件:老版本的miflash(版本号:2015.10.28。0)最新版本miflash最新解BL锁工具或者小米助手(用来装驱动)开发版6.17及以前的线刷包随便下一个一个你最终想刷的版本(推荐最新稳定版)…

    2022年4月30日
    172
  • 送别林俊旸,阿里千问“急行军”

    送别林俊旸,阿里千问“急行军”

    2026年3月13日
    2
  • vue项目中,页面刷新回到页面顶部的方法

    vue项目中,页面刷新回到页面顶部的方法在 Vue 项目中 访问过的页面 在滚动到某个位置后 再次刷新页面 页面仍处于上次访问过的位置 为了想页面回到顶部 只需要对路由进行修改 在 router 下 index js 中 exportdefaul routes scrollBehavi to from savedPositio return x 0

    2026年3月16日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号