《PRML》学习笔记2.2——多项式分布和狄利克雷分布

《PRML》学习笔记2.2——多项式分布和狄利克雷分布  上回讲完了伯努利分布、二项分布和Beta分布,以及从最大似然估计的非参数化思想和引入共轭先验,使得参数变成一个变量,建模求解的参数化方法两方面介绍了求解模型参数的方法。没有读过的朋友可以参考:《PRML》学习笔记2.1——伯努利分布、二项分布和Beta分布,从贝叶斯观点出发  今天将为大家介绍两个更难理解的分布——多项式分布和狄利克雷分布。1.多项式变量和多项式分布  …

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

    上回讲完了伯努利分布、二项分布和Beta分布,以及从最大似然估计的非参数化思想和引入共轭先验,使得参数变成一个变量,建模求解的参数化方法两方面介绍了求解模型参数\mu的方法。没有读过的朋友可以参考:《PRML》学习笔记2.1——伯努利分布、二项分布和Beta分布,从贝叶斯观点出发

    今天将为大家介绍两个更难理解的分布——多项式分布和狄利克雷分布。

1.多项式变量和多项式分布

    伯努利分布的一个经典例子就是掷硬币,当你掷出去的时候,得到的结果只有正面朝上或者反面朝上两种可能,因此可以用p(x|\mu)=\mu^{x}\cdot(1-\mu)^{1-x}进行建模。概率密度的表达式中,x的取值只有两种情况——0或1,那么,这个建模方法就不适用于掷骰子了,毕竟骰子有6个面,对应着6种投掷结果。所以这时候就要将服从伯努利分布的变量进行扩展了。

    首先,使用一种方式来表达投掷骰子的结果,这里推荐的是”1-of-K”表示法,使用一个K维向量\boldsymbol{x}来表示状态,向量中一个元素x_k等于1,其余元素为0,用来表示发生的是第k中情况:

                                                                          \large \boldsymbol{x}=(0,0,0,1,0,0)^T                                                                                  (1)

    如果用参数\mu_k表示x_k=1的概率,那么\mathbf{x}的分布为:

                                                                          \large p(\boldsymbol{x}|\boldsymbol{\mu})=\prod_{k=1}^{K}\mu_k^{x_k}                                                                                        (2)

    因为\mu_k代表的是一种情况的概率,所以\mu_k满足\mu_k\ge0而且\sum_{k=1}^{K}\mu_k=1。可以看出,这是伯努利分布的一个多维上的推广,伯努利分布p(x|\mu)=\mu^{x}\cdot(1-\mu)^{1-x}也可以换成相同的形式表达:p(\boldsymbol{x}|\boldsymbol{\mu})=\mu_1^{x_1}\cdot\mu_2^{x_2}\boldsymbol{x}是一个2维向量,同样是用”1-of-K”表示法,这里的\mu_k也满足\mu_k\ge0\sum_{k=1}^{K}\mu_k=1

    继续K维向量的讨论,由刚才的分布推导出其数学期望为:

                                                      \large \mathbb{E}[\boldsymbol{x}|\boldsymbol{\mu}]=\sum_{\boldsymbol{x}}p(\boldsymbol{x}|\boldsymbol{\mu})\boldsymbol{x}=(\mu_1,...,\mu_K)^T=\boldsymbol{\mu}                                                       (3)

    那么,可以联系之前从伯努利分布到二项分布的引出过程,我们也制造一个集合\mathcal{D},它由N个独立同分布(如上面的分布)的向量\boldsymbol{x_1}...\boldsymbol{x_N},那么对应的似然函数是:

                                                    \large p(\mathcal{D}|\boldsymbol{\mu})=\prod_{n=1}^{N}\prod_{k=1}^{K}\mu_k^{x_{nk}}=\prod_{k=1}^{K}\prod_{n=1}^{N}\mu_k^{x_{nk}}=\prod_{k=1}^{K}\mu_k^{\sum_{n=1}^{N}x_{nk}}                                       (4)

    设 m_k=\sum_nx_{nk},那么这个部分代表了似然函数对于N个数据点的依赖关系,而m_k也可以理解为,在N次观测中,观测到x_k=1的次数。接下来求解最大似然解,转化成对数似然函数:

                                                                     \large \mathrm{ln}p(\mathcal{D}|\boldsymbol{\mu})=\sum_{k=1}^Km_k\cdot \mathrm{ln}(\mu_k)                                                                        (5)

    同时存在的限制条件为\sum_{k=1}^{K}\mu_k=1,这个限制通过拉格朗日乘数\large \lambda实现,总的函数变为:

                                          \large \mathrm{ln}p(\mathcal{D}|\boldsymbol{\mu})+\lambda(\sum_{k=1}^K\mu_k -1)=\sum_{k=1}^Km_k\cdot \mathrm{ln}(\mu_k)+\lambda(\sum_{k=1}^K\mu_k -1)                               (6)

    求导:

                                                            \large \frac{\partial f}{\partial \mu_k}=\frac{m_k}{\mu_k}+\lambda=0 \to \mu_k=-\frac{m_k}{\lambda}                                                                   (7)

    将\mu_k=-\frac{m_k}{\lambda}代入\sum_{k=1}^{K}\mu_k=1中,解得\lambda=-N,\mu_k^{ML}=\frac{m_k}{N},对应的就是在N次观测中,观测到x_k=1的次数的比例。然后,类似于二项分布,考虑m_1...m_k的联合分布(二项分布只考虑m_1的分布),可以得到:

                                                     \large p(m_1,m_2...m_k|\boldsymbol{\mu},N)=(_{m_1,m_2...m_k}^{N})\prod_{k=1}^K\mu_k^{m_k}                                                          (8)

    此时满足\sum_{k=1}^{K}\mu_k=1

2.狄利克雷分布

    由多项式分布的形式可知,参数\{\mu_k\}的共轭先验分布满足p(\boldsymbol{\mu}|\boldsymbol{\alpha})\propto\prod_{k=1}^K\mu_k^{\alpha_k-1},其中1\ge\mu_k\ge0\sum_{k=1}^{K}\mu_k=1,由于这两个条件的限制,参数\{\mu_k\}被限制在了k-1维的单纯性中(作为特例,Beta分布的参数分布在一条直线\mu_1+\mu_2=1上)。归一化后,得到了狄利克雷分布:

                                                                p(\boldsymbol{\mu}|\boldsymbol{\alpha})=\frac{\Gamma(\sum_{k=1}^K\alpha_k)}{\Gamma(\alpha_1)...\Gamma(\alpha_K)}\cdot \prod_{k=1}^K\mu_k^{\alpha_k-1}                                                                        (9)

    它是Beta分布的多维推广。同样,用贝叶斯公式可得,参数\{\mu_k\}的后验概率正比于似然函数和先验概率的乘积。因此形式一致,得到归一化后的后验概率分布也是狄利克雷分布,为:

                                                        p(\boldsymbol{\mu}|\boldsymbol{\alpha})=\frac{\Gamma(\sum_{k=1}^K\alpha_k+N)}{\Gamma(\alpha_1+m_1)...\Gamma(\alpha_K+m_K)}\cdot \prod_{k=1}^K\mu_k^{\alpha_k+m_k-1}                                                  (10)

    因此参数\alpha_k可以理解为x_k=1的有效观测数。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/182917.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 微型计算机的性能主要由微处理器的什么,微型计算机的性能主要由微处理器的什么决定…「建议收藏」

    微型计算机的性能主要由微处理器的什么,微型计算机的性能主要由微处理器的什么决定…「建议收藏」大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答。微型计算机的性能主要由微处理器的控制器决定的。控制器是指按照预定顺序改变主电路或控制电路的接线和改变电路中电阻值来控制电动机的启动、调速、制动和反向的主令装置。微型计算机,是指由微处理器作为CPU的计算机。由大规模集成电路组成的、体积较小的电子计算机。由微处理机(核心)、存储片、输入和输出片、系统总线等组成。特点是体积小、灵活性大…

    2022年6月28日
    29
  • Android通过HTTP POST带參訪问asp.net网页

    Android通过HTTP POST带參訪问asp.net网页

    2022年1月29日
    43
  • Java递归下降分析器_递归下降语法分析器[通俗易懂]

    Java递归下降分析器_递归下降语法分析器[通俗易懂]用java语言编写的递归下降语法分析器,是一种适合手写语法编译器的方法,且非常简单。递归下降法对语言所用的文法有一些限制,但递归下降是现阶段主流的语法分析方法,因为它可以由开发人员高度控制,在提供错误信息方面也很有优势。就连微软C#官方的编译器也是手写而成的递归下降语法分析器。使用递归下降法编写语法分析器无需任何类库,编写简单的分析器时甚至连前面学习的词法分析库都无需使用。我们来看一个例子:现在有…

    2022年6月29日
    25
  • Php面试问题_php面试常问面试题

    Php面试问题_php面试常问面试题1、css的定位有哪些方式?以及用法position在英文中表示“位置”的意思 它主要是用于实现对元素的定位在CSS中定位分为三种:position:fixed         固定定位position:relatvie      相对定位position:absolute      绝对定位position:static      无特殊定位 (默认值)。注意:   在使用定位属…

    2022年8月27日
    6
  • 注册会计师_会计师报考需要什么条件

    注册会计师_会计师报考需要什么条件本人是华政的,学的是国际法,成绩一般,从来没有上课的习惯。会计是零基础,6个月通过了注册会计师的会计、财务成本管理、税法、经济法、公司战略与风险管理5门课,想在这里和大家分享一下经验,也希望大家指教~~资料下载:http://www.iliyu.com/ 里面几乎什么资料都下的到          http://www.zhukuai.com/ 这个论坛8错          ht

    2022年10月4日
    3
  • 电脑基站测试软件,Signalsitemap PC Tools(阿达基站路测PC辅助工具) V3.50 官方版

    电脑基站测试软件,Signalsitemap PC Tools(阿达基站路测PC辅助工具) V3.50 官方版SignalsitemapPCTools是款简单使用的基站路测工具。它针对阿达基站路测有专门的一套分析系统,帮助路测人员工作,有喜欢的用户不要错过了。【主要功能】1、SignalsitemapPCTools是配合Signalsitemapandroid(阿达基站路测)在PC上使用的辅助工具。2、支持在PC上进行路测数据查看分析,支持导入基站、路测信号回放、室内测试分析等。3、可用于生成…

    2025年6月24日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号