机器学习:Multinoulli分布与多项式分布

机器学习:Multinoulli分布与多项式分布学习深度学习时遇见multinoulli分布,在此总结一下机器学习中常用的multinoulli分布与多项式分布之间的区别于关系,以便更好的理解其在机器学习和深度学习中的使用。首先介绍一下其他相关知识。Bernoulli分布(两点分布)Bernoulli分布是单个二值随机变量的分布。它由单个参数控制,给出了随机变量等于1的概率。             …

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

学习深度学习时遇见multinoulli分布,在此总结一下机器学习中常用的multinoulli分布与多项式分布之间的区别于关系,以便更好的理解其在机器学习和深度学习中的使用。

首先介绍一下其他相关知识。

Bernoulli分布 (两点分布)

Bernoulli分布是单个二值随机变量的分布x\in \left \{ 0,1 \right \}。它由单个参数\mu \in \left [ 0,1 \right ]控制,\phi给出了随机变量等于1的概率。

                   P(X=1)=\mu

                   P(X=0)=1-\mu

                   P(X=x|\mu )=\mu ^{x}(1-\mu )^{1-x}

                   E[X]=\mu

                   Var[X]=\mu(1-\mu)

二项分布(n重Bernoulli分布)

二项分布(binomial distribution)用以描述N次独立的伯努利实验中有m次成功(即x=1)的概率,其中每次伯努利实验成功的概率为\mu \in \left [ 0,1 \right ]

                  P(m|N,u)=\binom{N}{m}\mu ^{m}(1-\mu )^{N-m}

                  E[X]=N\mu

                   Var[X]=N\mu(1-\mu)

多项分布

若将伯努利分布由单变量扩展为d维向量x,其中x_{i} = \left \{ 0,1 \right \}\sum_{i=1}^{d}x_{i}=1,并假设x_{i}取1的概率为\mu_{i} \in \left [ 0,1 \right ],\sum_{i=1}^{d}\mu_{i}=1,则将得到离散概率分布

                P(x|\mu )=\prod_{i=1}^{d}\mu_{i}^{x^{i}}

                E[X_{i}]=\mu_{i}

                Var[X_{i}]=\mu_{i}(1-\mu)_{i}

在此基础上扩展二项分布则得到多项分布(nultinomial distribution),它描述了在N次独立实验中有m_{i}x_{i}=1的概率。 

               P(m_{1},...,m_{d}|N,\mu )=\frac{N!}{m_{1}!...m_{d}!}\prod_{i=1}^{d}\mu_{i}^{m_{i}} 

multinoulli分布(范畴分布、分类分布(categotical distribution))

mutinoulli分布是指在具有k个不同状态的单个离散型随机变量上的分布,其中k是一个有限值。 mutinoulli分布由分布向量p\in \left [ 0,1 \right ]^{k-1}参数化,其中每一个分量p_{i}表示第i个状态的概率。最后的第k个状态的概率可以通过1-1^{T}p给出。注意我们必须限制1^{T}p\leq 1。mutinoulli分布经常用来表示对象分类的分布,所以我们很少假设状态1具有数值1之类的。因此我们通常不需要去计算mutinoulli分布的随机变量的期望和方差。

mutinoulli分布是多项式分布的一个特例。多项式分布是\left \{ 0,...,n \right \}^{k}中的向量的分布,用于表示当对mutinoulli分布采样n次时k个类中的每一个被访问的次数。很多文章使用“多项式分布”而实际上说的是mutinoulli分布,但是他们并没有说是对n=1(一次实验)的情况,这点需要注意。大概意思就是说multinouli分布进行一次实验,得到了各个状态k的概率分布p,多项分布是重复对multinoulli分布进行n次采样实验,看k个类中每一个被采样到的次数。我觉得很像bernoulli分布与二项分布的关系。(大家有不同想法的可以留言讨论!)

参考文献:

《概率论与数理统计》韩旭里,谢永钦

《机器学习》周志华

《深度学习》Ian GoodFellow

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/182944.html原文链接:https://javaforall.net

(0)
上一篇 2022年10月12日 上午6:36
下一篇 2022年10月12日 上午6:46


相关推荐

  • EditPlus正则表达式替换字符串详解

    EditPlus正则表达式替换字符串详解EditPlus的查找,替换,文件中查找支持以下的正则表达式:ExpressionDescription\tTabcharacter.\nNewline..Matchesanycharacter.|Eitherexpressiononitsleftandrightsidematchesthetargetstring.Forexa

    2022年5月13日
    200
  • python用pandas读取csv文件_使用pandas读取csv文件的指定列方法

    python用pandas读取csv文件_使用pandas读取csv文件的指定列方法根据教程实现了读取 csv 文件前面的几行数据 一下就想到了是不是可以实现前面几列的数据 经过多番尝试总算试出来了一种方法 之所以想实现读取前面的几列是因为我手头的一个 csv 文件恰好有后面几列没有可用数据 但是却一直存在着 原来的数据如下 GreydeMac mini chapter06gre catdata csv1 name 01 coment 01 2 name 02 c

    2025年9月26日
    7
  • node.js 安装详细步骤教程

    node.js 安装详细步骤教程 本机环境:Windows10专业版x64 1、下载安装包Node.js官方网站下载:https://nodejs.org/en/选择操作系统对应的包:下载完成,安装包如下: 2、安装打开安装,傻瓜式下一步即可:   选择安装位置,我这里装在D盘下:     安装成功,文件夹结构…

    2022年7月16日
    18
  • linux网络配置出现E325,Linux CentOS E325错误,如何解决?VI如何使用?「建议收藏」

    linux网络配置出现E325,Linux CentOS E325错误,如何解决?VI如何使用?「建议收藏」Linuxvi命令即vi编辑器,是Linux/UNIX环境下经典的编辑器。Linuxvi命令非常强大,可以使用它高效的编辑代码,配置系统文件等,运用非常广泛。但在Linux系统中打开vi编辑器时,不少朋友会提示E325:ATTENTION类的错误。那么,遇到这种情况后,该如何解决此类问题呢?为什么会出现E325:ATTENTION类的错误?出现此类错误是vi程序对文件的一种保护机制(…

    2022年5月12日
    45
  • 按效果付费+共担风险,这家清华系AI公司把销售“Agent化”了

    按效果付费+共担风险,这家清华系AI公司把销售“Agent化”了

    2026年3月13日
    2
  • creator drawcall优化_drawellipse函数

    creator drawcall优化_drawellipse函数前言*在游戏开发中,DrawCall作为一个非常重要的性能指标,直接影响游戏的整体性能表现。无论是CocosCreator、Unity、Unreal还是其他游戏引擎,只要说到游戏性能优化,DrawCall都是绝对少不了的一项。本文将会介绍什么是DrawCall,为什么要减少DrawCall以及在CocosCreator项目中如何减少DrawCall来提升游戏性能。正文什么是DrawCall?DrawCall中文译为“绘制调用”或“绘图指令”。DrawCall是

    2026年1月23日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号