概率论中PDF、PMF和CDF的区别与联系

概率论中PDF、PMF和CDF的区别与联系在概率论中,经常出现PDF、PMF和CDF,那么这三者有什么区别与联系呢?1.概念解释PDF:概率密度函数(probabilitydensityfunction),在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。PMF:概率质量函数(probabilitymassfunct…

大家好,又见面了,我是你们的朋友全栈君。

在概率论中,经常出现PDF、PMF和CDF,那么这三者有什么区别与联系呢?

1. 概念解释

  • PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

  • PMF : 概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。

  • CDF : 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

2. 数学表示

2.1 PDF

如果XX是连续型随机变量,定义概率密度函数为fX(x)fX(x),用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率,即

概率论中PDF、PMF和CDF的区别与联系
2.2 PMF

如果XX离散型随机变量,定义概率质量函数为fX(x)fX(x),PMF其实就是高中所学的离散型随机变量的分布律,即

概率论中PDF、PMF和CDF的区别与联系

比如对于掷一枚均匀硬币,如果正面令X=1X=1,如果反面令X=0X=0,那么它的PMF就是

概率论中PDF、PMF和CDF的区别与联系
2.3 CDF

不管是什么类型(连续/离散/其他)的随机变量,都可以定义它的累积分布函数,有时简称为分布函数。

  • 对于连续型随机变量,显然有:
    F X ( x ) = P r ( X ≤ x ) = ∫ − ∞ x f X ( t ) d t F_X(x)=Pr(X\leq x)=\int _{-\infty }^{x}f_X(t) dt FX(x)=Pr(Xx)=xfX(t)dt
    那么CDF就是PDF的积分,PDF就是CDF的导数。

  • 对于离散型随机变量,其CDF是分段函数,比如举例中的掷硬币随机变量,它的CDF为:
    F X ( x ) = P r ( X ≤ x ) { 0 i f     x &lt; 0 1 2 i f     0 ≤ x &lt; 1 1 i f     x ≥ 1 F_X(x)=Pr(X\leq x)\left\{ \begin{array}{rcl} 0 &amp; &amp; {if \ \ \ x &lt;0 }\\ \frac{1}{2} &amp; &amp; {if \ \ \ 0\leq x&lt;1}\\ 1 &amp; &amp; {if\ \ \ x\geq 1}\\ \end{array} \right. FX(x)=Pr(Xx)0211if   x<0if   0x<1if   x1

3.概念分析

根据上述,我们能得到以下结论:

  • PDF是连续变量特有的,PMF是离散随机变量特有的;
  • PDF的取值本身不是概率,它是一种趋势(密度)只有对连续随机变量的取值进行积分后才是概率,也就是说对于连续值确定它在某一点的概率是没有意义的;
  • PMF的取值本身代表该值的概率。

4.分布函数的意义

我们从两点来分析分布函数的意义:

4.1 为什么需要分布函数?

对于离散型随机变量,可以直接用分布律来描述其统计规律性;而对于连续型随机变量(非离散型的随机变量),我们无法一一列举出随机变量的所有可能取值,所以它的概率分布不能像离散随机变量那样用分布律进行描述。于是引入PDF,用积分来求随机变量落入某个区间的概率

分布律(PMF)不能描述连续型随机变量,密度函数(PDF)不能描述离散随机变量,因此需要找到一个统一方式描述随机变量统计规律,这就有了分布函数

另外,在现实生活中,有时候人们感兴趣的是随机变量落入某个范围内的概率是多少,如掷骰子的数小于3点的获胜,那么考虑随机变量落入某个区间的概率就变得有现实意义了,因此引入分布函数很有必要。

4.2 分布函数的意义

分布函数 F ( x ) F(x) F(x)在点 x x x处的函数值表示 X X X落在区间 ( − ∞ , x ] (−\infty,x] (,x]内的概率,所以分布函数就是定义域为 R R R的一个普通函数,因此我们可以把概率问题转化为函数问题,从而可以利用普通的函数知识来研究概率问题,增大了概率的研究范围。

5.参考文献

概率中的PDF,PMF,CDF
http://www.dataguru.cn/thread-150756-1-1.html
https://www.zhihu.com/question/23022012
https://www.zhihu.com/question/36853661
https://www.zhihu.com/question/21911186
http://wenku.baidu.com/view/823a0bb9f111f18582d05a14.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/142212.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 。。。

    。。。

    2021年9月12日
    42
  • 全网最全python爬虫精进

    全网最全python爬虫精进4.25(第一天)**第0关认识爬虫**1、初始爬虫爬虫,从本质上来说,就是利用程序在网上拿到对我们有价值的数据。2、明晰路径2-1、浏览器工作原理(1)解析数据:当服务器把数据响应给浏览器之后,浏览器并不会直接把数据丢给我们。因为这些数据是用计算机的语言写的,浏览器还要把这些数据翻译成我们能看得懂的内容;(2)提取数据:我们就可以在拿到的数据中,挑选出对我们有用的数据;(3)存储数据:将挑选出来的有用数据保存在某一文件/数据库中。2-2、爬虫工作原理(1)获取数据:爬虫程序会根据

    2022年5月27日
    34
  • uart接口是什么_各种接口的详细介绍

    uart接口是什么_各种接口的详细介绍我面试的时候一般喜欢问应聘者一个问题:UART与RS232/RS485的区别与联系?很多人对于这个问题答得都不是很好。还有些人压根就没有想过这个问题,一直认为他们是同一个东西,就是咱们俗称的串口。我刚入嵌入式的大门时,对这个问题也困惑过很久,后来终于弄明白了。跟大家一起分享一下吧。简单来说,区别在于UART是一种接口,而RS232/RS485是一种总线。UART这个接口,后面可以接TTL电平,这就是我们俗称的普通的串口。而UART如果接了RS232/RS485的转换芯片,那么后面的总线上..

    2022年9月14日
    3
  • 学java还是python哪个就业好_JAVA和Python哪个好就业?

    学java还是python哪个就业好_JAVA和Python哪个好就业?Python和Java是现在最火的两种编程语言,Python和Java的就业前景都很好,具体选择哪一个要看你自身对哪种编程语言更感兴趣。Python的就业方向和前景学习Python以后可以从事数据分析工作,无论是什么行业,做数据分析的人似乎都离不开Python,因为Python可以帮助他们提高工作效率。也可以从事网络编程工作,Python可以非常方便的完成网络编程的工作,提供了众多的解决方案和模块…

    2022年7月8日
    21
  • 关于部分动态爬虫「建议收藏」

    关于部分动态爬虫「建议收藏」前言爬虫的动态处理方法(我用较为简单的一些网址举例比如豆瓣的热门电影)一、动态爬虫动态爬虫与静态爬虫的最大区别就是源代码与网页内容不同,动态爬虫可以通过抓包(就是直接利用浏览器的F12进行network抓包,获取相关对应的文件)二、使用步骤1.先通过网址找到需要的东西截图如下(示例):按F12进入开发者模式,第二步点击左上角刷新重新加载一下内容,第三步在红框里选取需要的内容,可以通过“预览”来查看是否对应查找正确之后然后在“标头”里找到“请求URL”以及“User-Agent”,把这些找到

    2022年7月26日
    13
  • Java基本开发环境搭建

    Java基本开发环境搭建

    2021年12月2日
    40

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号