怎么理解泊松分布_泊松分布公式

怎么理解泊松分布_泊松分布公式1甜在心馒头店公司楼下有家馒头店:每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):均值为:按道理讲均值是不错的选择(参见如何理解最小二乘法?),但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖,的时间不够卖:你“甜在心馒头店”又不是…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

1 甜在心馒头店

公司楼下有家馒头店:

怎么理解泊松分布_泊松分布公式

每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?

老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):

\begin{array}{c|c} \qquad\qquad&\qquad销售\qquad\\\hline\color{SkyBlue}{周一}& 3 \\ \hline \color{blue}{周二}& 7 \\ \hline \color{orange}{周三}&4\\\hline \color{Goldenrod}{周四}&6\\ \hline \color{green}{周五}&5\\\end{array}\\

均值为:

\overline{X}=\frac{3+7+4+6+5}{5}=5\\

按道理讲均值是不错的选择(参见如何理解最小二乘法?),但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖,40\% 的时间不够卖:

\begin{array}{c|c}\qquad\qquad&\qquad销售\qquad&\quad备货五个\\\hline\color{SkyBlue}{周一}& 3 \\\hline \color{blue}{周二}& 7&\color{red}{不够} \\ \hline \color{orange}{周三}&4\\ \hline \color{Goldenrod}{周四}&6&\color{red}{不够}\\\hline \color{green}{周五}&5\\\end{array}\\

你“甜在心馒头店”又不是小米,搞什么饥饿营销啊?老板当然也知道这一点,就拿起纸笔来开始思考。

2 老板的思考

老板尝试把营业时间抽象为一根线段,把这段时间用 T 来表示:

怎么理解泊松分布_泊松分布公式

然后把周一的三个馒头(“甜在心馒头”,有褶子的馒头)按照销售时间放在线段上:

怎么理解泊松分布_泊松分布公式

把 T 均分为四个时间段:

怎么理解泊松分布_泊松分布公式

此时,在每一个时间段上,要不卖出了(一个)馒头,要不没有卖出:

怎么理解泊松分布_泊松分布公式

在每个时间段,就有点像抛硬币,要不是正面(卖出),要不是反面(没有卖出):

怎么理解泊松分布_泊松分布公式

T 内卖出3个馒头的概率,就和抛了4次硬币(4个时间段),其中3次正面(卖出3个)的概率一样了。

这样的概率通过二项分布来计算就是:

\binom{4}{3}p^3(1-p)^1\\

但是,如果把周二的七个馒头放在线段上,分成四段就不够了:

怎么理解泊松分布_泊松分布公式

从图中看,每个时间段,有卖出3个的,有卖出2个的,有卖出1个的,就不再是单纯的“卖出、没卖出”了。不能套用二项分布了。

解决这个问题也很简单,把 T 分为20个时间段,那么每个时间段就又变为了抛硬币:

怎么理解泊松分布_泊松分布公式

这样,T 内卖出7个馒头的概率就是(相当于抛了20次硬币,出现7次正面):

\binom{20}{7}p^7(1-p)^{13}\\

为了保证在一个时间段内只会发生“卖出、没卖出”,干脆把时间切成 n 份:

\binom{n}{7}p^7(1-p)^{n-7}\\

越细越好,用极限来表示:

\lim_{n\to\infty}\binom{n}{7}p^7(1-p)^{n-7}\\

更抽象一点,T 时刻内卖出 k 个馒头的概率为:

\lim_{n\to\infty}\binom{n}{k}p^k(1-p)^{n-k}\\

3 p 的计算

“那么”,老板用笔敲了敲桌子,“只剩下一个问题,概率 p 怎么求?”

在上面的假设下,问题已经被转为了二项分布。二项分布的期望为:

E(X)=np=\mu\\

那么:

p=\frac{\mu}{n}\\

4 泊松分布

有了 p=\frac{\mu}{n}了之后,就有:

\lim_{n\to\infty}\binom{n}{k}p^k(1-p)^{n-k}=\lim_{n\to\infty}\binom{n}{k}\left(\frac{\mu}{n}\right)^k(1-\frac{\mu}{n})^{n-k}\\

我们来算一下这个极限:

\begin{align}\lim_{n\to\infty}\binom{n}{k}\left(\frac{\mu}{n}\right)^k(1-\frac{\mu}{n})^{n-k}&= \lim_{n\to\infty}\frac{n(n-1)(n-2)\cdots(n-k+1)}{k!}\frac{\mu^k}{n^k}\left(1-\frac{\mu}{n}\right)^{n-k}\\ &=\lim_{n\to\infty}\frac{\mu^k}{k!}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n}\left(1-\frac{\mu}{n}\right)^{-k}\left(1-\frac{\mu}{n}\right)^n\end{align}\\

其中:

\lim_{n\to\infty}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n}\left(1-\frac{\mu}{n}\right)^{-k}=1\\

 

\lim_{n \to \infty}\left(1-\frac{\mu}{n}\right)^n = e^{-\mu}\\

所以:

\lim_{n\to\infty}\binom{n}{k}\left(\frac{\mu}{n}\right)^k(1-\frac{\mu}{n})^{n-k}=\frac{\mu^k}{k!}e^{-\mu}\\

上面就是泊松分布的概率密度函数,也就是说,在 T 时间内卖出 k 个馒头的概率为:

P(X=k)=\frac{\mu^k}{k!}e^{-\mu}\\

一般来说,我们会换一个符号,让 \mu=\lambda ,所以:

P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}\\

这就是教科书中的泊松分布的概率密度函数。

5 馒头店的问题的解决

老板依然蹙眉,不知道 \mu 啊?

没关系,刚才不是计算了样本均值:

\overline{X}=5\\

可以用它来近似:

\overline{X}\approx\mu\\

于是:

P(X=k)=\frac{5^k}{k!}e^{-5}\\

画出概率密度函数的曲线就是:

怎么理解泊松分布_泊松分布公式

可以看到,如果每天准备8个馒头的话,那么足够卖的概率就是把前8个的概率加起来:

怎么理解泊松分布_泊松分布公式

这样 93\% 的情况够用,偶尔卖缺货也有助于品牌形象。

老板算出一脑门的汗,“那就这么定了!”

6 二项分布与泊松分布

鉴于二项分布与泊松分布的关系,可以很自然的得到一个推论,当二项分布的 p 很小的时候,两者比较接近:

怎么理解泊松分布_泊松分布公式

7 总结

这个故事告诉我们,要努力学习啊,要不以后馒头都没得卖。

生活中还有很多泊松分布。比如物理中的半衰期,我们只知道物质衰变一半的时间期望是多少,但是因为不确定性原理,我们没有办法知道具体哪个原子会在什么时候衰变?所以可以用泊松分布来计算。

还有比如交通规划等等问题。

顺着这个故事我们还可以讲解:如何理解指数分布?

文章最新版本在(有可能会有后续更新):如何理解泊松分布?

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/180605.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • js indexOf 的正确用法「建议收藏」

    js indexOf 的正确用法「建议收藏」indexOf在js中有着重要的作用,可以判断一个元素是否在数组中存在,或者判断一个字符是否在字符串中存在,如果存在返回该元素或字符第一次出现的位置的索引,不存在返回-1。例如vararr=[1,2,3];console.log(arr.indexOf(2));//打印结果为1又或者varstr=”helloworld”;console.log(str.indexOf(“w”));//打印结果为5那么,当想删除某个数组中的某个元素时,常常会这么

    2022年7月26日
    7
  • 数据结构 图的邻接表

    数据结构 图的邻接表呃,下面该写邻接表了…….邻接表的出现是因为图若是稀疏图,用邻接矩阵会造成空间的浪费,毕竟你要开辟一个一维数组和一个二维数组嘛,而且还是大开小用的那种。邻接表为了避免内存的浪费引入了链式存储,它的处理办法是:1.用一个一维数组存储顶点,当然你也可以用单链表存储,2.用单链表存储顶点的邻接点,可以将顶点改为结构体数组,结构体中存放邻接点的指针,邻接点也创建一个结构体,定义指针…

    2022年6月28日
    18
  • 深入编程之QQ盗号核心代码[通俗易懂]

    深入编程之QQ盗号核心代码[通俗易懂]经常有听到有朋友QQ被盗的消息,总感觉做出这种行为的人是可鄙的,不就是对QQ窗口进行监视,然后再是记录用户输入的号码和密码,认为没什么了不起。对于Windows核心编程,本人还是一只菜鸟,前一段时间把《Windows系统编程》粗略的看一边(当然重点地方仔细的看),由于对于C++有点基础,感觉学起来比较容易上手。但到了这两天真正实践的时候,遇到了各种各样的问题。即使一个小小的问题都足以让我…

    2022年6月26日
    64
  • 2018最新APP Android UI设计规范「建议收藏」

    2018最新APP Android UI设计规范「建议收藏」设计稿尺寸:从目前市场主流设备尺寸来看,我们要用1080x1920PX来做安卓设计稿尺寸。以1080x1920px作为设计稿标准尺寸的原由:从中间尺寸向上和向下适配的时候界面调整的幅度最小,最方便适配。大屏幕时代依然以小尺寸作为设计尺寸,会限制设计师的设计视角。用主流尺寸来做设计稿尺寸,极大的提高了视觉还原和其他机型适配。所以做安卓设计稿时请以1…

    2022年6月18日
    38
  • Lena图像原图及由来[通俗易懂]

    Lena图像原图及由来[通俗易懂]莱娜图在数字图像处理学习与研究中颇为知名,常被用作数字图像处理各种实验的例图。

    2022年6月19日
    32
  • EditPlus正则表达式替换字符串详解

    EditPlus正则表达式替换字符串详解EditPlus的查找,替换,文件中查找支持以下的正则表达式:ExpressionDescription\tTabcharacter.\nNewline..Matchesanycharacter.|Eitherexpressiononitsleftandrightsidematchesthetargetstring.Forexa

    2022年5月13日
    195

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号