五分钟了解先验概率和后验概率

五分钟了解先验概率和后验概率五分钟了解先验概率和后验概率本文摘自我的公众号 车子的心智探索 欢迎关注我 不理解先验概率和后验概率 莫慌 本文可以帮你 从面积的角度看概率在说正题之前 咱们从面积的角度认识一下概率 拿掷骰子来说 每个点的概率是相等的 因为总概率是 1 所以每个点数的概率是 1 6 我们用格子的大小来表示概率 那么掷骰子的概率图是这样的 如果把掷出的点数小于等于 4 记作事件 F 问你 P F

五分钟了解先验概率和后验概率

在这里插入图片描述

不理解先验概率和后验概率?莫慌,本文可以帮你。

从面积的角度看概率

在说正题之前,咱们从面积的角度认识一下概率。

拿掷骰子来说,每个点的概率是相等的,因为总概率是 1,所以每个点数的概率是 1/6。我们用格子的大小来表示概率,那么掷骰子的概率图是这样的:

在这里插入图片描述

如果把掷出的点数小于等于 4 记作事件 F,问你 P(F) 等于多少,你会说等于 4/6 = 2/3.

如果用面积图来算呢?把对应点数的面积加起来就可以。

四个方块的面积之和 = 1/6 * 4 = 2/3

在这里插入图片描述

某种可能性消失

我洗好了 52 张扑克牌摆在你面前,扑克牌背面朝上。如果我问你,最上面这张是黑桃的概率是多少?你肯定会说四分之一。因为扑克牌共有四种花色,每一种花色的可能性都是相等的。

但是,我趁你不注意的时候偷看了一眼最上面的牌,然后告诉你这张牌是黑色的。这时候我再问你,最上面这张是黑桃的概率是多少?

因为已经确定花色是黑色,所以红桃或方块的可能性不存在了,只有可能是黑桃或梅花,所以,你推测这张牌是黑桃的概率为二分之一。

画图解释就是:

在这里插入图片描述

从面积角度看,整个过程是这样的:

在这里插入图片描述

当得知花色是黑色的时候,表示红桃和方块的两个方形不见了,只剩下黑桃和梅花,因为概率之和总是 1,所以把它们各自的面积向上伸展,直到总和为 1。注意,在伸展的同时要保持黑桃和梅花的面积比例不变,于是结果就是各占 1/2。

当然,也可以更简单,既然要保持黑桃和梅花的面积比例不变,不妨假设都伸展 k 倍。

黑 桃 的 面 积 总 面 积 = 1 4 k 1 4 k + 1 4 k = 1 4 1 4 + 1 4 = 1 2 \frac{黑桃的面积}{总面积}=\frac{\frac{1}{4}k}{\frac{1}{4}k+\frac{1}{4}k}=\frac{\frac{1}{4}}{\frac{1}{4}+\frac{1}{4}}=\frac{1}{2} =41k+41k41k=41+4141=21

又因为总面积为 1,所以黑桃的面积是 1/2.

好了,进入正题。

先验概率与后验概率

看这样一个问题:

假设某种癌症的患病率为0.1%(0.001)。有一个简易的方法能够检查出是否患病,但是不能百分之百检查出——患上这种癌症的人中有 95%(0.95)的概率被诊断为阳性;另一方面,健康人群也有 2%(0.02)的可能性被误诊为阳性。如果你的检查结果是阳性,请问你实际患上这种癌症的概率为多少?

这里的患病率就是先验概率。

如果要在检查前推测自己是否罹患这种癌症,概率图如下。左侧条形的面积是 0.001,右侧矩形的面积是 0.999,分别表示得癌症的概率和健康的概率。

在这里插入图片描述

通过流行病学数据可知,这种癌症的罹患率为 0.001。也就是说,1000 人中有 1 人罹患这种癌症。在没有任何个人信息的情况下,你属于图中左侧世界的概率是 0.001,属于右侧世界的概率是 0.999。

按照题目信息,可以制作一个表格。

在这里插入图片描述

先看癌症患者这行,在患癌症的情况下,检查结果呈阳性的概率为 0.95。也就是说,如果你真得了癌症,能检查出来的概率为 95%。还有 5% 的概率查不出来。

再看健康者这行,如果你是健康人,那么误诊为阳性的概率为 2%,准确诊断为阴性的概率是 98%。

所以,检查存在着误诊的风险。所谓的风险包含以下两种情况:

  1. 身患癌症,却诊断没有患病
  2. 健康,却误诊为患病

在前面那张图的基础上,我们可以根据阳性率和阴性率继续分割。

左侧是患癌症这一类别,把这个条形按照面积之比 0.95:0.05 来分割 ,那么患癌呈阳性的概率是 0.001*0.95;同理,可以算出其他三部分的概率(面积)。

在这里插入图片描述

当你做完检查,肯定属于以下四种可能性中的一种:

  1. 患癌并呈现阳性(左上区域)
  2. 患癌并呈现阴性(左下区域)
  3. 健康并呈现阳性(右上区域)
  4. 健康并呈现阴性(右下区域)

再回到原题,你的检查结果呈阳性,于是之前的 4 种情况就变成 2 种了。

在这里插入图片描述

同前面扑克牌问题的计算方法类似,你患癌症的概率是 0.095% ÷ (0.095% + 1.998%)= 0.045(保留三位小数)。

从这个结果可知,在得知阳性这一检查结果的情况下,你罹患这种癌症的概率约为 4.5% ,这便是后验概率。

频率树的方法

还有一种方法值得介绍,就是频率树。假设总人口是 10 万人,根据各种情况,最后可以生成一棵树。

在这里插入图片描述
是不是这种方法更直观呢?

—–【End】—–

参考资料
小岛宽之.(2018).统计学关我什么事:生活中的极简统计学.北京时代华文书局.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/218977.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月17日 下午11:04
下一篇 2026年3月17日 下午11:04


相关推荐

  • linux scp命令使用详解

    linux scp命令使用详解Linuxscp 命令一 前言二 语法三 实例 1 从本地复制到远程 1 命令格式 2 应用实例 3 复制目录命令格式 2 从远程复制到本地一 前言 Linuxscp 命令用于 Linux 之间复制文件和目录 scp 是 securecopy 的缩写 scp 是 linux 系统下基于 ssh 登陆进行安全的远程文件拷贝命令 scp 是加密的 rcp 是不加密的 scp 是 rcp 的加强版 windows 系统下也可以使用 scp 命令 因此我们可以使用 scp 在 linux 与 windos 系统上互相传递文

    2026年3月18日
    2
  • 黑马vue电商后台管理系统总结[通俗易懂]

    黑马vue电商后台管理系统总结[通俗易懂]vue电商后台管理系统-阶段总结一、项目技术栈前端前端采用vuecli脚手架搭建框架,使用elementUI美化项目结构环境依赖(开发依赖,运行依赖)富文本编辑器nprogress加载进度条echarts图表展示第三方http库axios后端后端是已经写好了的,采用express搭建的API服务,返回的数据是JSON格式的数据,只需要导入数据库,并配置一下数据库信息,就可以跑起来了,也有对应的api文档数据库数据库采用MySQL5.7

    2022年6月12日
    61
  • SQL 模糊查询(like)「建议收藏」

    SQL 模糊查询(like)「建议收藏」在进行数据库查询时,有完整查询和模糊查询之分。SQL模糊查询,使用like比较字,加上SQL里的通配符,请参考以下:1、LIKE’Mc%’将搜索以字母Mc开头的所有字符串(如McBadden)。2、LIKE’%inger’将搜索以字母inger结尾的所有字符串(如Ringer、Stringer)。3、LIKE’%en%’将搜索在任何位置包含字母en的所

    2022年6月10日
    45
  • java 16进制数据格式化处理工具类,16进制byte数组转String

    java 16进制数据格式化处理工具类,16进制byte数组转String废话不多说,直接上代码。格式化16进制字节数组,做数据处理时用得着,收藏吧!

    2022年8月30日
    4
  • Java哈希码

    Java哈希码转载自 https www cnblogs com hane p 7338047 html 哈希码 也叫散列码 是一个整数值 计算整数的算法称为散列函数 Java 使用散列码从基于散列的集合中有效地检索数据 Object 类有一个返回 int 的 hashCode 方法 它是对象的哈希码 该方法的默认实现通过将对象的内存地址转换为整数来计算对象的哈希码 下面是我们在类中重写 hashCode 方法时必须遵循的规则 假设有两个对象引用 x 和 y 如果 x equals y 返回 true x hashCo

    2026年3月19日
    2
  • 判断js数据类型的四种方法和原理

    判断js数据类型的四种方法和原理怎么去判断一个数据属于哪个数据类型 这个是很常见的操作 我们一般都会想到 typeof 和 instanceof 这两个常见的方法 但有时候这两种方法并不能满足我们的需求 那让我们来看一下都有哪些可以判断数据类型的方法吧 1 typeof 这个方法很常见 目前

    2026年3月19日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号