贝叶斯计算公式_贝叶斯公式推导

贝叶斯计算公式_贝叶斯公式推导【文章搬运自我的网易博客(http://zhenxuan1991.blog.163.com/)】今天下午偶然机会,又去看贝叶斯公式。就是这样简单的号称是“概率论中的勾股定理”的一个公式。有非常有趣

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

【文章搬运自我的网易博客(http://zhenxuan1991.blog.163.com/)】

  今天下午偶然机会,又去看贝叶斯公式。

  P(A|B) = \frac{P(B | A)\, P(A)}{P(B)}

  就是这样简单的号称是“概率论中的勾股定理”的一个公式。有非常有趣的一点。
  所谓“反直觉”的一点。
http://www.guokr.com/article/517/ 这个链接中,果壳网友讨论了一个问题:粗略估计大概每1000人中就有一人得艾滋病。采用某种血液试验检测法用于检测身体中是否含有艾滋病病毒,这种方法相当精确,但也可能带来两种误诊。首先,他可能会让某些真有艾滋病的人得到阴性结果,称为假阴性,不过只有0.05的概率发生;其次,它还可能让某些没有艾滋病的人得到阳性结果,称为假阳性,不过只有0.01的概率会发生。那么如果一个人检测结果为阳性,那么他得艾滋病的概率到底是多大?
当然,解答这个问题,我们要借助贝叶斯公式。
  (1)我们定义事件A为“被检测人带有艾滋病病毒”,则A‘表示被检测人不携带艾滋病病毒;定义事件T为“试验结果呈阳性”;
  (2)要求概率 P(A|T)。由贝叶斯公式可知:
  
/gkimage/us/ad/xi/usadxi.png
  

  (3)计算得,P(A|T)=0.087
  结论是:如果一个人检测结果为阳性,那么他患病的概率是8.7% 。很低的一个概率。试想,一个人在得知自己的血检是阳性的时候又听说其实患病的概率只是8.7%会有什么感受?
对,唯一的感受是:这哪儿跟哪儿啊?!
  可是贝叶斯公式错了吗?推导过程一步步在那摆着呢。那直觉错了吗?直觉怎么会错,难道我看到阳性结果不应该为自己担心吗?
  

  同样在那个链接中,有一个ID为 on9 的人说:我认为这样解释能让更多人容易理解:假设有这么一个理想统计人群,一共有十万人。那么按照文中的发病率千分之一,那么应该有一百人有艾滋病。而根据那两个误诊率,那么这一百个人里面,有九十五个会验出是阳性,而有五个(5%)会被验出为阴性(假阴性)。而在剩下的九万九千九百个没病的人里面,会有九百九十九个人(1%)验出是阳性(假阳性)。因此,总结所有十万个人里面,验出阳性的人有999+95=1094人,其中真正有病的只有95个,占其中的8.68%。那位被验出是阳性的哥,真正杯具的几率只有不到10%!
参考他的说法,我自己又整理了一下思路:用直白的话说,一个健康人检验结果为阳性的概率是0.01,但是有很多“不幸”的健康人落入到这个概率中。而在所有检测为阳性的人中,真正的病人与“不幸”的健康人比例大概为10:90,也就是100个阳性检测结果中,有90个人是健康的。所以就会有这种反直觉的计算结果。而出现这种结果的原因是什么?因为健康人检验结果为阳性的概率(0.01)太高,也就是检测可靠性太低。我算了一下,如果健康人检验结果为阳性的概率降低到0.0001,那么如果一个人检验结果为阳性,那么他患病的概率就飙升到0.9056.
 
  所以我认为,所谓的反直觉这种情况,其实是不存在的。如果机器的检测结果可靠性更好,也不存在“阳性结果患病的概率只有8%”这种情况。而题中所言的0.01的误诊率,其实是非常高的。而这也是我认为唯一存在“反直觉”的地方——在概率与统计中,0.1的误差其实比我们所认为的大得多。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/167141.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • shell批量新建文件

    shell批量新建文件shell批量新建文件,文件名依次为a1,a2……a100#!/bin/bashPath=/home/yifan/maying/shell/case2[-d$Path]||mkdir$Pathint=1while(($int<=100))dofilename="a"$int""touch$Path/$filenamelet"int++"do…

    2022年6月22日
    66
  • termux更改镜像源_pycharm自带python

    termux更改镜像源_pycharm自带python方法1在使用pip命令进行安装的时候,传入镜像地址如下#pipinstallpandas-ihttps://mirrors.aliyun.com/pypi/simple#pipinstalldjango==1.11.*-ihttps://pypi.tuna.tsinghua.edu.cn/simple可选的镜像地址有豆瓣https://pypi.douban.com/simple阿里云https://mirror…

    2022年8月29日
    3
  • java代码生成器,springboot代码生成器,加入oracle支持

    java代码生成器,springboot代码生成器,加入oracle支持续接上一篇博客,今天生成器又加入了oracle的支持,界面做了些许的微调,先看一下效果吧比之前好看了一点点吧,然后我们进行oracle配置在这里随便选了公司局域网oracle数据库中的一张表,名字有点长,然后点击数据项配置在这里对交互进行了优化,因为首次连接数据库有时会花费几秒的时间,加了一些提示,如果出现错误,也会出现友好提示,在这里就不一…

    2022年5月29日
    30
  • wifi网速慢的原因及解决办法_wifi连接速度不稳定

    wifi网速慢的原因及解决办法_wifi连接速度不稳定最近在家上网,突然wifi贼jb慢了,连信号也不满格了。脑补了下,估计是附近的wifi频段和我们家冲突了。于是yahoo了下,老外推荐软件NetStubler。兴冲冲地下载了一个,结果在我机器上用不了,搜索了下原因,不了了之。于是放弃,问了下度娘,给我推荐了Homedale,不错,还是国产搜索靠谱啊。果然,我家默认的频段为802.11g的channel1,附近有个家伙信号很

    2022年10月20日
    3
  • linux串口驱动分析

    linux串口驱动分析

    2021年11月30日
    44
  • matlab空间计量模型AIC和SC,空间计量模型[通俗易懂]

    matlab空间计量模型AIC和SC,空间计量模型[通俗易懂]回归分析中LMlag,LMerror后面的DFvaluefrob代表什么,哪一个是概率值?这个表的结论是所有的spatiallag都不显著,不要用spatialmodel,一般的OLS就行这一列(MI/DF这列)读下来就是Moran’sI的均值之类的东西(MI)等于-0.17,下面是各个LM检验的自由度,(LM检验是卡方分部所以有不同自由度)。第二列(value)是各个统计量的值,…

    2025年8月14日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号