学而时嘻之
学而时嘻之
栏目分类
最新文章
最新评论
标签列表
博客搜索
日志存档
友情链接

Locations of visitors to this page
统计信息
  • 访问:2806503 次
  • 日志: 196篇
  • 评论: 1846 个
  • 留言: 51 个
  • 建站时间: 2006-8-16
博客成员


Over-seriousness is a warning sign for mediocrity.
冤假错案的数学原理
作者:同人于郊 提交日期:2009-10-3 14:34:00 酷 | 分类: | 访问量:54738

  我最近连续从几本书中看到同样的概率典故,不得不把它写下来。人的直觉是一个非常强大的武器,在很多情况下可以帮我们不需要精密计算就能做出正确的判断。但是在人的众多直觉能力之中,不包括概率。下面我说说这个典故。
  
  现代技术检测 HIV 病毒的准确度已经到了惊人的程度。如果一个人真是 HIV 阳性,血液检测的手段有 99.9% 的准确率,也就是说有 99.9% 的可能性把他这个阳性给检查出来而不漏网。如果一个人不携带 HIV,那么检测手段的精度更高,达到99.99% - 也就是说有 99.99% 的可能性不会冤枉他。
  
  现在假设我们随便在街头找一个人给他做检查,发现检测结果是 HIV 阳性,那么请问这个人真有 HIV 的可能性是多大呢?
  
  在你回答之前,我要提供一点背景资料。德国马普研究所的心理学家曾经拿这道题考了好几百人,包括学生,数学家和医生。结果 95% 的大学生和 40% 的医生(这些医生实际上都受过这方面的专门训练)都给出了错误的答案。
  
  如果你真懂概率,你会想到要使用贝叶斯定理,然后你会发现这道题还缺少一个关键信息:那就是一般人感染 HIV 的概率。现在已知一般人感染 HIV 的概率是 0.01%,也就是说一万个人中才有一个人感染这种病毒。根据以上信息,这位不幸被检测为 HIV 感染者的朋友真有 HIV 的可能性是多少呢?
  
  正确答案是 50%。
  
  我先说贝叶斯定理的算法,然后再给一个更直观的解释。贝叶斯定理说的就是条件概率。如果我们用 A 表示 “真有 HIV”,B 表示 “检测出 HIV”,那么我们要计算的是 P(A|B)。 已知 P(A) = 0.01%, P(B|A)=99.9%。
  P(B) 需要计算一下,它等于 0.01% x 99.9% [也就是有 HIV 而被查出来的]+ 99.99% x 0.01% [也就是没有 HIV 但被冤枉的]。
  贝叶斯定理说,P(A|B) = P(B|A) x P(A) / P(B),计算结果等于 0.5.
  
  直观的解释是这样的。假设我们随机地找一万个人来做实验。根据 HIV 病毒的分布,这一万人中应该只有一个人是真有 HIV 的。而由于我们的检测手段很强,这个人会被检测出来。但剩下的9999人都没有 HIV,可是我们对没有 HIV 的人的检测精度是 99.99%,也就是说有万分之一的可能性会冤枉好人。这样一来,我们的检测手段还会在9999人中冤枉一个人。
  本来只有一人有 HIV,可是我们却检测出来两人。所以如果一个人被检测出 HIV 来,他真有 HIV 的可能性其实只有 50%。
  
  从根本上说,造成这种局面的原因在于 HIV 其实是一种罕见的病毒,只有万分之一的感染者。在这种情况下即使你的检测手段再高,也很有可能会冤枉人。下面再给一道例题:
  
  1%的妇女有乳房癌(简称为C);80% 的有乳房癌的妇女会在乳房 x 射线照相检验 (mammographies, 简称M)中成阳性;10%的没有乳房癌的妇女也会检测到M阳性。现在有一个妇女检测到了M阳性,请问她患有乳房癌的概率是多少?
  答案:P(C)=0.01; P(M|C)=0.8; P(M)=0.8*0.01+0.1*0.99=0.107,所以
   P(C|M)=P(M|C) P(C)/P(M)=8/107.
  这是一个出乎意料的小数。
  
  如果一个疾病比较罕见,那么你就不应该对阳性诊断特别有信心。
  
  由此我联想到当初文革期间的“抓特务”行动。“特务”这个工作的要求,其实贵在精而不在多,再说国民党也没那么多钱养,真正的特务其实是很少的。如果我们看到一个人长得像特务,说话走路也像特务,我们有多大把握说他就是特务呢?上面的两个概率例题告诉我们,“误诊率”可以相当高。“抓特务”,最好的办法是冒出来一个抓一个,最可怕的办法是搞“人人过关”。如果你搞“人人过关”,必然是一大堆冤假错案!
  
  这就是概率。哪怕你的初衷再好,你也会犯错!
  
  --
  本文第一个例子来自 The Social Atom 一书。
  第二个例子来自 Super Crunchers 一书。
  另外好像 The Drunkard's Walk 这本书里也有一个类似的例子。
  别人一而再,再而三地强调,我们岂可不知呼。
  

严肃评论,请去新版: www.geekonomics10000.com
#日志日期:2009-10-3 星期六(Saturday) 晴

评论人:越露轻狂 评论日期:2009-10-3 18:22
分析这么多,再去复查一次不就得了?

评论人:越露轻狂 评论日期:2009-10-3 18:22
分析这么多,再去复查一次不就得了?

评论人:371338812 评论日期:2009-10-3 19:09
有道理

评论人:371338812 评论日期:2009-10-3 19:09
老兄 你让我又涨见识了

评论人:swjdqpi 评论日期:2009-10-3 19:37
又算了遍,还真是,服了楼主!

评论人:tyyunwu321 评论日期:2009-10-3 20:17
讲的不是很清楚

评论人:越露轻狂 评论日期:2009-10-3 21:12
如果一个人被检测为阳性,那么50%他有艾滋,
如果复查再被检测为阳性,那么他有艾滋的概率是多少呢?
不算复检,文章没有说服力。


评论人:会计当和尚 评论日期:2009-10-3 21:18
 解放初,我村抓地主,当时给每个村都订了地主名额,我村订了两名,于是必须从我村民中揪出两户地主来,实际上我村村外大都是盐碱滩,农民耕种的土地基本上都是自己开荒的地,根本上不存在地主,但上面又下了命令。一户由于家中男人是赶马车顾不上地里的耕作,家中人手不够,所以花钱请过本村村民耕作过,于是被认为是剥削人民而定性为与工农阶级不共戴天的地主阶级,另一户类同!

评论人:白云品味 评论日期:2009-10-3 21:47
我觉得计算有误。

评论人:左丘失明 评论日期:2009-10-4 0:34
你根本就没搞懂问题。
随便找一个人,检出HIV阳性,正确率当然是99.9%。
估计原文作者的意思是,检测10000个人,其中有一个人阳性,那么,这个阳性正确的概率是50%。
其实这仍然不对。没有搞清楚条件概率。10000个人中,无论哪个是阳性,都与其他的被检测者无关,阴性也好,阳性也好,每个人正确的可能性都是99.9%。

评论人:不准袭击警车 评论日期:2009-10-4 1:37
还号称“用理工科思维理解世界 ”?!!楼主回去好好补习一下《概率论与数理统计》再来发帖吧!

评论人:诞生记 评论日期:2009-10-4 8:20
对事不对人,楼上的评论攻击人干嘛,即使计算有问题,那你拿出有理有据的东西出来啊,用事实说话,干嘛说出这样的话,无语了。

评论人:swjdqpi 评论日期:2009-10-4 9:27
回不准袭击警车:该好好补习《概率论与数理统计》的是你,我刚学完这本书,楼主分析的有理有据,引用的公式也是正确的。

评论人:锴文 评论日期:2009-10-4 10:18
正确的概率应该是0.4997,即近似0.50。
根据楼主的描述,感染HIV的概率是万分之一,则各种分布的概率如下:

1. 正常人的概率 0.9999;
2. HIV感染者的概率0.0001;
3. 正常人检测结果的准确性是0.9999;(检测结果错误的概率是0.0001)
4. HIV感染者检测检的准确性是0.9990;(检测结果错误的概率是0.001)

根据以上假设,检测结果有以下4种:
1. 正常人,检测结果为正常(阴性)=0.99980001;
 =0.9999*0.9999
2. 正常人,检测结果为HIV(阳性)=0.00009999;
 =0.9999*0.0001
3. HIV感染者,检测结果为正常(阴性)=0.0000001;
 =0.0001*0.001
4. HIV感染者,检测结果为HIV(阳性)=0.0000999;
 =0.0001*0.999

注意以上4种结果的和为1.0,即满足“互斥且构成一个完全事件”;

因此,检测结果为HIV的概率是(2+4) =0.00019989
而实际是HIV的概率是4,即0.0000999;
因此正确的概率=4/(2+4)=0.0000999/0.00019989=0.499774876


评论人:ococo 评论日期:2009-10-4 10:20
楼主写的没有问题。事实上爷爷不是楼主的发现。是已知的科普知识。《概率论与数理统计》中也有类似的例题。不明白可以回去看看。

评论人:last-love 评论日期:2009-10-4 11:12
楼主算的没错啊
诸位去看看浙大版的概率教材
里面有个和这个非常类似之例子。

评论人:linblackblood 评论日期:2009-10-4 11:25
概率独立,楼主不懂不懂啊,

评论人:水寒361 评论日期:2009-10-4 12:01
经典的题目,楼主是正确的。
我记得当初教科书中的案例不是HIV,
而是另一种罕见病,呵呵。
其实这问题的心理陷阱在于,
大部分人第一时间不会联想到正常人被误诊的概率。

评论人:EL0DIA 评论日期:2009-10-4 13:14
LZ和楼上有些人显然犯了统计上的错误 ,一万个人里的感染率其实跟这个人的感染率是两种概念 。这个感染率应该这样解释 ,这个人和有艾滋病的异性性交得艾滋病的几率,才能作为这个个体的感染率 ,这个几率接近百分之百,而不是万分之一 。你们显然混淆了概念 ,拿群体里的感染率作为个体的感染几率 ,真的是十分可笑 ,还办出来什么浙大的书来 ,完全是胡扯 。



评论人:同人于郊 评论日期:2009-10-4 13:29
一说概率,就冒出一大帮不懂还非得发言的人出来,概率论真是科学的试金石啊。

但大局是这个博客更多的留言读者是真懂概率的,我很自豪。

评论人:面将 评论日期:2009-10-4 17:08


楼主是对的
很多人可能想不明白
其实可以这样直观的来看
10000个人去检查,平均来说
会检查出两个人感染了HIV
其中一个是真的感染了HIV被检查出来了
而剩下的9999个人中
还有一个人会被误诊为感染了HIV
因此,对这两个人来说
他们中哪一个是真的被感染,哪一个是被误诊的概率正好是50%


评论人:左丘失明 评论日期:2009-10-4 17:52
楼主还在嘴硬,还欣慰呢。吐一个先。
什么叫条件概率?事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为 P(A|B)。
10000个人去检测HIV,X1检测的正确与否对X2检测的正确与否有关吗?无论谁去检测,都是一样的错误率。要按楼主的说法,扔硬币前10次是正面,第11次正面的概率大概降到1%以下了(我懒得算具体数字)。


评论人:白色之剑 评论日期:2009-10-4 18:42
楼上懂概率吗?支持楼主。反驳请给出详细的数学证明和推理

评论人:好岁月 评论日期:2009-10-4 18:48
你挺行

评论人:371338812 评论日期:2009-10-4 18:48
楼上的例子和LZ的不一样把

评论人:eroticartist 评论日期:2009-10-4 20:30
第一个不是严格的50%,应该比这个数值要略低一点,应为:

999/(999+999.9)

评论人:eroticartist 评论日期:2009-10-4 20:32
分析这么多,再去复查一次不就得了?
------------------
如果第一次概率大概是50%,复查一次也只能上升到75%左右

评论人:langman39 评论日期:2009-10-4 21:59
真有的可能为99.9%。此为脑筋转弯题

评论人:蟑无迹 评论日期:2009-10-4 22:03
第一次看,觉得不可理解,怎么才50%。
但是仔细想了后知道了是怎么回事。攻击楼主的人请列个式子仔细算一下。
没想明白的请把整个事件的全部空间画出来,画10000行,每行有10000个样本,其中有一个艾滋。
其中最后10行的艾滋没有被检出(99.9%的准确率,或者说10/10000的漏网率)。
很重要的一点,每行都会有一个被误检的样本,这些样本一共10000个(严格地说,不到10000个)。
以下不分析了,太累了。



评论人:zhuyeyi 评论日期:2009-10-4 23:38
评论人:左丘失明 评论日期:2009-10-4 0:34
  你根本就没搞懂问题。
  随便找一个人,检出HIV阳性,正确率当然是99.9%。
  估计原文作者的意思是,检测10000个人,其中有一个人阳性,那么,这个阳性正确的概率是50%。
  其实这仍然不对。没有搞清楚条件概率。10000个人中,无论哪个是阳性,都与其他的被检测者无关,阴性也好,阳性也好,每个人正确的可能性都是99.9%。
--------------------------------------------
哈哈,这位仁兄比那个楼主厉害多了。楼主看书都看不懂。也比我厉害。我考试考完了,就忘记了。

评论人:zhuyeyi 评论日期:2009-10-4 23:42
评论人:swjdqpi 评论日期:2009-10-4 9:27
  回不准袭击警车:该好好补习《概率论与数理统计》的是你,我刚学完这本书,楼主分析的有理有据,引用的公式也是正确的。
-------------------------------
引用的公式是正确的,公式正确,但是不代表用出来就正确了。用出来完全就是错误的。
笑死人了。

评论人:zhuyeyi 评论日期:2009-10-4 23:44
当你查出来你有了艾滋病,你应该用条件概率去算。

评论人:罪恶都市23 评论日期:2009-10-5 0:01
我觉得博主很酷!!

评论人:weibiao00 评论日期:2009-10-5 1:06
第2个题,可以这么理解,就是说检查出阳性后,正确的比例,假设随即1000个人去检查乳腺癌症,可以推断出其中有10个患有乳腺癌,通过X光机,80%的确诊率可以检查出其中8个为阳性,剩余990人没有乳腺癌症的,10%的失误率将导致有99个“被”确诊为阳性,因此当你被检查为阳性的时候,总共“被”确诊为阳性的有99+8=107人,这107人中只有8人真正有乳腺癌症,概率是8/107

评论人:weibiao00 评论日期:2009-10-5 1:07
第2个题,可以这么理解,就是说检查出阳性后,正确的比例,假设随即1000个人去检查乳腺癌症,可以推断出其中有10个患有乳腺癌,通过X光机,80%的确诊率可以检查出其中8个为阳性,剩余990人没有乳腺癌症的,10%的失误率将导致有99个“被”确诊为阳性,因此当你被检查为阳性的时候,总共“被”确诊为阳性的有99+8=107人,这107人中只有8人真正有乳腺癌症,概率是8/107

评论人:weibiao00 评论日期:2009-10-5 1:39
原来以为 95% 的大学生和 40% 的医生,这个是胡编造的数据,看来大家真的一直太热衷于玩弄文字游戏和愤青了,以后多研究数据。

评论人:弗兰基0518 评论日期:2009-10-5 2:30
99.9/(99.9+0.01)
对你们的50%我真是无语了。
每个人患病的概率都是一样的,跟别的1万人有一毛钱的关系么?

评论人:lundan2008 评论日期:2009-10-5 3:37
南开女博士在学校宿舍内被强行押送精神病院:疑与知晓考博内幕有关
http://blog.sina.com.cn/s/blog_609b4b3d0100ewm6.html

读博历险记(一)
http://blog.sina.com.cn/s/blog_609b4b3d0100f9du.html


评论人:zhou0751 评论日期:2009-10-5 9:18
敢叫日月换新天!

评论人:削竹道长 评论日期:2009-10-5 11:10
偷换概念混淆视听——鉴定完毕

评论人:晚疯兮兮 评论日期:2009-10-5 11:25
但凡是能有一丁点概率论基础(不需要是理工科的)都能明白这事儿。
若是一丁点概率论基础也没有的人,看了也不会明白的。
楼主何必故弄玄虚。
而且据我了解,贝叶斯定理是大学数学必考的一个,这种题目当年我好想也做过……不过是癌症的检测问题……

评论人:9亩地 评论日期:2009-10-5 17:02
数学是基础啊

评论人:泗水之锋 评论日期:2009-10-5 17:36
概统基础啊,虽然没学《概率与统计》,但也旁听过几节课,贝叶斯定理是基础题,每年必考。
再次学习了,几个例子也是经典例子了

评论人:newedition 评论日期:2009-10-5 17:45
真不明白为啥有些人就是嘴硬呢!
楼主明明是对的 锴文 分析的再明白不过了,怎么还不能理解呢!

我们可以再取的极端一点,假如艾滋病的概率是一亿分之一,一个正常人被误诊的概率是万分之一,诸位没想明白的,您再想一下,是不是明白了啊?

就是说一亿人去体检 被误诊的人大概有1万人,而真正得病的就那一个人,您说着检测结果的可信度有多大啊?

所以说看检测精度要看相对精度,不是看绝对精度,误诊率万分之一从绝对值上看是很精确,但对于这么小概率的病症来说,这个诊断精度还是太逊了,以至于结果根本不值得信赖!


评论人:m1i9q8i9 评论日期:2009-10-5 18:13
深入浅出的道理
(乳腺癌治疗指南 www.120rxa.com.cn 乳腺癌治疗指南 link:www.120rxa.com.cn)

 晚期乳腺癌症状,乳腺癌治疗,中医治疗乳腺癌,乳腺癌治疗指南

评论人:se7en_v 评论日期:2009-10-5 19:26
经典的贝叶斯课程的例子了,我学的时候讲的是罪犯被判有罪的例子,多谢分享。

评论人:阳光teacher 评论日期:2009-10-5 19:53
读书读迂了吧

评论人:greenarmed 评论日期:2009-10-5 20:33
吸毒者检测
贝叶斯定理在检测吸毒者时很有用。假设一个常规的检测结果的敏感度与可靠度均为99%,也就是说,当被检者吸毒时,每次检测呈阳性(+)的概率为99%。而被检者不吸毒时,每次检测呈阴性(-)的概率为99%。从检测结果的概率来看,检测结果是比较准确的,但是贝叶斯定理确可以揭示一个潜在的问题。假设某公司将对其全体雇员进行一次鸦片吸食情况的检测,已知0.5%的雇员吸毒。我们想知道,每位医学检测呈阳性的雇员吸毒的概率有多高?令“D”为雇员吸毒事件,“N”为雇员不吸毒事件,“+”为检测呈阳性事件。可得

P(D)代表雇员吸毒的概率,不考虑其他情况,该值为0.005。因为公司的预先统计表明该公司的雇员中有0.5%的人吸食毒品,所以这个值就是D的先验概率。
P(N)代表雇员不吸毒的概率,显然,该值为0.995,也就是 1-P(D)。
P(+|D)代表吸毒者阳性检出率,这是一个条件概率,由于阳性检测准确性是99%,因此该值为0.99。
P(+|N)代表不吸毒者阳性检出率,也就是出错检测的概率,该值为0.01,因为对于不吸毒者,其检测为阴性的概率为99%, 因此,其被误检测成阳性的概率为1-99%。
P(+)代表不考虑其他因素的影响的阳性检出率。该值为0.0149 或者 1.49%。我们可以通过全概率公式计算得到:此概率 = 吸毒者阳性检出率(0.5% x 99% = 0.495%)+ 不吸毒者阳性检出率(99.5% x 1% = 0.995%)。P(+)=0.0149 是检测呈阳性的先验概率。用数学公式描述为:
p(d|+)=p(+|d)p(d)/p(+)=0.3322

尽管我们的检测结果可靠性很高,但是只能得出如下结论:如果某人检测呈阳性,那么此人是吸毒的概率只有大约33%,也就是说此人不吸毒的可能性比较大。我们测试的条件(本例中指D,雇员吸毒)越难发生,误判的可能性越大。

http://zh.wikipedia.org/wiki/%E8%B4%9D%E5%8F%B6%E6%96%AF%E5%AE%9A%E7%90%86


评论人:阳光teacher 评论日期:2009-10-5 20:34
现代技术检测 HIV 病毒的准确度已经到了惊人的程度。如果一个人真是 HIV 阳性,血液检测的手段有 99.9% 的准确率,也就是说有 99.9% 的可能性把他这个阳性给检查出来而不漏网。如果一个人不携带 HIV,那么检测手段的精度更高,达到99.99% - 也就是说有 99.99% 的可能性不会冤枉他。
---------------------------
1亿人中1万人HIV呈阳性:检查结果[1万*99.9%+(1亿-1万)*(1-99.99%)]=9990+9999
1亿人中1千万人HIV呈阳性:检查结果[1千万*99.9%+(1亿-1千万)*(1-99.99%)]=999万+9000
二者的可能性
9990/[9990+9999]=49.98%
999万/[999万+9000]=99.91%

评论人:cxyz0508 评论日期:2009-10-5 20:43
可是现实生活中,很少人这样想问题。maths is important,但是生活中说条件概率,有几人能懂

评论人:钟秋节 评论日期:2009-10-5 21:58


恐怖呀.万分之一的人有爱滋病.那么全世界60亿人就有60万人.而事实上是不止这个数.所以这个假设是不成立的.





评论人:spuitwater 评论日期:2009-10-6 3:04
神奇的概率论与数理统计~

评论人:射日客 评论日期:2009-10-6 9:02
楼主强人啊,这么喜欢用数理方法来看待现实,很对我的胃口,不知道楼主有没有关心过美剧啊,有一部《Numb3rs》应该很对你的胃口,希望你能对这里面的数学问题也谈谈看法啊。

博客很不错,收藏了。

评论人:de7m 评论日期:2009-10-6 9:29
楼主的分析很正确。已经过了几百年时间的考验。

只不过讲给哪些骂人的人听:
当你血液检测验出有HIV的时候,说明了你真HIV的概率已比普通人群高了很多倍,但并不是检测方法的精确度那么高,先别把自已吓死。

你应该进一步检查。

评论人:黑影天下 评论日期:2009-10-6 10:39
呵呵!精辟,LZL厉害哦!

评论人:Sir_Mullich 评论日期:2009-10-6 10:43
关于复查:因为只有初查阳性的人才要复查,所以复查者患病的概率是50%。假设20000个人复查,其中10000个HIV患者9990个被确诊而10个被漏,10000个正常人有1个还是被误诊。所以如果一个人经过两次检查都是阳性,那他的患病率就是1/(9990+1)=99.99%,而不是75%。

再进一步,如果一个人初查阳性复查阴性,他患病概率是10/(9999+10),大约是千分之一。

评论人:huayanglei 评论日期:2009-10-6 10:56
lz好强大 好多人都绕进了你的圈里

评论人:台球打成高尔夫 评论日期:2009-10-6 12:04
如果一般人感染 HIV 的概率是 0.02%呢?那他被误诊的概率就是33.33%?

评论人:台球打成高尔夫 评论日期:2009-10-6 12:18
概率不会,用小学数学算算。一万人的样本太小了,100万人有1万个感染者,99万个未感染,1万个感染者会漏掉一个,99万个未感染者会冤枉99个,所以检出来的感染者是198个,但实际感染者是100个,所以被检出的感染者真正感染的可能性是100/198=50.51%

评论人:台球打成高尔夫 评论日期:2009-10-6 12:27
我晕,算错了,俺从小数学就不好,不在这丢人现眼了

评论人:羊一下 评论日期:2009-10-6 14:47
你很概率...

帮我算算下期彩票 的号吧

评论人:左手切菜 评论日期:2009-10-6 14:56
“现在假设我们随便在街头找一个人给他做检查,发现检测结果是 HIV 阳性,那么请问这个人真有 HIV 的可能性是多大呢?”

他得没得HIV,与其他人有什么关系?

你说的 1万个人里有1个,,这个“1个”条件 是你自己后来加上去的?。题目已经发生了变化。

别迷信逻辑计算。






评论人:_156_ 评论日期:2009-10-6 16:07
"三人行"超级500人群欢迎大家加入,QQ群号26193366.本着"三人行,必有我师"的宗旨,打造一个工作,学习,生活的交流平台,闲聊中增长知识。群员互通有无,交流知识,增长经验,达到提高个人能力的目的.


评论人:meiziwangba 评论日期:2009-10-6 16:28
小妹生活所迫 在聊天室做小姐 充值10元可以看BB出水

收费XX聊天室(充值10元钱可以看BB)这可是真人哦

 强烈鄙视那些不去验证就说是病毒广告的家伙!

 聊天室地址: www.sohobuy.com.cn 女的大多还算漂亮~~

 值的说明的是此聊天室虽然页面上声明他们不收取任何费用

其实只能试看10分钟但看到的刺激场面,充值(充值10元钱就看BB) 也是值得的

评论人:sangdaojun 评论日期:2009-10-6 16:32
整个概率论体系都是有严重问题的。
如果一个医院住了10000个HIV病人,那么结果是10000个人而不是你说的百分之零点一。
不要用一个错误的定律去证明一个论点。


评论人:田丫少年 评论日期:2009-10-6 16:48
确实是50%
我的理解:
粗略的讲,10000个人中只有1个被误诊而唯一一个真的被误诊的概率忽略,
也就是说,如果万中选一而且那个人被“误诊”了那么真假概率一半一半。

评论人:hoposoft 评论日期:2009-10-6 17:44
其实问题很简单,非说这么复杂干嘛.

问题的关键在于,他这个概率是有前提的,前提就是:这个人已经被检测为阳性了,以此为前提再来说他是否为阳性的概率...

评论人:人世间418 评论日期:2009-10-6 17:53
误诊无论什么病都存在

评论人:时尚魅力馆 评论日期:2009-10-6 18:18
无论是什么都会发生误差的

欢迎到我的小店逛逛 http://shop58758959.taobao.com/

评论人:很多的 评论日期:2009-10-6 20:43
看到这里的回复,我发现我国高等教育的普及率没有我感觉到的那么高。
很简单的条件概率问题么,几乎所有理工科的大学生都要学的,是仅次于古典概型的简单问题。如果忘记贝叶斯公式具体怎么写倒也正常,很容易查到,但居然“讨论”起来,真的是非常……

顺便说一下,lz文章最后提什么找特务,就很搞笑了。概率论和数理统计的数学体系,是建立在不确定性集合的基础上的,它只能反映出基于某个样本空间的某类事件发生的可能性,但它一般很难做出确定性的结论。统计学的方法一般是不能适用于需要确定性结论的个体的,抓特务这种事情,其最后的结论只能是“是”和“否”,是非常典型的确定性集合。对于一个调查特务的案件来说,你最后只能认定其到底是不是特务,绝不可能用统计学给出一个“是特务的概率”,或者利用模糊数学给出一个“是特务的隶属度”之类的数学结论。因此在抓特务的的问题上,采用统计学的视角来考察“冤假错案”,是没有意义的。
由此可见,lz对数学本身缺乏恰当的理解。

比如说,我们都知道,一个人在参加一场考试的时候,其最后的成绩与各种因素有关,从统计学的角度,一个人的考试成绩,对其真实能力的反应程度符合正态分布,但在具体社会实践中,我们将认为考试成绩(很可能仅有一次测试)就是确定其能力的依据。但你不能说,在数学上,由于样本空间(考试次数)不足,所以考试成绩不能准确反映出其学习能力,因此类似于高考这样的考试,都是荒谬的。

数学的方法是不可滥用的。实际上,整个人类生活中,目前人类的数学知识能够计算和反映的,仅是极小的一部分。

评论人:laosanwang 评论日期:2009-10-6 20:54
概率问题是很复杂的问题,有的人仅仅是靠个人生活经验来解释,有的人依靠一知半解的道理来分析。个人生活经验中有的是正确的,有的是错误的。概率讲的是随机事件出现的可能性的大小,所以我们首先要清楚某个问题是否是随机事件,如果不满足这个前提条件,就难以分析其发生的概率的大小。感染艾滋与没有感染艾滋不是一个随机事件,检查结果是正确的还是错误的是一个随机事件,如果把这两个问题混在一起谈就难以找到问题的答案。

评论人:yy071107 评论日期:2009-10-6 23:55
0.999p+(1-p)*(1-0.9999)=1
p=9989/9999=.998999999...

评论人:yy071107 评论日期:2009-10-6 23:56
高中数学题

评论人:yy071107 评论日期:2009-10-7 0:02
现代技术检测 HIV 病毒的准确度已经到了惊人的程度。如果一个人真是 HIV 阳性,血液检测的手段有 99.9% 的准确率,也就是说有 99.9% 的可能性把他这个阳性给检查出来而不漏网。如果一个人不携带 HIV,那么检测手段的精度更高,达到99.99% - 也就是说有 99.99% 的可能性不会冤枉他。
  
  现在假设我们随便在街头找一个人给他做检查,发现检测结果是 HIV 阳性,那么请问这个人真有 HIV 的可能性是多大呢?

此题答案如上


评论人:哈巴狼 评论日期:2009-10-7 0:24
楼主,差点遭你蒙了!不过看来你也没看清楚题,大家只需搞清楚他解释里的一句话:
他说设我们随机地找一万个人来做实验。根据 HIV 病毒的分布,这一万人中应该只有一个人是真有 HIV 的。请问这是为什么?题里面可没这个条件!题里只告诉了我们:有爱滋且检测出来有的概率0.999,没艾滋检测出来也没有的概率0.9999,并没说你取的这一万人样本里面就只有一个人有艾滋。这相当于是你不知不觉给我们附加了一个条件,艾滋病患病率是0.0001。
关键问题也在这里,你运算过程当中都是以这个患病率作为已知条件的。如果你一开始在题中明确告诉大家艾滋病患病率是0.0001,我想很多人都不会做错。最后补充的就是这个0.5也是约等于,精确的应该是0.499774876。具体运算上面有同仁给出了。


评论人:我系达闻西 评论日期:2009-10-7 0:29
纯属YY

评论人:greenarmed 评论日期:2009-10-5 20:33
吸毒者检测
贝叶斯定理在检测吸毒者时很有用。假设一个常规的检测结果的敏感度与可靠度均为99%,也就是说,当被检者吸毒时,每次检测呈阳性(+)的概率为99%。而被检者不吸毒时,每次检测呈阴性(-)的概率为99%。从检测结果的概率来看,检测结果是比较准确的,但是贝叶斯定理确可以揭示一个潜在的问题。假设某公司将对其全体雇员进行一次鸦片吸食情况的检测,已知0.5%的雇员吸毒。我们想知道,每位医学检测呈阳性的雇员吸毒的概率有多高?令“D”为雇员吸毒事件,“N”为雇员不吸毒事件,“+”为检测呈阳性事件。可得

P(D)代表雇员吸毒的概率,不考虑其他情况,该值为0.005。因为公司的预先统计表明该公司的雇员中有0.5%的人吸食毒品,所以这个值就是D的先验概率。
P(N)代表雇员不吸毒的概率,显然,该值为0.995,也就是 1-P(D)。
P(+|D)代表吸毒者阳性检出率,这是一个条件概率,由于阳性检测准确性是99%,因此该值为0.99。
P(+|N)代表不吸毒者阳性检出率,也就是出错检测的概率,该值为0.01,因为对于不吸毒者,其检测为阴性的概率为99%, 因此,其被误检测成阳性的概率为1-99%。
P(+)代表不考虑其他因素的影响的阳性检出率。该值为0.0149 或者 1.49%。我们可以通过全概率公式计算得到:此概率 = 吸毒者阳性检出率(0.5% x 99% = 0.495%)+ 不吸毒者阳性检出率(99.5% x 1% = 0.995%)。P(+)=0.0149 是检测呈阳性的先验概率。用数学公式描述为:
p(d|+)=p(+|d)p(d)/p(+)=0.3322

尽管我们的检测结果可靠性很高,但是只能得出如下结论:如果某人检测呈阳性,那么此人是吸毒的概率只有大约33%,也就是说此人不吸毒的可能性比较大。我们测试的条件(本例中指D,雇员吸毒)越难发生,误判的可能性越大。

http://zh.wikipedia.org/wiki/%E8%B4%9D%E5%8F%B6%E6%96%AF%E5%AE%9A%E7%90%86



题目有两个假设。
第一是:假设一个常规的检测结果的敏感度与可靠度均为99%
第二是:因为公司的预先统计表明该公司的雇员中有0.5%的人吸食毒品
在这两个假设条件下得出来的结果:如果某人检测呈阳性,那么此人是吸毒的概率只有大约33%是没有错误的。
但现在我们反推回去,“如果某人检测呈阳性,那么此人是吸毒的概率只有大约33%”=“检测结果的敏感度与可靠度均为33%”与上边的第一个假设的可靠度99%不相符合。
假如客观事实是该公司的雇员中有0.5%的人吸食毒品,那么假设的99%的检查结果根本不成立,因为与上边的推论结果相矛盾。
题目的数理逻辑没有错,结论不能证明假设条件,就表示假设不成立。如此而已。。。。。。。。。。。。。。。。。。。。

评论人:贾君鹏1 评论日期:2009-10-7 1:10
晕哦,这个例子根本不满足贝叶斯公式的!

这是在求已知被检测为 HIV 感染者的朋友真有 HIV 的可能性,这是属于假设检验的范畴。题设中出现的数字均为在已知前提下的检验水平,具体的说明要用数学语言描述,这里无法写。楼主用的是错误的理论,自然得出了一个错误的结论!

评论人:嘴不大 评论日期:2009-10-7 5:38
这里面有概念错误,误诊率真象楼主说的这么高,医院早被砸平了,哈哈。
你这个概率属于文字游戏。

比如这一段:“如果一个人不携带 HIV,那么检测手段的精度更高,达到99.99% - 也就是说有 99.99% 的可能性不会冤枉他。”
此处的意思是说,1万个阳性中,有1个是假阳性,这一个是被冤枉的。
而不是楼主所理解的,1万个阴性(未感染)中,有1个被检查成阳性。



评论人:卡费尔 评论日期:2009-10-7 8:08
评论人:很多的 评论日期:2009-10-6 20:43
  看到这里的回复,我发现我国高等教育的普及率没有我感觉到的那么高。
  很简单的条件概率问题么,几乎所有理工科的大学生都要学的,是仅次于古典概型的简单问题。如果忘记贝叶斯公式具体怎么写倒也正常,很容易查到,但居然“讨论”起来,真的是非常……
  
  顺便说一下,lz文章最后提什么找特务,就很搞笑了。概率论和数理统计的数学体系,是建立在不确定性集合的基础上的,它只能反映出基于某个样本空间的某类事件发生的可能性,但它一般很难做出确定性的结论。统计学的方法一般是不能适用于需要确定性结论的个体的,抓特务这种事情,其最后的结论只能是“是”和“否”,是非常典型的确定性集合。对于一个调查特务的案件来说,你最后只能认定其到底是不是特务,绝不可能用统计学给出一个“是特务的概率”,或者利用模糊数学给出一个“是特务的隶属度”之类的数学结论。因此在抓特务的的问题上,采用统计学的视角来考察“冤假错案”,是没有意义的。
  由此可见,lz对数学本身缺乏恰当的理解。
===========================
结论只能是“是”和“否”的对象空间照样是非常典型的统计样本空间。
大概你以为只有连续变量或模糊变量才能作为统计变量,而离散变量或二值离散变量就不能采用统计学的视角来考察了吧?哈哈。
楼主不搞笑,倒是你有点对数学本身缺乏恰当的理解。

评论人:wym12309 评论日期:2009-10-7 8:44
法官等同医生!在实践中审判职能与医能医德尤为重要;但二之间各有春秋?

冤假错案的发生绝对不与疑难疾病相题并论!因为冤假错案纯属是人为的!凡是讼争有法可依,只要是一个有民事行为力及是一个合法审判员他就知道公正判断!而疾病有的靠科学仪器机械性珍断显然有别。

评论人:saparty 评论日期:2009-10-7 10:13
LZ第1个假设,有很大的歧义
所以很多人都看不明白
如果LZ改一下 变成 在街上拉了很多人 结果检测到一个人事有HIV的就好理解
要是随便拉一个人,这个人就检测出有HIV这事本身的概率就是很小的

评论人:小贝小贝最爱最爱 评论日期:2009-10-7 10:44
对这么一个单个个体,有概率之说吗?它的样本空间如此小,那么只有两种结果,要么是HIV,要么不是HIV。不必要用概率来套的

评论人:荷花的女人 评论日期:2009-10-7 10:55
事实就是事实,事实大于雄辩,详情http://blog.sina.com.cn/u/1635401900大量记录了重庆市渝北区政法委书记袁勤华的犯罪事实,里面有他们的犯罪照片和视频。希望有同情弱势群体的市民伸出援助之手多多转发一下,不要让黑势力造势者逍遥法外,为和谐社会贡献一分力量,谢谢



评论人:aftertime1983 评论日期:2009-10-7 11:35
前面算是没有问题 后面的直观解释就是越解释越糊涂 50%

评论人:西瓜地de守護者 评论日期:2009-10-7 14:14
%>_<%


评论人:ketop2 评论日期:2009-10-7 20:09
假如阳性率99.99%,我们基本上就是按100%说事,其实你是拿0.001来说话而已

评论人:current82 评论日期:2009-10-7 22:09
楼主分析不错

评论人:jccgtianfeng 评论日期:2009-10-7 22:43
“直观的解释是这样的。假设我们随机地找一万个人来做实验。根据 HIV 病毒的分布,这一万人中应该只有一个人是真有 HIV 的。”

以上是楼主写的。

为什么这一万个人里会有一个HIV呢?

如果根据HIV分布,一万人里一定有一个HIV,那是不是说,我投一万次硬币,一定有50五千次正面呢?

请楼主回答

评论人:kuxs0619 评论日期:2009-10-8 8:13
这就是全概率公式与bayes公式的应用。
已知所有原因求结果应用全概率公式(即求验后概率);已知结果求具体哪个原因发生的概率用bayes公式(即求先验概率)。
这只是一个大学一年级学生期末考试必考的一道题目而已。

评论人:adxiao2009 评论日期:2009-10-8 10:48
................

评论人:mayflowercw 评论日期:2009-10-8 10:51
中外冤案不一样·······

评论人:goddc 评论日期:2009-10-8 11:00
小弟的想法仅供大家讨论,有不对的地方请指正。
我们首先把问题搞清楚。
问题是:现在假设我们随便在街头找一个人给他做检查,发现检测结果是 HIV 阳性,那么请问这个人真有 HIV 的可能性是多大呢?
这里的大街上随便找一个人的条件根本不满足条件概率的计算条件。
按照楼主的算法,如果现在有1w人去体检,一个人测出有HIV,那么他真有HIV的概率才是0.5。
大街上找个人来体检,被测出了有HIV,从检测手段的精确度来看,那么他0.9999就真有HIV。

评论人:面将 评论日期:2009-10-8 11:42
怎么还有这么多人想不明白呢?
随便一本象样的概率论教科书
在讲到贝叶斯定理的时候都会提到类似的例子的。

在这个例子里,
楼主说的“随便在街头找一个人给他做检查”,
这个前提条件很重要。
因为是随便在街头找的一个人,
那么这个人真有HIV的概率是0.0001,
而他被误诊为有HIV的概率也是0.0001,
这两种情况出现的概率是一样的,虽然都很低,
因此,如果检查的结果是这个人感染了HIV,
你并不能确定到底他是真的感染,还是被误诊的,
你只能说二者各占0.5的概率。

假如没有上述这个前提条件,情况当然就不一样,
比如来检查的这个人,性生活比较混乱,
这个人如果被检查出有HIV,那么他真有HIV的可能性就大多了

我怀疑上面那些不明白的人,是不是混淆了这两种不同的前提条件。





评论人:yuminqiaofu 评论日期:2009-10-8 11:46
楼主列举的艾滋病例子的计算是基本正确的,但关于“文革”的推论就不正确了。“文革”中如此多的冤假错案,并非是由于公众不懂概率论单凭直觉办案造成的。

评论人:anpei1990 评论日期:2009-10-8 13:06
越看越糊涂,基础不扎实啊1

评论人:myboke502 评论日期:2009-10-8 13:14
实践检验真理

评论人:苹果哈密瓜11 评论日期:2009-10-8 15:43
这个从单纯数学的角度是对的,但不意味着现实中查出2个HIV感染就是有一个是错的。因为现实中去接受这个检查的人中,患有AIDS的人的概率不会是万分之一,因为只有发病或存在嫌疑的人才会去检查。另就算查到是有但事实上是被冤枉的,也会进行复查,这个概率又会大大减少。。。。

评论人:苹果哈密瓜11 评论日期:2009-10-8 15:47
“直观的解释是这样的。假设我们随机地找一万个人来做实验。根据 HIV 病毒的分布,这一万人中应该只有一个人是真有 HIV 的。”
  
  以上是楼主写的。
  
  为什么这一万个人里会有一个HIV呢?
  
  如果根据HIV分布,一万人里一定有一个HIV,那是不是说,我投一万次硬币,一定有50五千次正面呢?
  
  请楼主回答
----------------------------------
我帮忙回答了:
从统计概率的角度讲,当样本很大的时候,事情就会按照概率去发生,如果把一万当成足够大的样本,那“我投一万次硬币,一定有50五千次正面”就是正确的。

评论人:wx8873 评论日期:2009-10-8 17:29
看了一下,本帖中其实很多人不懂概率,楼主的算法是正确的,说他错误的人其实是太笨了,没法理解严格的概率统计计算。

评论人:ybck2008 评论日期:2009-10-9 10:48
你的文字啰嗦了!有几人耐心看完!

评论人:jali2009 评论日期:2009-10-9 12:39
穷富小朋友看图片,图片里面有只小兔子座在餐桌旁边,前面摆了一道很丰盛的菜,小兔子的嘴巴是嘟起来的,旁边还座着兔妈妈正看着小兔子,穷人家的小朋友说,小兔子饿了,想吃东西,可是兔妈妈不准,而富人家的小朋友确说,小兔子不肯吃饭,兔妈妈偏让它吃...

评论人:很多的 评论日期:2009-10-9 13:50
评论人:卡费尔 评论日期:2009-10-7 8:08
  结论只能是“是”和“否”的对象空间照样是非常典型的统计样本空间。
  大概你以为只有连续变量或模糊变量才能作为统计变量,而离散变量或二值离散变量就不能采用统计学的视角来考察了吧?哈哈。
  楼主不搞笑,倒是你有点对数学本身缺乏恰当的理解。
===========

你的阅读理解能力很成问题,我有说离散变量不能作为统计变量吗?

数学要准确描述现实世界,必须要有恰当的模型,用条件概率分析疾病的患病率是可行的,但是分析抓特务的“错误率”就不行,因为抓特务的原则是宁可错杀一千不可放过一个。所以“错抓率”是没有意义的。
试举一例,我们现在怀疑5个人中有一个是特务,从数学上来说,每个人是特务的概率为20%,但在实践中,往往因为审查成本太大,而将这5个人全部视为特务来处理(当然处理方式不一定都是抓起来,也可以是调离原有职位),那么这里的错误率必然是80%。但这个错误率根本没有意义,因为抓特务的确定性特征极为明显:凡是可疑的就是要处理的,概率参数对抓特务的行为没有参考价值。


评论人:有缘风 评论日期:2009-10-9 20:22
LZ脑子进水了

评论人:我若水 评论日期:2009-10-9 23:43
这个高中就学过了,lz是对的,但是想问个问题,检验准确率99.9%是怎么来的?

评论人:mountainfoot 评论日期:2009-10-17 12:07
"很多的"老兄,你就是传说中的理科“掉书袋”的。。。用白话讲述科学原理,比掉书袋高明得多。

评论人:天涯网友(游客) 评论日期:2009-10-20 15:16
问题请问:
对小概率疾病,检测或者提高检测精度的意义何在呢?
既然测出阳性,该病人实际感染的可能是50%或者更低
那么为何要检测呢,意义何在呢?困惑



登录 | 新人注册>>
输入您的评论:(不支持HTML标签)


验证码
本文所属博客:学而时嘻之
引用地址:


© 天涯社区