在数学中,没有任何一个分支会像概率这样有那么多的例子表明凭直觉往往会得出错误的结论,正确的解答与常识相矛盾。——《啊哈!原来如此》
几个月前就跟室友@小礼子讨论了一些概率学的东西,只是由于各种原因也一直没有发文,只是零零散散有些笔记放着,今天在朋友圈正好又看到了一道概率题,于是突发奇想决定发文一篇,以供小伙伴们阅读与讨论。
虽然说最精彩的问题在结尾,但是估计没有人能看完……
还是先从最近看到的这个问题说起……
酒鬼问题
已知某酒鬼有90%的日子都会出去喝酒,喝酒只会去固定三家酒吧(三家酒吧去的频率一样),今天警察找了其中两家酒吧都没有找到酒鬼,问酒鬼在第三家酒吧的概率。
啊~什么后验概率啊,先验概率啊,贝叶斯公式啊,全概率公式啊,突然从脑海里闪了一下,然后就不见了,都又还给老师了。然而不重要,我们用尽量简单易懂的语言来解答这种问题。
先定义一些基本术语,相信大家都看得懂:
- 对于事件A,P(A)表示A事件发生的概率
- 用P(˜A)表示A事件不发生的概率(实在是找不到合适的符号表示了,后面有图正确地表示了这个符号),可以知道P(˜A)+P(A)=1
- P(A|B)表示B事件已发生的情况下A事件发生的概率
假定事件A是 酒鬼去酒吧,根据题意有P(A)=90%;
假设事件B是 酒鬼在第三家酒吧;
假设事件C是 酒鬼不在第一家和第二家酒吧。
根据题意呢,P(B|A)=1/3 即如果酒鬼在酒吧,那么在第三家酒吧(其实不管哪家酒吧都一样)的概率是1/3。
我们现在要算一下P(B),
根据全概率公式有P(B) = P(B|A)*P(A) + P(B|˜A)*P(˜A)。
等等,说好的简单易懂呢……
好吧,其实上面的式子很简答,我先解释一下。
有时候求某个事件M的概率并不好算,可是我可能知道一些其他条件,比如在事件N下M发生的概率P(M|N), 于是有P(M|N)*P(N)就表示在事件N下,M发生的概率;剩下的部分就是N不发生时M发生的概率P(M|˜N)*P(˜N)。 所以P(M) = P(M|N)*P(N) + P(M|˜N)*P(˜N), 其中P(N)+P(˜N)=1.
还是没看懂?我举个例子:你明天跑步的概率= 你明天吃饭的概率* (你吃饭情况下要跑步的概率) + 你明天不吃饭的概率*(你不吃饭的情况下要跑步的概率)。
因为 P(B|˜A) = 0(也就是说,酒鬼不在酒吧的情况下,酒鬼在第三家酒吧的概率是0),所以反正也没有右边的项了,
于是P(B)= 1/3 * 90% = 30%.
因为三家酒吧的概率是一样的,所以其实最终的结果就是酒鬼在任意一家酒吧的概率是30%,不在酒吧的概率是10%
你如果已经计算出这个了,也可以无视掉上面的计算过程了。
继续,我们要计算的是P(B|C),根据前面的,我们知道P(B) = P(B|C)*P(C) + P(B|˜C)*P(˜C)。
怎么又是这个……没关系,因为P(B|˜C) = 0 (也就是说,如果酒鬼在第一家或者第二家酒吧,那么他在第三家酒吧的概率就是0)。
看一下P(C),不在第一家和第二家酒吧就是表示要么在第三家(30%),要么不在酒吧(10%) 于是P(C)= 30% + 10% = 40%。
于是有P(B|C) = P(B)/P(C) = 30%/40% = 75%.
其实上面的问题也可以用贝叶斯公式来计算,这里就不写了,反正结果一样的~
两个小孩问题
一个家庭有两个孩子,一个是男孩,另一个是男孩的概率是多少(假设生男生女都是50%的概率)。
刚了解了全概率公式,马上应用一下,不过这题 得转化一下题目,题目意思是这样的:
有2个孩子,至少有一个是男孩的话,两个都是男孩子的概率是多少。
概率均等的情况下,我们知道一共只有这4种完全等概率的事件:
男男
男女
女男
女女
假设事件A是至少有一个是男孩,那么我们知道P(A)=3/4
假设事件B是两个都是男孩,那么P(B)=1/4
所以题目其实求的是在A发生时B的概率。根据刚才看到的P(B)=P(B|A)*P(A) + P(B|˜A)*P(˜A), 因为P(B|˜A)=0(意味着没有男孩的情况下,两个都是男孩的概率是0),
所以P(B|A) = P(B)/P(A) = 1/3.
不过这题更简单的解释是,4种情况中,满足1个男孩的只有前三种,而前三种情况中,符合2男的只有1种,所以是1/3.
两个小孩的变种问题
一个家庭有两个孩子,一个是星期二出生男孩,另一个也是男孩的概率有多少?
假设事件A是一个是星期二出生的男孩,(另一个可男可女);
假设事件B是一个是两个都是男孩,且至少一个是星期二出生。
先计算P(B) 。P(B)实际上是2个独立事件,事件1是两个都是男孩(1/4),和事件2有一个是星期二出生(注意事件2只是谈及出生,不涉及性别),事件2的发生概率是1-6/7*6/7=13/49(即1-两个都不是星期二出生的概率),或者也可以正向去计算,即(1).第一个是星期二出生而第二个不是(概率1/7*6/7);(2)第一个不是星期二出生而第二个是(概率6/7*1/7);(3)两个都是星期二出生(概率1/7*1/7)总和即1/7*6/7+6/7*1/7+1/7*1/7 = 13/49,当然也可以直接1/7-1/7*1/7。
所以P(B) = 1/4 * 13/49
P(A)呢实际上是首先包括了P(B),除此之外还有2个等概率的情况,就是一个是星期二出生的男孩,另一个是女孩,这块的概率是1/7*2*1/4.这里乘以2是因为有一男一女和一女一男的两种完全等价的情况。
所以P(A) = 1/4 * 2/7 + P(B)
最终计算的是P(B|A) = P(B)/P(A) = (13/49)/(2/7+13/49) = 13/27
你可能要问,右边那一坨P(B|˜A)*P(˜A)呢,相信你已经猜到了,反正是为0的……
至于为什么为0呢,我不会告诉你这是相互独立事件的……
假阳性问题
一步一步复杂之后,我们再简化一下,看这么一个问题,事实上,这个问题才是对文章第一行的一个完整的例子……

为什么会这样?为什么这种检验的准确率高达99%,但是可信度却不到2%?答案是与它的误报率太高有关。

三门问题
最后来个放松的问题了,问题描述主要摘自百度百科,稍作修改。
参赛者看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门可赢得该汽车,另外两扇门后面则各藏有一只山羊。当参赛者选定了一扇门,但未去开启它的时候,节目主持人开启剩下两扇门的其中一扇(节目主持人知道那扇门后面有汽车,他只会开启有山羊的门),露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。问题是:换另一扇门会否增加参赛者赢得汽车的机率。
两个信封悖论
本来说上一个问题是最后的放松问题了,这里又来了一个,别急,因为这个问题我根本不打算给结果。
读这题之前请确保你知道什么是数学期望,或者你能读懂下面的文字。
数学期望:简称期望,指的是试验中每次可能结果的概率乘以其结果的总和。
举例:如果一个比赛,有60%的概率赢得10元,40%的概率输5元,那么这个比赛的期望是60%*10 – 40% * 5 = 4元。
下面说正题。
让你在两个信封A和B之前作出选择。你被告知,其中一个信封内的钱是另一个信封内的两倍。你选择了信封A。接着,竞赛组织者问你是否要换另一个信封。你换不换,为什么?
啊,这个压轴题看起来好简单。
分析1:假设你朝信封A内瞥了一眼,发现装有10元。于是你推知信封B内有5元或者20元,于是你换信封B的数学期望是0.5*5+0.5*20 = 12.5元。于是换信封可以预期多获利2.5元。当然要选择换。
分析2:等等,A信封内的钱是B信封内钱的两倍的可能性,等于信封B内的钱是信封A内的钱的两倍的可能性。所以换或者不换都无所谓。
而且根据分析1,在你换完信封后,你可以在走一遍分析1,发现还是应该在继续换,感觉根本停不下来。
那么换还是不换呢,两个分析究竟哪个有什么错误呢?
参考文献
- 《思维魔方》 陈波 著
- 《啊哈!原来如此》 马丁·加德纳 著
- 百度百科
- 阮一峰的博客
本文共 1 个回复
七号球员 2018/09/28 01:40
必须看完~