贝叶斯定理为什么这么强大?这篇关于它的原理与应用的书终于讲清楚了!
图灵教育·
2024-11-28
相信很多人都或多或少的听过贝叶斯定理,但它到底怎么用?又怎么学?许多的书都无法讲清楚。但《趣学贝叶斯统计》却独辟蹊径,用一个个趣味十足、脑洞大开的例子,将贝叶斯统计的原理和用途娓娓道来。
在书中你可以评估UFO出现在自家后院中的可能性、《星球大战》中汉•索罗穿越小行星带幸存下来的可能性、抓鸭子中大奖游戏的公平性,并学会用乐高积木理解贝叶斯定理。
简直是最好的贝叶斯入门书!今天我们就研究如何将贝叶斯定理当作一种概率工具,对不确定性进行逻辑推理。将利用贝叶斯定理来计算和量化在给定数据的情况下,信念有多大的可能性为真。为此,需要使用该定理的三要素——后验概率、似然和先验概率。这3个要素将在这场贝叶斯统计和概率探险之旅中频繁出现。
来源 | 《趣学贝叶斯统计:橡皮鸭、乐高和星球大战中的统计学》
作者 | [美] 威尔·库尔特(Will Kurt)
译者 | 王凌云
1 贝叶斯定理三要素
贝叶斯定理可以准确地量化所观察到的数据改变我们信念的概率。这也就是。简单来说,我们想量化的是:在所观察到的数据下,自己对信念的坚信程度。在贝叶斯公式中,这个要素的术语是后验概率(posterior probability,简称为“后验”),也就是将通过贝叶斯定理所求出的解。
为了得到后验概率,还需要用到下一个要素:似然(likelihood)。它表示在给定信念的情况下,观察到某一数据的概率,也就是(数据|信念)。
最后,需要量化初始信念的概率,即 (信念)。这一要素在贝叶斯定理中被称为先验概率(prior probability,简称为“先验”),它表示我们在看到数据之前的信念强度。似然和先验结合在一起就会形成后验。通常情况下,我们需要使用数据的概率 (数据)对后验归一化,从而使其值介于0和1之间。然而在实践中并不总是需要 (数据),所以这个值没有特殊的名字。
你已经知道,我们将信念称为假设 ,并用变量 来表示数据。图8-1展示了贝叶斯定理的各个要素。
图8-1 贝叶斯定理的要素
在下文中,我们将调查一起犯罪案件,并结合这些要素进行推理。
2 调查犯罪现场
假设,一天你下班回家后,发现家里的窗户玻璃碎了,前门开着,你的笔记本计算机也不见了。你的第一反应可能是:“家里被盗了!”但你是如何得出这个结论的?更重要的是,你如何量化这个信念呢?
为了解决这个问题,我们需要补充贝叶斯定理中缺失的部分。
1 求解似然
首先,需要求解似然,具体到这个例子也就是,如果家里真的被盗了,同样的数据会被观察到的概率。换句话说,也就是数据与假设的吻合程度:
值得注意的是,尽管在这个例子中,我们只是猜测有哪些数据,但其实也可以通过一些调查来获得更好的判断。比如,我们可以去当地警察局询问盗窃案件犯罪现场的统计数据,或者浏览最近关于盗窃案的新闻报道。这样就可以得到更准确的似然估计:如果被盗,你看到这些数据的概率。
2 计算先验概率
接下来,我们需要确定家里被盗的概率。这也是本例的先验概率。先验概率非常重要,因为它允许我们使用背景信息对似然进行调整。假设前面描述的场景发生在一个荒岛上,而你是岛上唯一的居民,那么你家几乎不可能被盗(至少是被人类)。换一个场景,如果你家位于犯罪率很高的街区,那么盗窃事件就可能会经常发生。为简单起见,我们将被盗的先验概率设定为:
请记住,如果有不同的或额外的数据,随时可以调整这个概率。
现在,我们几乎有了计算后验概率的所有条件,只差对数据进行归一化处理。在继续之前,先来看看未归一化的后验概率:
这个值非常小,太令人惊讶了!这是因为直觉告诉我们,根据观察到的数据,家里被盗的概率看起来非常大。这里,我们还没有分析观察到这些数据的概率。
3 归一化数据
分子中的概率相当小,因为没有对它进行归一化处理。
0.050
0.006
0.010
0.030
0.005
0.060
0.001
0.300
图8-2 随着数据发生概率的减小,后验概率会增大
思考下面这个极端的例子:你朋友成为百万富翁的“唯二”途径是中彩票或者从某个连他自己都不知道的家族成员那里继承遗产。因此,你朋友成为百万富翁的概率非常小。然而,你发现这位朋友确实成了百万富翁。那么,他中彩票的概率就变大了,因为这是他成为百万富翁仅有的两种方式之一。
3 考虑备择假设
现在提出另外一个假设,并将它与原来的假设进行比较。新假设包括以下3个事件。
(1) 邻居家孩子把棒球打到了窗户上。
(2) 你离开家时忘了锁门。
(3) 你忘了自己带笔记本计算机去上班并把它落在了办公室。
1 备择假设的似然
如果假设中的所有事件都发生了,那么你肯定会观察到窗户玻璃碎了、前门开着以及笔记本计算机不见了。
2 备择假设的先验概率
先验概率表示的是这3个事件都发生的可能性,这也意味着需要先计算出其中每个事件的概率,然后通过乘法法则来确定先验概率。在这个例子中,我们假设每个可能的结果都是条件独立的。
备择假设的第一项内容是,邻居家孩子打棒球时不小心打碎了窗户玻璃。虽然这在电影中很常见,但现实中我从未听说过这种情况,更多的情况是发生了盗窃,所以我们假设棒球打碎窗户玻璃的概率是被盗概率的一半:
备择假设的第二项内容是你忘了锁门。这种情况相当普遍,所以假设它每月发生一次:
最后,让我们来看看将笔记本计算机落在办公室的概率。虽然带着笔记本计算机去上班并将它落在办公室可能很常见,但完全忘记带着它去上班的情况不太常见。假设这种情况每年会发生一次:
正如你看到的,这3个事件同时发生的先验概率很小。现在我们需要计算出这两个假设的后验概率以进行比较。
3 备择假设的后验概率
4 比较非归一化的后验概率
推荐阅读
《趣学贝叶斯统计:橡皮鸭、乐高和星球大战中的统计学》
作者:[美] 威尔·库尔特(Will Kurt)
译者:王凌云
本书用十余个趣味十足、脑洞大开的例子,将贝叶斯统计的原理和用途娓娓道来。你将从直觉出发,自然而然地习得数学思维。读完本书,你会发现自己开始从概率角度思考每一个问题,并能坦然面对不确定性,做出更好的决策。
02
《贝叶斯的博弈:数学、思维与人工智能》
作者:黄黎原
译者:方弦
法国数学类科普书、大学数学参考及教材类图书畅销书目,在机器学习、人工智能、逻辑学和哲学等众多领域中,探索贝叶斯定理蕴藏的智慧与哲理。
贝叶斯定理一旦与算法相结合,就不再是一套枯燥的数学理论或认识论,而变成了应用广泛的知识宝库,催生了众多现代数学定理,以及令人称道的实践成果。
《概率论沉思录》
作者:埃德温·汤普森·杰恩斯
译者:廖海仁
著名数学物理学家,圣路易斯华盛顿大学和斯坦福大学教授,统计力学和概率统计推断方面权谋埃德温·汤普森·杰恩斯,40年思想著作;
无数读者苦等15年的概率论神作,英文版豆瓣评分9.4高分;
概率论作为逻辑的延伸,是所有科学推断的基础。本书收集了概率统计的各种线索,将概率和统计推断融合在一起,用新的观点生动地描述了概率论在物理学、数学、经济学、化学和生物学等领域中的广泛应用,尤其是阐述了贝叶斯理论的丰富应用,弥补了传统概率论和统计学的不足,并揭开了众多悖论背后的玄机。
Like
Share
Wow
Comment