贝叶斯准则的理解及其在实际中的应用
The Understanding of Bayes Criterion and Its Application in Practice
DOI: 10.12677/AE.2022.1211764, PDF, HTML, XML, 下载: 290  浏览: 583  科研立项经费支持
作者: 程 凤:西南交通大学数学学院,四川 成都
关键词: 贝叶斯准则条件概率教学案例教学效果Bayes Criterion Conditional Probability Case Teaching Teaching Effect
摘要: 在所有的数学发现中,贝叶斯准则是应用最多的准则之一,它被广泛应用于各个领域。在实际教学过程中,学生存在不能正确理解和应用贝叶斯准则的问题。本文将深入分析贝叶斯准则的本质并给出其在实际中的几个应用,帮助学生深刻理解这个准则并加强其在生活中应用贝叶斯思维解决实际问题的能力。
Abstract: In all the discoveries in mathematics, Bayes criterion is one of the most widely used criteria, which is widely used in various fields. In practical teaching process, we found that students could not understand and apply the Bayes criterion correctly. In this paper we will deeply analyze the essence of Bayes criterion and give several applications of it in real life, so as to help students understand this criterion deeply and strengthen their ability of applying Bayes thinking to solve practical problems in life.
文章引用:程凤. 贝叶斯准则的理解及其在实际中的应用[J]. 教育进展, 2022, 12(11): 5032-5037. https://doi.org/10.12677/AE.2022.1211764

1. 引言

贝叶斯准则是18世纪英国哲学家、数学家托马斯·贝叶斯(Tomas Bayes) (1702~1761)首先提出的。但是他自己并没有公开发表这一重大发现,而是他的朋友在他去世之后整理他的遗稿时发现的。贝叶斯准则是“概率论与数理统计”课程中的一个非常重要的公式,它涉及到条件概率公式,乘法公式和全概率公式,是高等院校理工科学生学习“概率论与数理统计”碰到的第一个不易理解和容易出错的地方。为了帮助学生深刻理解这个准则并加强其在生活中应用贝叶斯思维解决实际问题的能力,教师需要全方位向学生展示这个准则包含的重要思想及其本质,需要多角度向学生展示这个准则的实际应用。

贝叶斯准则给出了依据新信息来更新事件概率的计算方法。在现实生活中,人们往往根据以往的数据或者经验得出事件发生的概率(称为先验概率),而如果与之相关的事件发生后,人们对之前的事件有了新的认识,那么此时事件发生的概率自然就不同于之前的概率了,需要用条件概率表示(称为后验概率)。即随机事件发生的概率随着相关条件的发生而改变,一个命题真假的信念即主观概率随着相关证据的发现而改变。当正相关条件发生时,条件概率上调,当负相关条件发生时,条件概率下调。当有利证据发现时,主观概率上调,当不利证据发现时,主观概率下调。

贝叶斯准则涉及条件概率公式,乘法公式与全概率公式,具体还涉及先验概率(无条件概率)、向前条件概率、向后条件概率(后验概率)。因此在实际应用中常常会发生分不清先验概率和后验概率,将向前条件概率与向后条件概率弄混淆,导致计算和分析错误并得出错误的结论。

贝叶斯准则在实际中的应用非常广泛,在疾病诊断、案情分析、安全监测等多方面都发挥着非常重要的作用。周雪晴等 [1] 将临床医学传统统计学方法与贝叶斯准则相结合,建立了川崎病并发冠状动脉损伤(CAL)的贝叶斯模型,对川崎病并发CAL的认知模型进行初步探讨。傅莺莺和田振坤 [2] 利用贝叶斯公式解释了疾病监测中的概率问题。宁绍军和邹恒明 [3] 提出了一种以贝叶斯公式为基础的自适应垃圾邮件过滤方法,具有较强的自适应能力。万应君 [4] 利用贝叶斯法则作为解决证据审查中对案件事实认定不确定性问题的一个理性工具。杨静等 [5] 给出了贝叶斯公式的几个应用,以丰富课堂教学。李益清 [6] 通过产品质量检测和测谎仪检测两个例子说明了贝叶斯公式的应用。与这些文献略有不同的是本文通过一个简单的例子说明了贝叶斯准则包含的思想和本质,同时应用案例选取也有不同。

贝叶斯准则也是贝叶斯统计的理论核心,以此为基础发展起来的贝叶斯估计、贝叶斯网络、贝叶斯分析、贝叶斯学习等理论在各个领域发挥着重要的作用,因此,学习和理解贝叶斯准则非常重要。

本文首先给出了贝叶斯准则并分析了其深刻含义,接着通过酒驾的危害、疫苗的有效性和案例的审查说明了其在实际中的广泛应用,最后给出了文章结论。

2. 贝叶斯准则

贝叶斯准则是18世纪英国哲学家、数学家Tomas Bayes首先总结出来的,其形式如下。

定理1 [7] 设试验E的样本空间为SAE的事件, B 1 , B 2 , , B n S的一个划分,且 P ( A ) > 0 , P ( B i ) > 0 , i = 1 , 2 , , n ,则

P ( B i | A ) = P ( A | B i ) P ( B i ) j = 1 n P ( B j ) P ( A | B j ) , i = 1 , 2 , , n .

本文主要用到贝叶斯准则的简单形式,即对任意两个事件AB有,

P ( A | B ) = P ( B | A ) × P ( A ) P ( B ) ,

其中, P ( B ) = P ( B | A ) × P ( A ) + P ( B | A ¯ ) × P ( A ¯ )

从上面可以看出,贝叶斯准则将形如 P ( A | B ) 的条件概率和形如 P ( B | A ) 的条件概率联系起来。

为了更好的理解无条件概率 P ( A ) ,条件概率 P ( A | B ) 和条件概率 P ( B | A ) ,先看一个例子。

例1在一个盒子里放着2个白球和2个黑球,先从盒子中拿出一球,然后再拿第二个球。问(1)第二个球是黑球的概率是多少?(2)在第二个球是黑球的情况下,第一个球也是黑球的概率是多少?

解:设事件A为第一个球是黑球,事件B是第二个球是黑球,则显然 P ( A ) = 1 / 2 P ( B | A ) = 1 / 3 P ( A ¯ ) = 1 / 2 P ( B | A ¯ ) = 2 / 3 。根据全概率定理,

P ( B ) = P ( B | A ) × P ( A ) + P ( B | A ¯ ) × P ( A ¯ ) = 1 / 3 × 1 / 2 + 2 / 3 × 1 / 2 = 1 / 2 .

根据贝叶斯准则,

P ( A | B ) = P ( B | A ) × P ( A ) P ( B ) = 1 / 3 × 1 / 2 1 / 2 = 1 / 3 .

因此,(1)第二个球是黑球的概率 P ( B ) 是1/2;(2)在第二个球是黑球的情况下,第一个球也是黑球的概率 P ( A | B ) 是1/3。

通过这个例子,我们首先分析 P ( A ) P ( A | B ) 的区别和联系。

P ( A ) 表示当选出第一个球且第二个球是什么颜色并不知道时第一个球是黑色的概率,即不知道第二个球信息的情况下第一个球的概率,它称为先验概率。因此,先验概率就是在不知道B事件的前提下,对A事件的一个主观判断。

P ( A | B ) 表示先选出一个球,握在手里,不看它的颜色,然后继续从盒子里取出另一个球,发现这个球是黑色的,那么第一个球是黑色的概率。即知道了第二个球是黑色的这个新信息后第一个球是黑色的概率,它称为后验概率。因为有了新的信息,使得第一个球是黑球的概率由1/2变为了1/3。因此,后验概率就是在知道了B事件的发生之后,对A事件概率的重新评估。

假设在拿了第一个球,第二个球的基础上再拿出一球,且知道第二个球和第三个球都是黑球,那么就知道第一个球为黑球的概率必定为0,这就是再次增加了信息时导致概率的改变。

我们再通过这个例子分析 P ( A | B ) P ( B | A ) 的区别和联系。

P ( B | A ) 非常容易理解,即已知第一次取出了一个黑球,把这个事件作为前提再从盒子里取出另外一个球,那么此时取出的是黑球的概率为1/3。而 P ( A | B ) 表示先选出一个球,握在手里,不看它的颜色,然后继续从盒子里取出另一个球,发现这个球是黑色的,那么第一个球是黑色的概率是1/3。

P ( B | A ) 符合按时间先后顺序考虑,当选出第一个球的时候第二个球是什么颜色的并不知道,因此有向前条件概率 P ( B | A ) P ( A | B ) 则是逆向考虑的,当知道了第二次取出的球后,重新考虑第一次取出球的可能性,因此有了向后条件概率 P ( A | B )

3. 贝叶斯准则的实际应用

在所有的数学发现中,贝叶斯准则是应用最多的准则之一,它从最开始的籍籍无名到现在被广泛应用于各个领域。本节介绍了其在三个方面的应用,分别是酒驾的危害,疫苗的有效性和案情的分析,充分说明了贝叶斯法则的广泛应用性。

3.1. 酒驾的危害

“喝酒不开车,开车不喝酒”是我们杜绝酒驾的一种说法。为什么不能酒后开车呢?因为饮酒后,当酒精在人体血液中达到一定浓度时,会严重干扰我们的大脑,导致人对外界的反应和控制能力下降。如果酒后开车就容易导致安全事故的发生,甚至严重的会导致严重的车祸,害人害己。

例1假设某城市某街道上开车驾驶的司机发生事故的概率是1%,其中95%的司机是清醒的,5%的司机是酒驾的。据该市统计知酒驾造成的交通事故比例占30%。请问某人清醒状态下开车发生事故的概率是多少,某人酒驾后发生事故的概率是多少?

解:记事件A为发生交通事故,事件S为清醒的,事件D为酒驾的。由题意知, P ( A ) = 1 % = 0.01 P ( S ) = 95 % = 0.95 P ( D ) = 1 0.95 = 0.05 P ( D | A ) = 30 % = 0.3 P ( S | A ) = 1 0.3 = 0.7

利用贝叶斯法则,可以计算出,

P ( A | S ) = P ( S | A ) × P ( A ) P ( S ) = 0.7 × 0.01 0.95 0.007 ,

P ( A | D ) = P ( D | A ) × P ( A ) P ( D ) = 0.3 × 0.01 0.05 = 0.06 .

所以,某人清醒状态下开车发生事故的概率是0.007;某人酒驾后发生事故的概率是0.06。

可以看出,清醒状态下开车发生事故的概率远小于酒驾后发生事故的概率。因此,开车不喝酒,喝酒不开车,这是每个司机都应该牢记的劝诫,也是我们每个公民应该遵守的规则。

3.2. 疫苗的有效性

我们从一生下来就要开始接种疫苗,人的一生至少要接种10种以上的疫苗。接种疫苗能够提高身体的抵抗能力,有效的预防受到病毒和病菌的感染。

例如,每年秋冬是流行性感冒(简称流感)高发的时期,流感是一种病毒性传染性疾病,严重威胁公众健康。而注射疫苗是目前应对流感最有效的措施。

例2 假设流感在某市人群中的感染率是8%,其中人群中有20%的人接种了流感疫苗。据统计知,接种了流感疫苗的人感染的比例占人群感染比例为2%。请问某人在接种了流感疫苗的情况下被感染的概率是多少,某人在没有接种流感疫苗的情况下被感染的概率是多少?

解:记事件I为被感染,事件V为接种了疫苗,事件U为未接种疫苗。由题意知, P ( I ) = 8 % = 0.08 P ( V ) = 20 % = 0.2 P ( U ) = 1 0.2 = 0.8 P ( V | I ) = 2 % = 0.02 P ( U | I ) = 1 0.02 = 0.98

利用贝叶斯法则,可以计算出,

P ( I | V ) = P ( V | I ) × P ( I ) P ( V ) = 0.02 × 0.08 0.2 = 0.008 ,

P ( I | U ) = P ( U | I ) × P ( I ) P ( U ) = 0.98 × 0.08 0.8 = 0.098 .

所以,某人在接种了流感疫苗的情况下被感染的概率是0.008;某人在没有接种流感疫苗的情况下被感染的概率是0.098。

可以看出,普通人群的感染率为8%,接种了疫苗之后感染率下降至0.8%。且接种了流感疫苗的情况下被感染的概率远小于没有接种流感疫苗的情况下被感染的概率。因此,接种流感疫苗是预防流感的有效手段之一。

3.3. 案情分析

司法人员在根据证据、证言对案件事情进行判断的时候,就要分析证据证言所传达的信息。司法人员在采信证据证言的时候,受限于自身的知识结构、逻辑能力和办案经验,司法人员所认定的案件事实并非绝对真实,而只是一种盖然性的事实。司法人员对这种盖然性大小的判定是通过证据证言传达的信息来进行的。当司法人员接触证据后,就会对案件事实发生的概率有一个判断,有新的证据出现时,再不断更新前期的判断。这种跟随证据信息更新判断的做法与贝叶斯法则的要求完全契合,因此司法人员在证据审查认定时完全可以才有贝叶斯法则进行合理分析。

例3 如张三在公交车上丢了一部手机,嫌疑人的同伙已下车,丢失的手机也被该嫌疑人同伙带走,虽然张三指控嫌疑人与逃跑同伙是团伙扒窃,但嫌疑人坚持自己只是普通乘客,未参与扒窃作案。假定根据嫌疑人的供述和张三陈述,司法人员判定嫌疑人有55%的概率参与了该起扒窃,司法人员根据两人的陈述,做出盖然性判断,认为嫌疑人作案的可能性只是比其没有作案的可能性稍大一点点。如果这时有乘客出来作证称其亲眼看到嫌疑人从被害人口袋里扒窃。司法人员通过调查了解到,如果该证人真实看到嫌疑人参与扒窃,其向司法机关如实作证的可能性为80%,而即使该证人没有目击嫌疑人扒窃,其也有10%的可能向司法机关证明其目击嫌疑人扒窃。那么司法人员拿到证人证言后,该如何判定呢?

解:记事件T为盗窃,事件W为证人作证。由题意知, P ( T ) = 55 % = 0.55 P ( W | T ) = 80 % = 0.8 P ( W | T ¯ ) = 10 % = 0.1

利用全概率定理得出,

P ( W ) = P ( W | T ) × P ( T ) + P ( W | T ¯ ) × P ( T ¯ ) = 0.8 × 0.55 + 0.1 × 0.45 = 0.485

利用贝叶斯法则,可以计算出,

P ( T | W ) = P ( W | T ) × P ( T ) P ( W ) = 0.8 × 0.55 0.485 0.907 ,

所以,那么有了这份证言后,嫌疑人实施扒窃的概率为0.907。

可以看出,加入证人的证词后嫌疑人实施扒窃的概率由最初的0.55上升至了0.907,根据判决标准就可以判定嫌疑人是否有罪了。

4. 结论

在教学实践中,案例教学法一直是一种有效的教学方法,它能通过学生所见所闻的真实事件来提高学生的理解力和积极性,开阔学生的思路和视野,加强学生的学习能力和探索能力。作者在多年的“概率论与数理统计”教学中使用案例教学法,均取得了很好的教学效果。“概率论与数理统计”中的贝叶斯准则是教学中的一个重点和难点,学生经常分不清先验概率和后验概率,混淆向前条件概率与向后条件概率,导致计算和分析错误并得出错误的结论。因此,教师在教学的过程中应该用简单易懂的例子帮助学生理解准则的思想及本质,通过多角度的案例帮助学生理解和应用这个准则,并在生活中建立用贝叶斯思维解决实际问题的能力。本文通过理论讲解和实际案例分析,让学生能够很好掌握贝叶斯准则的原理,并具备在实际生活中活学活用的能力。

致谢

作者非常感谢相关文献对本文的启发以及审稿专家提出的宝贵意见。

基金项目

西南交通大学2020年本科教育教学研究与改革项目(20201035-07)。

参考文献

参考文献

[1] 周雪晴, 宋萍, 黄仕鑫, 等. 基于贝叶斯公式的川崎病患儿并发冠状动脉损伤的认知模型研究[J]. 中国全科医学, 2016, 33(19): 4106-4109.
[2] 傅莺莺, 田振坤. 疾病监测中的概率问题[J]. 中国统计, 2017(11): 26-28.
[3] 宁绍军, 邹恒明. 基于贝叶斯公式的自适应垃圾邮件过滤方法[J]. 计算机应用与软件, 2007, 11(24): 189-191.
[4] 万应君. 贝叶斯法则: 证据审查认定的一个理性工具[J]. 中国检察官, 2010(17): 60-62.
[5] 杨静, 陈冬, 程小红. 贝叶斯公式的几个应用[J]. 大学数学, 2011, 2(27): 166-169.
[6] 李益清. 贝叶斯公式的应用[J]. 科教文汇, 2019(31): 75-76.
[7] 茆诗松, 程依明, 濮晓龙. 概率论与数理统计[M]. 北京: 高等教育出版社, 2020.