概率论基础3——条件概率

如题所述

第1个回答  2023-09-17

一、条件概率

生活中很多概率都是在某些特殊条件下的概率。比如你想知道你在家感染新冠的概率,这是取决于很多方面的,比如,政策有没有放开、是否位于高风险区等等。只有在这些条件的限制下,我们才能较为准确的求出你想知道的概率。

基本概念:设A,B是随机试验E的两个随机试验,且P(B)>0,称 P(A|B)=P(AB)P(B) 为在事件B发生的条件下,事件A发生的条件概率。

韦恩图:

上面A、B分别有两个椭圆,代表了他们的事件范围。我们想要求在B的条件下A发生的概率,那么直观上分母应该是P(B),因为条件是事件B就相当于要以事件B作为基础;而由于事件B的限制,事件A中不属于B的部分应该被舍去,它们不在B的控制之下。所以也很容易理解,分子是A和B的和事件(交集)的概率。

性质。

条件概率也属于概率,所以它也满足概率的基本性质,只不过会有所改变。

(1)对于每一事件A, 0≤P(A|B)≤1。

(2) P(Ω|B)=1。

(3)若 A1,A2,……,An 互不相容,则 P(⋃i=1mAi|B)=∑i=1mP(Ai|B)。

(4) P(A|B)+P(A¯|B)=1。

(5)容斥原理: P(A⋃B|B)=P(A|B)+P(B|B)−P(AB|B)。

二、乘法公式

在上文我们知道条件概率的公式为: P(A|B)=P(AB)P(B) 。那如果我们此时知道P(B)和P(A|B),相求P(AB),可以通过移项转化成下列公式: P(A|B)P(B)=P(AB) 同理,我们也可以得到:

P(B|A)P(A)=P(AB) 这两个公式我们称其为乘法公式。上面两个式子在实际计算中要根据问题灵活选择。

我们也可以将其拓展到n个事件中: P(A1A2…An)=P(A1)P(A2|A1)P(A3|A2A1)…P(An|An…A2A1)。

我们可以这样理解:$P(A_1)$是假设A1正确,$P(A_2|A_1)$是假设A1正确的情况下A2正确,以此类推。

三、全概率公式

有限划分。

基本概念:设 Ω 为随机试验E的样本空间,B1,B2 ,…,Bn为E的一组事件,若:

(1) Bi∩Bj=f,i≠j。

(2) B1∪B2∪…∪Bn=Ω。

则称B1,B2,…,Bn 为 ∅ 的一个有限划分,或称完备事件组。

注:样本空间的划分不唯一。

简单理解下,有限划分的意思就是,将一个样本空间切成许多小份。

全概率公式。

基本概念:设A为随机试验E的样本空间,B1,B2 ,…,Bn为E的一个有限划分,且P(Bi)>0,则 P(A)=∑i−1nP(Bi)P(A|Bi)。

其实这就是乘法原理的加强版,将很多个乘法原理结合起来使用。

四、贝叶斯公式

概念引入。

先验概率:事件发生前预判的概率。即在事件发生前根据之前的经验判断事件发生的概率。对应的是上面公式的P(A)。

后验概率:事件发生后反向条件概率。即事件已经发生了,在事件发生的这个条件之下,发生某个事件的概率。对应的是上面公式的$(A|B),即事件B已经发生后,事件A发生的概率。

从我们日常生活中的理解不难发现,后验概率受到先验概率的影响很大。

贝叶斯公式。

设$\Omega$为随机试验E的样本空间,B1,B2 ,…,Bn为E的一个有限划分, A⊂Ω ,且P(A)>0,P(Bi)>0,则: P(Bi|A)=P(Bi)P(A|Bi)∑j=1nP(Bj)P(A|Bj) 简单推导: P(Bi|A)=P(ABi)P(A)=P(Bi)P(A|Bi)∑j=1nP(Bj)P(A|Bj) 分子分母分别使用乘法公式和全概率公式。

通过贝叶斯公式,我们可以在事件A发生后(即位条件)求发生事件B~i~的概率,其中事件B~i~是促使事件A发展的一部分。下面举一个十分经典的例子:

假设一个病的发病率是0.0004(即2500人当中才有一个人得了这种病),现在有个可能得了该病的患者需要去医院进行检查。但是,医生检查并不会100%正确,多少会出现失误。已知该医院对该病患者判断没病的概率为1%,对没有该病患者判断有病的概率为0.1%。现在他通过检查发现得了该病,那请问他真正患病的概率有多少?

我们假设A={人是患者},B={人检验有病}。

通过对题目的分析,我们可以得到以下条件:

人群中得该病的概率为人群中未得该病的概率为人有病检验出来患病的概率为人没有病检验出来患病的概率为人群中得该病的概率为P(A)=0.0004,人群中未得该病的概率为P(A¯)=09996,人有病检验出来患病的概率为P(B|A)=0.99,人没有病检验出来患病的概率为P(B|A¯)=0.001。

那么我们要求的检验有病,真正患病的概率为: P(A|B)=P(AB)P(B)=0.0004×0.990.0013956=0.284 这个概率是让人震惊的。医院给我检查出有病,但是我实际上只有四分之一左右的概率真正患病!

那么这是为什么呢?我们具体化一下数字:

假设现在有10000人。那么理论上不得病的人有9996人,而得病的只有4人。由于对正常人判断失误率为0.1%,那么约有10个没有得该病的人得了该病。而将患病的误判为没得病的概率为1%,4人中近似没有人会被判成没病。这样就很清楚了,因为没得病的人基数太高,所以哪怕误判的概率很低,相比于得病的人来说,其人数依然很高。

相似回答