贝叶斯决策例题

例1

假定在一次食品样本抽查中,样本显示合格的先验概率 P ( C 1 ) P(C_1) P(C1)和样本显示不合格的先验概率 P ( C 2 ) P(C_2) P(C2)分别为:
P ( C 1 ) = 0.95 , P ( C 2 ) = 0.05 P(C_1) = 0.95, \quad P(C_2) = 0.05 P(C1)=0.95,P(C2)=0.05

现有一待检测的样本,其观察值为 x x x,从类条件概率密度函数分布曲线上查得:
p ( x ∣ C 1 ) = 0.2 , p ( x ∣ C 2 ) = 0.5 p(x|C_1) = 0.2, \quad p(x|C_2) = 0.5 p(xC1)=0.2,p(xC2)=0.5
试对 x x x进行分类。

利用贝叶斯公式,分别计算出 C 1 C_1 C1 C 2 C_2 C2的后验概率:
P ( C 1 ∣ x ) = p ( x ∣ C 1 ) P ( C 1 ) ∑ i = 1 2 p ( x ∣ C i ) P ( C i ) = 0.2 × 0.95 0.05 × 0.5 + 0.95 × 0.2 ≈ 0.884 P(C_1|x) = \frac{p(x|C_1)P(C_1)}{\sum\limits_{i=1}^{2} p(x|C_i)P(C_i)} = \frac{0.2 \times 0.95}{0.05 \times 0.5 + 0.95 \times 0.2} \approx 0.884 P(C1x)=i=12p(xCi)P(Ci)p(xC1)P(C1)=0.05×0.5+0.95×0.20.2×0.950.884
P ( C 2 ∣ x ) = p ( x ∣ C 2 ) P ( C 2 ) ∑ i = 1 2 p ( x ∣ C i ) P ( C i ) = 0.5 × 0.05 0.05 × 0.5 + 0.95 × 0.2 ≈ 0.116 P(C_2|x) = \frac{p(x|C_2)P(C_2)}{\sum\limits_{i=1}^{2} p(x|C_i)P(C_i)} = \frac{0.5 \times 0.05}{0.05 \times 0.5 + 0.95 \times 0.2} \approx 0.116 P(C2x)=i=12p(xCi)P(Ci)p(xC2)P(C2)=0.05×0.5+0.95×0.20.5×0.050.116

根据最小误判概率贝叶斯准则有:
P ( C 1 ∣ x ) = 0.884 > P ( C 2 ∣ x ) = 0.116 P(C_1|x) = 0.884 > P(C_2|x) = 0.116 P(C1x)=0.884>P(C2x)=0.116

所以合理的判决是把 x x x归于 C 1 C_1 C1类,即被检验的食品为合格产品。

似然比:
l ( x ) = p ( x ∣ C 1 ) p ( x ∣ C 2 ) = 0.4 l \left( {x} \right) = \frac{p \left( {x} | C_1 \right)}{p \left( {x} | C_2 \right)} = 0.4 l(x)=p(xC2)p(xC1)=0.4
似然比阈值:
T = P ( C 2 ) P ( C 1 ) = 0.0526 T = \frac{P \left( C_2 \right)}{P \left( C_1 \right)} = 0.0526 T=P(C1)P(C2)=0.0526

l ( x ) > T l \left( {x} \right) > T l(x)>T,判为 C 1 C_1 C1

从这个例子可以看出,分类结果由先验概率和类条件概率密度函数共同决定。在具体的例子中,由于 C 1 C_1 C1类的先验概率远大于 C 2 C_2 C2类的先验概率,使得先验概率在判决中起主导作用。

例2

在例1条件的基础上,损失函数的值分别为:
L 11 = 0 , L 12 = 1 , L 21 = 10 , L 22 = 0 L_{11} = 0, \quad L_{12} = 1, \\ \quad L_{21} = 10, \quad L_{22} = 0 L11=0,L12=1,L21=10,L22=0

按最小损失贝叶斯判决准则进行分类。

解释

- L 11 = 0 L_{11} = 0 L11=0:如果真实类别是 C 1 C_1 C1,且被判为 C 1 C_1 C1,损失为 0。
- L 12 = 1 L_{12} = 1 L12=1:如果真实类别是 C 1 C_1 C1,但被判为 C 2 C_2 C2,损失为 1。
- L 21 = 10 L_{21} = 10 L21=10:如果真实类别是 C 2 C_2 C2,但被判为 C 1 C_1 C1,损失为 10。
- L 22 = 0 L_{22} = 0 L22=0:如果真实类别是 C 2 C_2 C2,且被判为 C 2 C_2 C2,损失为 0。

根据最小损失贝叶斯判决准则,选择使得期望损失最小的类别。

已知条件为:
P ( C 1 ) = 0.95 , P ( C 2 ) = 0.05 P(C_1) = 0.95, \quad P(C_2) = 0.05 P(C1)=0.95,P(C2)=0.05
p ( x ∣ C 1 ) = 0.2 , p ( x ∣ C 2 ) = 0.5 p(x|C_1) = 0.2, \quad p(x|C_2) = 0.5 p(xC1)=0.2,p(xC2)=0.5
L 11 = 0 , L 12 = 1 , L 21 = 10 , L 22 = 0 L_{11} = 0, \quad L_{12} = 1, \quad L_{21} = 10, \quad L_{22} = 0 L11=0,L12=1,L21=10,L22=0

根据例 1 的计算结果可知后验概率为:
P ( C 1 ∣ x ) = 0.884 , P ( C 2 ∣ x ) = 0.116 P(C_1|x) = 0.884, \quad P(C_2|x) = 0.116 P(C1x)=0.884,P(C2x)=0.116

计算的条件平均损失函数为:
R 1 ( x ) = ∑ i = 1 2 L i 1 P ( C i ∣ x ) = L 21 P ( C 2 ∣ x ) = 1.16 R_1(x) = \sum\limits_{i=1}^{2} L_{i1} P(C_i|x) = L_{21} P(C_2|x) = 1.16 R1(x)=i=12Li1P(Cix)=L21P(C2x)=1.16
R 2 ( x ) = ∑ i = 1 2 L i 2 P ( C i ∣ x ) = L 12 P ( C 1 ∣ x ) = 0.884 R_2(x) = \sum\limits_{i=1}^{2} L_{i2} P(C_i|x) = L_{12} P(C_1|x) = 0.884 R2(x)=i=12Li2P(Cix)=L12P(C1x)=0.884

由于 R 1 ( x ) > R 2 ( x ) R_1(x) > R_2(x) R1(x)>R2(x),故判决为 C 2 C_2 C2的损失小于判决为 C 1 C_1 C1的损失。因此,我们将 x x x归到 C 2 C_2 C2类,即被检验食品为不合格食品。

将本例与例1相对比,其分类结果正好相反,这是因为这里影响判决结果的因素又多了一个,即“损失”。而且两类错误判决所造成的损失相差很悬殊,因此“损失”就起了主导作用。

你可能感兴趣的:(PR书稿,机器学习)