一面不均匀的硬币,抛出为正面的概率是0.8;连续抛出12次,问出现5次正面的概率是多少?一般的,出现 0 , 1 , 2 , ⋯ , 12 0,1,2,\cdots ,12 0,1,2,⋯,12次正面的概率分别是多少?
注意,对于本例,每一次抛出,单独拿出来,可以认为服从伯努利分布;
此例执行了12次,注意注意,伯努利分布的样本空间为 { 正 , 反 } \{正,反\} {正,反},而此例的样本空间为出现正面的次数,即 { 0 , 1 , 2 , ⋯ , 12 } \{0,1,2,\cdots ,12\} {0,1,2,⋯,12},故而研究的"自变量"发生了变化,即随机变量的定义方式不同了,
本例的连续12次,即总共执行的次数,记为 n n n,又可称为12重伯努利试验;
n n n次独立重复的伯努利试验(成功/失败),统计成功次数 k ( 0 ≤ k ≤ n ) k(0 \le k \le n) k(0≤k≤n),基于这个的定义出现的分布称为二项分布
记法:
X ∼ B ( n , p ) 或 X ∼ Binomial ( n , p ) \boxed{X \sim B(n,p)\quad或\quad X\sim \text{Binomial}(n,p)} X∼B(n,p)或X∼Binomial(n,p)
读作: X X X服从参数为 n n n和 p p p的二项分布;可见,其实伯努利分布是 n = 1 n=1 n=1的二项分布;
随机变量即定义为出现正面的次数,一共执行了n次,则出现正面的上限是n次,下限是0次;显然:
X ∈ { 0 , 1 , 2 , … , n } :表示 n 次试验中成功次数。 X\in\{0,1,2,…,n\}:表示n次试验中成功次数。 X∈{0,1,2,…,n}:表示n次试验中成功次数。
- $n$:重复执行的次数是参数,可以取值$n\in\mathbb N^+$;(本例中的12)
- $p$:单次试验的成功概率,$p\in(0,1)$;(本例中的0.8)
我们首先解决本例题,题目整理为:
已知 n = 12 , p = 0.8 , X ∈ { 0 , 1 , 2 , … , 12 } ; n=12,p=0.8,X\in\{0,1,2,…,12\}; n=12,p=0.8,X∈{0,1,2,…,12};
问1: P ( X = 5 ) P(X=5) P(X=5)
12次抛出,出现5次正面;可能的情况列表如下有(0代表反面,1代表正面):
编号 | 抛硬币结果(12位) |
---|---|
1 | 1 1 1 1 1 0 0 0 0 0 0 0 |
2 | 1 1 1 1 0 1 0 0 0 0 0 0 |
3 | 1 1 1 1 0 0 1 0 0 0 0 0 |
4 | 1 1 1 1 0 0 0 1 0 0 0 0 |
5 | 1 1 1 1 0 0 0 0 1 0 0 0 |
我列不下去了,因为太多了,我们算算有多少种可能性把,显然是一个组合数,即 C 12 5 C^5_{12} C125或写为 ( 12 5 ) \binom{12}{5} (512)计算得到 792 792 792种可能性;
组合数 ( n k ) \binom{n}{k} (kn)表示从 n n n 次试验中选择 k k k 次成功(正面)的位置,其余 n − k n−k n−k 次为失败(反面)。
那出现上表种的编号为1的事件的可能性是多少呢?
由于每一次抛出是独立事件,独立事件的性质:每次抛硬币的结果互不影响,独立事件同时发生的概率直接相乘即可,故而为:
0.8 × 0.8 × 0.8 × 0.8 × 0.8 × 0.2 × 0.2 × 0.2 × 0.2 × 0.2 × 0.2 × 0.2 × 0.2 0.8\times0.8\times0.8\times0.8\times0.8\times0.2\times0.2\times0.2\times0.2\times0.2\times0.2\times0.2\times0.2 0.8×0.8×0.8×0.8×0.8×0.2×0.2×0.2×0.2×0.2×0.2×0.2×0.2即 0. 8 5 × 0. 2 7 0.8^5\times0.2^7 0.85×0.27在792种可能的结果的概率无非是顺序不同,故而每一种可能性的发生的概率均相同;然后求和不就是答案吗?
即:
P ( X = 5 ) = ( 12 5 ) × 0. 8 5 × 0. 2 7 = 792 × 0. 8 5 × 0. 2 7 P(X=5)=\binom{12}{5} \times 0.8^5\times0.2^7= 792\times 0.8^5\times0.2^7 P(X=5)=(512)×0.85×0.27=792×0.85×0.27
问2: P ( X = k ) , k = 0 , 1 , 2 , … , 12 P(X=k),\quad k=0,1,2,…,12 P(X=k),k=0,1,2,…,12
同理:
P ( X = k ) = ( 12 k ) × 0. 8 k × 0. 2 12 − k P(X=k)=\binom{12}{k} \times 0.8^k\times0.2^{12-k} P(X=k)=(k12)×0.8k×0.212−k
更一般的,对于 n n n重伯努利试验,概率质量函数我们可以归纳为:
P ( X = k ) = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , … , n \boxed{P(X=k)=\binom{n}{k}p^k(1-p)^{n-k},\quad k=0,1,…,n} P(X=k)=(kn)pk(1−p)n−k,k=0,1,…,n
校验公式:若上述概率质量函数正确,那么应有,即所有可能结果的概率之和为1
∑ k = 0 n P ( X = k ) = 1 \sum_{k=0}^nP(X=k)=1 k=0∑nP(X=k)=1
证明:
∑ k = 0 n P ( X = k ) = ∑ k = 0 n ( n k ) p k ( 1 − p ) n − k 令 ( 1 − p ) → q ∑ k = 0 n P ( X = k ) = ∑ k = 0 n ( n k ) p k q n − k \begin{gather*} \sum_{k=0}^nP(X=k)=\sum_{k=0}^n\binom{n}{k}p^k(1-p)^{n-k}\\ 令(1-p)\rightarrow q\\ \sum_{k=0}^nP(X=k)=\sum_{k=0}^n\binom{n}{k}p^kq^{n-k}\\ \end{gather*} k=0∑nP(X=k)=k=0∑n(kn)pk(1−p)n−k令(1−p)→qk=0∑nP(X=k)=k=0∑n(kn)pkqn−k
这恰好是二项式定理的形式,故而:参见链接: 二项式定理以及证明过程
∑ k = 0 n P ( X = k ) = ( p + t ) n = ( p + 1 − p ) n = 1 \sum_{k=0}^nP(X=k)=(p+t)^n=(p+1-p)^n=1 k=0∑nP(X=k)=(p+t)n=(p+1−p)n=1
二项分布要求:
期望推导过程:
E ( X ) = ∑ i = 1 n x i p ( x i ) = ∑ i = 1 n x i ( n x i ) p x i ( 1 − p ) n − x i \begin{align*} E(X)&= \sum_{i=1}^{n} x_i p(x_i)\\ &=\sum_{i=1}^{n} x_i\binom{n}{x_i}p^{x_i}(1-p)^{n-x_i}\\ \end{align*} E(X)=i=1∑nxip(xi)=i=1∑nxi(xin)pxi(1−p)n−xi
由下列组合数恒等式
k ( n k ) = n ( n − 1 k − 1 ) k \binom{n}{k} = n \binom{n - 1}{k - 1} k(kn)=n(k−1n−1)
可得
E ( X ) = ∑ i = 1 n x i ( n x i ) p x i ( 1 − p ) n − x i = ∑ i = 1 n n ( n − 1 x i − 1 ) p x i ( 1 − p ) n − x i = ∑ i = 1 n n ( n − 1 x i − 1 ) p ⋅ p x i − 1 ( 1 − p ) n − x i = n p ∑ i = 1 n ( n − 1 x i − 1 ) p x i − 1 ( 1 − p ) n − x i 令 x i → j + 1 = n p ∑ j = 0 n ( n − 1 j ) p j ( 1 − p ) n − j − 1 \begin{align*} E(X)&=\sum_{i=1}^{n} x_i\binom{n}{x_i}p^{x_i}(1-p)^{n-x_i}\\ &=\sum_{i=1}^{n} n\binom{n-1}{x_i-1}p^{x_i}(1-p)^{n-x_i}\\ &=\sum_{i=1}^{n} n\binom{n-1}{x_i-1}p\cdot p^{x_i-1}(1-p)^{n-x_i}\\ &=np\sum_{i=1}^{n} \binom{n-1}{x_i-1}p^{x_i-1}(1-p)^{n-x_i}\\ &令x_i \rightarrow j+1\\ &=np\sum_{j=0}^{n} \binom{n-1}{j}p^{j}(1-p)^{n-j-1}\\ \end{align*} E(X)=i=1∑nxi(xin)pxi(1−p)n−xi=i=1∑nn(xi−1n−1)pxi(1−p)n−xi=i=1∑nn(xi−1n−1)p⋅pxi−1(1−p)n−xi=npi=1∑n(xi−1n−1)pxi−1(1−p)n−xi令xi→j+1=npj=0∑n(jn−1)pj(1−p)n−j−1
根据二项式定理:
( a + b ) n = ∑ k = 0 n ( n k ) a n − k b k 令 a → p ; b → ( 1 − p ) ; n → ( n − 1 ) [ p + ( 1 − p ) ] n − 1 = ∑ k = 0 n − 1 ( n − 1 k ) p n − 1 − k ( 1 − p ) k = 1 \begin{align*} (a+b)^n= \sum_{k=0}^{n}\binom {n}{k}a^{n-k}b^{k}\\ 令a \rightarrow p;b \rightarrow (1-p);n\rightarrow (n-1)\\ [p+(1-p)]^{n-1}= \sum_{k=0}^{n-1}\binom {n-1}{k}p^{n-1-k}(1-p)^{k}=1\\ \end{align*} (a+b)n=k=0∑n(kn)an−kbk令a→p;b→(1−p);n→(n−1)[p+(1−p)]n−1=k=0∑n−1(kn−1)pn−1−k(1−p)k=1
故:
E ( X ) = n p E(X)=np E(X)=np
或者使用更直观的方式去理解会更好:
期望具有线性性,即随机变量期望之和等于随机变量和的期望;
E ( X ) + E ( Y ) = E ( X + Y ) E(X)+E(Y)=E(X+Y) E(X)+E(Y)=E(X+Y)
更一般的:
a E ( X ) + b E ( Y ) = E ( a X + b Y ) aE(X)+bE(Y)=E(aX+bY) aE(X)+bE(Y)=E(aX+bY)
举个例子:投掷一次骰子的事件,期望若是5.5;那么连续投掷这个骰子10次的事件的期望就是55;
已知:伯努利分布的随机变量期望 E ( X ) = p E(X)=p E(X)=p,执行 n n n次后期望自然等于 n p np np
方差计算
单次的方差是 Var ( X ) = p ( 1 − p ) \text{Var}(X) =p(1-p) Var(X)=p(1−p),那么 n n n次的方差显然是: Var ( X ) = n p ( 1 − p ) \text{Var}(X) =np(1-p) Var(X)=np(1−p)
例1:工厂一批电子元件的一大批产品的一级品概率为0.2,问抽取20个产品,恰好存在 k = 0 , 1 , 2 , 3 ⋯ 20 k=0,1,2,3\cdots20 k=0,1,2,3⋯20只为一级品的概率分别是多少?
解 设随机变量 X X X,表示恰好存在 k = 0 , 1 , 2 , 3 ⋯ 20 k=0,1,2,3\cdots20 k=0,1,2,3⋯20只为一级品;
显然 X ∼ B ( 20 , 0.2 ) X \sim B(20,0.2) X∼B(20,0.2);则
P ( X = k ) = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , … , n P ( X = k ) = ( 20 k ) p k ( 1 − p ) n − k , k = 0 , 1 , … , n \begin{align*} P(X=k)&=\binom{n}{k}p^k(1-p)^{n-k},\quad k=0,1,…,n\\ P(X=k)&=\binom{20}{k}p^k(1-p)^{n-k},\quad k=0,1,…,n \end{align*} P(X=k)P(X=k)=(kn)pk(1−p)n−k,k=0,1,…,n=(k20)pk(1−p)n−k,k=0,1,…,n
代入即可求解,绘制图像出来应为:
自己试试把,我设计了一个动态图标可以使用,
点击: 二项分布
例2有80台相同的设备,每台设备独立运行,发生故障的概率是0.01,一个设备只能由1人维修;方案1:4人维护,每人维护固定的20台;方案2.3人共同维护80台;比较不能及时维修的的概率的大小;
解 方案1:设随机变量 X X X,表示恰好同时 k = 0 , 1 , 2 , 3 ⋯ 20 k=0,1,2,3\cdots20 k=0,1,2,3⋯20台设备发生故障;
则 X ∼ B ( 20 , 0.01 ) X\sim B(20,0.01) X∼B(20,0.01);同时一人同时只能处理一台,即求 P ( X > 1 ) P(X>1) P(X>1)
P ( X > 1 ) = 1 − P ( X = 1 ) − P ( X = 0 ) = 1 − ( 20 1 ) 0.0 1 1 × 0.9 9 20 − 1 − ( 20 0 ) 0.0 1 0 × 0.9 9 20 − 0 ≈ 0.0169 \begin{align*} P(X>1)&=1-P(X=1)-P(X=0)\\ &=1-\binom{20}{1}0.01^1\times0.99^{20-1} -\binom{20}{0}0.01^0\times0.99^{20-0} \\ &\approx0.0169 \end{align*} P(X>1)=1−P(X=1)−P(X=0)=1−(120)0.011×0.9920−1−(020)0.010×0.9920−0≈0.0169
设随机变量 Y Y Y, Y Y Y表示恰好同时发生 k = 0 , 1 , 2 , 3 , 4 k=0,1,2,3,4 k=0,1,2,3,4组不能及时维修的故障;可知 Y ∼ B ( 4 , 0.0169 ) Y\sim B(4,0.0169) Y∼B(4,0.0169);若一组发生,则认为发生,即,
P ( Y > 0 ) = 1 − P ( X = 0 ) = 1 − ( 4 0 ) 0.016 9 0 × 0.983 1 4 = 1 − 1 × 1 × ( 1 − 0.0169 ) 4 ≈ 0.0659 \begin{align*} P(Y>0)&=1-P(X=0)\\ &=1-\binom{4}{0}0.0169^0\times0.9831^4\\ &=1-1\times1\times(1-0.0169)^4\\ &\approx0.0659 \end{align*} P(Y>0)=1−P(X=0)=1−(04)0.01690×0.98314=1−1×1×(1−0.0169)4≈0.0659
独立事件同时发生的概率等于每个的概率之积,也就是
P ( A 1 ∩ A 2 ⋯ ∩ A n ) = P ( ⋂ i = 1 n A i ) = ∏ i = 1 n P ( A i ) P(A_1 \cap A_2 \cdots \cap A_n)=P(\bigcap_{i=1}^{n}A_i)=\prod_{i=1}^nP(A_i) P(A1∩A2⋯∩An)=P(i=1⋂nAi)=i=1∏nP(Ai)
那么独立事件任意一件发生的概率,等于1-各自的补集同时发生的概率即
P ( A 1 ∪ A 2 ⋯ ∪ A n ) = 1 − P ( A 1 c ∩ A 2 c ⋯ ∩ A n c ) = 1 − P ( ⋂ i = 1 n A i c ) = 1 − ∏ i = 1 n P ( A i c ) = 1 − ∏ i = 1 n ( 1 − P ( A i ) ) \begin{align*} &P(A_1 \cup A_2 \cdots \cup A_n)\\ &=1-P(A_1^c \cap A_2^c \cdots \cap A_n^c)\\ &=1-P(\bigcap_{i=1}^{n}A_i^c)\\ &=1-\prod_{i=1}^nP(A_i^c)\\ &=1-\prod_{i=1}^n(1-P(A_i)) \end{align*} P(A1∪A2⋯∪An)=1−P(A1c∩A2c⋯∩Anc)=1−P(i=1⋂nAic)=1−i=1∏nP(Aic)=1−i=1∏n(1−P(Ai))
注: ∏ \prod ∏ 符号表示连乘积(Product)
当每一项 P P P均相等时,有
P ( A 1 ∪ A 2 ⋯ ∪ A n ) = 1 − ( 1 − P ) n P(A_1 \cup A_2 \cdots \cup A_n)=1-(1-P)^n P(A1∪A2⋯∪An)=1−(1−P)n
所以上面的也可以这样算:
P ( Y 1 ∪ Y 2 ∪ Y 3 ∪ Y 4 ) = 1 − ( 1 − 0.0169 ) 4 = 0.0659 P(Y_1 \cup Y_2 \cup Y_3 \cup Y_4 )=1-(1-0.0169)^4=0.0659 P(Y1∪Y2∪Y3∪Y4)=1−(1−0.0169)4=0.0659
方案2:设随机变量 X X X,表示恰好同时 k = 0 , 1 , 2 , 3 ⋯ 80 k=0,1,2,3\cdots80 k=0,1,2,3⋯80台设备发生故障;可知 X ∼ B ( 80 , 0.01 ) X\sim B(80,0.01) X∼B(80,0.01),由于有3人故,求 P ( X > 3 ) P(X>3) P(X>3);
P ( X > 3 ) = 1 − P ( X = 0 ) − P ( X = 1 ) − P ( X = 2 ) − P ( X = 3 ) = 1 − ( 80 0 ) 0.0 1 0 × 0.9 9 80 − ( 80 1 ) 0.0 1 1 × 0.9 9 79 − ( 80 2 ) 0.0 1 2 × 0.9 9 78 − ( 80 3 ) 0.0 1 3 × 0.9 9 77 ≈ 1 − 0.4475 − 0.3616 − 0.1443 − 0.0379 ≈ 0.0078 \begin{align*} P(X>3)&=1-P(X=0)-P(X=1)-P(X=2)-P(X=3)\\ &=1-\binom{80}{0}0.01^{0}\times0.99^{80}-\binom{80}{1}0.01^{1}\times0.99^{79}\\ &-\binom{80}{2}0.01^{2}\times0.99^{78}-\binom{80}{3}0.01^{3}\times0.99^{77}\\ &\approx1-0.4475-0.3616-0.1443-0.0379\\ &\approx 0.0078 \end{align*} P(X>3)=1−P(X=0)−P(X=1)−P(X=2)−P(X=3)=1−(080)0.010×0.9980−(180)0.011×0.9979−(280)0.012×0.9978−(380)0.013×0.9977≈1−0.4475−0.3616−0.1443−0.0379≈0.0078
故方案1更优;
大部分例题均来自:概率论与数理统计,第五版,浙江大学 ↩︎