连续型随机变量(基础阶段讨论)
奇异型随机变量
和离散型随机变量不同,连续型随机变量可以充满某个区间
分布律的形式无法描述这类随机变量的取值的统计规律性
为了统一研究各种类型的随机变量,引入分布函数的概念
设 X 是一个随机变量 , x 是任意实数 设X是一个随机变量,x是任意实数 设X是一个随机变量,x是任意实数
任何随机变量X都有分布函数
函数F(x)成为某个随机变量X的分布函数的条件:
值域:
极限:
lim x → − ∞ F ( x ) = 0 \lim\limits_{x\to -\infin}F(x)=0 x→−∞limF(x)=0
lim x → + ∞ F ( x ) = 1 \lim\limits_{x\to +\infin}F(x)=1 x→+∞limF(x)=1
单调性:
F ( x ) 是右连续的 F(x)是右连续的 F(x)是右连续的
即,如果 x 在 x = k x在x=k x在x=k处的某个邻域 U = U ( k , δ ) U={U}(k,\delta) U=U(k,δ) 有定义,存在右极限
lim x → k + F ( x ) = F ( k ) \lim_{x\to k^+}F(x)=F(k) \\ x→k+limF(x)=F(k)
比如: F ( x + 0 ) = F ( x ) F(x+0)=F(x) F(x+0)=F(x)
例如:
F ( x ) = { 0 , x ⩽ 0 A x 2 + B , 0 < x ⩽ 1 1 x > 1 F(x)= \begin{cases} 0,&x\leqslant0 \\Ax^2+B,&0
上面这个分布函数的分段定义涵盖了实数区间R
利用右连续性求解A,B
由于 F ( x ) 在 x = 0 处和 x = 1 处均有定义 由于F(x)在x=0处和x=1处均有定义 由于F(x)在x=0处和x=1处均有定义
lim x → 0 + F ( x ) = F ( 0 ) \lim\limits_{x\to 0^+}F(x)=F(0) x→0+limF(x)=F(0)
lim x → 1 + F ( x ) = F ( 1 ) \lim\limits_{x\to1+}F(x)=F(1) x→1+limF(x)=F(1)
即:A=1,B=0
对于 ∀ x 1 < x 2 ; P ( { x 1 < x ⩽ x 2 } ) = F ( x 2 ) − F ( x 1 ) \forall x_1
有分布函数可以确定随机变量在某一个区间内的取值概率
对于任意的 x , P ( { X = x } ) = F ( x ) − F ( x − 0 ) 对于任意的x,P(\set{X=x})=F(x)-F(x-0) 对于任意的x,P({X=x})=F(x)−F(x−0)
例:
对于分布函数
F ( x ) = { 0 , x ⩽ 0 x 2 , 0 < x ⩽ 1 1 x > 1 F(x)= \begin{cases} 0,&x\leqslant0 \\x^2,&0
P ( 0.2 < x ⩽ 0.8 ) = F ( 0.8 ) − F ( 0.2 ) = 0.6 P(0.2
一般的,对于随机变量X的为:
P ( X = x k ) = p k , k = 1 , 2 , ⋯ P(X=x_k)=p_k,k=1,2,\cdots P(X=xk)=pk,k=1,2,⋯
F ( x ) = P ( X ⩽ x ) = ∑ x k ⩽ x P ( X = x k ) = ∑ x ⩽ x p k 其中 p k = P ( X = x k ) 这种转换得到的是一个跳跃性的函数 F ( x ) , 跳跃点分布在 x = x k 处 而且跳跃的高度为 p k F(x)=P(X\leqslant x)=\sum\limits_{x_k\leqslant x}P(X=x_k)=\sum\limits_{x\leqslant x}p_k \\其中p_k=P(X=x_k) \\这种转换得到的是一个跳跃性的函数F(x),跳跃点分布在x=x_k处 \\而且跳跃的高度为p_k F(x)=P(X⩽x)=xk⩽x∑P(X=xk)=x⩽x∑pk其中pk=P(X=xk)这种转换得到的是一个跳跃性的函数F(x),跳跃点分布在x=xk处而且跳跃的高度为pk
显然,离散型随机变量的函数不是连续函数
设随机变量X的分布函数是F(x)
如果存在一个**非负可积函数 f ( x ) , 使得任意 x ∈ R f(x),使得任意x\in R f(x),使得任意x∈R**有
F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infin}^{x}f(t)dt F(x)=∫−∞xf(t)dt
X 是连续性随机变量 X是连续性随机变量 X是连续性随机变量
f ( x ) 是随机变量 X 的概率密度函数 f(x)是随机变量X的概率密度函数 f(x)是随机变量X的概率密度函数,检查密度函数(密度)
F ( x ) 是 f ( x ) 的积分上限函数 F(x)是f(x)的积分上限函数 F(x)是f(x)的积分上限函数
非负性
规范性:
F ( x ) 和 f ( x ) 之间的关系 F(x)和f(x)之间的关系 F(x)和f(x)之间的关系
设其中X为连续型随机变量时,有:
对于任意实数 : a , b ( a ⩽ b ) 对于任意实数:a,b(a\leqslant b) 对于任意实数:a,b(a⩽b)
P ( a < X ⩽ b ) = ∫ a b f ( x ) d x P(a
推导:
P ( a < X ⩽ b ) = F ( b ) − F ( a ) = ∫ − ∞ b f ( x ) d x − ∫ − ∞ a f ( x ) d x = ∫ − ∞ b f ( x ) d x + ∫ a − ∞ f ( x ) d x = ∫ a b f ( x ) d x P(a
再回头看规范性:
F ( x ) 是连续函数 F(x)是连续函数 F(x)是连续函数
f ( x ) 在 x 0 处连续时 , f ( x 0 ) = F ′ ( x 0 ) f(x)在x_0处连续时,f(x_0)=F'(x_0) f(x)在x0处连续时,f(x0)=F′(x0)
F ( x + Δ x ) − F ( x ) = ∫ x x + Δ x f ( t ) d t → Δ x → 0 0 F(x+\Delta x)-F(x)=\int_{x}^{x+\Delta x}f(t)dt\xrightarrow{\Delta x\to 0}0 F(x+Δx)−F(x)=∫xx+Δxf(t)dtΔx→00
∀ 常数 c , P ( X = c ) = 0 \forall 常数c, P(X=c)=0 ∀常数c,P(X=c)=0
对于 Δ x > 0 0 ⩽ P ( X = c ) < P ( c − Δ x < x ⩽ c ) = F ( x ) − F ( c − Δ x ) = 0 ( Δ x → 0 + ) 由夹逼法则 , P ( X = c ) = 0 对于\Delta x>0 \\0\leqslant P(X=c) 对于Δx>00⩽P(X=c)<P(c−Δx<x⩽c)=F(x)−F(c−Δx)=0(Δx→0+)由夹逼法则,P(X=c)=0
可见,连续型随机变量取一个具体值的概率是0
基于此有:
P ( a ⩽ X < b ) = P ( { X = a } ∪ { a < X < b } ) = P ( X = a ) + P ( a < X < b ) = P ( a < X < b ) P(a\leqslant XP(a⩽X<b)=P({X=a}∪{a<X<b})=P(X=a)+P(a<X<b)=P(a<X<b)
类似的:
改变密度函数 f ( x ) 在有限个点处的函数值 ( 并且保证这些值非负 ) 改变密度函数f(x)在有限个点处的函数值(并且保证这些值非负) 改变密度函数f(x)在有限个点处的函数值(并且保证这些值非负)
比如得到新的函数 g ( x ) 比如得到新的函数g(x) 比如得到新的函数g(x)
根据概率密度的定义,g(x)也是X的概率密度函数
因此,改变有限个点处的密度函数值不会影响分布函数
即不同的密度函数可能得到相同的分布函数!
一个随机变量的分布函数是确定的,但是它的概率密度却不是唯一的
f ( x ) = { 1 , 0 < x < 1 0 , e l s e g ( x ) = { 1 , 0 ⩽ x ⩽ 1 0 , e l s e f(x)= \begin{cases} 1, &0
f ( x ) , g ( x ) ( 作为概率密度 ) 在是不同的两个函数 , 但是它们有相同的分布函数 f(x),g(x)(作为概率密度)在是不同的两个函数,但是它们有相同的分布函数 f(x),g(x)(作为概率密度)在是不同的两个函数,但是它们有相同的分布函数
F ( x ) = { 0 , x < 0 x , 0 ⩽ x ⩽ 1 1 , x > 0 F(x)= \begin{cases} 0, &x<0 \\x, &0\leqslant x\leqslant 1 \\1, &x>0 \end{cases} F(x)=⎩ ⎨ ⎧0,x,1,x<00⩽x⩽1x>0
F ( x ) = ∫ − ∞ x f ( x ) d x 由于 f ( x ) 是个分段函数 , 因此积分的时候也要相应的分段 f ( x ) 在不同段 ( x 落在不同区间 ) 下的积分如下 { F ( x ) = ∫ − ∞ x f ( x ) d x = ∫ − ∞ x 0 d x = C ∣ − ∞ x = C − C = 0 , x < 0 F ( x ) = ∫ − ∞ x f ( x ) d x = ∫ − ∞ 0 0 d x + ∫ 0 x 1 d x = 0 + x ∣ 0 x = x − 0 = x , 0 ⩽ x ⩽ 1 F ( x ) = ∫ − ∞ x f ( x ) d x = ∫ − ∞ 0 0 d x + ∫ 0 1 1 d x + ∫ 1 x 0 d x = x ∣ 0 1 = 1 , x > 0 F(x)=\int_{-\infin}^{x}f(x)dx \\由于f(x)是个分段函数,因此积分的时候也要相应的分段 \\f(x)在不同段(x落在不同区间)下的积分如下 \\ \begin{cases} F(x)=\int_{-\infin}^{x}f(x)dx=\int_{-\infin}^{x}0dx=C|_{-\infin}^{x}=C-C&=0,&x<0 \\F(x)=\int_{-\infin}^{x}f(x)dx=\int_{-\infin}^{0}0dx+\int_{0}^{x}1dx=0+x|_{0}^{x}=x-0&=x,&0\leqslant x\leqslant 1 \\F(x)=\int_{-\infin}^{x}f(x)dx=\int_{-\infin}^{0}0dx+\int_{0}^{1}1dx+\int_{1}^{x}0dx=x|_{0}^{1}&=1,&x>0 \end{cases} F(x)=∫−∞xf(x)dx由于f(x)是个分段函数,因此积分的时候也要相应的分段f(x)在不同段(x落在不同区间)下的积分如下⎩ ⎨ ⎧F(x)=∫−∞xf(x)dx=∫−∞x0dx=C∣−∞x=C−CF(x)=∫−∞xf(x)dx=∫−∞00dx+∫0x1dx=0+x∣0x=x−0F(x)=∫−∞xf(x)dx=∫−∞00dx+∫011dx+∫1x0dx=x∣01=0,=x,=1,x<00⩽x⩽1x>0
F ( x ) = { 0 , x ⩽ 0 x , 0 < x < 1 1 , x ⩾ 0 F(x)= \begin{cases} 0, &x\leqslant 0 \\x, &0< x< 1 \\1, &x\geqslant 0 \end{cases} F(x)=⎩ ⎨ ⎧0,x,1,x⩽00<x<1x⩾0
由密度函数 f 积分 ( 变上限积分 ) 得到分布函数 F 由密度函数f积分(变上限积分)得到分布函数F 由密度函数f积分(变上限积分)得到分布函数F
求解随机变量落在给定区间内的概率
f ( x ) = { a x + b , 0 < x < 2 0 , e l s e P ( 1 < X < 3 ) = 0.25 f(x)=\begin{cases} ax+b,&0
根据规范性:
∫ − ∞ + ∞ f ( x ) d x = 1 再结合密度函数 f ( x ) 分段区间 ∫ − ∞ + ∞ f ( x ) d x = 0 + ∫ 0 2 f ( x ) d x + 0 = 1 ( a x 2 2 + b x ) ∣ 0 2 = 2 a + 2 b = 1 a + b = 1 2 结合给出的特殊概率 : P ( 1 < X < 3 ) = 0.25 P ( 1 < X < 3 ) = ∫ 1 3 f ( x ) d x = ∫ 1 2 f ( x ) d x + 0 = ∫ 1 2 ( a x + b ) d x = 0.25 ( a x 2 2 + b x ) ∣ 1 2 = 2 a + 2 b − ( 1 2 a + b ) = 3 2 a + b = 0.25 a = − 0.5 , b = 1 \int_{-\infin}^{+\infin}f(x)dx=1 \\再结合密度函数f(x)分段区间 \\\int_{-\infin}^{+\infin}f(x)dx=0+\int_{0}^{2}f(x)dx+0=1 \\(\frac{ax^2}{2}+bx)|_0^2=2a+2b=1 \\a+b=\frac{1}{2} \\结合给出的特殊概率: \\P(1
f ( x ) = { − 1 2 x + 1 , 0 < x < 2 0 , e l s e F ( x ) = ∫ − ∞ x f ( x ) d x = { ∫ − ∞ 0 f ( x ) d x = 0 , x ⩽ 0 ∫ − ∞ 0 f ( x ) d x + ∫ 0 x ( − 1 2 x + 1 ) d x = 0 + − x 2 4 + x = − x 2 4 + x , 0 < x < 2 ∫ − ∞ 0 f ( x ) d x + ∫ 0 2 f ( x ) d x + ∫ 2 x f ( x ) d x = 0 + 1 + 0 = 1 , x ⩾ 2 f(x)=\begin{cases} -\frac{1}{2}x+1,&0
P ( X > 1.5 ) = 1 − P ( X ⩽ 1.5 ) = 1 − F ( 1.5 ) = 1 16 = 0.0625 P(X>1.5)=1-P(X\leqslant 1.5)=1-F(1.5)=\frac{1}{16}=0.0625 P(X>1.5)=1−P(X⩽1.5)=1−F(1.5)=161=0.0625
f ( x ) = { 3 x 2 , 0 < x < 1 0 , e l s e f(x)= \begin{cases} 3x^2,&0
这里例子中 , f ( x ) 被分为三段 , 容易直接推断分布函数中的首尾两段 中间段的 x 3 结果不一定要算出来 , 特别是有些求随机变量的密度函数的问题 , 不必求出 P ( X < x ) = { 0 , x < 0 1 , x > 1 ∫ − ∞ x f ( x ) d x = ∫ 0 x 3 x 2 d x = x 3 , 0 ⩽ x ⩽ 1 这里例子中,f(x)被分为三段,容易直接推断分布函数中的首尾两段 \\中间段的x^3结果不一定要算出来,特别是有些求随机变量的密度函数的问题,不必求出 \\ P(X
从分布函数 F ( x ) = P ( X ⩽ x ) = ∫ − ∞ x f ( x ) d x 以及公式 : P ( a < X ⩽ b ) = F ( b ) − F ( a ) = ∫ a b f ( x ) d x 的角度来看 , 以 [ a , b ] 为底 , 以曲线 f ( x ) 为顶的曲边梯形的面积表示的就是是概率 P ( a < X ⩽ b ) 从极限的角度考虑这个公式 : 取 b = a + Δ x P ( a < X ⩽ x + Δ ) = F ( a + Δ ) − F ( a ) = ∫ a a + Δ f ( x ) d x a 一般化为 x P ( x < X ⩽ x + Δ x ) = F ( x + Δ x ) − F ( x ) = ∫ x x + Δ x f ( x ) d x ≈ f ( x ) d x 即 , 运用化曲为直的近似思想 , 可以得到小曲边梯形近似称小矩形的结果 容易发觉 , 当 f ( x 1 ) > f ( x 2 ) 的是时候 , X 的取值落在 x 1 附近的概率比较大 ( 概率密度函数在 x = x 1 附近区间的积分的面积 ( 近似小矩形面积 ) 比较大 ) 从分布函数F(x)=P(X\leqslant x)=\int_{-\infin}^{x}f(x)\mathrm{d}x \\以及公式:P(a