假设检验:统计推断的决策艺术

目录

  • 引言
  • 8 假设检验
    • 8.1 假设检验的基本原理
      • 8.1.1 核心概念框架
      • 8.1.2 假设形式
    • 8.2 检验的两类错误
      • 8.2.1 错误类型矩阵
      • 8.2.2 错误概率关系
    • 8.3 单正态总体参数检验
      • 8.3.1 均值μ的检验
      • 8.3.2 方差σ²的检验
    • 8.4 双正态总体参数检验
      • 8.4.1 均值差检验
      • 8.4.2 方差比检验
    • 8.5 P值:检验的客观度量
      • 8.5.1 P值定义
      • 8.5.2 决策规则
      • 8.5.3 P值解读

引言

假设检验是统计学的’审判法庭’——通过严格的证据标准(数据),我们对总体参数的’主张’(假设)进行科学裁决。本章将建立原假设与备择假设的对抗框架,揭示显著性水平的哲学内涵,并系统学习从正态总体到非参数的各种检验方法。

8 假设检验

8.1 假设检验的基本原理

8.1.1 核心概念框架

提出假设
设计实验
收集数据
计算检验统计量
决策规则
拒绝H0?
支持H1
不拒绝H0

8.1.2 假设形式

检验类型 原假设 H 0 H_0 H0 备择假设 H 1 H_1 H1 应用场景
双侧检验 θ = θ 0 \theta = \theta_0 θ=θ0 θ ≠ θ 0 \theta \neq \theta_0 θ=θ0 检测参数变化
左侧检验 θ ≥ θ 0 \theta \geq \theta_0 θθ0 θ < θ 0 \theta < \theta_0 θ<θ0 检测参数减小
右侧检验 θ ≤ θ 0 \theta \leq \theta_0 θθ0 θ > θ 0 \theta > \theta_0 θ>θ0 检测参数增大

原则 H 0 H_0 H0 应包含等号,且通常是研究者希望推翻的假设


8.2 检验的两类错误

8.2.1 错误类型矩阵

决策\真实情况 H 0 H_0 H0 为真 H 1 H_1 H1 为真
拒绝 H 0 H_0 H0 第Ⅰ类错误 (α) 正确决策 (1-β)
不拒绝 H 0 H_0 H0 正确决策 (1-α) 第Ⅱ类错误 (β)

8.2.2 错误概率关系

控制
最大化
增加
增大
显著性水平 α
第Ⅰ类错误
功效 1-β
第Ⅱ类错误 β
样本量 n
效应量
  • α (显著性水平):通常设为0.05或0.01
  • β 影响因素:α减小、样本量小、效应量小时β增大

平衡艺术:在固定样本量下,α与β此消彼长(如图示)


8.3 单正态总体参数检验

8.3.1 均值μ的检验

条件 检验统计量 拒绝域
σ \sigma σ已知 z = x ˉ − μ 0 σ / n z=\frac{\bar{x}-\mu_0}{\sigma/\sqrt{n}} z=σ/n xˉμ0 ∣ z ∣ ≥ z α / 2 \mid z\mid \geq z_{\alpha/2} z∣≥zα/2 (双侧)
σ \sigma σ未知 t = x ˉ − μ 0 s / n t=\frac{\bar{x}-\mu_0}{s/\sqrt{n}} t=s/n xˉμ0 ∣ t ∣ ≥ t α / 2 ( n − 1 ) \mid t\mid \geq t_{\alpha/2}(n-1) t∣≥tα/2(n1)

8.3.2 方差σ²的检验

条件 检验统计量 拒绝域
μ \mu μ已知 χ 2 = ∑ ( x i − μ 0 ) 2 σ 0 2 \chi^2=\sum\frac{(x_i-\mu_0)^2}{\sigma_0^2} χ2=σ02(xiμ0)2 χ 2 ≤ χ 1 − α / 2 2 ( n ) \chi^2 \leq \chi^2_{1-\alpha/2}(n) χ2χ1α/22(n) χ 2 ≥ χ α / 2 2 ( n ) \chi^2 \geq \chi^2_{\alpha/2}(n) χ2χα/22(n)
μ \mu μ未知 χ 2 = ( n − 1 ) s 2 σ 0 2 \chi^2=\frac{(n-1)s^2}{\sigma_0^2} χ2=σ02(n1)s2 χ 2 ≤ χ 1 − α / 2 2 ( n − 1 ) \chi^2 \leq \chi^2_{1-\alpha/2}(n-1) χ2χ1α/22(n1) χ 2 ≥ χ α / 2 2 ( n − 1 ) \chi^2 \geq \chi^2_{\alpha/2}(n-1) χ2χα/22(n1)

8.4 双正态总体参数检验

8.4.1 均值差检验

条件 检验统计量 拒绝域
σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2已知 z = ( x ˉ − y ˉ ) − d 0 σ 1 2 / m + σ 2 2 / n z=\frac{(\bar{x}-\bar{y})-d_0}{\sqrt{\sigma_1^2/m+\sigma_2^2/n}} z=σ12/m+σ22/n (xˉyˉ)d0 ∣ z ∣ ≥ z α / 2 \mid z\mid \geq z_{\alpha/2} z∣≥zα/2
σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2未知 t = ( x ˉ − y ˉ ) − d 0 s p 1 / m + 1 / n t=\frac{(\bar{x}-\bar{y})-d_0}{s_p\sqrt{1/m+1/n}} t=sp1/m+1/n (xˉyˉ)d0 ∣ t ∣ ≥ t α / 2 ( m + n − 2 ) \mid t\mid \geq t_{\alpha/2}(m+n-2) t∣≥tα/2(m+n2)

8.4.2 方差比检验

条件 检验统计量 拒绝域
μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2未知 f = s 1 2 s 2 2 f=\frac{s_1^2}{s_2^2} f=s22s12 f ≤ F 1 − α / 2 ( m − 1 , n − 1 ) f \leq F_{1-\alpha/2}(m-1,n-1) fF1α/2(m1,n1) f ≥ F α / 2 ( m − 1 , n − 1 ) f \geq F_{\alpha/2}(m-1,n-1) fFα/2(m1,n1)

8.5 P值:检验的客观度量

8.5.1 P值定义

H 0 H_0 H0成立的条件下,观测到当前样本或更极端样本的概率

8.5.2 决策规则

  • P值 ≤ α → 拒绝 H 0 H_0 H0(结果统计显著)
  • P值 > α → 不拒绝 H 0 H_0 H0

8.5.3 P值解读

接近0
接近1
独立于
影响
P值
强证据反对H0
弱证据反对H0
效应大小
样本量

重要提示:P值不是 H 0 H_0 H0为真的概率!常见误解:

  • P=0.05 ≠ “H0有5%概率为真”
  • 而是"如果H0为真,有5%概率观察到当前或更极端数据"

你可能感兴趣的:(概率论与数理统计,概率论)