马尔科夫链(Markov Chain)没有发射概率 B

1. 马尔科夫链的定义

马尔科夫链是一种序列模型,其中状态是完全可见的,没有“隐藏”部分。它的转移是根据当前状态决定的,只关心当前状态转移到下一个状态的概率。其核心是 状态转移概率矩阵 A A A

  • 核心特点:只关注状态之间的转移,不涉及观察值(观测值)的生成。
  • 数学定义:如果在时间 t t t 的状态为 X t X_t Xt,那么 X t X_t Xt 的分布只取决于 X t − 1 X_{t-1} Xt1,即满足马尔科夫性:
    P ( X t ∣ X t − 1 , X t − 2 , … , X 1 ) = P ( X t ∣ X t − 1 ) . P(X_t | X_{t-1}, X_{t-2}, \dots, X_1) = P(X_t | X_{t-1}). P(XtXt1,Xt2,,X1)=P(XtXt1).

例子
假设你正在模拟一个天气系统,状态可能是“晴天”“阴天”和“雨天”,它们之间的转移概率可以用一个矩阵 A A A 来表示,例如:
A = [ 0.7 0.2 0.1 0.3 0.4 0.3 0.2 0.3 0.5 ] A = \begin{bmatrix} 0.7 & 0.2 & 0.1 \\ 0.3 & 0.4 & 0.3 \\ 0.2 & 0.3 & 0.5 \end{bmatrix} A= 0.70.30.20.20.40.30.10.30.5
其中, A i j A_{ij} Aij 表示从状态 i i i 转移到状态 j j j 的概率。


2. 隐马尔科夫模型的定义

HMM 是马尔科夫链的扩展,增加了一个 “隐藏状态”“观测值” 的机制。它不仅有状态转移概率矩阵 A A A,还需要 发射概率矩阵 B B B 来描述每个隐藏状态如何生成观测值。

  • 核心特点

    1. A A A:描述隐藏状态之间的转移关系。
    2. B B B:描述隐藏状态如何生成观测值。
    3. 隐藏状态是不可见的,观测值是可见的。
  • 数学定义
    P ( O , Q ) = P ( O ∣ Q ) P ( Q ) , P(O, Q) = P(O|Q) P(Q), P(O,Q)=P(OQ)P(Q),
    其中 O O O 是观测序列, Q Q Q 是隐藏状态序列。

例子
延续天气的例子,假设我们不能直接观测到天气,而是通过温度高低来间接推断天气。那么:

  • 隐藏状态:晴天、阴天、雨天。
  • 观测值:高温、中温、低温。
  • B B B:描述晴天可能导致高温的概率、中温的概率和低温的概率,例如:
    B = [ 0.8 0.1 0.1 0.2 0.6 0.2 0.1 0.3 0.6 ] B = \begin{bmatrix} 0.8 & 0.1 & 0.1 \\ 0.2 & 0.6 & 0.2 \\ 0.1 & 0.3 & 0.6 \end{bmatrix} B= 0.80.20.10.10.60.30.10.20.6
    其中, B j k B_{jk} Bjk 表示状态 j j j 发射观测值 k k k 的概率。

3. 总结两者的区别

特性 马尔科夫链 (Markov Chain) 隐马尔科夫模型 (HMM)
状态是否可见 状态是可见的 状态是隐藏的
是否有观测值 没有观测值 有观测值
发射概率 B B B 没有,需要的只是转移概率 A A A 有,描述隐藏状态如何生成观测值
应用场景 天气预测、股市状态模拟等 语音识别、自然语言处理等

因此,马尔科夫链只关心状态之间的转移,不涉及任何观测或发射行为,因此不需要发射概率 B B B。而 HMM 则更进一步,解决了隐藏状态与观测值之间关系的问题,通过 B B B 矩阵建立观测值和隐藏状态的连接。

你可能感兴趣的:(概率论)