下面是一个简单的两状态马尔可夫链:

假设建立了描述小孩状态的马尔可夫链模型,可以将“玩耍”、“吃饭”、“睡觉”和“哭闹”作为状态,这些状态和其他行为一起 构成一个“状态空间”:所有可能状态的列表。
此外,在状态空间的顶部,马尔可夫链告诉你从一个状态跳到另一个状态或“过渡”的可能 性。比如,小孩正在玩接下来的五分钟内入睡而不是哭的可能性。

真正使用MDP是并不总是绘制马尔可夫链图,而是使用“转移矩阵”来计算概率。状态空间中的每个状态作为一行一列包含一次, 矩阵中的每个单元格告诉您从其行状态转换到其列状态的概率。所以,在矩阵中,单元格所做的工作与图表中箭头所做的相同。

A B
A
P(A|A): {{ transitionMatrix[0][0] | number:2 }}
P(B|A): {{ transitionMatrix[0][1] | number:2 }}
B
P(A|B): {{ transitionMatrix[1][0] | number:2 }}
P(B|B): {{ transitionMatrix[1][1] | number:2 }}