马尔可夫过程
马尔可夫过程:从历史起源到数学推导与应用
马尔可夫过程的核心是 “无后效性”,系统未来状态的概率分布仅依赖于当前状态,与过去的状态无关。这一性质由俄罗斯数学家安德烈・马尔可夫于 1906 年在研究大数定律时首次提出,他通过分析普希金长诗《叶甫盖尼・奥涅金》中的俄语字母序列,验证了离散随机序列的条件独立性。此后,这一理论被推广至连续时间场景,形成了离散时间马尔可夫链(DTMC)和连续时间马尔可夫链(CTMC)两大分支。马尔可夫过程的简洁性使其成为复杂系统建模的基础工具,广泛应用于金融市场预测、自然语言处理和强化学习等领域。
定义与基本性质
马尔可夫性的形式化描述
马尔可夫过程的核心是马尔可夫性(Markov Property),即未来状态与过去状态在给定当前状态下条件独立。对于离散时间随机过程
其中
转移概率矩阵与初始分布
一步转移概率可构成转移概率矩阵
系统在时刻
展开后可得:
这表明任意时刻的状态分布完全由初始分布和转移矩阵决定。
关键数学推导
切普曼 - 科尔莫戈罗夫方程(C - K 方程)
切普曼 - 科尔莫戈罗夫方程(Chapman-Kolmogorov Equation)描述了多步转移概率的分解规则。对于时齐马尔可夫链,
推导过程:
从状态
由马尔可夫性,
矩阵形式为
平稳分布的存在性与唯一性
平稳分布(Stationary Distribution)是指满足
佩龙 - 弗罗贝尼乌斯定理:若
概率解释:对于不可约正常返链(返回时间期望有限),平稳分布可表示为
证明:
构造测度
将求和拆分为
由于
标准化后
连续时间马尔可夫链与科尔莫戈罗夫方程
连续时间马尔可夫链(CTMC)的状态转移由转移速率矩阵
推导:
根据全概率公式,
两边除以
应用方法与实例
离散时间马尔可夫链的建模步骤
定义状态空间:明确系统可能的状态(如天气模型中的 “晴”“雨”“阴”)。构建转移矩阵:通过数据统计或领域知识确定一步转移概率(如
连续时间马尔可夫链的应用
CTMC 常用于建模排队系统或化学反应动力学。例如,某服务台的状态为等待人数
求解科尔莫戈罗夫方程可得到稳态分布
马尔可夫决策过程(MDP)
MDP 是马尔可夫过程的扩展,引入了动作和奖励机制,核心为贝尔曼方程:
其中