马尔可夫链蒙特卡洛方法(MCMC)
第一步:基础概念——什么是马尔可夫链?
马尔可夫链是一种随机过程,其未来状态的概率分布仅依赖于当前状态,而与过去状态无关(即“无记忆性”)。例如,若用 \(X_t\) 表示时间 \(t\) 的状态,则满足:
\[P(X_{t+1} = x_{t+1} \mid X_t = x_t, X_{t-1} = x_{t-1}, \dots) = P(X_{t+1} = x_{t+1} \mid X_t = x_t). \]
在金融中,马尔可夫链可模拟资产价格的演化(如股价的离散变动)。
第二步:蒙特卡洛方法的局限性
蒙特卡洛方法通过随机抽样估计复杂积分或期望值(如期权定价)。但若目标概率分布(如后验分布)形态复杂或维度高,直接抽样效率极低。例如,在贝叶斯金融模型中,后验分布可能非标准且难以直接采样。
第三步:MCMC的核心思想——构建马尔可夫链
MCMC的核心是构造一个马尔可夫链,使其平稳分布(即长期运行后的状态分布)恰好是目标分布(如后验分布)。通过从链中生成样本,即可用这些样本近似目标分布。关键步骤包括:
- 初始化:选择初始状态 \(X_0\)。
- 迭代转移:根据转移概率 \(P(X_{t+1} \mid X_t)\) 生成新状态。
- 收敛后采样:丢弃初始的“预热”样本,保留后续样本用于计算。
第四步:具体算法——Metropolis-Hastings(M-H算法)
M-H算法是MCMC的典型实现,步骤如下:
- 从提议分布 \(Q(X_{t+1} \mid X_t)\)(如正态分布)中生成候选状态 \(X^*\)。
- 计算接受概率:
\[\alpha = \min\left(1, \frac{P(X^*) \cdot Q(X_t \mid X^*)}{P(X_t) \cdot Q(X^* \mid X_t)}\right), \]
其中 \(P(\cdot)\) 是目标分布密度。
3. 以概率 \(\alpha\) 接受 \(X^*\)(即 \(X_{t+1} = X^*\)),否则保持当前状态( \(X_{t+1} = X_t\))。
金融应用示例:估计随机波动率模型中的参数后验分布。
第五步:收敛性与实践要点
- 收敛诊断:需检查链是否达到平稳状态(如Gelman-Rubin统计量)。
- 自相关性:MCMC样本通常存在序列相关,需调整抽样间隔( thinning)或增加样本量。
- 效率优化:提议分布的选择影响接受率,理想接受率常设在20%-50%。
第六步:金融数学中的典型应用
- 贝叶斯参数估计:对复杂模型(如跳跃-扩散模型)的参数进行后验推断。
- 风险度量:计算在险价值(VaR)的完整后验分布。
- 隐含波动率曲面建模:利用MCMC校准非参数波动率模型。
通过MCMC,金融分析师可处理传统方法难以解决的高维随机问题,提升定价与风险管理的准确性。