赫斯顿模型校准的最大似然估计方法(Maximum Likelihood Estimation for Calibrating the Heston Model)
接下来,我将为您系统性地讲解如何利用最大似然估计方法校准赫斯顿模型。校准是指利用市场上观察到的期权价格等数据,来倒推赫斯顿模型参数的过程。
第一步:理解校准的目标与赫斯顿模型的参数
在讲解方法之前,我们先明确目标。
- 赫斯顿模型的核心动态:模型假设资产价格 \(S_t\) 和其随机波动率 \(v_t\) 遵循以下随机微分方程组:
\[ \begin{aligned} dS_t &= \mu S_t dt + \sqrt{v_t} S_t dW_t^S \\ dv_t &= \kappa (\theta - v_t) dt + \sigma \sqrt{v_t} dW_t^v \end{aligned} \]
其中, \(dW_t^S dW_t^v = \rho dt\)。
2. 待校准的参数集合:\(\Theta = \{ v_0, \theta, \kappa, \sigma, \rho \}\)。
- \(v_0\):初始方差。
- \(\theta\):长期平均方差。
- \(\kappa\):均值回归速度(方差回归到 \(\theta\) 的快慢)。
- \(\sigma\):波动率的波动率(vol of vol)。
- \(\rho\):资产价格与波动率过程之间的瞬时相关系数。
- 校准的输入数据:通常是某一时刻(例如某一天收盘时)针对同一标的资产(如某个股票指数)的一组期权市场价格,这些期权具有不同的行权价 \(K\) 和不同的到期日 \(T\)。
第二步:为什么选择最大似然估计?以及核心挑战
- 最大似然估计思想:在统计中,MLE的目标是找到一组参数 \(\Theta\),使得在给定这组参数下,观测到当前实际市场数据的概率(似然度)最大。这是一种从数据中“学习”参数的原则性方法。
- 在赫斯顿模型中的直接挑战:我们无法直接观测到模型的核心状态变量——瞬时波动率 \(v_t\)。我们只能观测到资产价格 \(S_t\)(以及由 \(S_t\) 衍生出的期权价格)。\(v_t\) 是一个隐藏状态。
- 解决方案思路:我们需要一个方法,能够基于可观测的资产价格序列 \(\{ S_0, S_1, ..., S_N \}\)(例如每日收盘价),来估计隐藏的波动率路径和模型参数。这就是所谓的“状态空间模型”滤波问题。
第三步:构建状态空间模型与似然函数框架
我们将校准问题转化为一个滤波与估计问题。
- 状态方程(隐含的,由模型定义):描述隐藏状态 \(v_t\) 的演化,即赫斯顿模型的方差过程:
\[ dv_t = \kappa (\theta - v_t) dt + \sigma \sqrt{v_t} dW_t^v \]
在离散时间(如每日)下,我们需要一个离散化的近似,例如欧拉离散化:
\[ v_{t+\Delta t} = v_t + \kappa (\theta - v_t) \Delta t + \sigma \sqrt{v_t} \sqrt{\Delta t} \, Z_t^v \]
其中 \(Z_t^v \sim N(0,1)\)。
- 观测方程:描述我们能观测到什么。这里有两种主流思路:
-
思路A:基于资产收益率。观测对象是资产的对数收益率 \(r_t = \ln(S_t/S_{t-1})\)。在给定 \(v_{t-1}\) 的条件下,根据赫斯顿模型动态,\(r_t\) 近似服从一个均值为 \((\mu - \frac{1}{2}v_{t-1})\Delta t\)、方差为 \(v_{t-1}\Delta t\) 的正态分布,并且与驱动 \(v_t\) 的随机项相关(相关系数为 \(\rho\))。
-
思路B:基于期权价格。观测对象是期权价格。这更为复杂,因为期权价格是隐藏状态 \(v_t\) 和参数 \(\Theta\) 的非线性函数(通过特征函数或傅里叶反演得到)。
对于纯时间序列校准(仅使用历史标的资产价格),我们采用思路A。其观测方程可以写为:
\[ r_t = (\mu - \frac{1}{2}v_{t-1})\Delta t + \sqrt{v_{t-1}\Delta t} \, \epsilon_t \]
其中, \(\begin{pmatrix} \epsilon_t \\ Z_t^v \end{pmatrix}\) 服从均值为0、协方差矩阵为 \(\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}\) 的二维标准正态分布。
- 似然函数:我们的目标是计算在给定参数 \(\Theta\) 下,观测到整个历史收益率序列 \(\mathbf{r} = (r_1, r_2, ..., r_N)\) 的联合概率密度(似然函数)\(L(\Theta; \mathbf{r})\)。
由于 \(v_t\) 是隐藏的,这个联合密度需要对所有可能的波动率路径积分,这是一个高维积分,难以直接计算。
第四步:应用滤波技术近似似然函数——以平方根无迹卡尔曼滤波为例
为了解决隐藏状态问题,我们需要一个“滤波器”来递归地估计每一时刻的 \(v_t\),并同时计算“一步预测”的似然值。
- 卡尔曼滤波及其局限性:标准的卡尔曼滤波要求状态方程和观测方程都是线性的,且噪声为高斯分布。赫斯顿模型的状态方程中,随机项有 \(\sqrt{v_t}\),观测方程也可能非线性,这违背了线性假设。
- 推广:无迹卡尔曼滤波:UKF通过一种称为“无迹变换”的确定性采样方法来处理非线性。它选取一组精心设计的“Sigma点”来捕捉状态分布的均值和协方差,然后让这些点通过非线性方程传播,再重新组合得到变换后分布的统计量。
- 针对赫斯顿模型的SR-UKF流程:
- 初始化:设定初始状态(方差)的估计 \(\hat{v}_{0|0}\) 和误差协方差 \(P_{0|0}\)。
- 时间更新(预测):
a. 根据 \(\hat{v}_{t-1|t-1}\) 和 \(P_{t-1|t-1}\) 生成一组Sigma点。
b. 将每个Sigma点通过赫斯顿方差过程的状态方程(离散化形式)进行传播。
c. 组合传播后的Sigma点,得到预测的状态 \(\hat{v}_{t|t-1}\) 和预测误差协方差 \(P_{t|t-1}\)。 - 测量更新(修正):
a. 再次基于预测值生成一组新的Sigma点。
b. 将这些点通过观测方程(收益率方程)传播,得到预测的观测值(收益率)。
c. 计算预测观测值的均值、协方差,以及与状态的互协方差。
d. 当实际观测值 \(r_t^{obs}\) 到来时,计算卡尔曼增益,并更新对当前状态 \(\hat{v}_{t|t}\) 和协方差 \(P_{t|t}\) 的估计。
- 时间更新(预测):
- 计算单步似然:在得到预测的观测分布(均值为 \(\hat{r}_{t|t-1}\),方差为 \(S_t\))后,假设其服从正态分布,则实际观测值 \(r_t^{obs}\) 的对数似然为:
\[ \ell_t = -\frac{1}{2} \left[ \ln(2\pi S_t) + \frac{(r_t^{obs} - \hat{r}_{t|t-1})^2}{S_t} \right] \]
- 总对数似然:滤波器从 \(t=1\) 运行到 \(t=N\),将每一步的对数似然累加,就得到在参数 \(\Theta\) 下,整个观测序列的总对数似然近似值:
\[ \ell(\Theta; \mathbf{r}) \approx \sum_{t=1}^{N} \ell_t(\Theta) \]
第五步:优化过程与最终校准
- 数值优化:我们的目标是找到参数 \(\Theta\),使得上一步计算出的总对数似然函数 \(\ell(\Theta; \mathbf{r})\) 最大化。这是一个无约束(或有简单约束,如 \(\kappa, \theta, \sigma > 0, |\rho| \le 1\))的非线性优化问题。
- 优化算法:通常使用梯度-based方法(如BFGS、共轭梯度法)或全局优化方法(如差分进化、模拟退火)来寻找最优参数集 \(\Theta^*\):
\[ \Theta^* = \arg \max_{\Theta} \ell(\Theta; \mathbf{r}) \]
- 输出结果:优化算法收敛后,我们得到了一组参数 \(\Theta^* = \{ v_0^*, \theta^*, \kappa^*, \sigma^*, \rho^* \}\),这组参数使得赫斯顿模型产生的动态,在最大似然的意义下,最“可能”生成了我们观测到的历史价格序列。
总结
赫斯顿模型校准的最大似然估计方法,本质上是通过滤波技术(如平方根无迹卡尔曼滤波)来处理隐藏状态变量,从而能够基于可观测的资产价格时间序列,递归地计算出模型参数的似然函数。最后通过数值优化最大化该似然函数,得到模型的最优参数。这种方法基于统计原理,能够有效利用历史数据,但计算复杂度较高,且对初始参数和优化算法比较敏感。它是连接赫斯顿模型理论与市场实际观测数据的一座重要桥梁。