赫斯顿模型校准的最大似然估计方法(Maximum Likelihood Estimation for Calibrating the Heston Model)
字数 3930 2025-12-22 08:24:14

赫斯顿模型校准的最大似然估计方法(Maximum Likelihood Estimation for Calibrating the Heston Model)

接下来,我将为您系统性地讲解如何利用最大似然估计方法校准赫斯顿模型。校准是指利用市场上观察到的期权价格等数据,来倒推赫斯顿模型参数的过程。

第一步:理解校准的目标与赫斯顿模型的参数

在讲解方法之前,我们先明确目标。

  1. 赫斯顿模型的核心动态:模型假设资产价格 \(S_t\) 和其随机波动率 \(v_t\) 遵循以下随机微分方程组:

\[ \begin{aligned} dS_t &= \mu S_t dt + \sqrt{v_t} S_t dW_t^S \\ dv_t &= \kappa (\theta - v_t) dt + \sigma \sqrt{v_t} dW_t^v \end{aligned} \]

其中, \(dW_t^S dW_t^v = \rho dt\)
2. 待校准的参数集合\(\Theta = \{ v_0, \theta, \kappa, \sigma, \rho \}\)

  • \(v_0\):初始方差。
  • \(\theta\):长期平均方差。
  • \(\kappa\):均值回归速度(方差回归到 \(\theta\) 的快慢)。
  • \(\sigma\):波动率的波动率(vol of vol)。
  • \(\rho\):资产价格与波动率过程之间的瞬时相关系数。
  1. 校准的输入数据:通常是某一时刻(例如某一天收盘时)针对同一标的资产(如某个股票指数)的一组期权市场价格,这些期权具有不同的行权价 \(K\) 和不同的到期日 \(T\)

第二步:为什么选择最大似然估计?以及核心挑战

  1. 最大似然估计思想:在统计中,MLE的目标是找到一组参数 \(\Theta\),使得在给定这组参数下,观测到当前实际市场数据的概率(似然度)最大。这是一种从数据中“学习”参数的原则性方法。
  2. 在赫斯顿模型中的直接挑战:我们无法直接观测到模型的核心状态变量——瞬时波动率 \(v_t\)。我们只能观测到资产价格 \(S_t\)(以及由 \(S_t\) 衍生出的期权价格)。\(v_t\) 是一个隐藏状态。
  3. 解决方案思路:我们需要一个方法,能够基于可观测的资产价格序列 \(\{ S_0, S_1, ..., S_N \}\)(例如每日收盘价),来估计隐藏的波动率路径和模型参数。这就是所谓的“状态空间模型”滤波问题。

第三步:构建状态空间模型与似然函数框架

我们将校准问题转化为一个滤波与估计问题。

  1. 状态方程(隐含的,由模型定义):描述隐藏状态 \(v_t\) 的演化,即赫斯顿模型的方差过程:

\[ dv_t = \kappa (\theta - v_t) dt + \sigma \sqrt{v_t} dW_t^v \]

在离散时间(如每日)下,我们需要一个离散化的近似,例如欧拉离散化:

\[ v_{t+\Delta t} = v_t + \kappa (\theta - v_t) \Delta t + \sigma \sqrt{v_t} \sqrt{\Delta t} \, Z_t^v \]

其中 \(Z_t^v \sim N(0,1)\)

  1. 观测方程:描述我们能观测到什么。这里有两种主流思路:
  • 思路A:基于资产收益率。观测对象是资产的对数收益率 \(r_t = \ln(S_t/S_{t-1})\)。在给定 \(v_{t-1}\) 的条件下,根据赫斯顿模型动态,\(r_t\) 近似服从一个均值为 \((\mu - \frac{1}{2}v_{t-1})\Delta t\)、方差为 \(v_{t-1}\Delta t\) 的正态分布,并且与驱动 \(v_t\) 的随机项相关(相关系数为 \(\rho\))。

  • 思路B:基于期权价格。观测对象是期权价格。这更为复杂,因为期权价格是隐藏状态 \(v_t\) 和参数 \(\Theta\) 的非线性函数(通过特征函数或傅里叶反演得到)。

    对于纯时间序列校准(仅使用历史标的资产价格),我们采用思路A。其观测方程可以写为:

\[ r_t = (\mu - \frac{1}{2}v_{t-1})\Delta t + \sqrt{v_{t-1}\Delta t} \, \epsilon_t \]

其中, \(\begin{pmatrix} \epsilon_t \\ Z_t^v \end{pmatrix}\) 服从均值为0、协方差矩阵为 \(\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}\) 的二维标准正态分布。

  1. 似然函数:我们的目标是计算在给定参数 \(\Theta\) 下,观测到整个历史收益率序列 \(\mathbf{r} = (r_1, r_2, ..., r_N)\) 的联合概率密度(似然函数)\(L(\Theta; \mathbf{r})\)
    由于 \(v_t\) 是隐藏的,这个联合密度需要对所有可能的波动率路径积分,这是一个高维积分,难以直接计算。

第四步:应用滤波技术近似似然函数——以平方根无迹卡尔曼滤波为例

为了解决隐藏状态问题,我们需要一个“滤波器”来递归地估计每一时刻的 \(v_t\),并同时计算“一步预测”的似然值。

  1. 卡尔曼滤波及其局限性:标准的卡尔曼滤波要求状态方程和观测方程都是线性的,且噪声为高斯分布。赫斯顿模型的状态方程中,随机项有 \(\sqrt{v_t}\),观测方程也可能非线性,这违背了线性假设。
  2. 推广:无迹卡尔曼滤波:UKF通过一种称为“无迹变换”的确定性采样方法来处理非线性。它选取一组精心设计的“Sigma点”来捕捉状态分布的均值和协方差,然后让这些点通过非线性方程传播,再重新组合得到变换后分布的统计量。
  3. 针对赫斯顿模型的SR-UKF流程
  • 初始化:设定初始状态(方差)的估计 \(\hat{v}_{0|0}\) 和误差协方差 \(P_{0|0}\)
    • 时间更新(预测)
      a. 根据 \(\hat{v}_{t-1|t-1}\)\(P_{t-1|t-1}\) 生成一组Sigma点。
      b. 将每个Sigma点通过赫斯顿方差过程的状态方程(离散化形式)进行传播。
      c. 组合传播后的Sigma点,得到预测的状态 \(\hat{v}_{t|t-1}\) 和预测误差协方差 \(P_{t|t-1}\)
    • 测量更新(修正)
      a. 再次基于预测值生成一组新的Sigma点。
      b. 将这些点通过观测方程(收益率方程)传播,得到预测的观测值(收益率)。
      c. 计算预测观测值的均值、协方差,以及与状态的互协方差。
      d. 当实际观测值 \(r_t^{obs}\) 到来时,计算卡尔曼增益,并更新对当前状态 \(\hat{v}_{t|t}\) 和协方差 \(P_{t|t}\) 的估计。
  • 计算单步似然:在得到预测的观测分布(均值为 \(\hat{r}_{t|t-1}\),方差为 \(S_t\))后,假设其服从正态分布,则实际观测值 \(r_t^{obs}\) 的对数似然为:

\[ \ell_t = -\frac{1}{2} \left[ \ln(2\pi S_t) + \frac{(r_t^{obs} - \hat{r}_{t|t-1})^2}{S_t} \right] \]

  1. 总对数似然:滤波器从 \(t=1\) 运行到 \(t=N\),将每一步的对数似然累加,就得到在参数 \(\Theta\) 下,整个观测序列的总对数似然近似值:

\[ \ell(\Theta; \mathbf{r}) \approx \sum_{t=1}^{N} \ell_t(\Theta) \]

第五步:优化过程与最终校准

  1. 数值优化:我们的目标是找到参数 \(\Theta\),使得上一步计算出的总对数似然函数 \(\ell(\Theta; \mathbf{r})\) 最大化。这是一个无约束(或有简单约束,如 \(\kappa, \theta, \sigma > 0, |\rho| \le 1\))的非线性优化问题。
  2. 优化算法:通常使用梯度-based方法(如BFGS、共轭梯度法)或全局优化方法(如差分进化、模拟退火)来寻找最优参数集 \(\Theta^*\)

\[ \Theta^* = \arg \max_{\Theta} \ell(\Theta; \mathbf{r}) \]

  1. 输出结果:优化算法收敛后,我们得到了一组参数 \(\Theta^* = \{ v_0^*, \theta^*, \kappa^*, \sigma^*, \rho^* \}\),这组参数使得赫斯顿模型产生的动态,在最大似然的意义下,最“可能”生成了我们观测到的历史价格序列。

总结
赫斯顿模型校准的最大似然估计方法,本质上是通过滤波技术(如平方根无迹卡尔曼滤波)来处理隐藏状态变量,从而能够基于可观测的资产价格时间序列,递归地计算出模型参数的似然函数。最后通过数值优化最大化该似然函数,得到模型的最优参数。这种方法基于统计原理,能够有效利用历史数据,但计算复杂度较高,且对初始参数和优化算法比较敏感。它是连接赫斯顿模型理论与市场实际观测数据的一座重要桥梁。

赫斯顿模型校准的最大似然估计方法(Maximum Likelihood Estimation for Calibrating the Heston Model) 接下来,我将为您系统性地讲解如何利用最大似然估计方法校准赫斯顿模型。校准是指利用市场上观察到的期权价格等数据,来倒推赫斯顿模型参数的过程。 第一步:理解校准的目标与赫斯顿模型的参数 在讲解方法之前,我们先明确目标。 赫斯顿模型的核心动态 :模型假设资产价格 \(S_ t\) 和其随机波动率 \(v_ t\) 遵循以下随机微分方程组: \[ \begin{aligned} dS_ t &= \mu S_ t dt + \sqrt{v_ t} S_ t dW_ t^S \\ dv_ t &= \kappa (\theta - v_ t) dt + \sigma \sqrt{v_ t} dW_ t^v \end{aligned} \] 其中, \(dW_ t^S dW_ t^v = \rho dt\)。 待校准的参数集合 :\(\Theta = \{ v_ 0, \theta, \kappa, \sigma, \rho \}\)。 \(v_ 0\):初始方差。 \(\theta\):长期平均方差。 \(\kappa\):均值回归速度(方差回归到 \(\theta\) 的快慢)。 \(\sigma\):波动率的波动率(vol of vol)。 \(\rho\):资产价格与波动率过程之间的瞬时相关系数。 校准的输入数据 :通常是某一时刻(例如某一天收盘时)针对 同一标的资产 (如某个股票指数)的 一组期权市场价格 ,这些期权具有不同的行权价 \(K\) 和不同的到期日 \(T\)。 第二步:为什么选择最大似然估计?以及核心挑战 最大似然估计思想 :在统计中,MLE的目标是找到一组参数 \(\Theta\),使得在给定这组参数下,观测到当前实际市场数据的概率(似然度)最大。这是一种从数据中“学习”参数的原则性方法。 在赫斯顿模型中的直接挑战 :我们无法直接观测到模型的核心状态变量——瞬时波动率 \(v_ t\)。我们只能观测到资产价格 \(S_ t\)(以及由 \(S_ t\) 衍生出的期权价格)。\(v_ t\) 是一个隐藏状态。 解决方案思路 :我们需要一个方法,能够基于可观测的资产价格序列 \(\{ S_ 0, S_ 1, ..., S_ N \}\)(例如每日收盘价),来估计隐藏的波动率路径和模型参数。这就是所谓的“状态空间模型”滤波问题。 第三步:构建状态空间模型与似然函数框架 我们将校准问题转化为一个滤波与估计问题。 状态方程(隐含的,由模型定义) :描述隐藏状态 \(v_ t\) 的演化,即赫斯顿模型的方差过程: \[ dv_ t = \kappa (\theta - v_ t) dt + \sigma \sqrt{v_ t} dW_ t^v \] 在离散时间(如每日)下,我们需要一个离散化的近似,例如欧拉离散化: \[ v_ {t+\Delta t} = v_ t + \kappa (\theta - v_ t) \Delta t + \sigma \sqrt{v_ t} \sqrt{\Delta t} \, Z_ t^v \] 其中 \(Z_ t^v \sim N(0,1)\)。 观测方程 :描述我们能观测到什么。这里有两种主流思路: 思路A:基于资产收益率 。观测对象是资产的对数收益率 \(r_ t = \ln(S_ t/S_ {t-1})\)。在给定 \(v_ {t-1}\) 的条件下,根据赫斯顿模型动态,\(r_ t\) 近似服从一个均值为 \((\mu - \frac{1}{2}v_ {t-1})\Delta t\)、方差为 \(v_ {t-1}\Delta t\) 的正态分布,并且与驱动 \(v_ t\) 的随机项相关(相关系数为 \(\rho\))。 思路B:基于期权价格 。观测对象是期权价格。这更为复杂,因为期权价格是隐藏状态 \(v_ t\) 和参数 \(\Theta\) 的非线性函数(通过特征函数或傅里叶反演得到)。 对于 纯时间序列校准 (仅使用历史标的资产价格),我们采用思路A。其观测方程可以写为: \[ r_ t = (\mu - \frac{1}{2}v_ {t-1})\Delta t + \sqrt{v_ {t-1}\Delta t} \, \epsilon_ t \] 其中, \(\begin{pmatrix} \epsilon_ t \\ Z_ t^v \end{pmatrix}\) 服从均值为0、协方差矩阵为 \(\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}\) 的二维标准正态分布。 似然函数 :我们的目标是计算在给定参数 \(\Theta\) 下,观测到整个历史收益率序列 \(\mathbf{r} = (r_ 1, r_ 2, ..., r_ N)\) 的联合概率密度(似然函数)\(L(\Theta; \mathbf{r})\)。 由于 \(v_ t\) 是隐藏的,这个联合密度需要对所有可能的波动率路径积分,这是一个高维积分,难以直接计算。 第四步:应用滤波技术近似似然函数——以平方根无迹卡尔曼滤波为例 为了解决隐藏状态问题,我们需要一个“滤波器”来递归地估计每一时刻的 \(v_ t\),并同时计算“一步预测”的似然值。 卡尔曼滤波及其局限性 :标准的卡尔曼滤波要求状态方程和观测方程都是线性的,且噪声为高斯分布。赫斯顿模型的状态方程中,随机项有 \(\sqrt{v_ t}\),观测方程也可能非线性,这违背了线性假设。 推广:无迹卡尔曼滤波 :UKF通过一种称为“无迹变换”的确定性采样方法来处理非线性。它选取一组精心设计的“Sigma点”来捕捉状态分布的均值和协方差,然后让这些点通过非线性方程传播,再重新组合得到变换后分布的统计量。 针对赫斯顿模型的SR-UKF流程 : 初始化 :设定初始状态(方差)的估计 \(\hat{v} {0|0}\) 和误差协方差 \(P {0|0}\)。 时间更新(预测) : a. 根据 \(\hat{v} {t-1|t-1}\) 和 \(P {t-1|t-1}\) 生成一组Sigma点。 b. 将每个Sigma点通过赫斯顿方差过程的状态方程(离散化形式)进行传播。 c. 组合传播后的Sigma点,得到预测的状态 \(\hat{v} {t|t-1}\) 和预测误差协方差 \(P {t|t-1}\)。 测量更新(修正) : a. 再次基于预测值生成一组新的Sigma点。 b. 将这些点通过观测方程(收益率方程)传播,得到预测的观测值(收益率)。 c. 计算预测观测值的均值、协方差,以及与状态的互协方差。 d. 当实际观测值 \(r_ t^{obs}\) 到来时,计算卡尔曼增益,并更新对当前状态 \(\hat{v} {t|t}\) 和协方差 \(P {t|t}\) 的估计。 计算单步似然 :在得到预测的观测分布(均值为 \(\hat{r} {t|t-1}\),方差为 \(S_ t\))后,假设其服从正态分布,则实际观测值 \(r_ t^{obs}\) 的对数似然为: \[ \ell_ t = -\frac{1}{2} \left[ \ln(2\pi S_ t) + \frac{(r_ t^{obs} - \hat{r} {t|t-1})^2}{S_ t} \right ] \] 总对数似然 :滤波器从 \(t=1\) 运行到 \(t=N\),将每一步的对数似然累加,就得到在参数 \(\Theta\) 下,整个观测序列的总对数似然近似值: \[ \ell(\Theta; \mathbf{r}) \approx \sum_ {t=1}^{N} \ell_ t(\Theta) \] 第五步:优化过程与最终校准 数值优化 :我们的目标是找到参数 \(\Theta\),使得上一步计算出的总对数似然函数 \(\ell(\Theta; \mathbf{r})\) 最大化。这是一个无约束(或有简单约束,如 \(\kappa, \theta, \sigma > 0, |\rho| \le 1\))的非线性优化问题。 优化算法 :通常使用梯度-based方法(如BFGS、共轭梯度法)或全局优化方法(如差分进化、模拟退火)来寻找最优参数集 \(\Theta^ \): \[ \Theta^ = \arg \max_ {\Theta} \ell(\Theta; \mathbf{r}) \] 输出结果 :优化算法收敛后,我们得到了一组参数 \(\Theta^* = \{ v_ 0^ , \theta^ , \kappa^ , \sigma^ , \rho^* \}\),这组参数使得赫斯顿模型产生的动态,在最大似然的意义下,最“可能”生成了我们观测到的历史价格序列。 总结 赫斯顿模型校准的最大似然估计方法,本质上是通过 滤波技术 (如平方根无迹卡尔曼滤波)来 处理隐藏状态变量 ,从而能够基于可观测的资产价格时间序列,递归地计算出模型参数的似然函数。最后通过 数值优化 最大化该似然函数,得到模型的最优参数。这种方法基于统计原理,能够有效利用历史数据,但计算复杂度较高,且对初始参数和优化算法比较敏感。它是连接赫斯顿模型理论与市场实际观测数据的一座重要桥梁。