随机变量的变换的Wishart过程
字数 3033 2025-12-07 16:27:20

随机变量的变换的Wishart过程

我将为你系统讲解Wishart过程,这是一种在多元时间序列分析和金融随机波动率建模中重要的随机过程。我们从基础概念开始,逐步深入其数学结构和应用。

第一步:Wishart分布回顾与动机
Wishart过程的基础是Wishart分布。设 \(X_1, X_2, \dots, X_n\) 是独立同分布的 \(p\) 维随机向量,且 \(X_i \sim N_p(0, \Sigma)\),则随机矩阵 \(W = \sum_{i=1}^{n} X_i X_i^T\) 服从自由度为 \(n\)、尺度矩阵为 \(\Sigma\) 的Wishart分布,记作 \(W \sim W_p(n, \Sigma)\)。它是多元统计分析中协方差矩阵的抽样分布。Wishart过程的核心思想是将这个“静态”的矩阵分布推广到连续时间随机过程,使得每个时刻的取值都是一个随机正定矩阵。

第二步:Wishart过程的定义
一个 \(p \times p\) 维的Wishart过程 \((W_t)_{t \ge 0}\) 是一个取值于对称非负定矩阵空间(通常是正定矩阵)的连续时间随机过程,其有限维分布具有特定的性质。最经典的定义基于随机微分方程(SDE)。我们称一个取值为 \(p \times p\) 对称非负定矩阵的过程 \(W_t\) 是一个参数为 \(\delta, \Sigma, \Theta\) 的Wishart过程(通常称为Wishart自回归过程或矩阵平方根扩散过程),如果它满足以下随机微分方程:

\[dW_t = (\delta \Sigma + \Theta W_t + W_t \Theta^T) dt + \sqrt{W_t} \, dB_t \, Q + Q^T dB_t^T \sqrt{W_t} \]

其中:

  • \(\delta \ge p-1\) 是自由度参数。
  • \(\Sigma\)\(Q\)\(p \times p\) 常数矩阵,且通常令 \(\Sigma = Q Q^T\) 以保证尺度。
  • \(\Theta\) 是一个 \(p \times p\) 的稳定矩阵(其特征值具有负实部),驱动均值回复。
  • \((B_t)\) 是一个 \(p \times p\) 的标准布朗运动矩阵(其元素独立的标准布朗运动)。
  • \(\sqrt{W_t}\) 表示 \(W_t\) 的对称平方根矩阵(即满足 \(\sqrt{W_t} \sqrt{W_t} = W_t\))。

第三步:直观理解与关键性质

  1. 矩阵值扩散: 这个SDE描述了一个矩阵值“平方根”型扩散。漂移项 \(\delta \Sigma + \Theta W_t + W_t \Theta^T\) 确保了过程的均值回复特性,其中 \(\delta \Sigma\) 是长期均值的一个“推动力”。扩散项 \(\sqrt{W_t} \, dB_t \, Q + ...\) 使得过程的随机波动与其当前值 \(W_t\) 的平方根相关,这保证了过程保持非负定性。
  2. 边缘分布: 在平稳状态下(当 \(t \to \infty\) 且过程平稳),\(W_t\) 的边际分布是一个矩阵伽马分布,它是Wishart分布的连续类比。具体地,如果过程是平稳的,则 \(W_t\) 服从 \(W_p(\delta, \Sigma_0)\),其中 \(\Sigma_0\) 满足一个特定的李雅普诺夫方程 \(\Theta \Sigma_0 + \Sigma_0 \Theta^T = -\Sigma\)
  3. 条件特征函数: Wishart过程的条件特征函数(或矩生成函数)具有仿射结构,这是其解析可处理性的核心。对于 \(t > s\),给定 \(W_s\)\(W_t\) 的条件拉普拉斯变换具有形式:

\[ E[ \exp( \text{Tr}(U W_t) ) | W_s ] = \frac{\exp( \text{Tr}( \Psi(t-s, U) W_s ) )}{ \det( I - 2 \Omega(t-s, U) \Sigma )^{\delta/2} } \]

其中 \(\Psi\)\(\Omega\) 是满足特定矩阵微分方程的函数。这种“仿射”形式使得许多计算(如矩、期权定价)成为可能。

第四步:与标量过程的联系(CIR过程)
当维度 \(p=1\) 时,Wishart过程退化为著名的Cox-Ingersoll-Ross (CIR) 过程,也称为平方根扩散过程,用于建模利率或波动率:

\[d w_t = \kappa (\theta - w_t) dt + \sigma \sqrt{w_t} d B_t \]

通过比较可以看到,此时 \(W_t = w_t\)(标量),\(\delta \Sigma\) 对应 \(\kappa \theta\)\(\Theta\) 对应 \(-\kappa/2\)\(Q\) 对应 \(\sigma/2\)。因此,Wishart过程是CIR过程在高维矩阵空间上的自然推广,用于建模动态的协方差矩阵或波动率矩阵。

第五步:主要应用领域

  1. 随机协方差/波动率建模: 在金融计量经济学中,资产收益率的协方差矩阵是时变的。Wishart过程可以直接对正定的协方差矩阵过程 \(\Sigma_t\) 进行建模,比用多个标量过程(如多元GARCH)更自然且能保证正定性。模型通常设定观测到的资产收益率 \(r_t\) 满足 \(r_t | \Sigma_t \sim N(0, \Sigma_t)\),而 \(\Sigma_t\) 本身服从一个Wishart过程。
  2. 期权定价: 在多资产期权(如篮子期权、波动率衍生品)定价中,资产间的相关性至关重要。Wishart仿射随机波动率模型(如Da Fonseca等人的模型)允许将资产价格和其随机协方差矩阵联合建模为仿射过程,利用其已知的特征函数通过傅里叶方法高效定价。
  3. 贝叶斯时间序列: 在贝叶斯动态模型中,Wishart过程可以作为时变精度矩阵(逆协方差矩阵)的先验过程,用于研究时变的格兰杰因果关系网络或图模型结构。

第六步:模拟方法
模拟Wishart过程通常采用离散化其随机微分方程的方法(欧拉-丸山法)。但由于扩散项包含 \(\sqrt{W_t}\),需要确保离散化后矩阵的非负定性。一种稳健的方法是采用基于矩阵平方根的精确模拟方案(当漂移项有特定形式时)或使用基于Wishart分布性质的条件采样技巧,但这些方法通常计算量较大。实践中,对小的时间步长使用谨慎的欧拉离散化,并在每一步对离散化得到的矩阵进行投影以保持半正定性,是一种常用做法。

总而言之,Wishart过程提供了一个数学上优雅且计算上相对易处理的框架,用于建模在连续时间上演化的随机正定矩阵,是多变量随机波动率和动态协方差研究中的一个核心工具。

随机变量的变换的Wishart过程 我将为你系统讲解Wishart过程,这是一种在多元时间序列分析和金融随机波动率建模中重要的随机过程。我们从基础概念开始,逐步深入其数学结构和应用。 第一步:Wishart分布回顾与动机 Wishart过程的基础是Wishart分布。设 \( X_ 1, X_ 2, \dots, X_ n \) 是独立同分布的 \( p \) 维随机向量,且 \( X_ i \sim N_ p(0, \Sigma) \),则随机矩阵 \( W = \sum_ {i=1}^{n} X_ i X_ i^T \) 服从自由度为 \( n \)、尺度矩阵为 \( \Sigma \) 的Wishart分布,记作 \( W \sim W_ p(n, \Sigma) \)。它是多元统计分析中协方差矩阵的抽样分布。Wishart过程的核心思想是将这个“静态”的矩阵分布推广到连续时间随机过程,使得每个时刻的取值都是一个随机正定矩阵。 第二步:Wishart过程的定义 一个 \( p \times p \) 维的Wishart过程 \( (W_ t)_ {t \ge 0} \) 是一个取值于对称非负定矩阵空间(通常是正定矩阵)的连续时间随机过程,其有限维分布具有特定的性质。最经典的定义基于随机微分方程(SDE)。我们称一个取值为 \( p \times p \) 对称非负定矩阵的过程 \( W_ t \) 是一个参数为 \( \delta, \Sigma, \Theta \) 的Wishart过程(通常称为Wishart自回归过程或矩阵平方根扩散过程),如果它满足以下随机微分方程: \[ dW_ t = (\delta \Sigma + \Theta W_ t + W_ t \Theta^T) dt + \sqrt{W_ t} \, dB_ t \, Q + Q^T dB_ t^T \sqrt{W_ t} \] 其中: \( \delta \ge p-1 \) 是自由度参数。 \( \Sigma \) 和 \( Q \) 是 \( p \times p \) 常数矩阵,且通常令 \( \Sigma = Q Q^T \) 以保证尺度。 \( \Theta \) 是一个 \( p \times p \) 的稳定矩阵(其特征值具有负实部),驱动均值回复。 \( (B_ t) \) 是一个 \( p \times p \) 的标准布朗运动矩阵(其元素独立的标准布朗运动)。 \( \sqrt{W_ t} \) 表示 \( W_ t \) 的对称平方根矩阵(即满足 \( \sqrt{W_ t} \sqrt{W_ t} = W_ t \))。 第三步:直观理解与关键性质 矩阵值扩散 : 这个SDE描述了一个矩阵值“平方根”型扩散。漂移项 \( \delta \Sigma + \Theta W_ t + W_ t \Theta^T \) 确保了过程的均值回复特性,其中 \( \delta \Sigma \) 是长期均值的一个“推动力”。扩散项 \( \sqrt{W_ t} \, dB_ t \, Q + ... \) 使得过程的随机波动与其当前值 \( W_ t \) 的平方根相关,这保证了过程保持非负定性。 边缘分布 : 在平稳状态下(当 \( t \to \infty \) 且过程平稳),\( W_ t \) 的边际分布是一个矩阵伽马分布,它是Wishart分布的连续类比。具体地,如果过程是平稳的,则 \( W_ t \) 服从 \( W_ p(\delta, \Sigma_ 0) \),其中 \( \Sigma_ 0 \) 满足一个特定的李雅普诺夫方程 \( \Theta \Sigma_ 0 + \Sigma_ 0 \Theta^T = -\Sigma \)。 条件特征函数 : Wishart过程的条件特征函数(或矩生成函数)具有仿射结构,这是其解析可处理性的核心。对于 \( t > s \),给定 \( W_ s \),\( W_ t \) 的条件拉普拉斯变换具有形式: \[ E[ \exp( \text{Tr}(U W_ t) ) | W_ s ] = \frac{\exp( \text{Tr}( \Psi(t-s, U) W_ s ) )}{ \det( I - 2 \Omega(t-s, U) \Sigma )^{\delta/2} } \] 其中 \( \Psi \) 和 \( \Omega \) 是满足特定矩阵微分方程的函数。这种“仿射”形式使得许多计算(如矩、期权定价)成为可能。 第四步:与标量过程的联系(CIR过程) 当维度 \( p=1 \) 时,Wishart过程退化为著名的 Cox-Ingersoll-Ross (CIR) 过程 ,也称为平方根扩散过程,用于建模利率或波动率: \[ d w_ t = \kappa (\theta - w_ t) dt + \sigma \sqrt{w_ t} d B_ t \] 通过比较可以看到,此时 \( W_ t = w_ t \)(标量),\( \delta \Sigma \) 对应 \( \kappa \theta \),\( \Theta \) 对应 \( -\kappa/2 \),\( Q \) 对应 \( \sigma/2 \)。因此,Wishart过程是CIR过程在高维矩阵空间上的自然推广,用于建模动态的协方差矩阵或波动率矩阵。 第五步:主要应用领域 随机协方差/波动率建模 : 在金融计量经济学中,资产收益率的协方差矩阵是时变的。Wishart过程可以直接对正定的协方差矩阵过程 \( \Sigma_ t \) 进行建模,比用多个标量过程(如多元GARCH)更自然且能保证正定性。模型通常设定观测到的资产收益率 \( r_ t \) 满足 \( r_ t | \Sigma_ t \sim N(0, \Sigma_ t) \),而 \( \Sigma_ t \) 本身服从一个Wishart过程。 期权定价 : 在多资产期权(如篮子期权、波动率衍生品)定价中,资产间的相关性至关重要。Wishart仿射随机波动率模型(如Da Fonseca等人的模型)允许将资产价格和其随机协方差矩阵联合建模为仿射过程,利用其已知的特征函数通过傅里叶方法高效定价。 贝叶斯时间序列 : 在贝叶斯动态模型中,Wishart过程可以作为时变精度矩阵(逆协方差矩阵)的先验过程,用于研究时变的格兰杰因果关系网络或图模型结构。 第六步:模拟方法 模拟Wishart过程通常采用离散化其随机微分方程的方法(欧拉-丸山法)。但由于扩散项包含 \( \sqrt{W_ t} \),需要确保离散化后矩阵的非负定性。一种稳健的方法是采用基于矩阵平方根的精确模拟方案(当漂移项有特定形式时)或使用基于Wishart分布性质的条件采样技巧,但这些方法通常计算量较大。实践中,对小的时间步长使用谨慎的欧拉离散化,并在每一步对离散化得到的矩阵进行投影以保持半正定性,是一种常用做法。 总而言之,Wishart过程提供了一个数学上优雅且计算上相对易处理的框架,用于建模在连续时间上演化的随机正定矩阵,是多变量随机波动率和动态协方差研究中的一个核心工具。