协方差矩阵
字数 1818 2025-10-26 19:16:23

协方差矩阵

协方差矩阵是描述多个随机变量之间协方差关系的方阵。让我们从基础概念开始,逐步深入。

1. 协方差的回顾

  • 定义:对于两个随机变量 \(X\)\(Y\),协方差衡量它们的线性相关性:

\[ \text{Cov}(X, Y) = \mathbb{E}[(X - \mathbb{E}[X])(Y - \mathbb{E}[Y])] \]

  • 性质
    • \(\text{Cov}(X, Y) > 0\)\(X\)\(Y\) 倾向于同向变化;
    • \(\text{Cov}(X, Y) < 0\),则反向变化;
    • \(\text{Cov}(X, Y) = 0\),称 \(X\)\(Y\) 不相关(但未必独立)。

2. 从协方差到协方差矩阵

假设有 \(n\) 个随机变量 \(X_1, X_2, \dots, X_n\),协方差矩阵 \(\Sigma\) 是一个 \(n \times n\) 矩阵,其中第 \((i, j)\) 元素为:

\[\Sigma_{ij} = \text{Cov}(X_i, X_j) \]

矩阵形式:若定义随机向量 \(\mathbf{X} = [X_1, X_2, \dots, X_n]^\top\),则:

\[\Sigma = \mathbb{E}[(\mathbf{X} - \boldsymbol{\mu})(\mathbf{X} - \boldsymbol{\mu})^\top] \]

其中 \(\boldsymbol{\mu} = \mathbb{E}[\mathbf{X}]\) 是均值向量。

3. 协方差矩阵的性质

  1. 对称性\(\Sigma = \Sigma^\top\),因为 \(\text{Cov}(X_i, X_j) = \text{Cov}(X_j, X_i)\)
  2. 半正定性:对任意非零向量 \(\mathbf{a} \in \mathbb{R}^n\),有 \(\mathbf{a}^\top \Sigma \mathbf{a} \geq 0\)
    • 理由:\(\mathbf{a}^\top \Sigma \mathbf{a} = \text{Var}(\mathbf{a}^\top \mathbf{X}) \geq 0\)(方差非负)。
  3. 对角线元素\(\Sigma_{ii} = \text{Var}(X_i)\),即第 \(i\) 个变量的方差。

4. 协方差矩阵的估计

在实际中,我们通常用样本数据估计协方差矩阵。假设有 \(m\) 个观测样本 \(\mathbf{x}_1, \dots, \mathbf{x}_m\)(每个样本是 \(n\) 维向量),样本协方差矩阵 \(S\) 的计算公式为:

\[S = \frac{1}{m-1} \sum_{k=1}^m (\mathbf{x}_k - \bar{\mathbf{x}})(\mathbf{x}_k - \bar{\mathbf{x}})^\top \]

其中 \(\bar{\mathbf{x}}\) 是样本均值向量,分母 \(m-1\) 确保无偏性(对比单变量样本方差)。

5. 协方差矩阵的应用示例

  • 多元正态分布:概率密度函数直接依赖协方差矩阵:

\[ f(\mathbf{x}) = \frac{1}{\sqrt{(2\pi)^n |\Sigma|}} \exp\left(-\frac{1}{2} (\mathbf{x} - \boldsymbol{\mu})^\top \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu})\right) \]

  • 主成分分析(PCA):通过特征值分解协方差矩阵,找到数据方差最大的方向,实现降维。
  • 金融风险建模:资产收益率的协方差矩阵用于量化投资组合的风险。

6. 深入理解:特征值与几何意义

协方差矩阵的特征向量指向数据分布的主要方向,特征值表示对应方向的方差大小。例如:

  • 若某个特征值远大于其他特征值,说明数据在该方向上有显著变化。
  • 协方差矩阵的逆矩阵 \(\Sigma^{-1}\) 在马氏距离中用于衡量数据点与均值的距离,考虑变量间的相关性。

通过以上步骤,你可以逐步掌握协方差矩阵的核心概念、性质及实际应用。

协方差矩阵 协方差矩阵是描述多个随机变量之间协方差关系的方阵。让我们从基础概念开始,逐步深入。 1. 协方差的回顾 定义 :对于两个随机变量 \(X\) 和 \(Y\),协方差衡量它们的线性相关性: \[ \text{Cov}(X, Y) = \mathbb{E}[ (X - \mathbb{E}[ X])(Y - \mathbb{E}[ Y]) ] \] 性质 : 若 \(\text{Cov}(X, Y) > 0\),\(X\) 和 \(Y\) 倾向于同向变化; 若 \(\text{Cov}(X, Y) < 0\),则反向变化; 若 \(\text{Cov}(X, Y) = 0\),称 \(X\) 和 \(Y\) 不相关(但未必独立)。 2. 从协方差到协方差矩阵 假设有 \(n\) 个随机变量 \(X_ 1, X_ 2, \dots, X_ n\),协方差矩阵 \(\Sigma\) 是一个 \(n \times n\) 矩阵,其中第 \((i, j)\) 元素为: \[ \Sigma_ {ij} = \text{Cov}(X_ i, X_ j) \] 矩阵形式 :若定义随机向量 \(\mathbf{X} = [ X_ 1, X_ 2, \dots, X_ n ]^\top\),则: \[ \Sigma = \mathbb{E}[ (\mathbf{X} - \boldsymbol{\mu})(\mathbf{X} - \boldsymbol{\mu})^\top ] \] 其中 \(\boldsymbol{\mu} = \mathbb{E}[ \mathbf{X} ]\) 是均值向量。 3. 协方差矩阵的性质 对称性 :\(\Sigma = \Sigma^\top\),因为 \(\text{Cov}(X_ i, X_ j) = \text{Cov}(X_ j, X_ i)\)。 半正定性 :对任意非零向量 \(\mathbf{a} \in \mathbb{R}^n\),有 \(\mathbf{a}^\top \Sigma \mathbf{a} \geq 0\)。 理由:\(\mathbf{a}^\top \Sigma \mathbf{a} = \text{Var}(\mathbf{a}^\top \mathbf{X}) \geq 0\)(方差非负)。 对角线元素 :\(\Sigma_ {ii} = \text{Var}(X_ i)\),即第 \(i\) 个变量的方差。 4. 协方差矩阵的估计 在实际中,我们通常用样本数据估计协方差矩阵。假设有 \(m\) 个观测样本 \(\mathbf{x}_ 1, \dots, \mathbf{x} m\)(每个样本是 \(n\) 维向量),样本协方差矩阵 \(S\) 的计算公式为: \[ S = \frac{1}{m-1} \sum {k=1}^m (\mathbf{x}_ k - \bar{\mathbf{x}})(\mathbf{x}_ k - \bar{\mathbf{x}})^\top \] 其中 \(\bar{\mathbf{x}}\) 是样本均值向量,分母 \(m-1\) 确保无偏性(对比单变量样本方差)。 5. 协方差矩阵的应用示例 多元正态分布 :概率密度函数直接依赖协方差矩阵: \[ f(\mathbf{x}) = \frac{1}{\sqrt{(2\pi)^n |\Sigma|}} \exp\left(-\frac{1}{2} (\mathbf{x} - \boldsymbol{\mu})^\top \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu})\right) \] 主成分分析(PCA) :通过特征值分解协方差矩阵,找到数据方差最大的方向,实现降维。 金融风险建模 :资产收益率的协方差矩阵用于量化投资组合的风险。 6. 深入理解:特征值与几何意义 协方差矩阵的特征向量指向数据分布的主要方向,特征值表示对应方向的方差大小。例如: 若某个特征值远大于其他特征值,说明数据在该方向上有显著变化。 协方差矩阵的逆矩阵 \(\Sigma^{-1}\) 在马氏距离中用于衡量数据点与均值的距离,考虑变量间的相关性。 通过以上步骤,你可以逐步掌握协方差矩阵的核心概念、性质及实际应用。