协方差矩阵
协方差矩阵是描述多个随机变量之间协方差关系的方阵。让我们从基础概念开始,逐步深入。
1. 协方差的回顾
- 定义:对于两个随机变量 \(X\) 和 \(Y\),协方差衡量它们的线性相关性:
\[ \text{Cov}(X, Y) = \mathbb{E}[(X - \mathbb{E}[X])(Y - \mathbb{E}[Y])] \]
- 性质:
- 若 \(\text{Cov}(X, Y) > 0\),\(X\) 和 \(Y\) 倾向于同向变化;
- 若 \(\text{Cov}(X, Y) < 0\),则反向变化;
- 若 \(\text{Cov}(X, Y) = 0\),称 \(X\) 和 \(Y\) 不相关(但未必独立)。
2. 从协方差到协方差矩阵
假设有 \(n\) 个随机变量 \(X_1, X_2, \dots, X_n\),协方差矩阵 \(\Sigma\) 是一个 \(n \times n\) 矩阵,其中第 \((i, j)\) 元素为:
\[\Sigma_{ij} = \text{Cov}(X_i, X_j) \]
矩阵形式:若定义随机向量 \(\mathbf{X} = [X_1, X_2, \dots, X_n]^\top\),则:
\[\Sigma = \mathbb{E}[(\mathbf{X} - \boldsymbol{\mu})(\mathbf{X} - \boldsymbol{\mu})^\top] \]
其中 \(\boldsymbol{\mu} = \mathbb{E}[\mathbf{X}]\) 是均值向量。
3. 协方差矩阵的性质
- 对称性:\(\Sigma = \Sigma^\top\),因为 \(\text{Cov}(X_i, X_j) = \text{Cov}(X_j, X_i)\)。
- 半正定性:对任意非零向量 \(\mathbf{a} \in \mathbb{R}^n\),有 \(\mathbf{a}^\top \Sigma \mathbf{a} \geq 0\)。
- 理由:\(\mathbf{a}^\top \Sigma \mathbf{a} = \text{Var}(\mathbf{a}^\top \mathbf{X}) \geq 0\)(方差非负)。
- 对角线元素:\(\Sigma_{ii} = \text{Var}(X_i)\),即第 \(i\) 个变量的方差。
4. 协方差矩阵的估计
在实际中,我们通常用样本数据估计协方差矩阵。假设有 \(m\) 个观测样本 \(\mathbf{x}_1, \dots, \mathbf{x}_m\)(每个样本是 \(n\) 维向量),样本协方差矩阵 \(S\) 的计算公式为:
\[S = \frac{1}{m-1} \sum_{k=1}^m (\mathbf{x}_k - \bar{\mathbf{x}})(\mathbf{x}_k - \bar{\mathbf{x}})^\top \]
其中 \(\bar{\mathbf{x}}\) 是样本均值向量,分母 \(m-1\) 确保无偏性(对比单变量样本方差)。
5. 协方差矩阵的应用示例
- 多元正态分布:概率密度函数直接依赖协方差矩阵:
\[ f(\mathbf{x}) = \frac{1}{\sqrt{(2\pi)^n |\Sigma|}} \exp\left(-\frac{1}{2} (\mathbf{x} - \boldsymbol{\mu})^\top \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu})\right) \]
- 主成分分析(PCA):通过特征值分解协方差矩阵,找到数据方差最大的方向,实现降维。
- 金融风险建模:资产收益率的协方差矩阵用于量化投资组合的风险。
6. 深入理解:特征值与几何意义
协方差矩阵的特征向量指向数据分布的主要方向,特征值表示对应方向的方差大小。例如:
- 若某个特征值远大于其他特征值,说明数据在该方向上有显著变化。
- 协方差矩阵的逆矩阵 \(\Sigma^{-1}\) 在马氏距离中用于衡量数据点与均值的距离,考虑变量间的相关性。
通过以上步骤,你可以逐步掌握协方差矩阵的核心概念、性质及实际应用。