概率论与统计中的随机变量的变换的随机矩阵理论
我将从随机矩阵的基本定义开始,逐步展开这一理论的核心内容。
-
随机矩阵的定义
随机矩阵是一个矩阵,其元素为随机变量。形式上,设 \(A\) 是一个 \(n \times m\) 矩阵,其中每个元素 \(A_{ij}\) 是一个定义在概率空间 \((\Omega, \mathcal{F}, P)\) 上的随机变量。例如,若所有元素独立同分布于标准正态分布,则 \(A\) 称为高斯随机矩阵。随机矩阵理论主要研究其谱性质(特征值分布)、范数行为等。 -
随机矩阵的常见类型
- Wigner 矩阵:对称矩阵(\(A = A^T\)),对角元与非对角元独立,且非对角元服从相同分布,对角元可能服从另一分布。
- 样本协方差矩阵:若 \(X\) 是 \(n \times p\) 随机矩阵(行表示独立观测),则 \(S = \frac{1}{n} X^T X\) 为样本协方差矩阵。
- 高斯酉系综(GUE):埃尔米特矩阵,对角元为实高斯,非对角元为复高斯,满足特定方差条件。
-
经验谱分布与半圆律
设 \(A\) 是 \(n \times n\) 随机矩阵,其特征值为 \(\lambda_1, \lambda_2, \dots, \lambda_n\)。经验谱分布定义为:
\[ F_A(x) = \frac{1}{n} \#\{ i : \lambda_i \leq x \} \]
Wigner 矩阵在 \(n \to \infty\) 时,\(F_A(x)\) 几乎必然收敛于半圆律:
\[ \rho_{sc}(x) = \frac{1}{2\pi} \sqrt{4 - x^2} \cdot \mathbf{1}_{|x| \leq 2} \]
这描述了特征值在区间 \([-2, 2]\) 内的分布密度。
- Marchenko-Pastur 律
对于样本协方差矩阵 \(S = \frac{1}{n} X^T X\)(\(X\) 的元独立同分布,均值为0,方差为1),当 \(n, p \to \infty\) 且 \(p/n \to c \in (0, \infty)\),经验谱分布收敛于:
\[ \rho_{mp}(x) = \frac{1}{2\pi c x} \sqrt{(b-x)(x-a)} \cdot \mathbf{1}_{a \leq x \leq b} + \max(0, 1-c^{-1}) \delta(x) \]
其中 \(a = (1-\sqrt{c})^2\), \(b = (1+\sqrt{c})^2\)。这解释了高维数据中协方差矩阵的特征值分布。
- 随机矩阵的变换方法
随机矩阵理论中的变换常用于分析特征值统计量:- 矩方法:通过计算矩阵矩 \(\frac{1}{n} \mathbb{E}[\operatorname{Tr}(A^k)]\) 推导极限分布。
- Stieltjes 变换:对经验谱分布 \(F_A\),其 Stieltjes 变换定义为:
\[ s_A(z) = \int \frac{1}{x-z} dF_A(x), \quad z \in \mathbb{C}^+ \]
该变换可简化谱分布的渐近分析。
- 自由概率理论:将随机矩阵视为非交换随机变量,利用自由卷积描述独立大随机矩阵的和与积的谱分布。
- 应用与扩展
- 主成分分析(PCA):在高维统计中,随机矩阵理论用于判断样本协方差矩阵的最大特征值是否偏离总体假设。
- 无线通信:多天线系统的信道容量建模依赖于随机矩阵的奇异值分布。
- 随机矩阵的泛函:研究 \(\operatorname{Tr}(f(A))\) 的波动,其中 \(f\) 是光滑函数,导致中心极限定理形式的结果。
通过以上步骤,我们完成了从随机矩阵的基本定义到其谱分布理论及变换方法的系统介绍。这一理论为高维统计和复杂系统建模提供了数学基础。