线性变换
线性变换是连接两个向量空间的结构保持映射。为了理解它,我们首先需要明确它作用的对象和环境。
第一步:从向量空间与映射谈起
-
基础环境:向量空间
回忆一下,一个向量空间是一个集合,其中的元素(称为向量)可以进行加法和数乘(用标量,如实数或复数,去乘向量)运算,并且这些运算满足一系列公理(如结合律、分配律等)。例如,所有二维平面上的箭头构成的集合,或者所有次数不超过n的多项式构成的集合,都是向量空间。 -
基础概念:映射
映射(或函数)是两个集合之间的一种对应关系。对于集合A中的每一个元素,通过映射f,在集合B中都有唯一一个元素与之对应,记作 f: A -> B。
第二步:什么是线性变换?
线性变换是一种特殊的映射,它发生在两个向量空间之间(可以是同一个向量空间),并且“保持”了向量空间的核心结构——即加法和数乘运算。
更精确地说,设V和W是同一个数域F上的两个向量空间。一个映射 T: V -> W 被称为线性变换,如果它满足以下两个条件:
对于V中任意两个向量 u 和 v,以及F中任意一个标量c,都有:
- 保持向量加法:T(u + v) = T(u) + T(v)
- 保持标量乘法:T(c * u) = c * T(u)
简单来说,这意味着“先运算后映射”与“先映射后运算”得到的结果是一样的。线性变换不会扭曲空间的基本线性结构。
第三步:具体例子
让我们看几个例子来加深理解:
- 零变换:定义 T(v) = 0(W中的零向量),对于所有v属于V。这显然满足线性条件。
- 恒等变换:定义 T(v) = v,对于所有v属于V。这是一个从V到自身的线性变换,它什么都不改变。
- 旋转:在二维平面(向量空间R²)上,将所有向量绕原点逆时针旋转一个固定角度θ的操作,是一个线性变换。你可以验证,两个向量和的旋转等于它们各自旋转后的和;一个向量乘以常数后再旋转,等于先旋转再乘以常数。
- 缩放:定义 T(x, y) = (ax, by),其中a和b是固定常数。这个变换将x坐标拉伸a倍,y坐标拉伸b倍。
- 微分运算:考虑所有可微函数构成的向量空间,求导操作 D(f) = f‘ 是一个线性变换。因为 (f+g)’ = f‘ + g’,且 (cf)’ = cf‘。
- 矩阵乘法:对于一个固定的m×n矩阵A,定义从Rⁿ到Rᵐ的变换 T(x) = Ax。这是线性变换最核心、最普遍的例子。事实上,在有限维情况下,每一个线性变换都可以用矩阵来表示。
第四步:线性变换的核心性质
线性变换有两个非常重要的子空间:
-
核:也称为零空间。它是V中所有被T映射成W中零向量的向量构成的集合,即 Ker(T) = { v ∈ V | T(v) = 0 }。
- 几何意义:核衡量了变换的“不可逆”程度。核中的向量在变换后“消失”了。核越大,说明被“压扁”到零向量的向量越多,信息损失越大。如果核只包含零向量,则称变换是单射(或一对一的)。
-
像:也称为值域。它是W中所有能被T映射到的向量构成的集合,即 Im(T) = { T(v) ∈ W | v ∈ V }。
- 几何意义:像描述了变换所能“覆盖”的W中的范围。像空间越大,变换的“作用范围”越广。如果像等于整个W,则称变换是满射(或到上的)。
第五步:秩-零化度定理
这是一个将线性变换、其定义域、核和像的维数联系在一起的优美定理。
- 零化度:核的维数,记作 nullity(T)。
- 秩:像的维数,记作 rank(T)。
秩-零化度定理指出:如果V是有限维的,那么有:
dim(V) = rank(T) + nullity(T)
这个定理有深刻的几何解释:定义域V的“总维度”,等于被变换“压扁”掉的维度(零化度),加上变换后剩下的有效维度(秩)。这一定理是理解线性方程组解的结构、矩阵理论等问题的关键。