1 −3 4 4 −7 8 6 −7 7
例题 3.2.20 : 设 a 是任一给定的复数, 对于 l 级 Jordan 块 Jl(a), 求 eJl(a) 的特征值.
例题 3.2.21 : 设 A 是 n 级复矩阵, 其全部特征值是 λ1, λ2,· · · , λn◦ 证明 : eA的全部特征是 eλ1, eλ2,· · · , eλn 例题 3.2.22 : 设 A 是 n 级复矩阵, 求 eA 的行列式.
§3.3 多项式矩阵的相抵
这节的内容主要是判断两个矩阵在任何域上是否相似, 如果是复数域, 若当标准型不好算时判断的速度将 不如这节的快 (事实上, 这样也是常用的计算 Jordan 标准型的一个快速方法, 这可比按上节的定义愣算来的, 不知道高到哪里去了); 如果考虑实数域上的矩阵, 那么将会有一个很好的性质: 如果两个实矩阵相似, 当且仅 当将它们视为复矩阵时二者相似. 这一性质的证明是平凡的, 只需设出 P = P1+ iP2 后, 考虑 P1+ tP2 中必然 有一个 t, 使得其可逆.
本节的内容核心就是: 两个矩阵是相似的, 当且仅当它们两个的多项式矩阵相抵. 而本节又恰恰给出了多 项式矩阵相抵与否的一系列充要条件.
对 n 阶 λ 方阵 A(λ)∈ (F[λ])n×n,如果存在 n 阶 λ 方阵 B(λ)∈ (F[λ])n×n,使得 A(λ)B(λ) = I(n)= B(λ)A(λ)
其中 I(n)是 n 阶单位方阵, 则 λ 方阵 A(λ) 称为可逆的; 而 B(λ) 称为 A(λ) 的逆方阵, 并记为 A(λ)−1. n阶 λ 方阵 A(λ) 可逆的充分必要条件是, λ 方阵 A(λ) 的行列式是数域F 中非零的数. 证明设 n 阶 λ 方阵 A(λ) 可逆, 则存在 n 阶 λ 方阵 B(λ), 使得 A(λ)B(λ) = I(n)= B(λ)A(λ).两端取行列式, 即得到 det A(λ)· det B(λ) = 1.
其中 det A(λ) 与 det B(λ) 是数域F 上关于 λ 的多项式. 比较两端多项式的系数可知, det A(λ) 与 det B(λ) 是 零次多项式. 因此 det A(λ) 是数域 F 中非零的数. 反之, 设 det A(λ) 是数域 F 中非零的数. 记 det A(λ) = a.λ 方阵 A(λ) 的附属方阵记为 A∗(λ).由于方阵 A∗(λ)中的元素是 λ 方阵 A(λ) 的 n− 1 阶子式, 而 A(λ) 的 n − 1 阶子式是数域F 上关于 λ 的多项式, 因此 A∗(λ)是数域F 上的 n 阶 λ 方阵. 所以 a−1A∗(λ)是数域F 上 n 阶 λ方阵, 并且
A(λ) a−1A∗(λ)
= I(n)= a−1A∗(λ) A(λ)
即 λ 方阵 A(λ) 可逆, 而且 A(λ) = a−1A∗(λ).如果 λ 方阵 A(λ) 可逆, 则 A(λ) 是满秩的. 反之则不然. 这可通 常方阵是不同的.
对 λ 矩阵, 同样有所谓行或列的初等变换. 对调 λ 矩阵 A(λ) 的某两行 ( 或列 ); λ 矩阵 A(λ) 的某一行 (或列) 遍乘数域 F 上某个非零多项式并加到 A(λ) 的某一行 (或列) ; 以及 λ 矩阵 A(λ) 的某一行 ( 或列 ) 遍 乘以数域F 中非零的数, 依次称为对 λ 矩阵 A(λ) 施行行 ( 或列 ) 的第一、第二和第三种初等 λ 变换. 记
Pij = I(n)+ Eij+ Eji− Eii− Ejj
Qij(f (λ)) = I(n)+ f (λ)Eij
Pi(a) = I(n)+ (a− 1)Eii
其中 Eij 是仅在 (i, j) 位置上元素为 1 而其它元素为 0 的 n 阶方阵 ; f (λ) 是数域 F 上关于 λ 的多项式.
Pij, Qij(f (λ))和 Pi(a)依次称为第一、第二和第三种初等 λ 方阵. 分别用第一、第二和第三种初等 λ 方阵左
乘 n× m 阶 λ 矩阵 A(λ), 相当于分别对 λ 矩阵 A(λ) 施行第一、第二和第三种行的初等 λ 变换. 而右乘于 n× m 阶 λ 矩阵 A(λ), 则相当于 A(λ) 的列变换.
设 m× n 阶 λ 矩阵 A(λ) 的秩为 rank A(λ) = r. 则 A(λ) 可以经过有限次行或列的初等 λ 变换化为以下形式:
B(λ) =
D(λ) 0 0 0
其中 D(λ) = diag (d1(λ), d2(λ), . . . , dr(λ)) 是 n 阶对角 λ 方阵, d1(λ), d2(λ), . . . , dk(λ) 是数域F 上首一多项 式, 并且依次一个整除另一个. 这些 d1(λ), d2(λ), . . . , dk(λ) 是不变因子, 它们是相抵不变量, 而且它们一样, 当 且仅当相抵.
设 A(λ)∈ (F[λ])m×n.A(λ)中所有 k 阶非零子式的最大公因子称为 A(λ) 的 k 阶行列式因子, 记为 Dk(λ). 如 果 λ 矩阵 A(λ) 的所有 k 阶子式全为零, 则约定 Dk(λ) = 0. 容易看出, 如果 rank A(λ) = r, 则 Dr+1(λ) =
· · · = Ds(λ) = 0,其中 s = min{m, n}, 而且当 1 ⩽ k ⩽ r 时, D1(λ), . . . , Dr(λ) 都是非零多项式, 同时依次一 个整除一个. m× n 阶 λ 矩阵 A(λ) 与 B(λ) 相抵的充分必要条件是, 它们的行列式因子相同. 简单地说, λ 矩 阵的行列式因子是 λ 矩阵在相抵下的全系不变量. 设 A(λ) 是复数域上 m× n 阶 λ 矩阵, rank A(λ) = r, 且 d1(λ), d2(λ), . . . , dr(λ)是 A(λ) 的不变因子. 由于复系数多项式可以分解为一次因子的乘积, 因此可设
d1(λ) = (λ− λ1)e11(λ− λ2)e12· · · (λ − λt)e1t d2(λ) = (λ− λ1)e21(λ− λ2)e22· · · (λ − λt)e2t
dr(λ) = (λ− λ1)er1(λ− λ2)er2· · · (λ − λt)ert
其中 λ1, λ2, . . . , λt是两两不同地复数, eij 是非负整数 , i = 1, . . . , r, j = 1, . . . , t. 由于 di(λ)整除 di+1(λ), 所以 0⩽ e1j⩽ e2j ⩽ · · · ⩽ erj.当 ejℓ> 0时, 因子 (λ− λj)ejℓ 称为矩阵 A(λ) 的属于 λj 的初等因子, A(λ) 的初等 因子的全体称为 A(λ) 的初等因子组.
接下来讲如何算 Jordan 标准型.
设 n 阶复方阵 A 的特征方阵 λI (n)− A 的初等因子组为
(λ− λ1)m11, (λ− λ1)m12, . . . , (λ− λ1)m1k1 (λ− λ2)m21, (λ− λ2)m22, . . . , (λ− λ2)m2k2
. . . . . . .
(λ− λt)mt1, (λ− λt)mt2, . . . , (λ− λt)mtkt
其中 mj1⩾ mj2⩾ · · · ⩾ mjkj > 0, j = 1, 2, . . . , t;且 λ1, λ2, . . . , λt 是两两不同地复数. 则复方阵 A 相似于如 下的 Jordan 标准形:
J = diag
J(mT
11)(λ1) , . . . , JT
(m1k1)(λ1) , . . . , J(mT
t1)(λt) , . . . , JT
(mtkt)(λt)
其中对任意 ℓ = 1, 2, . . . , kj, j = 1, 2, . . . , t, J(mT
jℓ)(λj) = λjI(mjℓ)+ N(mT
je)
本节总共讲了矩阵相似等价于其多项式矩阵 (即特征方阵) 相抵, 又讲了多项式矩阵的相抵标准型和相抵的判 断方法, 最后介绍了如何通过初等因子组求 Jordan 标准型. 本次内容很接近具体计算与应用, 为此只有一道例 题, 即计算任意给定的佛罗贝尼乌斯矩阵 (即之前提到的“友”矩阵) 的 Jordan 标准型.
第 4 章 欧式空间与二次型
本章的数域 F 总是默认考虑R 或 C.
§4.1 欧式空间与内积
为了使实线性空间更像现实世界的三维空间, 有必要在线性空间中增加几何结构, 首先在实线性空间中定 义向量之间的内积, 引进距离的概念, 从而赋予实线性空间一种几何结构. 这样的空间即是 Euclid 空间.
设实线性空间 V 上二元实函数 (α, β) 满足下面三个性质:
(1)对称性: 对任意的 α, β∈ V, (α, β) = (β, α);
(2)正定性: 对任意 α∈ V, α 6= 0, (α, α) > 0;
(3)双线性: 对任意 α1, α2, β∈ V, λ, µ ∈ R, 有 (λα1+ µα2, β) = λ(α1, β) + µ(α2, β).
则二元实函数 (α, β) 称为实线性空间 V 的一个内积.
对实线性空间 V 而言, 内积 (α, β) 不是唯一的, 只要满足对称性, 恒正性及双线性的二元实函数都是实线 性空间 V 的内积. 实线性空间 V 连同一个取定的内积 (·, ·) 一起 (V, (·, ·)) 称为 Euclid 空间, 或欧式空间.
对欧氏空间 V1, V2, 如果作为线性空间是不同的, 那么作为欧氏空间也是不同的, 即便作为线性空间相同, 但所取定的内积不同, 则这两个欧氏空间也是不同的. 设 U, V 是欧氏空间, 如果存在实线性空间之间的线性同 构 σ : U → V 保持向量的内积不变, 即 (σ(α), σ(β)) = (α, β), ∀α, β ∈ U, 则 σ 称为欧氏空间 U 到 V 的同构 映射, 欧氏空间 U , V 称为是同构的.
例题 4.1.1 考察 Rn. α = (x1, x2,· · · , xn), β = (y1, y2,· · · , yn)∈ Rn. 定义 (α, β) = Xn i=1
xiyi. 证明: (α, β) 是 Rn 的一个内积.
例题 4.1.2 证明: (x, y) := x1y1− x2y1− x1y2+ 4x2y2 定义了 R2 上的一个内积.
例题 4.1.3 考察Rn×n. 定义 (A, B) = tr ABT. 证明: (Rn×n, (·, ·)) 是 Euclid 空间.
尝试利用上题的正定性, 证明下题:
例题 4.1.4 设 A 是 n 阶实方阵, 若 A2AT = AATA, 则 AAT = ATA.
提示 令 C = AAT− ATA, 往证 tr CCT = 0.
给出内积的两条性质: (α, 0) = (0, β) = 0; Cauchy-Schwarz 不等式: ∀α, β ∈ V , (α, β)2⩽ (α, α)(β, β), 其 中等号仅当 α, β 线性相关时成立. 由正定性可以定义向量 α 的长度 |α| =p
(α, α),长度为 1 的称为单位向量.
由 Cauchy 不等式知, 可以定义两个非零向量 α, β 的夹角 hα, βi = arccos(α, β)
|α||β| ∈ [0, π]. 如 �hα, βi = π 2, 即 (α, β) = 0,称向量 α 与 β 正交. 有了长度的概念, 就有三角不等式: ∀α, β ∈ V , |α + β| ⩽ |α| + |β|.
27
例题 4.1.5 设 α1, α2,· · · , αn 是欧氏空间 V 的一组基, α, β∈ V . 求证:
向量组记为 {β1,· · · , βn}. 证明: |βj|2= det G(α1,· · · αj)
det G(α1,· · · , αj−1), j = 1,· · · , n, 其中约定零个向量的 Gram 阵行 列式为 1.
提示 正交化过程的过渡阵是对角元为 1 的上三角方阵.
例题 4.1.11 设 A 是可逆实方阵. 证明: 存在可逆上三角实方阵 T , 使得 A = P T 对某个正交方阵 P 成立.
提示 S = ATA 是正定对称的, 则与单位阵相合, 过渡阵 T 为上三角的, P = AT 为正交阵.
下面给出 n 维欧氏空间 V 中两组标准正交基的关系.
(1)两组标准正交基间的过渡阵 P 为正交方阵, 即 PTP = P PT = In.
(2)若给出一组标准正交基{α1,· · · , αn} 和一个 n 阶正交方阵 P , 则可以得到另一组标准正交基 {β1,· · · , βn}, 其中 (β1,· · · , βn) = (α1,· · · , αn)P .
上面提到的正交方阵是一类重要的方阵, 如果 O 是正交方阵, 那么 O−1= OT 也是正交方阵; 如果 O1, O2
都是正交方阵, 那么乘积 O1O2 也是正交方阵. 如果记所有 n 阶实正交方阵的集合为 On(R), 那么它是一个群.
由上面所述, 我们可以在 n 维欧氏空间所有标准正交基集合与 On(R) 之间建立了一个一一对应. 如果取 Rn 的 内积为标准内积, 那么一个正交阵的行向量和列向量都构成Rn 的一组标准正交基, 反之亦然.
例题 4.1.12 任意一个 n 阶实矩阵 A 都可以表为一个正交方阵和一个对角元非负的上三角方阵 T 的乘积, 即 A = OT . 而且, 当 A 为可逆实方阵时, 这种表法唯一.
提示 存在性: 取 A 的第一列 α1, 并扩充为标准正交基, 然后用归纳法.
唯一性: A = OT = O1T1, 往证 C = O1TO = In. 其中很重要的一个事实是上三角的正交方阵一定是对角 阵, 且对角元为 1 或 −1.
例题 4.1.13 设 α = β + iγ 是正交方阵 O 属于特征值 λ 的特征向量, 其中 β 与 γ 是实向量. 证明: |λ| = 1, 而且当 λ /∈ R 时, 实向量 β 与 γ 正交, 且范数相等.
欧氏空间中向量的正交可以推广到子空间上: 设 U 是欧氏空间 V 的子空间, β ∈ V , 如果 ∀α ∈ U, (α, β) = 0,则称向量 β 和子空间 U 正交. V 中所有与子空间 U 正交的向量集合称为子空间 U 的正交补, 记为 U⊥. 容易验证 U⊥ 是 V 的子空间, 并且 V = U⊕ U⊥. 关于正交补还有几个简单的性质, 大家可以自行验证:
(U⊥)⊥= U , (U + W )⊥= U⊥∩ W⊥, (U∩ W )⊥= U⊥+ W⊥.
在欧氏空间 V 上的实函数如果满足线性性, 称为线性函数. 即: f (λ1a + λ2b) = λ1f (a) + λ2f (b). 欧氏 空间 V 上所有线性函数的集合称为其对偶空间 V∗. 容易验证它是一个实线性空间, 且任意取定向量 b ∈ V, fb(a) = (a, b)就是其中一个线性函数. 利用欧氏空间 V 的内积, 考虑其到 V⋆ 上的线性映射 σ : b→ fb. 事实 上这里 σ 诱导了线性空间的同构. 从而若{ei} 是 V 的一组基, {fei} 就是 V∗的一组基, 称为原基的对偶基.
设 U, V 为欧式空间, 如果存在线性同构 σ : U → V 满足 (σ(x), σ(y))V = (x, y)U,使得∀x, y ∈ U, 则称 σ 为欧式空间 U 与 V 的同构映射, U 与 V 欧式同构.