一类线性变换的若干等价刻画
Some Equivalent Characterizations of a Class of Linear Transformations
摘要: 众所周知,有限维线性空间上的线性变换的最小多项式是其特征多项式的因式。本文给出最小多项式恰好等于特征多项式的线性变换的若干等价刻画。
Abstract: It is well known that the minimum polynomial of a linear transformation of a finite dimensional linear space is a factor of its characteristic polynomial. This article provides several equivalent characterizations of linear transformations whose minimum polynomial happens to equal to the characteristic polynomial.
文章引用:常学武, 郭巧萍, 黄谦. 一类线性变换的若干等价刻画[J]. 理论数学, 2024, 14(5): 194-199. https://doi.org/10.12677/pm.2024.145176

1. 引言

线性变换是线性代数的一个主要研究对象,在线性空间中具有非常广泛的应用,是数学、物理、工程、计算机科学等众多领域研究中不可或缺的工具。它可以用来描述线性空间的性质和结构,也可以揭示线性空间之间的联系,线性空间中的旋转、反射等线性变换可以用来描述很多物理和几何问题。另外,线性变换可以表示为矩阵,使抽象的问题具体化。本文给出一类线性变换的若干等价刻画。为了方便主要定理的证明,我们列举一些本文用到的主要概念和结论,而省去这些结论的证明。文中使用 [1] 中的术语和符号。

定义1.1. 设A是数域P上的一个n阶矩阵,是一个文字。称矩阵 λ E A 的行列式 | λ E A | 为A的特征多项式。

如果多项式 f ( x ) 使 f ( A ) = 0 ,则称 f ( x ) 以A为根。根据Hamilton-Cayley定理,n阶矩阵A的特征多项式以A为根。

定义1.2. 次数最低的首项系数为1的以A为根的多项式称为A的最小多项式。

熟知矩阵A的最小多项式不因为数域的扩大而改变。利用矩阵的最小多项式可以给出矩阵相似于对角矩阵的一个充要条件,即矩阵A可相似于对角阵当且仅当其最小多项式可以分解成互素的一次因式的乘积。由带余除法易知A的最小多项式是特征多项式的因式。本文主要研究最小多项式恰好等于特征多项式的若干等价条件。这些等价条件回答了历年考研题和竞赛题中的若干相关问题,例如2023年全国大学生数学竞赛A卷的第三题。

称A的特征多项式的根为A的特征值。设 λ 是A的一个特征值,如果存在非零列向量 X 0 ,使 A X 0 = λ X 0 ,称 X 0 是A的属于特征值 λ 的一个特征向量, X 0 即为齐次线性方程组 ( λ E A ) X = 0 的一个非零解。如果A的特征多项式 f ( λ ) = | λ E A | 能够分解成一些一次因式的乘积

f ( λ ) = ( λ λ 1 ) r 1 ( λ λ 2 ) r 2 ( λ λ s ) r s ,

其中 λ 1 , λ 2 , , λ s 互不相同, r 1 , r 2 , , r s 为正整数。称 r i 为特征值 λ i 的代数重数。齐次线性方程组 ( λ i E A ) X = 0 的基础解系所含解向量的个数称为特征值 λ i 的几何重数。

定理1.1. [2] 方阵A的任一特征值的几何重数不超过代数重数。

设P是一个数域, λ 是一个文字,一个矩阵,如果它的元素是数域P上的关于 λ 的多项式,就称为 λ - 矩阵。如果 λ -矩阵 A ( λ ) 中有一个 r ( r 1 ) 阶子式不为零,而所有 r + 1 阶子式(如果有的话)全为零,则称 A ( λ ) 的秩为r,零矩阵的秩规定为0。

定理1.2. [1] 任一非零的 λ -矩阵 A ( λ ) 等价于对角矩阵

d i a g ( d 1 ( λ ) , d 2 ( λ ) , , d r ( λ ) , 0 , , 0 ) ,

其中 r 1 A ( λ ) 的秩, d i ( λ ) ( i = 1 , 2 , , r ) 是首项系数为1的多项式,且 d i ( λ ) | d i + 1 ( λ )

定理1.2中的对角矩阵称为矩阵 A ( λ ) 的标准形,且标准形是唯一的。标准形对角线上的非零元 d 1 ( λ ) , d 2 ( λ ) , , d r ( λ ) 称为 A ( λ ) 的不变因子。

λ -矩阵 A ( λ ) 的秩为r,对于正整数 k ( 1 k r ) A ( λ ) 中必有非零的k阶子式, A ( λ ) 中全部k阶子式的首项系数为1的最大公因式 D k ( λ ) 称为 A ( λ ) 的k阶行列式因子。

不变因子和k阶行列式因子相互唯一决定,二者有如下关系:

D k ( λ ) = d 1 ( λ ) d 2 ( λ ) d k ( λ ) , k = 1 , 2 , , r .

d 1 ( λ ) = D 1 ( λ ) , d 2 ( λ ) = D 2 ( λ ) D 1 ( λ ) , , d r ( λ ) = D r ( λ ) D r 1 ( λ ) .

设A是数域P上的一个n阶矩阵,则 λ E A 是一个 λ -矩阵且 | λ E A | 是一个n次多项式,所以 λ E A 的秩为n, λ E A 的标准形为 d i a g ( d 1 ( λ ) , d 2 ( λ ) , , d n ( λ ) ) 。称 λ E A 的不变因子 d 1 ( λ ) , d 2 ( λ ) , , d n ( λ ) 为矩阵A的不变因子。

把矩阵A的每个次数大于零的不变因子分解成互不相同的首项系数为1的一次因式方幂的乘积,所有这些互不相同一次因式的方幂(相同的按出现的次数计算)称为A的初等因子。易知A的不变因子和初等因子相互唯一决定。

定理1.3. [1] 设 ( λ λ 1 ) k 1 , ( λ λ 2 ) k 2 , , ( λ λ s ) k s 为A的全部初等因子,则A相似于一个Jordan形矩阵 J = d i a g ( J 1 , J 2 , , J s ) ,其中

J i = ( λ i 1 λ i 1 λ i ) k i × k i

为Jordan块。这个Jordan形矩阵除Jordan块的排列次序外是被A唯一决定的,称为A的Jordan标准形。

定义1.3. 设矩阵A的初等因子 ( λ λ 1 ) k 1 , ( λ λ 2 ) k 2 , , ( λ λ s ) k s ,其中 λ 1 , λ 2 , , λ s 都是A的特征值( λ 1 , λ 2 , , λ s 未必两两不同),称 ( λ λ i ) k i 为特征值 λ i 对应的初等因子。易知A的每个初等因子 ( λ λ i ) k i 和一个Jordan块 J i 相互唯一确定,称 J i 为A的特征值 λ i 对应的Jordan块。

对数域P上的一个多项式 d ( λ ) = λ n + a 1 λ n 1 + + a n ,称Frobenius矩阵

( 0 0 0 a n 1 0 0 a n 1 0 1 0 a n 2 0 0 1 a 1 )

为多项式 d ( λ ) 的友矩阵。

定理1.4. [1] 设A的不变因子为 1 , , 1 , d 1 ( λ ) , , d s ( λ ) ,其中 d 1 ( λ ) , , d s ( λ ) 的次数 1 。则A相似于一个有理标准形矩阵 B = d i a g ( B 1 , B 2 , , B s ) ,其中 B i d i ( λ ) 的友矩阵。B由A的不变因子唯一决定,称为A的有理标准形。

线性空间V的一个线性变换 A 在任一组基下的矩阵是相似的,而相似矩阵具有相同的特征多项式、最小多项式、各阶行列式因子、不变因子、初等因子、Jordan标准形和有理标准形,所以线性变换 A 在一组基下的矩阵的特征多项式、最小多项式、各阶行列式因子、不变因子、初等因子、Jordan标准形和有理标准形也分别称为线性变换 A 的特征多项式、最小多项式、各阶行列式因子、不变因子、初等因子、Jordan标准形和有理标准形。

熟知A的特征多项式为 f ( λ ) = | λ E A | = d 1 ( λ ) d 2 ( λ ) d n ( λ ) ,而A的最小多项式为 m ( λ ) = d n ( λ ) 。因此,最小多项式是特征多项式的因式。满足最小多项式恰好等于特征多项式的矩阵具有特殊的性质和应用价值,本文从矩阵的初等因子、不变因子、Jordan标准形和有理标准形等方面给出了这类矩阵的若干等价刻画。

2. 主定理

定理2.1. 设V是n维复线性空间, A 是V上的一个线性变换,则下述九条等价。

(1) 存在 α V 使得 α , A α , , A n 1 α 构成V的一组基。

(2) A 在V的某组基下的矩阵是一个Frobenius矩阵。

(3) A 的不变因子为 1 , , 1 , d n ( λ ) ,其中 d n ( λ ) 为一个首一的n次多项式。

(4) A 的最小多项式等于特征多项式。

(5) A 的初等因子两两互素。

(6) A 的每个特征值对应的初等因子只有一个。

(7) A 的每个特征值对应的Jordan块只有一个。

(8) A 的每个特征值的几何重数均为1。

(9) 与 A 可交换的线性变换都是 A 的多项式。

为了完成证明,我们需要如下引理。

引理2.2. [3] (Sylvester方程)。设A,B分别为数域P上的m阶和n阶矩阵。则矩阵方程 A X = X B 只有零解当且仅当A,B没有公共的特征值。

证明. 因为矩阵方程 A X = X B 相当于一个具有mn个方程,mn个未知量的齐次线性方程组,而齐次方程组有无非零解不依赖于数域的扩大,因此不妨在复数域上考虑问题。

首先假设 A X = X B 只有零解。如果A和B有一个公共特征值 λ ,则 λ 也是 B T 的特征值,因此存在非零m维列向量x和n维列向量y满足 A x = λ x B T y = λ y 。令 X = x y T ,则

A X = A x y T = λ x y T = x ( λ y T ) = x ( y T B ) = X B ,

但是显然 X 0 ,矛盾。所以A,B没有公共特征向量。

反之,假设A,B没有公共特征值,则A和B的特征多项式 f ( λ ) g ( λ ) 互素,因此存在多项式 u ( λ ) v ( λ ) 使得 u ( λ ) f ( λ ) + v ( λ ) g ( λ ) = 1 。由Hamilton-Cayley定理知 g ( B ) = 0 ,所以 u ( B ) f ( B ) = E ,即 f ( B ) 可逆。如果 A X = X B ,则易知 f ( A ) X = X f ( B ) ,但由Hamilton-Cayley定理可得 f ( A ) = 0 ,因此

0 = f ( A ) X = X f ( B ) ,

因为 f ( B ) 可逆,所以 X = 0 ,即矩阵方程 A X = X B 只有零解。 £

定理2.1的证明. 先证明(1)和(2)等价。如果 α , A α , A n 1 α 是V的一组基,则

A ( α , A α , , A n 1 α ) = ( A α , A 2 α , , A n α ) = ( α , A α , , A n 1 α ) ( 0 0 0 1 0 0 0 1 0 0 0 1 ) ,

A 在基 α , A α , , A n 1 α 下的矩阵是Frobenius矩阵。反之,假设 A 在基 ε 1 , ε 2 , , ε n 下的矩阵为Frobenius矩阵,令 α = ε 1 ,则

ε 2 = A α , ε 3 = A 2 α , , ε n = A n 1 α

α , A α , , A n 1 α 是V的一组基。

再证(2)和(3)等价。假设 A 在某组基下的矩阵是Frobenius矩阵

A = ( 0 0 0 a n 1 0 0 a n 1 0 1 0 a n 2 0 0 1 a 1 ) ,

λ E A 的n阶行列式因子 D n ( λ ) = | λ E A | = λ n + a 1 λ n 1 + + a n 1 λ + a n ,而 λ E A 中有一个 n 1 阶子式

| 1 λ 0 0 0 1 λ 0 0 0 0 λ 0 0 0 1 | = ( 1 ) n 1 ,

所以 D n ( λ ) = 1 ,从而 D 1 ( λ ) = = D n 2 ( λ ) = 1 ,因此 d 1 ( λ ) = = d n 1 ( λ ) = 1 ,而 d n ( λ ) = D n ( λ ) = λ n + a 1 λ n 1 + + a n 1 λ + a n

反之,假设 A 的不变因子为 1 , , 1 , d n ( λ ) = λ n + a 1 λ n 1 + + a n 1 λ + a n ,则 d n ( λ ) 的友矩阵

( 0 0 0 a n 1 0 0 a n 1 0 1 0 a n 2 0 0 1 a 1 )

一定是 A 在V的某组基下的矩阵。

因为 A 的最小多项式是它的最后一个不变因子,而特征多项式等于所有不变因子之积,所以(3)和(4)是等价的,(3)和(5)等价从不变因子与初等因子的换算关系可得。由定义1.3可知 (5),(6),(7)等价。

接下来证明(7)和(8)等价。令J为 A 的Jordan标准形。假设 A 的属于特征值 λ 0 的Jordan块只有一个,则 λ 0 E J 的秩为 n 1 ,因此 λ 0 的几何重数等于 n r ( λ 0 E J ) = 1 。反之,假设特征值 λ 0 的几何重数为1,则矩阵 λ 0 E J 的秩为 n 1 ,这表明属于特征值 λ 0 的Jordan块只有一个。

至此可得(1)~(8)等价。最后证明(2)和(9)等价。设 A 在基 ε 1 , ε 2 , , ε n 下的矩阵是Frobenius矩阵 F ,假设 B A 可交换,令 B B 在基 ε 1 , ε 2 , , ε n 下的矩阵,则 F B = B F ,因此 F i B = B F i , i = 1 , 2 , , n 1 。设 e 1 , e 2 , , e n 为n维标准单位向量。注意到

e i = F e i 1 = F 2 e i 2 = = F i 1 e 1 , i = 2 , 3 , , n .

B e 1 = i = 1 n b i e i ,则

B = B E = B ( e 1 , e 2 , , e n ) = B ( e 1 , F e 1 , , F n 1 e 1 ) = ( B e 1 , B F e 1 , , B F n 1 e 1 ) = ( B e 1 , F B e 1 , , F n 1 B e 1 ) = ( i = 1 n b i e i , F i = 1 n b i e i , , F n 1 i = 1 n b i e i )

i = 1 n b i ( e i , F e i , , F n 1 e i ) = i = 1 n b i ( F i 1 e 1 , F F i 1 e 1 , , F n 1 F i 1 e 1 ) = i = 1 n b i F i 1 ( e 1 , F e 1 , , F n 1 e 1 ) = i = 1 n b i F i 1 E = i = 1 n b i F i 1 ,

即B是F的多项式,因此 B A 的多项式。

反之,假设 A 的有理标准形为 A = d i a g ( A 1 , A 2 , , A s ) ,其中 A i 为不变因子 d i ( λ ) 的友矩阵, i = 1 , 2 , , s 。只需证 s = 1 。假设 s > 1 。由不变因子的定义, d s 1 ( λ ) d s ( λ ) 有公共根,即 A s 1 A s 有相同特征值,由引理2.2,存在非零矩阵X,使得 A s 1 X = X A s ,令

B = ( 0 0 0 X 0 ) ,

A B = B A ,但显然B不能写成A的多项式。矛盾表明 A 在某组基下的矩阵是一个Frobenius矩阵。

£

注记2.3. 上述定理中的(1)~(4)和(9)的等价在一般数域上仍然成立。

3. 结语

本文研究和总结了满足最小多项式等于其特征多项式的线性变换,给出了若干等价刻画,其中(1)和(8)的等价解答了2023年全国大学生数学竞赛(数学类)A卷的第三题。这些等价刻画从不同角度,将一些不同的知识点联系起来,不仅帮助学生理解所学知识的本质,而且也拓宽了学生的知识面。对激发学生的求知欲,诱发学生的创造力有一定的积极作用。在后续研究中,有两个方面的相关问题值得继续探讨,一是继续寻找本文所研究问题的等价刻画;二是当最小多项式是特征多项式的真因子时,是否有好的描述和刻画以及好的应用。

基金项目

山西省高等学校教学改革创新项目(J20230018)。

参考文献

[1] 王萼芳, 石生明. 高等代数[M]. 第5版. 北京: 高等教育出版社, 2019.
[2] 屠伯埙. 线性代数-方法导引[M]. 上海: 复旦大学出版社, 1986.
[3] 王利广, 李本星. 高等代数中的典型问题与方法——考研题解精粹[M]. 北京: 机械工业出版社, 2022.