本文最后更新于:2023年10月5日 中午
07: 矩阵函数
1 矩阵序列
1.1 序列和收敛的定义
定义:对于一个矩阵A,我们将其内部的元素用数列aij(k)填进去,那么整个矩阵就是和k相关的,当k取不同值的时候,矩阵也是不同的,矩阵A成为了以k为索引的矩阵序列Ak
Ak=⎣⎢⎢⎡a11(k)⋮an1(k)⋯⋱⋯a1n(k)⋮ann(k)⎦⎥⎥⎤
这一系列矩阵{A1,A2,…,Ak,…}构成矩阵序列,简记为{Ak}
定义:我们知道数列是有极限的,那么推广到矩阵序列上来,如果
k→∞limAk=A
就说{Ak}是收敛于A的,矩阵序列{Ak}收敛的充要条件是他的每一个元素代表的数列都收敛,即∀aij(k), ∃aij, s.t.k→∞limaij(k)=aij。所以,只要有一个元素不收敛,矩阵序列就是发散的
1.2 定理与推论
定理:矩阵序列Ak收敛,那么矩阵序列就有界。注意此处有界的定义是∃M>0,s.t.,∀k, ∣∣Ak∣∣≤M。也就是使用矩阵范数进行衡量。
性质:矩阵序列以下的性质是成立的
- k→∞lim(αAk+βBk)=αA+βB,前提是Ak, Bk极限存在
- k→∞limAkBk=AB,前提是Ak, Bk极限存在
- 设Ak收敛于A,且Ak∈Cn×n, P∈Cq×n, Q∈Cn×p,有k→∞limPAkQ=PAQ
- 设Ak收敛于A,且Ak, A可逆,注意此处是∀k, Ak都可逆,那么矩阵序列{Ak−1}也收敛,且k→∞limAk−1=A−1
定理:对于数字阵A∈Cn×n,它的幂Ak的极限
k→∞limAk=0n×n
的充要条件是ρ(A)<1,即谱半径小于1。由于谱半径是小于任意矩阵范数的,所以如果能找到一个矩阵范数,使得∣∣A∣∣<1,那么上述极限也成立。
2 矩阵级数
2.1 定义
定义:设{Ak}∈Cn×n是一个矩阵序列,它的无穷和
k=1∑∞Ak
为矩阵级数。
那么矩阵级数的前k项部分和,就可以定义为
Sk=i=1∑kAi
顺势可以给出矩阵级数的收敛条件,是
k→∞limSk=S
定义:如果某个矩阵范数∣∣⋅∣∣,使得
k=1∑∞∣∣Ak∣∣=∣∣A1∣∣+∣∣A2∣∣+⋯+∣∣An∣∣+⋯
收敛,那么称k=1∑∞Ak绝对收敛。由于在矩阵范数章节中,我们证明了复数域或实数域中任意范数都是等价的,所以这里的矩阵范数是任意的。
2.2 推论与定理
定理:矩阵级数k=1∑∞Ak收敛的充要条件是
k=1∑∞aij(k)
收敛,就是说矩阵中每一个元素都收敛。
定理:矩阵级数k=1∑∞Ak绝对收敛的充要条件是,∀i,j,正项级数k=1∑∞∣aij(k)∣收敛。即矩阵级数绝对收敛就是每个元素都绝对收敛。
3 矩阵幂级数
3.1 定义
定义:给出一个数量矩阵A∈Cn×n,那么
k=0∑∞ckAk
的矩阵级数是方阵A的幂级数
定义:矩阵幂级数也有类似收敛半径的概念,在收敛半径中矩阵级数收敛。
定义;如果矩阵级数收敛,其无穷和为矩阵S,那么称S为矩阵级数的和,记为S=k=0∑∞Ak
3.2 定理与推论
定理:设矩阵级数的收敛半径R,那么当ρ(A)<R(谱半径小于收敛半径), 矩阵幂级数绝对收敛,若ρ(A)>R,则矩阵级数发散。
定理:若矩阵A的某一个范数∣∣A∣∣在幂级数
k=0∑∞ckxk
的收敛域内,那么
k=0∑∞ckAk
绝对收敛。这告诉我们可以用普通幂级数的收敛半径来判断矩阵幂级数,同时可以用范数来进行比较。因为ρ(A)是小于任意矩阵范数的,所以当矩阵范数落在收敛半径内,ρ(A)一定会落在收敛半径内。
常用矩阵级数
- 矩阵指数函数eA,
eA=k=0∑∞k!Ak
- 矩阵正弦函数sinA
sinA=k=0∑∞(−1)k(2k+1)!A2k+1
- 矩阵余弦函数cosA
cosA=k=0∑∞(−1)k(2k)!A2k
- 矩阵逆(E−A)−1
(E−A)−1=k=0∑∞Ak(ρ(A)<1)
- 矩阵对数函数ln(E+A)
ln(E+A)=k=0∑∞k+1(−1)kAk+1(ρ(A)<1)
定理:矩阵幂级数k=0∑∞Ak(即ck=1),那么它绝对收敛的充要条件是ρ(A)<1,其和为
(En−A)−1
4 矩阵多项式
4.1 矩阵的化零多项式
定义:给出多项式
P(x)=n=0∑nanxn
那么
P(A)=n=0∑nanAn
是相应于P(x)的关于方阵A的矩阵多项式,其中A0=En,P(x)的次数也是P(A)的次数,记为degP(A)=n
一些性质
- f(A)g(A)=g(A)f(A)=(fg)(A), where fg=f(x)g(x)
- f(A)+g(A)=g(A)+f(A)=(f+g)(A), where f+g=f(x)+g(x)
- 设f(x)为多项式,那么对∀T∈Cnn×n, f(TAT−1)=Tf(A)T−1
- 给定分块对角阵A=diag{A1,A2,…,As},则f(A)=diag{f(A1),f(A2),…,f(As)}
- 给定矩阵A的特征值λ,特征向量α,那么有Aα=λα,且f(A)α=f(λ)α
定义:给出矩阵A∈Cn×n,如果多项式P(x)满足P(A)=0,那么P(x)就是矩阵A的化零多项式。
如果f(A)=0,那么可构造新的多项式F(x)=f(x)g(x),其中g(x)任意,那么f(A)f(A)=0,这使得我们可以构造任意新的多项式,仍然满足F(A)=0,所以化零多项式不唯一
定理:任意方阵都有化零多项式
定理:Cayley-Hamilton,给出A∈Cn×n,且ϕ(λ)=det(λE−A)=k=0∑nakλk是特征多项式。那么ϕ(A)=0。即矩阵的特征多项式是矩阵的化零多项式。
4.2 矩阵的最小多项式
定义:给出A∈Cn×n,在A的所有化零多项式中(因为不唯一),次数最低的首一(最高次项系数为1)多项式为A的最小多项式,写成m(x)
定理:A的任意化零多项式P(x)和m(x)满足m(x)∣P(x)
定理:最小多项式是唯一的
定理:对于分块的对角矩阵A=diag{A1,A2,…,As},A的最小多项式mA(x)是对角线上分块矩阵的最小多项式mAi(x)的最小公倍式
定理:m阶Jordan块Jm(a),其中a是对角线上元素,则其最小多项式是(λ−a)m
定理:对于A∈Crn×n,A的最小多项式m(x)是A的smith标准型中的对角线上最后一个不变因子。
推论:相似矩阵具有相同的最小多项式。
推论:矩阵能够相似对角化的充要条件是其最小多项式没有重根。m(x)=0无重根。
推论:最小多项式和特征值有关系,设A有s个不同的特征值λ1,…,λs,每个特征值对应的几何重复度为ai,i∈[1,s],每个特征值对应的初等因子的幂次分别为nik,其中k∈[1,ai],记di=maxnik,则最小多项式是
m(x)=(x−λ1)d1(x−λ2)d2⋯(x−λs)ds
5 矩阵函数
5.1 定义
定义:对于幂级数
f(z)=k=0∑∞akzk
其收敛半径为r,则∣z∣<r时幂级数收敛于f(z)。现在代入矩阵A∈Cn×n,满足ρ(A)<r,那么矩阵函数就由矩阵幂级数定义
f(A)=k=0∑∞akAk
5.2 定理与推论
定理:对于矩阵函数f(A),A∈Cn×n,有以下性质
- f(A)和A可交换,f(A)A=Af(A)
- 函数和差的矩阵函数等于矩阵函数的和差,即(f±g)(A)=f(A)±g(A)
- 函数积的矩阵函数等于矩阵函数的积,(f⋅g)(A)=f(A)g(A)
- 若B=T−1AT,则f(B)=T−1f(A)T
定理:矩阵指数函数和三角函数除了普通指数函数和三角函数的性质外,有以下不同
- 当AB=BA时,才有eAeB=eBeA=eA+B
- ∣eA∣=etr(A)
- 当AB=BA时,才有cos(A+B)=cosAcosB−sinAsinB
- 当AB=BA时,才有sin(A+B)=sinAcosB+cosAsinB
6 矩阵函数计算
6.1 定义
引理:设A∈Cn×n,其不同的特征值为λ1,…,λr,m(λ)为A的最小多项式,且有
m(λ)=(λ−λ1)d1⋯(λ−λr)dr
记m=i=1∑rdi。对于函数f(x),如果对于所有λi,f(x)的导数f(λi),f′(λi),…,fdi−1(λi)这m阶都存在,则称函数f(x)在矩阵A的谱上有定义。