07:矩阵函数

本文最后更新于:2023年10月5日 中午

07: 矩阵函数

1 矩阵序列

1.1 序列和收敛的定义

定义:对于一个矩阵A,我们将其内部的元素用数列aij(k)a_{ij}(k)填进去,那么整个矩阵就是和k相关的,当k取不同值的时候,矩阵也是不同的,矩阵A成为了以k为索引的矩阵序列AkA_k

Ak=[a11(k)a1n(k)an1(k)ann(k)]A_k = \begin{bmatrix} a_{11}(k) & \cdots &a_{1n}(k)\\ \vdots & \ddots & \vdots \\ a_{n1}(k) & \cdots & a_{nn}(k) \end{bmatrix}

这一系列矩阵{A1,A2,,Ak,}\{A_1,A_2,\dots,A_k,\dots\}构成矩阵序列,简记为{Ak}\{A_k\}

定义:我们知道数列是有极限的,那么推广到矩阵序列上来,如果

limkAk=A\lim_{k\rightarrow \infty}A_k=A

就说{Ak}\{A_k\}收敛于A的,矩阵序列{Ak}\{A_k\}收敛的充要条件是他的每一个元素代表的数列都收敛,即aij(k)\forall a_{ij}(k), aij\exists a_{ij}, s.t.limkaij(k)=aij\lim\limits_{k\rightarrow \infty}a_{ij}(k)=a_{ij}。所以,只要有一个元素不收敛,矩阵序列就是发散的

1.2 定理与推论

定理:矩阵序列AkA_k收敛,那么矩阵序列就有界。注意此处有界的定义是M>0\exists M>0,s.t.,k\forall k, AkM||A_k||\leq M。也就是使用矩阵范数进行衡量。

性质:矩阵序列以下的性质是成立的

  1. limk(αAk+βBk)=αA+βB\lim\limits_{k\rightarrow \infty}(\alpha A_k+\beta B_k)=\alpha A+\beta B,前提是AkA_k, BkB_k极限存在
  2. limkAkBk=AB\lim\limits_{k\rightarrow \infty}A_kB_k=AB,前提是AkA_k, BkB_k极限存在
  3. AkA_k收敛于A,且AkCn×nA_k\in C^{n\times n}, PCq×nP\in C^{q\times n}, QCn×pQ\in C^{n\times p},有limkPAkQ=PAQ\lim\limits_{k\rightarrow \infty}PA_kQ=PAQ
  4. AkA_k收敛于A,且AkA_k, AA可逆,注意此处是k\forall k, AkA_k都可逆,那么矩阵序列{Ak1}\{A_k^{-1}\}也收敛,且limkAk1=A1\lim\limits_{k\rightarrow \infty}A_k^{-1}=A^{-1}

定理:对于数字阵ACn×nA\in C^{n\times n},它的幂AkA^k的极限

limkAk=0n×n\lim_{k\rightarrow \infty}A^k=0_{n\times n}

的充要条件是ρ(A)<1\rho(A)<1,即谱半径小于1。由于谱半径是小于任意矩阵范数的,所以如果能找到一个矩阵范数,使得A<1||A||<1,那么上述极限也成立。

2 矩阵级数

2.1 定义

定义:设{Ak}Cn×n\{A_k\}\in C^{n\times n}是一个矩阵序列,它的无穷和

k=1Ak\sum_{k=1}^\infty A_k

矩阵级数

那么矩阵级数的前k项部分和,就可以定义为

Sk=i=1kAiS_k = \sum_{i=1}^k A_i

顺势可以给出矩阵级数的收敛条件,是

limkSk=S\lim_{k\rightarrow \infty}S_k = S

定义:如果某个矩阵范数||\cdot||,使得

k=1Ak=A1+A2++An+\sum_{k=1}^\infty ||A_k|| = ||A_1||+||A_2||+\cdots+||A_n||+\cdots

收敛,那么称k=1Ak\sum\limits_{k=1}^\infty A_k绝对收敛。由于在矩阵范数章节中,我们证明了复数域或实数域中任意范数都是等价的,所以这里的矩阵范数是任意的。

2.2 推论与定理

定理:矩阵级数k=1Ak\sum\limits_{k=1}^{\infty} A_k收敛的充要条件是

k=1aij(k)\sum_{k=1}^\infty a_{ij}(k)

收敛,就是说矩阵中每一个元素都收敛。

定理:矩阵级数k=1Ak\sum\limits_{k=1}^\infty A_k绝对收敛的充要条件是,i,j\forall i,j,正项级数k=1aij(k)\sum\limits_{k=1}^\infty |a_{ij}(k)|收敛。即矩阵级数绝对收敛就是每个元素都绝对收敛。

3 矩阵幂级数

3.1 定义

定义:给出一个数量矩阵ACn×nA\in C^{n\times n},那么

k=0ckAk\sum_{k=0}^\infty c_k A^k

的矩阵级数是方阵A的幂级数

定义:矩阵幂级数也有类似收敛半径的概念,在收敛半径中矩阵级数收敛。

定义;如果矩阵级数收敛,其无穷和为矩阵S,那么称S为矩阵级数的和,记为S=k=0AkS=\sum\limits_{k=0}^\infty A_k

3.2 定理与推论

定理:设矩阵级数的收敛半径R,那么当ρ(A)<R\rho(A)<R(谱半径小于收敛半径), 矩阵幂级数绝对收敛,若ρ(A)>R\rho(A)>R,则矩阵级数发散。

定理:若矩阵A的某一个范数A||A||在幂级数

k=0ckxk\sum_{k=0}^\infty c_kx^k

的收敛域内,那么

k=0ckAk\sum_{k=0}^\infty c_kA^k

绝对收敛。这告诉我们可以用普通幂级数的收敛半径来判断矩阵幂级数,同时可以用范数来进行比较。因为ρ(A)\rho(A)小于任意矩阵范数的,所以当矩阵范数落在收敛半径内,ρ(A)\rho(A)一定会落在收敛半径内。

常用矩阵级数

  1. 矩阵指数函数eAe^A,

    eA=k=0Akk!e^A = \sum\limits_{k=0}^\infty \frac{A^k}{k!}

  2. 矩阵正弦函数sinA\sin A

    sinA=k=0(1)kA2k+1(2k+1)!\sin A=\sum_{k=0}^\infty (-1)^k \frac{A^{2k+1}}{(2k+1)!}

  3. 矩阵余弦函数cosA\cos A

    cosA=k=0(1)kA2k(2k)!\cos A = \sum_{k=0}^\infty (-1)^k \frac{A^{2k}}{(2k)!}

  4. 矩阵逆(EA)1(E-A)^{-1}

    (EA)1=k=0Ak(ρ(A)<1)(E-A)^{-1} = \sum_{k=0}^\infty A^k\quad (\rho(A)<1)

  5. 矩阵对数函数ln(E+A)\ln (E+A)

    ln(E+A)=k=0(1)kk+1Ak+1(ρ(A)<1)\ln (E+A) = \sum_{k=0}^\infty \frac{(-1)^k}{k+1}A^{k+1}\quad (\rho(A)<1)

定理:矩阵幂级数k=0Ak\sum\limits_{k=0}^\infty A^k(即ck=1c_k=1),那么它绝对收敛的充要条件是ρ(A)<1\rho(A)<1,其和为

(EnA)1{(E_n-A)}^{-1}

4 矩阵多项式

4.1 矩阵的化零多项式

定义:给出多项式

P(x)=n=0nanxnP(x) = \sum_{n=0}^n a_nx^n

那么

P(A)=n=0nanAnP(A) = \sum_{n=0}^n a_nA^n

是相应于P(x)P(x)的关于方阵A的矩阵多项式,其中A0=EnA^0=E_nP(x)P(x)次数也是P(A)P(A)次数,记为degP(A)=n\deg P(A)=n

一些性质

  1. f(A)g(A)=g(A)f(A)=(fg)(A)f(A)g(A)=g(A)f(A)=(fg)(A), where fg=f(x)g(x)fg=f(x)g(x)
  2. f(A)+g(A)=g(A)+f(A)=(f+g)(A)f(A)+g(A)=g(A)+f(A)=(f+g)(A), where f+g=f(x)+g(x)f+g=f(x)+g(x)
  3. f(x)f(x)为多项式,那么对TCnn×n\forall T\in C_n^{n\times n}, f(TAT1)=Tf(A)T1f(TAT^{-1})=Tf(A)T^{-1}
  4. 给定分块对角阵A=diag{A1,A2,,As}A=diag\{A_1,A_2,\dots,A_s\},则f(A)=diag{f(A1),f(A2),,f(As)}f(A)=diag\{f(A_1),f(A_2),\dots,f(A_s)\}
  5. 给定矩阵A的特征值λ\lambda,特征向量α\alpha,那么有Aα=λαA\alpha=\lambda \alpha,且f(A)α=f(λ)αf(A)\alpha = f(\lambda)\alpha

定义:给出矩阵ACn×nA\in C^{n\times n},如果多项式P(x)P(x)满足P(A)=0P(A)=0,那么P(x)P(x)就是矩阵A的化零多项式

如果f(A)=0f(A)=0,那么可构造新的多项式F(x)=f(x)g(x)F(x)=f(x)g(x),其中g(x)g(x)任意,那么f(A)f(A)=0f(A)f(A)=0,这使得我们可以构造任意新的多项式,仍然满足F(A)=0F(A)=0,所以化零多项式不唯一

定理:任意方阵都有化零多项式

定理Cayley-Hamilton,给出ACn×nA\in C^{n\times n},且ϕ(λ)=det(λEA)=k=0nakλk\phi(\lambda)=det(\lambda E-A)=\sum\limits_{k=0}^n a_k\lambda^k是特征多项式。那么ϕ(A)=0\phi(A)=0。即矩阵的特征多项式是矩阵的化零多项式。

4.2 矩阵的最小多项式

定义:给出ACn×nA\in C^{n\times n},在A的所有化零多项式中(因为不唯一),次数最低的首一(最高次项系数为1)多项式为A的最小多项式,写成m(x)m(x)

定理:A的任意化零多项式P(x)P(x)m(x)m(x)满足m(x)P(x)m(x)|P(x)

定理:最小多项式是唯一的

定理:对于分块的对角矩阵A=diag{A1,A2,,As}A=diag\{A_1,A_2,\dots,A_s\},A的最小多项式mA(x)m_A(x)是对角线上分块矩阵的最小多项式mAi(x)m_{A_i}(x)最小公倍式

定理:m阶Jordan块Jm(a)J_m(a),其中a是对角线上元素,则其最小多项式是(λa)m(\lambda-a)^m

定理:对于ACrn×nA\in C_r^{n\times n},A的最小多项式m(x)m(x)是A的smith标准型中的对角线上最后一个不变因子。

推论:相似矩阵具有相同的最小多项式。

推论:矩阵能够相似对角化的充要条件是其最小多项式没有重根。m(x)=0m(x)=0无重根。

推论:最小多项式和特征值有关系,设A有s个不同的特征值λ1,,λs\lambda_1,\dots,\lambda_s,每个特征值对应的几何重复度为aia_i,i[1,s]i\in [1,s],每个特征值对应的初等因子的幂次分别为nikn_{ik},其中k[1,ai]k\in[1,a_i],记di=maxnikd_i=\max n_{ik},则最小多项式是

m(x)=(xλ1)d1(xλ2)d2(xλs)dsm(x) = (x-\lambda_1)^{d_1}(x-\lambda_2)^{d_2}\cdots(x-\lambda_s)^{d_s}

5 矩阵函数

5.1 定义

定义:对于幂级数

f(z)=k=0akzkf(z) = \sum_{k=0}^\infty a_kz^k

其收敛半径为r,则z<r|z|<r时幂级数收敛于f(z)f(z)。现在代入矩阵ACn×nA\in C^{n\times n},满足ρ(A)<r\rho(A)<r,那么矩阵函数就由矩阵幂级数定义

f(A)=k=0akAkf(A) = \sum_{k=0}^\infty a_kA^k

5.2 定理与推论

定理:对于矩阵函数f(A),ACn×nf(A),A\in C^{n\times n},有以下性质

  1. f(A)f(A)和A可交换,f(A)A=Af(A)f(A)A=Af(A)
  2. 函数和差的矩阵函数等于矩阵函数的和差,即(f±g)(A)=f(A)±g(A)(f\pm g)(A)=f(A)\pm g(A)
  3. 函数积的矩阵函数等于矩阵函数的积,(fg)(A)=f(A)g(A)(f\cdot g)(A)=f(A)g(A)
  4. B=T1ATB=T^{-1}AT,则f(B)=T1f(A)Tf(B)=T^{-1}f(A)T

定理:矩阵指数函数和三角函数除了普通指数函数和三角函数的性质外,有以下不同

  1. AB=BAAB=BA时,才有eAeB=eBeA=eA+Be^Ae^B=e^Be^A=e^{A+B}
  2. eA=etr(A)|e^A|=e^{tr(A)}
  3. AB=BAAB=BA时,才有cos(A+B)=cosAcosBsinAsinB\cos (A+B)=\cos A\cos B-\sin A\sin B
  4. AB=BAAB=BA时,才有sin(A+B)=sinAcosB+cosAsinB\sin(A+B) = \sin A\cos B+\cos A\sin B

6 矩阵函数计算

6.1 定义

引理:设ACn×nA\in C^{n\times n},其不同的特征值为λ1,,λr\lambda_1,\dots,\lambda_rm(λ)m(\lambda)为A的最小多项式,且有

m(λ)=(λλ1)d1(λλr)drm(\lambda) = (\lambda-\lambda_1)^{d_1}\cdots (\lambda-\lambda_r)^{d_r}

m=i=1rdim=\sum\limits_{i=1}^r d_i。对于函数f(x)f(x),如果对于所有λi\lambda_if(x)f(x)的导数f(λi),f(λi),,fdi1(λi)f(\lambda_i),f'(\lambda_i),\dots,f^{d_i-1}(\lambda_i)这m阶都存在,则称函数f(x)f(x)在矩阵A的谱上有定义


07:矩阵函数
https://jesseprince.github.io/2023/09/26/master/matrixanalysis/matfunc/
作者
林正
发布于
2023年9月26日
许可协议