04:特殊矩阵

本文最后更新于:2023年9月20日 下午

04:特殊矩阵

1 单纯矩阵

1.1 方阵的特征值与特征向量

定义:设AFn×nA\in F^{n\times n},如果能找到λF\lambda\in F,且x0\exists x\neq 0,使得以下等式

Ax=λxAx = \lambda x

成立,那么λ\lambda就是矩阵的特征值xx就是数域这个特征值的特征向量。此定义式就代表着有一个列向量xx,矩阵和这个列向量相乘后,是这个列向量的λ\lambda倍。AA的所有特征值叫做A的谱。

定义λEA\lambda E-A是矩阵的特征矩阵det(λEA)det(\lambda E-A)是矩阵的特征多项式。

1.1.1 特征值特征向量性质

  1. 属于不同特征值的特征向量是线性无关的
  2. 如果λ\lambda是A的特征值,α\alpha是A属于λ\lambda的特征向量,那么f(A)f(A)的特征值是f(λ)f(\lambda)α\alpha是属于f(λ)f(\lambda)的特征向量。
  3. 如果λ\lambda是A的特征值,那么kA,A2,Am,aA+bEkA, A^2,A^m,aA+bE的特征值分别对应是kλ,λ2,λm,aλ+bk\lambda, \lambda^2, \lambda^m,a\lambda+b
  4. 如果λ1,,λn\lambda_1,\dots,\lambda_n是A的n个特征值,那么i=1nλi=tr(A)\sum\limits_{i=1}^n\lambda_i = tr(A), inλi=det(A)\prod\limits_{i}^n \lambda_i= det(A).
  5. 矩阵A可逆的充要条件是A的特征值全不为0
  6. 当矩阵A和B相似时,A和B有相同特征值。

1.2 重复度

定义:设λi\lambda_i是A的特征值,称A的特征多项式中的λi\lambda_i的重根数为λi\lambda_i代数重复度,记作mim_i,特征值对应的特征向量的特征子空间VλiV_{\lambda_i}的维数为λi\lambda_i几何重复度,记作aia_i,这个空间也是解特征向量的方程的解空间。

1.2.1 定理与推论

定理:设λi\lambda_i为矩阵A的特征值,其几何重复度为aia_i,那么ai=nrank(λiEA)a_i = n-rank(\lambda_iE-A),也就是几何重复度是特征矩阵构成的齐次方程组的解空间维度。

定理:矩阵的几何重复度一定小于等于代数重复度。aimia_i\leq m_i

1.3 矩阵的对角化

定义:矩阵ACn×nA\in C^{n\times n},若A与对角阵相似,则称A可对角化,可对角化的矩阵称为单纯矩阵

1.3.1 推论与定理

定理:矩阵A为单纯矩阵的充要条件是有n个线性无关的特征向量。

推论:如果能过够找到PP,使得P1AP=diag[λi]P^{-1}AP=diag[\lambda_i],其中λi\lambda_i是A的n个特征值,那么构成相似的矩阵PP的第ii个列向量是属于属于λi\lambda_i的特征向量。例如P的第一列就是λ1\lambda_1的特征向量。

定理:矩阵可对角化的充要条件是每一个特征值的代数重复度等于其几何重复度mi=aim_i=a_i

定理:对于ACn×nA\in C^{n\times n}, BCm×mB\in C^{m\times m},其构成的分块矩阵C=[AOmOnB]C=\begin{bmatrix} A & O_m \\ O_n & B\end{bmatrix},C是单纯矩阵的充要条件是A和B都是单纯矩阵。

矩阵相似对角化的步骤

  1. 求出det(λEA)=0det(\lambda E-A)=0, 得到所有特征值
  2. 对于每一个特征值λi\lambda_i,求解(λiEA)=0(\lambda_iE-A)=0,方程的基础解系就是特征向量
  3. 特征值写成对角矩阵Λ\Lambda, 特征向量根据特征值的位置排成矩阵P,则P1AP=ΛP^{-1}AP=\Lambda

2 正规矩阵及其对角化

定义:对于一个矩阵ACn×n(Rn×n)A\in C^{n\times n}(R^{n\times n}),如果AAH=AHAAA^H=A^HA,那么矩阵A称作一个复(实)正规矩阵

Hermite矩阵,反Hermite矩阵,正交矩阵,酉矩阵,对角阵都是正规矩阵

定义:设A,BCn×nA, B\in C^{n\times n}Rn×nR^{n\times n}, 如果存在UUn×nU\in U^{n\times n}(或En×nE^{n\times n}),使得

UHAU=U1AU=B(A=UBUH)U^HAU = U^{-1}AU=B\quad \quad (A=UBU^H)

实空间中

UTAU=U1AU=B(A=UBUT)U^TAU = U^{-1}AU=B\quad \quad (A=UBU^T)

则称A酉相似(或者正交相似)于B

2.1 定理与推论

Schur引理:设λ1,λ2,,λn\lambda_1,\lambda_2,\dots,\lambda_n为n阶方阵A的n个特征值,则存在酉矩阵UUn×nU\in U^{n\times n},使得

U1AU=[λ1λ2λn]U^{-1}AU = \begin{bmatrix} \lambda_1 & & & * \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{bmatrix}

上述矩阵是上三角阵,对角线上放元素任意,对角线下方元素为0

定理:设ACn×nA\in C^{n\times n},则A为正规矩阵的充要条件是UUn×n\exists U\in U^{n\times n},使得A=UΛUHA=U\Lambda U^{H},其中Λ\Lambda是对角矩阵,对角线元素是矩阵A的特征值。

定理:若A是正规矩阵

  1. A是单纯矩阵
  2. A属于不同特征值的特征向量相互正交,或者说特征子空间正交
  3. A为酉矩阵的充要条件是A的特征值的模为1,λ(A)=1|\lambda(A)|=1

矩阵A酉相似对角化的步骤

  1. 求解λEA=0|\lambda E-A|=0,得到A的谱
  2. 对每一个特征值求它的特征向量,解(λiEA)x=0(\lambda_i E-A)x=0
  3. 标准正交化所有的特征向量,得到U=[γ1,,γn]U=[\gamma_1,\dots,\gamma_n],里面的列向量是标准正交化后的特征向量
  4. U1AU=UHAU=ΛU^{-1}AU = U^{H}AU = \Lambda

3 Hermite矩阵

定义:设ACn×nA\in C^{n\times n}AHA^H为A的共轭转置矩阵

  • AH=AA^H=A为Hermite矩阵
  • A=AHA=-A^H为反Hermite矩阵

简称HermiteHermite矩阵为H-阵

3.1 性质与推论

推论:对任意ACn×nA\in C^{n\times n},则A+AHA+A^H, AAHAA^H, AHAA^HA都是H-阵,AAHA-A^H为反H-阵

性质:对于H-阵A

  1. kR\forall k\in R,有AkA^k也是H-阵
  2. 如果A是可逆的,则A1A^{-1}也是H-阵
  3. 如果A、B是H-阵,则k,lR\forall k,l\in R,线性组合kA+lBkA+lB也是H-阵(kAkA也是H阵)
  4. A、B是H-阵,ABAB是H-阵的充要条件是AB=BAAB=BA
  5. A是H-阵的充要条件是对于任意n阶方阵S,SHASS^HAS是H-阵
  6. iAiA是反H-阵
  7. A酉相似于对角阵
  8. A的特征值为实数,反H-阵的特征值为虚数

定理:设A是H-阵,它的秩为r,那么

A[EpErp0]A\sim \begin{bmatrix} E_p & & \\ & -E_{r-p} & \\ & & 0 \end{bmatrix}

其中p是A的正惯性指数,rpr-p是A的负惯性指数

定理:对于ACn×nA\in C^{n\times n}, A是H-阵的充要条件是对于任意的xCnx\in C^{n}, xHAxx^HAx是实数。

4 Hermite二次型

定义:对于n个复变量x1,,xnCnx_1,\dots,x_n\in C^n,系数为复数的二次齐次多项式

f=i=1nj=1naijxˉixj=xH[a11a12a1na21a22a2nan1an2ann]x=xHAxf = \sum_{i=1}^n\sum_{j=1}^na_{ij}\bar x_ix_j = x^H \begin{bmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n_2} & \cdots & a_{nn} \end{bmatrix}x =x^HAx

Hermite二次型,注意Hermite二次型中

  1. aij=ajia_{ij} = \overline{a_{ji}}
  2. AH=AA^H = A
  3. 二次齐次多项式中xˉ1x2x1xˉ2\bar x_1 x_2 \neq x_1\bar x_2

AA称作Hermite二次型对应的矩阵,A的秩就是Hermite二次型的秩

定义:对于Hermite二次型,必存在一个可逆的线性变换x=Cyx=Cy, 使得

f=xHAx=yHCHACy=yH(CHAC)y=yHByf = x^H Ax = y^HC^HAC y=y^H(C^HAC)y = y^HBy

这里B=CHACB=C^HAC,且显然BH=BB^H=B

如果变换CHACC^HAC让A变成了对角矩阵,那么Hermite二次型会变成

f=λ1yˉ1y1++λnyˉnyn=yHΛyf = \lambda_1 \bar y_1y_1 +\cdots + \lambda_n \bar y_ny_n = y^H\Lambda y

这种样式的Hermite二次型是标准型

其中变化x=Cyx=Cy是让AA对角化的变换,上式λi\lambda_i是A的特征值。

定义:对于Hermite二次型矩阵,\exists线性变换x=Cyx=Cy,在A的正惯性指数为p,秩为r时,有

f=y12+y22++yp2yp+12yp+22yr2f = |y_1|^2 + |y_2|^2+\cdots+|y_p|^2 - |y_{p+1}|^2-|y_{p+2}|^2-\cdots - |y_r|^2

即二次型各项前系数为±1\pm 1和0,这时的二次型称作规范型

定义:设f=xHAxf=x^HAx为Hermite二次型,给出xCn,xθ\forall x\in C^n, x\neq \theta,有

  1. 如果xHAx>0x^HAx>0, 称f是正定的,也叫矩阵A是正定的,记作A>0A>0
  2. 如果xHAx0x^HAx\geq 0, 称f是半正定的,也叫矩阵A是半正定的,记作A0A\geq 0
  3. 如果xHAx<0x^HAx<0, 称f是负定的,也叫矩阵A是负定的,记作A<0A<0
  4. 如果xHAx0x^HAx\leq 0, 称f是半负定的,也叫矩阵A是半负定的,记作A0A\leq 0

4.1 推论与性质

性质

  1. 单位矩阵E>0E>0
  2. A>0A>0,给出数k>0k>0,则kA>0kA>0
  3. A>0A>0, B>0B>0, 则A+B>0A+B>0
  4. A0A\geq 0, B0B\geq 0, 则A+B0A+B\geq 0
  5. A>0A>0, B0B\geq 0, 则A+B>0A+B>0

定理:n阶H-阵是正定(半正定)矩阵的充要条件是A的所有特征值都是正数(非负数)。

定理:设A是n阶Hermite矩阵,f=xHAxf = x^HAx,则下列命题等价

  1. A是正定阵
  2. 对任意n阶可逆阵P,PHAPP^HAP都是Hermite正定矩阵
  3. 存在n阶可逆阵P,使得PHAP=EP^HAP=E
  4. 存在n阶可逆阵Q,使得A=QHQA=Q^HQ

定理:设A是n阶Hermite矩阵,f=xHAxf = x^HAx,则下列命题等价

  1. A是正定矩阵
  2. 对任意n阶可逆矩阵P,PHAPP^HAP都是Hermite半正定矩阵
  3. 存在n阶可逆阵P,使得PHAP=[ErOOO]P^HAP=\begin{bmatrix}E_r & O \\ O & O \end{bmatrix},其中r=rankAr = rank A
  4. 存在n阶可逆阵Q,使得A=QHQA=Q^HQ

推论

  1. 设A是一个正定的H-阵,且又是酉矩阵,那么矩阵A是单位阵E
  2. 设A是一个正定的H-阵,B是一个反H-阵,那么AB与BA的特征值实部为0

定理:设A是Hermite矩阵,则A正定的充要条件是的顺次主子式大于0


04:特殊矩阵
https://jesseprince.github.io/2023/09/17/master/matrixanalysis/specialmat/
作者
林正
发布于
2023年9月17日
许可协议