01:线性空间

本文最后更新于:2023年9月7日 下午

矩阵论01:线性空间

1 集合

定义A={a,b,c,d,e}A = \{a,b,c,d,e\},其中大写字母A表示集合,小写字母a-e表示集合中的元素,如果集合里面没有任何元素,集合被称为空集ϕ\phi

常用的特殊集合如下:

N Z Q R C
自然数 整数 有理数 实数 复数

1.1 集合的关系

定义A=BA=B:表示两个集合中的元素完全相等。
定义ABA\subset B: 表示集合A中的元素都是集合B中的元素,A包含于B
定义ABA\subseteq B:表示ABA\subset BABA\neq B

定理

  1. BAB\subset AABA\subset B,两个集合相等A=BA=B
  2. CBC\subseteq BBAB\subseteq A,则CAC\subseteq A,即具有传递性。

1.2 集合的运算

  1. 交集:AB={xxA,xB}A\cap B = \{x|x\in A, x\in B\}
  2. 并集:AB={xxAxB}A\cup B = \{x|x\in A 或x\in B\}
  3. 差集:AB={xxA,xB}A-B = \{x|x\in A, x\notin B\}
  4. 补集:集合ASA\subset S,则SA=CSA={xxSxA}S-A = C_S A = \{x|x\in S且x\notin A\}

1.2.1 运算的性质

  1. AA=AA\cup A = A, AA=AA\cap A = A
  2. AB=BAA\cup B = B\cup A, AB=BAA\cap B = B\cap A
  3. (AB)C=A(BC)(A\cup B)\cup C = A\cup (B\cup C)
  4. (AB)C=A(BC)(A\cap B)\cap C = A\cap (B\cap C)
  5. A(BC)=(AB)(AC)A-(B\cup C) = (A-B)\cap (A-C)
  6. A(BC)=(AB)(AC)A-(B\cap C) = (A-B)\cup (A-C)

2 映射

定义f:AB,f(x)=yf: A\rightarrow B, f(x) = y,y为x在映射f下的像,x为原像。A为定义域,f(A)f(A)为值域。
满射f(A)=Bf(A) = B,即A集合的元素都能被映射到B中,不存在有元素的映射不在B。
单射x1,x2A\forall x_1,x_2\in A, 当x1x2x_1\neq x_2,有f(x1)f(x2)f(x_1)\neq f(x_2)
双射:同时满射且单射,也叫做一一映射。
复合映射g(f(x))=zg(f(x))=z的映射是复合映射,复合映射写作gfg\circ f

3 数域

定义:F是包含0和1的,F中任意两数的和、差、积、商的结果仍在F中,那么F就被称作数域。

C R Q
复数域 实数域 有理数域

运算封闭:如果F中任意两个数作某一运算的结果仍在F中,F对这个运算是封闭的。

定理:任意数域F都包括有理数域Q,即有理数域为最小数域

3.1 集合中的运算

VV是非空集合,F为一数域,在V上定义线性运算:

  1. 对于α,βV\forall \alpha,\beta \in V,总有唯一的γV\gamma \in V满足γ=α+β\gamma =\alpha +\beta,那么V对加法是唯一和封闭的,称"++"为V的加法
  2. 对于αV\alpha \in VλF\lambda \in F,总有唯一的σV\sigma \in V满足σ=λα\sigma = \lambda \cdot \alpha,那么V对乘法就是唯一和封闭的,称\cdot为V的乘法。

加法和乘法的运算合起来被称作线性运算。

3 线性空间

定义:数域F上的集合V对于线性运算唯一封闭,且满足对α,β,γV\forall \alpha,\beta,\gamma \in V, γ,μF\gamma, \mu \in F

  1. α+β=β+α\alpha +\beta = \beta +\alpha
  2. (α+β)+γ=α+(β+γ)(\alpha+\beta)+\gamma = \alpha+(\beta+\gamma)
  3. V存在零元θ\theta, 对αV\forall \alpha\in V,有α+θ=α\alpha+\theta = \alpha
  4. V总有负元β\beta, 使α+β=θ\alpha+\beta = \theta
  5. 1α=α1\cdot \alpha=\alpha
  6. λ(μα)=(λμ)α\lambda(\mu\alpha)=(\lambda\mu)\alpha
  7. (λ+μ)α=λα+μα(\lambda+\mu)\alpha = \lambda\alpha+\mu\alpha
  8. λ(α+β)=λα+λβ\lambda(\alpha+\beta) = \lambda\alpha+\lambda\beta

此时V称作数域F上的线性空间,记作V(F)V(F), 集合V中的元素,称为线性空间V(F)中的元素或向量。

3.1 线性空间的性质

  1. 零元素是唯一的
  2. 负元素是唯一的
  3. 0α=θ0\alpha=\theta, (1)α=α(-1)\alpha = -\alpha, λθ=θ\lambda\theta = \theta(零元,负元,单位元)
  4. 如果λα=θ\lambda\alpha = \theta, 则λ=0\lambda = 0α=0\alpha = 0
  5. 对任意的x,y,zVx,y,z\in V,若x+y=x+zx+y = x+z,则y=zy=z

3.2 向量组的线性相关性

定义:αiV\alpha_i\in V,kjFk_j\in F, $\theta $是零元,当满足求和

i,jkjαi=θ\sum_{i,j}k_j\alpha_i = \theta

时,若kik_i不全为0则向量组α\alpha是线性相关的,如果ki=0k_i=0则是线性无关的。

定义: 对于向量组A={α1,α2,,αm}A=\{\alpha_1, \alpha_2, \dots, \alpha_m\}B={β1,β2,,βn}B = \{\beta_1,\beta_2,\dots,\beta_n\}, 如果A中任一向量都能被B中的向量线性表示,则称A可被B线性表示。如果两个向量组可以互相线性表示,则两个向量组等价

定义: 对于A={α1,α2,,αm}A=\{\alpha_1,\alpha_2,\dots,\alpha_m\},如果能找到r(rm)r(r\leq m)个向量线性无关,而r+1r+1个向量都是相关的,那么这r个向量就是A的一个极大无关组。无关组向量的个数就是A的秩。rank(A)=rrank(A)=r

3.2.1 线性相关的性质

  1. 线性相关的充要条件是其中有某个向量可由其他向量线性表示
  2. 部分相关,全组相关
  3. 全组无关,部分组无关
  4. 向量组αV(F)\alpha\in V(F),则α\alpha线性无关的充要条件是αθ\alpha\neq\theta
  5. α\alpha增加一个向量β\beta后向量组(α,β)(\alpha,\beta)相关,则新增向量由原组α\alpha唯一表示。

3.3 基,维与坐标

定义: V是F的一个线性空间,如果能找到n个线性无关的向量α1,,αn\alpha_1,\dots,\alpha_n,使得V中任意一个向量x都能被这组向量线性表示,那么α1,,αn\alpha_1,\dots,\alpha_n就是V的一个基底。同时能够确定线性空间维数是n,即dimV=n\dim V=n

定义:对于空间V的一组基α1,,αn\alpha_1,\dots,\alpha_n,空间中的向量xx由基唯一线性表示。

x=ixiαix = \sum_{i}x_i\alpha_i

那么x在这个基下的坐标就是(x1,x2,,xn)T(x_1,x_2,\dots,x_n)^T

结论

  1. 如果对于任意n,总能在线性空间V中找到n个线性无关的向量,那么V就是无限维线性空间
  2. 空间中的向量在不同基底下的坐标是不同的

3.3.1 基变换与坐标变换

基变换公式:如果求ϵ1ϵn\epsilon_1\dots\epsilon_n(旧)到ϵ1ϵn\epsilon'_1\dots \epsilon'_n(新)的变换,则变换的关系为

[ϵ1ϵn]=[ϵ1ϵn]P[\epsilon'_1\dots\epsilon'_n] = [\epsilon_1\dots\epsilon_n]P

或者说

新的=旧的×P新的 = 旧的\times P

矩阵P就被称为过渡矩阵

坐标变换公式:向量x在旧基下的坐标是(x1,,xn)T(x_1,\dots,x_n)^T,在新基下的坐标是(x1,,xn)T(x'_1,\dots,x'_n)^T,则坐标的变换公式是

(x1,,xn)=P(x1,,xn)(x_1,\dots,x_n) = P(x_1',\dots,x'_n)

或者说

旧的=P×新的旧的 = P\times 新的

重要定理:矩阵空间Fm×nF^{m\times n}和多项式空间F[x]nF[x]_n中的向量α1,,αn\alpha_1,\dots,\alpha_n线性无关当且仅当α1,,αn\alpha_1,\dots,\alpha_n在其自然基底下的坐标是线性无关的。

利用这点,在验证矩阵型向量无关的时候,可以转换为自然基地坐标的无关,其中自然基底是仅有一个元素为1的矩阵型向量组成的空间的基。例如对于R2×2R^{2\times 2},其自然基底是

[1000],[0100],[0010],[0001]\begin{bmatrix}1 & 0 \\0 & 0\end{bmatrix},\begin{bmatrix}0 & 1 \\0 & 0\end{bmatrix},\begin{bmatrix}0 & 0 \\1 & 0\end{bmatrix},\begin{bmatrix}0 & 0 \\0 & 1\end{bmatrix}

3.4 线性子空间

子空间定义:给定数域F上的线性空间V,取W为V的一个非空子集,如果W对V上两种运算也构成数域F上的线性空间,即a,bF,α,βW\forall a,b\in F,\forall \alpha,\beta\in W,有aα+bβWa\alpha+b\beta\in W(线性运算封闭),则称W为V的一个线性子空间。

维数关系: 子空间的维数一定是小于等于原空间的。

固定的子空间: 一个空间V必定有两个子空间,分别是V本身和单个零向量构成的子空间{θ}\{\theta \}

3.4.1 生成子空间

定义:从线性空间V(F)V(F)中取m个向量α1,,αm\alpha_1,\dots,\alpha_m,那么这些向量所有线性组合{kiαikiF}\{\sum k_i\alpha_i|k_i\in F\}可以张成一个新空间,这个新空间一定是V(F)V(F)的子空间,记作L(α1,,αm)L(\alpha_1,\dots,\alpha_m)或者span[α1,,αm]span[\alpha_1,\dots,\alpha_m]

其实任何一个线性空间都可以看作是其基张成的。

3.5 线性空间的等价

设两组向量α1,,αr\alpha_1,\dots,\alpha_rβ1,,βs\beta_1,\dots,\beta_s为n维线性空间V中的两组向量,则

  1. L(α1,,αr)=L(β1,,βs)L(\alpha_1,\dots,\alpha_r) =L(\beta_1,\dots,\beta_s)的充要条件是两个向量组等价。
  2. dimL[α1,,αr]=rank(α1,,αr)\dim L[\alpha_1,\dots,\alpha_r] = rank(\alpha_1,\dots,\alpha_r)

3.6 基扩充定理

设W为n维线性空间V的一个m维子空间,α1,,αm\alpha_1,\dots,\alpha_m是W的一组基,那么这组向量必定可以扩充成V的一组基。

也就是说子空间的基可以通过扩充变成原空间的基。

3.7 特殊的子空间

AFm×nA\in F^{m\times n}

  1. 值域R(A)={yy=Ax,xFn}R(A) = \{y|y=Ax, x\in F^n\}FmF^m的子空间。
  2. 核空间N(A)={xAx=θ,xFn}N(A) = \{x|Ax=\theta, x\in F^n\}FnF^n的子空间。
  3. 特征子空间:设AFn×nA\in F^{n\times n}, λ\lambda为A的特征值,则集合Vλ={xλx=Ax,xFn}V_\lambda = \{x|\lambda x = Ax,x\in F^n\}FnF^n的子空间。

重要结论
A=[α1,,αn]Fm×nA = [\alpha_1,\dots,\alpha_n]\in F^{m\times n},则

  1. R(A)=span[α1,,αn]R(A) = span[\alpha_1,\dots,\alpha_n]
  2. dimR(A)=rankA\dim R(A) = rank A
  3. dimR(A)+dimN(A)=n\dim R(A)+\dim N(A) = n

3.8 子空间的运算

V1V_1, V2V_2是线性空间V的两个子空间

  1. 交集运算:V1V2={xxV1,xV2}V_1\cap V_2 = \{x|x\in V_1, x\in V_2\}是V的子空间
  2. 和运算:V1+V2={x+yxV1,yV2}V_1+V_2 = \{x+y|x\in V_1,y\in V_2\}是V的子空间

交集运算过后的称为交子空间,和运算过后的称为和子空间。

V的两个子空间的并集未必是V的子空间,具体可用向量错位加法不封闭的反例证明

具体运算方法

交子空间:设γ\gamma是属于两个空间的向量

γL(α1,α2)L(β1,β2)\gamma \in L(\alpha_1,\alpha_2)\cap L(\beta_1,\beta_2)

那么γ\gamma必定被两个空间的基线性表示,且表示结果相等。

γ=x1α1+x2α2=y1β+y2β2\gamma = x_1\alpha_1+x_2\alpha_2 = y_1\beta+y_2\beta_2

解出相等后的方程组即是交子空间。

和子空间

V1+V2=L(x1,x2,,xm,y1,y2,,ys)V_1+V_2 = L(x_1,x_2,\dots,x_m,y_1,y_2,\dots,y_s)

即两个子空间的基向量共同张成的空间

3.8.1 子空间维数运算

V1V_1, V2V_2为线性空间V的两个子空间,则

{dimV1+dimV2=dim(V1+V2)+dim(V1V2)dim(V1+V2)=dimV1+dimV2dim(V1V2)\begin{cases} \dim V_1 + \dim V_2 = \dim (V_1+V_2) + \dim (V_1\cap V_2) \\ \dim (V_1+V_2) = \dim V_1 +\dim V_2 - \dim (V_1\cap V_2) \end{cases}

可类比概率论的概率加法公式记忆。

从维数公式可以看到,子空间的和的维数往往比子空间的维数的和小

推论:设V1V_1, V2V_2为n维线性空间V的两个子空间,若dimV1+dimV2>n\dim V_1+ \dim V_2 >n,则V1V_1, V2V_2闭含非零的公共向量,即V1V2V_1\cap V_2中必有非零向量。

3.8.2 子空间运算的性质

  1. V1V2V_1\cap V_2 = V2V1V_2\cap V_1
  2. (V1V2)V2=V1(V2V2)(V_1\cap V_2)\cap V_2 = V_1\cap (V_2\cap V_2)
  3. V1+V2=V2+V1V_1+V_2 = V_2+V_1
  4. (V1+V2)+V3=V1+(V2+V3)(V_1+V_2)+V_3 = V_1+(V_2+V_3)

3.8.3 子空间与齐次方程组

W1W_1是方程组AX=0AX=0的解空间,W2W_2是方程组BX=0BX=0的解空间,则W1W2W_1\cap W_2是方程组联立的解。

[AB]X=0\begin{bmatrix} A \\ B \end{bmatrix}X = 0

3.8.4 直和

定义直和: 设V1V_1,V2V_2为线性空间V的两个子空间,若V1V2={θ}V_1\cap V_2 = \{\theta \},则称V1+V2V_1+V_2是直和,记作V1V2V_1\oplus V_2

重要结论
V1V_1, V2V_2为线性空间V的子空间,则下面的命题等价

  1. V1+V2V_1+V_2是直和
  2. V1+V2V_1+V_2中的任意一个向量的分解式唯一。其中分解式是指γV1+V2\forall \gamma \in V_1+V_2, γ\gamma 分解为γ=α+β\gamma = \alpha+\beta, where αV1,βV2\alpha\in V_1,\beta \in V_2
  3. x1,,xmx_1,\dots,x_mV1V_1的基,y1,,ysy_1,\cdots,y_sV2V_2的基,则x1,,xm,y1,ysx_1,\dots,x_m,y_1\dots, y_sV1V2V_1\oplus V_2的基。即直和空间的基就是原来两个子空间的基。详见子空间的具体运算。
  4. dim(V1+V2)=dimV1+dimV2\dim (V_1+V_2) = \dim V_1 + \dim V_2,因为交集是0,所以省略减法项。

直和生成空间:设x1,,xnx_1,\dots,x_n为n维线性空间的一个基,则

V=L(x1)L(xn)V = L(x_1)\oplus \cdots \oplus L(x_n)

定义余子空间:U是V的一个子空间,则必存在一个子空间W,使得V=UWV = U\oplus W, 称这样的W为U的一个余子空间。类比集合的补集。

注意:余子空间一般不是唯一的(除非是平凡子空间,0空间和空间本身)

定理:n维向量空间V的任一子空间V1V_1都有余子空间,若W是V1V_1的余子空间,有

dimV1+dimW=dimV\dim V_1 + \dim W = \dim V

原因同空间直和时无交集部分。


01:线性空间
https://jesseprince.github.io/2023/08/30/master/matrixanalysis/linearspace/
作者
林正
发布于
2023年8月30日
许可协议