矩阵分解

矩阵的满秩分解

定义:设ACm×n,rank(A)=rA\in C^{m\times n},rank(A)=r,如果存在列满秩矩阵FCm×nF\in C^{m\times n}和行满秩矩阵GCr×nG\in C^{r\times n},使得
A=FGA=FG则称上式为矩阵A的满秩分解,当A是满秩(列满秩或行满秩)矩阵时,A可分解为一个单位阵和其本身,称此满秩分解为平凡分解。

定理:设非零阵ACm×n,rank(A)=rA\in C^{m\times n},rank(A)=r,则A有满秩分解。

proof.proof.
rank(A)=rrank(A)=r时,对A进行初等行变换为行阶梯型矩阵B,即
ArB=(GO),GCr×n,rank(G)=rA\xrightarrow{r}B=\begin{pmatrix}G\\O \end{pmatrix},\quad G\in C^{r\times n},\quad rank(G)=r
于是存在m阶可逆阵P,使得PA=BPA=B或者A=P1BA=P^{-1}B.将P1P^{-1}分块为P1=(F,S)P^{-1}=(F,S),其中
FCm×r,rank(F)=r,SCm×(mr),rank(S)=mr,F\in C^{m\times r},rank(F)=r,S\in C^{m\times(m-r)},rank(S)=m-r,则有:
A=P1B=(F,S)(GO)=FGA=P^{-1}B=(F,S)\begin{pmatrix}G\\O \end{pmatrix}=FG
其中F是列满秩矩阵,G是行满秩矩阵

注1:矩阵A的满秩分解不唯一,因为如果取任一r阶非奇异阵,则式可改写为
A=(FD)(D1G)=F~G~A=(FD)(D^{-1}G)=\tilde F\tilde G
是A的另一个满秩分解。
注2:由证明过程可以用初等变换的方法求满秩分解。
注意列满秩阵是P逆的前r列,计算量较大

为了避免求逆,引入下面的定义

置换矩阵

定义:以n阶单位阵EnE_n的n个列向量e1,e2,,ene_1,e_2,\cdots,e_n为列打乱顺序构成的n阶矩阵
P=(ej1,ej2,,ejn)P=(e_{j_1},e_{j_2},\cdots,e_{j_n})称为置换矩阵,这里j1,j2,,jnj_1,j_2,\cdots,j_n是1,2,…,n的一个全排列。
如:P=(e3,e4,e1,e2)P=(e_3,e_4,e_1,e_2)是一个4阶置换矩阵。

置换矩阵有如下性质

  1. P是正交阵
  2. 对任意ACm×nA\in C^{m\times n},AP是将A的列按j1,j2,,jnj_1,j_2,\cdots,j_n的次序重新排列得到的矩阵。
    我们已知,任意非零秩r阵A,可以通过初等行变换化为行最简形,且B的前r行线性无关。

定理:设ACm×n,rank(A)=r(r>0),A\in C^{m\times n},rank(A)=r(r\gt 0),A的行最简形矩阵为B,那么在A的满秩分解中,可取F为A的j1,j2,,jrj_1,j_2,\cdots,j_r列所构成的m×rm\times r矩阵,G为B的前r行构成的r×nr\times n矩阵。
下面确定列满秩矩阵F,参照A的行最简形矩阵B作n阶置换矩阵
P1=(ej1,,ejr,ejr+1,,ejn)P_1=(e_{j_1},\cdots,e_{j_r},e_{j_{r+1}},\cdots,e_{j_n})按列划分A=(α1,,αn),B=(β1,β2,,βn)A=(\alpha_1,\cdots,\alpha_n),\quad B=(\beta_1,\beta_2,\cdots,\beta_n)
AP1=(αj1,,αjr,αjr+1,,αjn)AP_1=(\alpha_{j_1},\cdots,\alpha_{j_r},\alpha_{j_{r+1}},\cdots,\alpha_{j_n}) BP1=(βj1,,βjr,βjr+1,,βjn)=(ErB12OO)BP_1=(\beta_{j_1},\cdots,\beta_{j_r},\beta_{j_{r+1}},\cdots,\beta_{j_n})= \begin{pmatrix} E_r & B_{12}\\ O & O \end{pmatrix}
其中B12Cr×(nr)B_{12}\in C^{r\times (n-r)},再由A=P1B,A=P^{-1}B,可得
AP1=P1(BP1)=(F,S)(ErB12OO)=(F,FB12)AP_1=P^{-1}(BP_1)=(F,S) \begin{pmatrix} E_r & B_{12}\\ O & O \end{pmatrix}=(F,FB_{12})
即F为AP1AP_1的前r列构成的矩阵,也就是A的j1,j2,,jrj_1,j_2,\cdots,j_r列构成的矩阵。

利用上述定理求A的满秩分解时,需要首先求出A的行最简形矩阵B,但并未用到矩阵P,因此不需求。

QR分解

(Schur定理)若ACn×n,A\in C^{n\times n},则存在酉矩阵,使得
UHAU=TU^HAU=T
其中T为上三角矩阵,T的主对角线上的元素都是A的特征值。

(QR分解定理)设A为n阶复矩阵,则存在酉矩阵Q及上三角矩阵R,使得
A=QRA=QR

正规矩阵

定义:设A为n阶复矩阵,若
AHA=AAHA^HA=AA^H
则称A为正规矩阵
显然:对角阵、实对称矩阵(A=ATA=A^T)、实反对称矩阵(AT=A)(A^T=-A)、正交矩阵(A1=AT)(A^{-1}=A^T)、Hermite矩阵(A=AHA=A^H),反Hermite矩阵(AH=AA^H=-A),酉矩阵(A1=AH)(A^{-1}=A^H)都是正规矩阵
注:正规矩阵并不只有上述这些。

矩阵的奇异值分解

引理:设ACm×n,A\in C^{m\times n},则:

  1. AHA,AAHA^HA,AA^H的特征值全为非负实数。
  2. AHA,AAHA^HA,AA^H的非零特征值相同,并且非零特征值的个数(重特征值按重数算)等于rank(A)rank(A)
  3. rank(AHA)=rank(AAH)=rank(A)rank(A^HA)=rank(AA^H)=rank(A)

定义:设ACm×n,rank(A)=r(r>0)A\in C^{m\times n},rank(A)=r(r\gt 0),矩阵AHAA^HA的特征值为
λ1λ2λr>λr+1==λn=0\lambda_1\ge \lambda_2\ge\cdots\ge\lambda_r\gt \lambda_{r+1}=\cdots=\lambda_n=0则称σi=λi(i=1,2,,n)\sigma_i=\sqrt{\lambda_i}(i=1,2,\cdots,n)为A的奇异值。
易见,A的奇异值的个数等于A的列数,A的非零奇异值的个数等于rank(A)rank(A)

定理(奇异值分解)设ACm×nA\in\mathbb C^{m\times n},则存在m阶酉阵U和n阶酉阵V,使得
A=USVH=σ1u1v1H+σ2u2v2H++σrurvrHA=USV^H=\sigma_1u_1v_1^H+\sigma_2u_2v_2^H+\cdots+\sigma_ru_rv_r^H其中S=diag(σ1,,σn)Rm×n,σi>0(i=1,,r),r=rank(A)S=diag(\sigma_1,\cdots,\sigma_n)\in\mathbb R^{m\times n},\sigma_i\gt 0(i=1,\cdots,r),r=rank(A)

推论:在矩阵A的奇异值分解A=USVHA=USV^H中,U的列向量为AAHAA^H的特征向量,V的列向量为AHAA^HA的特征向量。
proof.proof.
AAH=(USVH)(USVH)H=USVHVSHUH=USSHUH(AAH)U=USSH=Udiag(λ1,λ2,,λr,0,,0)\begin{aligned} \because AA^H=& (USV^H)(USV^H)^H\\ =& USV^HVS^HU^H=USS^HU^H\\ \therefore (AA^H)U=& USS^H=Udiag(\lambda_1,\lambda_2,\cdots,\lambda_r,0,\cdots,0) \end{aligned}U=(u1,,um)U=(u_1,\cdots,u_m),则(AAH)ui=λiui,i=1,,m(AA^H)u_i=\lambda_iu_i,i=1,\cdots,m