矩阵与线性方程组

记号:

性质

定义

集合的运算

注:集合中的冒号与竖线是一样的,是另一种记法。

对于一个正整数,实数的所有有序n元组[x1,x2,,xn][x_1,x_2,\cdots,x_n]的集合记为RnR^n,它的每一个元素称为向量(n×1n\times 1向量)。特别地,若n=1,则R的元素称为标量。设V为n维向量的集合,如果集合V非空,且集合V对向量加法和数乘两种运算封闭,则称集合V为向量空间。
实内积空间是满足内积公理的实向量空间。
如果对实n阶向量空间RnR^n定义向量之间的内积为典范内积(canonical inner product)
<x,y>=i=1nxiyi<x,y>=\sum_{i=1}^nx_iy_i
则称RnR^n为n阶欧氏空间(Euclidean),也记作EnE^n,若两向量内积为0,称这两个向量正交。记作xyx\perp y

范数

内积公理:满足正定性、可加性、齐次性、对称性的数叫内积。
范数公理:满足正定性、齐次性、三角不等式的数叫范数。

向量范数:
l2l_2范数:也称Euclidean范数,Frobenius范数。
x=<x,x>1/2||x||=<x,x>^{1/2}
lpl_p范数:(Holder范数)
xp=(xip)1/p||x||_p=(\sum |x_i|^p)^{1/p}
可以证明
无穷(ll_\infty)范数。
x=limpxp=max(x1,,xn)||x||_\infty=\lim_{p\to\infty}||x||_p=\max({|x_1|,\cdots,|x_n|})
proof.proof.
对n个正数a1,a2,,an,a_1,a_2,\cdots,a_n,
max(a1n,a2n,,ann)a1n+a2n++annnmax(a1n,a2n,,ann)\max(a_1^n,a_2^n,\cdots,a_n^n)\le a_1^n+a_2^n+\cdots+a_n^n\le n\max(a_1^n,a_2^n,\cdots,a_n^n)max(a1,a2,,an)(a1n+a2n++ann)1nnnmax(a1,a2,,an)\max(a_1,a_2,\cdots,a_n)\le (a_1^n+a_2^n+\cdots+a_n^n)^\frac{1}{n}\le \sqrt[n]n\max(a_1,a_2,\cdots,a_n)注意到limnnn=1\lim_{n \to \infty}\sqrt[n]n=1,由夹逼准则
limn(a1n+a2n++ann)1n=max(a1,a2,an)\lim_{n\to\infty}(a_1^n+a_2^n+\cdots+a_n^n)^\frac{1}{n}=\max(a_1,a_2,a_n)
范数x||x||称为酉不变的,若Ux=x||Ux||=||x||对所有向量xCmx\in C^m和所有酉矩阵(实数为正交矩阵)UCm×mU\in C^{m\times m}恒成立。
Euclidean范数2||\cdot||_2是酉不变的。

向量之间的距离:d=xyd=||x-y||
特别地,对于n维欧氏空间,向量范数取
x2=a12++an2||x||_2=\sqrt{a_1^2+\cdots+a_n^2}
常数向量w和v的外积记作wvHwv^H,定义为矩阵的乘法。

Pythagorean定理:若xy,x+y2=x2+y2x\perp y,||x+y||^2=||x||^2+||y||^2
Cauchy-Schwartz不等式:<x,y>xy|<x,y>|\le||x||||y||
平行四边形法则:x+y2+xy2=2x2+xy2||x+y||^2+||x-y||^2=2||x||^2+x||y||^2
定义:若n,xnx0,n\to\infty,||x_n-x||\to 0,则称xnx_n收敛于x。
命题:若xnx,yny,x_n\to x,y_n\to y,<xn,yn><x,y><x_n,y_n>\to<x,y>

矩阵范数具有以下性质:
正定性,齐次性,三角不等式,两个矩阵乘积的范数小于或等于两个矩阵范数的乘积ABAB||AB||\le||A||||B||
典型的矩阵范数:

矩阵范数满足平行四边形法则,Cauchy-Schwartz不等式,Pathagoras定理。

综上所述:在实内积空间里,范数有以下性质:

映射T的值域:Im(T)Im(T)
将矩阵与向量的乘法Am×nxn×1A_{m\times n}x_{n\times 1}视为将RnR^n的向量x变为RmR^m的某个向量的线性映射T:xAxT:x\mapsto Ax.

向量的内积是一种线性映射,T:V×VC=<x,y>V\times V\mapsto C=<x,y>,由内积公理易知其满足线性变换的两个条件。

向量空间(线性空间)

同构:两个实内积空间同构,若存在一个一一线性映射T:EFT:E\mapsto F能保持向量的内积不变,即<Tx,Ty>=<x,y><Tx,Ty>=<x,y>对所有向量x,yEx,y\in E成立。这个映射T称为向量空间的同构映射。

一般把RnR^n叫做(向量)空间,把里面的对加法和数乘封闭的子集称为子空间。(不严谨叙述)

向量x1,,xnx_1,\cdots,x_n的所有线性组合的集合称为由x1,,xnx_1,\cdots,x_n张成的子空间(/闭包closure),记作
L=span{x1,,xn}L=span\{x_1,\cdots,x_n\}
生成子空间W的线性无关的向量{u1,,un}\{u_1,\cdots,u_n\}称为子空间W的基,基的个数称为子空间W的维度,即
d=dim(span{u1,,un}d=\dim(span\{u_1,\cdots,u_n\}

Gram-Schmidt正交化
定义投影向量Py(x)=y(yy)1yxP_y(x)=y(y'y)^{-1}y'x,可以将x向量投影到y上来
a1,a2,,ana_1,a_2,\cdots,a_n是向量空间W的一组基,将这组基标准正交化

  1. b1=a1b_1=a_1
    b2=a2Pb1(a2)b_2=a_2-P_{b_1}(a_2)
    bk=akPb1(ak)Pb2(ak)Pbk1(ak)b_k=a_k-P_{b_1}(a_k)-P_{b_2}(a_k)-\cdots-P_{b_{k-1}}(a_k)
    产生正交基
  2. 将这组正交基标准化即得。
    标准正交化matlabB=orth(A)B=orth(A)

矩阵的标量函数

前面介绍的矩阵范数是矩阵的标量函数,下面介绍另外几个:矩阵的二次型,迹,行列式,秩

二次型y(x)=xAxy(x)=x'Ax

一般将A变为对称阵。
一个对称阵A称为
正定矩阵,若xAx>0,x0x'Ax\gt 0,\forall x\neq 0
半正定矩阵,若xAx0,x0x'Ax\ge 0,\forall x\neq 0(也称非负定)

正矩阵:A的所有元素为正,简记为A>0A\gt 0
非负矩阵:A的所有元素非负,简记为A0A\ge 0,
注意也有文件中用上面两个简记号表示正定矩阵和半正定矩阵。

tr(A)=aiitr(A)=\sum a_{ii}

性质

迹的不等式

行列式det(A),A\det(A),|A|

相等关系

不等关系

秩rank,rk

根据系数矩阵秩的大小,矩阵方程Am×nxn×1=bm×1A_{m\times n}x_{n\times 1}=b_{m\times 1},可分为以下三种类型。(n个未知数m个方程)

是否有解不能看未知数个数和方程个数,要比较系数阵和增广矩阵的秩。

每个未知数可以被视为一个自由度,每个方程可以被视为一个限制了一个自由度的约束。行满秩,则每个方程都是独立方程,列满秩,则每个未知数都被涉及到(不存在自由未知数),如参数平差中限定列满秩(保证参数能求出),还要求超定(有多于观测)。

矩阵的秩等于其列空间的维数,等于其行空间的维数。

参考资料

  1. 矩阵分析与应用,张贤达
  2. Invertible matrix,wiki
  3. underdetermined system,overdetermined system,wiki
  4. generlized inverse,wiki