- 前言
- 实对称矩阵
- 正交对角化
- 二次型
- 正定矩阵
- 实对称矩阵的正定判断条件
- 一个常见的半正定矩阵
- 后记
终于快到矩阵分解了。在矩阵分解前,最后一个内容是实对称矩阵,二次型和正定矩阵。这三个概念与矩阵分解相关。
实对称矩阵对于矩阵 A ∈ R n × n A\in R^{n\times n} A∈Rn×n,如果 A T = A A^T=A AT=A,则称 A A A为实对称矩阵。
实对称矩阵不同特征值的特征向量正交,n重特征值有n个线性无关的特征向量。因此实对称矩阵必然能够对角化。
实对称矩阵是 n × n n\times n n×n矩阵能够正交对角化的充分必要条件。
正交对角化如果存在一个正交矩阵 Q Q Q,使得方阵 A = Q Λ Q − 1 = Q Λ Q T A=Q\Lambda Q^-1=Q\Lambda Q^T A=QΛQ−1=QΛQT能够对角化,称为正交对角化。
能够正交对角化的矩阵都是对称矩阵。 证明: A = Q Λ Q T A T = Q Λ T Q T = Q Λ Q T = A A=Q\Lambda Q^T \\ A^T=Q\Lambda^T Q^T=Q\Lambda Q^T=A A=QΛQTAT=QΛTQT=QΛQT=A
二次型A A A是实对称矩阵,将一个变量满足 f ( x ) = x T A x f(x)=x^TAx f(x)=xTAx函数称为二次型。
对于 f ( x ) = x T A x f(x)=x^TAx f(x)=xTAx,替换变量 x = P y , f ( x ) = f ( P y ) = y T P T A P y x=Py,f(x)=f(Py)=y^TP^TAPy x=Py,f(x)=f(Py)=yTPTAPy,而 A A A是实对称矩阵,因此存在正交矩阵 Q , f ( Q y ) = y T Λ y Q,f(Qy)=y^T\Lambda y Q,f(Qy)=yTΛy,使得二次型化为标准型。
正定矩阵广义的正定矩阵:对于矩阵 A ∈ R n × n A\in R^{n\times n} A∈Rn×n,函数 f ( x ) = x T A x > 0 f(x)=x^TAx>0 f(x)=xTAx>0对任意非零向量 x ∈ R n x\in R^n x∈Rn都成立,则称 A A A为正定矩阵。如果 f ( x ) = x T A x ≥ 0 f(x)=x^TAx\ge0 f(x)=xTAx≥0,则称 A A A为半正定矩阵。
狭义的正定矩阵:对于对称矩阵 A ∈ R n × n A\in R^{n\times n} A∈Rn×n,函数 f ( x ) = x T A x > 0 f(x)=x^TAx>0 f(x)=xTAx>0对任意非零向量 x ∈ R n x\in R^n x∈Rn都成立,则称 A A A为正定矩阵。如果 f ( x ) = x T A x ≥ 0 f(x)=x^TAx\ge0 f(x)=xTAx≥0,则称 A A A为半正定矩阵。也把这种正定矩阵称为对称正定矩阵。
实对称矩阵的正定判断条件如果实对称矩阵的特征值都大于0,则是对称正定矩阵;如果特征值都非负,则是对称半正定矩阵。
证明: f ( x ) = x T A x Q Q T = E x = Q y f ( x ) = f ( Q y ) = y T Q T A Q y = y T Λ y = ∑ i = 1 n λ i y i 2 i f λ i > 0 , f ( x ) > 0 i f λ i ≥ 0 , f ( x ) ≥ 0 f(x)=x^TAx \\ QQ^T=E \\ x=Qy\\ f(x)=f(Qy)=y^TQ^TAQy=y^T\Lambda y=\sum_{i=1}^n \lambda_i y_i^2 \\ if \quad \lambda_i>0,f(x)>0 \\ if \quad \lambda_i\ge0,f(x)\ge 0\\ f(x)=xTAxQQT=Ex=Qyf(x)=f(Qy)=yTQTAQy=yTΛy=i=1∑nλiyi2ifλi>0,f(x)>0ifλi≥0,f(x)≥0
一个常见的半正定矩阵对于任意矩阵 A ∈ R m × n A\in R^{m\times n} A∈Rm×n,矩阵 A T A A^TA ATA是半正定矩阵。
证明: x T A T A x = ( A x ) T A x = ( A x ) ⋅ ( A x ) = ∣ ∣ A x ∣ ∣ 2 2 ≥ 0 x^TA^TAx=(Ax)^TAx=(Ax)\cdot(Ax)=||Ax||^2_2\ge0 xTATAx=(Ax)TAx=(Ax)⋅(Ax)=∣∣Ax∣∣22≥0
如果 A ∈ R m × n A\in R^{m\times n} A∈Rm×n列满秩,则 A T A A^TA ATA是正定矩阵。
证明: A x = 0 → A T A x = 0 A T A x = 0 → x T A T A x = 0 → ∣ ∣ A x ∣ ∣ 2 2 = 0 → A x = 0 ∴ N U L ( A ) = N U L ( A T A ) ∵ d i m N U L ( A ) + r a n k ( A ) = n ∴ r a n k ( A T A ) = r a n k ( A ) r a n k ( A ) = n , d i m N U L ( A ) = 0 ∴ ∀ x ≠ 0 , A x ≠ 0 ∴ ∣ ∣ A x ∣ ∣ 2 2 > 0 i . e . x T A T A x > 0 Ax=0 \to A^TAx=0 \\ A^TAx=0 \to x^TA^TAx=0 \to ||Ax||^2_2=0\to Ax=0 \\ \therefore NUL(A)=NUL(A^TA) \\ \because dimNUL(A)+rank(A)=n \\ \therefore rank(A^TA)=rank(A) \\ \quad \\ rank(A)=n,dimNUL(A)=0 \\ \therefore \forall x\ne 0, A x\ne0 \\ \therefore ||Ax||_2^2>0 \\ \quad \\ i.e. \quad x^TA^TAx>0 Ax=0→ATAx=0ATAx=0→xTATAx=0→∣∣Ax∣∣22=0→Ax=0∴NUL(A)=NUL(ATA)∵dimNUL(A)+rank(A)=n∴rank(ATA)=rank(A)rank(A)=n,dimNUL(A)=0∴∀x=0,Ax=0∴∣∣Ax∣∣22>0i.e.xTATAx>0
后记线性代数的矩阵性质部分大概就记录完了。下一篇就进入到了矩阵计算的内容——矩阵分解。