在03节,矩阵乘法是沿着解方程这个思路来理解的,其主要讨论的是 E E E和 A A A间的矩阵乘法,矩阵乘法可不局限于消元矩阵 E E E与系数矩阵 A A A之间的运算,要计算矩阵乘积,还有以下求解方法:
一、矩阵乘法的四种理解角度 1.1 逐元素(选一行选一列,对应相乘求和)请注意!!是行乘列,不是列乘行。逐元素是按照"行向量 ⋅ \cdot ⋅列向量"点乘的方式获取各个位置的元素,如结果矩阵 C C C元素 c i j c_{ij} cij可以按照这样的方式计算: 有矩阵 A A A和 B B B: A = [ a 11 a 12 ⋯ a 1 p a 21 a 22 ⋯ a 2 p ⋮ ⋮ ⋱ ⋮ a n 1 a n 2 ⋯ a n p ] B = [ b 11 b 12 ⋯ b 1 m b 21 b 22 ⋯ b 2 m ⋮ ⋮ ⋱ ⋮ b p 1 b p 2 ⋯ b p m ] A=\begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1p}\\ a_{21}&a_{22}&\cdots&a_{2p}\\ \vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{np} \end{bmatrix}\quad B=\begin{bmatrix} b_{11}&b_{12}&\cdots&b_{1m}\\ b_{21}&b_{22}&\cdots&b_{2m}\\ \vdots&\vdots&\ddots&\vdots\\ b_{p1}&b_{p2}&\cdots&b_{pm} \end{bmatrix} A= a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1pa2p⋮anp B= b11b21⋮bp1b12b22⋮bp2⋯⋯⋱⋯b1mb2m⋮bpm 取 A A A的第 i i i行和 B B B的第 j j j列: A i ∗ = [ a i 1 a i 2 ⋯ a i p ] B ∗ j = [ b 1 j b 2 j ⋮ b p j ] A_{i*}=\begin{bmatrix}a_{i1} a_{i2}\cdots a_{ip}\end{bmatrix}\quad B_{*j}=\begin{bmatrix} b_{1j}\\ b_{2j}\\ \vdots\\ b_{pj} \end{bmatrix} Ai∗=[ai1ai2⋯aip]B∗j= b1jb2j⋮bpj 将行向量和列向量进行点乘运算,得到一个数字 c i j c_{ij} cij: c i j = A i ∗ ⋅ B ∗ j = ∑ k = 1 p a i k b k j c_{ij}=A_{i*}\cdot B_{*j}=\sum_{k=1}^{p}a_{ik}b_{kj} cij=Ai∗⋅B∗j=k=1∑paikbkj 其中 A i ∗ A_{i*} Ai∗表示A第 i i i行,是一个行向量; B ∗ j B_{*j} B∗j则表示第 j j j列,是一个列向量。点乘的结果是一个数,即 c i j c_{ij} cij。!!矩阵乘法就是行向量乘以列向量!!列乘以行得到的是一个大面积矩阵。
1.2 列向量(左侧看成列向量,右侧一列是看成列向量的组合系数)A B AB AB乘积的每一列逐列给出。 C = A B C=AB C=AB,C的每一列的结果由以下方程给出:
- 左矩阵看成很多个列向量
- 右矩阵看成很多个列向量组合系数
- 按系数组合列向量对应结果的一列
为了方便说明,举个简单的例子: A = [ 1 2 3 4 5 6 7 8 9 ] B = [ 10 11 12 13 14 15 16 17 18 ] A=\begin{bmatrix} 1&2&3\\ 4&5&6\\ 7&8&9\\ \end{bmatrix}\quad B=\begin{bmatrix} 10&11&12\\ 13&14&15\\ 16&17&18\\ \end{bmatrix} A= 147258369 B= 101316111417121518
结果第一列: C ∗ 1 = 10 [ 1 4 7 ] + 13 [ 2 5 8 ] + 16 [ 3 6 9 ] = [ 87 201 318 ] C_{*1}=10 \begin{bmatrix}1\\4\\7\end{bmatrix} +13\begin{bmatrix} 2\\5\\8 \end{bmatrix}+16\begin{bmatrix} 3\\6\\9\end{bmatrix}=\begin{bmatrix}87\\201\\318\end{bmatrix} C∗1=10 147 +13 258 +16 369 = 87201318 结果第二列: C ∗ 2 = 11 [ 1 4 7 ] + 14 [ 2 5 8 ] + 17 [ 3 6 9 ] = [ 90 216 342 ] C_{*2}=11 \begin{bmatrix}1\\4\\7\end{bmatrix} +14\begin{bmatrix} 2\\5\\8 \end{bmatrix}+17\begin{bmatrix} 3\\6\\9\end{bmatrix}=\begin{bmatrix}90\\216\\342\end{bmatrix} C∗2=11 147 +14 258 +17 369 = 90216342 结果第三列: C ∗ 3 = 12 [ 1 4 7 ] + 15 [ 2 5 8 ] + 18 [ 3 6 9 ] = [ 96 231 366 ] C_{*3}=12 \begin{bmatrix}1\\4\\7\end{bmatrix} +15\begin{bmatrix} 2\\5\\8 \end{bmatrix}+18\begin{bmatrix} 3\\6\\9\end{bmatrix}=\begin{bmatrix}96\\231\\366\end{bmatrix} C∗3=12 147 +15 258 +18 369 = 96231366 组合起来: A B = C = [ C ∗ 1 C ∗ 2 C ∗ 3 ] = [ 84 90 96 201 216 231 318 342 366 ] AB=C=\begin{bmatrix}C_{*1}&C_{*2}&C_{*3}\end{bmatrix}=\begin{bmatrix} 84&90&96\\ 201&216&231\\ 318&342&366 \end{bmatrix} AB=C=[C∗1C∗2C∗3]= 842013189021634296231366
1.3 行向量(右侧看成行向量,左侧每行看成是行的线性组合系数)A = [ 1 2 3 4 5 6 7 8 9 ] B = [ 10 11 12 13 14 15 16 17 18 ] A=\begin{bmatrix} 1&2&3\\ 4&5&6\\ 7&8&9\\ \end{bmatrix}\quad B=\begin{bmatrix} 10&11&12\\ 13&14&15\\ 16&17&18\\ \end{bmatrix} A= 147258369 B= 101316111417121518 A B AB AB乘积的每一列逐行给出。 C = A B C=AB C=AB,C的每一列的结果由以下方程给出:
- 右矩阵看成很多个行向量
- 左矩阵看成很多个行向量组合系数
- 按系数组合行向量对应结果的一行
还是(1.2)的 A A A B B B为例: 第一行: C 1 ∗ = 1 [ 10 11 12 ] + 2 [ 13 14 15 ] + 3 [ 16 17 18 ] = [ 84 90 96 ] C_{1*}=1\begin{bmatrix}10&11&12\end{bmatrix}+2\begin{bmatrix}13&14&15\end{bmatrix}+3\begin{bmatrix}16&17&18\end{bmatrix}=\begin{bmatrix}84&90&96\end{bmatrix} C1∗=1[101112]+2[131415]+3[161718]=[849096] 第二行: C 2 ∗ = 4 [ 10 11 12 ] + 5 [ 13 14 15 ] + 6 [ 16 17 18 ] = [ 201 209 231 ] C_{2*}=4\begin{bmatrix}10&11&12\end{bmatrix}+5\begin{bmatrix}13&14&15\end{bmatrix}+6\begin{bmatrix}16&17&18\end{bmatrix}=\begin{bmatrix}201&209&231\end{bmatrix} C2∗=4[101112]+5[131415]+6[161718]=[201209231] 第三行: C 3 ∗ = 7 [ 10 11 12 ] + 8 [ 13 14 15 ] + 9 [ 16 17 18 ] = [ 318 342 366 ] C_{3*}=7\begin{bmatrix}10&11&12\end{bmatrix}+8\begin{bmatrix}13&14&15\end{bmatrix}+9\begin{bmatrix}16&17&18\end{bmatrix}=\begin{bmatrix}318&342&366\end{bmatrix} C3∗=7[101112]+8[131415]+9[161718]=[318342366] 组合起来: A B = C = [ C 1 ∗ C 2 ∗ C 3 ∗ ] = [ 84 90 96 201 216 231 318 342 366 ] AB=C=\begin{bmatrix}C_{1*}\\C_{2*}\\C_{3*}\end{bmatrix}=\begin{bmatrix} 84&90&96\\ 201&216&231\\ 318&342&366 \end{bmatrix} AB=C= C1∗C2∗C3∗ = 842013189021634296231366
1.4 列乘行(列矩阵和行矩阵相乘)A = [ 1 2 3 4 5 6 7 8 9 ] B = [ 10 11 12 13 14 15 16 17 18 ] A=\begin{bmatrix} 1&2&3\\ 4&5&6\\ 7&8&9\\ \end{bmatrix}\quad B=\begin{bmatrix} 10&11&12\\ 13&14&15\\ 16&17&18\\ \end{bmatrix} A= 147258369 B= 101316111417121518 请注意!!是列乘行,不是行乘列。列乘行矩阵加法给出。还是以(2.1)的 A A A B B B为例。 矩阵1: M 1 = [ 1 4 7 ] [ 10 11 12 ] = [ 10 11 12 40 44 48 70 77 84 ] M1=\begin{bmatrix}1\\4\\7\end{bmatrix}\begin{bmatrix}10&11&12\end{bmatrix}=\begin{bmatrix} 10&11&12\\ 40&44&48\\ 70&77&84\end{bmatrix} M1= 147 [101112]= 104070114477124884 矩阵2: M 2 = [ 2 5 6 ] [ 13 14 15 ] = [ 26 28 30 65 70 75 78 84 90 ] M2=\begin{bmatrix}2\\5\\6\end{bmatrix}\begin{bmatrix}13&14&15\end{bmatrix}=\begin{bmatrix} 26&28&30\\ 65&70&75\\ 78&84&90\end{bmatrix} M2= 256 [131415]= 266578287084307590 矩阵3: M 3 = [ 3 6 9 ] [ 16 17 18 ] = [ 48 51 54 96 102 108 144 153 162 ] M3=\begin{bmatrix}3\\6\\9\end{bmatrix}\begin{bmatrix}16&17&18\end{bmatrix}=\begin{bmatrix} 48&51&54\\ 96&102&108\\ 144&153&162\end{bmatrix} M3= 369 [161718]= 48961445110215354108162 组合起来: A B = C = M 1 + M 2 + M 3 = [ 84 90 96 201 216 231 318 342 366 ] AB=C=M1+M2+M3=\begin{bmatrix} 84&90&96\\ 201&216&231\\ 318&342&366 \end{bmatrix} AB=C=M1+M2+M3= 842013189021634296231366
1.5 分块矩阵为了计算方便,可将矩阵分为多份,再进行矩阵乘法。 [ A 11 A 12 A 21 A 22 ] [ B 11 B 12 B 21 B 22 ] = [ A 11 B 11 + A 12 B 21 A 11 B 12 + A 12 B 22 A 21 B 22 + A 11 B 21 A 21 B 12 + A 22 B 22 ] \begin{bmatrix} A_{11}&A_{12}\\ A_{21}&A_{22} \end{bmatrix} \begin{bmatrix} B_{11}&B_{12}\\ B_{21}&B_{22} \end{bmatrix}= \begin{bmatrix} A_{11}B_{11}+A_{12}B_{21}&A_{11}B_{12}+A_{12}B_{22}\\ A_{21}B_{22}+A_{11}B_{21}&A_{21}B_{12}+A_{22}B_{22} \end{bmatrix} [A11A21A12A22][B11B21B12B22]=[A11B11+A12B21A21B22+A11B21A11B12+A12B22A21B12+A22B22]划分规则:能进行矩阵乘法。
二、方阵的逆 2.1 定义方阵 A A A可能有逆,也可能没逆。如果 A A A是有逆的,那么必有: A − 1 A = I = A A − 1 A^{-1}A=I=AA^{-1} A−1A=I=AA−1对于非方阵,那么左逆不等于右逆,不符合行列要求。
2.2 可逆条件以 2 × 2 2\times2 2×2矩阵 A A A为例子,如: A = [ 1 2 2 6 ] A=\begin{bmatrix}1&2\\2&6\end{bmatrix} A=[1226] 如果矩阵是可逆的,那么必然能够找到一个矩阵对其进行变换,得到一个单位矩阵: [ 1 3 2 6 ] [ ∗ ∗ ∗ ∗ ] = [ 1 0 0 1 ] \begin{bmatrix}1&3\\2&6\end{bmatrix}\begin{bmatrix}*&*\\*&*\end{bmatrix}=\begin{bmatrix}1&0\\0&1\end{bmatrix} [1236][∗∗∗∗]=[1001]这时候,从列向量的角度容易知道,这个矩阵不存在,因为列向量的线性组合是共线的,其线性组合永远都在一条直线上。
可逆等价定义:仅有零向量
X
X
X使得
A
X
=
0
AX=0
AX=0成立,还是以上面作为例子:
A
X
=
[
1
3
2
6
]
[
∗
∗
]
=
[
0
0
]
AX=\begin{bmatrix}1&3\\2&6\end{bmatrix}\begin{bmatrix}*\\*\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix}
AX=[1236][∗∗]=[00] 直观上讲,因为
X
=
[
0
0
]
X=\begin{bmatrix}0\\0\end{bmatrix}
X=[00]始终成立,不可能要求所有的矩阵都是可逆的,所以作为条件它是应该一个非零向量;矩阵比较简单,容易找到两个向量
X
X
X使等式成立:
X
=
[
3
−
1
]
X
=
[
−
3
1
]
X=\begin{bmatrix}3\\-1\end{bmatrix}\quad X=\begin{bmatrix}-3\\1\end{bmatrix}
X=[3−1]X=[−31]理论上说,假设我们的
X
X
X是一个非零向量,且存在可逆矩阵,那么:
A
−
1
A
X
=
I
X
=
X
=
0
A^{-1}AX=IX=X=0
A−1AX=IX=X=0与假设矛盾,所以,
X
X
X必须是一个零向量。
一个方阵,如果具有可逆矩阵,那么其满足: A A − 1 = I AA^{-1}=I AA−1=I还是简单的 2 × 2 2\times2 2×2矩阵 A = [ 1 3 2 7 ] A=\begin{bmatrix}1&3\\2&7\end{bmatrix} A=[1237],求其可逆矩阵 A − 1 = [ a c b d ] A^{-1}=\begin{bmatrix}a&c\\b&d\end{bmatrix} A−1=[abcd]。 [ 1 3 2 7 ] [ a c b d ] = [ 1 0 0 1 ] \begin{bmatrix}1&3\\2&7\end{bmatrix}\begin{bmatrix}a&c\\b&d\end{bmatrix}=\begin{bmatrix}1&0\\0&1\end{bmatrix} [1237][abcd]=[1001]按照列向量的观点看待上述问题,上述的矩阵等价于求解两个线性方程: [ 1 3 2 7 ] [ a b ] = [ 1 0 ] [ 1 3 2 7 ] [ c d ] = [ 0 1 ] \begin{bmatrix}1&3\\2&7\end{bmatrix}\begin{bmatrix}a\\b\end{bmatrix}=\begin{bmatrix}1\\0\end{bmatrix} \quad \begin{bmatrix}1&3\\2&7\end{bmatrix}\begin{bmatrix}c\\d\end{bmatrix}=\begin{bmatrix}0\\1\end{bmatrix} [1237][ab]=[10][1237][cd]=[01]Jordan观察到,上述两线性方程可以放在一起来解,增广矩阵的“增”就是系数矩阵 A A A增加了两列。 [ 1 3 1 0 2 7 0 1 ] → [ 1 3 1 0 0 1 − 2 1 ] \begin{bmatrix}1&3&1&0\\2&7&0&1\end{bmatrix}\rightarrow \begin{bmatrix}1&3&1&0\\0&1&-2&1\end{bmatrix} [12371001]→[10311−201]进行到这一步,高斯就停止进行变换了,但是Jordan再次继续向上消元,使其系数矩阵 A A A变成单位矩阵 I I I: [ 1 3 1 0 0 1 − 2 1 ] → [ 1 0 1 0 0 1 7 − 3 ] \begin{bmatrix}1&3&1&0\\0&1&-2&1\end{bmatrix}\rightarrow \begin{bmatrix}1&0&1&0\\0&1&7&-3\end{bmatrix} [10311−201]→[1001170−3]好家伙,Jordan将矩阵 [ A ∣ I ] = [ I ∣ A − 1 ] [A|I]=[I|A^{-1}] [A∣I]=[I∣A−1],这是为什么?我们在消元的过程中,相当于对 [ A ∣ I ] [A|I] [A∣I]做行变换 E E E: E [ A ∣ I ] = [ E A E I ] = [ E A E ] = [ I ? ] E[A|I]=[EA\quad EI]=[EA\quad E]=[I \quad?] E[A∣I]=[EAEI]=[EAE]=[I?] 因为消元过程使得 E A = I EA=I EA=I,所以, E = A − 1 E=A^{-1} E=A−1,容易得到 ? ? ?处就是系数矩阵 A A A的逆。
小结本小结首先从四个角度理解了矩阵乘法运算;然后介绍了矩阵可逆的定义和条件,最后从行向量的观点引出了Gause-Jordan方法求逆矩阵的方法。