線性代數的基本定理 PDF

線性代數的基本定理
林琦焜
前言: 在此向量都是以行向量來表示。其中 A 是一
個 m × n 矩陣
最近在 American Mathematical
Monthly 閱讀到 Gilbert Strang 探討線
 
性代數之文章, 讀後收穫良多, 尤其幾個圖形 a11 ... a1n
 
實在有教學上之價值。在感動之餘想想何不 A = 
 a21 ... a2n 

am1 . . . amn
動手, 以 Gilbert Strang 之文章為藍本, 同
aij ∈ R, 1 ≤ i ≤ m, 1 ≤ j ≤ n (2)
時把自己讀書與教學之心得將之整理後, 以
與中文之讀者一起分享。
此文主要探討的是 Fredholm Altena- 首先我們將矩陣 A 視為向量。(實際上
tive 定理, 要提醒的是雖然我們僅在有限的矩陣是向量的推廣)
空間上討論, 但實際上都可推廣至無限維空
間, 而這就是泛函分析 (functional analy-
A = 
[A1 , . .. , An ] (3)
sis) 所研究的主題之一。 a1j
 

 a2j 

Aj = .. 1≤j≤n (4)
矩陣的本質: 

 .



要瞭解線性代數, 最直接且最有動機莫 amj
若於從求聯立方程組的解開始。
有了上述之結果, 我們可將 (1) 式的左邊表
為向量的線性組合:
−
→
A−
→
x = b A : Rn → Rm (1)
其中 
a11 ... a1n

x1

−
→   .. 
x = (x1 , x2 · · · xn )T ∈ Rn

a21 ...  . 
a2n 
  
A−
→ 
−
→ x = .. .. ..   . 
 . 

b = (b1 , b2 · · · bm )T ∈ Rm 
 . . . 
 . 
am1 . . . amn xn
1
2 數學傳播十九卷二期民 84 年 6 月
 
x1 乘法有另一個角度的體會, 給定任一矩陣
 . 
= [A1 , . . . , An ]  .. 

 B = [B1 , B2 , · · · Bk ]
xn
−
→
= x1 A1 + · · · + xn An = b (5) Bi 為矩陣 B 之第 i 行向量, 因此矩陣 A 與
矩陣 B 之相乘可表為
 
x1 AB = A[B1 , B2 , · · · Bk ]
 .. 
註 (A): 如果我們將向量 
 .  視為矩
 = [AB1 , AB2 , · · · , ABk ]
xn
陣的話, 則 (5) 式同時也告訴我們, 矩陣乘在
右手邊其運算為行運算。 (同理乘在左手邊則即矩陣 AB 的第 i 行向量 (AB)i 為矩陣 A
為列運算。) 而其法則為乘矩陣 B 的第 i 行向量 ABi 。由 (5) 式知
ABi 要有意義其先決條件為 Bi 為一 n 維行
x1 × (第一行) + x2 × (第二行) + · · ·
向量, 即矩陣 B 為一 n × k 矩陣
+xn × (第 n 行) (6)
B = 
[B1 , B2 , · · · , Bk ]
b11 . . . b1k
 .. .. 
註 (B): 由 (5) 式我們也可略窺 “行 =  .  .  
空間” (column space) 的雛形, 由此角度 bn1 . . . bnk
−
→
而言, 求 A− →x = b 的解, 相當於求所有
−
→ 同理, 矩陣 BC 要有意義為 C 為一 k × l 矩
A1 · · · An 的線性組合正好等於 b , 即求
陣。
(x1 · · · xn ) ∈ Rn 使得  
c11 . . . b1l
−
→  . .. 
C = [C1 , · · · , Cl ] =  .
x1 A1 + · · · + xn An = b  . .  
ck1 . . . ckl
註 (C): (5) 式可幫助我們明白矩陣的
我們現在考慮矩陣之結合律, 由 (5) 式知
結合律, 一般在線性代數的課本是將矩陣視
為線性變換 (linear transformation), 因此 A(BCi ) = A(c1i B1 + · · · + cki Bk )
矩陣的結合律可視為是函數之合成的結合律, = c1i AB1 + · · · + cki ABk
c1i
但這種作法, 對學生而言, 幫助並不大。在這  .. 
= [AB1 , · · · , ABk ]  . 
裡我們希望藉由 (5) 及一些簡單的基本運算  
cki
來証明矩陣的結合律 = [AB1 , · · · , ABk ]Ci
A(BC) = (AB)C。
再次利用 (5) 式可得矩陣之結合律
由(5) 式知向量 A−
→
x 為矩陣 A 之行向量的
線性組合, 利用這個概念, 我們可以對矩陣的 A(BC) = A(B[C1 , · · · , Cl ])
線性代數的基本定理 3
= A[BC1 , · · · , BCl ] 兩邊同時取行列式得

= [A(BC1 ), · · · , A(BCl )] i −
→
(det A)(det[I ←−−
i →
x ]) = det[A←− b ]
= [(AB)C1 , · · · , (AB)Cl ]
= (AB)[C1 , · · · , Cl ] 由 Laplace 展開式或行列式的性質知
= (AB)C
det[I ←−−
i →
x ] = xi , 故
i −
→
det[A←− b ]
註 (D): (5) 式告訴我們的還不僅如此。 xi =
det A
在中學階段就熟知 Cramer 公式, 亦可由此
這就是 Cramer 公式。
式再加點行列式的性質而得, 當然還是從解
聯立方程組開始
−
→
基本定理:
A−
→
x = b
−
→ 習慣上, 我們將行空間 (column space)
此時 A 為一 n × n 矩陣向量, −
→
x , b 則視為
i −
→ 記為 R(A), 明顯地 R(A) ⊆ Rm 。談了
n × 1 矩陣, 為著簡便用符號 [A←− b ] 表示
一 n × n 矩陣, 其中矩陣 A = [A1 · · · An ] 行向量, 行空間自然要提它的孿生兄弟列向
−
→ 量 (row vecter), 列空間 (row space), 記
之第 i 行向量為向量 b 所取代, 即
−
→ −
→ 為 R(AT ) , 另要提的子空間如下
i
[A←− b ] = [A1 · · · Ai−1 , b , Ai+1 , · · · , An ]
N(A) ≡ {−
→
x ∈ Rn |A−
→
x = 0} ⊆ Rn (7)
但由 (5) 式並利用行運算基本上是矩陣乘在
右手邊之原則得 N(AT ) ≡ {−
→
y ∈ Rn |AT −
→
y = 0} ⊆ Rm
(8)
[A1 · · · Ai−1 , A−
→
x , Ai+1 , · · · An ]
底下我們將注意力都集中在這四個子空
= [A1 , · · · Ai−1 , x1 A1 + · · · + xn An , Ai+1 ,
間, 當然讀者可能會問為何要探討這些子空
· · · An ]
= [A1 , · · · Ai−1 , Ai , Ai+1· · · An ] 間, 實際上所有線性代數上的運算與應用皆
1 0 x1 0 0 可經由子空間的瞭解而來, 例如在中學階段
 
0
 1 x2 0 0  所學利用加減消去法, 代入消去法來求聯立
×  .. .. .. .. .. 
.
 . . . . 方程組的解, 就是無形中已使用到子空間的
0 0 xn 0 1 某些特性, 其中最重要的一個就是維數 (di-
= A[I ←−−
i →
x] mension) 的不變性。維數在線性代數中扮演
著極重要的角色。
−
→
因此聯立方程 A−
→
x = b 可改寫為
定理1: (i) dim R(A) = dim R(AT )
i −
→
A[I ←−−
i →
x ] = [A←− b ] (ii) dim R(A) + dim N(A) = n
(i) 式告訴我們行空間 (colum space) 獨立, 因此 dim R(A) = r, 由定理 1 知

與列空間 (row space) 的維數是一樣的, 如 dim N(A) = n − r 。
此的描敘還是抽象了一些, 最好的方式還是
線性代數另一個基本定理如下
以例子來明瞭定理的意義。其實學數學最好
的方法即是從“例子”著手。
定理2: N(A)⊥R(AT )。
例1:
 
這定理告訴我們子空間的正交性 (or-
0 0 0 0 0
  thogonality), 其意義與證明也可從聯立方
0 0 2 0 0
A=



 程組的解來視出端倪。
0 1 0 1 1
  −→ 
B1
0 4 3 4 0 4×5 .. 
A−
→ −
→

x = 
 .  x
經過化簡得 −
→
−
B
→m −
B1 · →
  

0 4 3 ......... 0 0 
..  x 0
...


  .
.  .
 =  .. 

 0 0 2 ....... 0 0 
.
=  .
 3    
A∼
 ...
.....  −
→ − →
 1 1 0 ........ 0 0 
.   Bm · x 0

........................................................................................................
..

...
0 0 0 0 0 ..
...
..
| {z } 取各分量得
3 −
→ − −
→ →
因此 B1 · →
x = ··· = Bn · −
x =0
−
→ −
→
x 與所有列向量 B i , (1 ≤ i ≤ m) 垂直
dim R(A) = dim R(AT ) = 3
dim N(A) = 5 − 3 = 2 −
→ −
→
x ⊥ B i (1 ≤ i ≤ m)
dim N(AT ) = 4 − 3 = 1
−
→
因此 −
→ P
x ⊥ ni=1 bi B i
即−
→x ⊥R(AT ), ∀−
→
x ∈ N(A)
對於一般 m × n 矩陣, 經過行運算 (或
所以 N(A)⊥R(AT )
列運算) 後可容易判別上述的關係式
同理, 取轉置 (transpose) 矩陣我們有
例2: A = [A1 · · · An ] ∼ 定理 2’: N(AT )⊥R(A)。
[B1 · · · Br , 0 · · · 0], {B1 · · · Br } 是線性茲以一個圖形來說明上面二個定理
dim R(AT ) = r −
→
A−
→
xr = b dim R(A) = r
T
R(A )
−→
xr R(A)
列空間 .......................... −
→ 行空間
A−
→ .............................
x =0 b
−
→
x =−
→
x r +−
→
xn
Rn O Rm
A−
→
xn =0
−
→xn N(AT )
N(A)
dim N(A) = n−r dim N(AT ) = m − r
這圖形說明了幾件事實: −
→ −
→
= b +0= b 。
(a) Rn 上的向量 −
→
x 可分解為兩
個互相垂直的向量。 −
→x p 為 (1) 式之特解 (particular solu-
tion) −
→
x 為 (1) 式之均勻解 (homoge-
h
−
→ neous solution) 而 −→xp +−→
xh 為一般解
x =−
→
x r+−
→
x n, −
→
x r ∈ R(AT ), −
→
x n ∈ N(A)
−
→
(general solution), x p 稱為特解是因
(9)
為
或
−
→
x p ⊥−
→
xh , ∀−
→
x h ∈ N(A)。 (10)
Rn = R(AT ) ⊕ N(A)
另外順便一提的是所有均勻解所
實際上此分解是唯一的。
成的空間正好是核空間 (null space)
(b) A 將 Rn 上的任一向量 −
→
x 帶
到行空間 R(A) , 而將核空間 (null N(A) = {−
→
x h ∈ Rn |A−
→
x h = 0}
space) 皆帶到 0 向量。
−
→ 註: 上面(c) 所談的在無窮維空
(c) 若 b 落在行空間 R(A) , 則聯
−
→ 間亦有相類似的結果, 其實這就是
立方程組 A− →
x = b 是可解的。換言
−
→ 泛函分析 (functional analysis) 或積
之, 若 b 與所有 N(AT ) 的向量垂直
−
→ 分方程 (integral equation ) 裡著名的
( b ⊥N(AT )) , 則聯立方程組 A−→x = Fredholm Alternative 定理。
−
→ −
→
b 是可解的。而其解 x 可分解為二
註: 若將A視為一微分算子 (dif-
部份
ferential operator), 則 (c) 所言在微分
−
→x = −
→
xp+− →
xh 方程也有相對應的結果。讀者若有
A x = A( x p + −
−
→ −
→ →
x h ) = A−
→
x p + A−
→
xh 興趣可自行驗證。事實上, 我們所提
的線性代數的基本定理是可直接而現在因為 A 為一線性泛函,
推廣至無窮維空間。 m = 1 且 A 6= 0 , 因此由定理 1 知
如果值域為一維, 即 m = 1 dim R(AT ) = dim R(A) = 1。
A : Rn → R (11) 令−
→
z ∈ R(AT ), −
→ 6 0, 則
z =
則A為一有界線性泛函 (bounded lin- R(AT ) =< −

→
z >= {α−
→
z |α ∈ R}。
ear functional)。由 Riesz 表現定理告由正交投影知
訴我們, A 可表為一內積之形式。 <−→x ,−→z >− →
P(x) = −
→ z
k z k2
Riesz 表現定理: A 為一有界線性泛函所以A(−
→
x ) = A(−
→x r ) = A(P(− →
x ))!
從 Rn 映到 R。 A : Rn → R 有界, 線性。 −
→ −
→
< x, z > −
= A ·→
z
則存在唯一− →y ∈ Rn 使得 k−
→
z k2
< x, −
→z >
= · A(−
→
z)
A(−
→
x ) = (−
→
x,−
→
y) ∀−
→
x ∈ Rn 。 (12) −
→
k z k2
A(−→
z) −
利用上述之結果, 再加上一點 = <−→x, − → ·→
z >
k z k2
正交投影之概念可容易地證明且
A(−→
z )−→
明白 Riesz 表現定理的幾何意義: 令y≡ −
→ z 即為所求。
k z k2
定理證明: (不失一般性可設 A 6= 0 ) 註1: 這個證明方法並沒有維數
的限制, 對一般的內積空間 (inner
∀−
→
x ∈ Rn 可表為
−
→ produt space) 皆可。
x = −
→
x r +−
→
x n, →
−
x r ∈ R(AT ), →
−
x n ∈ N(A)
註2: 因為用到投影的概念,
A(−
→
x ) = A(− →xr +− →
x n ) = A(−
→x r ) + A(−
→
x n)
因此在無形中, 我們已經將最短距
= A(− →x r )。
離或變分學的概念注入這定理中。而
上式告訴我們 A 的值完全由在
事實上這定理本身已具有變分原
R(AT ) 上的值所決定。令 P 為一 Rn
理(variational principle) 的內涵。在
在 R(AT ) 上之正交投影, 則我們有
偏微分方程 (P.D.E) 這定理是弱解
P(−→x ) = P(− →xr+− →x n) = −
→
x r。 (weak solution) 存在的最好證明工
具呢!
因此
A(−
→
x ) = A(−
→
x r ) = A(P(−
→
x ))。
所以, 如果我們能決定P(− →
x )之長像,
−
→
則A( x ) 之形像也跟著決定。最小二乘方:
關於 Fredholm Alternative 定理 −
→
落在同一直線上 (或拋物線上), 即 b 是落
的另一個重要應用便是最小二乘方 (least- −
→
在矩陣 A 之行空間上。這種向量 b 是限制
−
→
square)。由前面之理論知, 若 b 不屬於行過大, 所以我們問問題的方式需略作改變, 即
空間 (column space) 則聯立方程組 (矩陣求向量 −→
x 使得
A 並沒有限制一定是方陣) −
→
A−
→
x − b 之長度為最短 (15)
−
→
A−
→
x = b
或者是求向量 −
→
x 使得
無法求得其解。但在現實情形與應用, 期待一
−
→ −
→ −
→
個非奇異方陣是不實際的。因此我們需要有 η = (A−
→
x − b ) · (A−
→
x − b ) = |A−
→
x − b |2
某些方法以面對殘酷的現實。之值為最小 (16)

我們的問題如下: 試求一直線: b =
C + Dt 或一拋物線 b = C + Dt + Et2 由於 A−
→
x 始終是行向量, 因此上面之問題相
通過 (t1 , b1 ) · · · (tm , bm ) 這些點? 當於是
首先我們將問題表為聯立方程組, 即
−
→

C + Dt1 = b1 求向量 b 至行空間之最短距離? (17)


 ..

. 而眾所周知, 求最短距離當然是與投影 (pro-


+ Dtm = bm −
→
C jection) 有關聯。若 −
→p 為向量 b 在行空間
 C + Dt1 + Et21 = b1 (13) −
→ →
上之投影, 則向量 − →e = b −−

 .. p 為所求, 而
或 .


 且− →e 與行空間垂直, 即 − →e ∈ Ker(AT )。
C + Dtm + Et2m = bm
−
→ →
AT −
→
e = AT ( b − −
p)=0 (18)
乍見之下該聯立方程組為二個未知數 (C, D)
令
(或 3 個未知數 (C, D, E) ) 卻要滿足 m 個 −
→
p = Ax (19)
方程式, 這顯然是要求過多。上面之聯立方
程組可表為

 A−
→ −
→ 因此 (18) 等於告訴我們
x = b
−
→
x = (C, D)t 或 −
→
x = (C, D, E)t −
→
AT Ax = AT b (20)
(14)
而 A 則為一 m × 2 或 m × 3 矩陣, 因此 (20) 式就是通常所說的正則方程式 (normal
−
→
A−
→
x = b 要有解, 唯一可能的是這些點都 equation), 上面之結果可以圖來表示。
列空間........... ......
........ 行空間
(row space) ....
....
.......
.......
....... (column space)
Ax = −
→ −
→
....
.
p p
....
x ............................................................................................................................................................................................................................................................
...
−
→ −
→ − ....
A−
→ b =→
p +−
→
................................................................................................................................................................................................... ....
x = b e
....
RN −q
.........
.
0
RN −
→
e ..........
.........
............
Rq
.......
...
核空間
..
........
..
(null space)
正則方程式亦可由微分而不失一般性可設
來(最短距離當然是與微分有關) (
dim N(Ã) = dim N(ÃT ) = q
(24)
η(−
→
x ) = η(x1 · · · xN ) (21) dim R(Â) = N − q
−
→ −
→
= (A−
→x − b ) · (A−→
x − b)
−
→ → − → − → 因為 Ã 為對稱矩陣, 故存在正交矩
= (AT A− →x − 2AT b ) · −
x + b · b
陣 P , P · PT = I , 使得
!
∂η 0 0
則 = 0 i = 1, · · · N P ÃP = T
(25)
∂xi 0 D
−
→
得 AT A−
→
x = AT b = P T AT (AP ) = (AP )T (AP )
為了方便, 令
−
→
Ã = AT A b̃ = AT b (22)
D 為一 (N − q) × (N − q) 對角矩陣, 即
因此正則方程式可改寫為  
λq+1 0
Ãx = b̃ (23)  .. 
D=
 . 
 (26)
該方程式有利之處在不管原矩陣 0 λN
T
A 是否為方陣, Ã = A A 一定是
且 detD 6= 0 , 我們現在決定矩陣 P 。
個“對稱方陣”, 故前面的 Fredholm-
可設
Alternative 定理現在就可派上用場,
即 (23) 要有解其充分必要條件為
→
− −
→
b̃⊥N(ÃT ) P = [−
→
ϕ 1, · · · −
→
ϕ q , ξ q+1 , · · · , ξ N ] (27)
−
→ −
→ −
→ −
→
ϕ i , 1 ≤ i ≤ q。 ξ j , q + 1 ≤ j ≤ N 為行 = (0, · · · , 0, (Aξq+1)T b , · · · , (AξN )T b )
向量, 其中 (可由 (24) 式看出來)
比較各座標知
span{−
→
ϕ1 ···−
→
ϕ q } = Ker(A)
 λ z = A−
→ − →

i i ξ i· b q+1≤i≤N
從 (24) 可得 z
1 · · · zq 則為任意數
(33)
AP = [(AP )1 , · · · , (AP )q , (AP )q+1, · · · , (AP )N ]
−
→ −
→ 故待求之x可表為
= [A−→ϕ 1 · · · A−→
ϕ q , A ξ q+1 , · · · , A ξ N ] q N −
→ − →
−
→ −
→
X
−
→ X (A ξ i · b ) −
→
= [0, · · · 0, A ξ q+1 , · · · , A ξ N ] (28) x= zi ϕ i + ξ i (34)
i=1 i=q+1 λ i
直接檢驗可得
因此再一次由 (24) 可知 −
→
AT Ax = AT b


 (AP )i · (AP )j = (AP )Ti (AP )j =0 如果取


 q
 i 6= j i = j ≤ q −
→ → X−
− → → −
bR = b − ( b ·−
ϕ i )→


 ϕi (35)
j=1






 (AP )j · (AP )j = (AP )Tj (AP )j = λj 則可得


j>q
(29) 引理: Ax = bR 。
而且綜合上面之討論, 我們整理如
h i⊥ −
→ −
→ 下:
Ker(AT ) = [A ξ q+1 , · · · , A ξ N ] −
→
方程式 A−
→
x = b 有解之充分必要條
= [(AP )q+1, · · · , (AP )N ]
件為
(30)
定理: (Fredholm Alternative)
−
→
方程組 A− →x = b 有解之充分必
現在定義 −
→
要條件為 b ∈ Ker(AT )⊥ , 而且其解
−
→ 可表為
z = PT−
→
x = (z1 · · · zN )T (31) q −
→ − →
N
X
−
→ X (A ξ i · b ) −
→
x= zi ϕ i + ξi
故由正則方程式 (28),(29) 知 i=1 i=q+1 λi
! −
→
0 0 −
→ 其中 z1 · · · zq 為任意常數。如果 b =
z (32) −
→
0 D bR ,則存在唯一− →w ∗ ∈ Ker(AT )⊥ 使
= P T ÃP − →z = P T AT AP P T − → −
→
x 得 A−
→
w ∗ = b R。
−
→ −
→
= P (A A→
T T −
x ) = P A b = (AP )T b
T T
−
→
= (0, · · · , 0, Aξq+1, · · · , AξN )T b 參考資料
1. Gilbert Strang, The Fundamental The- Jovanovich (1988).

orm of Linear Algebra American, 3. Gilbert Strang, Introduction to Linear
Mathematical Monthly, 100 (1993), 848 Algebra, Wellesley - Cambridge Press
- 855.
(1993).
2. Gilbert Strang, Linear Algebra and Its
Applications, 3rd ed., Harcourt Brace —本文作者任教於成功大學數學系—

線性代數的基本定理 PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

線性代數的基本定理 PDF

Uploaded by

Copyright:

Available Formats

線性代數的基本定理

要瞭解線性代數, 最直接且最有動機莫 amj

= A[BC1 , · · · , BCl ] 兩邊同時取行列式得

(i) 式告訴我們行空間 (colum space) 獨立, 因此 dim R(A) = r, 由定理 1 知

則A為一有界線性泛函 (bounded lin- R(AT ) =< −

某些方法以面對殘酷的現實。之值為最小 (16)

1. Gilbert Strang, The Fundamental The- Jovanovich (1988).

You might also like

線性代數的基本定理 PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

線性代數的基本定理 PDF

Uploaded by

Copyright:

Available Formats

線性代數的基本定理

要瞭解線性代數, 最直接且最有動機莫 amj

= A[BC1 , · · · , BCl ] 兩邊同時取行列式得

(i) 式告訴我們行空間 (colum space) 獨立, 因此 dim R(A) = r, 由定理 1 知

則A為 一 有 界 線 性 泛 函 (bounded lin- R(AT ) =< −

某些方法以面對殘酷的現實。 之值為最小 (16)

1. Gilbert Strang, The Fundamental The- Jovanovich (1988).

You might also like

則A為一有界線性泛函 (bounded lin- R(AT ) =< −

某些方法以面對殘酷的現實。之值為最小 (16)