Chapter 1
Vectors in R n
我們藉由大家熟悉的向量來介紹向量間運算的性質. 要注意我們不再去定義何謂向量, 而是著重於如何用這些已知的向量性質, 利用較抽象的方法來推導出一些幾何的性質.
1.1. 坐標平面中的向量
本節針對對抽象數學論述不熟悉的同學, 想利用大家熟悉坐標平面的向量慢慢引導進入 狀況. 也因此本節在細節的說明特別繁瑣. 若對坐標平面的向量相當清楚的同學, 可放心略 過此節.
在坐標平面中的向量, 我們都可用 (a, b) 來表示, 其中 a, b∈ R (我們用 R 來表示所有實 數所成的集合, 所以 a, b∈ R 表示 a,b 屬於實數, 也就是說 a,b 皆為實數). 意思就是說如果 你在坐標平面中任給一點 P, 然後從 P 點開始往水平方向走 a 單位 (a > 0 時往右; a < 0 時 往左), 再沿鉛直方向走 b 單位 (b > 0 時往上; b < 0 時往下), 最後到達的點若記為 Q. 那麼 從 P 點開始到 Q 點為止的這一個向量就可用 (a, b) 來表示, 記為−→
PQ = (a, b).
用坐標來表示一個向量 (即用 (a, b) 這種方法) 有許多好處, 例如大家很容易理解: 當兩 個向量 (a, b) 和 (c, d) 相等時 (即 (a, b) = (c, d)), 這表示 a = c 且 b = d; 從這觀點, 若用點 來表示向量時就較麻煩, 因為如果 P, P′, Q, Q′ 為平面中四個點 −→
PQ =−−→
P′Q′ 並不代表 P 和 P′ 為同一點且 Q 和 Q′ 為同一點. 不過若已知 P = P′ , 則可得 Q = Q′. 反之若 Q = Q′ 則可得 P = P′. (我們說明一下這裡符號的使用: 因為 P, P′ 皆為 “點” 而不是 “數”, 所以這裡 P = P′ 這個等號表示同一 “點” 而不是同一 “數”). 上面這個論述可用剛才定義−→
PQ 的方法驗證, 這 裡就不再驗證. 基於符號的方便性, 當我們要用符號來表示一個向量時, 除非已知此向量為 特定兩點所決定的向量, 通常會僅用 u, v 這類的粗體字符號來表示. 一般來說我們用R2 來 表示坐標平面上的向量所成的集合, 所以若我們說 v∈ R2, 就表示 v 是坐標平面上的一個向 量, 也就是說可以找到 a, b∈ R 使得 v = (a,b).
坐標表示法的另一個好處是很容易幫助我們定義向量的加法 (addition) 以及係數積 (scalar multiplication).
1
Definition 1.1.1. 令 u = (a1, a2), v = (b1, b2)∈ R2 以及 r∈ R. 我們定義 u + v = (a1+ b1, a2+ b2) and ru = (ra1, ra2).
要注意這裡所謂的定義 (即 definition) 指的是規定, 也就是說我們規定向量必須這樣相 加及乘以常數. 當然了你也可以自行規定一套向量加法的規則, 不過一般在數學上的定義都 有其必要性. 通常一個定義對理論推導或實用上都會有相當的幫助. 例如這一個定義與我們 直觀上認為若 P, Q, R 為坐標平面上三點, 則−→
PQ +−→
QR =−→
PR 相吻合. 這是因為: 假設 P, Q, R 三點的坐標分別為 P(x1, y1), Q(x2, y2), R(x3, y3) (注意: 為了區分點和向量的坐標表示法, 當 我們提到點的坐標時都會加上該點的代號), 則
−→PQ = (x2− x1, y2− y1),−→
QR = (x3− x2, y3− y2),−→
PR = (x3− x1, y3− y1).
然而依前面向量加法的定義確實
−→PQ +−→
QR = ((x2− x1) + (x3− x2), (y2− y1) + (y3− y2)) = (x3− x1, y3− y1) .
故得 −→
PQ +−→
QR =−→
PR. (1.1)
一個定義一定要清楚明確, 例如若 u = (1, 2), v = (3, 4) 且 r = 5, 由 Definition 1.1.1 我 們知 u + v = (1 + 3, 2 + 4) = (4, 6) 且 ru = (5× 1,5 × 2) = (5,10). 不過我們絕對不能用: 若 u = (1, 2), v = (3, 4) 且 r = 5, 則定義 u + v = (1 + 3, 2 + 4) = (4, 6) 且 ru = (5×1,5×2) = (5,10) 這樣的說法來定義向量的加法及係數積. 因為這樣的說法只是定義出兩個特殊的向量的 加法以及和一特殊實數的乘積, 不能依這特例要求別人 “依此類推”. 這就是當初定義時用 a1, a2, b1, b2, r 這些符號來代替具體數字的用意. 另外要注意在 Definition 1.1.1 中我們沒有 提 rv 的定義, 不過當初既然 u 已表成任意 R2 上的向量, 定義 ru 已足夠, 所以不必再去定 rv. 最後要強調的是: 這裡我們並不是定義兩向量的乘法, 而是定義實數和向量相乘, 所以我 們稱為係數積 (scalar multiplication) 而不能說是向量的乘法.
有了定義之後, 我們就需依定義處理相關問題, 但通常直接依定義處理較繁複, 我們可依 定義推導出一些性質, 利用這些性質簡化處理程序. 例如在微積分, 我們定義出一個函數在 某一點的極限後, 若每次都得依定義處理極限問題論證起來很複雜; 但當我們利用定義推導 出一些極限的性質後, 用這些性質處理極限問題就簡單方便多了. 所以在定義之後我們會有 一些定理 (Proposition 或 Theorem) 來論證一些依定義可得的性質, 以方便我們處理更進一 步的問題. 以下就是要談向量加法及係數積有關的性質.
Proposition 1.1.2. 對於R2 上的向量, 我們有以下的性質:
(1) 對任意 u, v∈ R2, 皆有 u + v = v + u.
(2) 對任意 u, v, w∈ R2, 皆有 (u + v) + w = u + (v + w).
(3) 存在一向量 O∈ R2 滿足對任意 u∈ R2 皆有 O + u = u.
(4) 對任意 u∈ R2 皆可找到 u′∈ R2 滿足 u + u′= O.
(5) 對任意 r, s∈ R 以及 u ∈ R2, 皆有 r(su) = (rs)u.
1.1. 坐標平面中的向量 3
(6) 對任意 r, s∈ R 以及 u ∈ R2, 皆有 (r + s)u = ru + su.
(7) 對任意 r∈ R 以及 u,v ∈ R2 皆有 r(u + v) = ru + rv.
(8) 對任意 u∈ R2, 皆有 1u = u.
通常一個定理敘述完就要證明, 不過在這裡我們建議先緩一緩. 對同學來說了解定理說 些什麼比起證明來得重要. 在這裡我們就一一說明一下這個定理說些什麼.
(1) 敘述的是所謂向量加法的交換性. 它告訴我們在處理向量加法時可以依方便交換順 序. 或許同學覺得這個很自然為何還要證明. 事實上只要是定義未提的事情都要證明, 不能 因為覺得自然而不去處理. 這裡大家會覺得自然是因為大家對實數的加法運算很清楚, 不過 數學上是存在許多 “抽象” 的數系它的加法是不能交換的. 所以經由證明不只讓我們確認事 情是對的, 也能幫助我們釐清事情是對的其背後的主要因素.
(2) 說的就是所謂的結合律, 它依然是因為實數加法的性質而成立. 這裡 (u + v) + w 是 說先將 u 和 v 相加後所得的向量再和 w 相加. 這樣所得的向量和先將 v 和 w 相加後再和 u 相加會是同樣的向量. 這裡雖然也是談向量加法的順序問題, 不過和 (1) 所談的順序是兩 回事, 大家應該要分清楚.
(3) 談的就是所謂的零向量, 零向量的特點就是加上任何向量都不動. 為什麼要特別談零 向量的存在性? 這就好比在實數上若沒有零的概念就沒有減法一樣, 在向量的運算上是相當 重要的. 尤其以後要用抽象的方式談向量系統時零向量的存在性更不容忽視.
(4) 談的就是所謂的反向量, 要注意需有零向量的存在才能談反向量. 而且要區分清楚這 裡的敘述是給了 u 後可找到 u′ 使得 u + u′= O. 這裡 u′ 是會隨著 u 而改變, 而不是一個固 定的向量和所有的向量加起來會是零向量. 數學的敘述要弄清楚否則差之毫釐失之千里.
(5),(6),(7) 談的是係數積的性質, 例如 r(su) 表示是先將 u 乘上 s 倍後所得的向量再乘 上 r. 這幾個性質也都和實數乘法性質息息相關, 雖然看起來不顯眼但在處理向量的運算時 非常重要.
(8) 指的是所有向量乘上 1 後仍不動. 這裡特別提出來其實和零向量意義很像, 唯有 1 的引入以後才能談係數的除法. 例如已知 2u = v, 就可利用 (5) 的性質兩邊乘上 1/2, 得
u =1u =1
2(2u) =1 2v.
最後要強調一下: 這裡將這些性質列出, 並不是要求大家將這幾個性質背下來. 一來我 們希望大家知道有些性質不能覺得理所當然就不去證明, 另一方面也讓大家知道以後在處理 向量運算時可以放心且自然的使用這幾個性質. 現在我們就來看看這些證明.
Proof. (of Proposition 1.1.2) 這幾個性質其實很簡單, 我們寫下證明是希望不熟悉寫抽象 證明的同學利用這個簡單的證明學學看如何寫好證明. 若自覺對這些性質的證明清楚的同 學可跳過此證明.
(1) 假設 u = (a1, a2), v = (b1, b2), 則依定義知
u + v = (a1+ b1, a2+ b2), v + u = (b1+ a1, b2+ a2).
故由實數加法的交換性 (即 a + b = b + a) 可得 u + v = v + u.
(2) 假設 u = (a1, a2), v = (b1, b2), w = (c1, c2),則依定義知 u + v = (a1+ b1, a2+ b2)故得 (u + v) + w = ((a1+ b1) + c1, (a2+ b2) + c2).
同理由 v + w = (b1+ c1, b2+ c2) 可得
u + (v + w) = (a1+ (b1+ c1), a2+ (b2+ c2)).
因此由實數加法的結合律 (即 (a+b)+c = a+(b+c)) 得知 (u+v)+w = v+(u+w).
(3) 這是一個存在性的問題, 也就是說要找到一個向量 O 滿足所求. 這裡我們只要令 O = (0, 0), 則對任意向量 u = (a1, a2)皆有
O + u = (0 + a1, 0 + a2) = (a1, a2) = u.
故知確實存在這樣的向量.
(4) 上 面 我 們 已 知 可 令 O = (0, 0), 故 此 時 對 任 意 u = (a1, a2) 我 們 只 要 考 慮 u′ = (−a1,−a2), 則可得
u + u′= (a1+ (−a1), a2+ (−a2)) = (0, 0) = O.
(5) 假設 u = (a1, a2),依定義知 su = (sa1, sa2),因此得 r(su) = (r(sa1), r(sa2)).
另一方面
(rs)u = ((rs)a1, (rs)a2),
故由實數乘法結合律 (即 r(sa) = (rs)a) 可得 r(su) = (rs)u.
(6) 假設 u = (a1, a2),依定義知
(r + s)u = ((r + s)a1, (r + s)a2).
另一方面 ru = (ra1, ra2), su = (sa1, sa2),可得
ru + su = (ra1+ sa1, ra2+ sa2),
故由實數加法與乘法的分配律 (即 (r + s)a = ra + sa) 可得 (r + s)u = ru + su.
(7) 假設 u = (a1, a2), v = (b1, b2), 依定義知
r(u + v) = (r(a1+ b1), r(a2+ b2)).
另一方面 ru = (ra1, ra2), rv = (rb1, rb2),可得
ru + rv = (ra1+ rb1, ra2+ rb2),
故由實數加法與乘法的分配律 (即 r(a + b) = ra + rb) 可得 r(u + v) = ru + rv.
(8) 假設 u = (a1, a2),由於對任意實數 a 皆有 1a = a, 故由 1u = (1a1, 1a2)可得 1u = u.
Question 1.1. 利用R2 向量加法的定義, 試證明以下性質:
1.1. 坐標平面中的向量 5
(1) O = (0, 0) 是R2 中唯一的向量滿足對任意 u∈ R2 皆有 O + u = u.
(2) 給定 u = (a, b)∈ R2, 試證明 u′= (−a,−b) 是 R2 中唯一的向量滿足 u + u′= O.
接下來我們將舉一個例子來說明我們可以用向量的性質 (Proposition 1.1.2) 來處理一些 幾何的問題. 由於這些性質以後我們不會用到, 所以在此不用定理的形式呈現而是用例題的 形式呈現.
Example 1.1.3. 假設 P, Q, R, S 是平面中四個點, 其中−→
PQ =−→
SR, 則我們有以下性質:
(1) −→
QR =−→ PS.
(2) 假設 T 為線段 PR 和線段 SQ 的交點, 則 −→PT =−→
T R 且 −→
ST =−→
T Q.
我們利用下圖來解釋這兩個性質會成立的原因:
P
Q R
S
T
(1) 我們要利用 −→
PQ =−→
SR 來得到−→
QR =−→
PS. 由前面式子 (1.1) 我們知道 −→
PQ +−→
QR =−→
PR 且 −→
PS +−→ SR =−→
PR. 也就是說
−→PQ +−→
QR =−→ PS +−→
SR. (1.2)
由 Proposition 1.1.2 (4), 我們知存在 u 使得 −→
PQ + u = O. 要注意由於 Proposition 1.1.2 (1) 以及 −→
PQ =−→
SR 的假設, 這等於
−→PQ + u = u +−→
PQ =−→
SR + u = u +−→ SR = O 現將上面式子 (1.2) 兩邊加上 u 可得
u + (−→
PQ +−→
QR) = u + (−→ PS +−→
SR) (1.3)
然而利用 Proposition 1.1.2 (2), (3) 我們有 u + (−→
PQ +−→
QR) = (u +−→
PQ) +−→
QR = O +−→
QR =−→
QR.
同理可得 u + (−→
PS +−→
SR) = (−→ PS +−→
SR) + u =−→ PS + (−→
SR + u) =−→
PS + O =−→ PS.
故由式子 (1.3) 可得−→
QR =−→ PS.
(2) 通常我們用坐標來處理問題時, 碰到交點的問題可以用解方程式的方法處理, 不過 這裡我們要用抽象的向量處理, 遇到交點問題就比較麻煩, 需要用比較特殊的方法 處理. 這裡原要證明線段 PR 和線段 SQ 的交點 T 會是 PR 的中點, 也會是 SQ 的 中點. 我們用反過來的看法處理, 也就是要去說明 PR 的中點和 SQ 的中點會是同
一點. 如此一來這一點因同時在 PR 和 SQ 上, 所以自然就是 PR 和 SQ 的交點. 又 因為 PR 和 SQ 不平行, 僅能有一個交點, 這就說明了線段 PR 和線段 SQ 的交點就 是 PR 以及 SQ 的中點. 具體來說我們假設 T′, T′′ 分別為 PR 和 SQ 的中點. 然後 說明 T′= T′′, 如此一來便得證 T′ 為 PR 和 SQ 的交點, 也就是說 T = T′= T′′, 故 得證所求.
依假設 T′, T′′ 分別為 PR 和 SQ 的中點, 故知
−→PT′=−→
T′R = 1 2
−→PR (1.4)
且 −−→
ST′′=−−→
T′′Q = 1 2
−→SQ. (1.5)
若我們能證明 −→
PT′=−−→
PT′′便得證 T′= T′′. 然而−−→
PT′′=−→ PS +−−→
ST′′, 故由式子 (1.5) 可
得 −−→
PT′′=−→ PS +−−→
ST′′=−→ PS +1
2
−→SQ.
又由於 (1) 告訴我們 −→ PS =−→
QR 上式可改寫為
−−→PT′′=−→
QR +1 2
−→SQ = (1 2
−→QR +1 2
−→QR) +1 2
−→SQ = 1 2
−→QR +1 2(−→
QR +−→
SQ) =1 2(−→
QR +−→ SR) 再利用已知 −→
PQ =−→
SR, 上式又可改寫為
−−→PT′′=1 2(−→
QR +−→ SR) =1
2(−→
QR +−→
PQ) =1 2
−→PR
故由式子 (1.4) 得證 −→
PT′=−−→
PT′′, 也因此得知 T′= T′′ 就是 PR 和 SQ 的交點, 也就 是說 T = T′= T′′. 故由式子 (1.4,1.5) 得證 −→PT =−→
T R 且−→
ST =−→
T Q.
同學或許會想到用設定坐標的方式處理 Example 1.1.3 的問題. 這裡我們故意不去設定 坐標系, 而僅用 Proposition 1.1.2 中列出的向量運算性質去處理, 主要就是要強調這幾個運 算性質就足以處理向量有關的性質. 也就是說不一定需要架設坐標系, 只要符合 Proposition 1.1.2 中列出的運算性質, 都可享有 Example 1.1.3 的性質. 另外由 Example 1.1.3 的處理過 程中我們了解到, Proposition 1.1.2 的運算性質可幫助我們在處理向量有關的等式運算時可 如處理實數的等式運算一樣 (例如移項, 消去... 等). 這些等我們以後更進一步談向量空間 時, 大家就更能體會了.
1.2. Rn 中的向量
在高中時我們也學坐標空間中的向量, 也就是R3. 很容易理解R3 中的向量可以說是R2 中的向量的推廣. 同樣的我們也可將之推廣而定義Rn 中的向量, 其中 n∈ N 是任意的正整 數. 本節中我們將探討Rn 中的向量. 或許同學們會覺得Rn 中的向量已看不到, 而疑惑為何 要探討它. 事實上線性代數的應用有許多情況就是在這類抽象且看不到的狀況, 這甚至可以 說是線性代數發展的主因 (如果僅為了R2 或 R3 就沒必要發展這一套理論). 在這一節中我 們會發現, 雖然它看不到, 但因為具有如R2 中向量的運算性質, 我們還是可以如處理 R2 中 的向量一般的方式處理它們相關的性質.
1.2. Rn 中的向量 7
R3 中的向量, 即坐標空間中的向量我們可以用 (a1, a2, a3) 其中 a1, a2, a3∈ R 來表示, 而 且我們定義兩向量 (a1, a2, a3), (b1, b2, b3) 相等表示 a1= b1, a2= b2 且 a3= b3. 對於任意的 n∈ N 我們也有如下的定義:
Definition 1.2.1. 給定任意 n∈ N, 我們定義 Rn中的向量為 (a1, . . . , an),其中 a1, . . . , an∈ R.
我們說兩向量 (a1, . . . , an) 以及 (b1, . . . , bn) 相等若且唯若 a1= b1, . . . , an= bn.
我們多說明一下符號的表示法, 這裡 (a1, . . . , an) 表示有 n 個位置, 每個位置我們依次填 入實數其中第 1 個位置的元素我們用 a1 來表示, 第二個位置用 a2 來表示, 這樣一直下去直 到第 n 個位置用 an 來表示. 例如 n = 4 時,R4中的向量可以用 (a1, a2, a3, a4)來表示. 因為 n 可以是任意的正整數不能如 n = 4 時將所有的 a1, a2, . . . 都列出來, 所以我們就用 (a1, . . . , an) 來表示. 這裡我們也沿習這樣省略的方法說 a1, . . . , an∈ R, 表示 a1 到 an 這 n 個元素都是實 數. 有的書用較嚴謹的說法, 會用 ai∈ R, ∀1 ≤ i ≤ n 來表示, 此即對所有的 1 ≤ i ≤ n 皆有 ai∈ R 的意思. 這種說法的意義是: i 是任意 1 到 n 的整數, 而對於這個 i 所對應的 ai 會是 實數. 所以這等同於說 a1 到 an 這 n 個數都是實數. 另一方面談論向量的相等是必要的, 這 是因為在談論向量的運算時就如同實數的運算, 我們必須明確規定等式的意義. 實數的相等 很明確, 所以我們就利用實數的相等來定義向量的相等. 這裡 a1= b1, . . . , an= bn 也是一種 省略的說法, 一般也可以用 ai= bi,∀1 ≤ i ≤ n 來表示.
接著我們沿用R2 中向量的加法及係數積來定義Rn 中向量的加法 (addition) 以及係數 積 (scalar multiplication).
Definition 1.2.2. 令 u = (a1, . . . , an), v = (b1, . . . , bn)∈ Rn 以及 r∈ R. 我們定義 u + v = (a1+ b1, . . . , an+ bn) and ru = (ra1, . . . , ran).
依此定義, 給定Rn 中的兩向量我們可以明確地計算它們之和, 例如若 u = (1, 1, 2, 2, 3), v = (5, 4, 3, 2, 1)∈ R5
則
u + v = (1 + 5, 1 + 4, 2 + 3, 2 + 2, 3 + 1) = (6, 5, 5, 4, 4).
這裡特別要注意的是必須是 u, v 皆在相同的 Rn 中才能定義 u + v. 例如若 u 在R3 而 v 在 R4 是不能談 u + v 的了!
如同R2 的情形, Rn 中向量加法及係數積有以下的性質. 由於這些性質的證明和 R2 的 情形完全相同 (用到實數相對應的性質), 此處我們就不再證明了.
Proposition 1.2.3. 對於Rn 上的向量, 我們有以下的性質:
(1) 對任意 u, v∈ Rn, 皆有 u + v = v + u.
(2) 對任意 u, v, w∈ Rn, 皆有 (u + v) + w = u + (v + w).
(3) 存在一向量 O∈ Rn 滿足對任意 u∈ Rn 皆有 O + u = u.
(4) 對任意 u∈ Rn 皆可找到 u′∈ Rn 滿足 u + u′= O.
(5) 對任意 r, s∈ R 以及 u ∈ Rn, 皆有 r(su) = (rs)u.
(6) 對任意 r, s∈ R 以及 u ∈ Rn, 皆有 (r + s)u = ru + su.
(7) 對任意 r∈ R 以及 u,v ∈ Rn 皆有 r(u + v) = ru + rv.
(8) 對任意 u∈ Rn, 皆有 1u = u.
Proposition 1.2.3 (3) 所提的 O 就是所謂 additive identity, 這裡其實就是向量 (a1, . . . , an), 其中 ai= 0, ∀1 ≤ i ≤ n, 我們也稱此 O 為零向量. 另外若 u = (a1, . . . , an)∈ Rn, 則 Proposi- tion 1.2.3 (4) 所提的 u′ 就是所謂 additive inverse, 這裡其實就是 (b1, . . . , bn),其中 bi=−ai,
∀1 ≤ i ≤ n. 如同 Question 1.1 所提, 利用 Rn 向量加法的定義, 我們知這裡 O 是 Rn 中唯一 滿足對任意 u∈ Rn 皆有 O + u = u 的向量, 而給定 u∈ Rn, u′=−1u 是唯一滿足 u + u′= O 的向量. 事實上, 不必利用 Rn 向量加法的定義, 由 Proposition 1.2.3 (3) 的性質本身就可以 確定 O 是唯一的. 這是因為若有另一個 O′∈ Rn 也是 additive identity (即滿足 Proposition 1.2.3 (3) 的性質), 則由 O 為 additive identity 可得 O + O′= O′. 另一方面, 由 O′ 為 additive identity 可得 O + O′= O. 也就是說我們有 O = O′, 得到唯一性. 同樣的道理, 給定 u∈ Rn, 若 u′, u′′ 皆滿足 Proposition 1.2.3 (3) 的性質, 即 u + u′= u + u′′= O, 則得
u′= u′+ O = u′+ (u + u′′) = (u′+ u) + u′′= O + u′′= u′′. 所以我們有以下之性質.
Corollary 1.2.4. 在 Rn 中存在唯一的向量 O 滿足對任意 u∈ Rn 皆有 O + u = u. 另外, 給定 u∈ Rn, 存在唯一的 u′∈ Rn 滿足 u + u′= O.
Remark 1.2.5. 在數學中, 一個定理若是由前一個定理直接得到 (不需引用新的性質), 通 常會以 Corollary 稱之. Proposition 1.2.3 (3),(4) 其實談的是 additive identity 和 additive inverse 的存在性而 Corollary 1.2.4 談的是它們的唯一性. 同學或許會奇怪為何要將它們分 開敘述呢? 這也就是我們用 Corollary 稱之的用意, 就是要強調我們雖然可以用 Rn 的加法 及係數積的定義得到 Corollary 1.2.4, 但這裡我們避開定義, 直接用 Proposition 1.2.3 的結 果得到 Corollary 1.2.4 (以後我們在抽象的向量空間中就會這麼處理). 就如在前一節所述, 很多向量的運算性質, 不需回歸到定義, 利用 Proposition 1.2.3 中所述的這些性質就足以推 導出一般向量有關的性質.
有了唯一性, 以後我們將一律用 O 表示Rn 中的 additive identity. 而給定 u∈ Rn, 我們 用 −u 表示 u 的 additive inverse.
我們利用 Proposition 1.2.3 (3) 有關 additive identity 的存在性證得 Corollary 1.2.4 中 有關 additive identity 的唯一性. 證明過程中用了一個很重要的關鍵, 就是 Proposition 1.2.3 (3) 中要求 O 必須滿足對所有 u∈ Rn 皆滿足 u + O = u. 如果當初僅只有特定 u∈ Rn 會滿 足 u + O = u, 則就無法證出 Corollary 1.2.4 中有關 additive identity 的唯一性了. 不過因為 我們知道向量加法有 Proposition 1.2.3 這們完善的性質, 當我們要確認一個向量 v 是否為 零向量時, 不必檢查所有的向量, 只要找到一個向量 u 滿足 u + v = u, 就可以確認 v 是零向 量了. 事實上我們有以下之結果.
1.2. Rn 中的向量 9
Corollary 1.2.6. 假設 v∈ Rn 且存在 u∈ Rn 使得 u + v = u, 則 v = O.
Proof. 由 u = u + v = v + u, 將等式兩邊加上−u, 可得
O = u + (−u) = (v + u) + (−u) = v + (u + (−u)) = v + O = v.
這裡的邏輯順序一定要弄清楚. 我們是先知道 Proposition 1.2.3 是對的, 才能推得 Corollary 1.2.4 以及 Corollary 1.2.6. Corollary 1.2.6 告訴我們如果要確定一個Rn 中的向 量 v 是零向量, 我們只要在 Rn 中找到一個向量 u, 使得 v + u = u 即可, 不必去試 Rn 上所 有的向量. 所以我們馬上有以下的性質.
Corollary 1.2.7. 令 v∈ Rn, 我們有以下之結果.
(1) 0v = O.
(2) (−1)v = −v.
Proof. 若直接用 Rn 上向量加法及係數積的定義, 馬上可得到此結果. 不過這裏我們利用 Proposition 1.2.3 以及其衍伸的 Corollaries 來證明.
(1) 利用 Corollary 1.2.6, 我們只要找到一個向量 u 滿足 0v + u = u 即可. 若考慮 u = v, 此時
0v + v = 0v + 1v = (0 + 1)v = 1v = v.
得證 0v = O.
(2) 要證明 (−1)v = −v, 利用 Corollary 1.2.4 additive inverse 的唯一性我們只要證明 (−1)v + v = O 即可. 然而,
(−1)v + v = (−1)v + 1v = (−1 + 1)v = 0v, 故由 (1) 的結果知 (−1)v + v = O.
再次強調一次, Corollaries 1.2.4, 1.2.6, 1.2.7, 都可以很簡單的利用Rn 上向量加法與係 數積的定義得到. 它們很自然也很容易理解, 不必去死記. 這裡特別提到它們是要讓大家知 道, 這些性質都可以直接由 Proposition 1.2.3 得到, 也讓大家更加確定 Proposition 1.2.3 中 的性質足以使得Rn 中向量的運算都可像實數一般處理. 同樣的, 我們可以如實數一樣引用
“減法” 的符號, 也就是說將 w + (−v) 寫成 w − v. 如此一來以後我們在一些等式的推演時 就直接沿用大家習慣的「移項」的說法. 例如 2u + v = w, 我們就直接移項且乘以 1/2 得 u = 12(w− v).
1.3. Span of Vectors
在 Rn 中有許多由 Rn 中的向量展成的 “子空間”. 這些子空間是這一節要探討的課題.
所謂子空間以後我們後有更正式的定義, 這裡我們僅暫時借用這個名詞, 大略指的是Rn 中 一些向量所組成的特殊子集合 (subset).
我們先從熟悉的坐標平面開始. 在坐標平面中我們最常談的就是直線. 一個直線通常有 很多方式來表示, 若用通俗一點的說法一個直線可以說是通過一特定點且沿著一特定方向 前進 (或後退) 所得的點所成的集合. 如果這個特定點用 P 來表示, 而 Q 為此直線上另外 一點, 則用向量的觀點來說就是此直線是通過 P 點且沿著 −→
PQ 方向的直線. 這個向量 −→
PQ 我們稱為此直線的 “方向向量” (directional vector). 一個直線的方向向量並不唯一, 因為若 Q′ 為此直線上 P, Q 以外的另一點, 則 −−→
PQ′ 也會是此直線的一個方向向量. 不過因為 P, Q, Q′ 皆在同一直線上, 依向量的定義我們知道會存在一實數 r 使得 −−→
PQ′= r−→
PQ. 因此若已知ㄧ 非零向量 v 為一直線的方向向量, 則此直線上任兩點 P, Q 所成的向量都會存在一實數 r 使 得 −→
PQ = rv. 反之若已知ㄧ直線 L 通過 P 點且其方向向量為 v, 若 Q 點滿足 −→
PQ = rv, 其中 r∈ R, 則知 Q 點會在此直線 L 上. 因此我們可以用以下的集合來表示通過 P 點且方向向量 為 v 的直線 L 上的點, 即
L ={Q |−→
PQ = rv, r∈ R}.
通常在集合的表示法中, 如果無法用列舉的方式一一列舉此集合的元素時, 我們會用上面的 方法來表示. 也就是在 “|” 的左邊寫下此集合元素的形式, 右邊寫下這些元素所需符合的性 質. 在這裡左邊的 Q 表示此集合所組成的元素是像 Q 這樣的點, 而右邊−→
PQ = rv, r∈ R 表 示 Q 點需滿足−→
PQ = rv, 其中 r 為實數.
從上面可知若 v 是直線 L 的方向向量那麼對任意非零實數 r, 若 w = rv, 則 w 也是 L 的 方向向量. 為了方便起見我們就稱 w 和 v 為 parallel (平行), 用 v∥ w 來表示. 若兩直線它 們的方向向量是平行的, 我們就稱此二直線相平行.
我們可以發現, 上面這種用向量來描述一直線上的點的方法, 不僅在坐標平面中適用, 在 坐標空間甚至更高維度的空間皆適用. 所以在Rn 中若 v 是一個非零向量,
{w ∈ Rn| w = rv, r ∈ R}
這一類由向量所組成的集合便顯得重要. 提醒一下, 這個集合表示法 | 的左邊是 “向量”, 表 示是由向量所成的集合, 和前面直線 L 的集合表法 | 左邊是 “點” 表示是由點所成的集合有 所不同, 大家應區分清楚.
在坐標空間中除了直線另一個大家常探討的便是平面. 同樣的一個平面也有許多表示 法. 和向量有關的最常見的就是法向量的表示法, 不過關於法向量的看法因牽涉內積我們留 待以後再說明, 這裡我們依然沿用剛才直線的看法. 也就是說每一個平面, 我們都可以在其 上找到兩個不平行的直線 L1, L2, 而整個平面就是沿著其中一條直線 L1 畫出與 L2 平行的 直線而得. 換言之, 若 L1, L2 分別為此平面上不平行的兩條直線, 其方向向量分別為 v1, v2 且相交於 P 點, 則對 L1 上任一點 Q 皆可找到 r1∈ R 滿足 −→
PQ = r1v1. 而通過 Q 點且與 L2
平行的直線會在此平面上, 亦即若 R 點會在此與 L2 平行的直線上, 則可找到 r2∈ R 使得
1.3. Span of Vectors 11
−→QR = r2v2. 利用 −→ PR =−→
PQ +−→
QR 我們可得
−→PR = r1v1+ r2v2,
也就是說對於平面上任一點 R 皆可找到 r1, r2∈ R 滿足 −→PR = r1v1+ r2v2. 反之若 R 滿足
−→PR = r1v1+ r2v2, 我們也可知 R 會落在一個過 L1 且與 L2 平行的直線上, 也就是說 R 會在 此平面上. 所以若一平面 H 通過 P 點且 v1, v2 為 H 上兩條不平行的直線的方向向量, 我們 也可用以下的集合表示平面 H 上的點, 即
H ={R | −→PR = r1v1+ r2v2, r1, r2∈ R}.
要注意表示 H 的這兩個向量 v1, v2 並不唯一, 至於要怎樣的兩個向量可以同樣描述 H 這個平面, 這裡我們暫不探討, 留待以後我們學習更多線性代數理論時再探討. 這裡我們將 專注於{w ∈ Rn| w = rv,r ∈ R} 以及 {w ∈ Rn| w = r1v1+ r2v2, r1, r2∈ R} 這一類由向量所組 成的集合.
上述有關平面的向量表示法, 不僅在坐標空間上適用, 我們可以將上述概念推廣至Rn上 且考慮更一般的情形. 在Rn 上我們不只可談直線和平面, 還有許多和直線平面有類似的特 性的事物值得探討. 我們自然引進以下的定義.
Definition 1.3.1. 給定 v1, . . . , vm∈ Rn, 以及 r1, . . . , rm∈ R 令 w = r1v1+··· + rmvm,
則 稱 w 為 v1, . . . , vm 的 一 個 linear combination (線 性 組 合). 所 有 v1, . . . , vm 的 linear combinations 所組成的集合稱為它們的 span (展成的空間), 我們用 Span(v1, . . . , vm) 來表示 這個集合, 也就是說
Span(v1, . . . , vm) ={w ∈ Rn| w = r1v1+··· + rmvm, r1, . . . , rm∈ R}.
要注意因為 v1, . . . , vm 在 Rn 中, 所以 v1, . . . , vm 的一個線性組合仍在 Rn 中. 也就是說 Span(v1, . . . , vm)是Rn 的一個子集合. 這個子集合具有一重要的性質, 我們稱之為Rn的「子 空間」(以後會給正式定義). 這個子集合具有怎樣的特殊性質呢? 比方說利用定義我們可以 知零向量 O 一定會在 Span(v1, . . . , vm)中 (即每個 ri 皆取為 0), 又若 w∈ Span(v1, . . . , vm),則 因 w = r1v1+···+rmvm可知−w = (−r1)v1+···+(−rm)vm 也就是說−w ∈ Span(v1, . . . , vm).
這些性質我們可以推廣到更一般的情況而得到以下的定理.
Proposition 1.3.2. 給定 v1, . . . , vm∈ Rn, 則對任意 u, w∈ Span(v1, . . . , vm) 以及 s,t∈ R 皆 有
su + tw∈ Span(v1, . . . , vm).
Proof. 因 u, w∈ Span(v1, . . . , vm) 由定義知存在 r1, . . . , rm∈ R 以及 r′1, . . . , r′m∈ R 使得 u = r1v1+··· + rmvm 以及 w = r′1v1+··· + rm′ vm. 因此得
su + tw = (sr1+ tr′1)v1+··· + (srm+ tr′m)vm.
也就是說 su + tw 仍為 v1, . . . , vm 的一個線性組合, 故得證 su + tw∈ Span(v1, . . . , vm).
雖然在 Proposition 1.3.2 中我們僅提及 Span(v1, . . . , vm) 中的兩個向量的線性組合仍在 Span(v1, . . . , vm) 中, 不過利用數學歸納法, 我們可以證得任意有限多個 Span(v1, . . . , vm) 中的 向量的線性組合也會在 Span(v1, . . . , vm) 中.
Question 1.2. 設 v1, . . . , vm∈ Rn, 試證明若 w1, . . . , wk∈ Span(v1, . . . , vm), 則 Span(w1, . . . , wk)⊆ Span(v1, . . . , vm).
對於 span of vectors, 其中有一個基本的問題便是判斷哪些 vectors 會在特定 vectors 的 span 裡. 例如我們可以問 (1, 2, 3)∈ R3 是否屬於 Span((1,−1,2),(2,1,−2))? 這樣的問題就 等同於是否找得到 r, s∈ R 使得 (1,2,3) = r(1,−1,2) + s(2,1,−2). 比較向量各坐標, 我們得 到一次聯立方程組
1r + 2s = 1
−1r + 1s = 2 2r − 2s = 3
.
所以知道這一類的問題會和解聯立方程組有關. 另外大家可以發現, 若將向量寫成直行 (即 column vector), r(1,−1,2) + s(2,1,−2) = (1,2,3) 可寫成
r
1
−1 2
+ s
2 1
−2
=
1 2 3
.
這樣看成聯立方程組就更清楚方便了. 所以有的書都會將 vector 寫成 column vector 的樣 子. 不過寫成 column vector 的缺點便是太占版面了, 本講義採 column vector 和 row vector (橫列) 混用的方法. 會視方便有時用 row vector 有時用 column vector. 這一點等介紹矩陣 運算時我們會再釐清.
還有一個解決 column vector 占版面的方法就是利用所謂的 standard basis. 在R2 我們 令 i =
( 1 0
) , j =
( 0 1
)
,每一個R2的 vector 都可以唯一寫成 i, j 的線性組合, 例如 ( 2
3 )
便可以寫成 2i + 3j. 一般我們令R3 上的 standard basis vectors 為
i =
1 0 0
, j =
0 1 0
, k =
0 0 1
.
而 Rn 上的 standard basis vectors 定為
e1=
1 0 0 ... 0
, e2=
0 1 0 ... 0
, . . . , en=
0 0 ... 0 1
,
其中對任意 1≤ i ≤ n, ei 為第 i 個位置是 1, 其他位置為 0 的 column vector. 不難發現, 任 意 Rn 的 vector 都可以唯一寫成 e1, . . . , en 的 linear combination. 事實上Rn 還有其他組和 standard basis vectors 有類似性質的 vectors, 我們留待以後再談.
1.4. Dot Product 13
1.4. Dot Product
在 R2 和 R3 中大家熟悉內積的定義也可以推廣到一般的Rn. 將來我們會知道內積可以 幫助我們定義出Rn 中許多重要的子空間, 在本節我們僅論及大家熟悉的內積性質在 Rn 的 情況.
首先我們回顧在R2 和 R3 中內積的定義. 若在R2 中 u = (a1, a2), v = (b1, b2), 則 u, v 的 內積 u· v 定義成 u · v = a1b1+ a2b2. 而在 R3 中若 u = (a1, a2, a3), v = (b1, b2, b3), 則 u, v 的 內積 u· v 定義成 u · v = a1b1+ a2b2+ a3b3.由這定義我們很自然地可推廣到 Rn 中向量的內 積如下:
Definition 1.4.1. 假設 u = (a1, . . . , an), v = (b1, . . . , bn)∈ Rn. 則定義 u, v 的 dot product (inner product) 為
u· v = a1b1+··· + anbn=
∑
n i=1aibi.
向量的內積和向量的運算有一定的關係, 以下就是它們之間的關係 Proposition 1.4.2. 對任意 u, v, w∈ Rn, 我們有以下的性質:
(1) u· v = v · u.
(2) u· u ≥ 0 且 u · u = 0 若且唯若 u = O.
(3) 對任意 r∈ R 皆有 (ru) · v = u · (rv) = r(u · v).
(4) u· (v + w) = u · v + u · w.
Proof. 這些性質在R2 和 R3 大家應都了解, 在 Rn 上的證明其實也一樣, 不同的是 n 可以 是任意自然數我們無法完整地寫下 Rn 中的向量, 而需藉由符號的幫助.
假設 u = (a1, . . . , an), v = (b1, . . . , bn), w = (c1, . . . , cn). 我們想利用∑ (summation) 這個符 號來處理內積, 讓大家習慣這個便利的符號.
(1) 依定義
u· v =
∑
ni=1
aibi
這表示 u· v 是這些 aibi 的和其中 i 是跑遍 1 到 n 的所有正整數. 由於這 n 項的每一項 aibi 皆等於 biai (實數乘法交換率) 所以我們知道它們的和也相等, 也就是說
∑
n i=1aibi=
∑
n i=1biai= v· u.
所以我們得 u· v = v · u.
(2) 依定義
u· u =
∑
ni=1
aiai=
∑
n i=1a2i.
由於任一實數的平方皆大於等於 0, 即 a2i ≥ 0, 故有 ∑ni=1a2i ≥ 0, 而得證 u · u ≥ 0. 又上式中 若 ∑ni=1a2i = 0, 表示每一項 a2i 皆需等於 0, 故知對任意 1≤ i ≤ n 皆需有 ai= 0, 而得知
u = (a1, . . . , an) = (0, . . . , 0) = O.
反之若 u = (a1, . . . , an) = O 表示對任意 1≤ i ≤ n 皆有 ai= 0, 故得 u· u =
∑
ni=1
aiai= 0.
(3) (ru)· v 這個符號表示 ru 這個向量與 v 的內積, 因 ru = (ra1, . . . , ran) 故由定義知 (ru)· v =
∑
ni=1
(rai)bi.
又對所有的 1≤ i ≤ n 皆有 (rai)bi= r(aibi) (實數乘法結合律) 故知
∑
n i=1(rai)bi=
∑
n i=1r(aibi)
再加上∑ni=1r(aibi) 中每一項皆有 r 可提出, 故由實數加法與乘法的分配律可知
∑
n i=1r(aibi) = r
∑
n i=1aibi= r(u· v)
而得證 (ru)· v = r(u · v). 我們也可用同樣方法證得 u · (rv) = r(u · v), 不過我們這裡可利 用 (1) 知 u· (rv) = (rv) · u 再利用剛才的結果得 (rv) · u = r(v · u), 再利用一次 (1) 得到 r(v· u) = r(u · v) 而得證 u · (rv) = r(u · v).
(4) u· (v + w) 這個符號表示 u 這個向量與 v + w 的內積, 因 v + w = (b1+ c1, . . . , bn+ cn) 故由定義知
u· (v + w) =
∑
ni=1
ai(bi+ ci).
由實數加法與乘法的分配律知每一項 ai(bi+ ci)可表為 aibi+ aici, 也就是說
∑
n i=1ai(bi+ ci) =
∑
n i=1(aibi+ aici).
因為實數加法有交換率, 我們可以先將 aibi 的部份先加在一起, 再將 aici 的部份加在一起, 再求它們之和, 故知
∑
n i=1(aibi+ aici) =
∑
n i=1aibi+
∑
n i=1aici= u· v + u · w,
依此得證 u· (v + w) = u · v + u · w.
Proposition 1.4.2 (2) 告訴我們除了零向量 O 以外其餘向量 v 皆需符合 v·v > 0, 所以很 自然地我們可依此定義向量的長度.
Definition 1.4.3. 令 v = (a1, . . . , an)∈ Rn, 我們定義 v 的長度 (length) 為
∥v∥ =√
v· v =√
a21+ a22+··· + a2n.
1.4. Dot Product 15
我們可以利用 Proposition 1.4.2 的處理一些有關於內積的性質, 而不必涉及內積的定義.
Lemma 1.4.4. 假設 u, v∈ Rn, 則 ∥u + v∥2=∥u∥2+ 2u· v + ∥v∥2.
Proof. 依定義 ∥u + v∥2= (u + v)· (u + v), 再依 Proposition 1.4.2 (4) 可得 (u + v)· (u + v) = (u + v) · u + (u + v) · v = u · u + v · u + u · v + v · v.
最後再依 Proposition 1.4.2 (1) 的交換律知 v· u + u · v = 2u · v 而得證本定理. Question 1.3. 試證明平行四邊形定理 (parallelogram relation): 平行四邊形兩對角線長的 平方和等於四邊長的平方和, 即對任意 u, v∈ Rn 皆有
∥u + v∥2+∥u − v∥2= 2∥u∥2+ 2∥v∥2.
再次強調一次 Lemma 1.4.4 僅用到內積的性質, 所以在一般的情形若我們不是利用 Definition 1.4.1 的方法定義內積 (當然此時長度的定義也跟著改變) 但所定義的內積仍保有 Proposition 1.4.2 中的性質, 我們依然可得到 Lemma 1.4.4 中的性質. Lemma 1.4.4 最常見 的就是可以幫助我們推得所謂的「柯希、舒瓦茲」不等式.
Proposition 1.4.5 (Cauchy-Schwarz inequality). 若 u, v∈ Rn, 則 |u · v| ≤ ∥u∥∥v∥. 特別地 當 u, v 皆不為零向量時, 等號成立若且唯若存在λ ∈ R 使得 v = λu.
Proof. 假設 u 和 v 中有一個為零向量, 即 u· v = 0 且 ∥u∥∥v∥ = 0, 故此不等式成立.
若 u, v 皆不為零向量, 考慮 u0= u/∥u∥ 且 v0= v/∥v∥. 此時
∥u0∥2= u0· u0= 1
∥u∥u· 1
∥u∥u = 1
∥u∥2u· u = 1.
同理得∥v0∥2= 1, 故由 Lemma 1.4.4 得知
∥u0+ v0∥2= 2 + 2u0· v0, (1.6)
∥u0− v0∥2= 2− 2u0· v0.
因為對任意的 w∈ Rn 皆有 ∥w∥2≥ 0, 故得 −1 ≤ u0· v0≤ 1. 換回 u,v 得
−∥u∥∥v∥ ≤ u · v ≤ ∥u∥∥v∥.
亦即|u · v| ≤ ∥u∥∥v∥.
從上可知當 u, v 皆不為零向量時, 此不等式之等式會成立等同於 u0· v0= 1 或 u0· v0=
−1. 此時由式子 (1.6) 分別得 ∥u0−v0∥2= 0 或∥u0+ v0∥2= 0, 也就是說 u0= v0或 u0=−v0. 換回 u, v 我們得
v =∥v∥
∥u∥u 或v =−∥v∥
∥u∥u.
故此時只要令λ 分別為 ∥v∥/∥u∥ 或 −∥v∥/∥u∥, 即可得 v = λu.
反之若 v =λu, 則由 Proposition 1.4.2 可得
|u · v| = |λ||u · u| = |λ|∥u∥2=∥u∥∥λu∥ = ∥u∥∥v∥.
在證明 Proposition 1.4.5 時, 我們用了一個很特殊的技巧, 就是將 u 化成長度為 1 的向 量 u0= u/∥u∥. 一般來說一個長度為 1 的向量, 我們稱之為 unit vector. 任意的非零向量 u 都可以化成 unit vector, 即取 u0= u/∥u∥. 這種化成 unit vector 的方法不只讓我們確定向 量的長度且又保有原向量的方向性, 是線性代數處理內積有關的問題很好用的技巧.
利用 Proposition 1.4.5, 我們可以得到所謂的三角不等式.
Corollary 1.4.6 (Triangle inequality). 若 u, v∈ Rn, 則 ∥u + v∥ ≤ ∥u∥ + ∥v∥.
Proof. 由 Lemma 1.4.4 以及 Proposition 1.4.5, 我們有
∥u + v∥2=∥u∥2+ 2u· v + ∥v∥2≤ ∥u∥2+ 2∥u∥∥v∥ + ∥v∥2= (∥u∥ + ∥v∥)2.
不等式兩邊開根號得證∥u + v∥ ≤ ∥u∥ + ∥v∥.
Question 1.4. 試找到充分必要條件使得 ∥u + v∥ = ∥u∥ + ∥v∥.
利用內積我們可以知道坐標平面或空間中向量之間的一些幾何關係. 例如若兩非零向量 u, v 的夾角為θ, 因為 u · v = ∥u∥∥v∥cosθ, 所以我們可以利用內積得知此二非零向量所夾角 度. 特別地當 u· v = 0 即表示 u 和 v 垂直. 我們也可將此幾何意義推廣到更一般的 Rn. 雖 然當 n≥ 4 時, 我們無法 “看到” Rn 中的向量 (無法用幾何的方式來定義夾角), 此時我們可 以沿習R2,R3 上的結果定義兩非零向量 u, v∈ Rn 的夾角為 θ, 其中 0 ≤ θ ≤ π 使得
cosθ = u· v
∥u∥∥v∥.
當我們定義一個東西時要注意這個定義是否 “well-defined”. 也就是說要確認這樣定義出 來的夾角 θ 是否可以找得到, 這是所謂「存在性」的問題. 我們都知道當 0 ≤ θ ≤ π 時,
|cosθ| ≤ 1. 所以這裡夾角 θ 的存在性就關係到 Rn 中兩個非零向量 u, v 是否會滿足 u· v
∥u∥∥v∥
≤ 1.
然而 Proposition 1.4.5 告訴我們這是一定對的, 所以這裡θ 的存在性沒問題. 另一個要確認 的問題是, 這樣定出來的夾角會不會有兩個或更多呢? 這是所謂「唯一性」的問題. 就是因 為會有θ′̸=θ 但 cosθ = cosθ′ 的情形發生, 所以這裡我們要求θ 要滿足 0 ≤ θ ≤ π, 如此才 能確保所得的夾角會是唯一的. 也就是說用這種方法定義兩非零向量的夾角是沒有問題的, 我們就稱這樣的定義是 well-defined.
Example 1.4.7. 在 R4 中設 u = (1, 1, 1, 1), v = (1, 0,−2,−2) 的夾角為 θ, 則由 cosθ = u· v
∥u∥∥v∥= −3 2× 3=−1
2, 得知θ = 120◦.
利用夾角的定義我們進而定義出何謂「垂直」.
Definition 1.4.8. 令 u, v∈ Rn 為非零向量, 我們說 u 和 v 為 orthogonal 若且唯若 u·v = 0.
1.4. Dot Product 17
注 意 這 裡 因 在 Rn 空 間, 習 慣 上 垂 直 我 們 稱 為 orthogonal 而 較 少 用 一 般 幾 何 上 的 perpendicular. 有了垂直概念後, 我們也可以將 R2 或 R3 上的向量在另一向量上的投影 (projection) 之概念推廣至Rn.
我們先看 R2 的情況, 給定一非零向量 u∈ R2, 對任意 v∈ R2, 若 u′ 為 v 在 u 上的投 影, 表示向量 v− u′ (參考下圖虛線表示的向量) 會和 u 垂直, 即 (v− u′)· u = 0, 也就是說 v· u = u′· u.
-
* 6
-
uv
u′
因為 u′ 會落在 Span(u), 也就是說要找到 r∈ R 使得 u′= ru, 且符合 (v− u′)· u = 0. 將 u′= ru 代入得 v· u = ru · u = r∥u∥2, 亦即 r = (v· u)/∥u∥2. 也就是說, 若 v 在 u 的投影是存 在的, 那們它的投影一定就是 ∥u∥v·u2u (這說明了投影的唯一性). 然而若令 r = (v· u)/∥u∥2 (注 意 u 為非零向量的假設), 則 u′= ru 確實符合 (v− u′)· u = 0 (這說明了投影的存在性). 我 們可以將以上的概念推廣到 Rn 的情形.
Proposition 1.4.9. 給定一非零向量 u∈ Rn, 對任意 v∈ Rn, 皆可寫成 v = u′+ v′, 其中 u′, v′∈ Rn 滿足 v′· u = 0 且 u′= ru, r∈ R. 事實上這樣的寫法是唯一的, 即
r = v· u
∥u∥2.
Proof. 前面的論述在Rn 亦成立, 亦即 r = (v·u)/∥u∥2 是唯一的實數會使得 (v−ru)·u = 0.
換言之,
u′= v· u
∥u∥2u.
是唯一的向量會滿足 u′= ru 且 (v−u′)·u = 0. 既然 u′ 是唯一的, 故而 v′ 要滿足 v′+ u′= v,
即 v′= v− u′, 自然也就唯一確定了.
Question 1.5. 能否不用找到 r 的方法得到 Proposition 1.4.9 的唯一性?
Proposition 1.4.9, 大致上是說給定一 Rn 中的非零向量 u 後, 我們都可以將 Rn 中任一 向量 v 分解成兩個向量之和, 其中一個向量會落在 Span(u) (即定理中的 u′) 而另一個與 u 垂直 (即定理中的 v′), 且這個表法是唯一的. 我們稱落在 Span(u) 的那個向量
v· u
∥u∥2u 為 v 在 u 的 projection (投影).
Example 1.4.10. 在 R4 中考慮 u = (1, 1, 1, 1), v = (1, 0,−2,−2). 因 ∥u∥ = 2 且 v · u = −3, 得 v 在 u 的 projection 為
−3
4u =−3
4(1, 1, 1, 1).
又我們有
v = (1, 0,−2,−2) = −3
4(1, 1, 1, 1) + (7 4,3
4,−5 4,−5
4), 其中
−3
4(1, 1, 1, 1)∈ Span((1,1,1,1)) and (7 4,3
4,−5 4,−5
4)· (1,1,1,1) = 0.
1.5. Parametric Equation and Cartesian Equation
我們利用本節幫大家回顧一下高中所學有關坐標平面以及坐標空間中直線與平面的參 數式以及坐標方程式, 並將此概念推廣到更高維度的情況.
前面在介紹 span 時曾說過, 在坐標平面上的直線只要給其通過的一點 P(p, q) 及其上 的一個方向向量 v = (c, d) (注意 v̸= O) 就可以決定這一條直線了 (我們稱 v 為此直線的 direction vector). 事實上此直線每一點 Q(x, y) 須滿足−→
PQ = (x− p,y − q) = t(c,d), 其中 t 為 任意的實數. 反之, 給定任一實數 t∈ R, 我們都會有 Q(p +tc,q +td) 在此直線上. 所以我們 得 Q(x, y) 在此直線上, 若且唯若 x = p + tx, y = q + td, t∈ R. 這種描述坐標平面上一直線的 方法就稱為此直線的 parametric equation (參數式). 我們還有另一種方式來描述坐標平面 上的直線, 也就是說直線上任一點 Q(x, y), 其和 P(p, q) 所形成的向量 v′= (x− p,y − q) 一定 和 v 平行, 所以若我們找到一非零向量 w 和 v 垂直, 那麼 w 必定會和 v′ 垂直. 反之若 w 和 v′ 垂直, 則必有 v′ 和 v 平行 (注意因為我們是考慮坐標平面, 這個說法在坐標空間是錯的), 因此知 Q(x, y) 會在此直線上. 從這個角度來看, 我們也確實確定出這直線上的點了. 很容易 看出 w = (d,−c) 滿足 w · v = 0 (我們稱 w 為此直線的 normal vector), 因此從前面論述我 們知道此直線上的點 Q(x, y) 須滿足 (x− p,y − q) · (d,−c) = 0, 即 dx − cy = pd − qc. 這種描 述直線的方法就稱為是直線的 Cartesian equation. 既然 parametric equation 和 Cartesian equation 都能描述直線上的點, 所以這兩種 equations 都能互換. 我們看以下的例子.
Example 1.5.1. 考慮坐標平面上通過 P(2, 1) 且 direction vector 為 v = (1,−3) 的直線, 我 們可以得到此直線的點的 parametric equation 為 Q(x, y) = (2, 1) + t(1,−3) = (2 +t,1 − 3t).
也就是說坐標平面上的點 Q(x, y) 只要滿足 x = 2 + t, y = 1− 3t, 其中 t ∈ R 就會在此直 線上. 另外此直線的 normal vector 為 w = (3, 1), 對此直線上任意一點 Q(x, y), 皆須滿足 (3, 1)· (x − 2,y −1) = 0, 故得到此直線的 Cartesian equation 3x +y = 7. 注意對於任意 t ∈ R, x = 2 + t, y = 1− 3t 確實符合 3x + y = 7.
反之, 若先給定的是此直線的 Cartesian equation 3x + y = 7, 將 x 視為參數 t, 即令 x = t, 我們可得 y = 7− 3t. 也就是說 x = t,y = 7 − 3t, 也是此直線的 parametric equation. 所以 一個直線的 parametric 並不唯一 (其實 Cartesian equation 也不唯一, 但是僅差在多乘一 個係數很容易辨識). 不過若將剛剛求出的 parametric equation (x, y) = (t, 7− 3t) 改寫成 t(1,−3) + (0,7), 我們很快的認出此直線的 direction vector 為 (1,−3). 而且若令 t = 2, 我們 得 P(2, 1) 在此直線上, 所以它和我們一開始所得的 parametric equation (x, y) = (2 +t, 1−3t) 代表的是同一直線.
我們也可從投影的角度來看直線的 Cartesian equation. 前面已知若 n 為坐標平面上 一直線的 normal vector, 且考慮原點到此直線上一點 Q(x, y) 所形成的向量 (x, y), 則其
1.5. Parametric Equation and Cartesian Equation 19
Cartesian equation 可表示成 n· (x,y) = c, 其中 c ∈ R 這樣的形式. 回顧一下向量 (x,y) 對於 n 的 projection 為 n·(x,y)∥n∥2 n, 所以這告訴我們此直線上的點 Q(x, y) 都滿足對其 normal factor n 的投影向量為一固定向量 ∥n∥c2n, 反之亦然 (請參考下圖). 依此我們也推得原點到此直線 的最短距離為∥∥n∥c2n∥ =∥n∥|c|. 也就是說若直線的 Cartesian equation 為 ax + by = c, 則原點 到此直線的最短距離為 √|c|
a2+b2.
>
>
Q(x, y) n
Question 1.6. 假設 L 為坐標平面上其 Cartesian equation 為 n· (x,y) = c 的直線. 試說 明此坐標平面上一點 P(p, q) 到 L 上任一點 Q(x, y) 所形成的向量 (x− p,y − q) 對 n 的 projection 為
c− n · (p,q)
∥n∥2 n.
並依此證明坐標平面上一點 P(p, q) 到直線 ax + by = c 的最短距離為
|ap + bq − c|√ a2+ b2 .
同樣的, 在大家熟悉的坐標空間中的一平面, 我們可以利用該平面上一點 P(p1, p2, p3) 以及平面上兩個不平行的 direction vectors u = (u1, u2, u3), v = (v1, v2, v3) 得到此平面的 parametric equation (x, y, z) = (p1+ su1+ tv1, p2+ su2+ tv2, p3+ su3+ tu3), 其中 s,t∈ R. 我 們也可找到一個同時與 u, v 垂直的 normal vector w. 由於 P(p1, p2, p3) 到此平面上任 一點 Q(x, y, z) 所形成的向量 (x− p1, y− p2, z− p3) 皆可寫成 u, v 的線性組合, 所以必與 w 垂直, 我們得 (x− p1, y− p2, z− p3)· w = 0. 反之, 若坐標空間中任一點 Q(x,y,z) 若滿足 (x− p1, y− p2, z− p3)·w = 0, 表示 P(p1, p2, p3)到 Q(x, y, z) 所形成的向量 (x− p1, y− p2, z− p3) 可以寫成 u, v 的線性組合 (注意關於這個論述等待以後介紹完 “維度” 的概念後, 我們會有 完整的解釋), 因此知 Q(x, y, z) 會在此平面上. 也就是說 (x− p1, y− p2, z− p3)· w = 0 可以完 整的描述此平面上的點, 這就是此平面的 Cartesian equation. 我們看以下的例子.
Example 1.5.2. 考慮坐標空間上通過 P(0, 1, 1) 且 direction vectors 為 u = (2, 1, 0), v = (−5,0,1) 的平面, 我們可以得到此平面的點的 parametric equation 為 Q(x,y,z) = (0,1,1) + s(2, 1, 0) + t(−5,0,1) = (2s − 5t,1 + s,1 + t). 也就是說坐標空間上的點 Q(x,y,z) 只要滿足 x = 2s−5t, y = 1+s, z = 1+t 其中 s,t ∈ R 就會在此平面上. 另外我們可以檢查 w = (1,−2,5) 為此平面的 normal vector (即 w· u = w · v = 0), 對此平面上任意一點 Q(x,y,z), 皆須滿足 (1,−2,5) · (x − 0,y − 1,z − 1) = 0, 故得到此平面的 Cartesian equation x − 2y + 5z = 3. 注意 對於任意 s,t∈ R, x = 2s − 5t, y = 1 + s, z = 1 +t 確實符合 x − 2y + 5z = 3.
反之, 若先給定的是此平面的 Cartesian equation x− 2y + 5z = 3, 將 x 視為參數 s, y 視為參數 t, 我們可得 z = (3− s + 2t)/5. 也就是說 x = s,y = t,z = (3 − s + 2t)/5, 也是此 平面的 parametric equation. 要注意不像直線的情形對於平面我們較難利用 parametric equations 來判斷是否為相同的平面, 這是因為平面的 direction vectors 表法並不唯一.
不過若將剛剛所得的 parametric equation (x, y, z) = (s,t, (3− s + 2t)/5) 改寫成 (0,0,3/5) + s(1, 0,−1/5) +t(0,1,2/5), 我們可得到 direction vectors 為 u′= (1, 0,−1/5), v′= (0, 1, 2/5).
由於 u′= (−1/5)u, v′= u + (2/5)v 我們知道 u′, v′ 都可以寫成 u, v 的線性組合. 再加上令 s = 0,t = 1, 我們得 P(0, 1, 1) 在此平面上, 所以它和我們一開始所得的 parametric equation 代表的是同一平面.
同樣的, 我們也可從投影的角度來看坐標空間中一個平面的 Cartesian equation. 若 n 為此平面的 normal vector, 且考慮原點到此平面上一點 Q(x, y, z) 所形成的向量 (x, y, z), 則 其 Cartesian equation 可表示成 n· (x,y,z) = c, 其中 c ∈ R 這樣的形式. 由於向量 (x,y,z) 對 於 n 的 projection 為 n·(x,y,z)∥n∥2 n, 所以這告訴我們此平面上的點 Q(x, y, z) 都滿足對其 normal factor n 的投影向量為一固定向量 ∥n∥c2n, 反之亦然. 依此我們也推得原點到此平面的最短距 離為∥∥n∥c2n∥ =∥n∥|c|.
至於坐標空間中的直線, 由於和坐標平面一樣只要一個此直線通過的點 P(p1, p2, p3) 以及一個 direction vector v = (v1, v2, v3), 就可以完全描繪出此直線, 我們可得此直線上任 一點 Q(x, y, z) 須滿足 (x, y, z)− (p1, p2, p3) = t(v1, v2, v3), 故得其 parametric polynomial 為 (x, y, z) = (p1+ tv1, p2+ tv2,t3+ tv3). 由於在 R3 中和非零向量 v 垂直的向量需由兩個不 平行的向量 u, w 所 span 而成 (注意這兩個向量並不唯一, 另外以上的論述等待以後介 紹完 “維度” 的概念後, 我們會有完整的解釋), 所以我們無法用一個 Cartesian equation 將它描繪出來. 也就是說若 u, w 不平行且滿足 u· v = w · v = 0, 則任意此直線上的點 Q(x, y, z) 須同時滿足 (x− p1, y− p2, z− p3)·u = 0 以及 (x− p1, y− p2, z− p3)·w = 0 (因為向量 (x− p1, y− p2, z− p3)與 v 平行). 也因此此直線需符合聯立方程組 (x− p1, y− p2, z− p3)·u = 0, (x− p1, y− p2, z− p3)· w = 0, 從幾何的角度來說就是這兩個 Cartesian equation 所決定的兩 個平面的交集. 我們看以下的例子.
Example 1.5.3. 考慮坐標空間上通過 P(3, 0, 1) 且 direction vectors 為 v = (−1,1,1) 的直 線, 我們可以得到此直線上的點的 parametric equation 為 Q(x, y, z) = (3, 0, 1) + t(−1,1,1) = (3− t,t,1 + t). 也就是說坐標空間上的點 Q(x,y,z) 只要滿足 x = 3 − t, y = t, z = 1 + t 其 中 t∈ R 就會在此直線上. 另外我們可以檢查 u = (1,1,0),w = (1,2,−1) 皆與 v 垂直 (即 v· u = v · w = 0), 對此直線上任意一點 Q(x,y,z), 皆須滿足 (1,1,0) · (x − 3,y,z − 1) = 0 以及 (1, 2,−1) · (x − 3,y,z − 1) = 0 故得到此直線就是兩平面 x + y = 3 和 x + 2y − z = 2 的交集. 注 意對於任意 t∈ R, x = 3 −t, y = t, z = 1 +t 確實都符合 x + y = 3 和 x + 2y − z = 2. 另外要注 意若我們選擇了和 v 垂直的另兩個不平行向量 (例如 u′= (0, 1,−1),w′= (1, 0, 1)), 我們會得 到另一組的兩平面, 不過它們的交集仍會是同一直線.
反之, 若先給定的是此直線所符合的兩平面的 Cartesian equations x + y = 3 和 x + 2y− z = 2. 利用加減消去法將第一式乘以 2 減第二式, 削去 y 得 x + z = 4. 將 x 視為