第三章 研究方法
3.3 多元迴歸分析
48
的主成分能保有原來變數最多的資訊,即主成分有最大的變異數。
主 成 分 分 析 將 多 個 有 相 關 的 變 數 簡 化 為 少 數 沒 有 相 關 的 主 成 分 ,經 由 樣 本
x
1, x
2, L , x
n所 估 計 的 相 關 矩 陣 R ,可 得 到 該 矩 陣 的 特 徵 值λ λ
1, 2,L ,λ
n ,則 λ i 所 對 應 的 特 徵 向 量α
i,則1 1 2 1 1
1 2
1 2
, , ,
n n
n n n n
α α α
α α α
α α α
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
= ⎜ ⎟ = ⎜ ⎟ = ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠
M M L M
(3.2.5)其 中
α α
i i′ = ,I R α
i =λα
i i。 利 用α
i將 x轉 換 成 第 i 個 主 成 份F , 轉 換 結 果 如 下 :
第一主成份為:
F
1 =α
11 1x
+α
12 2x
+L+α
1n nx
第二主成份為:F
2 =α
21 1x
+α
22 2x
+L+α
2n nx
M第n主成份為:
F
n =α
n1 1x
+α
n2 2x
+L+α
nnx
n為了達到簡化的目的,通常主成份個數只取最大m個來替代原本的 n個變數,而這m個變數可解釋原始變數變異數的比例為
2 1 2
1 2
m n
R λ λ λ
λ λ λ
+ + +
= + +L+
L (3.2.6)
49
一、迴歸分析基本假設(殘差分析) (一)常態性
對任何一個自變數X 而言,依變數 Y 是常態分配的,平均數為
/
μ
Y X,變異數為σ
2。本研究利用迴歸方程式的殘差相關檢定,繪製 標準化殘差值的次數分配圖與標準化殘差值的常態機率(P-P)圖,檢 定殘差項是否符合常態分配。(二)獨立性
每一個依變數 Y 彼此之間是統計獨立,觀察值之間彼此不會互 相引響。本研究將利用 D-W 檢定(Durbin-Watson Test)用以檢定觀測 資料,是否合乎獨立性的假設。
2 1 2
2 1
( )
n
i i
i n
i i
E E DW
E
= −
=
−
=
∑
∑
(3.3.1)Where Ei = −Yi Y iˆ , 1,2,3, ,i = L n
若 DW 值小時,表示殘差是正相關;若大時,表示負相關。當 DW 值愈接近 2 時(範圍為 1.5~2.5 之間),殘差項間愈無相關;當 DW 值愈接近 0 時,殘差項間正相關愈強;當 DW 值愈接近 4 時,殘差 項間負相關愈強。
(三)恆常性
即 迴 歸 殘 差 值 的 變 異 量 為 固 定 的 常 數,不會因為變數值而 改變原使得型態。若迴歸標準化殘差值與變數的散佈圖呈現一水平帶 狀,代表殘差值的變異量為固定值,即符合迴歸殘差恆常性。
當 迴 歸 方 程 式 滿 足 上 述 三 個 基 本 假 設 時,代 表 此 迴 歸 方 程 式 具 有 線 性 特 性 , 稱 為 線 性 迴 歸 。 如 果 資 料 違 反 基 本 假 設 時 , 可 將 變 數 加 以 轉 換 , 譬 如 採 取 對 數 、 平 方 根 或 倒 數 。
50
二、多元迴歸模式
本 研 究 將 17 項 專 利 指 標 利 用 因 素 分 析 萃 取 出 不 同 的 主 成 份 之 後 , 再 利 用 多 元 迴 歸 模 式 分 析 依 變 數( 專 利 訴 訟 賠 償 金 額)Y 與 自 變 數 (各 個 主 成 份 )F 之 間 的 線 性 關 係 , 多 元 迴 歸 基 本 模 式 為
0 1 1 2 2
i i i m mi i
Y
=β
+β F
+β F
+L+β F
+ε
(3.3.2) 或1 ( 1) ( 1) 1 1
n n m m n
Y
× =F
× +β
+ × +ε
× 或1 11 1 0 1
2 21 1 1 2
1
1 1 1
m m
n n nm m n
Y F F
Y F F
Y F F
β ε
β ε
β ε
⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢ ⎥ ⎢= ⎥ ⎢ ⎥ ⎢ ⎥+
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦
L L
M M M M M M M
L
(3.3.3)
其中
ε
i為多元迴歸基本模式的殘差值,彼此之間互相獨立且屬常態 分配,ε
i ~N (0,σ
2)
,i
=1,2, ,L ,接著利用最小平方法(Original Least n
Square,OLS),估計多元迴歸方程式的係數值為
1 1
1
0 2
1 1 1
( ) ,
m m
i i
i i
m m m
i i i i
i i i
m F Y
F F F Y Y F
F F FY
β
− = =β β
= = =
⎛ ⎞⎛ ⎞
⎜ ⎟⎜ ⎟
⎜ ⎟⎜ ⎟
′ ′
= = = −
⎜ ⎟⎜ ⎟
⎜ ⎟⎜ ⎟
⎝ ⎠⎝ ⎠
∑ ∑
∑ ∑ ∑
(3.3.4)三 、 多 元 共 線 性 分 析
共 線 性 指 的 是 由 於 自 變 數 之 間 的 相 關 性 太 高,具 有 共 線 性 變 數 所 提 供 的 訊 息 相 似,使 研 究 結 果 無 法 分 辨 出 個 別 變 數 的 效 果 , 因 此 變 數 項 之 間 如 果 存 在 著 共 線 性 問 題 , 表 示 一 個 自 變 數 是 其 他 字 變 相 的 線 性 組 合 , 例 如 有 兩 個 自 變 項
X 與
1X , 兩 自
2 變 項 具 有 完 全 共 線 性 , 則X
1= +a bX
2, 所 以 一 自 變 項 與 其 他 自 變 項 之 間 具 有 共 線 性 問 題 時,這 個 自 變 項 的 迴 歸 係 數 估 計 值 不 夠 穩 定 , 而 迴 歸 係 數 的 計 算 值 也 會 有 很 大 的 誤 差 。51
通 常 診 斷 共 線 性 的 問 題 可 由 容 忍 度(tolerance)或 變 異 數 膨 脹 因 素(variance inflation factor, VIF)作 為 共 線 性 的 量 度 。 容 忍 度 與 VIF 的 公 式 分 別 為 (3.4.4)與 (3.4.5):
1 2
tolerance = − R (3.3.5)
2
1
VIF
1=
R
− (3.3.6)
其中
R 是此自變項與其他自變項間的多元相關係數的平方,即模式
2 中其他自變項對此變項的解釋能力,因此如果其他自變項對此變項解釋 能力越高,即若容忍度越小,代表此變項與其他變項間存在線性關係;VIF 值為容忍度的倒數,因此容忍度越小,即 VIF 越大,代表此變項與 其他變項間存在線性關係。
52