• 沒有找到結果。

多元迴歸分析

在文檔中 中 華 大 學 碩 士 論 文 (頁 58-62)

第三章 研究方法

3.3 多元迴歸分析

48

的主成分能保有原來變數最多的資訊,即主成分有最大的變異數。

主 成 分 分 析 將 多 個 有 相 關 的 變 數 簡 化 為 少 數 沒 有 相 關 的 主 成 分 ,經 由 樣 本

x

1

, x

2

, L , x

n所 估 計 的 相 關 矩 陣 R ,可 得 到 該 矩 陣 的 特 徵 值

λ λ

1, 2,L ,

λ

n ,則 λ i 所 對 應 的 特 徵 向 量

α

i,則

1 1 2 1 1

1 2

1 2

, , ,

n n

n n n n

α α α

α α α

α α α

⎛ ⎞ ⎛ ⎞ ⎛ ⎞

⎜ ⎟ ⎜ ⎟ ⎜ ⎟

= ⎜ ⎟ = ⎜ ⎟ = ⎜ ⎟

⎜ ⎟ ⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠ ⎝ ⎠

M M L M

(3.2.5)

其 中

α α

i i′ = ,

I R α

i =

λα

i i。 利 用

α

ix轉 換 成 第 i 個 主 成 份

F , 轉 換 結 果 如 下 :

第一主成份為:

F

1 =

α

11 1

x

+

α

12 2

x

+L+

α

1n n

x

第二主成份為:

F

2 =

α

21 1

x

+

α

22 2

x

+L+

α

2n n

x

M

n主成份為:

F

n =

α

n1 1

x

+

α

n2 2

x

+L+

α

nn

x

n

為了達到簡化的目的,通常主成份個數只取最大m個來替代原本的 n個變數,而這m個變數可解釋原始變數變異數的比例為

2 1 2

1 2

m n

R λ λ λ

λ λ λ

+ + +

= + +L+

L (3.2.6)

49

一、迴歸分析基本假設(殘差分析) (一)常態性

對任何一個自變數X 而言,依變數 Y 是常態分配的,平均數為

/

μ

Y X,變異數為

σ

2。本研究利用迴歸方程式的殘差相關檢定,繪製 標準化殘差值的次數分配圖與標準化殘差值的常態機率(P-P)圖,檢 定殘差項是否符合常態分配。

(二)獨立性

每一個依變數 Y 彼此之間是統計獨立,觀察值之間彼此不會互 相引響。本研究將利用 D-W 檢定(Durbin-Watson Test)用以檢定觀測 資料,是否合乎獨立性的假設。

2 1 2

2 1

( )

n

i i

i n

i i

E E DW

E

=

=

=

(3.3.1)

Where Ei = −Yi Y iˆ , 1,2,3, ,i = L n

若 DW 值小時,表示殘差是正相關;若大時,表示負相關。當 DW 值愈接近 2 時(範圍為 1.5~2.5 之間),殘差項間愈無相關;當 DW 值愈接近 0 時,殘差項間正相關愈強;當 DW 值愈接近 4 時,殘差 項間負相關愈強。

(三)恆常性

即 迴 歸 殘 差 值 的 變 異 量 為 固 定 的 常 數,不會因為變數值而 改變原使得型態。若迴歸標準化殘差值與變數的散佈圖呈現一水平帶 狀,代表殘差值的變異量為固定值,即符合迴歸殘差恆常性。

當 迴 歸 方 程 式 滿 足 上 述 三 個 基 本 假 設 時,代 表 此 迴 歸 方 程 式 具 有 線 性 特 性 , 稱 為 線 性 迴 歸 。 如 果 資 料 違 反 基 本 假 設 時 , 可 將 變 數 加 以 轉 換 , 譬 如 採 取 對 數 、 平 方 根 或 倒 數 。

50

二、多元迴歸模式

本 研 究 將 17 項 專 利 指 標 利 用 因 素 分 析 萃 取 出 不 同 的 主 成 份 之 後 , 再 利 用 多 元 迴 歸 模 式 分 析 依 變 數( 專 利 訴 訟 賠 償 金 額)Y 與 自 變 數 (各 個 主 成 份 )F 之 間 的 線 性 關 係 , 多 元 迴 歸 基 本 模 式 為

0 1 1 2 2

i i i m mi i

Y

=

β

+

β F

+

β F

+L+

β F

+

ε

(3.3.2) 或

1 ( 1) ( 1) 1 1

n n m m n

Y

× =

F

× +

β

+ × +

ε

×

1 11 1 0 1

2 21 1 1 2

1

1 1 1

m m

n n nm m n

Y F F

Y F F

Y F F

β ε

β ε

β ε

⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤

⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥

⎢ ⎥ ⎢= ⎥ ⎢ ⎥ ⎢ ⎥+

⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥

⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥

⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦

L L

M M M M M M M

L

(3.3.3)

其中

ε

i為多元迴歸基本模式的殘差值,彼此之間互相獨立且屬常態 分配,

ε

i ~

N (

0,

σ

2

)

,

i

=1,2, ,L ,接著利用最小平方法(Original Least

n

Square,OLS),估計多元迴歸方程式的係數值為

1 1

1

0 2

1 1 1

( ) ,

m m

i i

i i

m m m

i i i i

i i i

m F Y

F F F Y Y F

F F FY

β

= =

β β

= = =

⎛ ⎞⎛ ⎞

⎜ ⎟⎜ ⎟

⎜ ⎟⎜ ⎟

′ ′

= = = −

⎜ ⎟⎜ ⎟

⎜ ⎟⎜ ⎟

⎝ ⎠⎝ ⎠

∑ ∑

∑ ∑ ∑

(3.3.4)

三 、 多 元 共 線 性 分 析

共 線 性 指 的 是 由 於 自 變 數 之 間 的 相 關 性 太 高,具 有 共 線 性 變 數 所 提 供 的 訊 息 相 似,使 研 究 結 果 無 法 分 辨 出 個 別 變 數 的 效 果 , 因 此 變 數 項 之 間 如 果 存 在 著 共 線 性 問 題 , 表 示 一 個 自 變 數 是 其 他 字 變 相 的 線 性 組 合 , 例 如 有 兩 個 自 變 項

X 與

1

X , 兩 自

2 變 項 具 有 完 全 共 線 性 , 則

X

1= +

a bX

2, 所 以 一 自 變 項 與 其 他 自 變 項 之 間 具 有 共 線 性 問 題 時,這 個 自 變 項 的 迴 歸 係 數 估 計 值 不 夠 穩 定 , 而 迴 歸 係 數 的 計 算 值 也 會 有 很 大 的 誤 差 。

51

通 常 診 斷 共 線 性 的 問 題 可 由 容 忍 度(tolerance)或 變 異 數 膨 脹 因 素(variance inflation factor, VIF)作 為 共 線 性 的 量 度 。 容 忍 度 與 VIF 的 公 式 分 別 為 (3.4.4)與 (3.4.5):

1 2

tolerance = − R (3.3.5)

2

1

VIF

1

=

R

− (3.3.6)

其中

R 是此自變項與其他自變項間的多元相關係數的平方,即模式

2 中其他自變項對此變項的解釋能力,因此如果其他自變項對此變項解釋 能力越高,即若容忍度越小,代表此變項與其他變項間存在線性關係;

VIF 值為容忍度的倒數,因此容忍度越小,即 VIF 越大,代表此變項與 其他變項間存在線性關係。

52

在文檔中 中 華 大 學 碩 士 論 文 (頁 58-62)