第四章 研究方法
第一節 研究方法介紹
第四章 第四章
第四章 研究方法 研究方法 研究方法 研究方法
第一節 第一節
第一節 第一節 研究方法介紹 研究方法介紹 研究方法介紹 研究方法介紹
由於前章各研究文獻中,大多採用傳統的多元複迴歸實證方式,以橫斷面資 料(Cross Section Data)為研究樣本,較少採用 Panel Data11,因此,本研究擬採用 Panel Data 作為實證方法,衡量生技新藥產業研發投入活動與新藥公司股票價值 的關係。
本小結將針對 Panel Data、其相關模型及檢定作簡略介紹。
一 一 一
一. .. . Panel Data 介紹 介紹 介紹 介紹
1. 何謂縱橫資料何謂縱橫資料何謂縱橫資料何謂縱橫資料(Panel Data)
傳統迴歸分析方法進行實證研究,多半採用橫斷面(Cross Section)或時間 序列12(Time Series)資料作為主要研究樣本。近年來,Panel Data 逐漸普及 後,相應的實證計量方法才開始蓬勃發展。所謂 Panel Data,是指針對相同 個人、家戶、公司廠商、產業或國家,連續調查多年蒐集的資料,頻率大多 一年一次,少數亦有以季或月為單位的高頻率 Panel Data。無庸置疑地,此 種資料之蒐集須耗費大量時間與成本,因此在過去並不普遍,從前述定義中 我們可以知道,Panel Data 同時包含橫斷面與時間序列兩種特性,每年度觀 察許多橫斷面個人、家戶、公司廠商、產業或國家,同一對象連續觀察多 年。此特性為 Panel Data 的重要之處,表示該種資料蘊含的資訊較單純的橫 斷面或時間序列資料更佳豐富多元,因此漸漸受到學者們的重視,因此,為 了能夠充分的萃取資料中有用的資訊,Panel Data 迴歸模型通常較為複雜,
同時也是近年來計量經濟理論發展的重點之一。(黃台心 2009)
────────────────
11亦稱縱橫資料、追蹤資料、面板數據,本文均使用 Panel Data 一詞。
12亦稱時間數列
2. Panel Data 的優點與限制的優點與限制的優點與限制 的優點與限制
從前述介紹中可知道 Panel Data 兼具有橫斷面與時間數列的特性,以下 將針對 Panel Data 特性,簡述其優點以及限制:
Panel Data 之優點包括:
A. 控制個體的異質性
B. 提供更多樣本資訊、更多變化性,減少變數間之共線性,使樣本具 更多自由度並提升有效性
C. 較佳的動態行為分析方法
D. 更能夠認定與衡量單純之橫斷面或時間序列資料所不能發現的效果 E. 個體資料較總體資料對於相同變數之衡量較為精確
F. 較單純之橫斷面或時間序列資料更能建構並檢測較複雜的行為模式 Panel Data 之限制包括:
A. 資料蒐集不易 B. 資料期間較短 (Baltagi, B.H. 2005)
基於上述優點,本文將採用生技新藥公司之 Panel Data 作為研究對象。
二 二 二
二. .. . Panel Data 模型 模型 模型 模型--共同迴歸模型 共同迴歸模型 共同迴歸模型 共同迴歸模型、 、 、固定效果模型與隨機效果模型 、 固定效果模型與隨機效果模型 固定效果模型與隨機效果模型 固定效果模型與隨機效果模型
前述簡略介紹完 Panel Data,接下來將針對 Panel Data 主要的迴歸模型作介 紹,其迴歸分析方法主要有三種,如傳統橫斷面或時間數列分析方式之「共同迴 歸模型」,將樣本個體之差異區分為具有固定或隨機效果之「固定效果模型」及
「隨機效果模型」,茲分述如下:
1. 共同迴歸模型共同迴歸模型共同迴歸模型共同迴歸模型(Pooled Regression Model) 共同迴歸模型之迴歸式為:
1 K
it k kit it
k
Y α β X ε
=
= + ∑ +
(4.1)其中, N 為單位個數
T
為時間期數
K
為待估計參數個數Yi t,i = 1, 2 ,⋅ ⋅ ⋅,N t; =1, 2 ,⋅ ⋅ ⋅,T 為第
i
個單位於第t
期的被解釋變數 Xk it,k =1, 2 ,⋅ ⋅ ⋅,K 為第i
個單位於第t
期的第 k個解釋變數
β
k 為第 k個解釋變數之迴歸係數α
為截距項,所有單位皆相同ε
it 為誤差項,且εit∼
iid( 0 ,
σ2ε)
此迴歸模型將所有資料合併進行一個最小平方法(Ordinary Least Square)迴歸,並假設截距項為固定的,不隨時間或個體而有差異,共同 迴歸簡單,而且可以增加樣本數,但忽略個體間/不同期間的差異,是以 若欲考慮不同單位間的差異性,則需針對截距項具有不同的假設。
2. 固定效果模型固定效果模型固定效果模型固定效果模型(Fixed Effect Model, FE)
固定效果模型之迴歸式為:
1 1
N K
it i j i k kit it
j k
Y D α β X ε
= =
=
∑
+∑
+ (4.2) 其中,α
i為第i
個單位之截距項,為特定常數
D
i j為虛擬變數,且D
i j= 1, if i = j D ;
i j= 0, . . ow
ε
it 為誤差項,且εit∼
iid( 0 ,
σ2ε)
此迴歸模型由於利用虛擬變數將各別個體的效果分開表示,故文獻 上稱作為最小平方虛擬變數模型(Least Squares Dummy Variable Model),
簡稱 LSDV 模型,其中的αi在文獻中稱為個別效果(Individual Effect),
不隨時間變動而改變,但不同單位卻有不同個別效果,而固定模型中,
將αi視為特定常數,而不同單位有不同特定常數,認為不同單位的差
異,可被不同個別效果所解釋,視每個αi為待估計未知參數,也稱作共 變數模型(Covariance Model)。
3. 隨機效果模型隨機效果模型隨機效果模型隨機效果模型(Random Effect Model, RE) 採用一般化最小平方法(General Least Square, GLS)進行估計,或採用最 大概似法(Maximum Likelihood, ML)來估計參數。
三 三 三
三. .. . 檢定與模型選擇 檢定與模型選擇 檢定與模型選擇 檢定與模型選擇--F 檢定 檢定 檢定與 檢定 與 與 與 Hausman 檢定 檢定 檢定 檢定
混合迴歸、固定效果及隨機效果模型中,須利用檢定方法以選擇出最佳的模 型以進行實證分析,以下為常用之檢定:
1. F 檢定檢定檢定檢定(F Test)
欲檢測是否每個單位的截距項均不相同,決定固定效果模型相較於共同 迴歸模型是否更具參考價值,可以利用F檢定,其檢定之假設為:
H
0:α α
i= j,∀ ≠ ,意即所有單位截距項完全相等i j
H
a: α α
i≠
j, ∀ ≠ i j
,意即所有單位截距項不完全相等檢定統計量: ( 1, 1)
( 1)
( +1)
pooled fixed
N N T N K
fixed
SSE SSE N
F
− − − +SSE N T N K
− −
= − −
(4.4)其中,
SSE
pooled為共同迴歸模型之殘差平方和
SSE
fixed為固定效果模型之殘差平方和 (N −1)及(NT −N −K+1)為F檢定之自由度
H
0為真的情況下,檢定統計量F
服從自由度為(N −1)及(NT −N −K+1) 的F 分配,若檢定結果為拒絕 H
0時,表示各單位間的截距項並不完全相同,存在個別差異,應採用固定效果模型較佳;若其結果不拒絕
H
0時,則採用共 同迴歸模型可能是較為適當的選擇。2. Hausman 檢定檢定檢定檢定(Hausman Test)
若想要考慮固定效果模型與隨機效果模型何者較為適用,則需考慮另外的 檢定方式, Hausman(1978)提出之 Hausman 檢定,其假設為:
H
0 : ( ,E u X
i it)= ,意即隨機誤差與解釋變數無關; 0H
a: E u X (
i,
it) ≠ 0
,意即隨機誤差與解釋變數相關 檢定統計量:
H = ( β
∧fixed− β
∧random) (
T∑
∧fixed−∑
∧random) (
−1β
∧fixed− β
∧random)
(4.6) 其中,fixed
β
∧ 、β
∧random分別為固定效果模型與隨機效果模型係數估計式向量fixed
∑∧ 、 random
∑∧ 分別為固定效果模型與隨機效果模型共變異數矩陣
H
0為真的情況下,檢定統計量H
服從自由度為K − 的卡方分配,若檢
1 定結果為拒絕H
0時,顯示模型中隨機誤差與解釋變數相關,兩種模型係數估計值差異甚大,固定效果模型為較正確的模型設定;若其結果不拒絕
H
0時,兩種模型的估計值差別僅有抽樣誤差,則採用隨機效果模型較為佳。
在檢定固定效果模型與隨機效果模型時,其虛無假設隱含了兩種模型皆 具有一致性,然而,由於隨機效果模型相對於固定效果模型更具有效性,故 若無法拒絕虛無假設時,應採取隨機效果模型較佳。
一般而言,檢定統計量
H
應為正值,然而當樣本數較小時,得到負值也 並非不可能,當H
為負值時,強 烈 地 表 示 兩 個 模 型 中 被 比 較 的 迴 歸 係數 相 同 , 抑 或 是 說 無 顯 著 差 異 , 因 此 原 假 說 不 能 被 拒 絕 , 尤 其 是 小 樣 本 中 很 可 能 出 現 。 而 文 獻 中 也 有 提 到 當 Hausman 檢 定 之 卡 方 值 為 負 時 , 將 其 視 為 0 可 能 是 較 為 正 確 的 選 擇 。 (Greene, 2003)