第二章 文獻回顧
第一節 長期資料分析
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
6
第二章 文獻回顧
由於本研究主要是以長期追蹤方法分析台灣壽險業資產配置情 形,故本章文獻回顧探討之主題共分為兩部分:第一節介紹長期資料 分析與長期資料迴歸模型及其適合性檢定;第二節介紹長期資料分量 迴歸分析。
第一節 長期資料分析
壹、 長期資料分析之特點
所謂長期資料分析(longitudinal data analysis)即結合橫斷面分 析(cross section analysis)與時間數列分析(time series analysis),而 在社會科學與經濟領域上,長期資料分析亦被稱為追蹤資料分析
(panel data analysis)(Baltagi 2005)。
Diggle, Heagerty, Liang and Zeger(2002)指出橫斷面分析其資料 型態為每一觀察個體皆只觀測一次,此即為一般傳統的迴歸分析;而 長期資料分析之資料型態則是每一觀察個體內隨著時間被重複觀測,
且其主要的特點是其可區分世代效果(cohort effects)和年齡效果(age effects)。所謂世代效果即是一群體中整體地觀察個體間之變化;年齡 效果則是每一觀察個體內隨著時間的變化。因此,長期資料分析可同 時探討個體與個體之間的變異與單一個體內隨著時間的變化。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
7
以閱讀能力和孩童年齡之間的關係為例(Diggle et al. 2002),從 圖 1(a)對於閱讀能力和孩童年齡的假設性橫斷面研究,可以得知 閱讀能力隨著孩童年齡越大相對越差。圖 1(b)我們假設這些相同 的資料,是在長期資料研究中每一個體被重複觀測兩次所得到的,則 其不僅於橫斷面中顯示出孩童年齡越大其閱讀能力越差(此即世代效 果),並且亦於縱斷面中顯示出每位孩童的閱讀能力都隨著年齡的增 長而有所提升(此即年齡效果)。若長期資料研究其資料顯示如圖 1
(c),則無論橫斷面或縱斷面之型態皆有相同的結論為閱讀能力隨著 年齡增長而越差。
圖 1 閱讀能力和孩童年齡之間的關係
在長期資料研究的例子中,如圖 1(b)和圖 1(c),主要是說明 長期資料研究可區分個體內隨著時間之變化(年齡效果)和在相同時 間基準下個體間之變異(世代效果)的不同。然而,橫斷面研究則只
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
8
能探討世代效果。
接著可利用上述例子之說明,在不考慮截距項下,使用迴歸模型 的數學模式來探討長期資料之特性。首先定義變數符號:對 N個觀察 個體,每一個體均重複觀測 T 次,yit表示第 i 個個體在第 t 次所觀測 之反應變數,xit表示為解釋變數。
在橫斷面研究中,由於每個觀察個體皆只觀測一次(亦即 T =1),
所以在只有一個解釋變數的假設之下,模型可表示為:
y
i1
Cx
i1
i1, i 1 ,..., N
(1)其中βC表示為解釋變數每變動一單位,反應變數的平均變動量。
長期資料研究中,對每個觀察個體重複觀測 T 次,在同樣只有一 個解釋變數的假設之下,線性模型可表示為(Ware et al. 1990):
y
it
Cx
i1
L( x
it x
i1)
it, i 1 ,..., N , t 1 ,..., T
(2)當 T =1 時,式子(2)之模型則簡化為式子(1),因此βC與在橫斷 面的解釋相同。然而,現在亦可藉由式子(2)與式子(1)相減來解 釋βL,模型表示為:
x
x y
y
it i1)
L(
it i1)
it i1(
(3)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
9
其中βL表示對於某一既定個體內,隨著時間改變,解釋變數 xit與 xi1
之差量每變動一單位,反應變數差量的平均變動量。應用在上述例子 中,圖 1(b)表示βC和βL有著相異的符號,圖 1(c)則表示有著 相同的符號。
Diggle et al.(2002)提到若想從橫斷面研究中估計個體隨著時間 如何變化,則必須考慮假設βC =βL。然而,對於長期資料研究,因 為βC 和βL 兩者皆可被估計,所以此假設是不需要的。即使當βC = βL,長期資料研究亦較橫斷面研究更具有效性(efficiency)。
在長期資料研究中多數情況,個體之間常因諸如環境因素、個人 習慣…等無法測量的特性之影響而造成相當大的變異,且這些特性是 不易隨著時間而消逝。然而此影響在βL 的估計中是會被忽略,但不 會被βC的估計忽略。
Diggle et al.(2002)亦提到長期資料研究的優點是其可區分以下 二者之不同,一為同一個體內隨著時間的改變在反應變數上的變異,
另一為不同個體間在反應變數上的變異。在橫斷面資料研究中,對於 某一個體的估計是利用其他個體的觀察值來做推論,但是整體的平均 化卻忽視了個體之間固有的差異性。因此,若在橫斷面研究中,個體 之間變異小時,對於某一個體的估計仍可利用其他個體的觀察值來做 推論;然而,如個體之間變異大時,若在長期資料分析中,我們能夠
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
10
認知個體之間固有的差異性。
Hsiao(2003)和 Klevmarken(1989)亦提出關於使用追蹤資料 分析之助益,其中包括:(1)個體異質(individual heterogeneity)的 控制;(2)給予更多的訊息資料、自由度與有效性,以及在變數之間 有較低的共線性。
貳、 長期資料迴歸模型
長期資料研究中,其資料是屬於針對每一觀察個體隨著時間被重 複觀測的型態, Hsiao(2003)將一般長期資料線性模型表示為:
yit α*it βitxit uit , i 1,...,N , t 1,...,T (4)
其中,α*it 和βit (β1it,β2it,...,βKit) 分別為 11 的常數和1K的常數向 量,xit (x1it,x2it,...,xKit)為一1K的解釋變數向量,且 uit 為誤差項,
u
it ~ iid(0,u2)。Baltagi(2005)指出長期資料迴歸模型可考慮個體特定效果
(individual-specific effect)、時間特定效果(time-specific effect)或 兩者同時考慮,若僅單獨考慮其中之一特定效果,稱為一因子誤差成 分迴歸模型(one-way error component regression model);若兩者同 時考慮,則稱為二因子誤差成分迴歸模型(two-way error component regression model)。
‧
不考慮不可觀察的個體特定效果( unobservable individual-specific effect)。總合模型型式如下所示:‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
12
Hsiao(2003)亦指出由於總合模型不考慮不可觀察的個體特定 效果,因此,當使用總合模型進行分析時,將無法控制個體之特性。
如若資料結構中確實存有不可觀察的個體特定效果,則用總合模型估 計的結果將會產生異質偏誤(heterogeneity bias)。
二. 固定效果模型(fixed effects model)
固定效果模型是假設對每一個體其斜率係數皆是相同的,但截距 項卻不相同,亦即將不可觀察的個體特定效果視為被估計的固定常數。
因此,使用固定效果模型進行分析時,由於個體間擁有各自不同的截 距項,如此將允許控制個體之特性,而呈現出個體間之差異。固定效 果模型如下:
y
it α
*i β x
it u
it, i
1,..., N , t
1,..., T
(8)其中,β是1K的常數向量;α*i 是 11 的數值常數,代表第 i 個個 體特定效果,並且假設 uit 與 (xi1,xi2,...,xiT)不相關,uit ~ iid(0,u2)。
Baltagi(2005)指出若以公司為例,此不可觀察的公司特定效果
(unobservable firm-specific effects)將會被α*i 所捕捉,並且認為這些 特性諸如公司執行者的企業家能力或管理技能。
接著,我們將(8)以向量之形式表示為:
‧
least squares (OLS) estimator)即為最佳線性不偏估計(Best linear unbiased estimator,BLUE)。我們可藉由極小化(10)求得 αi*和 β 的
‧
OLS 估計(12)稱為最小平方虛擬變數(Least squares dummy variable
,LSDV ) 估計;亦因其估計形式只利用到群內變異,所以又稱為群 內估計(within-group estimator)。
而另一與(8)等價之型式,我們將其表示為:
y
it β x
it α
i u
it, i 1 ,..., N , t 1 ,..., T
(13)其中,μ為平均截距(mean intercept),αi表示為第 i 個個體與共同平 均μ之差的效果;且μ和
α
i皆是固定常數。三. 隨機效果模型(random effects model)
隨機效果和固定效果差別在於,固定效果是假設個體特定效果
α
i*‧
(見 Graybill (1969);Nerlove (1971);Wallace and Hussain (1969))。
因為 vit和 vis兩者皆包含
α
i,所以(14)的誤差是相關的。為了得 到δ
( , β
) 的 有 效 估 計 值 , 我 們 必 須 使 用 廣 義 最 小 平 方 方 法 (Generalized least squares (GLS) method)。對於 GLS 估計的正規方程 式如下所示:根據 Maddala (1971),可將(16)表示為下面形式:
Q T
‧
‧
估計量βˆbetween稱為群間估計(between-group estimator)。
Hsiao(2003)亦指出 GLS 估計(20)是群間估計和群內估計的加 權平均,若2= 0,則
1,如此δGLS將收斂到 OLS 估計Tx~-~x1Tx~y;若 型之檢定方法,可透過 F test、Lagrange Multiplier test(LM test)以 及 Hausman test 三種檢定作為檢測,分述如下:‧
為總和模型中 OLS 之殘差平方和;未限制的殘差平方和(unrestricted residual sums of squares,URSS)則為固定效果模型中 LSDV 之殘差 平方和(Baltagi 2005)。若檢定結果拒絕虛無假設,則表示個體間擁有各自不同的截距項,
此時,使用固定效果模型會較總合模型適合;反之,則是使用總合模 型較適合。
2. LM test
對於隨機效果模型,Breusch and Pagan(1980)提出 Lagrange multiplier(LM)test 來檢定 αi之變異數是否顯著異於 0,亦即檢定
0
‧
之 GLS 將達 Cramer-Rao 下界(Cramer-Rao lower bound,CRLB),且 其為 BLUE;但是若在H1: E(i | Xi)0之下,GLS 會是一個有偏
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
20