長期資料分析 - 文獻回顧 - 台灣壽險業國外投資與績效之長期追蹤分析

第二章文獻回顧

第一節長期資料分析

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第二章文獻回顧

由於本研究主要是以長期追蹤方法分析台灣壽險業資產配置情形，故本章文獻回顧探討之主題共分為兩部分：第一節介紹長期資料分析與長期資料迴歸模型及其適合性檢定；第二節介紹長期資料分量迴歸分析。

第一節長期資料分析

壹、長期資料分析之特點

所謂長期資料分析（longitudinal data analysis）即結合橫斷面分析（cross section analysis）與時間數列分析（time series analysis），而在社會科學與經濟領域上，長期資料分析亦被稱為追蹤資料分析

（panel data analysis）（Baltagi 2005）。

Diggle, Heagerty, Liang and Zeger（2002）指出橫斷面分析其資料型態為每一觀察個體皆只觀測一次，此即為一般傳統的迴歸分析；而長期資料分析之資料型態則是每一觀察個體內隨著時間被重複觀測，

且其主要的特點是其可區分世代效果（cohort effects）和年齡效果（age effects）。所謂世代效果即是一群體中整體地觀察個體間之變化；年齡效果則是每一觀察個體內隨著時間的變化。因此，長期資料分析可同時探討個體與個體之間的變異與單一個體內隨著時間的變化。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

以閱讀能力和孩童年齡之間的關係為例（Diggle et al. 2002），從圖 1（a）對於閱讀能力和孩童年齡的假設性橫斷面研究，可以得知閱讀能力隨著孩童年齡越大相對越差。圖 1（b）我們假設這些相同的資料，是在長期資料研究中每一個體被重複觀測兩次所得到的，則其不僅於橫斷面中顯示出孩童年齡越大其閱讀能力越差（此即世代效果），並且亦於縱斷面中顯示出每位孩童的閱讀能力都隨著年齡的增長而有所提升（此即年齡效果）。若長期資料研究其資料顯示如圖 1

（c），則無論橫斷面或縱斷面之型態皆有相同的結論為閱讀能力隨著年齡增長而越差。

圖 1 閱讀能力和孩童年齡之間的關係

在長期資料研究的例子中，如圖 1（b）和圖 1（c），主要是說明長期資料研究可區分個體內隨著時間之變化（年齡效果）和在相同時間基準下個體間之變異（世代效果）的不同。然而，橫斷面研究則只

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

能探討世代效果。

接著可利用上述例子之說明，在不考慮截距項下，使用迴歸模型的數學模式來探討長期資料之特性。首先定義變數符號：對 N個觀察 個體，每一個體均重複觀測 T 次，yit表示第 i 個個體在第 t 次所觀測 之反應變數，xit表示為解釋變數。

在橫斷面研究中，由於每個觀察個體皆只觀測一次（亦即 T =1），

所以在只有一個解釋變數的假設之下，模型可表示為：

y

_i₁

 

x

_i₁

 

_i₁

, i  1 ,..., N

（1）

其中βC表示為解釋變數每變動一單位，反應變數的平均變動量。

長期資料研究中，對每個觀察個體重複觀測 T 次，在同樣只有一 個解釋變數的假設之下，線性模型可表示為（Ware et al. 1990）：

y

_it

 

x

_i₁

 

( x

_it

 x

_i₁

)  

_it

, i  1 ,..., N , t  1 ,..., T

（2）

當 T =1 時，式子（2）之模型則簡化為式子（1），因此βC與在橫斷面的解釋相同。然而，現在亦可藉由式子（2）與式子（1）相減來解釋βL，模型表示為：

x

x y

y

_it _i₁

)

(

_it _i₁

)

_it _i₁

(        

（3）

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

其中βL表示對於某一既定個體內，隨著時間改變，解釋變數 xit與 xi1

之差量每變動一單位，反應變數差量的平均變動量。應用在上述例子中，圖 1（b）表示βC和βL有著相異的符號，圖 1（c）則表示有著相同的符號。

Diggle et al.（2002）提到若想從橫斷面研究中估計個體隨著時間如何變化，則必須考慮假設βC =βL。然而，對於長期資料研究，因為βC 和βL 兩者皆可被估計，所以此假設是不需要的。即使當βC = βL，長期資料研究亦較橫斷面研究更具有效性（efficiency）。

在長期資料研究中多數情況，個體之間常因諸如環境因素、個人習慣…等無法測量的特性之影響而造成相當大的變異，且這些特性是不易隨著時間而消逝。然而此影響在βL 的估計中是會被忽略，但不會被βC的估計忽略。

Diggle et al.（2002）亦提到長期資料研究的優點是其可區分以下二者之不同，一為同一個體內隨著時間的改變在反應變數上的變異，

另一為不同個體間在反應變數上的變異。在橫斷面資料研究中，對於某一個體的估計是利用其他個體的觀察值來做推論，但是整體的平均化卻忽視了個體之間固有的差異性。因此，若在橫斷面研究中，個體之間變異小時，對於某一個體的估計仍可利用其他個體的觀察值來做推論；然而，如個體之間變異大時，若在長期資料分析中，我們能夠

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

認知個體之間固有的差異性。

Hsiao（2003）和 Klevmarken（1989）亦提出關於使用追蹤資料分析之助益，其中包括：（1）個體異質（individual heterogeneity）的控制；（2）給予更多的訊息資料、自由度與有效性，以及在變數之間有較低的共線性。

貳、長期資料迴歸模型

長期資料研究中，其資料是屬於針對每一觀察個體隨著時間被重複觀測的型態， Hsiao（2003）將一般長期資料線性模型表示為：

y_it α^*_it  β_itx_it u_it , i 1,...,N , t 1,...,T （4）

其中，α^*_it 和β_it (β₁_it,β₂_it,...,β_Kit) 分別為 11 的常數和1K的常數向量，x_it (x₁_it,x₂_it,...,x_Kit)為一1K的解釋變數向量，且 u_it 為誤差項，

u

_it ~ iid（0,_u²）。

Baltagi（2005）指出長期資料迴歸模型可考慮個體特定效果

（individual-specific effect）、時間特定效果（time-specific effect）或兩者同時考慮，若僅單獨考慮其中之一特定效果，稱為一因子誤差成分迴歸模型（one-way error component regression model）；若兩者同時考慮，則稱為二因子誤差成分迴歸模型（two-way error component regression model）。

‧

不考慮不可觀察的個體特定效果（ unobservable individual-specific effect）。總合模型型式如下所示：

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

Hsiao（2003）亦指出由於總合模型不考慮不可觀察的個體特定效果，因此，當使用總合模型進行分析時，將無法控制個體之特性。

如若資料結構中確實存有不可觀察的個體特定效果，則用總合模型估計的結果將會產生異質偏誤（heterogeneity bias）。

二. 固定效果模型(fixed effects model)

固定效果模型是假設對每一個體其斜率係數皆是相同的，但截距項卻不相同，亦即將不可觀察的個體特定效果視為被估計的固定常數。

因此，使用固定效果模型進行分析時，由於個體間擁有各自不同的截距項，如此將允許控制個體之特性，而呈現出個體間之差異。固定效果模型如下：

y

_it

 α

^*_i

 β  x

_it

 u

_it

, i 

,..., N , t 

,..., T

（8）

其中，β是1K的常數向量；α^*_i 是 11 的數值常數，代表第 i 個個 體特定效果，並且假設 u_it與 (x_i₁,x_i₂,...,x_iT)不相關，u_it ~ iid（0,_u²）。

Baltagi（2005）指出若以公司為例，此不可觀察的公司特定效果

（unobservable firm-specific effects）將會被α^*_i 所捕捉，並且認為這些特性諸如公司執行者的企業家能力或管理技能。

接著，我們將(8)以向量之形式表示為：

‧

least squares (OLS) estimator)即為最佳線性不偏估計(Best linear unbiased estimator，BLUE)。我們可藉由極小化(10)求得 αi

*和 β 的

‧

OLS 估計(12)稱為最小平方虛擬變數(Least squares dummy variable

，LSDV ) 估計；亦因其估計形式只利用到群內變異，所以又稱為群內估計(within-group estimator)。

而另一與(8)等價之型式，我們將其表示為：

y

_it

   β  x

_it

 α

 u

_it

, i  1 ,..., N , t  1 ,..., T

（13）

其中，μ為平均截距(mean intercept)，αi表示為第 i 個個體與共同平均μ之差的效果；且μ和

α

i皆是固定常數。

三. 隨機效果模型（random effects model）

隨機效果和固定效果差別在於，固定效果是假設個體特定效果

α

_i^*

‧

（見 Graybill (1969)；Nerlove (1971)；Wallace and Hussain (1969)）。

因為 vit和 vis兩者皆包含

α

i，所以(14)的誤差是相關的。為了得到

δ  

(

 , β

) 的有效估計值，我們必須使用廣義最小平方方法 (Generalized least squares (GLS) method)。對於 GLS 估計的正規方程式如下所示：

根據 Maddala (1971)，可將(16)表示為下面形式：

Q T

‧

估計量βˆ_between稱為群間估計(between-group estimator)。

Hsiao（2003）亦指出 GLS 估計(20)是群間估計和群內估計的加權平均，若_²= 0，則



¹，如此δ_GLS將收斂到 OLS 估計T_x~^-~_x1T_x~_y；若型之檢定方法，可透過 F test、Lagrange Multiplier test（LM test）以及 Hausman test 三種檢定作為檢測，分述如下：

‧

為總和模型中 OLS 之殘差平方和；未限制的殘差平方和（unrestricted residual sums of squares，URSS）則為固定效果模型中 LSDV 之殘差平方和（Baltagi 2005）。

若檢定結果拒絕虛無假設，則表示個體間擁有各自不同的截距項，

此時，使用固定效果模型會較總合模型適合；反之，則是使用總合模型較適合。

2. LM test

對於隨機效果模型，Breusch and Pagan（1980）提出 Lagrange multiplier（LM）test 來檢定 αi之變異數是否顯著異於 0，亦即檢定

‧

之 GLS 將達 Cramer-Rao 下界（Cramer-Rao lower bound，CRLB），且其為 BLUE；但是若在H₁: E(_i | X_i)0之下，GLS 會是一個有偏

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在文檔中台灣壽險業國外投資與績效之長期追蹤分析 - 政大學術集成 (頁 15-29)

長期資料分析

第二章 文獻回顧

第一節 長期資料分析

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第二章 文獻回顧

第一節 長期資料分析

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

y

 

x

 

, i  1 ,..., N

y

 

x

 

( x

 x

)  

, i  1 ,..., N , t  1 ,..., T

x

x y

y

)

(

)

(        

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

u

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

y

 α

 β  x

 u

, i 

,..., N , t 

,..., T

‧

‧

y

   β  x

 α

 u

, i  1 ,..., N , t  1 ,..., T

α

α

‧

α

δ  

 , β

Q T

‧

‧

第二章文獻回顧

第一節長期資料分析

立政治大學

第二章文獻回顧

第一節長期資料分析

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學