國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
2 文獻回顧
2.1 近期發展的分群方法
在資訊爆炸的時代,學術發展也開始以資料的原始型態作為研究的重心,尤其 體現在分群的議題上,學者不再以人為既定的類別作為資料分析的素材,而是 透過計量方法運用資料本身所反映的型態對觀察個體進行分群。關於分群的計 量方法,主要分為階層式及分類式兩類,同時文獻中也運用新的分析法以改善 分群上的品質及提升分群上的豐富度。
Ben-Hur et al. (2003) 以監督式學習 (supervised learning) 的成功率來檢視分 群結果的穩定度。Bien and Tibshirani (2011) 對於階層式分群法辨識兩個個體相 似距離的計算提出一個極大極小連接法 (minimax linkage),透過此法得到的樹 狀分群結果不僅看出個體間計量上的相似程度,還可以看出每個階層代表的原 型。Argüelles et al. (2014) 結合階層式沃德連接法 (Ward’s linkage) 及 k-means 運算法,以群間變異得到的群數作為起始群數,經過 k-means 運算法修正沃德 法受到樹狀圖架構影響得到的分群結果,並運用主成分分析法以更客觀的方式 解釋分群的結果。Bonhomme and Manresa (2015) 以線性迴歸關係式為分群的 基礎,結合變動鄰域搜尋法 (Variable Neighborhood Search, VNS) 及 k-means 運算法概念,將無法由自變數解釋的部分所形成的時間軌跡作為分群的依據,
提出在分群及係數估計上一個更有彈性、效率的運算模式。
2.2 金融危機議題探討
2007-2008 年全球金融危機造成市場秩序的重整,無疑是分群廣泛應用上重要的 方向,針對此議題的文獻大致可以依據分群的主體分為兩類,第一類分群的對 象為國家,以金融危機對經濟體造成的影響所反映的總體變數作為分群的變數,
並分析各群受到金融危機影響的程度。
CIMPOERU (2015) 先以文獻結果歸結金融危機蔓延全球的因素,第一為因
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第二為因財務成本提高及信心下滑造成公司的股票乏人問津使得股價呈現負向 的走勢。他們將金融危機對一國的經濟主要影響歸結於 2008-2012 年平均經濟成 長率、2013 年不良貸款率、2012 年現金赤字/盈餘、2011 年通膨率及 2012 年貨 幣成長率五項變數後,再以沃德法 (Ward’s linkage) 對 49 個國家進行分群探討;
研究結果顯示共分為四群,並透過各群統計分析結果發現亞洲、中東地區較穩 定的經濟體及西歐地區已開發國家分別屬於受到金融危機影響最小的第二群和 第一群,而歐洲新興國家及相對較弱的經濟體則屬於受到金融危機影響最大的 第三群和第四群。
Zwick and Syed (2017) 以主成分分析法結合聚合式階層分群法研究金融危機 對歐洲勞動市場整合的影響,並發現危機發生前期 (1999-2007) 的歐洲勞動市 場的波動可以歸結於三項因子,分別為就業表現 (employment performances)、
失業挫敗 (unemployment failure) 及稅率與終生學習 (tax and lifelong learning),
危機發生後期 (2008-2014) 則以就業表現及失業挫敗兩項因子為主。此外,兩段 期間都分別將歐盟 26 個國家及歐元區 12 個國家分為四群,分別為核心 (core)、
追隨者 (followers)、邊緣 (marginalized) 及局外者 (outliers),從群內的組成成員 得出金融危機的發生使得歐盟各國的勞動市場異質性微幅增加,歐元區各國的 勞動市場異質性則是顯著降低,整體而言,此篇以群別為研究單位提供更精細 的分析結果,並以兩階段時期的比較得出歐盟勞動市場整合的過程。
第二類為對經濟變數分群以找出關鍵變數,為了改善過去探討全球金融 危機成因的議題上所忽略變數間存在的群組關係的問題,Chen et al. (2017) 針對金融危機變數的群組關係,以貝氏階層模式下結合 sparse group selection algorithm 及 Group-wise Gibbs sampler,將群組的架構納入考量,以同時決定 金融危機對各國經濟衝擊關鍵的群組變數及各群組內重要的變數,迴歸式的應 變數選擇 2008-2009 經濟成長變化率、2005-2007 年經濟成長變化率及 2008-2009 年經濟成長率和平均趨勢成長率的差異三項,而自變數選擇及群組變數的定義 則參考 Rose and Spiegel (2012) 及 Ho (2015) 選擇了 72 個國家的 51 個指標變 數,最終得出關鍵的群組變數分別為財政政策 (Financial policies)、制度建立 (Institutions) 及貿易連結 (Trade linkages) 三群,其中,在財政政策群組變數 中包括信用市場法規 (Credit market regulation)、私有銀行家數 (Private bank
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
ownership) 及利率控制 (Interest rate controls) 等三項變數;制度建立群組變數 中包括各市場的法規、整體經濟自由度及公民權等 11 項變數;而貿易連結群組 變數則包括對世界主要市場的出口及貿易曝險程度共計 12 項變數。
值得一提的是,關於上述的文獻在選擇關鍵變數時常常僅以單一時間點或是 平均的變數值作為代表,可能導致研究結果與實際的情形有差異。例如,Rose and Spiegel (2012) 由研究結果發現此問題,他們以 Multiple Indicators Multiple Causes (MIMIC) 模型分析金融危機主要顯現的面向,包括 2008 年實質經濟成 長率、證券市場、國家信用排名及匯率,與各別對應的可能因素之間的連結,
然而最終結果顯示沒有任何變數對金融危機嚴重性有顯著的影響,推測可能的 原因為以單一個時間點的資料無法精確的描述金融危機發生的過程。
關於區域性金融危機分群應用,Afonso et al. (2014) 參考 Arghyrou and Kontonikas (2012) 及 Afonso et al. (2012) 提出的模型架構,建立一個十年期歐 債對德國公債利差的多變量迴歸式,以探討歐債危機成因。其中以主成分分析 法選擇代表移轉風險指數的因子,並運用因子影響方向對歐元區國家進行分群,
最後利用兩階段最小平方法 (two stage least squares, 2SLS) 得出整體的迴歸式。
我們將上述文獻整理於附錄 1 中。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
3 研究方法
3.1 k-平均演算法 (k-means)
本文研究主要應用 Bonhomme and Manresa (2015) 提出的分群方法,此分群方 法雖然是以迴歸式為分群的根基,但分群的概念類似於 k-means 運算法。不同 之處在於 k-means 運算法是依每個觀察點與群中心點的距離作為分群的依據,
此分群方法則是依每個觀察點在每一個時間點所形成迴歸式殘差向量與各群異 質性時間效果向量的距離作為分群的依據。疊代最佳化技術為 k-means 運算法 最常使用的技術,主要由分配、更新兩個步驟交替進行,直到得到收斂的結果。
3.1.1 分配 (assignment)
在原始的疊代最佳化技術中,分配的步驟在於將每個觀察點分配到各群內,而 分配的目標為使群內距離的平方達到最小化,也就是達到群內變異最小的分配 結果。此距離的衡量即為集群分析中判定資料的相似程度常用的歐幾里德距離。
在本文的應用上,對每一個觀察點而言,首先得出在研究時間段上迴歸式的殘 差向量 (vector of residuals),接著以此向量與各群的時間效果向量的距離建構出 目標函數,最後以目標函數值極小的群別作為最適的分配結果。目標函數如下:
g i (s+1)
= argming ∈(1,...,G)
∑
T t=1
(y
it − x ′ it θ (s) − α (s) gt
)2 ,
其中,g
i
為第 i 個觀察點的群別,s 為疊代次數,T 為時間點,yit − x ′ it θ (s)
為第i
個觀察點的殘差向量,α(s) gt
為各群的時間效果。3.1.2 更新 (update)
在原始的疊代最佳化技術下,更新的步驟主要是對於分配步驟所得到的各群,
重新求出各群中心點,以達到群內變異最小的目標。在本文的應用上,此步驟 就是在給定分配步驟下的群別,以目標函數值極小的結果求出每個群組的迴歸 係數及時間效果。目標函數如下:
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
(θ
(s+1) , α (s+1)
) = argmin(θ,α) ∈Θ∗A
GT∑
N i=1
∑
T t=1
(y
it − x ′ it θ − α g
(s+1)i