第三章 資料介紹與研究方法
第二節 研究方法
Bayesian、Partial SMR 等越來越受到重視(金碩 2011),以及修勻大、小區域死亡 率比值的 Whittaker Ratio 方法,因此,本文主要使用這些修勻方法探討小區域資 料的修勻。
一、死亡率估計誤差比較標準
估計誤差的選擇標準,一般可由 MAPE(Mean Absolute Percentage Error)或 MSE(Mean Square Error)作為判斷標準,其中 MAPE 以數學式表示為:
MAPE = 1𝑛∑ |𝑌̂−𝑌i𝑌 𝑖|
𝑖
𝑛𝑖=1 × 100% (3.1)
其中,𝑌̂:估計值。 𝑖
𝑌𝑖:理論值或真實值。
‧
由於使用 Whittaker 修勻法時,因為小區域人口數較少導致資料震盪較大,
會發生修勻完後死亡率小於或等於 0 的情況,因此,必須對此情況調整。考慮到 通常是在原始死亡率較低的情況會發生此情形,需要找一個數值取代,如圖 3-1 可知,研究發現取值10−5、10−4、10−3、10−2在不同的情境下皆有不錯的效果,
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
19
考慮到一般最小年齡層的死亡率接近10−4,因此選擇10−4作為取代的數值。
圖 3-1、Whittaker 修勻後調整值對 MSE 的影響
而在 Whittaker 修勻法中,參數 h 值的選擇中,一般建議 h 值為各年齡層平 均人數,由圖 3-2 可知,因為各年齡層平均人數約為 5000 人,當 h 值選取 5000 及其他值時,對於估計結果的影響不大,只有在 h 值選取過大時,修勻完全考慮 平滑性,會造成估計誤差的增加,因此,h 值可以選擇為各年齡層平均人數。
圖 3-2、比較 Whittaker 修勻在不同 h 值的表現
(二) Whittaker Ratio 修勻法
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
20
在參考大區域資料的修勻方法中,Whittaker Ratio 是一個不錯的方法,但若 遇到小區域資料震盪過大時,會造成死亡率比值為 0 或是太大的可能,假設小區 域 x 歲死亡率為ux,參考之大區域死亡率為ux∗,而死亡率比值為rx=ux/ux∗,金 碩(2011)建議當rx=0 或是rx>2×SMR 時,x 歲死亡率比值以 SMR 的值取代,但 考慮到若極端值皆以 SMR 的數值取代時,會過度調整,建議若rx>死亡率比值上 限時,以上限值取代,若rx<死亡率比值下限時,以下限值取代,根據圖 3-3 知,
若上限值取 1.6-2.5 時,其實並沒有太大的差異,因此建議rx>2 時,將rx以 2 取 代。而根據圖 3-4,死亡率比值下限的選取,對於估計的誤差並沒有太大的影響,
因此,為了避免過度調整,選取10−5當作死亡率比值下限的調整值。
圖 3-3、死亡率比值上限對 Whittaker Ratio 修勻的影響
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
21
圖 3-4、死亡率比值下限對 Whittaker Ratio 修勻的影響
(三) Bayesian 修勻法
貝氏(Bayesian)修勻法和 Whittaker Ratio 修勻法同樣參考大區域的資料,修 勻時參數 r 一般選擇 0.9,本文也嘗試選擇 r=0.5 比較,而當小區域 x 歲死亡率為 0 時,共變異矩陣 A 的元素𝐴𝑥𝑥為 0,會導致 x 歲死亡率修勻時完全沒有參考大 區域的死亡率,而是直接以小區域的原始死亡率當作修勻值,也就是修勻完的死 亡率數值仍然是 0,金碩 (2011)提出若遇到此情形,可以先將小區域死亡率以 SMR 取代,再代入貝氏修勻法修勻,可以得到較為合理的數值,本文也採用此 修正方法進行修勻。
三、死亡率模型
估計死亡率的模型,最常見的是 Lee and Carter 在 1992 年提出的 Lee-Carter 模型,而 Li and Lee (2005)提出的 Coherent Lee-Carter 模型,是一個結合大、小 區域資料再估計的方法,屬於「Two-Stage」的估計方法,以下分別介紹之。
(一) Lee-Carter 模型
使用 Lee-Carter 模型估計死亡率時,參數α𝑥、β𝑥、κ𝑡的估計有不同的方法,
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
22
Lee and Carter 建議使用 SVD(Singular Value Decomposition)估計死亡率改善幅度,
而曾奕翔 (2005)使用近似法求解,是一個較為簡便的方法,本文比較 Lee-Carter 採用以上方法估計參數對於小區域死亡率的估計結果。
(二) Coherent Lee-Carter 模型
如第二章所提到,Li and Lee 的模型為:
log(m𝑥,𝑡) = a𝑥+ B𝑥K𝑡+ b𝑥k𝑡+ εx,𝑡 (3.3)
對於小區域的死亡率取 Logarithm 後,直接利用log(m𝑥,𝑡)計算各年齡組死亡率的 平均數,而結合大、小區域資料後,代入 Lee-Carter 模型,使用 SVD 的方法求 得大、小區域共通的死亡率改善參數B𝑥、K𝑡,之後再計算出殘差:
log(m𝑥,𝑡) − a𝑥− B𝑥K𝑡 (3.4)
對殘差做 SVD 取出小區域獨特的參數b𝑥、k𝑡,但因為大、小區域合併的資料可 以解釋大部份死亡率的改善率,小區域獨特的改善率b𝑥、k𝑡就不見得如此有效。
因此本文比較獨特性參數放入模型與否。具體做法為下:
(a)分別檢定:H0:bx=0、H0:kt=0
(b)若該 x 歲年齡組的獨特性參數b𝑥顯著異於 0,則在計算 x 歲年齡組之死亡 率時,將獨特性參數放入模型中計算,若 t 年的獨特性參數k𝑡顯著異於 0,則在 計算 t 年的死亡率時,將獨特性參數放入模型中計算,反之,則將該年齡組或該 年的獨特性參數b𝑥、k𝑡設為 0,再代入計算死亡率。
由圖 3-5 可以發現,獨特性參數全部放入模型中,所計算出來的死亡率誤差 皆較大,因此,本文在使用 Li and Lee 的 Coherent Lee-Carter 模型時,都會先計 算獨特性參數是否顯著,只將顯著的部份放進模型中計算死亡率。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
23
圖 3-5、比較獨特性參數的重要性 四、修勻與死亡率模型應用
對於小區域死亡率估計上的方式,可以分為四個面向,如圖 3-6,傳統上以 修勻和死亡率模型估計,除了分別探討二者的優缺點之外,本文嘗試將其合併使 用,期望可以有更好的估計效果。金碩 (2011)的研究指出,若是先修勻再推估 和先推估再修勻,估計誤差並沒有太大的差異。因此,本文將先配模型再修勻的 部份,改為修勻死亡率模型的參數估計值,比較先修勻再配死亡率模型或是先配 死亡率模型再修勻其參數估計值,對於估計誤差的影響。修勻與死亡率模型的結 合,主要以 Lee-Carter 模型搭配不同的修勻方法。另外,也探討使用 Li and Lee 的 Coherent Lee-Carter 模型後,再針對小區域的獨特性參數估計值a𝑥修勻。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
24
圖 3-6、修勻與死亡率模型
(一)先修勻,再配模型
將二者結合時,若採用先修勻,後配模型的方式,做法為先將各年度的小區 域死亡率透過 Bayesian、Whittaker Ratio、Partial SMR 等修勻法,參考相對應年 度的大區域死亡率,之後再將修勻後的各年度死亡率,套入 Lee-Carter 模型估計。
(二)先配模型,再修勻
先將死亡率資料代入 Lee-Carter 模型中,求取參數估計值後,再對參數進行 修勻,由於估計出來的參數並非死亡率,若套用於在死亡率上的修勻方法,會遇 到一些問題,如參數估計值可能為負值等情形。因此,考慮的修勻方法必須做些 微調整。
具體做法如下:
(a)估計參數
將大、小區域的死亡率資料代入 Lee-Carter 模型中,分別計算出參數 A𝑥、B𝑥、K𝑡估計值及a𝑥、b𝑥、k𝑡估計值。
(b)修勻參數
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
25
利用 Whittaker Ratio 的概念,先將小區域和大區域的參數估計值做比值,計 算r𝑥α=a𝑥/A𝑥、r𝑥β=b𝑥/B𝑥、r𝑥k=k𝑡/K𝑡之後,再使用 Whittaker 修勻法修勻r𝑥α、r𝑥β、 r𝑥k,最後再將修勻後的比值乘上大區域的參數值A𝑥、B𝑥、K𝑡得到小區域修勻後 的參數估計值,而修勻時參數 h 設定為各年齡組平均人數,而參數 Z 一樣設定 為 3。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
26