• 沒有找到結果。

小區域死亡率模型與生命表編算 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "小區域死亡率模型與生命表編算 - 政大學術集成"

Copied!
60
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學商學院統計學系 碩士論文. 小區域死亡率模型與生命表編算. 政 治 大 A Study 立 of Mortality Models and. ‧ 國. 學. Life Table Construction of Small Areas. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 指導教授:余清祥 博士 研究生:鍾陳泰 撰. 中華民國 一百零四 年 七 月.

(2) 摘要 臺灣各縣市人口結構差異明顯,各縣市的人口出生、老化程度都不盡相同, 而且在醫療分配及社會資源的使用也有很大的差異,因此各縣市應因應各地特性 發展不同的小區域人口推估方法。由於樣本數與變異數成反比,人數較少者的死 亡率(像是高齡人口)通常震盪較大,藉由適當的修勻(Graduation)調整,通常可 降低年齡層間的死亡率震盪。然而,當縣市層級的人數太少時,只依賴修勻往往 不足,多半會再參考人口較多的大母體之死亡率。例如:傳統的的貝氏修勻,使 用 Lee-Carter 之類的參數死亡模型(Lee and Carter, 1992),或是透過小區域及大母. 政 治 大 其是用於人數較少(如:十萬人)的地區。 立. 體的死亡率比值(王信忠, 2012) 。然而過去研究較少全面性的比較這些方法,尤. ‧ 國. 學. 本文以探討小區域生命表及死亡率推估為目標,著眼於人數不多於五萬人, 尋求較為適合臺灣及類似國家的死亡率編算方法。由於修勻或貝氏等方法可視為. ‧. 增加樣本數,本文將擴大樣本分為四種方式:「同地同時」、「同地異時」、「異地. sit. y. Nat. 同時」、「異地異時」,亦即將死亡資料的整併分成是否限定於小區域,以及是否. al. er. io. 可擴及其他年度。本文藉由電腦模擬測試,提供在各種限制之下,最合適小區域. v. n. 生命表建構的準則。其中,本文假設大、小區域的死亡率間存有三種情境的關係:. Ch. engchi. i n U. 定值、遞增、V 字型,藉由調整大小區域死亡率比值間的幅度,探討大母體及小 區域間的差異對實務使用的影響。研究發現,Partial SMR 方法是一個值得參考 的方法,當大小區域死亡率類型接近時的效果不錯,甚至可用於人數小於一萬人, 但若死亡率類型差異過大,修勻方法會有限制,使用時需格外謹慎。. 關鍵字:小區域人口推估、生命表、修勻、電腦模擬、標準死亡率. II.

(3) Abstract The population structure, life expectancy (and age-specific mortality rates), and the speed of population aging vary a lot in different county of Taiwan. Each county has its own policy planning according to the needs. However, the county level population is usually not enough to provide stable estimates, such as of the life expectancies and mortality rates at the county level. Thus, certain graduation methods are applied to stabilize these estimates. However, only a few studies focus on comparing different types of graduation methods, including traditional graduation methods, Bayesian. 政 治 大 In this study, we separate 立 the graduation methods into four types, according to if. methods, and parametric mortality models.. ‧ 國. 學. using only the small area data and if one year or multiple years of data are used, and explore which methods are appropriate to the areas with population fewer than 100,000.. ‧. We use computer simulation to evaluate the graduation methods. We found that the. sit. y. Nat. Standard Mortality Ratio is promising when the mortality profiles of small and large. al. n. fewer than 10,000.. er. io. populations are similar, and it is a feasible solution even for the areas with population. i n U. v. However, if the mortality profiles differ significantly, all. Ch. engchi. graduation methods need to be applied with care.. Keywords: Small Area Estimation, Life Table, Graduation Methods, Computer Simulation, Standard Mortality Ratio. III.

(4) 目. 錄. 目 錄 ........................................................................................................................ IV 表目錄 .......................................................................................................................... V 圖目錄 ........................................................................................................................ VI 第一章 緒論 ........................................................................................................... 1 第一節 研究背景與動機.......................................... 1 第二節 研究目的................................................ 4 第二章 文獻探討 ................................................................................................... 6 第一節 文獻探討................................................ 6 第二節 介紹修勻方法............................................ 7 第三節 死亡率模型............................................. 11 第四節 修勻方法與參數設定..................................... 13 第五節 評斷標準............................................... 14. 立. 政 治 大. ‧ 國. 學. 第三章 資料介紹 ................................................................................................. 17 第一節 資料來源............................................... 17 第二節 Lee-Carter 模型 ......................................... 19. ‧. 第四章 研究方法 ................................................................................................. 26 第一節 「同地同時」的探討..................................... 27 第二節 「異地同時」的探討..................................... 30 第三節 「異地異時」的探討..................................... 38 第四節 「同地異時」的探討..................................... 40. er. io. sit. y. Nat. al. n. 第五章 結論與建議 ............................................................................................. 44 參考文獻 ..................................................................................................................... 47 附表 ............................................................................................................................. 50 附圖 ............................................................................................................................. 53. Ch. engchi. IV. i n U. v.

(5) 表目錄 表 表 表 表 表 表. 1-1、民國 104 年人口結構表,本研究自行編製 ................................................ 1 2-1、Lewis 衡量估計誤差標準(MAPE) ........................................................ 16 3-1、臺灣男性單齡組資料 .................................................................................. 18 3-2、臺灣男性五齡組資料 .................................................................................. 18 3-3、不同求解方法下參數 αˆ x 的穩定性 .............................................................. 25 3-4、不同求解方法下參數 βˆx 的穩定性 .............................................................. 25. 表 4-1、五齡組與單齡組誤差比較(MAPE:%) ................................................ 27 表 4-2、Greville 法及 Whittaker 法的修勻誤差(單齡資料。MAPE:%) ........ 29 表 4-3、Greville 法及 Whittaker 法的修勻誤差(單齡資料。MSE:‰) .......... 29 表 4-4、Greville 法及 Whittaker 法的修勻誤差(五齡組資料。MAPE:%) .... 29 表 4-5、五齡組修勻誤差比較(MAPE:%) ........................................................ 33 表 4-6、定值情境下,不同幅度下的修勻效果(20 萬人。MAPE:%) ........... 36 表 4-7、定值情境下,不同幅度下的修勻效果(5 萬人。MAPE:%) ............. 36 表 4-8、遞增情境下,異地同時的修勻效果(20 萬人。MAPE:%) ............... 37 表 4-9、V 型情境下,異地同時的修勻效果(20 萬人。MAPE:%) ............... 37 表 4-10、遞增情境下,異地異時的修勻效果(20 萬人。MAPE:%) ............. 39 表 4-11、V 型情境下,異地異時的修勻效果(20 萬人。MAPE:%) ............. 39 表 4-12、全臺灣男性五齡組,同地異時的修勻誤差比較(MAPE:%) .......... 41 表 4-13、全臺灣男性單齡組,同地異時的修勻誤差比較(MAPE:%) .......... 41 表 4-14、Partial-SMR+資料年度的誤差比較(五齡組。MAPE:%) ............... 42 附表 1、SVD 法,參數 αˆ x 在各年齡層涵蓋機率 ..................................................... 50. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. i n U. v. 附表 2、SVD 法,參數 βˆx 在各年齡層涵蓋機率 ..................................................... 50 附表 3、近似法,參數 βˆx 在各年齡層涵蓋機率 ...................................................... 51. Ch. engchi. 附表 4、遞增情境下,異地同時的修勻效果(5 萬人。MAPE:%) ................. 51 附表 5、V 型情境下,異地同時的修勻效果(5 萬人。MAPE:%) ................. 51 附表 6、遞增情境下,異地異時的修勻效果(5 萬人。MAPE:%) ................. 52 附表 7、V 型情境下,異地異時的修勻效果(5 萬人。MAPE:%) ................. 52. V.

(6) 圖目錄 圖 圖 圖 圖 圖 圖 圖 圖 圖. 1-1、各縣市簡易生命表:0 歲平均餘命 ............................................................. 2 1-2、電腦模擬在不同人數之下的誤差(MAPE) ............................................. 3 1-3、電腦模擬在不同人數下的平均餘命震盪程度 ............................................ 4 3-1、Lee-Carter 模型在不同人數的參數估計值 αˆ x ........................................... 20 3-2、Lee-Carter 模型在不同人數的參數估計值 βˆx ........................................... 20 3-3、Lee-Carter 模型在不同人數的 αˆ x 、 βˆx 檢定比值 ....................................... 21 3-4、Lee-Carter 模型使用澎湖資料,在不同人數的 αˆ x 、 βˆx 檢定比值 ........... 22 3-5、Lee-Carter 模型不同求解方法下的參數估計值 αˆ x ................................... 23 3-6、Lee-Carter 模型不同求解方法下的參數估計值 βˆx ................................... 24. 圖 4-1、Greville 及 Whittaker 修勻的誤差比較(MAPE) ................................... 30 圖 4-2、不同研究方法之下的誤差(MSE) .......................................................... 31 圖 4-3、不同研究方法之下的誤差(MAPE) ....................................................... 32 圖 4-4、異地同時的平滑性比較 .............................................................................. 34 圖 4-5、假設大、小區域死亡率比值 ...................................................................... 35 圖 4-6、各種修勻的平滑性比較 .............................................................................. 43 附圖 1、Lee-Carter 模型在不同人數的參數估計值 αˆ x (澎湖人口結構) ............ 53. 立. 政 治 大. ‧ 國. 學. ‧. 附圖 2、Lee-Carter 模型在不同人數的參數估計值 βˆx (澎湖人口結構) ............ 53 附圖 3、Lee-Carter 模型不同求解方法下的參數估計值 αˆ x .................................... 54 附圖 4、Lee-Carter 模型不同求解方法下的參數估計值 βˆx .................................... 54. n. er. io. sit. y. Nat. al. Ch. engchi. VI. i n U. v.

(7) 第一章 第一節. 緒論. 研究背景與動機. 近年來人口老化的議題被討論廣泛,在日本、德國、瑞典等國家都在思考如 何因應老化速度,而在老年化政策上如社會救濟、健保醫療、社會福利、財政考 量都須因應不同的人口結構來應變。根據行政院經建會《2010 年至 2060 年臺灣 人口推計》,各國人口結構高齡化速度比較,臺灣從高齡化社會(7%)轉變成高齡 社會(14%)需要 25 年,只比韓國需時 19 年、新加坡需時 22 年、日本需時 24 年. 政 治 大 高齡社會,因此如何針對老年化的政策是政府現階段最迫切的課題。 立. 來的長,與歐美國家相比人口老化速度將近兩倍。中華民國預計於 2018 年進入. ‧ 國. 學. 儘管人口老化的問題在臺灣各縣市都相當普遍,鑒於居住環境上的不同及各 地縣市的發展方針不同,例如臺北盆地、嘉南平原、直轄市的設立,另外,由於. ‧. 臺灣地小、交通便利,各縣市的遷移頻繁,導致人口老化速度及人口比例上都有. sit. y. Nat. 相當大的差別。根據民國一百四年,內政部戶政司公布的人口年齡分配,全國老. al. er. io. 年人口比例最多的縣市是嘉義縣,其次是雲林縣及澎湖縣,這三個縣市的老年人. v. n. 口均超過十四%,達到「高齡縣」的標準;青壯年人口比例最多的縣市是金門縣、. Ch. engchi. i n U. 連江縣比例超過七十七%,青壯年人口比例最低的縣市是雲林縣為七十%。此外, 新北市為全臺灣總人數最多的縣市有 396 萬人;人數最少的縣市依次為澎湖縣 10 萬人、連江縣 1.2 萬人,各縣市的人口結構及總人數差異相當大。 表 1-1、民國 104 年人口結構表,本研究自行編製. 嘉義縣. 雲林縣. 澎湖縣. 臺北市. 金門縣. 新北市. 連江縣. 0-14 歲. 11.4%. 13.2%. 12.0%. 14.2%. 10.9%. 13.5%. 12.7%. 15-64 歲. 71.8%. 70.7%. 73.6%. 71.8%. 77.9%. 76.4%. 77.8%. 65 歲以上. 16.8%. 16.1%. 14.5%. 14.1%. 11.2%. 10.1%. 9.5%. 總人數. 52 萬. 70 萬. 10 萬. 270 萬. 12 萬. 396 萬. 1.2 萬. 1.

(8) 立. 政 治 大. ‧ 國. 學. 圖 1-1、各縣市簡易生命表:0 歲平均餘命. ‧. 另外,臺灣各縣市的壽命也不盡相同,圖 1-1 為民國 87 年至 102 年,內政. y. Nat. 部編制簡易生命表 0 歲平均餘命。台北市由 79 歲至 83 歲,平均每年增加 0.23. er. io. sit. 歲;台東縣由 69 歲至 75 歲,平均每年增加 0.32 歲;台中市由 76 歲至 79 歲, 平均每年增加 0.18 歲,臺灣各縣市的每年壽命增加速度不同。. al. n. v i n 各縣市總人數、老年化速度、人口年齡結構及人口特性差異頗大,全臺灣所 Ch engchi U. 使用的國民生命表及簡易生命表的編制方法未必適用於各個縣市,因此根據各區 域的人口特性、年齡結構因地制宜的編制小區域生命表,有利地方政府針對不同 的人口比例來做施政上的調配,例如:各縣市的嬰幼兒補助方案、老年人醫療、 老年人長期照護等,讓地方政府更能即時掌握人口近況,切合社會大眾的需求。. 然而,人數的大小與死亡率的變異數成反比,人數越小的區域,死亡率震盪 越大。臺灣各縣市的人口總數差距懸殊,最大的縣市層級為三、四百萬人,最小 的縣市層級為十萬人,差距高達二十倍。圖 1-2 為使用卜瓦松分配(Poisson)亂數 進行死亡人數估計的電腦模擬,當人數為五百萬,死亡率的平均絕對誤差百分率 為 10%;當人數為十萬,死亡率的平均絕對誤差百分率為 65%,可驗證樣本數與 2.

(9) 死亡率的變異數成反比。除此之外,圖 1-3 為使用電腦模擬 1000 次在不同人數 之下,平均餘命的震盪程度。隨著人數增加,四分位數全距的距離會越來越小, 使得平均餘命的誤差越趨於穩定。. 立. 政 治 大. ‧. ‧ 國. 學 sit. y. Nat. n. al. er. io. 圖 1-2、電腦模擬在不同人數之下的誤差(MAPE). Ch. engchi. 3. i n U. v.

(10) 立. 政 治 大. ‧ 國. 學. 圖 1-3、電腦模擬在不同人數下的平均餘命震盪程度. ‧. 為了避免誤差及變異數對小區域死亡率的影響,增加樣本數是修正小區域死. y. Nat. 亡率震盪的唯一方法,各國在增加樣本數的方法不一,例如:紐西蘭(五百萬人). er. io. sit. 編算縣市(Subnational)的簡易生命表以三年人口為基礎、修勻方法來減少小區域 死亡率震盪(小區域死亡率推估研究,王信忠等人,2012)。本文整理並歸納「增. al. n. v i n 加樣本數」的方法,依照藉助的死亡率資訊(包含時間及地區),提供所對應的修 Ch engchi U. 勻方法,面對不同限制之下的小區域提供最適當的小區域死亡率估計方法。. 第二節. 研究目的. 臺灣在日據時期初(1905)實施每隔五年度的戶口調查,因此就資料完整度來 說,臺灣具有研究人口問題的良好環境。臺灣隨著不同地形、環境之下,各縣市 發展重點不一,導致臺灣內部異質性高,以地域來探討:臺灣在山區的原住民平 均壽命較短;臺北、高雄的老年人平均壽命較長。因此,國家在發展整體規劃之 4.

(11) 外,應該對於特別地點和特殊團體做個別的規劃,來保障國民的需求。臺灣在小 區域的劃分為兩種,一、依照行政區域、縣市做劃分,在每個縣市都有完整的資 料可以參考。其二為無明顯之地域關聯的特殊族群,像是原住民。根據特殊的需 求來編制小區域生命表,能針對澎湖、金門等離島,或原住民族群,將真實的人 口狀況反應給地方政府或原住民委員會,以利施政作參考。 生命表是由調整過後的各年齡組死亡機率所建構而成的,因此死亡率為評量 一國人口老化及醫療健康程度的一個重要指標。死亡率會因應環境、疾病等因素, 產生震盪的情況。為了合理性,我們期望死亡率為平滑的曲線,因此各國採用不. 政 治 大 近期小區域死亡率研究當中,都是針對縣、市層級作探討,主要研究小區域 立. 同的修勻方式及死亡率模型,來改善不穩定的情況。. 大小為人數五十萬左右,本文更近一步想探討二十萬人以下的小區域修勻方法,. ‧ 國. 學. 以五萬人為目標,找到最適合該區域編算生命表的方法。本文各章節安排如下:. ‧. 第二章回顧過去對於死亡率修勻及死亡率模型之理論,簡要解釋各類公式、參數. y. Nat. 設定及優缺點;第三章為資料介紹及 Lee-Carter 模型探討;第四章為研究方法,. n. al. er. io. 結論與建議。. sit. 藉由電腦模擬在不同限制下,探討各種修勻方法的適用時機及優缺點;第五章為. Ch. engchi. 5. i n U. v.

(12) 第二章. 文獻探討. 生命表的建構反映醫療水平以及國民競爭力,各國在編算國民生命表的方法 大致相同,以每十年編算一次,為了減少普查的成本及即時性,也發展以每年編 算一次的簡易生命表;各國在編算簡易生命表的方法則不盡相同,例如:日本及 英國合併五年資料來增加樣本數,減少生命表的震盪。 通常在人數較少的地區,某些年齡組的死亡人數為零,造成逐年的死亡率有 很大的變動較不符合常理,因此有修勻的必要。傳統的修勻方式不涉及模型假設, 常見的方法有移動平均法(Moving Weighted Average; MWA)、Whittaker 法。然而,. 政 治 大. 當樣本數逐漸變小時,傳統方法無法有效地降低震盪情況,因此近年發展出以參. 立. 數模型、半參數模型或利用輔助資訊(參考大、小區域的比值或參考標準死亡率). ‧ 國. 學. 來進行修勻。本文探討小區域生命表建構,欲提供較合適的方法來降低死亡率的 震盪,第一節先整理近年小區域死亡率修勻的文獻。第二節整理論文中所探討的. ‧. 修勻方法。第三節介紹動態死亡率模型。第四節、第五節介紹本文的修勻參數設. y. Nat. n. er. io. a. sit. 定及評斷死亡率優劣的準則。. 第一節. 文獻探討 l. Ch. engchi. i n U. v. 近年許多國家都針對較特殊的地區,編制該區域特性的生命表,以加拿大(三 千多萬人)為例,分別編制特別區域的生命表,包含愛德華王子島(Prince Edward Island)、育空(Yukon)、西北地區(Northwest Territories)和努納武特(Nunavut),使用 的方法大多採用合併相近年度的資料。除了加拿大外,日本及英國在處理國民生 命表也使用合併資料來降低死亡率的震盪。 王信忠等人(2012)針對影響小區域死亡率震盪的因子作探討,影響小區域死 亡率推估的最重要原因為地區人數的大小、第二點為歷史資料的長度,第三點為 推估年數的長短,最後以二十萬左右的臺北信義區來做實證分析,文中點出小區 域若是人數在二十萬以下就需要擴大樣本數來使得死亡率估計更穩定,使用擴充 6.

(13) 樣本數的方法為參考一大母體的資訊再結合修勻方法,以臺北男性為例,可將全 臺灣男性的資訊當作大母體來當作輔助資料,以 Whittaker 比值法做修勻,提出 跨區域死亡率修勻方法的可行性。 林志軒(2014)延伸王信忠等人(2012)提出的小區域模型及方法,也是使用跨 區域死亡率修勻的概念來擴大樣本數降低誤差,林志軒的研究中探討更多的方法, 包含 Lee and Li 模型,再結合死亡率及修勻方法,最後以電腦模擬來測試歸納出: 若是大、小區域相似時,可使用 Partial SMR;若是大、小區域不相似時,可使用 Whittaker Ratio。. 政 治 大 率模型,以下介紹使用各種方法。 立. 本文重新探討擴大樣本數的核心想法,並測試上述所提到的修勻方法及死亡. ‧ 國. 學. 第二節. 介紹修勻方法. ‧. 修勻(Graduation)是資料的修整步驟,又稱差補或平滑化(Smoothing),當資料. sit. y. Nat. 不規則或資料特性違反過去經驗時,即符合修勻的要求。修勻通常使用在編算生. al. er. io. 命表(Life table)或是編算保險業的保費,為了讓死亡率符合大眾的預期,一般認. v. n. 為年齡越高死亡率也越高,並滿足死亡率為平滑的曲線。修勻初期發展為類似內. Ch. engchi. i n U. 插法,期望死亡率呈線性遞增,而後發展各年齡層以不同多項式來估計死亡率。 傳統的修勻方法為只考慮單一年度,各年齡層之間的平滑性及適度性,利用調整 權重來使得修勻更貼近實際應用面。近年則發展以參數模型、半參數模型或利用 輔助資訊(參考大、小區域的比值或參考標準死亡率)來進行修勻。. (一) 移動平均法(Moving Weighted Average Method; MWA) 19 世紀使用在保險業,又稱線性合成法(Linear Compound Formula),因為計 算簡易,只需考量各年齡死亡率的加權平均,在樣本數大時有不錯的效果,MWA 的修勻公式如下: 7.

(14) Vx = ∑∞ r=−∞ a r Ux+r. 其中,Vx 為 x 歲的修勻值。. (2-1). U𝑥𝑥 為 x 歲的原始估計值。 ar 為第 r 項的權數。. 通常會假設兩個條件,1.有限性:ar =0,如果r > n或 r < −n,其中 2n+1 為範圍。. 2.對稱性:ar = a−r ,r = 1、2、3、 … 、n。依上述條件,MWA 的公式可改為: Vx = ∑nr=−n ar Ux+r. MWA 具有兩個常見要求:. (2-2). 1.還原性:E(Vx ) = t x 。 (𝑡𝑡𝑥𝑥 為 x 歲理論值。). 治 政 大 2.縮小變異:Variance(V ) ≤ Variance(U )。 立 x. x. ‧ 國. 學. (二) Greville 三次九項法. ‧. T.N.E. Greville 提出,延伸移動加權平均法的概念,藉由調整各年齡層之間. sit. y. Nat. 不同的權重來減少誤差。除此之外,更同時考量平滑性及適度性的因子,目前許. al. n. 適度性部分:. er. io. 多國家包含日本、韓國及加拿大都在使用。. 其中,Vx 為 x 歲的修勻值。. i n U. CVh = ∑n a U′′ i x e ns=−n g csh x+s. v. (2-3). U𝑥𝑥 為 x 歲的原始估計值。 as 為第 s 項的係數。. 需滿足限制式: 平滑性部分:. Vx = ∑ns=−n as = 1 及 Vx = ∑ns=−n s2 as = 0 Var(∆ 𝑧𝑧 Vx ) Rz = Var(∆ 𝑧𝑧 Ux′′ ). 需同時滿足適度性及平滑性兩個方程式,我們設定 z=3 且考慮修正前後各四項, 共修正九項,因此稱為 Greville 三次九項。目前臺灣政府編算簡易生命表,也是 8.

(15) 用此方法調整一歲至六十歲的死亡率,高齡部份另外處理,藉由調整附近年齡的 權重來還原並降低死亡率的震盪,其修勻公式可以整理如下: 一般年齡(五歲以上、六十歲以下): q x = 1 / 2431( −99q x' − 4 − 24q x' −3 + 288q x' − 2 + 648q x' −1 + 805q x' + 648q x' +1 + 288q x' +2 − 24q x' +3 − 99q x' +4 ). 一至四歲: = q1 1 / 14586(9449q1' + 9800q2' + 980q3' − 5880q4' − 4410q5' + 1512q6' + 4060q7' + 1000q8' − 1925q9' ) = q2 1 / 58344(13475q1' + 23096q2' + 20090q3' + 8820q4' − 1470q5' − 5040q6' − 700q7' + 1000q8' + 1375q9' ) = q3 1 / 29172(385q1' + 5470q2' + 11464q3' + 11340q4' + 5040q5' − 1860q6' − 3760q7' − 772q8' + 1595q9' ). 政 治 大. q= 1 / 19448( −1155q1' + 1260q2' + 5670q3' + 7736q4' + 5670q5' + 1620q6' − 930q7' − 720q8' + 297 q9' ) 4. 立. ‧ 國. 學. (三) Whittaker 法. ‧. Whittaker(1923)提出,由 Henderson(1924,1925)改良,此法如 MWA 考慮適度. sit. y. Nat. 性(Fit)。除此之外,也考慮各年齡層死亡率的平滑性。其模型如下:. al. n. 其中,F 為適度性函數。 S 為平滑性函數。. (2-4). er. io. z 2 M = F + hS = ∑nx=1 wx (vx − ux )2 + h ∑n−x x=1 (∆ vx ). Ch. engchi. i n U. v. ux 為 x 歲的死亡率(原始死亡率的觀察值)。. vx 為調整後的 x 歲死亡率。. wt 為 x 歲的加權數(一般為 x 歲的人數)。 h 及 z 為選定的參數。. h 為平滑性及適度性的權重。 z 為第 z 次差分(Difference),通常選擇 2、3、4。 通常計算上使用矩陣運算可得到修勻值: �⃑ = (W + hk ′z k z )−1 Wu v �⃑ 9. (2-5).

(16) 其中 k z = Dn−z+1 ∙∙∙ Dn−1 Dn. (2-6). 0 … 0 0 … 0� ⋮ ⋱ ⋮ … −1 1. −1 1 0 D = � 0 −1 1 ⋮ ⋮ ⋮ 0 … …. (2-7). (四) Whittaker Ratio 法 Whittaker Ratio 作法與 Whittaker 相同,只是修勻的對象改為大區域和小區. 政 治 大 勻完後的比值,再乘上大區域的死亡率,即得到 Whittaker Ratio 法的修勻值 (王 立. 域的死亡率比值,將死亡率比值套入 Whittaker 法,去修勻死亡率比值,得到修. ‧ 國. 學. 信忠等人,2012)。. ‧. (五) Partial SMR 法. y. Nat. sit. Partial SMR 為參考母體或大區域的死亡率來修正小區域預期死亡人數,. n. al. er. io. SMR 就是觀察死亡總數與期望死亡總數的比值,當 SMR 等於 1.0 的時候表示兩. i n U. v. 者相同,當 SMR 大於(小於)1.0 的時候,表示觀察死亡總數較期望死亡總數多. Ch. engchi. (少) 。當小區域死亡率在年齡間的變動與大區域相近時,SMR 會是一個可靠的 參考數值。 ∑x dx. nx 為小區域 x 歲人數。. SMR = ∑. ∗ x nx∙ ux. (2-8). dx 為小區域 x 歲死文人數。 u∗x 為大區域 x 歲死亡率。. SMR 為觀察死亡總數與期望死亡率總數的比值。 Lee (2003)考慮小區域與大區域間的死亡率比值,再加上 SMR,提出 Partial SMR 的方法修勻小區域死亡率,令調整過的死亡率為: 10.

(17) ∗. vx = ux ∙ exp �. �2 ∙log� dx ∗ �+(1−dx/ ∑ dx)∙log(SMR) dx∙h nx ∙u. �. x. � 2 +(1−dx/ ∑ dx) dx∙h. (2-9). 其中,先選擇一個死亡率與小區域有相似性質的大區域,x 歲的死亡率修勻 值是 x 歲的死亡率比值與 SMR 之間取得加權幾何平均所得之數值,h� 2 是異質性. 參數h2 的估計值,是在一些假設下使誤差最小的估計,詳細推導過程可參考 Lee (2003)。 ∗. 2. ∑((dx−nx∙ ux ∙SMR) −∑ dx) h� 2 = max � , 0� SMR2 ×∑(n ∙u∗ )2 x. (2-10). x. h� 2 越大表示小區域與大區域存在越大的異質性(Heterogeneity)。當死亡數越. 政 治 大 大區域,也就是SMR × u 立 ,可以看做大區域死亡率的平移。. 少時,修勻值參考大區域死亡率的比例越高;死亡數為零時,修勻值會完全參考. ‧ 國. 學. 第三節. ∗ x. 死亡率模型. ‧ sit. y. Nat. (六) Lee-Carter. n. al. er. io. Lee-Carter 模型(Lee and Carter, 1922),利用不同年度的相對死亡率變化來做 死亡率模型調整,假設死亡率滿足方程式:. Ch. engchi. i n U. log�mx,t � = αx + βx K t + εx,t. v. (2-11). 其中,mx,t 代表 x 歲在 t 年的中央死亡率。 αx 為 x 歲死亡率的平均曲線。. βx 為 x 歲相對死亡率的變化率。. K t 為 t 年度下的死亡率強度的變化量。 εx,t 為隨機誤差項,服從常態分配。. 此模型假設在不同年度中,死亡率在同一年齡層有相同的改善幅度;在不同 年齡層中,死亡率在同一年度中有相同的改善幅度。一般認為各年齡死亡率隨著 時間而逐漸下降,即隨著年齡的演進,預期死亡率會逐漸下降;𝛽𝛽𝑥𝑥 為年齡死亡率 11.

(18) 改善幅度,數值越大死亡率改善幅度越大。 求解過程中,為避免有無限多組解的情況,因此會假設限制式∑x βx = 1及. ∑t K t = 0。估計參數的方法有許多種,Lee and Carter 提出可以利用死亡人數及. 人 數 找 到 k t 、 Lawson and Hansin (1974) 提 出 奇 異 值 分 解 法 (Singular Value. Decomposition, SVD)、主成分分析法(Principle Component Analysis, PCA)、最大. 概似估計法(Maximum Likelihood Estimation, MLE)及近似法(曾奕翔,2005),而 在K t 部分,有學者假設具有飄移項的隨機漫步(Random Walk with Drift, RWD), 也有相當多假設時間序列的方式。 . 政 治 大 �log�m � − α − β K �. SVD 的做法,先對中央死亡率取對數後,使用最小平方法估計αx :. 立. αx =. x. x. t. 2. ∑T t=1 log�mx,t �. (2-12). (2-13). T. ‧. ‧ 國. 由於βx K t 加總為零,所以求得. x,t. 學. min ∑Tt=1. Nat. 再對log�mx,t � − αx 做 SVD 分解,可得到βx 及K t。將死亡率矩陣分解為U ∑ V T. io. 異值代表每組向量可解釋的共變異數的量。. al. n. . er. sit. y. 三個矩陣相乘,其中 U 和V T 是正交的單位向量矩陣,Σ 為奇異值的對角矩陣,奇. i n U. v. 近似法的做法,為了與 SVD 法有相同的解,採用相同的限制式∑x βx = 1及. ∑t K t = 0。可得. 再利用∑t k t = 0,可得:. Ch. αx =. engchi. ∑T t=1 log�mx,t � T. K t = ∑x[log�mx,t � − αx ]. (2-14). (2-15). 令log�mx,t � − αx 為應變數,參數K t 估計值為自變數,分別對各年齡層做無截. 距項的迴歸配適,得到的係數即為參數βx 估計值。. (七) Coherent Lee-Carter Li and Lee (2005)提供小區域結合大區域的模型,將所有國家視為一個大區 12.

(19) 域,大區域的變化視為與小區域間的連貫(Coherence),在大區域的共同 Lee-Carter 模型中加入小區域資料的波動,此模型下小區域的預測值會因為加入參數而與大 區域預測值不同,但最終會逐漸回歸大區域的均質。 具體做法分為兩階段:先將大區域資料以 SVD 法分解得到Bx 、K t ,而小區. 域αx 以該區域的平均死亡率取對數來估計,此時殘差為 εx,t = log�mx,t � − αx − Bx K t. (2-16). 再以 SVD 法分解殘差,將小區域變化的獨特性萃取出來,得到bx 及k t ,最. 終的模型為:. (2-17) 政 治 大 預 測 未來 K 與k 時, Li and Lee(2005)建議令 K 為具飄移項的隨機漫步 立 t. t. log�mx,t � = αx + Bx K t + bx k t + εx,t t. ‧ 國. 學. (Random walk Drift),k t 為一階自我迴歸(First Order Autocorrelation)進行預測,再 推算出死亡率。. ‧. 修勻方法與參數設定. sit. n. al. er. io. (一) MWA. y. Nat. 第四節. Ch. engchi. i n U. v. 一般用在單一年度上不同的年齡做修勻,但是會造成前後年齡的遺失值,因 此本文將此方法用在不同年度的資料做移動平均,雖然會造成前後年度的死亡率 遺失值,但是相較之下比缺少年齡組的影響來的小,因此本文在同地異時當中, 利用歷史三年及五年的死亡率做 MWA 修勻死亡率。. (二) Whittaker 通常使用 Whittaker 修勻,在某些年齡修勻完死亡率小於或等於 0 的情況, 因此需要對此情況做調整,林志軒(2014)研究發現使用最小年齡層的死亡率接近 10−4,因此選擇以10−4為取代值。. 13.

(20) 參數 h 值決定修勻的幅度,一般而言,h 值越高,修勻出來的數值也越平滑 (平滑性增加),與原來的數值差距越大(適度性降低),因此 h 值為適度性與平滑 性的權重,林志軒(2014)建議 h 值選擇 5000 或各年齡層平均數。本文因模擬不 同人數,因此使用各年齡層的平均人數來設定 h 值,參數對象呈現 n 次多項式, 則 z 值通常設定為 n+1 以上的值,一般設定 z 值為 2 或 3,本文在 z 值選擇 3。. (三) Whittaker Ratio 修勻法 根據王信忠等人(2012)參考大區域資料的修勻方法中,Whitaker Ratio 法在死. 政 治 大 > 2 × 死亡率比值」則該年齡的死亡率比值以 SMR 取代。林志軒(2014)針對死 立. 亡率比值為異常的點以 SMR 取代,令 x 歲死亡率比值rx = ux ⁄ux∗,當「rx = 0或 rx. ‧ 國. 學. 亡率取代值的上下限做探討,為了避免過度調整,因此若超過上下限則以界線值. 取代,然而本文實際做法還是依舊王信忠等人(2012)將死亡率比值的異常點以. sit. y. Nat. n. al. er. 評斷標準. io. 第五節. ‧. SMR 取代。. i n U. v. 生命表的建構為了貼近真實狀況,通常假設死亡率隨著年齡增加而逐漸遞增,. Ch. engchi. 較常見的作法為要求死亡率滿足連續或是可微分的函數,現行修勻方法中 Miller(1946)主張修勻需要同時滿足適度性(Fit)及平滑性(Smoothness)。因此本節 介紹評斷此兩種特性的標準:. (一) 平滑性 一般以微分來判別曲線函數的平滑程度,然而通常年齡層間以一歲為最小單 位,各年齡為一個離散型變數,因此使用差分來評斷死亡率的平滑度(差分作用 與微分類似)。根據 Borgan(1979)及 Hoem and Linnemann(1988)在實證上發現還原 三次多項式所計算出的誤差最小,Ramsay 也使用三次差分∑( ∆3 𝑉𝑉𝑥𝑥 )2來評斷平滑 14.

(21) 性的效果,差分運算子(Difference Operator, ∆),又稱為前進差分運算子,定義如 下:. 一次差分 ∆f(x) = f(x + 1) − f(x). 二次差分. (3-1). ∆2 f(x) = ∆[∆f(x)] = ∆[f(x + 1) − f(x)] =. [f(x + 2) − f(x + 1)] − [f(x + 1) − f(x)] = f(x + 2) − 2f(x + 1) + f(x). (3-2). 同理,可得三次差分為. ∆3 f(x) = f(x + 3) − 3f(x + 2) + 3f(x + 1) − f(x). 政 治 大 將三次差分取平方後,依各年齡組加總(𝑉𝑉 為各年齡層死亡率): 立 𝑥𝑥. ‧. ‧ 國. (3-4). 學. (二) 適度性. ∑𝐱𝐱( ∆3 Vx )2. (3-3). sit. y. Nat. 本文衡量標準以平均絕對誤差(Mean Absolute Percentage Error, MAPE)及均. al. n. 以 20%為良好、50%為合理的預測界線(表 2-1)。 MSE 數學式表示為:. Ch. engchi. er. io. 方誤差(Mean Square Error, MSE)為主。根據 Lewis(1982)將 MAPE 分成四個等級,. i n U. v. MSE = E[(y�ı − yi )2 ] = Variance(y�ı ) + [Bias(y�ı )]2. (3-5). 其中,y�ı 為估計值。. yi 為理論值或真實值。. Bias(y�ı ) 為E(y�ı ) − yi (偏誤)。 Variance(y�ı )為y�ı 的變異數。. MAPE 數學式表示為:. 1. MAPE = n ∑ni=1. �為推估值、Y為真實值。 其中,Y. 15. �ı −Yi � �Y Yi. × 100%. (3-6).

(22) 表 2-1、Lewis 衡量估計誤差標準(MAPE). MAPE. <10%. 10%~20%. 20%~50%. >50%. 預測能力. 高度精確. 良好. 合理. 不正確. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 16. i n U. v.

(23) 第三章. 資料介紹. 由於造成死亡率震盪的原因很多,為了釐清小區域所遇到的問題,先使用全 臺灣資料做電腦模擬,全臺灣資料較不易受到政府政策或行政區重劃影響且各年 度資料完整,因此我們以全國臺灣男性的人口資料為基礎。 引用林志軒及金碩所整理的修勻及死亡率模型,能降低人數過少所造成的震 盪,但是在死亡率比值過大時,修勻效果有限制,因此本文回歸小區域的核心概 念,探討如何增加有效的樣本數,利用參考資料的角度來重新定義修勻方法,依 照「地域」及「時間」來分類,將林志軒及金碩所整理的方法整理為「異地同時」 、. 政 治 大. 「異地異時」。由於在做電腦模擬過程沒有一個基準來判別死亡率的好壞,因此. 立. 我們假設死亡率服從 Lee-Carter 模型,以 Lee-Carter 參數所生成的死亡率當作基. ‧ 國. 學. 準來判別各種方法的優劣。. 因此第一節先介紹所使用的資料。第二節介紹 Lee-Carter 模型並探討死亡率. io. sit. y. Nat 資料來源. er. 第一節. ‧. 服從 Lee-Carter 模型所需要考量的因素。. al. n. v i n 本文使用內政部統計年報中的戶政資料,包含人口年齡分配表及年齡別死亡 Ch engchi U. 數,本文在電腦測試過程中分別使用單齡組資料及五齡組資料,台灣男性單齡組. 死亡資料從 1992 年至 2014 年共 23 年,因此台灣男性人數部分也收集從 1992 至 2014 年共 23 年資料。台灣男性五齡組死亡資料從 1982 年至 2014 年共 33 年, 部分年份的高齡人數及死亡人數紀錄較不完整,原因為隨著醫療設備及生活環境 的提升使得平均壽命延長,而為了能及時反映各地區的狀況,在死亡年齡的紀錄 上從 1982 年的 85 歲(含以上),提升至 2014 年的 100 歲(含以上)。表 3-1 及表 32 分別為台灣單齡組資料及五齡組資料所記錄的各年份年齡。. 17.

(24) 表 3-1、臺灣男性單齡組資料. 資料年份 (年). 人數紀錄年齡 (歲). 死亡數紀錄年齡 (歲). 1992~1997. 0~100+. 0~95+. 1998~2014. 0~100+. 0~100+. 表 3-2、臺灣男性五齡組資料. 資料年份 (年). 人數紀錄年齡 (歲). 死亡數紀錄年齡 (歲). 1982~1991. 0~90+. 0~85+. 1992~1994. 立. 0~90+. 0~100+. 1998~2014. 0~95+. 學. ‧ 國. 1995~1997. 政0~100+治 大 0~100+. 0~100+. ‧. 本文處理資料以單齡組及五齡組分開處理,主要以五齡組為探討的重點,單. y. Nat. n. al. er. io. 區域的生命表編算。. sit. 齡組部分是為了與內政部的方法做比較,檢視此方法的優異程度及是否適用在小. Ch. i n U. v. 本文將修勻同整為「同地同時」、「同地異時」「異地同時」、「異地異時」等. engchi. 四大部分,主要使用五齡組資料來顯示修勻的效果。「同地同時」的電腦模擬部 分使用單齡組資料,方便與內政部簡易生命表的編算做對照,內政部將 60 歲以 下採用 Greville 三次九項來修勻各年齡死亡率,60 至 76 歲採用 Greville 與高馬 氏法則(Gompertz-Makeham Law)做線性加權。 電腦模擬方法介紹,實際上我們並沒有一個基準死亡率或是一個標準死亡率, 因此我們假設死亡率服從 Lee-Carter 模型,固定 Lee-Carter 參數以此參數所生成 的死亡率當作基準。單齡組部分,將 0 至 76 歲共 77 個年齡層的資料代入 LeeCarter 模型中。本文主要以五齡組資料為主,五齡組資料較單齡組完整且合併五 年資料的死亡人數震盪較小,五齡組作法與單齡組相同,由 0-4 歲至最高年齡組 18.

(25) 80-84 歲(0-4 歲、5-9 歲、…、80-84 歲)共 17 個年齡組,由於先假設 Lee-Carter 為 基準死亡率,因此先探討 Lee-Carter 的特性及影響 Lee-Carter 的因素。. 第二節. Lee-Carter 模型. Lee-Carter 模型是一個廣被使用的動態死亡率模型,除了考量各年齡的死亡 率外,也考慮不同年度的死亡變化率,主要由三個參數𝛼𝛼𝑥𝑥、𝛽𝛽𝑥𝑥 及𝐾𝐾𝑡𝑡 所組成,研究. 指出在人數少時,Lee-Carter 模型的參數估計值會有偏差,因此,本文先測試 LeeCarter 模型的參數。接下來,利用電腦模擬釐清人數、人口結構及求解方式等因. 政 治 大. 素對死亡率的影響,以下分別來探討:. 立. ‧ 國. 學. (一) 人數影響. 利用電腦模擬將臺灣資料縮小至幾種情境後,最後套入 Lee-Carter 模型中,. ‧. y. Nat. 檢視各種𝛼𝛼�𝑥𝑥 及𝛽𝛽̂𝑥𝑥 的誤差程度。實際做法為取得全臺灣地區 1992 至 2011 年,共二. sit. 十年,並使用男性五齡組(0~4 歲、5~9 歲、…、80~84 歲)的人口結構及死亡數,. n. al. er. io. 先找出 Lee-Carter 參數𝛼𝛼𝑥𝑥、𝛽𝛽𝑥𝑥 及𝐾𝐾𝑡𝑡,再將臺灣地區男性的人口結構等比例調整至. i n U. v. 總人數為 1 萬、2 萬、5 萬、10 萬、20 萬、50 萬、100 萬、200 萬、500 萬人。. Ch. engchi. 將 Lee-Carter 參數所生成的死亡率當作理論值,假設死亡人數服從卜瓦松(Poisson) 分配,以電腦模擬 1000 次模擬各種人數下的各年齡層死亡人數,得出各種人數 下 的 估 計 死 亡 率 , 再 帶 入 Lee-Carter 模 型 的 奇 異 值 分 解 法 (Singular Value Decomposition, SVD)最後估計出𝛼𝛼�𝑥𝑥 及𝛽𝛽̂𝑥𝑥 。以下為在不同人數之下,Lee-Carter 模 型參數估計值𝛼𝛼�𝑥𝑥 及𝛽𝛽̂𝑥𝑥 的誤差。. 圖 3-1、圖 3-2 為電腦模擬 1000 次下,𝛼𝛼�𝑥𝑥 及𝛽𝛽̂𝑥𝑥 的偏差(Bias)與變異數。𝛼𝛼�𝑥𝑥 代. 表各年齡層死亡率的平均數,𝛽𝛽̂𝑥𝑥 代表各年齡層相對死亡率的變化率。𝛼𝛼�𝑥𝑥 在人數少. 時,偏差(Bias)非常大,隨著人數越多偏差越小。另外,𝛼𝛼�𝑥𝑥 變異數也是隨著人數 越多,變異數越小。𝛽𝛽̂𝑥𝑥 的偏差(Bias)與變異數也是隨著人數越多而越小。偏差部 19.

(26) 分,𝛽𝛽̂𝑥𝑥 比𝛼𝛼�𝑥𝑥 更為敏感,𝛼𝛼�𝑥𝑥 在人數 100 萬以上時幾乎沒有偏差,𝛽𝛽̂𝑥𝑥 則在人數 500 萬 時才沒有明顯偏差,但是兩者都是在年齡 20 歲左右偏差最大。變異數方面,𝛼𝛼�𝑥𝑥 在人數 100 萬以上變異數較趨緩,而𝛽𝛽̂𝑥𝑥 則是在 500 萬時變異數才趨緩。. 由電腦模擬得知,使用 Lee-Carter 模型在五齡組 500 萬以上人數的區域不需. 要擔心死亡率偏差及變異數過大的問題。. 立. 政 治 大. ‧. ‧ 國. 學 sit. y. Nat. n. al. er. io. 圖 3-1、Lee-Carter 模型在不同人數的參數估計值 αˆ x. Ch. engchi. i n U. v. 圖 3-2、Lee-Carter 模型在不同人數的參數估計值 βˆx 20.

(27) 接下來繼續討論人數少於 500 萬時,Lee-Carter 模型的穩定性及使用時機。 以類似 t 檢定的統計方法來評估參數估計值𝛼𝛼�𝑥𝑥 和𝛽𝛽̂𝑥𝑥,一般常態分配檢定在顯著水. 準 0.05 之下,常態分配臨界值為 1.96,分別計算𝛼𝛼�𝑥𝑥 和𝛽𝛽̂𝑥𝑥 估計值的平均偏誤(Bias) 除以標準誤(Standard Error),以檢定比值大於 1.96 視為參數估計值不佳。. 圖 3-3 為𝛼𝛼�𝑥𝑥 和𝛽𝛽̂𝑥𝑥 參數估計值的檢定比值,兩個參數的檢定比值都隨著人數增. 加比值越小,而估計值𝛼𝛼�𝑥𝑥 相對較好,𝛼𝛼�𝑥𝑥 在人數 2 萬以下檢定比值才會大於 1.96。 𝛽𝛽̂𝑥𝑥 則是在人數 5 萬以下檢定比值會大於 1.96。因此,隨人數(樣本數)增加,Lee-. Carter 各參數趨於穩定,套用 Lee-Carter 模型時,當人數介於 100 萬至 500 萬時,. 政 治 大 盪;當人數少於 5 萬時不建議使用。 立. 預期產生的死亡率基準還算穩定;當人數少於 100 萬時,則需要注意死亡率的震. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3-3、Lee-Carter 模型在不同人數的 αˆ x 、 βˆx 檢定比值. (二) 人口結構差異 本文目標為小區域生命表編算,直接使用小區域資料做電腦模擬會造成死亡 率震盪太大,例如澎湖縣(10 萬)或金門縣(13 萬)在各年齡組死亡人數經常為 0, 本文想以全臺灣的人口結構縮小至 5-10 萬左右來模擬小區域的情境,由於已經 知道人數的影響,因此想測試不同地區的人口結構對參數估計的影響程度。 21.

(28) 我們以電腦模擬方式探討人口結構對 Lee-Carter 參數的影響程度,實際做法 為先取得全台灣地區與澎湖地區相同年度的資料,從 1992 至 2011 年,共二十個 年度,採用澎湖男性五齡組(0~4 歲、5~9 歲、…、80~84 歲)與全台灣男性五齡組 資料來做電腦模擬。為求公平仿照之前的做法,固定 Lee-Carter 參數,利用參數 所生成的死亡率當作理論值,再將人數等比例調整,假設死亡人數服從卜瓦松 (Poisson)分配,模擬並估計各年齡層的死亡率,再帶入 Lee-Carter 模型以奇異值 分解法(Singular Value Decomposition;SVD)估計出各參數值的誤差。 澎湖地區的模擬結果以類似 t 檢定角度評估參數估計值𝛼𝛼�𝑥𝑥 及𝛽𝛽̂𝑥𝑥,在使用相同. 資料年度下,𝛼𝛼�𝑥𝑥 的偏差與變異數與臺灣地區相比差異不大,𝛼𝛼�𝑥𝑥 約 100 萬時較穩. 治 政 大1、2)。圖 3-4 為使用澎湖 定;𝛽𝛽̂ 的偏差與變異數則比臺灣地區來的小(參考附圖 立 ̂ 𝑥𝑥. ‧ 國. 學. 人口結構 𝛼𝛼�𝑥𝑥 和𝛽𝛽𝑥𝑥 參數估計的檢定比值,比較臺灣地區(圖 3-3)與澎湖地區,𝛼𝛼�𝑥𝑥 的 檢定比值在人數 2 萬以下檢定比值會大於 1.96,台灣與澎湖差異不大;在澎湖人. ‧. 口結構之下,𝛽𝛽̂𝑥𝑥 的偏差(Bias)較小以致於𝛽𝛽̂𝑥𝑥 的檢定比值較好,但是整體來說,臺. y. Nat. 灣地區與澎湖地區的差異並不大。因此,我們在接下來的各種修勻探討中使用全. 湖、金門等小區域的狀況做電腦模擬測試。. n. al. Ch. engchi. er. io. sit. 臺灣資料,再依照全臺灣人口結構將人數等比例縮小至小區域的大小,來代替澎. i n U. v. 圖 3-4、Lee-Carter 模型使用澎湖資料,在不同人數的 αˆ x 、 βˆx 檢定比值 22.

(29) (三) Lee-Carter 求解方法 除了人數及人口結構的影響之外,探討 Lee-Carter 求解方法是否會造成參數 估計的誤差,Lee-Carter 參數求解方式有相當多種,本文先比較奇異值分解法 (Singular Value Decomposition;SVD)與近似法(Approximation)。實際做法為使用 相同的資料,採用全臺灣男性 1992-2011 年資料做 Lee-Carter 參數估計時,分別 使用 SVD 法與近似法找出固定的參數值,將此組參數當作理論參數值,再仿照 先前電腦模擬步驟生成各年齡層的死亡率,最後套用 SVD 法與近似法比較此兩 種求解方法的參數估計值𝛼𝛼�𝑥𝑥 及𝛽𝛽̂𝑥𝑥 。. 政 治 大. 圖 3-5、圖 3-6 為 SVD 法與近似法,以類似 t 檢定方式評斷各參數估計值𝛼𝛼�𝑥𝑥. 立. 學. 和𝛽𝛽̂𝑥𝑥,由於𝛼𝛼�𝑥𝑥 部分在求解過程中步驟相同,先算出中央死亡率後取平均數,因此. ‧ 國. 所估計出來的𝛼𝛼�𝑥𝑥 會完全相同。𝛽𝛽̂𝑥𝑥 部分,使用 SVD 法與近似法都是在人數 100 萬. 以上,各年齡層才有較穩定的參數估計(MSE 與檢定比值相似,可參考附圖 3、. ‧. io. sit. y. Nat. n. al. er. 4). Ch. engchi. i n U. v. 圖 3-5、Lee-Carter 模型不同求解方法下的參數估計值 αˆ x. 23. 。.

(30) 政 治 大. 圖 3-6、Lee-Carter 模型不同求解方法下的參數估計值 βˆx. 立. ‧ 國. 學. 除此之外,利用統計方法中的涵蓋機率來探討不同人數下各年齡層參數的穩 定程度,實際做法為仿照先前 Lee-Carter 測試參數步驟,使用電腦模擬 1000 次. ‧. 分別算出參數的標準差,並建構 1000 個信賴區間,最後將理論值帶入算出涵蓋. sit. y. Nat. 機率(附表 1、2、3),以涵蓋機率數值介於 0.936 及 0.964 代表大略滿足 95% 信. al. er. io. 心水準,以 17 個年齡組中有 15 個以上的年齡組能落在此區間內表示參數具相當. v. n. 穩定性。表 3-3 為比較𝛼𝛼�𝑥𝑥 參數在 SVD 法與近似法,17 個年齡組中有多少個年齡. Ch. engchi. i n U. 組落在信賴區間 0.936~0.964 中。由於兩種方法的𝛼𝛼�𝑥𝑥 求解過程相同,因此兩者的 參數穩定度相同,當人數在 100 萬以上時,17 個年齡組中有 15 個年齡組覆蓋機. 率在 0.936~0.964。然而,𝛽𝛽̂𝑥𝑥 求解方式不相同,不同人數下落在 0.936~0.964 的年 齡組次數,雖然隨著人數越多而有越多年齡組落在區間內,但是卻沒有收斂的趨. 勢,因此兩種方法無法判別優劣,由於 15 個以上的年齡組的條件過於嚴苛,若 放寬至 13 個以上的年齡組,SVD 法在人數為 500 萬以上才穩定;而近似法在人 數為 200 萬以上較穩定,因此 Lee-Carter 在求解方法中,使用近似法優於 SVD 法。整體 SVD 法在 500 萬以上才穩定的結果與第一部分 Lee-Carter 受到人數影 響有相同的結論。 24.

(31) 表 3-3、不同求解方法下參數 αˆ x 的穩定性. 近似法. Alpha. SVD. 人數. 17 個年齡組. Y/N. 17 個年齡組. Y/N. 1萬. 0. X. 0. X. 2萬. 0. X. 0. X. 5萬. 3. X. 3. X. 10 萬. 3. X. 3. X. 20 萬. 9. X. 9. X. 50 萬. 13. X. 13. X. 100 萬. 15. V. 15. V. 200 萬. 16. V. 16. V. 500 萬. 16. V 政 治 大. 16. V. 立. 表 3-4、不同求解方法下參數 βˆx 的穩定性. 100 萬. 4. X. 1. X. 6. X. 1. X. 10. X. 0. X. 13. X. 0. X. 9. X. V. 8. X. 12. X. X. 15. V. X. 13. X. a17l 16. 200 萬. 12. 500 萬. 13. Ch. e n g Vc h i. 25. y. X. sit. 50 萬. 3. io. 20 萬. Y/N. er. 10 萬. 17 個年齡組. Nat. 5萬. ‧ 國. 2萬. Y/N. ‧. 1萬. 17 個年齡組. n. 人數. 近似法. SVD. 學. Beta. i n U. v.

(32) 第四章. 研究方法. 研讀各國小區域生命表的編算方法,各國基本上都使用較保守、較傳統的修 勻方法,近年來王信忠等人(2012)、林志軒(2014)採用跨區域修勻的方法可以減 少死亡率的震盪,本章除了使用跨區域的修勻方式並結合歷史資料來做修勻,最 後比較各種方法的使用時機及優缺點。 我們使用 Lee-Carter 參數所生成的理論死亡率當作基準。由上一章 Lee-Carter 模擬測試得知人數大於 500 萬的區域,Lee-Carter 參數非常穩定;人數介於 100 萬至 500 萬的區域,Lee-Carter 參數震盪算小;人數小於 100 萬的區域則多注意. 政 治 大. 死亡率的震盪情況;在人數少於 5 萬的區域,則不建議使用此模型。臺灣各縣市. 立. 的規模上至兩三百萬人、下至十萬人,以金門縣、澎湖縣人數最小,這樣的人數. ‧ 國. 學. 對於編算生命表是一大難題,由於死亡人數服從卜瓦松(Poisson)分配,此分配下 樣本數與變異數成反比,在人數少時震盪非常大。. ‧. 王信忠等人(2012)、林志軒(2014)藉由參考大區域的資訊來增加樣本數為近. y. Nat. sit. 年來的趨勢,本文發現當大、小區域特性差異較大時,跨區域修勻方法有其限制。. n. al. er. io. 本文回歸探討小區域的核心概念,如何增加有效的資訊對小區域做調整為本文的. i n U. v. 核心目標,我們認為藉由小區域的歷史資訊可以降低特性不符的問題,因此本文. Ch. engchi. 採用以時間當作增加樣本數的方式,再結合修勻方法。 本文重新整理並歸納增加樣本數的方法分為四種:一、參考該地區過去幾年 資訊(相同時間、相同地區;同地同時),二、參考類似縣市或大母體的資料(相同 時間、不同地區;異地同時),三、合併過去該地區的歷史資訊(不同時間、相同 地區;同地異時),四、在小區域死亡率模型中也加入參考區域的人口資料(不同 時間、不同地區;異地異時)。 第一節先探討傳統修勻方法的限制,亦即同地同時的修勻方法,此方法雖然 可以減小誤差,但是在人數少於五十萬時(單齡組)修勻後的誤差還是偏大。因此 回顧王信忠等人(2012)、林志軒(2014)利用大、小區域死亡率比值來做修勻的概 26.

(33) 念(即異地同時的修勻方法),我們發現當跨區域死亡率比值不穩定下,也不一定 能夠還原小區域的真實死亡狀況,而過去在探討大小區域死亡率比值方法時,主 要考慮適度性(亦即誤差大小),而忽略死亡率曲線需滿足平滑度,因此第二節除 了探討「異地同時」的修勻限制及使用時機外,增加生命表所需滿足的平滑性條 件。第三節「異地異時」結合跨地區的修勻方法及死亡率模型,探討在極端情況 下「異地異時」的可行性。第四節為了解決大小區域比值幅度過大的問題,參考 歷史資料並結合跨區域的方法,即探討「同地異時」的修勻效果及極限。 由於在死亡率比值不穩定狀況下,也不一定能夠還原小區域的真實死亡狀況。. 政 治 大 母體資訊,因此本章多方考量各種限制並模擬各種限制下修勻方法的效果,提供 立. 此外,小區域常遇到的問題是沒有較可信的歷史資料、或沒有可以參考的類似大. 修勻方法的使用時機以利還原小區域的真實情況。. ‧ 國. 學. 「同地同時」的探討. ‧. 第一節. sit. y. Nat. 本文分別使用全臺灣男性單齡組與五齡組資料,由於五齡組相當於單齡組的. al. er. io. 資料先做整併(擴大樣本數),因此五齡組平均絕對誤差(MAPE)較小,表 4-1 為使. v. n. 用電腦模擬 1000 次,使用單齡組資料及五齡組資料在不同人數下,完全不修勻. Ch. engchi. i n U. 的誤差比較。單齡組平均絕對誤差約為五齡組誤差的兩至三倍。以 Lewis 準則來 評 估 , 使 用 五 齡 組 資 料 時 , 當 人 數 50 萬 以 上 完 全 不 修 勻 的 結 果 算 精 確 (MAPE<10%),本文主要探討五齡組狀況,借用修勻或死亡率模型來解決小區域 人數小於 50 萬的狀況,目標為將人數 5 萬的小區域誤差降至精確的標準。. 表 4-1、五齡組與單齡組誤差比較(MAPE:%). 人數. 1萬. 2萬. 5萬. 10 萬. 20 萬. 50 萬. 五齡組不修勻. 64.48. 47.62. 30.33. 21.08. 15.06. 9.45. 6.71. 4.74. 125.56 101.45. 73.01. 54.89. 39.40. 24.60. 17.45. 12.32. 單齡組不修勻. 27. 100 萬 200 萬.

(34) 臺灣與各國的人數差異非常大,各國處理小區域時都採用傳統修勻方法,然 而傳統修勻方法並不一定適用在臺灣,因此本節先衡量傳統修勻的極限,評估傳 統修勻的適用場所,傳統的修勻方式採用單一年度的資料做修勻(同地同時),本 節探討的「同地同時」方法,包含內政部使用的 Greville 三次九項及 Whittaker 法。 我們仿照上一節的做法,利用台灣資料並假設死亡率服從 Lee-Carter 模型, 再帶入 1992~2011 年臺灣地區的人口結構,依情境人數等比例調整各年齡層人 數,接著以卜瓦松分配模擬出死亡人數,再使用傳統修勻方法,包含 Greville 修. 政 治 大 勻法需要以單齡組資料做修勻,參考簡易生命表作法,用 0 歲至 76 歲單齡組資 立 勻法及 Whittaker 修勻法。與上一節唯一差別在於使用資料的年齡組,Greville 修. 料做 Greville 修勻(0-60:Greville 法,60-76:Greville 法+ Gompertz-Makeham 法),. ‧ 國. 學. 因此本節先列出單齡組傳統修勻效果,之後再討論五齡組傳統修勻效果。. ‧. 表 4-2 為使用全台灣男性單齡組,完全不修勻與兩種傳統修勻方法的誤差比. y. Nat. 較,可看出當目標地區大小在 200 萬以下,傳統修勻的誤差都比完全不修勻來的. er. io. sit. 小,使用傳統修勻誤差會隨著人數增加而減少。由表可知,當人數為 5 萬修勻前 後的誤差分別為 73%、45% (43%),降低誤差約三四成,當人數為 100 萬修勻前. al. n. v i n 後的誤差分別為 17%、14% (9%),降低誤差兩成以上。 Ch engchi U. 表 4-3 為均方誤差(MSE)的評斷標準下,同地同時的修勻方法比較。以平均. 絕對誤差(MAPE)當作評斷標準時 Greville 的誤差都優於 Whittaker,但衡量標準 若換成均方誤差(MSE),則 Whittaker 所有情形都優於 Greville。圖 4-1 為傳統修 勻在各年齡層的誤差修正,可明顯看出 Greville 在低年齡時修正誤差的能力較好, 而 Whittaker 則是在中高齡部分修正誤差較好,因此此兩種傳統修勻方法無法評 斷優劣,但可知傳統修勻有助於減少誤差。 若我們以 Lewis 準則來評估當平均絕對誤差(MAPE)小於 20%為良好,單齡 組資料在人數小於 50 萬為傳統修勻的限制;五齡組資料在人數小於 20 萬為傳統 修勻的限制。因此下一節我們採用王信忠等人(2012)及林志軒(2014)的跨地區修 28.

(35) 勻方式,利用大母體的資訊來修勻,降低死亡率的誤差。. 表 4-2、Greville 法及 Whittaker 法的修勻誤差(單齡資料。MAPE:%). 1萬. 2萬. 5萬. 10 萬. 20 萬. 50 萬. 100 萬. 200 萬. 不修勻. 125.56. 101.45. 73.01. 54.89. 39.40. 24.60. 17.45. 12.32. Whittaker. 89.41. 68.06. 45.75. 33.44. 24.92. 17.61. 14.14. 11.75. Greville. 87.15. 66.36. 43.55. 30.83. 21.85. 13.92. 9.96. 7.20. 2萬. 政 治 大 5 萬 10 萬 20 萬 50 萬. 20.70. 10.38. 4.15. 2.08. 1.04. 6.95. 3.49. 1.39. 0.70. 8.25. 4.13. 1.65. 0.83. 表 4-3、Greville 法及 Whittaker 法的修勻誤差(單齡資料。MSE:‰). 0.41. 0.21. 0.10. 0.35. 0.14. 0.07. 0.04. 0.41. 0.17. 0.08. 0.04. y. sit. io. er. Nat. Greville. 200 萬. ‧. Whittaker. ‧ 國. 不修勻. 100 萬. 學. 立. 1萬. 表 4-4、Greville 法及 Whittaker 法的修勻誤差(五齡組資料。MAPE:%). n. al. 1萬. 2萬. 不修勻. 68.23. Whittaker. 51.54. Ch. i50v 萬 n U. 5萬. 10 萬. 20 萬. 50.59. 32.90. 22.88. 16.28. 38.20. 27.62. 22.68. 19.82. engchi. 29. 100 萬. 200 萬. 10.27. 68.23. 50.59. 17.70. 51.54. 38.20.

(36) 政 治 大. 立. ‧ 國. 學. 圖 4-1、Greville 及 Whittaker 修勻的誤差比較(MAPE). 「異地同時」的探討. ‧. 第二節. sit. y. Nat. 王信忠等人(2012)所探討的 Whittaker Ratio 和 Partial SMR,都是使用跨區域. al. er. io. 的方法,借用大母體的資訊來修勻。當小區域的人數不足,死亡率估計不穩定時,. v. n. 可以用當年度的大區域資料做輔助資料,為「異地同時」的想法。本節採用五齡. Ch. engchi. i n U. 組的資料做「異地同時」電腦模擬,「異地同時」的方法包含 Whittaker Ratio 及 Partial SMR。Whittaker Ratio 為先計算大小區域各年齡組的死亡率比值,再套用 Whittaker 做死亡率比值的修勻。 Partial SMR 為考慮大小區域死亡率比值再與 SMR 做加權調整,因此兩者都有使用大母體的資訊做修勻,因此被我們列為「異 地同時」的修勻方法。由前一節得知人數對於死亡率的估計有很大的影響,因此 本節先探討跨區域大母體的影響程度。假設不同大小的大母體,包含大母體大小 為無窮大、500 萬、200 萬等,另外也探討大母體與小區域的相異程度,藉此來 測試「異地同時」的使用時機。 圖 4-2 為假設大母體為無窮大且大、小區域死亡率完全相同,此假設下的修 30.

(37) 勻誤差比較(MSE),當人數在 100 萬以上完全不修勻都算是不錯(綠色線),完全 不修勻在人數小於 50 萬,誤差很大(紅色線)。 「異地同時」的修勻可以看到誤差 (MSE)都較完全不修勻來的好,Whittaker Ratio 比完全不修勻有小幅的下降一點; Partial SMR 比完全不修勻好相當多,但是在高年齡層的均方误差(MSE)還是算高。 圖 4-3 為假設大母體為無窮大且大、小區域死亡率完全相同,使用異地同時 方法在各年齡層平均絕對誤差(MAPE)。完全不修勻在 20 歲以下及高齡的死亡率 相當不穩定,且誤差隨著人數變少而急遽上升,可看到 100 萬以上的小區域才較 穩定,人數少於 100 萬相當不樂觀;使用 Whittaker Ratio 及 Partial SMR 都會使. 政 治 大 換言之,參考一個完美的大母體,使用異地同時的修勻方法都可以減少各年度的 立. 各年齡層的誤差降低,可看出修勻後在各年齡層的誤差(MAPE)調整都較一致。. 誤差幅度,而 Partial SMR 的表現最好(各年齡層 MAPE 都小於 20%)。. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4-2、不同研究方法之下的誤差(MSE). 31.

(38) 學. 圖 4-3、不同研究方法之下的誤差(MAPE). ‧. ‧ 國. 立. 政 治 大. 上述大母體的假設太過樂觀,因此考量大母體的震盪狀況,假設大母體大小. y. Nat. sit. 為動態的 200 萬、動態的 500 萬及無窮大,亦即利用相同組 Lee-Carter 參數分別. n. al. er. io. 產生不同的死亡亂數,而小區域的大小依舊使用全臺灣人口結構等比例調整由 1. i n U. v. 萬至 100 萬。表 4-5 為假設大母體為動態的兩百萬、五百萬及無窮大母體,再使. Ch. engchi. 用「異地同時」的修勻結果,「異地同時」的方法包含 Whittaker Ratio 及 Partial SMR。當大區域大小為動態的 200 萬、500 萬及無窮大母體,在大母體不同大小 之下,使用 Whittaker Ratio 及 Patial SMR,修勻後誤差差異都在 2%以內。換句 話說,大母體人數 200 萬已經是一個相當穩定的大母體。 探討當大母體人數為 200 萬,以 Lewis 精確標準來評斷(MAPE<10%), Whittaker Ratio 可以修勻至 20 萬的小區域;Partial SMR 可以修勻至 2-5 萬的小 區域,若是大母體更大更穩定(無窮大母體),甚至可以處理至 1 萬的小區域。. 32.

(39) 表 4-5、五齡組修勻誤差比較(MAPE:%). 小區域大小. 1萬. 2萬. 5萬. 10 萬. 20 萬. 50 萬. 100 萬. 64.48. 47.62. 30.33. 21.08. 15.06. 9.45. 6.71. 17.37. 16.16. 13.32. 10.78. 8.53. 5.74. 4.20. 18.15. 16.46. 13.48. 11.05. 8.76. 6.31. 4.74. 兩百萬. 18.71. 17.12. 14.09. 11.61. 9.27. 6.77. 5.45. 無窮大. 10.76. 7.81. 4.91. 3.44. 2.45. 1.57. 1.12. 五百萬 Partial SMR 11.91. 8.54. 5.93. 4.87. 4.02. 3.45. 3.16. 兩百萬. 9.54. 5.45. 4.87. 4.60. 母體大小 無窮大. 不修勻. 無窮大 五百萬. Whittaker Ratio. 12.50. 立. 治 6.11 政 7.18 大. ‧ 國. 學. 修勻生命表除了希望降低小區域死亡率的震盪外,在各年齡組之間希望滿足 平滑性,利用三次差分均方值來計算各年齡層間的差異,再將各年齡組的誤差加. ‧. 總來判斷「異地同時」的修勻平滑效果。採用全臺灣五齡組資料做平滑性計算,. y. Nat. sit. 由於 0-4 歲、5-9 歲完全不修勻的震盪過大,且計算三次差分的過程中會犧牲前. n. al. er. io. 後三項的資料,因此實際上使用全臺灣五齡組資料,依各年齡層死亡率生成方式. i n U. v. 做電腦模擬 1000 次,只採計 25 歲至 74 歲(25-29、30-34、…、70-74)各年齡層間. Ch. engchi. 三次差分的均方值,最後取平均後的結果。. 圖 4-4 為隨著人數遞增,「異地同時」的平滑性效果。由圖可知,當人數少 於 10 萬完全不修勻的平滑性非常差,使用「異地同時」都有不錯的效果。Whittaker Ratio 在各種人數下都很平滑,甚至至 1 萬左右時平滑性也相當一致,原因為 Whittaker 法在求解過程中就已考慮各年齡間的平滑性效果,因此利用死亡率比 值調整的 Whittaker Ratio 法也保留平滑的性質,整體平滑效果非常好;Partial SMR 在人數 1、2 萬也算良好,使用 Partial SMR 也能大幅提升平滑度。 基本上,人數少於 10 萬完全不修勻的平滑性非常不好,使用「異地同時」 的方法確實能調整死亡率曲線的平滑性。由以上大致可以驗證適度性與平滑性兩 33.

(40) 個效果無法同時滿足,但是至少在穩定的大母體之下,Partial SMR 及 Whittaker Ratio 都算是不錯的修勻方法。. 立. 政 治 大. ‧. ‧ 國. 學 圖 4-4、異地同時的平滑性比較. sit. y. Nat. al. er. io. 然而,在一般的情境下小區域不一定與大區域有相似的死亡率比值,因此本. v. n. 文仿造王信忠等人(2012)、林志軒(2014)的情境設定,假設大小區域的死亡率比. Ch. engchi. i n U. 值為定值、遞增及 V 型來模擬不同的情境。林志軒(2014)所探討的情境為,大、 小區域的死亡率比值由 0 至 0.2。本文擴大比值範圍,將死亡率比值由 0 至 0.9 進行電腦模擬,探討在極端小區域之下,各種修勻方法的適用時機。 圖 4-5 為假設三種情境設定:一、大、小區域死亡率比值為定值,定值幅度 從 1.1~1.9,表示小區域的生活水準或醫療機構比大區域來的差。二、大、小區域 死亡率比值隨年齡直線遞增,遞增幅度由 0.1 至 0.9 (亦即 0.9-1.1、0.8-1.2、0.71.3、…、0.1-1.9),表示小區域高齡人口死亡率較高,可能發生在老年人口照顧 制度不佳的小區域。三、大、小區域死亡率比值隨年齡遞減再遞增(V 型),V 型 幅度由 0.1 至 0.9 (亦即 1.1-0.9-1.1、1.2-0.8-1.2、1.3-0.7-1.3、…、1.0-0.1-1.9),表 34.

(41) 示小區域中間年齡層的人口死亡率較低,可能發生在小區域意外死亡率較低的情 境。. 立. 政 治 大. al. er. io. sit. y. ‧. ‧ 國. 學. Nat. 圖 4-5、假設大、小區域死亡率比值. v. n. 實際電腦模擬作法,假設大母體服從理論死亡率,將理論死亡率乘上各種情. Ch. engchi. i n U. 境後為小區域死亡率,假設小區域死亡人數服從卜瓦松分配產生死亡率亂數,用 此生成死亡率同時考量大母體死亡率,再用「異地同時」的 Whittaker Ratio 及 Partial SMR 來做修勻,最後再還原各種情境下不同幅度的修勻效果。 假設大、小區域死亡率比值為定值且定值幅度從 0 至 0.9,使用全臺灣男性 五齡組資料,以上述方法做電腦模擬 1000 次,先探討小區域人數為二十萬的結 果。表 4-6 為定值情境小區域 20 萬人,定值幅度 0-0.9,異地同時的修勻效果 (MAPE)。完全不修勻的誤差,從定值幅度為 0 的 15%降至定值幅度 0.9 的 10.9%, 當死亡率比值為定值,誤差隨著幅度增加而越小、越穩定,其原因為隨著定值幅 度的增加,死亡率被放大(相當於增加死亡人數的樣本數),進而降低死亡率震盪, 35.

(42) 因此可看出完全不修勻、異地同時方法的誤差都隨著比值幅度變大而變小,另外 Partial SMR 的效果更為突出。表 4-7 為小區域五萬人,在不同定值幅度下,異地 同時的效果。由表可知完全不修勻 5 萬人的誤差約為 20 萬人的兩倍,修勻後的 結果也大致為兩倍。另外,誤差的趨勢相同,都是隨著比值幅度增加而越穩定。. 表 4-6、定值情境下,不同幅度下的修勻效果(20 萬人。MAPE:%). 0. 0.1. 0.2. 0.3. 0.4. 0.5. 0.6. 0.7. 0.8. 0.9. 不修勻. 15.0. 14.3. 13.6. 13.1. 12.7. 12.3. 11.9. 11.5. 11.3. 10.9. Whit.Ratio. 8.5. 8.3. 8.0. 6.9. 6.8. 6.6. Partial SMR. 2.5. 2.4. 7.3 7.0 治 政 2.2 2.1 2.0大 2.0. 1.9. 1.9. 1.8. 0. 0.2. 0.3. 0.4. 0.5. 0.6. 0.7. 0.8. 0.9. 不修勻. ‧ 國. 0.1. 30.1. 28.7. 27.6. 26.5. 25.3. 24.7. 23.3. ‧. 22.4. 21.8. Whit.Ratio. 13.2. 12.8. 12.5. 12.3. 11.9. 11.7. 11.5. 11.4. y. 11.1. 10.9. Partial SMR. 5.0. io. 定值\幅度. 4.6. 4.2. 4.1. 4.1. 3.9. 3.8. 3.7. 3.7. 2.2. 立. 7.7. 7.4. 學. 表 4-7、定值情境下,不同幅度下的修勻效果(5 萬人。MAPE:%). n. al. Ch. engchi. sit. Nat. 4.6. 23.0. er. 定值\幅度. i n U. v. 表 4-8、4-9 為假設大、小區域死亡率比值為遞增、V 型,且死亡率比值幅度 從 0 至 0.9,當小區域人數為二十萬,異地同時的修勻結果。此兩種情境的誤差 都隨著比值幅度增加而變大。完全不修勻的誤差,分別從遞增幅度為 0 的 14.9% 增加至遞增幅度 0.9 的 132.9%;從 V 型幅度為 0 的 14.9%增加至 V 型幅度 0.9 的 125%。 以 Lewis 評斷標準小於 20%為良好,介於 20-50%為合理。當小區域大小為 20 萬時,各情境幅度小於 0.2、0.3 修勻後的誤差小於 20%,算是良好;幅度介 於 0.3-0.7 則誤差介於 20-50%,算是尚可接受;幅度高於 0.7 修勻後的誤差(MAPE) 大於 50%。由表可知使用 Partial SMR 及 Whittaker Ratio 有點差別,當幅度小於 36.

(43) 0.3,Partial SMR 較好;當幅度大於 0.3(0.4),反倒是 Whittaker Ratio 的效果較好。 異地同時的修勻方法會受到大小區域比值非定值幅度的影響,當大母體與小區域 的落差太大,使用 SMR 及大小區域比值就相當不穩定,隨著比值增加,Whittaker Ratio 的表現漸漸優於 Partial SMR;當比值幅度增加至 0.7 以上,完全不修勻的 偏差已經過大,異地同時修勻方法的修正效果也相當有限(超過 50%),因此不建 議使用異地同時的方法。 本節所做的電腦模擬與林志軒(2014)的結論相符,而本文延伸情境至死亡率 比值幅度 0.9,當大小區域相當類似或比值幅度在一定範圍內,使用「異地同時」. 政 治 大 的修勻結果,則須確認大小區域死亡率比值小於 0.2 (0.4),若在比值幅度高於 0.7 立 的效果是一個有效增加樣本數的方法;若在非定值比值之下,要達到精確(良好). 時,不建議使用「異地同時」的修勻方法。異地同時的方法中,Whittaker Ratio. ‧ 國. 學. 較注重各年齡層間的平滑性、較適用於非定值比值幅度較大的情境;Partial SMR. ‧. 則是配適性較好、較適用在定值情境或比值幅度較小的情境。除此之外,以相同. io. sit. 閱附表 4、5。. y. Nat. 方式模擬小區域人數 5 萬的結果與 20 萬人的情況類似,惟誤差較大一些,可參. er. 表 4-8、遞增情境下,異地同時的修勻效果(20 萬人。MAPE:%). 0.8. 68.3. 90.0 132.9. Whit.Ratio. 8.4. 10.4. 14.6. 19.4. 25.8. 32.8. 42.0. 53.5. 72.5 112.8. Paritial SMR. 2.4. 6.2. 12.5. 19.9. 28.5. 38.2. 50.1. 65.6. 89.4 138.6. n. 0.7. 14.9. a l 0.2 0.3 0.4 0.5 i0.6 v n Ch engchi U 17.2 22.2 27.8 35.5 44.0 54.7. 遞增\幅度. 0. 不修勻. 0.1. 0.9. 表 4-9、V 型情境下,異地同時的修勻效果(20 萬人。MAPE:%). V 型\幅度. 0. 0.1. 0.2. 0.3. 0.4. 0.5. 0.6. 0.7. 0.8. 不修勻. 14.9. 16.7. 21.6. 27.4. 34.4. 42.9. 52.9. 65.8. 85.2 125.0. Whit.Ratio. 8.5. 10.5. 14.9. 20.5. 26.9. 34.5. 43.4. 54.9. 72.2 109.5. Partial SMR. 2.4. 6.2. 12.4. 19.5. 27.5. 36.5. 47.0. 60.5. 80.3 121.0. 37. 0.9.

(44) 第三節. 「異地異時」的探討. 本節想解決上一節比值幅度過大造成修勻效果不佳的問題,林志軒(2014)探 討大小區域修勻加上死亡模型的效果比單純使用大小區域修勻還好,因此本文測 試修勻加上死亡率模型,並將此方法整理為「異地異時」。 「異地異時」主要分為兩類,一、藉由大、小區域修勻再加上死亡率模型, 例如:Partial SMR 加上 Lee-Carter 死亡率模型,可視為結合不同區域的狀況後, 再經由 Lee-Carter 模型調整各年度的死亡率變化。另一種方式為 Li and Lee (2005) 的 Coherent Lee-Carter 模型,同時考量大小區域死亡率及各年度時間的方法 1,. 政 治 大 沿用上一節的情境,假設大、小區域死亡率比值為遞增、V 型,且幅度從 0 立. 因此整理這些「異地異時」的方法,試圖解決大、小區域死亡率比值過大的問題。. ‧ 國. 學. 至 0.9。表 4-10、4-11 為使用電腦模擬 1000 次,在人數為二十萬下,比較異地同 時與異地異時的修勻效果,異地同時的方法包含 Whittaker Ratio 及 Partial SMR;. ‧. 異地異時的方法包含 Partial SMR+Lee-Carter 模型、Whittaker Ratio+Lee-Carter 模. sit. y. Nat. 型及 Coherent Lee-Carter 模型。由表可知,異地異時無法有效修正非定值的情境,. al. er. io. 至多修正 0.1 個幅度 (即非定值比值幅度至 0.4),Partial SMR 或 Whittaker Ratio. v. n. 修勻後再套用 Lee-Carter 模型都比單純使用 Partial SMR 及 Whittaker Ratio 誤差. Ch. engchi. i n U. 來的小一些,而「異地異時」與「異地同時」的修勻效果類似,在比值幅度大於 0.7 以上則不建議使用。 異地異時的組合方面,Partial SMR+Lee-Carter 在比值幅度小時,誤差較小; 相反地,Whittaker Ratio+Lee-Carter 在比值幅度較大時,誤差較小,此結果與異 地同時的結果相近。死亡率模型部分,Coherent Lee-Carter 效果不如使用異地同 時的修勻。除了模擬 20 萬人之外,也在附錄(附表 6、7)提供 5 萬人的異地異時、 異地同時的修勻比較,由於人數更少死亡率震盪更大,因此在遞增及 V 型情境 下,異地同時的修勻極限為比值幅度小於 0.1;異地異時的修勻極限為比值幅度. 1. 詳細的 Coherent Lee-Carter 介紹可參考第二章文獻回顧。 38.

(45) 小於 0.2。 由此節可知,若是有穩定大母體(定值情境),我們能使用「異地異時」修勻 達到非常好的效果,包含適度性及平滑性,然而異地的修勻方式有很大的限制, 即使使用「異地異時」方法也頂多增加 0.1 個幅度。當比值幅度過大(0.7),上述 兩種方式就不建議使用。. 表 4-10、遞增情境下,異地異時的修勻效果(20 萬人。MAPE:%). 0. 0.1. 0.2. 0.3. 0.4. 0.5. 0.6. 0.7. 0.8. 不修勻. 14.9. 17.2. 22.2. 27.8. 35.5. 44.0. 54.7. 68.3. 90.0 132.9. Whit.Ratio. 8.4. 10.4. 治 政 大 42.0 14.6 19.4 25.8 32.8. 53.5. 72.5 112.8. Partial SMR. 2.4. 6.2. 12.5. 19.9. 28.5. 38.2. 50.1. 65.6. 89.4 138.6. 1.7. 5.6. 11.3. 17.6. 25.2. 33.9. 45.1. 60.1. 83.3 131.0. 5.5. 7.4. 11.4. 16.0. 22.3. 29.1. 38.0. Nat. 9.2. 13.4. 18.2. 24.8. 31.9. 40.4. io. n. al. y. 51.3. sit. 7.0. 51.0. 0.9. 71.1 112.1 68.6 104.6. er. Li-Lee. ‧. Whit.Ratio+ Lee-Carter. ‧ 國. Partial SMR+ Lee-Carter. 立. 學. 遞增\幅度. iv n U 0.6 0.5. 0.7. 0.8. 表 4-11、V 型情境下,異地異時的修勻效果(20 萬人。MAPE:%). V 型\幅度. 0. 0.1. C0.2h. 不修勻. 14.9. 16.7. 21.6. 27.4. 34.4. 42.9. 52.9. 65.8. 85.2 125.0. Whit.Ratio. 8.5. 10.5. 14.9. 20.5. 26.9. 34.5. 43.4. 54.9. 72.2 109.5. Partial SMR. 2.4. 6.2. 12.4. 19.5. 27.5. 36.5. 47.0. 60.5. 80.3 121.0. Partial SMR+ Lee-Carter. 1.7. 5.8. 11.4. 17.7. 24.8. 33.0. 42.3. 54.2. 71.8 108.7. Whit.Ratio+ Lee-Carter. 5.7. 8.1. 13.1. 18.9. 25.5. 33.2. 42.2. 53.5. 70.4 105.9. Li-Lee. 7.1. 9.4. 14.6. 20.7. 27.7. 35.8. 44.7. 56.4. 74.0 111.5. e0.3 n g c0.4h i. 39. 0.9.

參考文獻

相關文件

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006... 了解大樣本與小樣本母體常態、變異數已知與未知 下,單一母體平均數區間估計的方法。知悉

The study samples are students’ quiz grades , homework assignments (paper homework and English homework) and six comprehensive examinations.. It’s our hope that these conclusions

日本侵略中國的背景、抗日戰爭的經過與結果 一、建議教節:4 節(以一節 40

有感過去於休閒事業管理系的學習非常充實與快樂,因此於 93 年 3

(approximation)依次的進行分解,因此能夠將一個原始輸入訊號分 解成許多較低解析(lower resolution)的成分,這個過程如 Figure 3.4.1 所示,在小波轉換中此過程被稱為

表 4-4-5 彙整了不同教育程度的民眾對祭品用品電子化的接受度之 單因子變異數分析統計結果。由表 4-4-5 的整體量表的 F

其 m 值約可達到 1 左右,也就是呈現出牛頓型黏滯行為。該類材料主要是由滑移過程 (slip-controlled process)

域更新的方式反映在各 Slave 的費洛蒙路徑上,也因此 Slave 之間不需要傳輸 大量費洛蒙資訊亦可分享其他 Slave