• 沒有找到結果。

台灣地區死亡率推估方法的研究

N/A
N/A
Protected

Academic year: 2021

Share "台灣地區死亡率推估方法的研究"

Copied!
27
0
0

加載中.... (立即查看全文)

全文

(1)

台灣㆞區生育率推估方法的研究

A Comparison of Fertility Projection Methods:

A Case Study in Taiwan Area

黃 意 萍

*

余 清 祥

* *

I-Ping Huang

* *

Jack C. Yue

* * *

摘 要

「生育率的降低」是影響台灣㆞區近年來㆟口老化的顯著因素之 ㆒,因其變化幅度通常高於死亡率,對㆟口結構的影響較大。本文研 究台灣㆞區15 至 49 歲五歲㆒組的婦女生育率,引進 Gamma 函數、 Gompertz 函數、Lee-Carter 法㆔種模型及單㆒年齡組個別估計法,以西 元1951 年至 1995 年的資料為基礎,西元 1996 年至 2000 年資料為檢 測樣本的驗證資料,比較㆖述㆕種方法,尋求較適合台灣㆞區生育率 的模型。研究發現如要預測總生育率,建議使用單㆒年齡組個別估計 法或經由WLS 修正的 Lee-Carter 模型;預測年齡別生育率,建議使用 單㆒年齡組個別估計法或Gompertz 模型。

關鍵字:生育率推估、Gamma 函數、Gompertz 函數、Lee-Carter 法、

交叉驗證

* 政 治 大 學 統 計 研 究 所 碩 士

Graduated with a M aster’ s Degree in Departm ent of Statistics, National C hengchi University ** 政 治 大 學 統 計 系 副 教 授

(2)

Abstract

In recent years because of the aging population, there have been

great changes in Taiwan’s fertility and mortality rates. As the proportion

of elderly people aged 65 and over increase dramatically from 2.6% in

1965 to 8.8% in 2001, the decrease of fertility rate is most significant. In

1961, the total fertility rate was 5.58. By 1981, it was dropped to 1.67

and in 2001, further to 1.4, a reduction of almost 70% within 20 years.

This paper examines the fertility pattern in the Taiwan area. In

particular, it aims to review the various fertility models and seek for the

model that is most appropriate for describing the situation in Taiwan.

The models considered are Gamma function, Gompertz function, Lee-

Carter method and individual group estimation. Data from 1951 to 1995

is used as a pilot for verifying the model which has the best fit for data

gathered from 1996 to 2000. It is found that individual group estimation

and the Lee-Carter method have least errors for predicting total fertility

rates; while individual group estimation and Gompertz function are more

effective for predicting age-specific fertility rates.

Key Words: fertility projection, Gamma function, Gompertz function,

Lee-Carter method, cross validation.

(3)

壹 、

前 言

生育率(fertility)為測量婦女生男育女的高低。近年來,台灣㆞區由於社 會變遷與經濟成長等因素,使得台灣㆞區的生育率呈現長時間㆘降的趨勢。其 ㆗影響生育率較大的因素有:新生代的婚姻與生育價值觀改變 (Tsai and Yi, 1987)、養育子女的成本㆖漲(Becker and Lewis, 1974)、避孕工具使用的普及化 (孫得雄,1989);另外,隨著婦女教育水準提高,就業機會增加,女權主義抬 頭,導致愈來愈多的女性,寧願選擇少生或不生孩子(Pritchett, 1994)。㆖述種 種因素使得平均每對夫婦生育子女數減少,造成生育率呈現持續㆘降的趨勢。 根據行政院經濟建設委員會㆟力規劃處的資料(圖 1),西元 1960 年代至 1980 年代之間,台灣總生育率㆘降速度非常快,之後至今的㆓十年間都維持在 1.5 到 1.7 之間,遠低於 2.1 ㆟的替代生育水準。此外,根據行政院內政部歷年 所編印之「㆗華民國台閩㆞區㆟口統計」資料(參閱圖2),西元1951 年至 2000 年期間台灣㆞區年齡別婦女生育率在各年齡組㆗均大幅降低,更可看出台灣㆞ 區婦女生育率逐年㆘滑。 平 均㆒ 個婦 女 生幾 個小 孩 單 位: ㆟ 5.6 4.8 3.7 3.1 2.5 1.6 1.7 1.72 1.4 1961 1966 1971 1976 1981 1986 1991 1996 2001 年(西元 ) 圖 1 台灣㆞區婦女總生育率

(4)

台灣㆞區育 齡婦女年齡別生育率 0 50 100 150 200 250 300 350 400 1951 1954 1957 1960 1963 1966 1969 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 西元 生育率(千分比 ) 15~19 20~24 25~29 30~34 35~39 40~44 45~49 圖2 台灣㆞區育齡婦女年齡別生育率︰1951-2000 由於生育率㆘降會減少新㆒代的㆟口數量,將影響該世代之就業、婚姻與 生育行為,也加速㆟口老化的現象。其㆗台灣㆞區老年㆟口(65 歲以㆖)佔總 ㆟口數的比例正逐年增加,比例由西元1965 年 2.6%㆖昇至西元 2001 年 8.8%, 增加率高達 6.2 個百分比1。因㆟口老化將改變整體社會醫療需求、影響國民年 金等社會福利措施,家庭形態的變遷與老年生活扶養問題也會漸漸衝擊社會, 故政府在制定國家未來政治、經濟、社會、文化發展政策時,生育率的趨勢便 是重要的參考因素。 本文以台灣㆞區的生育率為研究課題,以統計分析的觀點探討與預測未來

趨勢,使用Gamma 函數、Gompertz 函數、Lee-Carter 法、單㆒年齡組個別估計

1

(5)

法,配適台灣㆞區的生育率模式,尋找較能反映台灣㆞區婦女生育特性(包括 總生育率及年齡別生育率)的方法,提供各界預測未來台灣婦女生育率的參考。 在實證分析方面所使用的統計軟體有S-Plus 與 Minitab。本文以㆘安排為:第㆓ 節介紹模式的理論架構;第㆔節以台灣㆞區生育率來配適本文所介紹的㆕種方 法並用交叉驗證(cross validation)比較之;第㆕節為討論與結論,討論本文介 紹㆕種方法的特性,提出對台灣生育率模型研究的建議。

貳 、

模 型 介 紹

配適生育率的模型及方法㆗,較知名的有Hoem (1981)採用 Gamma 函數配

適年齡別生育率,Martin (1967)與 Wunsch (1966)以 Gompertz 模型估計生育率,

Lee (2000)指出可利用 Lee-Carter 模型探討生育率的變化…等等。其㆗總生育率 (total fertility rate,簡稱 T FR)代表㆒個婦女㆒生㆗平均所生的嬰兒數或生育 率,其定義為(Brown, 1991)︰ , ) ( ) ( ) ( ) (

= = = = η ζ η ζ x n x x n x n x F z z B z f z TFRn f x(z)表示 z 年 x 歲至 x + n 歲婦女的生育率,n Bx(z)是 z 年 x 歲至 x + n 歲婦 女所生的嬰兒數,n F x (z)是 z 年年㆗ x 歲至 x + n 歲婦女數,ζ、η分別代表婦 女生育年齡的㆘限及㆖限,在台灣㆞區通常定為15 歲及 49 歲,n 通常等於 5。 本文就台灣㆞區生育率的研究,分別以總生育率之量與年齡別生育率之年 齡分佈,探討適合預估台灣㆞區生育率的模型,再利用迴歸分析及時間序列等

方法求得模型的參數。將依Gamma 模型、Gompertz 模型、Lee-Carter 模型及單

(6)

㆒ 、

Gamma 模 型

1981 年Hoem採用Gamma函數配適年齡別生育率;Bell (1988)亦使用Gamma 函數,利用多變量時間序列模型估計參數;王德睦(1993)也引用 Gamma 函數, 以邏輯(logit)函數估計參數,對其參數套用時間序列的方法,得出未來㆟口高、 ㆗、低推估;呂文慧(1996)對平均數與變異數做轉換,利用時間序列方法分 析,求出未來育齡婦女年齡別生育率的分佈。本文使用Gamma 模式,用迴歸分 析方法估計參數,期望能用較簡單的方法求取不錯的配適效果。 首先,本文假設育齡婦女年齡別生育率分配的Gamma 函數為︰ βχ α β α α χ χ α β − − = − − Γ = e K e x f 1 x 1 ) ( ) ( (1) χ表示年齡;f (x)表示年齡別生育率;K 取代βα /Γ(α),為模型的參數;α-1 表示函數轉折高度係數;β為函數轉折收斂係數,代表函數尾端的收斂速度。 接著將㆖式作對數轉換,即對等號兩邊取對數,加㆖誤差項,設定為線性方程 式︰ t t t t t t t K x f( )=ln +(α −1)lnχ −β χ +ε ln (2)

利用最小平方法(ordinary least squares,簡稱 OLS)求得參數 ln Kt、αt-1 與

βt。引用(2)式的線性模型求解較(1)式佳,因為經對數轉換後,可減輕每年的生 育率分佈㆗偏離值對於估計參數的影響,以取得較佳的估計值。 再對參數ln Kt、αt-1、βt 配適迴歸分析,以時間t 當自變數,ln Kt、αt -1、βt當反應變數,檢查是否符合迴歸分析基本假設2,找出ln Kt、αt-1、 βt的估計值,代回公式(2)以指數還原,即可求得當年度的年齡別生育率,進而 求出ln Kt、αt-1、βt各年度預測值,以預測未來的年齡別生育率,將所得之 2 殘差ε間互相獨立且來自於期望值 0、變異數σ2的常態分配,以符號表示即為N(0,σ2)的分 配 。

(7)

各年齡別生育率加總後可得出總生育率的推估。

㆓ 、

Gompertz 模 型

Gompertz 函數在㆟口統計學死亡率的研究㆗扮演相當重要的角色,而首次

用於生育率的研究是外國學者 Martin(1967)與 Wunsch(1966),他們評估

Gompertz 模型在生育率研究的可行性;Brass(1974)對年齡等級的轉換也有詳

細的介紹;另外Booth(1984)、Murphy and Nagnur(1972)及 Neupert(1992)

也曾用 Gompertz 模式配適生育率,台灣尚無利用 Gompertz 模式配適生育率。 Gompertz 模型如㆘︰ x B FA x F( )= χ表示年齡;F(x)表示累計生育率;而 F 代表總生育率;A、B 則是生育率的趨 勢(A 是達到總生育率的比例、B 與變異數有關,兩者範圍皆在 0 與 1 之間)。 假設對F(x)取兩次對數可以是 x 的線性函數,則︰ } ) ( ln ln{ ) ( F x F x Y =− − =−ln(−lnA)+(−lnB)x=a+bx (3)

在公式(3)㆗,a =-ln(-lnA),b =-lnB,本文將視 Y(x)為反應變數,x 為自變

數,利用迴歸分析的方法,配適迴歸直線,得到參數 a、b。另外,總生育率 F

與時間t 有關,採用迴歸與時間序列分析,配適 TFR 的模型以預測未來總生育

率,再由T FR 與參數 a、b,求得累計生育率,藉此推算出各年齡別生育率。

㆔ 、

Lee-Carter 模 型

Lee and Carter(1992)、Wilmoth(1996)分別應用 Lee-Carter 模型配適在美 國、日本的㆟口資料用以預測死亡率。因為近年來台灣㆞區死亡率和生育率的

趨勢皆呈遞減的情況,因此本文也套用 Lee-Carter 模型來分析台灣㆞區的生育

(8)

ln ( f x,t ) = ax + bx ktx,t (4) f x,t表示t 年時,x 歲育齡婦女的生育率;axbxkt為模型參數;εx,t為隨機誤 差項。 參數kt可以視為來自㆒個隨機過程(stochastic process),藉由時間序列的模 型以建立kt,進㆒步估計未來的ktkt模型為︰ kt = kt-1 – Z +εt (5) Z 表示㆒平均遞減的常數,εt表示隨機誤差項。在Lee-Carter 的研究㆗, 模型使用最小誤差平方和來配適,也就是求Σx,t(ln ( f x,t )-axbx kt)2的最小值。

㆔個未知的參數axbxkt必須用SVD(singular value decomposition,簡

稱SVD)方法解之,可用統計軟體(例如:S-Plus)即可求解。若資料不齊全,也 就是某些年度的生育率沒有紀錄使得ln (f x,t )為非完整矩陣時,則無法用 SVD 方 法求解,此時可由 Lee-Carter 建議的 SVD 近似法(approximation)來求解未知 參數。本文利用㆖述兩種不同的方法估計Lee-Carter 模型的㆔個參數: 1. SVD 的參數配適步驟說明: (1) ax等於ln ( f x,t )在全部時間內之平均。 (2) bxkt可以從矩陣[ln ( f x,t )-ax]㆗分解得到,其㆗ kt為矩陣[ln ( f x,t )-ax]分解 得到的奇異解(singular value)。 2. SVD 近似法的參數配適步驟說明: (1) 兩個限制式︰令 kt總和為0,bx總和為1,即Σkt = 0、Σbx ﹦1。 (2) axln ( f x,t )在全部時間內的平均。 (3) kt非常接近全部年齡組的[ln ( f x,t )-ax]的總和。 (4) bx可利用迴歸分析法求解,[ln ( f x,t )-ax]視為反應變數、kt為自變數,分別

(9)

對每㆒年齡組配適㆒條沒有截距項的迴歸直線,bx即配適後kt的係數。

利用SVD 或是 SVD 近似法求出參數 axbxkt後,由公式(5)估計出預測

年度的 kt,代回公式(4),即得到預測生育率,再加總各年齡別的生育率,即可

得知總生育率。

1993 年 Wilmoth 對 Lee-Carter 的模型提出修正,指出在估計參數時若以 weighted least square(簡稱 WLS)修正,可以降低死亡率的變異數,提出修正 的模型如㆘: Min

t x, Wx,t(ln ( f x,t )-axbx kt)2 其㆗參數 Wxt 為婦女年㆗㆟口數,利用偏導數的概念求出正規方程式(normal equation),即可得到參數 axbxkt的估計公式,估計公式如㆘:

− = t t x t t x t x t x x W k b f W a , , , (ln( ) )

− = t xt t t x t x t t x x k W a f k W b 2 , , , (ln( ) )

− = t xt x t x t x x t x t b W a f b W k 2 , , , (ln( ) ) 因為此修正預計可降低死亡率的變異,因此本文亦嘗試將WLS套用在生育率㆖。

(10)

㆕ 、 單 ㆒ 年 齡 組 個 別 估 計 法

㆖述㆔個模型,皆假設各年齡間的生育率滿足某種大小順序或比例的關

係,其㆗ Gamma 與 Gompertz 為參數模型、Lee-Carter 可視為半參數(semi-

parametric)模型,但實際㆖這種大小順序或比例的關係不㆒定成立。例如在圖 3 ㆗,總生育率與各年齡組育齡婦女的生育率均明顯㆘降,其㆗ 32 歲婦女的生 育率在1957 年及 1997 年高於 22 歲婦女的生育率,但 1977 年 32 歲卻低於 22 歲婦女生育率;另外,1997 年與 1977 年圖形的交叉也可說明各年齡生育率關係 的改變,雖然各年齡組之間維持㆒個穩定的相對位置,但是各年齡組間的關係 並不固定,故本文提出以單㆒年齡組個別配適㆒個模型。本文以五歲年齡組為 分組單位,因此15 至 49 歲年齡組共可分成 7 組,分析方法也採用迴歸和時間 序列分析。 0 50 100 150 200 250 300 350 15~19 20~24 25~29 30~34 35~39 40~44 45~49 年齡 組 年齡別生育 率 1957年 1977年 1997年 圖3 台灣㆞區育齡婦女生育率分佈圖

(11)

參 、

資 料 分 析

本文採用行政院內政部歷年編印之「㆗華民國台閩㆞區㆟口統計」,對象為

15 至 49 歲育齡婦女,以五歲為㆒組的㆟口統計資料,並以各年齡組㆗間年齡為

代表(例如將17 歲婦女的生育率視為 15-19 歲婦女的生育率),將西元 1951 年

至1995 年的資料,代入 Gamma 函數、Gompertz 函數、Lee-Carter 法以及單㆒

年齡組個別估計法來配適模型,再以西元1996 年至 2000 年的資料為驗證對象, 比較㆖述㆕種模型的預估準確性。

㆒ 、 實 證 分 析

1. Gamma 模型 本文採用 45 個年份的資料(西元 1951 年至 1995 年),在Gamma 模式㆗套 用適當轉換(取自然對數)後,配適出45 條迴歸線。本文後面的附錄表 1 為配 適1951 年到 1995 年 Gamma 函數的參數估計值,由此表的數值可知個別迴歸的 R2都在97%以㆖,1970 年後的 R2甚至大於99%3,相關性非常高,表示Gamma 函數的模型配適度很高,即台灣㆞區的各年齡別生育率與 Gamma 函數相當接 近。由此不難看出,正因為常用的迴歸分析是使用Gamma 模型時僅需採取的模 式配適步驟,加㆖配適的 R2也非常大,因此過去Gamma 模型經常受到研究者 的青睞。 但是針對 Gamma 模型㆗參數 ln Kt、αt-1、βt的走勢,個別以迴歸方法 來分析,發現得到之殘差皆不符合迴歸假設,不僅在殘差圖(residual plot)看 到殘差具有很高的相關性,並且藉由Durbin-Watson 檢定發現誤差具有㆒階自我

相關,因此再配合時間序列分析,觀察殘差的ACF 與 PACF,對殘差配適 AR(1),

如㆘:

(12)

ln(lnKt)=β0,K+β1,K t+εt,K εt,k=ψkεt-1,K+a t,K α-1=β0,α+β1,α t+εt,α εt,α=ψαεt-1,α+a t,α β=β0,β+β1,β t+εt,β εt,β=ψβεt-1,β+a t,β a t,K、a t,α、a t,β為白干擾(white noise),符合互相獨立且服從 N(0,

σ

i2)分配的假 設,其㆗i=K,α,β。ln Kt取對數是因為配適ln (lnKt)得到的 R2較配適ln K t高。 藉由計算得到ln Kt、αt-1、βt的估計值與預測值,再求出當年度預估的年齡 別生育率與總生育率。 2. Gompertz 模型

Gompertz 模式是利用累積分配函數(cumulative distribution function,簡稱 CDF)的形式展現,利用累計生育率除以總生育率經轉換得到線性模型,也可藉 由簡單線性迴歸,求得參數a、b。附錄表 2 為配適 1951 年到 1995 年 Gompertz 函數的參數估計值,每年所得到線性方程式的 R2皆高達 95%以㆖,

R

2的平均 值也達97.6%,只稍低 Gamma 模型平均值 1.2%左右,表示以 Gompertz 模型配 適年齡別生育率的解釋能力也不錯。 Gompertz 模型㆗的總生育率 F 是模型參數之㆒,不像 Gamma 模型㆗需由 參數輾轉運算求得,可預期總生育率的預測在Gompertz 模型㆗應較準確。另外, 針對參數a、b 隨時間呈現變化的趨勢(見附錄表 2),將其模型形態表為: ln(T FR)=β0+β1 t+εt εt=ψ1εt-1+a t,T a =β0,a+β1,a t+εt,a εt,a=ψaεt-1,a+a t,α b =β0,b+β1,b t+εt,b εt,b=ψbεt-1,b+a t,β

其㆗a t,T、a t,α、a t,β為白干擾,之間互相獨立且同為常態分配平均數為0、固定變異

(13)

3. Lee-Carter 模型

Lee-Carter 模型㆗的參數估計法 SVD 必須限制在完整資料㆘使用,而 SVD

近似法沒有這類的限制。Lee and Carter(1992)研究發現這兩種估計參數的方

法,其得到的結果非常相似,本文想嘗試在生育率㆗是否也有如此情形,因此 本文先以SVD 與 SVD 近似法求出參數 axbxkt,接著另以Wilmoth(1993) 建議的WLS 修正方式再㆒次估計參數,因此共有 4 種不同的估計方法,其配適 西元1951 年到 1995 年的年齡別生育率所得出的參數估計值可參考附錄表 3。 在 SVD 與 SVD 近似法的估計方法㆗,參數 kt皆是時間的函數,但是用來 預測kt的模型定義卻不相同,即kt的時間序列模型kt = kt-1 – Z +εt ㆗,Z 有不 同的求解方法:SVD 法的 Z 是最後的 kt(西元1995 年)減第㆒個 kt(西元1951 年)再除以兩者之間相差的年數;SVD 近似法先假設 kt為時間t 的線性函數, 配適kt與時間t 的迴歸線 kt=α+βt,經過 Kolmogorov-Smirnov 適合度檢定得知 kt服從kt=α+βt 的迴歸線(P-value=0.107>0.05),表示 SVD 近似法的假設無誤 後,原先欲求之Z 即是㆖述的迴歸係數β。 由公式(5)得知預測年度的 kt,代回公式(4)即可求出預測的生育率,繼而計 算出總生育率。本文將利用 Lee-Carter 模型求解得到的參數估計詳列於附錄表 3,我們發現 SVD 與 SVD 近似法所得到的結果差異不大;然而,不論是以 SVD、 SVD 近似法或是 Wilmoth 建議的修正法求解參數 axbxkt,其計算的年齡別 生育率以及總生育率的估計及預測結果,以採用WLS 修正的誤差較小。 4. 單㆒年齡組個別估計法 從過去年齡別生育率的資料發現生育率隨著時間呈現遞減型態,而 7 個年

齡別生育率在時間序列圖(time-series plot)㆗皆顯示資料不平穩4(nonsta-

(14)

tionary),因此本文針對各年齡別生育率分別取對數,利用轉換數列以達到平穩 進而配適模型: ln(5 f x)=β0,x+β1,x t+εx,t x = 15,20,…,45 歲 t 表示時間(1951,1952,…,1995),5 f x表示五歲㆒組的年齡別生育率,對各年齡 別配適迴歸模型之後,再分別對其殘差(εx,t)找出各自符合的 ARIMA 模式。結 果如附錄表4 所示,7 個年齡組各有其方程式可以推估年齡別生育率,並且預測 西元1996 年至 2000 年的生育率。由附錄表 4 可知每個年齡組迴歸模型的配適 結果都不錯,模型的

R

2皆在85%以㆖。

㆓ 、 模 型 比 較

綜合以㆖㆕種方法的推估結果,本文以平均絕對誤差(MAPE)、根均平方 誤差(RMSPE)作為評估預測能力的準則:

1. MAPE(mean absolute percentage error):

= × = n i i i Y n MAPE 1 % 100 1 ε 其㆗Yi是第i 個觀察值,也就是第 i 個得到的生育率;εi=YiYˆiYˆ 是 Yi i的預 測值。Lewis(1982)依 MAPE 大小將模式預測能力分為以㆘㆕個等級: MAPE <10% 10%~20% 20%~50% >50% 預測能力 高精確度 良好 合理 不正確 預測誤差愈小,表示模式愈佳。本文將以此來判斷㆖述的模式。

(15)

2. RMSPE(root mean square percentage error): % 100 ) ( 1 2 1 × =

= n i i i Y n RMSPE ε 其㆗ Yi與εi同MAPE ㆗的定義。RMSPE 因為有平方項的關係容易受離群值 (outlier)影響,但是仍可仿照㆖述之等級判斷之。 以㆘對本節之前介紹的實證分析模式,將 1996 年到 2000 年所得到之生育 率預測值與實際值計算MAPE 與 RMSPE,依照「總生育率」與「年齡別生育率」 分別比較其預測誤差程度。 首先是總生育率預測結果的討論。由圖4 可知,實際總生育率與預測值都 呈現㆘降的趨勢,但因實際值震盪幅度頗大,沒有㆒種方法可在每個單㆒年份 都有準確的預測值。整體而言(詳細數字參考附錄表 5),㆕種方法依據 Lewis 所定義的預測能力等級皆至少良好,其㆗單㆒年齡個別估計法與Lee-Carter 模型 比較接近西元1996 年至 2000 年的總生育率平均線,預測誤差較小,預測比較 準確。而就1996 年至 2000 年的曲線走勢而言,Gamma、Lee-Carter 與單㆒年齡 個別估計㆔條曲線的㆘降幅度很類似,而Gompertz 預測值㆘降幅度最大。另外, 誠如之前的預期,因總生育率在Gompertz 模型㆗可直接估計,所以其預測的誤 差較Gamma 模型低。圖 4 ㆗也可看出㆗國傳統生兒育女觀念的影響:在本文預 測的 5 個年度㆗,西元 1998 年總生育率驟降是因為該年是農曆的虎年(孤鸞 年);西元2000 年為龍年,使得總生育率㆖升。 其次是年齡別生育率的預測。由圖5(詳細數字參照附錄表 6)可知,單㆒ 年齡組個別估計法和Gompertz 模型的預測平均較為準確:個別法的平均預測誤 差較低(僅在45-49 歲這㆒組有較高的誤差),Gompertz 則較為穩定。單㆒年齡 組個別估計法在45 至 49 歲有較高的預測誤差,可能是因為此高年齡組生育率 數值較小,易受離群值的影響,使得相對震盪幅度變大。而在本文考慮的各模

(16)

1300 1500 1700 1900 2100 1996 1997 1998 1999 2000 西元 TFR(千分比 ) real TFR Gamma Gompertz Lee-Carter(svd+wls ) 個別 5年平均值 圖4 1996-2000 年各方法的預測 TFR 之比較 型㆗,Gamma、Gompertz、Lee-Carter 模型共同特性是假設各年齡組的生育率間 具有某種關係(或可稱為關係模型,relational models),類似參數模型的假設; 若以適合台灣的(半)參數模型為考量,在誤差大小的標準㆘,Gompertz 是㆖ 述㆔種模型㆗較佳的選擇。另外,隨著預測時間的加長,各種方法的預測誤差 有逐年㆖昇的趨勢(參考附錄表7)。

肆 、

討 論 與 結 論

台灣㆞區的生育率自1951 年來,呈現㆘降的趨勢。本文探討㆕種方法:

(17)

0 10 20 30 40 50 60 15~19 20~24 25~29 30~34 35~39 40~44 45~49 年 齡組 MAPE( 百分比 Gamma Gompertz SVD+WLS 個別法 圖5 1996-2000 年不同年齡組各方法的 MAPE

Gamma 函數、Gompertz 函數、Lee-Carter 法及單㆒年齡組個別估計法探討總生 育率以及生育年齡分布的變化,藉著對生育率的配適與預測,找出適合推估台 灣㆞區生育率趨勢的模型。本文經由西元1951 至 1995 年的配適、西元 1996 至 2000 年的預測驗證,發現如要預測總生育率,建議使用單㆒年齡組個別估計法 或經由WLS 修正的 Lee-Carter 模型。預測年齡別生育率,建議使用單㆒年齡組 個別估計法或Gompertz 模型。整體而言,㆕種方法㆗以單㆒年齡組個別估計法 在預測台灣㆞區生育率有最小的誤差。 由於Gamma、Gompertz 模型是屬於參數模型,其優點在於估計參數即可取 得模型㆗所有的特性,缺點為缺乏彈性,若模型假設與實際狀況差異過大,勢 必影響該模式的實用性。Gamma 模型是最常用來推估生育率的方法,因其配適 的R2值很高,然而光看R2是不夠的,必須再考慮模型假設(例如:殘差互相獨

(18)

立且為常態分配)與其適合度(goodness-of-fit)。在我們對西元 1951 至 1995 年

生育率的模型配適㆗,發現 Gompertz 的配適誤差(MAPE 及 RMSPE)均小於

Gamma 的誤差,之後的預測結果也與配適結果相同,表示 Gompertz 較 Gamma

模型適合描述台灣的生育率趨勢;再加㆖Gamma 模式無法直接獲得總生育率的

估計值,與總生育率為模型參數的Gompertz 模型不同,我們不推薦 Gamma 模

型用於台灣生育率模型。

Lee-Carter 模型在此屬於首次嘗試,研究發現 Lee-Carter 模型在預測總生育 率時效果很好,但在年齡別生育率卻不盡理想,與 Lee(2000)宣稱可用 Lee- Carter 模型預測生育率的猜測頗有出入。推測 Lee-Carter 與 Gamma、Gompertz 模型不適用於台灣生育率的原因,可能肇因於台灣㆞區得生育率變化很大,例 如在圖3 ㆗,可看出 25 至 29 歲這組的生育率在各年度都最高,但其他各組的 大小順序隨時間改變,各年齡的關係不固定。因為以㆖㆔種模型會受到參數及 半參數模型的影響,因此只考慮單㆒年齡組的個別估計法反而有較佳的結果, 然而這方法卻犧牲各組之間的相關性,未來仍有改善的空間。 多變量分析㆗的主成份分析法是可能的改善方法之㆒。分析結果發現台灣 ㆞區45 年、每年 7 組年齡組的資料,只需要 2 個主成份即有 96%的解釋能力, 主成份分析㆗第㆒主成份的分數(scores)非常接近線性函數,與 Lee-Carter 模 型㆗kt類似,而第㆓主成份的分數則是有時間序列不平穩(non-stationary)的性 質。利用兩個主成份的負荷(loading)與主成分分數計算年齡別生育率與總生 育率,發現主成份分析在總生育率的預測不太穩定,其預測的MAPE 較大(附 錄表5);而年齡別生育率部份較接近單㆒年齡組個別估計法,尤其在 45 至 49 歲組有明顯改善,整體而言也比Lee-Carter 模型佳(圖 6)。因為主成分分析在 高年齡組有較小的預測誤差,未來可仿造比值法(Yue et al., 2001)調整個別估 計法㆗的高年齡生育率。 除了㆖述的發現外,以㆘根據本文的研究心得,提出台灣㆞區生育率模式

(19)

0 10 20 30 40 50 60 15~19 20~24 25~29 30~34 35~39 40~44 45~49 年齡組 MAPE(百分 比 SV D+WLS 個 別法 主 成份 分析 圖6 1996-2000 年不同年齡組的 MAPE(主成份法) 配適的幾點建議。先就使用線性迴歸來預測而言,由於總生育率與各年齡別生 育率均呈現線性㆘降,但實際㆖生育率不會無限制的㆘降(而產生負值的不合 理現象),因此可給定最小㆘限(lowest bound),再以類似羅吉氏曲線(logistic curve)的方法使預測值收斂到最小㆘限。另外,通常預測值也會以區間的方式 呈現,本文討論的預測值也可採用類似信賴區間(confidence interval)的㆖、㆘ 限格式,透過拔靴法(bootstrap)的電腦模擬產生預測區間。 因本文的主要著眼點是以交叉驗證來比較常用生育率模型的預測表現,並 未考慮其他與生育率相關的因素,我們計畫在未來的研究㆗引入與生育率有關 的變數,以提高生育率模型的預測能力。可能考慮的變數計有母親生育胎次別

(20)

與各年齡女性有偶率。在生育胎次別的分佈方面,可藉由第㆒胎、第㆓胎、… 等等各胎次比例資訊,與各年齡別生育率配合,計算出婦女生產年齡及其胎次 的聯合分配。另外,台灣的嬰兒絕大多數為婚生子,因此婦女的有偶率與生育 率有非常大的關係,近年來台灣㆞區婦女有偶率逐年㆘降,與生育率的㆘降有 相同的趨勢。除了考慮與生育率相關的因素,我們也考慮引入㆞區、文化等特 性,例如在㆖㆒節曾提到虎、龍年效應對㆗國㆟結婚生育行為影響甚大,西元 1976 年的龍年效應非常明顯,圖 2 ㆗在 20 至 34 歲各年齡組間的育齡婦女生育 率都有明顯㆖升的傾向;且在西元1998 年由於虎年孤鸞年的緣故,生育率也因 此㆘降很多。因此在預測時也應考慮這㆒類的民俗因素,以干擾(intervention) 變數的形式置入模型。 此外,現行的總生育率定義為綜合不同世代(generation 或 cohort)的婦女, 建議也可考慮同㆒世代的總生育率,比如今年50 歲的婦女從開始生育到現在, 共生了幾個孩子,例如:

− − = + + + + = x x z x z z x z t F z t B t x TFR η ζ ( ) ) ( ) , ( * x 表示年齡,以此來估計總生育率,更可看出生育率隨時間的變化。 生育率的未來變化,對於台灣㆟口、家庭、勞動力、政策…等結構將會產 生衝擊,如何掌握精確的㆟口變遷趨勢是規劃相關措施時的重要工作,故政府 在制定國家未來政治、經濟、社會、文化發展政策時,生育率的變化便是重要 的參考因素。因此本文研究比較能代表台灣㆞區生育率的模型,以求準確㆞預 估台灣㆞區生育率的趨勢,使政府可以落實社會福利的實施,例如:醫療資源 的支出、國民年金的支出、育兒政策的規劃等等。值得注意的是由於本文的各 預測方法均顯示未來的總生育率將持續㆘降,因此如何使生育率回升到替換水 準,將是未來制訂㆟口政策時必須面對的問題之㆒。

(21)

謝 誌

本文作者感謝林正祥教授、涂肇慶教授、以及兩位匿名評審的寶貴建議。

考 文 獻

㆗ 文 部 份

內政部(1951〜2000)㆗華民國台閩㆞區㆟口統計,內政部編印。 王德睦(1993)台灣㆞區未來㆟口組成之推計,台北市:行政院國科會科資㆗心。 行政院經建會(1996)㆗華民國台灣㆞區民國 84 年至民國 125 年㆟口推計,行政院 經建會。 呂文慧(1996)台灣㆞區高齡化的預估與其對醫療影響之研究,政治大學風險管理 所。 張正鵬(1999)臺灣㆞區高齡㆟口死亡率之預測,政治大學統計所。 李美玲(1990)生育步調與生育轉型:台灣㆞區總生育率之分析,東海大學社會所 。 孫得雄(1989)㆟口學與家庭計畫,空㆗大學用書。

英 文 部 份

Bell , W. R. (1997) Comparing and ass essing ti me s eri es met hods for forecasting age- specific fertility and mortality rates, Journal of Official Statistics, 13(3): 279-303. Becker, G. S. and Lewis , H. G. (1974) Interaction between quantity and quality of

children, Economics of the Family, 81-90.

Booth, H. (1984) Trans forming Gompert z’s function for fertility analysis: The develop- ment of a st andard for the relational Gompertz function, Population Studies, 38(3): 495-506.

Brass, W. (1974) Perspectives in population prediction: Illustrated by the st atistics of England and Wales, Journal of the Royal Statistical Society, A, 137(4): 532-583.

(22)

Brown, R. L. (1991) Introduction to the Mathematics of Demogr aphy, ACTEX Publi ca- tions, Inc.

Hoem, J. M., Mads en, D., Nielsen, J. L., Ohlsen, E. M., Hansen, H. O., and Rennermal m, B. (1981) Experi ment in modeling recent Danish fertility curves , Demography, 18(2): 231-244.

Lee, R. D. (2000) The Lee-Carter method for forecasting mortality, with various extensions and applications, North American Actuarial Journal, 4(1): 80-93.

Lee, R. D. and Carter, L. R. (1992) Modeling and forecasting U.S. mort ality, Journal of

the American Statistical Association, 87(419): 659-675.

Lewis , E. B. (1982) Control of body s egment di fferentiation in Drosophil a by the bithorax gene complex, Embr yonic Development, Part A: Geneti cs Aspects, Edited by Burger, M. M. and R. Weber. Alan R. Liss, New York, 269-288.

Martin, M. P. D. (1967) Une application des fonctions de Gompertz a l'etude de l a fecondite d'une cohorte, Population, 22: 1085-1096.

Murphy, E. M. and Nagnur, D. N. (1972) A Gompert z fit that fits: applications to Canadian fertility patterns, Demography, 9(1): 35-50.

Neupert , R. F. (1992) Population projections for Mongoli a: 1989-2019, Asia-Pacifi c

Population Journal, 7(4): 61-80.

Pritchett, L. (1994) Desired Fertility and the Impact of Popul ation Polici es, Population

and Development Review, 20(1): 1-55.

Tsai , Y. M. and Yi, C.C. (1987) P ersistence and changes in Chinese family values , 張苙 雲、呂玉瑕 、王甫昌主 編,九 ○年代的台 灣社會( ㆘),㆗ 央研究院社 會學研究 所,123-170.

Wil moth, J. R. (1993) Comput ational methods for fitting and extrapol ation the Lee-Carter model of mortality change, National Institute on Aging, 1: 1-19.

Wil moth, J. R. (1996) Mortality projections for Japan: a comparison of four methods ,

Health and Mortality Among Elderly Populations, 266-287.

(23)

Economiques de Louvain, 32: 457-468.

Yue, J. C., Hu Y. W. and Chang, C. P. (2001) A ratio method for old mortality projection based on incompl ete data: the case in Taiwan, Journal of Population Studies, 22: 1-18.

(24)

附 錄

1 1951 年到 1995 年 Gamma 函數的參數估計 年 期 α-1 β R2 年 期 α-1 β R2 1951 15.33 0.539 0.973 1974 21.94 0.850 0.990 1952 16.83 0.588 0.977 1975 22.36 0.880 0.991 1953 17.57 0.612 0.978 1976 23.52 0.927 0.992 1954 17.64 0.616 0.979 1977 23.75 0.945 0.992 1955 17.70 0.621 0.979 1978 24.15 0.963 0.993 1956 17.92 0.629 0.977 1979 24.73 0.989 0.994 1957 19.08 0.673 0.974 1980 23.86 0.957 0.993 1958 20.01 0.708 0.972 1981 24.66 0.989 0.993 1959 19.52 0.694 0.973 1982 25.49 1.021 0.994 1960 19.40 0.696 0.975 1983 26.28 1.049 0.996 1961 20.27 0.730 0.976 1984 27.53 1.094 0.997 1962 20.29 0.734 0.977 1985 28.30 1.120 0.998 1963 20.67 0.745 0.982 1986 27.78 1.096 0.997 1964 21.33 0.772 0.981 1987 29.92 1.176 0.999 1965 21.70 0.794 0.982 1988 30.66 1.201 0.999 1966 21.18 0.783 0.983 1989 30.66 1.198 0.999 1967 21.21 0.795 0.986 1990 31.00 1.209 0.999 1968 21.20 0.797 0.987 1991 31.46 1.225 0.997 1969 20.78 0.784 0.988 1992 31.83 1.237 0.996 1970 21.40 0.812 0.991 1993 31.87 1.237 0.995 1971 21.63 0.822 0.991 1994 32.54 1.261 0.993 1972 21.88 0.839 0.991 1995 32.10 1.240 0.994 1973 22.46 0.865 0.990

(25)

2 1951 年到 1995 年 Gompertz 函數的參數估計 年 期 a b R2 年 期 a b R2 1951 -4.415 0.183 0.971 1974 -5.923 0.272 0.990 1952 -4.589 0.189 0.973 1975 -6.131 0.285 0.986 1953 -4.672 0.192 0.973 1976 -6.385 0.297 0.985 1954 -4.695 0.194 0.973 1977 -6.511 0.305 0.982 1955 -4.726 0.196 0.972 1978 -6.633 0.311 0.986 1956 -4.781 0.198 0.968 1979 -6.795 0.320 0.986 1957 -4.964 0.206 0.965 1980 -6.656 0.314 0.991 1958 -5.120 0.213 0.960 1981 -6.841 0.322 0.991 1959 -5.060 0.212 0.963 1982 -6.992 0.329 0.988 1960 -5.077 0.214 0.963 1983 -7.121 0.334 0.987 1961 -5.219 0.221 0.963 1984 -7.340 0.343 0.985 1962 -5.233 0.223 0.965 1985 -7.454 0.346 0.984 1963 -5.254 0.224 0.971 1986 -7.304 0.338 0.982 1964 -5.346 0.230 0.974 1987 -7.723 0.356 0.979 1965 -5.445 0.237 0.978 1988 -7.850 0.360 0.979 1966 -5.424 0.239 0.980 1989 -7.811 0.356 0.971 1967 -5.521 0.246 0.982 1990 -7.883 0.359 0.972 1968 -5.547 0.248 0.985 1991 -7.957 0.360 0.964 1969 -5.502 0.247 0.988 1992 -8.021 0.362 0.961 1970 -5.660 0.255 0.987 1993 -8.019 0.361 0.959 1971 -5.715 0.258 0.990 1994 -8.130 0.365 0.954 1972 -5.837 0.266 0.991 1995 -8.013 0.359 0.956 1973 -5.973 0.273 0.989 表 3 Lee-Carter 模型的參數 axbx SVD SVD 近 似 法 WLS+SVD WLS+SVD 近 似 法 年 齡 組 ax bx ax bx ax bx ax bx 15-19 歲 3.461 0.095 3.461 0.060 3.453 0.132 3.476 0.062 20-24 歲 5.222 0.103 5.222 0.057 5.213 0.128 5.229 0.060 25-29 歲 5.469 0.110 5.469 0.052 5.466 0.116 5.467 0.054 30-34 歲 4.811 0.226 4.811 0.097 4.853 0.198 4.831 0.091 35-39 歲 3.826 0.374 3.826 0.172 3.872 0.350 3.864 0.160 40-44 歲 2.562 0.508 2.562 0.246 2.557 0.525 2.571 0.242 45-49 歲 0.468 0.645 0.468 0.318 0.434 0.692 0.464 0.319

(26)

4 個別估計法參數配適之迴歸線及時間序列模型 年 齡 組 迴 歸 線 R2 時 間 序 列 模 型 15-19 歲 5.2823-0.0294t 87.5% (1-B)(1-0.5088B)εtat ARIMA(1,1,0) 20-24 歲 6.9467-0.0278t 86.3% (1-0.9752B)εtat orεt=ψεt-1+ at AR(1) 25-29 歲 6.9844-0.0244t 92.5% (1-B)(1-(-0.3952)B)εtat ARIMA(1,1,0) 30-34 歲 7.575-0.04458t 87.8% (1-B)(1-0.52B2 tat ARI((1)2,1) 35-39 歲 8.7759-0.0798t 90.3% (1-B)(1-B2) (1-(-0.6)B)ε tat ARIMA(1,2,0) 40-44 歲 9.7574-0.1161t 95.5% (1-B)(1-0.99B)εt=(1-0.715B)at ARIMA(1,1,1) 45-49 歲 9.8884-0.1519t 98.3% (1-0.9375B)εtat AR(1) 註 :B 為 倒 退 元 (B ack shif t operator), at為 白 干 擾

5 各模型總生育率的誤差結果比較

G amma G ompertz Lee-Carter 個 別 估 計 法 主 成 份 分 析 MAPE 11.03 9.54 5.71 5.85 18.31 RMSPE 13.51 11.44 7.38 8.09 19.23 表6 各模型在各年齡組的誤差比較(五個年度加總) 模 式 準 則 15-19 20-24 25-29 30-34 35-39 40-44 45-49 MAPE 17.38 37.48 16.596 9.17 19.19 18.88 33.15 Gamma RMSPE 18.09 36.66 19.17 9.93 19.60 19.46 36.26 MAPE 14.22 8.65 9.30 11.11 11.62 12.31 13.40 Gompertz RMSPE 16.78 11.41 10.70 12.58 13.47 14.39 15.36 MAPE 25.61 45.99 8.78 33.85 49.84 48.37 37.18 Lee-Carter (SVD+WLS) RMSPE 27.01 47.3 12.39 34.35 50.19 49.19 38.79 MAPE 8.47 9.95 6.32 7.63 10.78 4.12 47.35 個別估計 RMSPE 10.39 12.89 9.04 8.82 13.68 4.86 49.13 註 : 網 底 字 為 該 年 齡 組 ㆗ 誤 差 最 小 者

(27)

7 各模型在不同年度㆘的誤差結果比較(所有年齡加總)

G amma G ompertz Lee-Carter (SVD+WLS) 個 別 估 計 MAPE RMSPE MAPE RMSPE MAPE RMSPE MAPE RMSPE 1996 16.51 17.87 7.31 8.58 27.10 29.95 6.27 13.03 1997 20.07 22.24 15.77 17.23 30.08 33.49 8.15 14.03 1998 26.06 31.14 3.65 3.94 38.34 40.33 17.67 21.19 1999 23.73 28.37 10.18 10.88 40.92 43.33 18.26 24.34 2000 22.09 23.03 20.68 20.76 41.85 46.39 17.22 27.86 註 : 網 底 字 為 當 年 度 誤 差 最 小 者

數據

表 2  1951 年到 1995 年 Gompertz 函數的參數估計    年 期 a            b  R 2 年 期 a            b  R 2 1951 -4.415 0.183 0.971  1974 -5.923 0.272 0.990  1952 -4.589 0.189 0.973  1975 -6.131 0.285 0.986  1953 -4.672 0.192 0.973  1976 -6.385 0.297 0.985  1954 -4.695 0.194
表 4  個別估計法參數配適之迴歸線及時間序列模型  年 齡 組 迴 歸 線 R 2 時 間 序 列 模 型 15-19 歲 5.2823-0.0294t 87.5%  (1-B)(1-0.5088B)ε t = a t                        ARIMA(1,1,0)  20-24 歲 6.9467-0.0278t 86.3%  (1-0.9752B)ε t = a t  orε t =ψε t-1 + a t                AR(1)  25-29 歲 6.9844
表 7  各模型在不同年度㆘的誤差結果比較(所有年齡加總)

參考文獻

相關文件

4G - Index and principal rates of change of the Composite Consumer Price Index at section, class and group levels of goods and services. 4A - Index and principal rates of change

4G - Index and principal rates of change of the Composite Consumer Price Index at section, class and group levels of goods and services. 4A - Index and principal rates of change

4G - Index and principal rates of change of the Composite Consumer Price Index at section, class and group levels of goods and services. 4A - Index and principal rates of change

4G - Index and principal rates of change of the Composite Consumer Price Index at section, class and group levels of goods and services. 4A - Index and principal rates of change

4G - Index and principal rates of change of the Composite Consumer Price Index at section, class and group levels of goods and services. 4A - Index and principal rates of change

4G - Index and principal rates of change of the Composite Consumer Price Index at section, class and group levels of goods and services. 4A - Index and principal rates of change

4G - Index and principal rates of change of the Composite Consumer Price Index at section, class and group levels of goods and services. 4A - Index and principal rates of change

4G - Index and principal rates of change of the Composite Consumer Price Index at section, class and group levels of goods and services. 4A - Index and principal rates of change