• 沒有找到結果。

第三章 電腦模擬與實證分析

第二節 臺灣地區生育率推估

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

24

圖 3- 3、總生育率型二法之推估誤差

第二節 臺灣地區生育率推估

生育率推估的研究目標在於找出適當的歷史資料年數、未來推估年數、和推 估方法 (區塊拔靴法或者LC模型),並配合適當的參數 (如區塊長度),使得生率 育和出生人口數之推估誤差控制在可接受的範圍且表現穩定。此外也可藉由推估 誤差,觀察臺灣地區和縣市育齡婦女生育率變化與趨勢,評估人口規模與生育推 估的關聯,驗證前一節的電腦模擬結果。

由於臺灣各縣市層級的生育率可使用的資料年數不多 (僅過去30年),因此 以臺灣地區 (大區域) 的資料為研究對象,評估隨機推估方法的優劣和限制,且 當縣市 (小區域) 的推估值需要修正時,可以參考臺灣地區的數據。臺灣總生育 率自1951年起逐年下滑 (圖 3-4),而1983年可謂生育率轉型的分界點,臺灣總生 育率跌破人口替代水準 (Replacement Level) 的2.1,而且高齡婦女生育率也逐漸 攀升 (陳寬政 1997);2008-2010年時在1.0附近震盪,形成實質的一胎化,也就 是說平均每位婦女一生生育不滿一個小孩。此外,除了逐年遞降外,臺灣總生育 率還存在龍虎年效應,通常龍年的生育率居十二生肖之首,而虎年最低,2000 年時這兩年的出生數差異約為4萬人。

0 5 10 15 20 25 30 35 40

3,400 340 34 3

MAPE (%)

人口規模 (千)

總生育率推估誤差

(情境一) 固定 (情境二) 遞增

(情境三) 遞減 (情境四) 遞減再持平

(情境五) 遞減再遞增 (情境六) 遞減、遞增、持平

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

25

圖 3- 4、1947-2011年臺灣總生育率

生育率推估除了前一節提到的區塊拔靴法,也可使用LC模型,本文將評估 這兩種方法是否適合用於小地區生育率推估。本節將以1951-2011年臺灣育齡婦 女生育率資料作為比較對象,分成測試集和訓練集,計算推估誤差,比較LC模 型、總生育率型一、和總生育率型二,評估三種方法的優劣。因為臺灣生育率存 有生肖週期,設定區塊拔靴法的區塊長度為12,而且仿造郭孟坤與余清祥 (2008)

,假設未來生育率下限為0.75,區塊拔靴法的模擬中若總生育率的推估值小於0.75

,則捨棄該次模擬。以下討論,限於篇幅限制,區塊拔靴法僅呈現總生育型一的 結果。

為了研究歷史資料年數、未來推估年數這兩者對推估結果的影響,考慮兩者 的不同組合 (資料年數和推估年數的總和固定為61年)。推估時,資料起始年份 都為1951年,逐次增加未來推估年數 (亦即逐次減少歷史資料年數),假設推估 年數為10至30年 (或是資料年數為51至31年)。研究發現 (圖 3-5),資料年數和 推估年數的比例對區塊拔靴法沒有明顯影響,但對LC模型的結果則有明顯影響

,使用資料愈多、推估誤差反而愈大。推測LC模型的誤差與歷史資料年數成反 比,因為早期臺灣生育率的變化趨勢不同於最近幾年,使用的資料年數愈多、早

0 1 2 3 4 5 6 7 8

1940 1950 1960 1970 1980 1990 2000 2010 2020

總生育率

TFR

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

26

期資料權重愈重,這和區塊拔靴法不一樣,線性加權重視近期資料,不受早期資 料的干擾,增加資料年數對推估影響不大。評估訓練-測試比例與推估誤差的關 係,最佳資料年數和推估年數比大約為2:1;因為未來推估年數不多於30年,區 塊拔靴法的推估誤差大致都在20%,這與金碩與余清祥 (2011) 的死亡率推估結 果類似。此外,倘若歷年總生育率下降速度一致 (生育率情境三),可預期推估 誤差會更小 (表 3-2);若生育率變化較不規則,則推估誤差會較大。

圖 3- 5、資料年數和推估年數總和61年 (訓練:測試) 的推估誤差 圖3-5的結果反映歷史資料、推估年數兩者比例與推估結果的關係,但這個 結果也與起始點 (1951年) 有關,本文將進一步變動起始點,觀察推估誤差變化

,並驗證1951-2011年間臺灣總生育率是否出現轉折點或震盪,操作方式為固定 歷史資料年數和推估年數,逐次移動起始年份 (圖 3-6)。無論是歷史資料及推估 年數均為12年 (圖 3-7)、分別為24年及12年 (圖 3-8)、或均為24年 (圖 3-9),LC 模型及區塊拔靴法的結果差異不大,從圖3-7可約略判斷在1980年代至1990年代 中期,臺灣地區生育率大致平穩變化,約莫在1997年前後,總生育率整體趨勢改 變,造成兩種推估方法的結果誤差皆增加。此外,觀察不同資料年數的推估誤差

,發現當資料年數增加時誤差的穩定度增加,能降低誤差對總生育率波動的敏感 度 (圖 3-9)。根據上述結果,建議推估總生育率,選取近期生育率資料 (或給予

0 10 20 30 40 50 60

51:10 49:12 47:14 45:16 43:18 41:20 39:22 37:24 35:26 33:28 31:30 MAPE (%)

資料年數:推估年數

MAPE

資料年數和推估年數總和固定

Block bootstrap Lee-Carter

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

27

較重的權數) 或增加資料年數,可增加推估方法的穩定度和準確度。

推估起始年份 資料年份 推估年份

1975 1951 - 1974 1975 - 1998 1976 1952 - 1975 1976 – 1999

… … …

1988 1964 - 1987 1988 - 2011

圖 3- 6、移動起始年份示意圖(資料年數和推估年數皆為24年)

圖 3- 7、資料年數和推估年數皆為12年的推估誤差(區塊長度為6)

圖 3- 8、資料年數24年、推估年數12年的推估誤差

0 10 20 30 40 50 60

1961 1966 1971 1976 1981 1986 1991 1996 2001 MAPE (%)

推估起始年份

推估誤差

固定資料年數和推估年數

Block bootstrap Lee-Carter

0 10 20 30 40 50 60

1970 1975 1980 1985 1990 1995 2000 2005 MAPE (%)

推估起始年份

推估誤差

固定資料年數和推估年數

Block bootstrap Lee-Carter

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

28

圖 3- 9、資料年數和推估年數皆為24年的推估誤差

為了 Leslie 矩陣,須進一步評估年齡組生育率推估結果,然而訓練-測試結 果誤差不理想 (表 3-3)。由於 35 歲以上婦女生育率下降趨勢不明顯,甚至近年 高齡產婦人數不減反增,可預期推估結果不佳。由圖 3-10,20-24 歲和 30-34 歲 推估值和真實值略有出入,似乎過去的資料無法完全反應近年生育率趨勢,其中 20-24 歲真實生育率下降趨勢比推估值明顯,而 30-34 歲生育率卻不減反增。由 於受到傳統觀念的束縛,臺灣女性非婚生子比例低,而綜合上述觀察,間接地反 映出臺灣女性初婚年齡正往後延遲。

表 3- 3、臺灣地區育齡婦女年齡組生育率訓練-測試推估誤差 (資料年數41年、推估年數20年)

單位:MAPE (%)

年齡組 區塊拔靴法 Lee-Carter模型

5-19 44.97 82.27

20-24 39.12 107.23 25-29 16.23 30.30 30-34 45.85 53.45 35-39 68.07 73.33 40-44 75.21 71.78 45-49 82.20 75.45

總生育率 11.82 10.62

註、加註底線表示誤差超過可接受範圍 (MAPE > 50%) 0

10 20 30 40 50 60

1974 1976 1978 1980 1982 1984 1986 1988 1990 MAPE (%)

推估起始年份

推估誤差

固定資料年數和推估年數 Block bootstrap

Lee-Carter

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

29

由於機率推估方法無法估算社會和文化因素對生育率的影響,當社會隨時代 變遷時,女性生育習慣和計畫也大異其趣,因此推估生育率時,不建議使用過於 久遠的資料。此外,根據表3-4結果,在年齡組生育率推估結果不佳的情況下,

但總生育型一的總生育率推估誤差卻相對準確,推測各年齡組生育率變化有互補 的情況。

(註、點線為區塊拔靴法推估結果、虛線為Lee-Carter模型推估結果)

圖 3- 10,臺灣地區年齡組生育率訓練-測試結果 表 3- 4、臺灣地區總生育率之訓練-測試誤差

單位:MAPE (%)

資料年數 /推估年數 總生育率型一 Lee-Carter模型 總生育率型二* 41 / 20 12.01 11.39 15.02

20 / 13 22.56 28.40 14.33

*不考慮年齡組資料,直接對總生育率資料進行區塊拔靴法推估。

由於年齡組推估結果不理想,因此進一步探討生育率推估方法對於出生人數 推估的影響程度,如果出生人數推估誤差在可接受範圍,則表示生育率推估方法 對於人口推估的影響有限。由於本文著重在人口推估,若出生人數推估誤差皆控

0 20 40 60 80 100 120 140 160 180 200

1980 1985 1990 1995 2000 2005 2010 2015

MAPE (%)

年齡組生育率 1992 - 2011

20 - 24 25 - 29 30 - 34

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

30

制在可接受範圍,則選擇操作簡易的推估方法。計算總出生人數的方法有兩種:

一、 年齡組生育率 年齡組婦女數;

二、總生育率 平均單齡婦女數。

首先比較方法一、二計算方式是否存在差異。假設方法一的結果為真,計算 出生人數誤差結果如表 3-5,顯示兩種計算方法差異不大。因此未來推估各年度 出生人數時,可以採用方法二,一方面可以解決年齡組資料不齊全的問題,也能 減少需處理的資料量。接著比較各種計算方法之推估誤差 (表 3-6),發現當資料 年數少時,總生育率型一之推估誤差增加,而型二法之誤差反而縮小,推測型一 法是受到年齡組生育率趨勢不穩定的影響。綜合上述結果,建議人口推估時,採 用總生育率型二法,依照過去比例求出年齡組生育率,如此即可取得不錯的出生 人數推估值。

表 3- 5、比較兩種方法計算出生人數的差異

由於推估時應考量變異大小,確保真實值落在信賴區間中,確保推估的穩定 性,因此採用交叉驗證方式,使用訓練集資料20年、測試集資料20年,觀察是否 測試資料皆落在信賴區間中。結果發現 (圖 3-11),唯Lee-Carter之信賴區間包含 全段訓練集資料,而區塊拔靴法的結果似乎高估總生育率下降速度,因此無法掌 握龍年生育率的彈升,建議加入專家意見設定生育率下限值,可以使得推估區間

單位:MAPE (%)

資料年數 /推估年數 總生育率型一 Lee-Carter模型 總生育率型二 41 / 20 3.23 3.39 3.40 20 / 13 2.35 1.85 9.27

表 3- 6、臺灣地區出生人口數之訓練-測試誤差

單位:MAPE (%)

資料年數 /推估年數 總生育率型一 Lee-Carter模型 總生育率型二 41 / 20 15.28 10.26 16.36 20 / 13 19.70 24.91 11.52

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

31

往上抬升。此外,由於設定總生育率下限值為0.75,因此越靠近0.75時,信賴區 間有逐漸變小的情況。在此資料年數和推估年數比為1:1,不符合前述2:1的結 果,可能有未預期的誤差,因此最後10年的推估結果 (2002-2011年) 僅作為參考

圖 3- 11、臺灣總生育率訓練-測試結果之信賴區間

根據上述結果,以1992-2011年、共20年資料推估臺灣地區未來20年總生育 率 (2012-2031年)。觀察結果發現 (圖 3-12),在總生育率下限值為0.75的限制下

,推估值約落在0.9-1.2之間,最高不會超過1.6的水準。然而推估結果顯示總生育 率下降的速度將趨緩,未來可能出現停滯的情況,是否會彈升還必須考量女性生 涯規劃、社會變遷、政府政策、…等其他因素。

0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00

1970 1980 1990 2000 2010

總生育率 1992 - 2011

Historical data Testing data Block bootstrap Lee-Carter

Block Bootstrap TFR

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

32

圖 3- 12、臺灣總生育率推估結果之信賴區間 (資料年數為40年、推估年數為20年)

相關文件