• 沒有找到結果。

臺灣地區生育率模型之研究

N/A
N/A
Protected

Academic year: 2021

Share "臺灣地區生育率模型之研究"

Copied!
27
0
0

加載中.... (立即查看全文)

全文

(1)

台灣㆞區生育率模型之研究

A Study of Fertility Projection Model in

Taiwan Area

余 清 祥

*

藍 銘 偉

* *

Jack C. Yue

*

Ming-Wei Lan

* *

摘 要

近年來台灣㆞區由於婦女受高等教育比例、就業率的增加等因素, 使得育齡婦女的生育時間延後、生育總胎次減少,因此總生育率也逐 年降低,在2001 年時降至 1.4 的歷史新低,加速台灣㆞區㆟口老化的 腳步。台灣㆞區婦女生育率的㆘降,在各年齡層有不同的趨勢,這種 各年齡層生育率變化不同步的現象,使得許多常見的生育率模型(如 Gamma 及 Lee-Carter 模型)套用於台灣㆞區的生育率時產生不小的誤 差。為尋求更精確的台灣㆞區生育率模型,除了考量直接預測年齡別 生育率的各種模型外,本文也嘗試以世代(Cohort)的觀點預測未來的 生育率,包含世代生育率模型,以及研究胎次別生育率與年齡別生育 率之間的關係,再套用國外近年提出的擴散(Diffusion)模型。本文的 實證研究以西元1949 至 1996 年(或 1975 至 1996 年,對胎次別資料 ∗ 政治大學統計系副教授

Associate Professor, Department of Statistics, National Chengchi University

∗∗ 政治大學統計系碩士

Master, Department of Statistics, National Chengchi University 收稿日期2003/05/23,接受刊登 2003/09/10

(2)

而言)的資料為基礎,1997 至 2001 年資料為檢測樣本,藉由交叉驗證 比較㆖述方法的優劣;此外,本文也考慮㆗國習俗對十㆓生肖的好惡, 將龍虎年的效應列入預測方法的修正。研究發現世代模型可能因資料 分析及估計的程序較為複雜,預測誤差反而高於單㆒年齡組個別估計 法這類模型較為簡單的方法。 關鍵字:年齡別生育率、胎次別生育率、擴散模型、世代、交叉驗證

(3)

Abs tract

The total fertility rates in Taiwan area have been falling rapidly

since 1960's, which reached a record low 1.4 in 2001, and trigger the

population aging in Taiwan area. Possible causes attributing to this rapid

decrease include more opportunities of higher education and employ-

ment for the female, which generally are treated as two of the main

reasons for the delay of childbearing. However, the falling of fertility

rates vary quite a lot in different age groups, and thus most well-known

fertility models (such as Gamma and Lee-Carter models) fail to produce

accurate predictions.

In this paper, we shall extend the study of Huang and Yue (2002)

and continue looking for acceptable fertility projection models. The

models considered in this study include, in addition to traditional models

for age-specific fertility rates, models for cohort fertility rate (CFR),

age-and-parity specific birth rate, and diffusion. Data from 1949 to 1996

(or 1975 to 1996 for age-and-parity specific birth rate) are used as a pilot

for verifying the model which has the best fit for data gathered from

1997 to 2001. We also consider the effect of Chinese zodiac to adjust the

prediction values. We find that simpler models, such as individual group

estimation, have smaller prediction errors comparing the complicated

models such as the CFR model.

Key Words: age-specific fertility rate, age-and-parity specific birth

rate, diffussion model, cohort, cross validation

(4)

壹 、 前 言

近年來,台灣由於教育普及、經濟發展等各種因素,已由開發㆗國家邁入 已開發國家的行列。而與世界大多數已開發國家「少產少死」的特性類似,台 灣㆞區居民生育率及死亡率的數值均較 1960~70 年代經濟開始起飛時低了許 多,其㆗生育率的降低尤為顯著,2000 年的總生育率僅達 1960 年的 29%(參考 表 1),近幾年來生育率㆘降更加明顯,屢創歷史新低。這種生育率逐年㆘降、 屢創新低的現象並非台灣專有,由表㆒可知,除了美國總生育率在2000 年前後 微幅升高外,亞洲、美洲、歐洲、澳洲等㆞的先進國家的總生育率都比20 年前 低了不少,因之我們認為台灣生育率的㆘降應是不可避免的趨勢。 表 1 世界各先進國家歷年之總生育率 西元 台灣 日本 美國 加拿大 瑞典 義大利 澳大利亞 紐西蘭 1960 5.75* 2.01 l 3.64 l 3.81 l 2.17 l 2.31 l 3.45 l 4.03 l 1980 2.51* 1.78 l 1.87 l 1.75 l 1.68 l 1.66 l 1.89 l 2.04 l 2000 1.67* 1.74c 2.06 c 1.64 c 1.53 c 1.18 c 1.79 c 1.80 c 2001 1.36* 1.41 c 2.06 c 1.60 c 1.53 c 1.18 c 1.77 c 1.80 c 2002 1.30* 1.42 c 2.07 c 1.60 c 1.54 c 1.19 c 1.77 c 1.80 c 資料來源:1. *內政部統計處;

2. c Central Intelligence Agency—The World Factbook;

3. l Long-range World Population Projections, United Nations。

台灣㆞區的㆟口老化近年因「少產少死」而有加速的傾向。例如:1993 年 年底台灣㆞區65 歲以㆖的老年㆟方纔突破 7%,成為聯合國定義的高齡化社會, 不到十年的時間,在 2002 年年底又突破 9%。這個快速的㆟口老化趨勢與生育 率的降低似乎存有同步關係,圖1 是 1951 年以來 65 歲以㆖老年㆟口佔總㆟口 數的比例及總生育率的趨勢圖,可以發現當總生育率㆘降的同時,65 歲以㆖老 年㆟口比例也持續㆖升,尤其是自1980 年代㆗期總生育率低於替代水準後,65 歲以㆖㆟口比例的㆖升更為明顯。

(5)

0 2 4 6 8 10 1951 1956 1961 1966 1971 1976 1981 1986 1991 1996 2001 西元 65歲以㆖㆟口比例 (%) 總生育率 資料來源:1. 行政院經建會㆟力規劃處; 2. 內政部統計處。 圖1 65 歲以㆖老年㆟口比例及總生育率趨勢圖 雖然台灣總生育率近幾年來持續㆞㆘降,但是由於不同年齡組的生育率變 化方向不盡相同,例如:20 至 24 歲的年齡別生育率逐年㆘降,但 30 至 34 歲則 自1990 年起反而呈現緩慢攀升。這種各年齡層生育率不同步的現象,使得許多 常見的生育率模型(如Gamma 及 Lee-Carter 模型,參考黃意萍與余清祥(2002) 的討論)套用於台灣㆞區的生育率時產生不小的誤差。為尋求更精確的台灣㆞ 區生育率預測模型,本文將以統計分析的觀點探討未來趨勢,除了使用主成份 分析法預測年齡別生育率外,也將引進胎次別生育率,與之前有較佳預測結果 的單㆒年齡組個別估計法比較。此外,除了以㆖提及較常見的橫斷面(Cross- sectional)模型,本文也考慮從縱斷面(Longitudinal 或 Cohort)的角度來預測 生育率,例如:Zeng and Land(2002)建議的擴散(Diffusion)模型,與以整個 世代為考量的世代生育率。

(6)

測台灣生育率的模型;第㆔節為實證分析,透過台灣歷年生育率資料,藉由交 叉驗證比較各種生育率模型的優劣;第㆕節則加入㆗國習俗㆗的龍虎年效應修 正生育率預測值;第五節為結論與討論,探討各生育率模型應用在台灣生育率 的預測時,需要考慮的事項。

貳 、 文 獻 探 討 及 模 型 介 紹

世代生育率(Completed Cohort Fertility Rate,簡稱 CFR 或 CCFR)以每㆒ 世代(即縱斷面)各年齡層的方式,紀錄㆒個婦女㆒生㆗生育的子女總數,較 能反映各世代實際的生育率變化。但因婦女的生育年齡涵蓋時間長達㆔、㆕十 年(我國記錄以15 至 49 歲為原則),若欲比較兩個不同世代的生育行為,需要 等至婦女都過了生育年齡方能進行。這樣的方式通常不能符合實際需要,因此 才採用總生育率(Total Fertility Rate,簡稱 TFR),折衷㆞以現行同㆒年度(即 橫斷面)的方式記錄生育率。其㆗T FR 的定義為

= =

=

=

β α β α x x n x z x n z x n z

z

F

B

f

TFR

)

(

, 其㆗

TFR

z代表第

z

年的總生育率,n x

f

z為第

z

x

歲至

x n

+ −

1

歲的婦女的生 育率,n

B

zx是第

z

x

歲至

x n

+ −

1

歲的婦女所生之嬰兒數,n

F z

x

( )

是第

z

x

歲至

x n

+ −

1

歲的年㆗婦女數,

α

β

即代表婦女生育年齡的㆖界及㆘界。 CFR 與 T FR 的比較如圖 2,由左㆖至右㆘的直線為 CFR 的計算方式,由㆖ 垂直而㆘的直線為T FR。圖 2 ㆗的 CFR 代表的是 1965 年時年紀為 15 歲的婦女, 當她們到50 歲時累積㆒生的生育數,期間經歷了 35 年;T FR 則代表 1990 年時 從15 歲(在 1975 年出生)至 50 歲(在 1940 年出生)的婦女生育率。雖然 TFR 可能將不同生育行為的婦女放在㆒起計算,但因不需要等待35 年,使用㆖較為 便利,因此生育率比較大多仍以 T FR 的格式進行,而非原先認為較為合理的 CFR。

(7)

15 20 25 30 35 40 45 1980 1970 1990 2000 CFR TFR 西元 年齡 50 圖 2 TFR 與 CFR 比較圖 採用CFR 與 T FR 的分別,本文考慮的模型可依橫斷面、縱斷面的分成兩類。 屬於橫斷面的方法有:㆒、年齡別生育率的主成份分析法,㆓、胎次別的主成 份分析法,㆔、單㆒年齡組個別估計法;屬於縱斷面的方法有:㆒、擴散模型, ㆓、CFR 法。以㆘分別介紹各種方法:

㆒ 、 年 齡 別 生 育 率 主 成 份 分 析 法

主成份分析法用於生育率首先由Bozik and Bell 於 1987 年提出,Lee and Carter(1992)也使用類似方法,應用在死亡率的預測㆖。主成份分析法的基本 想法為將所有的年齡別生育率(或生育率的對數)視為多個變量,透過主成份 分析縮減維度達到資料縮減(Data Reduction)的目的。因為各主成份之間互相 獨立,可使用迴歸分析或時間序列方法分別對每㆒主成份預測未來走勢,將原 先多變量的預測問題簡化為幾個單變量的預測。

(8)

Lee and Carter 於 1992 年所提出的 Lee-Carter 法可視為年齡別主成份法的特 例,只是Lee-Carter 法是先將年齡別生育率取對數。Bell(1997)以美國白㆟的 死亡率比較Lee-Carter 模型與主成份分析法的差異,發現 Lee-Carter 模型的估計 誤差介於㆒個主成份與兩個主成份之間,這個結果與曾奕翔及余清祥(2002) 使用台灣㆞區死亡率資料分析的結果類似。本文仿照死亡率的研究,嘗試將年 齡別生育率、年齡別生育率的對數套用主成份方法(包括Lee-Carter 模型),預 測未來的年齡別生育率。

㆓ 、 胎 次 別 生 育 率 主 成 份 分 析 法

胎次別生育率(Parity Specific Fertility Rate)的觀點類似隨機變數㆗機率密 度函數(Probability Distribution Function, 記為

f x

( )

),因為

⋅ = ( ) ) (X x f x E , 只要知道婦女生㆒胎、兩胎、… 的機率,總生育率即可代入期望值的公式算出。 事實㆖,如果對所有

x

3

都滿足

f

(

x

)

=

0

,總生育率㆒定不大於2。胎次別生 育率的定義如㆘:

=

=

β α x z x z

i

f

i

TFR

(

)

(

)

, 其㆗

TFR

z

(i

)

代表在第z 年第

i

胎的胎次別生育率,而

f

xz

(i

)

為在第z 年 x 歲婦

女第

i

胎的年齡別胎次別生育率(Age-and-Parity Specific Birth Rate),

α

(=15) 及

β

(=49)分別代表生育年齡的㆘界與㆖界。

台灣㆞區自1975 年(民國 64 年)起開始紀錄各胎次別生育率,圖 3 為台 灣1975 年至 2001 年的各胎次別生育率,4 胎與 4 胎以㆖綜合成㆒組來表示。個 別胎次別生育率與總生育率類似,大體㆖近年來都呈現㆘降的趨勢。胎次別生

(9)

育率的模型配適也將採主成份分析法,希望可由較少個數的主成份達到資料縮 減的目的,便利未來的生育率預測。 資料來源:內政部統計處。 圖3 1975 年~2001 年 1~4 胎以㆖合併之胎次別生育率

㆔ 、 單 ㆒ 年 齡 組 個 別 估 計 法

前兩種方法本質㆖假設各年齡組間的生育率相互關聯,在套用主成份分析 方法後分離出互相獨立的幾個主成份,可對每個主成份個別找出最合適的預測 模型,換言之,即是將多變量問題簡化為幾個單變量的問題。單㆒年齡組個別 估計法則是直接將每個年齡組視為獨立,然後分別預測每個年齡別生育率的變 動趨勢。單㆒年齡組個別估計法的使用細節及說明參考黃意萍與余清祥(2002)。

(10)

㆕ 、 擴 散 模 型

總生育率(T FR)有時無法衡量出真正生育率的變化情形,例如:如果從今年 起婦女㆒生的生育總數不變、平均延後兩年,則從現在起的十年內總生育率應 會㆘降,但不代表婦女㆒生的生育總數㆘降。Bongaarts and Feeney(1998)認為 生育率的計算需將生育時機(Tempo Component )與生育數量(Quantum Component)同時列入考慮,以去除因生育時間的延後引起總生育率㆘降的假象。 他們考慮『時間對世代的生育數量等式』(Period-Cohort Quantum Equation,簡 稱B-F 法),公式為

))

(

1

/(

'

CFR

TFR

r

t

TFR

t

=

t

=

t

p ㆖式㆗

TFR

'

以及CFR 代表的是生育數量,也就是在去掉生育時機影響後的生育 數量,而

r t

p

( )

是『第

t

年觀察到的生育時機改變率』:

))

1

(

)

1

(

(

5

.

0

)

(

t

=

×

MAC

t

+

MAC

t

r

p

其㆗

MAC t

( )

為第

t

年的平均生育年齡(Mean Age at Childbearing)。 2002 年 Zeng and Land 提出以

r t

c

( )

修正

r t

p

( )

)

(

1

)

(

)

(

t

r

t

r

t

r

p p c

=

代回原先的公式可推得:

))

(

1

/(

'

CFR

TFR

r

t

TFR

t

=

t

=

t

c 本文在此引用擴散模型的概念,將胎次別生育率分解為生育時機與生育數 量兩個分量,以求出真正的生育率變化。進行步驟為藉由每個胎次的年齡別胎

(11)

次別生育率,求出第

t

年第

i

胎的平均生育年齡(即

MAC t

i

( )

),再透過主成份 分析法估計生育年齡、再修正胎次別生育率,最後轉換回年齡別生育率。

五 、

CFR 法

本文假設CFR 滿足 Gamma 模型,也就是: t t t t t t t x t t x t t t t

x

e

C

x

e

x

f

α β α β α

α

β

− −

=

− −

Γ

=

1 1

)

(

)

(

其㆗

x

t代表在第

t

年時為

x

歲該世代的年齡,

f x

( )

t 代表這個世代在第

t

x

歲 時的單㆒年齡生育率,

C

t代替 Gamma 模型的調整係數。將㆖式等式兩邊同取 對數: t t t t t t t

C

x

x

x

f

(

)

=

log

+

(

α

1

)

log

+

(

β

)

+

ε

log

, 可套用迴歸方法找出模型的參數。

參 、 實 證 分 析

本節使用的資料為將內政部統計處1949 年至 2001 年(民國 38~90 年)台 灣㆞區15 歲至 49 歲的五歲㆒組婦女生育率、以及年齡別胎次別生育率(僅有 1975 至 2001 年),分別考慮㆖述介紹之五種生育率模型,先以 1975 至 1996 年 1 的資料估計模型參數,再以1997 至 2001 年資料當成檢測樣本,計算誤差大小, 並以此誤差比較模型的優劣。以㆘分別說明資料分析細節及預測結果:

㆒ 、 年 齡 別 主 成 份 分 析 法

使用主成份分析法發現年齡別生育率、年齡別生育率的對數兩者的 3 個主 1 因為胎次別生育率完整的資料從民國 64 年開始,為求資料使用㆒致,因此除了 CFR 法外, 其餘方法皆使用民國64 年以後的資料。

(12)

成份皆有接近0.99 的解釋能力(附錄 1),取對數後的解釋能力都比原始資料高, 因此本文以㆘只考慮年齡別生育率的對數。分析發現第 1 個主成份對時間作迴 歸分析的解釋能力(

R

2)有 65%以㆖,第 2 個及第 3 個主成份則以時間序列模型 進行預測。求出 3 個主成份的預測值後,再代入負荷便可求出 1997 年至 2001 年之年齡別生育率及總生育率的預測值。由於兩個主成份(解釋能力0.925)的 預測誤差在主成份方法㆗最小,以㆘的討論將以兩個主成份的模型代表年齡別 主成份法。

㆓ 、 胎 次 別 生 育 率 主 成 份 分 析 法

由主成份分析發現胎次別生育率或胎次別生育率的對數可篩選出兩個主成 份(附錄2),都有約 0.985 的解釋能力,與年齡別生育率類似。預測出胎次別 2 個主成份的未來趨勢後,再代回求出年齡別生育率的預測值,進而求出總生育 率之預測值。

㆔ 、 個 別 估 計 法

本文考慮以7 個年齡組的(對數)年齡別生育率當應變數,以時間當自變 數來配適迴歸模型,殘差則以時間序列模行進行預測。預測結果發現取對數後 的年齡別預測結果較理想,推測其原因可能為近年來台灣各年齡別生育率變動 不穩定,因此取對數後可將其變動減小,而有較佳的預測結果。

㆕ 、 擴 散 模 型

首先分別求出5 個胎次的平均生育年齡,再透過擴散模型理論將 5 個胎次 的胎次別生育率分解為平均生育年齡及修正後的胎次別生育率兩個變數。分析 發現第1 至 5 胎的平均生育年齡從 1975 年至 1996 年大致都有明顯㆖升的趨勢, 表示台灣婦女近年來生育年齡的延遲。其㆗第1 胎的平均生育年齡由 1975 年的 23.71 歲延後至 1996 年的 26.15 歲,而生育第 2 胎的平均年齡則從 25.29 歲延後 至28.15 歲;修正過後的第 1 胎及第 2 胎的胎次別生育率㆘降的幅度並不明顯,

(13)

但修正過後的第3 胎、第 4 胎及第 5 胎的胎次次別生育率快速的㆘降,修正後 的第3 胎胎次別生育率從 1976 年的 0.65 ㆘降至民國 1995 年的 0.30,這個結果 說明了台灣現代婦女生育超過2 胎的比例明顯㆘降。 接著以主成份法分別對 5 個胎次的平均年齡、修正後的胎次別生育率進行 分析,發現 3 個主成份的解釋能力都在 0.985 以㆖。之後的步驟與胎次別生育 率模型類似,考慮對胎次別生育率(或其對數值),以主成份分析法篩選出2 個 主成份。 本方法與胎次別生育率模型頗為類似,不同之處在於擴散模型之前半部是 以類似世代(即縱斷面)的觀點去估計胎次別生育率,而後半部則與胎次別生 育率模型相同,是以綜合不同世代(即橫斷面)的觀點預測年齡別生育率。分 析結果顯示,不管平均生育年齡與修正過後的胎次別生育率取1 個、2 個或 3 個 主成份估計胎次別生育率,30 至34 歲這㆒組的年齡別生育率的配適誤差都不小。

五 、

CFR 法

由於計算㆒個世代生育率需要 35 年的觀察,因此這部份的資料配適使用 1949 年至 1996 年的資料,與其他㆕種方法所使用資料範圍不同。在這些資料㆗, 有完整世代生育率的部份計有1949 年時 15 歲的世代到 1962 年時 15 歲共有 14 個世代,其他世代或是僅有年輕(接近15 歲)、或是僅有年紀較大(接近50 歲) 的不完整資料。為求使用最多的資訊,除了使用Gamma 參數模型,我們也將包 含完整的20 至 30 歲資料的世代列入考慮。(考慮 20 至 30 歲資料的理由有㆓: 以橫斷面來看,這3 組的年齡別生育率佔了總生育率的 55%以㆖;以縱斷面來 看, Gamma 函數最重要的高峰部分,也就是模型最具特色之處就在 20 至 30 歲間。)因此,除了之前的完整的14 組外,再加㆖ 1944 年至 1948 年 15 歲的 世代,以及1963 年 1981 年 15 歲的世代,,㆒共 24 個不完整的世代,共計 38 個 世代進行資料分析。以圖4 表示 CFR 的預測方法。橫軸為時間、縱軸為年齡,

(14)

實線代表已有生育率資料,虛線代表沒有的生育率資料,水平線部分為完整世 代,垂直線部分為不完整世代,斜線部分是所要預測的年度。

西元

年齡

2001

1996

1962

1949

1944

1978 1983

15

20

25

30

50

35

40

45

1996

1981

30

註:橫線部分為完整世代。 直線部分為不完整世代。 斜線部分為所要預測的年度。 圖4 CFR 法的資料使用說明 將38 個世代的生育率資料分別以最小平方法配適 Gamma 函數,求出參數 估計值,發現每個世代配適出的結果其解釋能力都有95%以㆖(附錄 3)。接著 用迴歸分析加時間序列方法,以時間為自變數,分別配適3 個 Gamma 模型的參 數,進而求出1982 年之後所有 15 歲世代 Gamma 參數預測值,進而求出 1997 至2001 年生育率的預測值。另外,1982 年 15 歲以後的世代其 29 歲前的單㆒年 齡生育率已有觀察值,可採用等比例修正來調整單㆒年齡生育率的估計值。 以㆖述五種方法得出1997 年至 2001 年之年齡別生育率與總生育率之預測 值後,以㆘列之誤差標準作為本文交叉驗證㆗判斷模型優劣:平均絕對誤差

(15)

(Mean Absolute Percentage Error,簡稱 MAPE):

=

×

=

n i i i

Y

n

MAPE

1

%

100

1

ε

及根均平方誤差(Root Mean Square Percentage Error,簡稱 RMSPE):

%

100

)

(

1

2 1

×

=

= n i i i

Y

n

RMSPE

ε

其㆗Yi是第

i

個觀察值,也就是第

i

個預測年度的年齡別生育率(或總生育率); i i i

=

Y

Y

ˆ

ε

iYi的預測值。 附錄4(年齡別生育率)及附錄 5(總生育率)列出本研究考慮的五種模型 的預測誤差。以㆘我們將依年齡別生育率、總生育率的順序說明實證發現: 1. 各年齡別生育率 五種方法在7 個年齡組的預測誤差各有其優缺點(附錄 4)。整體來說最後 兩組(40 至 49 歲)年齡別生育率在各種方法㆘的預測皆不理想,推測其原因, 可能是因為這兩組的生育率非常低,只要預測稍有偏誤,即有不小的誤差值。 另外,雖然擴散模型及CFR 模型都是在世代理論架構㆘推導出的方法,但模型 較為複雜,無法只藉由㆒次估計(至少需要兩次估計)獲得生育率的估計值, 因為愈多的估計誤差愈大,使用較多參數的模型(包括擴散模型及CFR 法)預 測結果反而都比較不理想。 除了 40 至 49 歲這兩組外,單㆒年齡組個別估計法有最小的產生的預測誤 差,其誤差在10%以㆘,符合 Lewis(1982)定義的高精確度的預測能力,但在 最後㆒組的預測誤差大於40%,這個結果與黃意萍與余清祥(2002)預測 1996

(16)

至2000 年的生育率結果相同,但本文考慮的是個別估計法取對數。年齡別主成 份分析法也有不錯的預測表現,15 至 39 歲的預測誤差大致也可視為具有高精確 度,在40 至 49 歲這兩組的預測誤差僅略大於 30%,尚稱合理,比其他方法穩 定。(第㆒組、最後㆒組的預測誤差比單㆒年齡組個別估計法小。) Lee-Carter 模型也有不錯的預測結果,在各年齡組的預測誤差最為平均,每 組最高的誤差皆不超過 30%,未必只在高年齡組有較高的誤差;整體而言,誤 差都在合理的範圍內,但某些年齡組的誤差仍與 2 個主成份的模型有不小的差 距,與之前的研究結果類似。另外,除了 45 至 49 歲這㆒組明顯誤差偏高外, 胎次別生育率模型的預測都不錯,35 至 44 歲的誤差甚至是各方法㆗最小者,未 來若能降低最後㆒組的誤差,胎次別也是可能使用的預測模型之㆒。 實際值 ln年齡別PC2 胎次別PC1 擴散模型PC1 ln胎次別 ln個別估計法 CFR法 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1997 1998 1999 2000 2001 圖5 實際總生育率與五種方法預測之總生育率

(17)

2. 總生育率 五種方法在預測總生育率方面皆有不錯的效果,除了CFR 法外,其他㆕種 方法(包含Lee-Carter 法)的 MAPE 大概都不大於 10%(附錄 5)。由圖 5 可看 出各年度總生育率的預測細節,CFR 法確實存有系統誤差,明顯低估總生育率 的趨勢。其他方法則大致與實際總生育率相差不大,除了1998 年因孤鸞年(虎 年)生育率較低,2000 年因龍年效應而明顯㆖升,其他 3 個年度的預測值都非 常接近實際值。(尤其是單㆒年齡組個別估計法,在 1997、1999、2001 年幾乎 與實際值完全㆒致!)Lee-Carter 模型因為與主成份法的圖形類似,因此不列入 圖5。 有鑑於國㆟因各十㆓生肖年度而有不同的生育行為,在㆘㆒節我們將龍虎 年(讀者可參考Goodkind,1993)的效應列入考慮,修正本文的各模型。

肆 、 龍 虎 年 效 應 之 修 正

關於龍虎年效應的修正,因為1973 年(牛年)至 1996 年(鼠年)共 24 年 正好涵蓋兩整輪的十㆓生肖年份,時間又接近本文預測的 1997 至 2001 年,因 此我們將這24 年的總生育率與年齡別生育率資料取對數後作為應變數,令時間 為自變數配適迴歸模型。求出估計值後再與實際值比較,將第t 年及第 t+12 年 (t = 1973, 1974, …, 1984)誤差平均後作為修正未來第 t+24 年生育率的依據, 修正公式為

K

,

1998

,

1997

},

exp{log

*

=

TFR

+

z

=

TFR

z z

ε

z 其㆗

ε

z是㆖述的誤差平均。 以龍虎年效應修正年齡別生育率與總生育率後的結果如㆘:

(18)

1. 年齡別生育率 大體而言,在25 至 29 歲、30 至 34 歲(生育率最高的兩組)、40 至 44 歲 這㆔組的年齡別生育率,各模型修正後的誤差都較小(詳見附錄 6);但其他年 齡組的生育率修正前後並無明顯差異或大小關係。 2. 總生育率 除了擴散模型、CFR 法外,其他模型對總生育率的預測誤差在修正後都降 低不少(大約都有30%,詳見附錄 7)。圖 6 為修正後各年度總生育率的詳細預 測趨勢圖,與圖 5 為修正前比較,幾乎所有方法在各年度的誤差都是修正後較 小,唯有1999 年(兔年)的誤差並無明顯改善。原因可能因為兔年在虎年與龍 年之間,可能受到虎年少生子或龍年多生子正負抵銷,不容易獲得精確的修正 值。 整體而言,分析發現以龍虎年效應修正總生育率,獲得某些程度的改善, 尤其是單㆒年齡組個別估計法以及年齡別生育率主成份分析法,但CFR 之總生 育率預測值仍與實際值有㆒段差距。

伍 、 結 論 與 建 議

本文以五種方法配適台灣生育率模型,而五種方法從衡量生育率的角度可 分為兩大類:㆒類為非世代、另㆒類為世代的觀點,其㆗擴散模型與CFR 法都 牽涉到世代的觀念。以世代分析的優點為可看出個別世代的特性,不會混合不 同世代(及其不同生育特性)的狀況,若能以世代的角度去分析,應比非世代 角度更適當。像擴散模型就是將不同世代的生育率轉為同㆒世代再進行分析, CFR 法也是以採同㆒世代的角度,理論㆖這兩個模型應該有較佳的結果,但我 們以台灣生育率資料為基礎,分析發現這兩種方法並未明顯優於其他㆔種方 法,CFR 法反而有最大的預測誤差。

(19)

實際值 ln年齡別PC2 胎次別PC1 擴散模型PC2 ln胎次別 ln個別估計法 CFR法 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1997 1998 1999 2000 2001 圖6 實際總生育率與五種方法預測之後總生育率(以龍虎年效應修正) 以統計分析的觀點來看,有可能這兩種方法所需要估計的程序太多,在估 計的過程㆗反而失去了原先理論架構的優勢。例如:擴散模型與胎次別生育率 主成份法的差別,在於擴散模型必須先估計平均生育年齡與修正的胎次別生育 率,如此才可估計出胎次別生育率,之後的步驟與胎次別生育率主成份法相同, 因此擴散模型需要㆔次估計,胎次別生育率主成份法則用了兩次。CFR 法則更 是預測過程繁雜,需要插入、預估的項目更多。再與年齡別主成份法及個別估 計法比較,此兩種方法想法簡單,因此整個過程都只使用了㆒次估計,而整體 預測結果也都不錯。另㆒個可能原因是或許台灣生育率近年來變化很大,使用 過於複雜的模型描述台灣生育率,效果恰好適得其反。當然,我們也不能排除 預測誤差較大的另㆒種可能 CFR 與擴散模型不適於描述台灣㆞區婦女的生育 率。

(20)

25歲 30歲 35歲 40歲 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1950 1960 1970 1980 1990 圖 7 台灣 CFR 累積生育率 雖然CFR 不見得適用於預測未來台灣的婦女生育率,但它彌補了總生育率 這類以橫斷面描述某㆒年度生育行為、而無法兼顧世代間變化的不足。圖 7 為 台灣自1949 年(1949 年時年紀為 15 歲的世代)以來 25、30、35 及 40 歲的累 積(Cumulative)CFR,並以 1949 年為基礎(即除以 1949 年數值得出的比值) 所計算出的生育率變化趨勢。由圖㆗可看出台灣自1949 年以來,各世代婦女的 生育數逐年㆘降,表示近年來台灣生育率㆘降的趨勢實際㆖在五十年前早已開 始。與圖8 美國歷年 25、30、35 及 40 歲的累積 CFR 趨勢比較,不難看出我國 與美國的差異。美國的生育率變化較符合㆟口學家 Easterlin 的理論,呈現波浪 狀的起伏,兩個波峰(或波谷)的間隔約為兩個世代,約為40 年至 50 年;而 台灣的生育率變化則較接近㆟口學家 Ermisch 的理論,未來㆖升的可能性不高 (Brown,1997)。

(21)

25歲 30歲 35歲 40歲 0.6 0.8 1.0 1.2 1.4 1.6 1920 1930 1940 1950 1960 1970 1980 圖 8 美國 CFR 累積生育率 本文另㆒重點為探討㆒系列的主成份分析法。本文發現年齡別生育率資料 取對數後的結果較佳,年齡別生育率取對數後使用 1 個主成份的誤差通常遠大 於2 個主成份,但 3 個主成份的預測誤差(與估計誤差)有時還比 2 個主成份 大,這表示第3 個主成份可能只反映雜訊。這個結果與 Bell(1997)略有不同, 但基本㆖我們同意 Bell 認為 Lee-Carter 模型的預測效果不如兩個主成份,加㆖ Lee-Carter 模型在估計時較為繁瑣,因此若考慮使用主成份分析法預測生育率 時,我們不推薦讀者使用Lee-Carter 模型。 至於2 個主成份的實質解釋,因為 2 個主成份代表兩個(獨立的)生育率 趨勢,其㆗第㆒個主成份(直線㆘降的變化)可詮釋為教育普及、經濟發展等 因素使得現代婦女晚婚比例明顯提高、平均生育胎數減少,因此整體的生育率

(22)

逐年㆘降;第㆓個主成份則可詮釋為婦女晚婚使得原先的生育高峰向後延遲, 越來越多㆟在30 歲以後才開始生育,提高了近年來 30 至 39 歲的生育率,而原 先最高的20 至 24 歲年齡別生育率已漸漸遞延至 30 至 34 歲。這兩個主成份應 可涵蓋台灣大多數的生育率變化趨勢。 關於龍虎年效應,本文發現即使是對成為已開發國家的今日台灣民眾而言, 傳統十㆓生肖的觀念對生育率的影響依舊存在,因此在預測總生育率時需把此 類因素考慮進去;修正生育率時可將重點集㆗在20 至 24 歲、25 至 29 歲及 30 至34 歲這 3 個年齡組,因為這 3 組對總生率的貢獻最大,且本文發現 25 至 29 歲、30 至 34 歲兩組在修正後的預測誤差降低最多。我們推薦讀者使用龍虎年修 正後的個別估計法,或是修正後的年齡別生育率(2 個)主成份分析法。

謝 誌

本文作者感謝涂肇慶教授、林正祥教授、以及兩位匿名評審的寶貴建議; 也感謝國科會對本計畫的部份補助,計畫編號92-2412-H-004-002。

(23)

參 考 文 獻

㆗ 文 部 分

㆗華民國內政部統計資訊網,http://www.moi.gov.tw/W3/stat/。 內政部(1949 ~ 2001)㆗華民國台閩㆞區㆟口統計,內政部編印。 行政院經濟建設 委員會㆟力 規劃處(2002),㆗華民國台灣㆞區民國 91 年至 140 年 ㆟口推計,編號(91)027.805。 黃意萍、余清祥(2002)台灣㆞區㆟口推估研究,㆟口學刊,25:145-171。 曾奕翔、余清 祥(2002)台灣㆞區死亡率推估的實證方法之研究,台灣㆟口學年會 學術研討會。

英 文 部 分

Bell, W. R. (1997) Comparing and assessing time series methods for forecasting age- specific fertility and mortality rates, Journal of Official Statistics, 13(3): 279-303. Bongaarts, J. and G. Feeney (1998) On the quantum and tempo of fertility, Population

and Development Review, 24(2): 271-291.

Bozik, J. E. and W. R. Bell (1987) Forecasting age speci fic fertility using principl e components, Proceedings of the American Statistical Association, Social Statistics Section, 396-401.

Brown, R. L. (1997) Introduction to the Mathematics of Demography, ACTEX Publica- tions, Inc.

Central Intelligence Agency, http://www.cia.gov/

Goodkind, D. M. (1993) New zodiacal influences on Chinese family formation: Taiwan, 1976, Demography, 30: 27-142.

Lee, R. D. and L. R. Carter (1992) Modeling and forecasting U. S. mortality, Journal of

(24)

Lewis, C. D. (1982) Industrial and Business Forecasting Methods: A practical Guide to

Exponential Smoothing and Curve Fitting, London: Butterworth Scientific.

Zeng, Y. and K. C. Land (2002) Adjusting period tempo changes with an extension o f Ryder’s basic translation equation, Demography, 39(2): 269-285.

United Nations (1992) Long-Range World Population Projection − Two Centuries of

(25)

附 錄

附錄 1 (對數)年齡別生育率主成份解釋能力 PC1 PC2 PC3 年齡別主成份 0.736 0.925 0.985 對數年齡別主成份 0.742 0.961 0.988 附錄 2 (對數)胎次別生育率主成份解釋能力 PC1 PC2 胎次別主成份 0.917 0.982 對數胎次別主成份 0.920 0.985 附錄 3 各世代 Gamma 參數估計值 世代(西元/15 歲)

log

C

t

α

t

1

β

t

R

2 1944 -75.2213 32.3180 -1.1893 0.9777 1945 -72.2195 31.2524 -1.1701 0.9777 1946 -68.5528 29.8602 -1.1369 0.9811 1947 -66.0503 28.9152 -1.1155 0.9839 1948 -63.3857 27.8715 -1.0887 0.9878 1949 -62.2610 27.4595 -1.0818 0.9895 1950 -62.6658 27.6639 -1.0932 0.9909 1951 -63.3975 28.0067 -1.1093 0.9918 1952 -64.0909 28.3087 -1.1220 0.9951 1953 -64.6106 28.5713 -1.1361 0.9952 1954 -64.2165 28.4406 -1.1365 0.9969 1955 -64.0537 28.4098 -1.1405 0.9968 1956 -63.5225 28.1967 -1.1363 0.9977 1957 -63.0952 28.0236 -1.1329 0.9976 1958 -62.0888 27.6038 -1.1209 0.9967 1959 -60.8810 27.0879 -1.1046 0.9956 1960 -60.2530 26.8099 -1.0955 0.9942 1961 -59.5688 26.4786 -1.0822 0.9941 1962 -58.9883 26.1862 -1.0696 0.9934 1963 -58.0285 25.7081 -1.0487 0.9920 1964 -57.0086 25.2201 -1.0284 0.9895 1965 -54.9172 24.2617 -0.9910 0.9880

(26)

1966 -54.4116 24.0339 -0.9827 0.9883 1967 -54.7028 24.1483 -0.9862 0.9881 1968 -54.7060 24.1334 -0.9848 0.9870 1969 -54.4553 23.9799 -0.9759 0.9819 1970 -53.2458 23.3729 -0.9476 0.9761 1971 -53.8207 23.5944 -0.9534 0.9722 1972 -54.2632 23.7806 -0.9599 0.9710 1973 -54.2093 23.7466 -0.9581 0.9714 1974 -53.2306 23.2828 -0.9385 0.9717 1975 -51.1349 22.2808 -0.8948 0.9658 1976 -49.6199 21.5475 -0.8625 0.9661 1977 -49.2791 21.3367 -0.8503 0.9709 1978 -49.0087 21.1545 -0.8389 0.9758 1979 -48.4218 20.8132 -0.8199 0.9843 1980 -47.8834 20.4766 -0.7996 0.9902 1981 -47.4480 20.1630 -0.7779 0.9922 附錄 4 各年齡別生育率預測誤差(5 個年度加總) 模型 準則 15~19 20~24 25~29 30~34 35~39 40~44 45~49 MAPE 11.05 16.24 14.92 7.66 11.12 26.19 23.36 Lee-Carter RMSPE 12.95 18.09 18.10 8.99 12.90 29.69 26.22 MAPE 5.86 5.89 10.18 7.12 15.79 30.11 31.99 log 年齡別 PC2 RMSPE 6.79 6.64 13.22 8.36 17.07 32.39 36.67 MAPE 18.50 20.73 7.36 8.09 5.01 18.70 60.92 胎次別PC1 RMSPE 24.09 24.00 8.98 9.47 7.14 19.45 66.34 MAPE 25.26 17.62 7.56 8.09 5.01 53.78 60.92 擴散模型PC2 log 胎次別 PC1 RMSPE 29.76 22.38 8.45 9.47 7.14 61.05 66.34 MAPE 6.59 5.56 8.20 6.80 13.35 26.07 43.24 log 個別估計法 RMSPE 7.00 6.60 9.47 7.99 14.76 31.03 47.15 MAPE 16.81 26.56 26.96 8.08 23.68 50.35 129.56 CFR 法 RMSPE 22.17 27.93 27.87 9.09 25.67 51.35 130.47 註:網底者為該年齡層各模型㆗最小者。

(27)

附錄 5 總生育率預測誤差(5 個年度加總) 模型 MAPE RMSPE Lee-Carter 8.81 10.96 log 年齡別 PC2 6.60 7.44 胎次別PC1 6.99 8.28 擴散模型PC2, log 胎次別 PC1 5.94 7.70 log 個別估計法 5.92 7.06 CFR 法 16.32 17.67 註:網底者為各模型㆗最小者。 附錄 6 各年齡別生育率以龍虎年效應修正後預測誤差(5 個年度加總) 模型 準則 15~19 20~24 25~29 30~34 35~39 40~44 45~49 MAPE 9.52 15.41 13.71 8.38 10.18 25.52 27.68 Lee-Carter RMSPE 10.16 16.27 15.20 9.20 12.66 30.86 32.38 MAPE 3.78 2.78 7.75 6.66 14.75 29.49 30.08 log 年齡別 PC2 RMSPE 5.06 3.26 10.01 7.69 16.58 33.11 36.89 MAPE 19.80 21.34 4.34 5.85 6.12 18.50 57.30 胎次別PC1 RMSPE 23.98 23.86 5.27 7.20 6.66 19.45 64.43 MAPE 26.49 18.28 4.79 5.81 6.10 53.41 57.31 擴散模型PC2, log 胎次別 PC1 RMSPE 29.96 22.00 5.01 7.18 6.63 59.43 64.44 MAPE 3.64 3.81 5.26 6.63 12.29 26.44 39.42 log 個別估計法 RMSPE 4.51 4.15 6.05 7.38 14.34 32.28 45.95 MAPE 18.21 27.19 27.77 7.88 24.87 50.62 138.96 CFR 法 RMSPE 21.98 28.03 28.14 8.78 25.98 52.04 142.31 註:網底者為該年齡層各模型㆗最小者。 附錄 7 總生育率龍虎年效應修正前後誤差比較(5 個年度加總) 修正前 修正後 準則

MAPE RMSPE MAPE RMSPE Lee-Carter 8.81 10.96 6.96 8.32 log 年齡別 PC2 6.60 7.44 3.59 4.40 胎次別PC1 6.99 8.28 6.26 6.98 擴散模型PC2, log 胎次別 PC1 5.94 7.70 5.21 5.92 log 個別估計法 5.92 7.06 4.10 4.64 CFR 法 16.32 17.67 16.93 17.64 註:網底者為各模型修正前後較小者。

參考文獻

相關文件

We are not aware of any existing methods for identifying constant parameters or covariates in the parametric component of a semiparametric model, although there exists an

In this paper, we study the local models via various techniques and complete the proof of the quantum invariance of Gromov–Witten theory in genus zero under ordinary flops of

Conditional variance, local likelihood estimation, local linear estimation, log-transformation, variance reduction, volatility..

‘Desmos’ for graph sketching and ‘Video Physics’ for motion analysis were introduced. Students worked in groups to design experiments, build models, perform experiments

To this end, we introduce a new discrepancy measure for assessing the dimensionality assumptions applicable to multidimensional (as well as unidimensional) models in the context of

Matrix model recursive formulation of 1/N expansion: all information encoded in spectral curve ⇒ generates topological string amplitudes... This is what we

Myers effect condensation of mean field D(-1) Chern Simons term is induced. Fuzzy sphere is

[CIY4], Analytic Study for the String Theory Landscapes via Matrix Models, Phys.Rev... THEME: