國
立 政 治 大
㈻㊫學
•
N a tio na
l C h engchi U ni ve rs it y
第二章 文獻探討
第一節 年齡-年代-世代分析的基本概念
年齡-年代-世代分析是一種將長期性資料作綜合整理進行跨時間點的比
較,並將長期趨勢的變化區分為年齡效應(age effect)、年代效應(period
effect)及世代效應(cohort effect)的一種分析方法。
自Frost(1939)將 APC 模型應用於分析結核病的研究後,APC 模型便成 為流行病學常見的分析工具。此外,年齡-年代-世代分析也應用在人口統計 學、社會科學、心理學、政治學、經濟學等領域。
在取得資料後,可先將資料整理成二維表,以觀察該資料之基本架構。二 維表之列表示年齡,行表示年代,對角線表示世代。一般而言,年齡與年代多
採取相同組距。以表 2-1 為例,即為以 5 年為一組距的一個二維表,
A
i代表第i
個年齡層,
i = 1 , 2 ,..., a
,P
j代表第j
個年代層,j = 1 , 2 ,..., p
,C
k則代表第 k 個世代層,其中1 ≤ k = j − i + a ≤ a + p − 1
。舉例來說,C
1表示 1906-14 世 代、而C
10則表示 1951-1959 世代。表 2-1 二維表
P
1P
2P
3P
4P
5P
6年齡別 1975-79 1980-84 1985-89 1990-94 1995-99 2000-04
A
1 15-19C
11C
12C
13C
14C
15C
16A
2 20-24C
10C
11C
12C
13C
14C
15A
3 25-29C
9C
10C
11C
12C
13C
14A
4 30-34C
8C
9C
10C
11C
12C
13A
5 35-39C
7C
8C
9C
10C
11C
12A
6 40-44C
6C
7C
8C
9C
10C
11A
7 45-49C
5C
6C
7C
8C
9C
10A
8 50-54C
4C
5C
6C
7C
8C
9A
9 55-59C
3C
4C
5C
6C
7C
8A
10 60-64C
2C
3C
4C
5C
6C
7A
11 65-69C
1C
2C
3C
4C
5C
6年代別
世 代 別
• 國
立 政 治 大
㈻㊫學
•
N a tio na
l C h engchi U ni ve rs it y
因此在年齡-年代-世代分析中,關係長期趨勢變化的三個效應可以進一步 說明如下:
一、年齡效應
在二維表資料裡,如果差異出現的規律和年齡層的區分一致時,稱為年齡 效應。表示每個人因年齡的增長,對其本身不論身理或心理所產生的影響。受 訪者只要在同一年齡層都會有相似的特質。
二、年代效應
在二維表資料裡,如果差異出現的規律和年代的區分一致時,稱為年代效 應。表示每個人因某個年代所發生之重大事件(如:戰爭、天災等),對其本身 不論身理或心理所產生的影響。受訪者只要在同一年代層都會呈現相似之特 質。
三、世代效應
世代是指一群具有共同特性或經歷共同事件的人,大多數研究均以出生年 定義之。在二維表資料裡,如果其差異出現的規律和世代的區分一致時,則稱 為世代效應。表示同一世代的人在某些特質上很相似,但是做跨世代比較時,
則出現差異。
第二節 年齡-年代-世代模型
年齡-年代-世代模型是由應變數與年齡、年代及世代三個自變數所組成的 迴歸模型:
!
ij = f (!
ij) = log(y
ijn
ij) =µ
+!
i+!
j+!
k+!
ijki = 1,..., a; j = 1,..., p;k = 1,..., a + p !1
其中k = j − i + a
且 !ii=1 a
!
= !jj=1 p
!
= !kk=1 a+p"1
!
= 0。!ij為應變數,表第
i
個年齡層在第j
個年代時某事件發生率的一個函數值, !ij為發生率, yij為該事件發生之個數, nij 為與該事件發生之相關衡量指標
(如:人口數等);
µ
為整體平均效應; !i為第i
個年齡層的效應; !j為第j
個年代的效應; !k為第k
個世代的效應; !ijk為隨機誤差項且 E(!ijk) = 0 ,其變• 國
立 政 治 大
㈻㊫學
•
N a tio na
l C h engchi U ni ve rs it y
異數及分配則須視 !ij的資料特性而定。當 yij為正整數時,並假設具有卜瓦松
分配,且連結函數(link function)為 f (!ij) = log(!ij) ,此為一對數線性模型,廣受 流行病學家喜愛 。
第三節 年齡-年代-世代分析方法
然而由於年齡=年代-世代,因此前述的模型須面對因年齡、年代及世代三 者間之共線性所產生的甄別問題(identifiability problem)。共線性問題會使得模 型參數的估計值有無限多組解。為了自無限多組解中選出一組可行的參數估計 值,學者們提出了受限廣義線性模型(constrained generalized linear model 簡稱 CGLIM)及本質估計量(intrinsic estimator 簡稱 IE)等方法來解決此問題,以下為 對此兩種方法的簡介:
一、Fienberg 與 Mason(1978)認為年齡-年代-世代分析會產生無限多組解的原 因是因有效參數個數比方程式個數多了一個,所以只要對參數多加一個限 制式(arbitrary constraint)後,就能估計年齡、年代及世代三個效應,此 即為受限廣義線性模型估計量方法。設限制式的方法包括將其中一個效應 設為零,或是選取兩個效應並假定它們相同。至於要決定該如何設定這個 限制式,則須根據母體相關資訊來判斷。但因為這個方法對於限制式的選 取相當敏感,所以在進行此方法時必須對母體充分瞭解,否則不當的限制 式將嚴重影響分析結果 。
二、Fu(2000)提出不論限制式如何設定都能取得惟一參數估計值的本質估計 量(intrinsic estimator),來解決年齡、年代及世代三者的共線性問題。
當受限廣義線性模型估計量透過正確的限制式來求得時,結果將與本質估計 量近似。由於本質估計量方法不受限制式的選取所影響,而且具有很好的 統計性質(Yang, Fu, and Land (2004)),所以是解決年齡、年代及世代三 者共線性問題的一個有效方法。
• 國
立 政 治 大
㈻㊫學
•
N a tio na
l C h engchi U ni ve rs it y
第四節 兩種以上的分層作比較
許多資料在收集時會包含其他的分層變數,像是性別,地域等,當 我們希望比較不同層別的年齡效應趨勢,年代效應趨勢及世代效應趨勢,
許多學者多會針對不同分層用畫圖的方式來作比較,以下是對各種比較方 式的整理:
一、 Wu and Cheng(2008)針對台灣的自殺死亡率分別對男女資料畫圖,以年
齡為 X 軸,自殺死亡率為 Y 軸,依年代或世代畫出相對應的曲線,接著 以年代為 X 軸,自殺死亡率為 Y 軸,依年齡或世代畫出相對應的曲線,
再以世代為 X 軸,自殺死亡率為 Y 軸,依年代或世代畫出相對應的曲 線,最後再分別檢視男女在圖形上所顯示出來的差異,像是男女高峰分別 是出現在哪個年齡層,哪個年代,哪個世代,以及三個效應在兩種性別走
勢上的差異,是上升或是下降。此外 Ananth 等(2001)針對美國白人女
性與黑人女性生出早產兒的比率,還有Gunnell 等 (2003)針對英國男女
的自殺率也採用相同的方法來進行 。
二、 Gross 等(2006)針對瑞士男女自殺死亡率除採用圖示法進行比較外,更 進一步對男女資料配適模型,其配適模型的方式如下:
先對三個效應各配適一個只有單一效應的模型,並發現只有年齡效應的模 型配適的最好,表示年齡可能是個重要的因子,因此在配適只有兩個效應
的模型時,只配適
AP
, AC 兩種模型,並在隨後用到受限廣義線性模型的方式配適有三個效應的模型時,選擇對年齡來作限制。接著根據前面配 適的
AP
, AC 兩種模型衍生出兩個具有三個效應的模型 A*PC , A**PC , 其中 A*PC 是由 AP 所衍生出的模型,藉由AP
模型的結果來判斷該如何對年齡設限, A**PC 則是由 AC 所衍生出。接著針對估計出來的估計值繪
圖,並做解釋及比較男女在圖形上有哪些不同。由於配適模型的方法是比 較模型的係數而非真正的死亡率,因此再解釋上主要在於比較男女高峰上 的差異,上升下降趨勢相對緩慢或快速,以及男女有趨勢上差異的區間所 在 。
三、 Yang(2008)對美國成人慢性病死亡率趨勢的研究,針對其中四種疾病
(心臟疾病,氣喘,肺癌,乳癌)及男女差異進行(乳癌除外)比較。比
• 國
立 政 治 大
㈻㊫學
•
N a tio na
l C h engchi U ni ve rs it y
較的方法是,四種疾病的男女資料分別用本質估計量的方法去估計參數,
並對估計模型的年齡效應,年代效應及世代效應畫圖查看趨勢,並說明男 女的相對差異。同(二),此方法也是比較模型的係數而非真正的死亡 率。
四、 前面三種方法都只能用畫圖的方式去觀察男女的差別,缺乏較為嚴謹的統 計分析過程。針對資料中包含分層解釋變數(如男女,地域等)的情況,
Held and Riebler(2010)建議可以採用多元年齡-年代-世代模型
(Multivariate APC model (MAPC))來配適模型,考慮這個模型的好處 是 ,儘管個別參數仍然存在不可甄別的問題,不過如果當年齡,年代或 世代三效應存在一個或兩個效應與分層變數的層別無關時,剩下的參數其 分層的差是可以甄別的。此外Held and Riebler (2010)也證明了在給定加總 各個層別某事件發生個數的條件下,各個分層的條件分配可以透過一多項 式邏輯模型(multinomial logit model)來表示。透過這項條件分配的使用,
可甄別參數的估計變異將會降低。