第三章 理論架構與實證模型
第一節 研究方法
國
立 政 治 大
㈻㊫學
•
N a tio na
l C h engchi U ni ve rs it y
第三章 理論架構與實證模型
第一節 研究方法
由於建構 MAPC 模型之前需要先決定讓哪個效應在每個分層表現一致,因
此我們將先利用文獻探討中所提及的畫圖等方式來判斷,哪個效應在男女的資 料表現較一致 。 由於我們會用到本質估計量的方法來繪製男女各效應差異的圖 形,因此以下將先就本質估計量的定義,統計性質,及計算方法進行介紹。因 為我們的研究資料是台灣男女的自殺死亡率,所以之後介紹模型即以自殺死亡 率來作解釋。
一、APC 模型
(一)、模型簡介:
!
ij= f (!
ij) = log( y
ijn
ij) = µ +!
i+ !
j+ !
k+ !
ijki = 1,..., a; j = 1,..., p;k = 1,..., a + p !1
其中k = j − i + a
且!
ii=1 a
!
="
jj=1 p
!
=#
kk=1 a+p"1
!
= 0。!ij為應變數,表第
i
個年齡層在第j
個年代時的對數自殺死亡率, !ij為 自殺死亡率, yij為自殺死亡人數, nij為年中人口數,µ
為整體平均效應, !i為第
i
個年齡層的效應; !j為第j
個年代的效應; !k為第k
個世代的效應; !ijk為隨機誤差項 。
(二)、本質估計量之結構
前述迴歸模型可以矩陣符號表示為! = Xb +" ,其中
b = (
µ,
!1,...,
!a,
"1,...,
"p,
#1,...,
#a+p!1)
T,由於 X 矩陣的行向量間具有共線 性的情形,且已知其秩較全秩少 1,因此一定存在一個非零的單位向量B
0,使得XB
0 =0。因為
XB
0 =0,所以B
0向量僅與X
矩陣有關,與!
向量無關。此外B
0可以視為
X X !
矩陣中對應於特徵根為 0 的特徵向量。令(A
*1,..., A
a!1*, B
1*,..., B
p!1*, C
1*,..., C
a+p!2*)
為X
矩陣的行向量,Kupper et al.(1983)證明出
X
矩陣的行向量會滿足•
• 國
立 政 治 大
㈻㊫學
•
N a tio na
l C h engchi U ni ve rs it y
(三)、本質估計量之統計性質
本質估計量具有很好的統計性質,在有限的年代數下,本質估計量為
b
0的不偏估計量;且在有限的年代數下,本質估計量之變異小於受限廣義線性模型估計量的變異;另外本質估計量還具有漸近一致性。(Yang, Fu, and Land (2004))
(四)、本質估計量之計算方法
先藉由Fienberg 與 Mason(1978)所建議採用的受限廣義線性模型估計
量方法對參數向量
b
加入一限制式,來取得一參數估計向量bˆ
。接著利用先前提到的Kupper et al.(1983)的結果來求得
B
0,亦即0 0
0 ~
~
B
B = B
,其中0
B ~
為( 0, 1!
a +1
2 ,..., (a !1) !a +1 2 , p +1
2 !1,..., p +1
2 ! ( p !1),1-a + p
2 ,..., (a + p ! 2) !a + p 2 )T
最後將所求得之
bˆ
及B
0向量,代入b ˆ
0= (I ! B
0B
0T) ˆ b
的公式中,即可求 得本質估計量。
透過本質估計量,我們便可以個別繪製男女的年齡,年代及世代的趨勢變 化圖,藉以判斷該選取哪個變數做為 MAPC 模型中的一致的效應。接著可以開 始配製 MAPC 模型。
二、MAPC 模型
(一)、模型簡介:
y
ijr ~ Poisson(nijr!ijr)!ijr
= log(
"ijr) =
µr+
#ir+
$jr+
%kri = 1,..., a; j = 1,..., p;k = 1,..., a + p !1;r = 1,..., R
其中!
i ir
! = !
j"
jr= !
k#
kr= 0, "r = 1,..., R
,n
ijr 為第i
個年齡層,第j
個 年代層,第 r 個分層的總人口數,y
ijr 為為第i
個年齡層,第j
個年代 層,第 r 個分層的自殺死亡人數,µ
r為第 r 個分層的截距項,!
ir為第• 國
立 政 治 大
㈻㊫學
•
N a tio na
l C h engchi U ni ve rs it y
r 個分層的第 i
個年齡效應,!
jr為第 r 個分層的第j
年代效應,!kr為第 r 個分層的第 k 個世代效應 。由於每個分層的年齡,年代及世代還 是存在線性相關,因此甄別問題依然存在。如同受限廣義線性模型法,
這邊我們依然需要對模型增加一個限制式,如此也會遇到與受限廣義線 性模型法一樣的問題,因為限制式的不同而有不一樣的解。但若是在子
模型的情況下,分層的效應差則不會因為限制式不同而不一樣Riebler
and Held(2010)。
(二)、MAPC 子模型:
某些情況下,年齡,年代或世代效應可能具有一致效應,亦即該效應不 會因分層不同而有所不同,這類模型我們可以視為前述 MAPC 模型的 子模型。舉例來說,我們依據 Held and Riebler(2010)所訂定的符 號,以大寫表示一致的效應,小寫表示因分層而有所不同的效應,因此
如果年齡及年代具有一致效應,則記為APc 模型,模型形式如下:
!
ijr= µ
r+ "
i+ #
j+ $
kr同理,只有年齡效應具有一致效應,則記為 Apc 模型,模型形式如
下:
!
ijr= µ
r+ !
i+ !
jr+ !
kr針對這些子模型而言,模型中的各個效應參數依然存在無法甄別的問 題,然而若考量各個效應值與參考分層(reference stratum)的效應值 差,亦即 !i(r )=
!
i,r !!
i,R為第 r 個分層與第 R 個分層在第i
個年齡效應 上的差異,!j(r )=
!
j,r !!
j,R為第 r 個分層與第 R 個分層在第j
個年代效 應上的差異,!k(r )=!
k,r!!
k,R為第 r 個分層與第 R 個分層在第 k 個世代效應上的差異,其中 !
i (r ) i
"
="
j!(r )j ="
k!k(r )= 0,Riebler and Held(2010)證明在子模型下這些效應差參數是可以甄別的。除了說明效應
差異外,這些參數也具有實務上的意義,以APc 為例,
!!
k(r )
= !
µ(r )+ !
k(r ),可解釋為在第 k 個世代上,第 r 個分層相對於第 R 個 分層的的對數相對風險(log relative risk),其中
•
• 國
立 政 治 大
㈻㊫學
•
N a tio na
l C h engchi U ni ve rs it y
數 是 充 分 的 , 因 此 將 模 型 透 過 這 樣 的 轉 換 基 本 上 是 沒 有 遺 失 任 何 資 訊 的
(Riebler and Held (2010)),這一點也可藉由 R = 2 只有兩個類別來作簡單的說 明。令 !1代表所有 !ij1所組成的向量, !2代表所有 !ij 2所組成的向量,MAPC 模 型的概似函數因為條件獨立可表示為
L(
!1,
!2) = L(
!ij1,
!ij 2)
i, j
!
L( !
ij1,!
ij 2) = (nij1!
ij1)yij1(nij 2!
ij 2)yij 2exp(!(nij1!
ij1+ nij 2!
ij 2))設定!ij
=
!ij1!ij 2
,
"ij= n
ij1!ij1+ n
ij 2!ij 2,其中!ij為我們所關心的相對風險, !ij為干 擾因子。現在將上述概似函數中的參數改用!ij, !ij代替並乘上1 = !ijyij•
!ij
! yij•後可 以得到:
L(
!ij,
!ij) = ( n
ij1n
ij 2!ij1+ n
ij1n
ij 2!ij)
yij1( 1 1+ n
ij1n
ij 2!ij)
yij 2=L1(!ij)
! #### # " ##### $
exp(!
!ij)
!yij•=L2(!ij)
! " # # ## $ = L
1(
!ij)L
2(
!ij)
因此
L(!, ") = L
1(!)L
2(!)
,其中L
1(!) = L
1(!
ij); L
2(!) = L
2(!
ij)
i, j
!
i, j
!
,表示MAPC 的概似函數可以拆成分別只與參數! , ! 有關的兩個概似函數相乘,因 此只考慮我們所關心的 L1(!) 是充分的。
透過條件概似函數的多項式邏輯模型估出來的值與直接使用 MAPC 模型來進行
估計所得出來的估計值相去不遠,但是過度離散度(overdispersion)則會不
同。由於過度離散度是模型中忽略了某些解釋變數
z
ijr 所導致,藉由條件概似函數法 ,我們可以忽略掉不關心的干擾因子,進而降低過度離散度。