由於本研究所蒐集的資料為階層性的資料,第二層總體層次特徵變數會對依變數有 跨層次直接影響效果,為避免採用傳統迴歸來做分析時未能考量第一層解釋變數係數在 第二層特徵變數間的差異,亦即未考量不同行政區組間的異質性問題且易違反各解釋變 項須相互獨立的假設,導致研究分析上的可能錯誤,所以本研究以多層次線性模型 (multilevel linear modeling, MLM)或稱階層線性模式(hierarchical linear modeling, HLM) 層次分析方式來處理具有內屬、鑲嵌或稱巢套(nested)性質的層級資料。1即第一層個體 巢套於第二層不同的行政區時,利用 HLM 階層線性模式可客觀準確地分析對依變數產 生的固定效果並可估計其截距項與變異數,同時可檢視第一層解釋變數與第二層特徵變 數對依變數是否正確地達到統計上的顯著水準。換言之,階層線性模式與一般線性模式 最主要的差別,就是階層線性模式有考慮組間的差異,藉由 HLM 模型分析能客觀正確 地探討具階層性質的資料之第一層解釋變數與第二層特徵變數對依變數影響的結果,並 可探究第二層之特徵變數對依變數是否有跨層次直接影響效果。
本研究依變數為傾向購屋或傾向租屋結果的二元變數,因此我們將資料設定為白努 利分配(Bernoulli distribution),並使用一般化階層線性模式(hierarchical generalized linear modeling, HGLM)進行分析。
HGLM 模型設定如下:
1 ) log(
ij ij
ij
(1) 其中,
:
i 為每一受訪家計部門。
1溫福星,2006,初版二刷,階層線性模式原理、方法與應用,雙葉書廊。pp.1-2。
11
:
j
行政區之編號。 代表購買住宅的機率。 ij
ij
1 則代表租賃住宅的機率。
為賭賠率(odds ratio)取對數。 ij
若 機率是 0.5,,則賭賠率ij ij/
1ij
= 0.5/0.5 = 1,而 log(1) = 0;若 機率低於 0.5,ij 則賭賠率小於 1, <0,表示家計部門傾向於租賃住宅;若ij 機率大於 0.5,則賭賠ij率大於1, >0,代表家計部門傾向購買住宅。ij
本研究設計階層線性模型之兩個次模型分別討論,兩個次模型為零模型與以截距為 結果的迴歸模型。
一、零模型
階層線性模式中的零模型(null model)為階層一與階層二均沒有納入解釋變項,二個 階層都是無條件化的模型(unconditional model),此模型之設定主要為先檢視依變項家戶 租買選擇行為在不同行政區間是否有所差異,也就是先檢視不同行政區間的租買選擇行 為是否同質。當依變項租買選擇行為在不同行政區間沒有顯著的差異時,表示租買選擇 行為在不同區間是同質的,就沒有必要進行HLM 的分析;即若隨機效果( )檢定結果0j 為達顯著水準,則表示家戶於各行政區的租買行為有不同之變異存在,因此就必須考慮 到各行政區間租買選擇的差異性。模型設定如下:
Level 1:
j
ij 0
(2) 其中,
:
i 為每一受訪家計部門。
:
j
行政區之編號。12 關係數(intra-classcorrelation coefficient; ICC)可做為檢測。其係數定義如下:
3
13
:為組間變異數。 00 2:
為組內變異數。應用 Snijders and Bosker (1999)與 O’Connell et. al. (2008)當 資 料 為 二 元 變 數 時 , 其 誤 差 項 為 邏 吉 斯 特 ( l o g i s t i c ) 分 配 , 變 異 數 為 固 定 之
2/33.289。ICC:稱為組內相關係數;或稱為集群效果(cluster effect) (Raudenbushand and Bryk, 2002),為組間變異數與總變異數的比值,該係數並可用來說明組間變異占整體變 異的比例,代表依變項的變異量可以被組間差異解釋的程度,用來呈現依變項與 組間的關連程度(McGraw and Wong, 1996)。
另外一種方式也可判別之,以 Muthen and Satorra (1995)建議的設計效果(design effect)來判別。2如設計效果大於 2,HLM 為不偏(unbiased)的結果,測量結果與真正的 母數差距很小,其公式如下:
design effect = 1+(average cluster size - 1)*ICC (6) 其中,average cluster size 為第一層次的觀察值個數除以第二層次單位的個數。
二、以截距為結果的迴歸模型
以截距為結果的迴歸模型(intercepts-as-outcomes model)是將第一層次迴歸模式之截 距項當作第二層次的結果變項(outcomes variable),第一層的變項包含依變項與解釋變項
,是屬於個體層次的變項,第一層要探討的主題是個體層次解釋變項與依變項間的關係。
本模型在探討第二層次特徵變數對第一層次截距項之跨層次直接影響效果,第二層次特
2設計效果(design effect)由Cochran (1977)提出,意謂如果兩階段抽樣要達到簡單隨機抽樣的標準誤時,所 必須要增加多少倍的簡單隨機抽樣樣本,average cluster size等於1或ICC等於0時設計效果等於0,亦即不 存在組間(不同行政區)差異;當average cluster size ≥2且ICC不等於0,代表組間特性很不一樣(異質),組內 樣本特性很相似(同質),組內樣本提供資訊量的效果要被打折扣的(乘上ICC),不像同樣本數但完全相異 的組內樣本所提供的資訊那麼多。參考溫福星,2006,初版二刷,階層線性模式原理、方法與應用,雙 葉書廊。pp.8-27、28頁。
14
(PRELOAN),第一層自變數以組平均來中心化(group mean centering)。3第二層次之特 徵變項包括環境品質滿意度(ENVI)與休閒與運動滿意度(LEIS)(詳細變數定義,參見表
移或平減(centering),以減少共線性問題(Tabachnick and Fidell, 2007)。而在HLM之分析中,解釋變 數以總(組)平均數平減,應可避免共線性問題(Hofmann and Gavin,1998; Mathieu and Taylor, 2007)。
本文之第一層解釋變數即是以組平均數進行平減。
15
16
第二層次(總體層次)
第一層次(個體層次)
圖2 研究架構圖