第三章 研究方法
第三節 資料分析
本研究的統計分析方式將會利用 SAS 9.1.3 進行描述性統計、雙變項 分析以及用多層次分析(Multilevel Analysis)來驗證研究假設。在本篇研 究,我們會將鄉鎮的指標與縣市的指標分別作探討。
雙變項分析首先會利用皮爾森相關性分析(Pearson correlation
coefficient analysis)檢測縣市層次因子之間的相關性,藉此觀察不同因子是 否有共線性的問題,當不同因子之間相關過大時,直接將這些因子放入迴
歸模式中,有可能會在迴歸模式裡遮蔽住彼此的影響力。鄉鎮層次因子之
間也會以同樣的方式進行共線性的檢測。
另外在雙變項分析中,我們會測量個人人口學變項與健康之間的關 係,年齡層則以小於19 歲為最小分層,最大分層為大於 80 歲以上,以 10 歲為一個分層來看與個人健康的關係。社經地位會依照全部人口的社經地
位數值的33rd%, 66th%歸類為低、中、高三層,測量與自評健康、慢性病 及日常生活功能障礙的關係;性別、父親籍貫、婚姻狀態均以兩個分層測
量與自評健康、慢性病及日常生活功能障礙的關係。在縣市層次因子會將
不同因子依的33rd%, 66th%歸類為低、中、高三層測量與三種健康狀況之 間的關係;鄉鎮層次的因子也以同樣的方式進行測量。
最後研究會使用到多層次分析(Multilevel Analysis, MLA),這個方法已 經廣泛的被應用到公共衛生領域,這是一個專門用來處理有層次結構資料
(hierarchical data)的統計方法。在縣市鄉鎮的研究中,資料的結構是有層次 的(每個縣市鄉鎮的因子下面還有居住在該區的個人因子),形成了一個重 疊的(nested)的結構,這樣的資料結構違反了傳統線性迴歸式裡:樣本需要 相互獨立的假設,因為同一個地區裡的居民可能在許多特徵上有比較類似
的情形。導致同一個地區的居民有依存性(dependency)(Blakely &
Woodward, 2000)。因此多層次分析主要是將資料做分層,首先居民的資料 (個人的因子)作為第一個分層,第二個分層則是縣市的資料(例:縣市平均 人口密度)以及鄉鎮的資料(例:鄉鎮平均人口密度)。換句話說,多層次分 析是把結果變項變異程度(variation),分成不同分層(個人 v.s. 鄉鎮 or 個 人 v.s. 縣市),利用此分析方法可以檢視個人的健康差異,究竟是因為個 人因素還是地區因素的差異(Leyland & Groenewegen, 2003)。
多層次分析中的首先會用到的模式是random intercept model,這個模 式假設每個縣市或鄉鎮模式的截距(intercept)是不同的,也就是說每個縣市 或鄉鎮平均的人民健康基準是不一樣的,其數學方程式如下:
(1)
Yij=β0j+β1j(個人因子1j)+β2j(個人因子2j) +εij ---個人層次 β0j=γ00+γ01(區域因子1j)+μ0j ---區域層次
接著是多層次分析中的另一個模式random slope model,其方程式為
(2)
Yij=β0j+β1j(個人因子j)+ β2j(社經地位j)+εij---個人層次 β0j=γ00+γ01 (區域因子1j)+ μ0j---區域層次 β1j=γ10+γ11 (區域因子1j)+ μ1j---區域層次
方程式(2)比方程式(1)多了鄉鎮縣市指標和個人的社經地位變項的交 互作用,也就是個人社經地位的參數β1j可另外被區域的因子所預測,這個 模式假設個人變項和結果變項之間的關係會因為居住的區域的不同而有
所差異,換句話來說,對於社經地位不同的人來說,區域的因子對健康的
影響程度也不同。分析步驟我們會將縣市層次的因子鄉鎮層次的因子分開
與健康指標作探討。分析中會將多層次分析分成三個模式:
模式一(model1),為了要知道區域層次因子(縣市或鄉鎮)與健康之間是否有 關,會先將區域(縣市或鄉鎮)層次的因子放入多層次分析。
模式二(model2),在控制個人的基本人口學變項之後,檢驗是否控制個人 因子之後,區域(縣市或鄉鎮)層次因子與個人健康的關係仍然顯著。
模式三(model3),為了檢驗區域(縣市或鄉鎮)層次因子與個人社經地位的交 互作用,迴歸模式將利用random-slope model 來做預測,以瞭解區域層次 因子和個人健康的關係是否會依不同的個人社經地位而變異。
當發現模式三的交互作用有達顯著時,可利用多層次分析控制其他變
項時預測該交互作用項的預測值(prediction value),進一步瞭解不同社經地 位的人,他們的健康受到縣市層次因子或鄉鎮層次因子的影響情形。