第四章 資料分析
第一節 敘述統計
二、 自變項─地理環境因素
本研究的自變項原為環境品質面向 2 個─PM10濃度、自來水普及率;社經水 準面向 3 個─收入中位數、低教育人口比例、農業人口比例;生活壓力面向 3 個
─離婚、遷移、無業人口比例;以及醫療資源面向 2 個─每萬人醫事人員數、每 萬人病床數。經由自變項間的相關分析,以及多元線性重合診斷之後 (詳見下一 節),發現自變項間有嚴重的多元線性重合,恐造成迴歸母數變異數膨脹的問題,
影響迴歸分析結果 (謝雨生、鄭宜仲 1993),故將社經水準、生活壓力與醫療資 源三個面向的變項分別依據其理論基礎進行主成分分析,以萃取出代表性的複合 式指標,在本小節先行說明作者挑選各變項的理論依據與邏輯推理。
1. 環境品質面向
回顧過去文獻,發現空氣品質與健康的關係是許多研究關注的問題,特別是 懸浮微粒濃度與死亡率的關係。以短期暴露而言,Schwartz (1994) 與 Samet (2000) 確認懸浮微粒 PM10的濃度與每日死亡率有正向關係;哈佛六城研究則是檢驗出
45
懸浮微粒 PM2.5與非事故死亡風險有正相關 (Dockery et al. 1993),此外,總懸浮 微粒 TSP 與日死亡率也有正向關係 (Schwartz 1994)。以長期暴露而言,總懸浮 微粒 TSP 也與長期死亡率相關 (Jerrett et al. 2005; Barceló, Saez and Saurina 2009)。
在臺灣,有有不少研究探討懸浮微粒與死亡率的關係 (Yang 1999;詹長權 2008),
懸浮微粒很可能就是致命的健康殺手。
由於過去眾多研究指出懸浮微粒是健康的重要影響因素,故本研究的環境品 質面向選擇懸浮微粒濃度作為全死因死亡率的解釋變項,具體而言,是以粒徑小 於 10 微米之懸浮微粒 PM10濃度作為環境品質的代表。為何不選擇總懸浮微粒 TSP 或 PM2.5作為解釋變項?這是因為本研究使用行政院環保署空氣品質監測網 所公開的空氣品質歷年資料,該資料為全臺 72 個空氣品質測站監測所得,而總 懸浮微粒 TSP 則多以人工檢測的方式取得 24 小時懸浮微粒濃度總值,並非全臺 72 個空氣品質測站所進行的監測方式,故資料不可得。另一方面,環保署由 2007 年才開始監測 PM2.5濃度,而本研究期間的起點在於 2001 年,故以 2007 年的 PM2.5 濃度來解釋 2001 年的死亡率並不合理。
原則上,當我們要討論 PM10濃度與死亡率變遷的關係時,必須考慮到每年 PM10濃度之空間型態是否具有時間波動。若是,則以 PM10濃度去解釋死亡率變 遷時,必須使用歷年 PM10濃度去解釋各年的死亡率;若否,也就是每年 PM10濃 度變化不大時,則可將之假定為一穩定而不隨時間變化的因素。為了確認這個問 題,本研究將 2001 年至 2010 年十年間的 PM10濃度進行相關分析。由表 8 可知,
各年間的 PM10濃度的相關係數達 0.7 以上,具有高度的正相關,因此我們可以假 定每年 PM10濃度之空間型態大致為穩定不變,亦即可將其視為不隨時間變動的 變數(time-invariant variable)。
46
表 8 2001 年至 2010 年間 PM10濃度相關係數
年代 01 02 03 04 05 06 07 08 09 10 01 1.00**
02 0.92** 1.00
03 0.92** 0.92** 1.00
04 0.85** 0.76** 0.82** 1.00
05 0.84** 0.77** 0.85** 0.96** 1.00
06 0.85** 0.79** 0.86** 0.92** 0.97** 1.00
07 0.80** 0.74** 0.80** 0.90** 0.94** 0.97** 1.00 08 0.82** 0.76** 0.82** 0.92** 0.95** 0.98** 0.98** 1
09 0.82** 0.74** 0.81** 0.91** 0.94** 0.96** 0.96** 0.98** 1.00
10 0.79** 0.74** 0.80** 0.90** 0.94** 0.95** 0.95** 0.96** 0.96** 1.00
*. 在顯著水準為0.05 時 (雙尾),相關顯著。
**. 在顯著水準為0.01時 (雙尾),相關顯著。
註) 為求簡潔,表格中的年代 2001 年以 01 表示,2002 年以 02 表示,以此類推。
接著必須將全臺 72 個測站的 PM10濃度資料轉換為鄉鎮資料,需要進行空間 推估 (spatial interpolation),這是因為空氣具有連續而流動的特質,但我們只有少 數幾個測站的資料,故每個鄉鎮所屬的 PM10濃度是未知的,需要透過空間推估 的步驟來獲得各鄉鎮的 PM10濃度資料。空間推估方法是將 PM10濃度由點型測站 資料轉換為連續性的網格資料 (raster data),其基本假定為 PM10濃度為空間相依,
且地理位置愈接近的網格,數值愈相似 (Lai, So and Chan 2009)。
克利金法 (Kriging Method ) 是推估空氣品質資料常見的方法 (Jerrett et al.
2005; Barceló, Saez and Saurina 2009)。該方法透過計算控制點的半變異數 (semivariance) 與控制點間距離的關係來獲得各控制點空間相依關係,由各控制 點的空間相依關係賦予未知網格的權重λ,以權重 λ 與各控制點的乘積去計算未 知網格的數值 (Cromley and McLafferty 2002)。
具體而言,本研究使用地理資訊系統工具 ArcMap 10.0,以各測站 2000 年至 2002 年 PM10的三年平均濃度作為空間推估的基礎。在推估方法上,選用 Universal Kriging 法,在半變異數模型選擇線性幅度模型 ( linear with linear drift)。獲得臺
47
灣本島 PM10的網格資料後,為了讓各鄉鎮市區皆有一代表性的 PM10濃度數值,
本研究採用 2000 年的村里人口資料,以 GIS 工具求得當年各鄉鎮的人口重心,
並取人口重心所在的 PM10濃度網格數值作為該鄉鎮之 PM10濃度數值,如此便求 得臺灣本島 349 個鄉鎮市區於研究起點的 PM10濃度變數。
2. 社經水準面向
社經水準代表一地貧窮的程度。若一地較貧窮,象徵著該地的生活機會貧乏、
公共設施不足、高犯罪率 (Sloggett and Joshi 1998; Carstairs 2000),居民缺乏運動 與休閒的時間,且運動強度較低 (Turrell et al. 2010),攝取蔬菜與水果的頻率較 低 (Shohaimi et al. 2004),皆不利於生命的維持。衡量貧窮可由多種視角切入,
本研究以收入、教育程度及農業人口比例作為判斷一地社經水準的依據,以下逐 一探討之。
(1) 收入:
收入的多寡直接影響了個人或家戶的生活品質,以及醫療資源的可得性,當 一地的平均收入較低,則該地的居民較為貧窮。過去多以剝奪指數作為資源貧瘠 的變項,而收入則常被納為剝奪指數的考慮因子 (Singh 2004; Rey et al. 2009;
Windenberger 2011),也有研究將收入作為一個獨立變項,探討收入與死亡率的 關係 (Jerrett et al. 2005; Shi et al. 2005)。另一方面,也有研究以低收入戶比例做 為死亡率探討的要素 (Jerrett rt al. 1998)。以臺灣研究而言,個人收入是解釋鄉鎮 嬰幼兒死亡率 (孫樹根、劉俊賢 2006) 及縣市粗死亡率(洪乙禎、林錦鴻 2010) 的因素。所以,收入應為衡量一地死亡率的重要因素。
本研究選擇 2001 年鄉鎮收入中位數作為社經水準的變項之一,該變項為綜 合所得稅資料,以各鄉鎮市區內所有納稅單位繳交綜合所得總額之中位數作為鄉 鎮收入的代表方式,這是因為目前無法獲得全臺 349 個鄉鎮的的個人或家戶所得 資料,故以鄉鎮市區綜所稅的中位數資料作為代理變項,依據剝奪理論,鄉鎮收 入中位數愈高的鄉鎮,其死亡率可能愈低。
48
(2) 教育程度:
教育程度直接影響了人們接收衛教知識的程度,也與收入有著高度相關,對 於疾病的預防扮演重要的角色。過去剝奪指數的編製也常把低教育人口比例作為 貧窮的測量因素 (Benach and Yasui 1991; Salmond and Crampton 2000; Singh 2003),或者將高中以下人口比例作為一個獨立變項以探討教育程度與死亡率的關 係 (Jerrett 1998; Jerrett et al. 2005),也有研究採用高中以上學歷人口作為教育程 度的代理 (Shi 2005; Rey et al. 2009; Windenberger et al. 2011),在臺灣,教育程度 也是研究死亡率的重要變項 (胡幼慧等 1990;孫樹根、劉俊賢 2006),依據上 述討論,本研究將教育程度納為解釋變項。
本研究以各鄉鎮低教育程度的人口比例作為解釋變項,也就是 15 歲以上高 中以下學歷(含未就學)人口佔整體人口的百分比。若一地低學歷之人口比例較高,
代表衛生、保健、醫藥知識的教育推廣較為困難,則死亡率可能愈高。
(3) 農業人口比例:
依據行政院農業委員會 (2002) 的農家所得分析,2001 年農家所得收入為 850,428 元,非農家為 1,090,301 元,相對於非農家而言,農家是收入較低的人口,
故以農業人口比例作為死亡率的解釋因素。回顧過去文獻,農業人口比例也曾被 當作控制變項來探討其與死亡率的關係 (Jerrett et al. 1998);胡幼慧等人 (1990) 與孫樹根、劉俊賢 (2006) 也曾以鄉鎮農業人口比作為探討個別死因與嬰幼兒死 亡率的解釋因素。所以採用農業人口應該是衡量一地資源貧乏的適當變項。
本研究以各農業人口比例作為解釋變項,若一地農業人口比例較高,則該地 相對較為貧窮,則死亡率應較高,其定義為各鄉鎮 15 歲以上從事農業人口佔整 體有業人口的百分比。
3. 生活壓力面向
一個整合程度不佳的社會,其中的成員壓力愈大,死亡可能性愈高 (Seeman 1996; Berkman et al. 2000),這是社會整合理論 (social intergration theory) 的經典
49
論述。人們透過社會關係整合進社會之中,若一地社會關係薄弱,則人們的社會 支持系統鬆散,特別是在現代化社會中,社會與文化的變遷快速,面對角色的變 動與複雜的人際關係,生活於其中的個體不免感到適應不良、文化矛盾、困惑與 挫折感 (Dennis 1977)。在 Eyer 與 Sterling (1977) 的研究中指出離婚、喪偶、遷 移與失業是人們生活中重要的壓力事件,雖然本研究能獲得上述四種事件發生的 人口比例,但若強迫上述四種因素進行主成份分析,將造成第一主成份解釋變異 量百分比偏低,故本研究剔除喪偶變項,採用離婚、遷移、失業此三項的人口比 例作為解釋因素
(1) 離婚人口比例
婚姻狀態一直是社會整合、社會網絡、社會支持等研究途徑相關研究時常用 以檢驗社會關係與健康、死亡率的代表性變項 (Neser 1971; Berkman and Syme 1979),若人們經歷離婚這般重大的壓力事件 (Holmes Rahe 1967; Cochrane and Robertson 1973; Rabkin and Struening 1976; 張苙雲 1989),形成龐大心理負擔,
產生多種負面情緒,這種慢性壓力極可能影響人們的內分泌系統與免疫系統的運 作 (Cassel 1976),使人走向疾病。而患病後缺乏社會性支持,孤獨無援,無人提 供協助與照顧,那麼恢復健康的機會就更加渺茫 (Gove 1973; Berkman et al.
2000 )。過去研究也指出,儘管未有疾病,鰥寡而未有社會支持 (social support) 的 人,相對地死亡率或死亡風險較高 (Neser 1971; Gove 1973; Berkman and Syme 1979; Schoenbach et al. 1986; Orth-Gomér and Johnson 1987; Kaplan et al. 1988;
Seeman et al. 1993)。所以,婚姻的狀態可能影響健康,一地的離婚人口比例應與 該地之死亡率有關。
本研究以離婚人口比例做為生活壓力的變項,因為離婚為一壓力事件,且象 徵著社會支持系統的斷裂,故一地的離婚人口比例愈高,死亡率也可能愈高。其 測量方式為鄉鎮內 15 歲以上離婚人口佔全體 15 歲以上人口的百分比。
(2) 遷移人口比例
50
遷移是人們脫離原本的居住地,搬遷至相對陌生的環境裡。不但是外顯的居
遷移是人們脫離原本的居住地,搬遷至相對陌生的環境裡。不但是外顯的居