第 4 章 研究方法
第三節 統計分析
4.3.1 研究族群之描述性統計分析
將乳癌及 NHL 病人之基本資料(例如:性別、年齡及共病症)、癌症相關資料(例 如:癌症分級、腫瘤類型及是否侵犯骨髓、化學治療或放射線療法的使用情形)及 G-CSF 的使用狀況分別以病人數和週期數為單位進行描述性統計分析。連續變項 以平均值和標準差表示,類別變項則以百分比表示。另外也依照研究對象的週期 中是否使用 G-CSF 做預防分成初級預防、次級預防及沒有預防三組,檢測三組間 之週期特性有無差異。連續變項進行變異數分析(analysis of variance, ANOVA),類 別變項進行卡方檢定(chi-square)或費雪精確檢定(Fisher’s exact test),以雙尾檢定之 p-value 小於 0.05 做為統計上顯著的判定。
4.3.2 邏輯式迴歸分析(logistic regression)
依照研究對象的週期是否發生嗜中性白血球低下分為兩組,利用邏輯式迴歸 分析,比較其基本資料、癌症相關資料、G-CSF 的使用及實驗室生化數值的差異,
以分析病人在不同週期的特質對此副作用之影響。
單變項迴歸分析
以是否發生嗜中性白血球低下為依變項,自變項則單獨放入下列變項:
1. 基本資料:年齡、性別、共病症 2. 癌症相關資料:
(1) 癌症分級、腫瘤類型
(2) 「進入研究世代日期」前一年內:有無使用化學治療或放射線療法、有 無發生嗜中性白血球低下或 FN
(3) 研究期間內:有無使用放射線療法、發生嗜中性白血球低下或 FN 的次 數、有無延後化學治療的預定日期、有無降低化學治療藥物的劑量
33
3. G-CSF 的使用:初級預防與次級預防
4. 實驗室生化數值:血紅素、血小板、ANC 等數值的正常與否
5. 腎功能及肝功能
由於本研究為回溯性病歷回顧,部分資料並非每個週期都會記載於病歷,且 實驗室生化數值也不一定每個週期固定檢驗,因此會有資料缺失(missing data)的問 題。處理資料缺失的方式為:若資料缺失大於 10%的變項,不予納入邏輯式迴歸 分析;若資料缺失小於等於 10%的變項,則將資料缺失的部分填 0,以併入參考組 (reference group)做分析。資料缺失的變項,請參考 Table 4-2。
多變項迴歸分析
將上述單變項迴歸分析的所有自變項,共同放入多變項迴歸分析模式中分 析,經由 stepwise 的篩選步驟,探討校正其他危險因子後,各變項對於嗜中性白 血球低下的影響。分析結果以勝算比(odds ratio, OR)及 95%信賴區間(confidence interval, CI)表示。
4.3.3 廣義估計方程式(generalized estimating equations, GEE)
由於每個病人收集了多個化學治療週期,這些來自相同病人的化學治療週期 彼此間有相關性,為了處理這種重複測量的問題,故使用 GEE。同樣也將上述所 有自變項,共同放入 GEE 中分析,探討校正重複測量問題後,各變項對於嗜中性 白血球低下的影響。分析結果以勝算比及 95%信賴區間表示。
以上分析皆以雙尾檢定之 p-value 小於 0.05 做為統計上顯著的判定。
34
Table 4-2 Variables of missing data
Breast cancer NHL
>10% -Karnofsky Performance Scale -Total bilirubin
-Albumin
-Bone marrow involvement -Karnofsky Performance Scale -Total bilirubin
-Albumin
-Lactate dehydrogenase (LDH)
≦10% -Stage
-Alanine aminotransferase (ALT) -Hemoglobin (Hb)
-Platelet
-Absolute neutrophil count (ANC)
-Stage
-Alanine aminotransferase (ALT) -Hemoglobin (Hb)
-Platelet
-Absolute neutrophil count (ANC)
4.3.4 統計軟體
本研究利用 Microsoft Office Excel 2010 進行資料整理,並以 SAS 統計軟體 9.2 版進行統計分析。
35