第三章 研究方法
第十節 資料分析
本研究主要的目的是在探討兒童肥胖是否與兒童氣喘有關連性的存在,以及 兒童肥胖的程度與氣喘嚴重的程度是否呈現某種關係。本研究採用 R 3.0.2 統計軟 體(R Foundation for Statistical Computing, Vienna, Austria)來進行資料的分析。針對 第一個研究目的,本研究採用描述性統計來探討氣喘兒童的肥胖程度,隨著其年 齡與性別之大略分布趨勢。針對第二個研究目的,本研究先採用 t-test、Wilson
rank-sum test、Fisher’s exact test、Kruskal-Wallis test 之統計方式,來探討氣喘控制 程度與兒童不同體位或肥胖程度之間的關係。針對第三個研究目的,採用羅吉斯 複迴歸分析,來尋找肥胖與氣喘之間的關連性,以及可能影響兩者關係的有意義 變項。另外有關病童特徵、父母特徵,及家庭特徵等關於人口學的資料,也會進 行基本的描述性分析、t-test、Wilson rank-sum test,來呈現不同組的研究對象特性 以及各組之間的差異。
在此分析步驟中,本研究所採用的統計軟體為 R 3.0.2 software (R Foundation
for Statistical Computing, Vienna, Austria),在各項統計檢定中,two-sided p value ≤ 0.05 被設定為統計達顯著水準的標準,且運用基本的模型適配技巧(model-fitting techniques),包括(1)變項的選擇(variable selection);(2)模型適配度檢定
(goodness-of-fit assessment);以及(3)模型的診斷及補救(regression diagnostics and remedies),來找出最簡約(parsimonious)的迴歸模式。再運用逐步迴歸分析的方式 (stepwise variable selection procedure),將所有的相關變項放入一自變項清單中,每
個自變項依照須達到至少 0.15 的顯著水準,來決定其是否進入並存留於自變項的 清單中(significant level for entry(SLE) and for stay(SLS) were set to 0.15 or larger)。
在進行檢定前,除了將類比變項轉換為虛擬變項外,也運用了 Generalized additive
models (GAMs)來檢定連續性變項的非線性效應,並視情況將連續變項依照適當的 切分點(cut-off point),轉換為類別變項。
此外,針對模型的適配度檢定(Goodness-of-fit, GOF)我們採用了下列幾項標準,
包括: R2 (for linear regression model)、ROC curve (the estimated area under the
receiver operating characteristic, also called the c statistic),以及 the
Hosmer-Lemeshow GOF test (for logistic regression model)。其中 R2 (0 ≤ R2 ≤ 1)所代 表的意義是,模型中的依變項可被自變項解釋的變異量有多少;而 ROC (the c
statistic,正常範圍為 0 ≤ c ≤ 1) ≥ 0.7 代表此模型的鑑別度(discrimination power)在 可以接受的範圍內,而 ROC 曲線下的面積 AUC (Area Under Curve)亦可用來判別
ROC 曲線的鑑別能力,若 0.7≦AUC<0.8 代表可接受的判別力(acceptable discrimination);0.8≦AUC<0.9 則代表好的判別力(excellent discrimination),若 AUC≥0.9 則代表非常好的判別力(outstanding discrimination) (Hosmer & Lemeshow, 2004)。而在 Hosmer-Lemeshow GOF test 中,較高的 p values 顯示較佳的羅吉斯模 型;另外,其殘差(residual deviance)與自由度(degrees of freedom, df)的比值≤ 1.0 也代表適配較佳的羅吉斯模型。除了以上的檢定之外,資料的分析過程中也會進 行迴歸的診斷,包括殘差的分析(residual analysis)、檢測影響性個案的存在
(detection of influential cases),以及計算各重要自變項的變異數膨脹因子(variance inflating factor, VIF)之數值,來檢定其是否產生共線性的情形。
表 3-10:資料分析方法
研究變項/面向 分析方法
人口學特性 描述性統計(平均數、標準差、中位數、眾數、偏
態、峰度)不同群組間的差異(t test, Wilcoxon rank-sum test)
氣喘控制程度與不同肥胖程度 之關連性
Wilcoxon rank-sum test, Fisher’s exact test, Kruskal-Wallis test, Multiple logistic regression 兒童身體活動程度、飲食型態
以及人口學特性對氣喘控制程 度與肥胖程度的影響
Multiple logistic regression Multiple linear regression
第十一節 倫理考量
本研究計畫獲得台灣大學醫學院附設醫院「研究倫理委員會」之審查通過,
並於 2009 年 12 月至 2011 年 9 月進行研究個案的收集(案號: 200911042R 號)(附錄 七)。由於研究對象為 4~15 歲的兒童,故需要取得其監護人的同意及在知情同意 書上簽章(附錄八),每位受試者皆會收到此知情同意書之回條,上方並註記有研究 者的姓名與聯絡方式,當受試者有任何進一步的疑慮或意見時,可與研究者取得 聯繫。除此之外,在研究進行前,研究者均會針對兒童在資料收集中所可能接受 的詢問與檢查,一一向其監護人及兒童說明與確認。特別是本研究需要利用肺活 量計來測量兒童的肺功能,因此每位受試兒童須具備相當的理解力與配合度,得 以順利進行檢查。若在研究進行或測量的過程中,兒童本身或其父母(主要監護人) 有任何身心靈的不適,導致其不願繼續參與研究過程,均可以隨時退出研究。完 成資料蒐集後,研究者將受試者個人資料另外保存,並運用代號而非可辨識的個 人資料進行資料的輸入與分析,以將受試者個資暴露的風險降至最低,達到保護 受試者的目的。