第二章 文獻探討
第四節 卡方互動自動偵測法
卡方自動互動偵測法(CHAID, Chi-Square Automatic Interaction Detection),由 Kass 於 1980 年所發展出的一種經驗證之 有效的多 變量統計方法,針對類別變項及連續變項,建立樹狀圖或分割 (segmentation) , 而 被 成 功 地 運 用 於 分 析 大 量 的 市 場 調 查 資 料 (Perreault and Barksdale, 1980)。此法為先檢定各不同類別對依變項 是否達到統計上顯著之差異,將不顯著之類別合併成為一個相似的 群組,然後再對剩餘的類別進行重複的動作,直到統計上無法再區
分為止,接著在所有的自變項中首先選取一個統計上最顯著之預測 變數,做為第一個節點,再由此一變項下每一相似的群組中重複上 述動作,一直到每個節點下的相似群組在統計上均無法分割為止,
因此,CHAID 可非常成功地排除類別變項間的交互作用。
本研究中潛在變項中有些屬於類別變項,有些屬於連續變項,
而過去的研究多使用邏輯斯迴歸來定義氣胸復發的危險因子,雖然 在邏輯斯迴歸中對自變項並無分配之假設,但類別變項中最常見的 問題為變項與變項之間存在著交互作用,若要消除之間的交互作 用,一般常用之方法為將兩個或兩個以上變項的乘積加入迴歸之模 式中,但此做法若變項過多時易耗時且成本過高,因此,為了克服 上述各項缺點,本研究將首先使用邏輯斯迴歸統計分析,在控制干 擾因子,定義出原發性自發性氣胸復發之危險因子後,再將這些自 變項應用 CHAID 方法,兩者相輔相成,以建立氣胸復發之預測模 型。
CHAID 近年來較廣泛地被應用於健康照護方面,Huang et al.利 用 CHAID 建立一些易患精神問題病患的特性,他分析了十六個獨 立變項,包括性別、種族、職業、年齡、收入、家庭、婚姻、宗教、
教育及身心健康狀況等等,結果發現身心健康狀況最能預測心智是 否有問題,不同的健康狀況其治療結果亦不同。若健康狀況尚可,
則沮喪(depression)成為最顯著之預測身心問題的變項,此結果表示
類 別 變 項 間 確 有 交 互 作 用 存 在 。1984-1988 年 以 色 列 Rambam Medical Center 對 117 位因嚴重頭部外傷而住院之兒童病患(0-14 歲) 使用邏輯斯迴歸及 CHAID 來找出影響預後之危險因子,結果發現 在邏輯斯迴歸中GCS(Glasgow Coma Scale),硬腦膜下血腫及年齡小 於三歲是病患是否死亡之最佳預測變項,CHAID 的分析結果雖然類 似,但卻顯示硬腦膜下血腫及小於三歲,對GCS 為 6-7 分之亞群病 患影響最嚴重,而邏輯斯迴歸則無法測出此一重要結果 (Levi et al., 1998)。Hill 等人使用 CHAID 來分析預測創傷預後之變項,結論為 急診室病患的 GCS 是最有意義的預測變項,再依據 GCS 將病患分 割成三組,發現各組死亡率顯著不同;若GCS 為 3 分,則年齡是最 強的預測變項,若GCS 為 4-12 分,則 ISS(Injury Severity Score)成 為最強的預測變項,若GCS 為 13-15 分,病患年齡亦為最強的預測 變項。CHAID 分析結果顯示了變項間的互動關係,這些互動關係可 協助臨床醫師特別注意在不同的病患亞群中存在不同的變項,來改 善創傷病患之預後。因此,在類別的資料組中,總是存在依變項的 偏態分布,以及類別變項間的交互作用,而使得一般統計迴歸方法 如線性迴歸模型等很難適用,此時必須藉助一強而有效的統計方法 如CHAID 來解決上述問題。