二元羅吉斯迴歸模型

第四章實驗分析

4.3 二元羅吉斯迴歸模型

本節中，我們將運用二元羅吉斯迴歸建立預測模型，因為羅吉斯迴歸分析的概念為非線性，其預測結果之值為預測口腔癌患者之死亡率，然後再利用透過死亡率值的結果來判定口腔癌患者是屬於死亡之群體或是痊癒之群體，而為了判定患者的歸屬群體，一般均採用死亡率值為當其預測結果值超過(含)0.5 時，則判定病患屬於死亡群體，反之則為痊癒群體，然而以死亡率 0.5 為判定門檻值，主要假設條件為原始死亡群與痊癒群之人數比例應相同時，其羅吉斯迴歸預測模型為下面公式(4.2)，羅吉斯迴歸之預測結果詳如表 4.3 所示，其中在預測樣本(預測結果) 部分，則是運用所有樣本所預測之結果，在摺刀樣本(摺刀結果)部分，則是採摺刀法所預測之結果，以有效應用所有資料的資訊建立模型，了解模型之預測能力。由預測結果可以發現當判斷值為 0.5 的二元羅吉斯迴歸預測模型的預測樣本(預測結果)與摺刀樣本(摺刀結果)如表 4.3 所示，在預測樣本(預測結果)下其癒後正常者為 171 位，而癒後正常誤判為癒後非正常樣本有 3 位，判別癒後正常者之訓練正確率為 98.3%；癒後非正常者為 12 位，其中誤判為正常的個數為 10 位，其判別癒後非正常的正確率為 16.7%，整體模型的判別命中率達 93.0%，

而在摺刀樣本(摺刀結果)部分其癒後正常者為 164 位，而癒後正常誤判為癒後非正常樣本有 10 位，判別癒後正常者之訓練正確率為 94.3%；癒後非正常者為 12 位，其中誤判為正常的個數為 11 位，其判別癒後非正常的正確率為 8.3%，整體模型的判別命中率達 88.7%。

表 4.3、羅吉斯迴歸分類結果

疾病狀況預測的各組成員

正確率

0 1

預測樣本

0 171 3 98.3

1 10 2 16.7

摺刀樣本

0 164 10 94.3

1 11 1 8.3

而經過本研究之樣本資料檢視與詢問醫生可知口腔癌患者之死亡群體人數顯著低於痊癒群體，所以若直接採用 0.5 為門檻值將可能造成模式預測效力估計之誤差，而這樣的狀況不只會導致癒後狀況非正常的病患被誤判成正常，而錯過了重要的治療時間，使得病患的病情越加嚴重更不易治癒更需要花費更多的醫療資源和時間在治療上面，因此學者建議可採用重新選取較適切之門檻值的方法來解決，透過了選取出最適當的判別分割值能夠有效地提升針對癒後非正常的病患之預測能力，表 4.4 為在不同分割值時的預測正確率，藉由圖 4.1 可以得知預測癒後正常病患與癒後非正常病患的正確率交點大約為 0.2，所以使用此分割值重新建立二元羅吉斯迴歸預測模型，藉以帄衡兩類預測結果之預測能力。

表 4.4、各階分割值

分割值 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 癒後正

常正確率

90.2 91.4 92.5 95.4 98.3 99.4 100 100 100

癒後非正常正確率

100 91.7 83.3 41.7 16.7 8.3 0 0 0

圖 4.1、各個分割值的分布圖

故表 4.5 為以最合適的判別值 0.2 重新建立二元羅吉斯迴歸模型之預測結果，

在預測樣本(預測結果)下其癒後正常者為 159 位，而癒後正常誤判為癒後非正常樣本有 15 位，判別癒後正常者之訓練正確率為 91.4%；癒後非正常者為 12 位，

其中誤判為正常的個數為 1 位，其判別癒後非正常的正確率為 91.7%，整體模型的判別命中率達 91.4%，而在摺刀樣本(摺刀結果)部分其癒後正常者為 156 位，

而癒後正常誤判為癒後非正常樣本有 18 位，判別癒後正常者之訓練正確率為

0 20 40 60 80 100 120

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 正

確率

分割值

癒後正常正確率癒後非正常正確率

89.7%；癒後非正常者為 12 位，其中誤判為正常的個數為 7 位，其判別癒後非正常的正確率為 41.7%，整體模型的判別命中率達 86.6%；由上面結果可以看到在判別值變更為 0.2 時，雖然在預測癒後正常的正確率部分，從 94.3%下降至 89.7%，然而在預測癒後非正常的正確率部分，卻從 8.3%上昇至 41.7%，雖然這兩者的正確率增減的狀況不一定，但是在此判斷值的預測模式下，可以均衡地判斷兩類癒後狀況，且整體命中率 91.4%，顯示出在最合適地判別值的模型下，可以達到較高預測癒後非正常的正確率。

表 4.5、羅吉斯迴歸分類結果

疾病狀況預測的各組成員

正確率

0 1

預測樣本

0 159 15 91.4

1 1 11 91.7

摺刀樣本

0 156 18 89.7

1 7 5 41.7

(4.1)

4.4 預測模型之效益分析

在使用判別分析與羅吉斯迴歸分析兩種方法建構預測模型後，為了衡量兩種方法所建立之預測模型的預測效益，本論文將運用根據摺刀法所求出之精準度敏感度、整體命中率及 Press’s Q 值和誤判成本等各項結果進行預測效益評估，並且給予評價，以比較其兩者的優缺，如表 4.6 所示。

表 4.6、模型預測效益比較表模型

方法精確度敏感度

整體命中率

Press’s Q 值

誤判成本判別分析 98.9% 8.3% 93.0% 458.8459* 36.1%

羅吉斯迴歸分析 89.7% 41.7% 86.6% 375.9211* 26.3%

*表示具有顯著性

由表 4.5 之結果可以歸納出下列三點：

一、模型的精確度(即是癒後正常預測為正常的機率)是以判別分析模型 98.9%較高，而羅吉斯迴歸分析模型則為 89.7%略低於判別分析模型，但是兩種預測模型皆達到 85%，由此顯示有足夠之能力可以預測癒後狀況正常的病患。

二、模型的敏感度(即是癒後非正常預測為非正常的機率) 是以羅吉斯迴歸分析模型 41.7%較高，而判別分析模型則為 8.3%低於羅吉斯迴歸分析模型。

三、在整體命中率方面，仍然以判別分析模型 93.0%較高，而羅吉斯迴歸分析模型則為 86.6%略低於判別分析模型，但是兩種預測模型皆達到 85%，由此顯示有足夠之能力可以預測癒後狀況正常的病患。

根據上面三點結果，可發現在透過摺刀法檢驗後，雖然羅吉斯迴歸分析模型整體命中率較低，但其預測效益較佳，而在 Press’s Q 值和誤判成本部分，由表 4.5 可發現兩預測模型之Press’s Q 值皆大於標準值 6.63，顯示其兩模型皆有達到統計之顯著水準，均具有良好之適切性，其中判別分析模型其適切性優於羅吉斯迴歸分析模型；在兩預測模型之誤判發生率為 0.5 左右時，其中羅吉斯迴歸分析模型之誤判成本相對較低，綜合上面結果，顯示使用判別分析建構癒後狀況正常的

預測模型較適切，而若要建構癒後狀況非正常的預測模型則使用羅吉斯迴歸分析模型較佳。

在文檔中中華大學 (頁 34-40)

第四章 實驗分析

4.3 二元羅吉斯迴歸模型

(4.1)

4.4 預測模型之效益分析

第四章實驗分析