• 沒有找到結果。

決策樹分類法則

在文檔中 中 華 大 學 (頁 53-64)

第四章 結果分析與探討

第一節 決策樹分類法則

值越小代表修剪越多,在此設定為0.25。

三、葉節點數(numfold):用於建立決策樹的事前修剪,設定為 10%。

試驗結果:各區域的決策樹分類正確率如表4.1~4.6。

本研究採用F-Measure 的方式來評估實驗出來規則的好壞。評估的指標包含 三種指標,分別為精確率(Precision)、召回率(Recall)、及 F 度量(F-Measure);

精確率(Precision)指的是在被預測的資料中有多少被推論出來的規則所預測到的 資料,而召回率指的是被推論出來的規則所預測到的資料佔符合推論出規則的資 料筆數,而F 度量(F-Measure)是結合召回率及精確率二種指標所產生的綜合性指 標,通常也是來評估推論出規則品質的好壞,其公式分別如下[31][ 27][05]:

精確率(Precision)=

FP TP

TP

+ 、召回率(Recall)=

FN TP

TP

+ F 度量(F-Measure)=

call Percision

call Percision

Re Re

*

* 2

+ ,其值介於0~1 之間,越接近 1 其 推論出規則的品質越好。

一、經痛及胃痛區域的分析

利用決策樹分類模型 C4.5 演算法的技術,將經痛及胃痛有關的學生健康檢 查資料進行分析,其分析結果如表4.1 所示。

表 4.1 經痛及胃痛區域的分析實驗結果

分類準確率評估:

由表 4.1 可知,本實驗在分析經痛及胃痛的區域中,所產生的規則預測學 生傷病的資料能正確被分類到經痛的比率為91.9%,正確被分類到胃痛的比例為 87.2%,也就是說學生健康檢查的資料是符合該分析所產生的規則,我們可以推 論學生傷病屬於經痛的可能性有91.9%、屬於胃痛的可能性有 87.2%。將準確率 較低及節點的數量太少的規則進行人工刪除,所產生的規則有12 條規則,這 12

Minnum obj

Number of leaves

size of the tree

Correctly classified Instances

TP Rate FP Rate Precision Recall F-Measure 類別 5 24 32 91.20% 0.977 0.353 0.919 0.977 0.947 經痛 0.647 0.023 0.872 0.647 0.743 胃痛 0.912 0.289 0.91 0.912 0.907

條規則均以IF…THEN 的模式呈現,例如:IF 姓別=女 AND 血紅素=正常 AND 膽固醇=過高 THEN 傷病=經痛。若健康檢查項中,其姓別、血紅素及瞻固醇的 屬性值是符合該規則,在經痛和胃痛這兩種的傷病上,該生屬於經痛的機率是 91.67%,所以當護理人員於事後登錄學生傷病資料時,將該生記錄為胃痛類別的 情況下,由可傷病管理系統提出可能錯誤的提醒。其所推論出來的規則在 F-Measure 品質的評估分為 94.7%及 74.3%,代表該規則的品質是相當不錯的。

因此將此實驗所產生的規則加入到傷病管理的推論規則資料庫中,作為預防傷病 輸入錯誤機制的推論規則。所產生的規則如下所示:

1. IF 性別-女 AND 血壓-疑似高血壓 AND 血紅素-正常 AND SGOT-正常 AND SGPT-疑似過低 AND 膽固醇-疑似過低 THEN 胃痛

2. IF 性別-女 AND 血紅素-正常 AND SGOT-過高 THEN 胃痛 3. IF 性別-女 AND 體型-過輕 AND 白血球-疑似過低 THEN 胃痛 4. IF 性別-男 THEN 胃痛

5. IF 性別-女 AND 血紅素-正常 AND SGOT-正常 AND 膽固醇-過高 AND 膽固醇 -過高 THEN 經痛

6. IF 性別-女 AND 血紅素-正常 AND SGOT-正常 AND 膽固醇-正常 THEN 經痛 7. IF 性別-女 AND 血紅素-正常 AND SGOT-正常 AND SGPT-正常 AND

膽固醇-疑似過低THEN 經痛

8. IF 性別-女 AND 血壓-正常 AND 血紅素-正常 AND SGOT-正常 AND SGPT-疑 似過低AND 膽固醇-疑似過低 THEN 經痛

9. IF 性別-女 AND 血紅素-正常 AND SGOT-疑似過低 THEN 經痛 10. IF 性別-女 AND 血紅素-正常 AND SGOT-疑似過高 THEN 經痛 11. IF 性別-女 AND 體型-正常 AND 血紅素-疑似過低 THEN 經痛 12. IF 性別-女 AND 血紅素-過低 THEN 經痛

二、經痛及腹痛區域的分析

以 C4.5 演算法的技術,將經痛及腹痛有關的學生健康檢查資料進行分析,

其分析結果如表4.2 所示。

表 4.2 經痛及腹痛區域的分析實驗結果

分類準確率評估:

由表4.2 可知,本實驗在分析腹痛及經痛的區域中,學生傷病的資料能正確 被分類到腹痛的比率為82%,而正確被分類到經痛的比例為 72.2%。將準確率較 低及節點的數量太少的規則進行人工刪除,所產生的規則有24 條規則,這 24 條 規則均以 IF…THEN 的模式呈現。所推論出來的規則其品質的評估分 81.3%及 73%,代表該規則的品質是相當不錯的。因此將此實驗所產生的規則加入到傷病 管理的推論規則資料庫中,作為預防傷病輸入錯誤機制的推論規則。所產生的規 則如下所示:

1. IF 性別-女 AND 體型-正常 AND 尿蛋白-陰性 AND 白血球-正常 AND SGPT-疑似過低AND 三酸甘油脂-過高 AND 未感染或具有抗體 THEN 經痛 2. IF 性別-女 AND 體型-正常 AND 尿蛋白-陰性 AND 白血球-正常 AND

SGPT-疑似過低AND 三酸甘油脂-正常 AND 未感染或具有抗體 THEN 經痛

3. IF 性別-女 AND 體型-正常 AND 血壓-正常 AND 尿蛋白-陰性 AND 白血球-正 常AND SGPT-疑似過低 AND 未感染或具有抗體 THEN 經痛

4. IF 性別-女 AND 血壓-正常 AND 尿蛋白-陰性 AND 白血球-正常 AND SGPT-正常AND 膽固醇-正常 AND 三酸甘油脂-過高 AND 未感染或具有抗體 THEN 經痛

5. IF 性別-女 AND 血壓-正常 AND 尿蛋白-陰性 AND 白血球-正常 AND SGPT-正常AND 膽固醇-正常 AND 曾經感染 B 型肝炎 THEN 經痛

6. IF 性別-女 AND 血壓-正常 AND 尿蛋白-陰性 AND 白血球-正常 AND SGPT-正常AND 膽固醇-疑似過低 THEN 經痛

7. IF 性別-女 AND 體型-正常 AND 血壓-疑似低血壓 AND 尿蛋白-陰性 AND 白 血球-正常 AND SGPT-正常 AND 膽固醇-正常 THEN 經痛

Minnum obj

Number of leaves

size of the tree

Correctly classified Instances

TP

Rate FP Rate Precision Recall F-Measure 類別 10 62 80 77.92% 0.807 0.261 0.82 0.807 0.813 經痛 0.739 0.193 0.722 0.739 0.73 胃痛

0.779 0.234 0.78 0.779 0.78

8. IF 性別-女 AND 體型-正常 AND 血壓-疑似低血壓 AND 尿蛋白-陰性 AND 白 血球-正常 AND SGPT-正常 AND 正常 AND 過高 AND 膽固醇-過高THEN 經痛

9. IF 性別-女 AND 體型-過重 AND 尿蛋白-陰性 AND 白血球-疑似過高 THEN 經 痛

10. IF 性別-女 AND 尿蛋白-陰性 AND 白血球-疑似過低 AND 三酸甘油脂-過低 THEN 經痛

11. IF 性別-女 AND 尿蛋白-偽陽性 AND 膽固醇-疑似過高 THEN 經痛

12. IF 性別-女 AND 體型-正常 AND 尿蛋白-陰性 AND 白血球-正常 AND SGOT-疑似過低AND 三酸甘油脂-疑似過高 AND 未感染或具有抗體 THEN 腹痛 13. IF 性別-女 AND 血壓-疑似低血壓 AND 尿蛋白-陰性 AND 白血球-正常 AND

SGOT-疑似過低 AND 曾經感染 B 型肝炎 THEN 腹痛

14. IF 性別-女 AND 血壓-正常 AND 尿蛋白-陰性 AND 白血球-正常 AND SGPT-正常AND 膽固醇-正常 AND 三酸甘油脂-疑似過低 AND 未感染或具有抗體 THEN 腹痛

15. IF 性別-女 AND 血壓-正常 AND 尿蛋白-陰性 AND 白血球-正常 AND SGPT-正常AND 膽固醇-正常 AND 三酸甘油脂-正常 AND 未感染或具有抗體 THEN 腹痛

16. IF 性別-女 AND 血壓-正常 AND 尿蛋白-陰性 AND 白血球-正常 AND 膽固醇 -過高 AND 膽固醇-過高 THEN 腹痛

17. IF 性別-女 AND 血壓-正常 AND 尿蛋白-陰性 AND 白血球-正常 AND 三酸甘 油脂-正常 THEN 腹痛

18. IF 性別-女 AND 體型-過重 AND 血壓-疑似低血壓 AND 尿蛋白-陰性 AND 白 血球-正常 AND SGPT-正常 THEN 腹痛

19. IF 性別-女 AND 血壓-疑似高血壓 AND 尿蛋白-陰性 AND 白血球-正常 AND SGPT-正常 THEN 腹痛

20. IF 性別-女 AND 體型-過輕 AND 尿蛋白-陰性 AND 白血球-疑似過高 THEN 腹痛

21. IF 性別-女 AND 尿蛋白-陰性 AND 白血球-疑似過低 AND 三酸甘油脂-正常

THEN 腹痛

22. IF 性別-女 AND 尿蛋白-陰性 AND 白血球-過低 THEN 腹痛 23. IF 性別-女 AND 尿蛋白-陽性 THEN 腹痛

24. IF 性別-男 THEN 腹痛

三、胃痛及腹痛區域的分析

以 C4.5 演算法的技術,將胃痛及腹痛有關的學生健康檢查資料進行分析,

其分析結果如表4.3 所示。

表 4.3 胃痛及腹痛區域的分析實驗結果

Minnum obj

Number of leaves

size of the

tree

Correctly classified Instances

TP Rate

FP

Rate Precision Recall F-Measure 類別 5 35 47 86.36% 0.983 0.853 0.874 0.983 0.925 腹痛

0.147 0.017 0.586 0.147 0.234 胃痛

0.864 0.734 0.833 0.864 0.827

分類準確率評估:

由表4.3 可知,本實驗在分析腹痛及胃痛的區域中,學生傷病的資料能正確 被分類到腹痛的比率為87.4%,而正確被分類到經痛的比例只有 58.6%,將準確 率較低及節點的數量太少的規則進行人工刪除,所產生的規則有14 條規則,這 14 條規則均以 IF…THEN 的模式呈現。所推論出來的規則其品質的評估分 92.5%

及23.4%,因此只將此實驗預測出腹痛的規則加入到傷病管理的推論規則資料庫 中作為預防傷病輸入錯誤機制的推論規則。所產生的規則如下所示:

1. IF 體型-正常 AND 血紅素-疑似過低 AND SGOT-正常 AND SGPT-疑似過低 THEN 腹痛

2. IF 血紅素-正常 AND SGOT-正常 AND SGPT-疑似過低 AND 未感染或具有抗 體THEN 腹痛

3. IF 血紅素-正常 AND SGOT-正常 AND SGPT-疑似過低 AND 膽固醇-正常 AND 曾經感染B 型肝炎 THEN 腹痛

4. IF 血紅素-正常 AND SGOT-正常 AND SGPT-疑似過低 AND 膽固醇-過高 AND 膽固醇-過高 AND 曾經感染 B 型肝炎 THEN 腹痛

5. IF 體型-過輕 AND 血紅素-正常 AND SGOT-正常 AND SGPT-疑似過低 AND

膽固醇-疑似過低 AND 曾經感染 B 型肝炎 THEN 腹痛

6. IF 性別-女 AND 血紅素-正常 AND SGOT-正常 AND SGPT-疑似過低 ANDB 肝帶原者THEN 腹痛

7. IF 血紅素-過低 AND SGOT-正常 AND SGPT-疑似過低 AND 三酸甘油脂-正常 THEN 腹痛

8. IF 性別-男 AND 血紅素-疑似過低 AND SGOT-正常 AND SGPT-疑似過低 AND 三酸甘油脂-正常 THEN 腹痛

9. IF 血紅素-疑似過高 AND SGOT-正常 AND SGPT-疑似過低 AND 三酸甘油脂-過高THEN 腹痛

10. IF 血紅素-過高 AND SGOT-正常 AND SGPT-疑似過低 THEN 腹痛 11. IF SGOT-正常 AND SGPT-正常 THEN 腹痛

12. IF SGOT-正常 AND SGPT-疑似過高 THEN 腹痛 13. IF 性別-男 AND SGOT-過高 THEN 腹痛

14. IF SGOT-疑似過低 THEN 腹痛

四、暈眩及發燒區域的分析

以 C4.5 演算法的技術,將暈眩及發燒有關的學生健康檢查資料進行分析,

其分析結果如表4.4 所示。

表 4.4 暈眩及發燒區域的分析實驗結果

Minnum obj

Number of leaves

size of the tree

Correctly classified Instances

TP Rate

FP

Rate Precision Recall F-Measure 類別 2 37 50 63.24% 0.626 0.363 0.582 0.626 0.603 暈眩 0.637 0.374 0.679 0.637 0.658 發燒

0.632 0.369 0.636 0.632 0.633

由表4.4 可知,本實驗在分析暈眩及發燒的區域中,學生傷病的資料能正確 被分類到暈眩的比率為58.2%,而正確被分類到發燒的比例為 67.9%,實驗所產 生的規則有 15 條規則,規則的品質的評估為 60.3%及 65.8%,將準確率較低及 節點的數量太少的規則進行人工刪除,在評估準確率及F-Measure 指標後,仍將 此實驗所產生的規則加入到傷病管理的推論規則資料庫中,作為預防傷病輸入錯 誤機制的推論規則。所產生的規則如下所示:

1. IF 血紅素-疑似過高 THEN 發燒

2. IF 體型-過輕 AND 血壓-正常 AND 尿蛋白-陰性 AND 血紅素-正常 AND 三酸 甘油脂-正常 THEN 發燒

3. IF 體型-正常 AND 尿蛋白-陰性 AND 血紅素-正常 AND SGPT-正常 AND 三酸 甘油脂-正常 AND 未感染或具有抗體 THEN 發燒

4. IF 體型-正常 AND 血壓-疑似低血壓 AND 尿蛋白-陰性 AND 血紅素-正常 AND 三酸甘油脂-正常 AND 曾經感染 B 型肝炎 THEN 發燒

5. IF 體型-過重 AND 尿蛋白-陰性 AND 血紅素-正常 AND 三酸甘油脂-正常 THEN 發燒

6. IF 性別-女 AND 尿蛋白-陰性 AND 血紅素-正常 AND 三酸甘油脂-過高 THEN 發燒

7. IF 尿蛋白-陰性 AND 血紅素-正常 AND 三酸甘油脂-疑似過低 THEN 發燒 8. IF 性別-女 AND 尿蛋白-偽陽性 AND 血紅素-正常 THEN 發燒

9. IF 血紅素-過低 AND 未感染或具有抗體 THEN 發燒 10. IF 血紅素-疑似過低 THEN 暈眩

11. IF 體型-過輕 AND 血壓-疑似低血壓 AND 尿蛋白-陰性 AND 血紅素-正常 AND 三酸甘油脂-正常 THEN 暈眩

12. IF 體型-正常 AND 尿蛋白-陰性 AND 血紅素-正常 AND SGPT-疑似過低 AND 三酸甘油脂-正常 AND 未感染或具有抗體 THEN 暈眩

13. IF 性別-女 AND 體型-肥胖(第一型)AND 尿蛋白-陰性 AND 血紅素-正常 AND 三酸甘油脂-正常 THEN 暈眩

14. IF 尿蛋白-陰性 AND 血紅素-正常 AND SGPT-正常 AND 三酸甘油脂-疑似過 高THEN 暈眩

15. IF 血紅素-過高 THEN 暈眩 五、頭痛及暈眩區域的分析

以 C4.5 演算法的技術,將頭痛及暈眩有關的學生健康檢查資料進行分析,

其分析結果如表4.5 所示。

表 4.5 頭痛及暈眩區域的分析實驗結果

在文檔中 中 華 大 學 (頁 53-64)

相關文件