第三章 研究方法
第四節 關連式法則分析
關連式法則探勘採用的資料型態為交易形式,因此將資料作轉換,例如 原始資料中,血紅素的屬性值有正常、過低、過高、疑似過低、疑似過高等 五項。轉換後,改為血紅素-正常、血紅素-過低、血紅素-過高、血紅素-疑似 過低、血紅素-疑似過高等五個屬性,每個屬性的值為「是」、「否」兩種。
本研究採關連式法則探勘主要的目的在找出在既有的疾病下更多潛在的 疾病的預防建議,經與專業護理人員詢問後,將資料作了一些調整:
一、刪除健康檢查項目中正常值的屬性,例如血紅素-正常這個欄位。
二、刪除較不具護理參考建議的屬性,例如三酸甘油脂太低這個屬性,
一般都是在探討當三酸甘油脂太高可能產生的疾病。
登錄學生 傷病資料
轉換學生健檢 資料
讀取學生
健檢資料 健檢資料庫
判斷學生 傷病登錄 是否有誤 讀取學生 傷病規則
顯示登錄 可能有誤
健檢參考數據
傷病規則資料庫
學生傷病資料庫 登錄學生傷
人工判斷 病 登錄傷病 是否有誤
否 否
是
是
經整理後,共有 27 個屬性。每個屬性的值為「是」、「否」兩種。整合 後的學生健康檢查資料如表3.6 所示。
表 3.6 整合後的學生健康檢查資料
屬性 資料類型 屬性值描述
體型-過輕 Nomial 是、否
體型-過重 Nomial 是、否
體型-肥胖(第一型) Nomial 是、否
體型-肥胖(第二型) Nomial 是、否
體型-肥胖(第三型) Nomial 是、否
血壓-高血壓 Nomial 是、否
血壓-疑似高血壓 Nomial 是、否
尿蛋白-偽陽性 Nomial 是、否
尿蛋白-陽性 Nomial 是、否
尿蛋白-陽性(過量) Nomial 是、否
白血球-過低 Nomial 是、否
白血球-過高 Nomial 是、否
白血球-疑似過低 Nomial 是、否
白血球-疑似過高 Nomial 是、否
血紅素-過低 Nomial 是、否
血紅素-疑似過低 Nomial 是、否
SGOT-過高 Nomial 是、否
SGOT-疑似過高 Nomial 是、否
SGPT-過高 Nomial 是、否
SGPT-疑似過高 Nomial 是、否
膽固醇-過高 Nomial 是、否
膽固醇-疑似過高 Nomial 是、否
三酸甘油脂-過高 Nomial 是、否
三酸甘油脂-疑似過高 Nomial 是、否
B 肝帶原者 Nomial 是、否
曾經感染B 型肝炎 Nomial 是、否
未感染或具有抗體 Nomial 是、否
為了能提供學校護理人員更多潛在健康咨詢及預防保健上資訊,利用關連式 法則分析所產生的規則,提出了「學生潛在疾病預防建議的機制」,本研究針對 資料探勘的部份分兩方面來分析:
一、針對經過資料前處理後的全部學生健康檢查資料來進行探勘分析,
找出普遍性的潛在規則。
二、加上時間及分群的概念,針對學生健康檢查資料與學生傷病有關係 的資料去分析。依分群的概論可知同一群集中的資料其特性是較接 近的,其彼此間的特徵屬性也較一致,利用這個概念將依學生高中三 年傷病的資料來將學生健康檢查資料來分類,也就是依學生傷病的類別 將學生健檢的資料加以分割,並逐一進行關連分析,企圖找出更多 的潛在規則。相關流程步驟如下:
步驟1:透過系統讀取學生健康檢查資料及最近一次傷病資料 步驟2:配合健康檢查參考數據,將學生健檢資料加以轉換 步驟3:由健康檢查推論規則資料庫中讀取健檢推論規則
步驟4-1:針對全部學生健康檢查資料來進行探勘分析,將轉換後 的學生健檢資料和健檢推論規則加以判別是否有潛在疾 病趨勢,判斷結果為「是」的話,顯示相關的疾病預防 保健知識。
步驟 4-2:針對學生健康檢查資料與學生傷病有關係的資料去分 析,配合頻率最高的傷病資料與經過資料分割後的健檢 推論規則加以判別是否有潛在疾病趨勢,判斷結果為
「是」的話,顯示相關的疾病預防保健知識。
步驟5:若沒有潛在疾病趨勢,顯示一般健檢資料的疾病預防保健 知識。流程圖如圖3.4
圖 3.4 學生潛在疾病預防建議的機制
讀取學生 健檢資料
轉換學生健檢
資料 健檢參考數據
判斷潛 在疾病 讀取健檢 推論規則
一般疾病 預防保健
潛在疾病 預防保健 傷病資料庫
健康檢查推 論規則
疾病預防保 健資料庫 健檢資料庫
讀取學生 傷病資料
計算傷病類別 的比重
否
是