• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

81

小結 4.5.4

經實驗結果,在分類技術 J48 演算法來看其決策樹規模及評估數值並未因剔除 ALU

代碼而有太大差異,於 JRRIPER 演算法其產製之符合邏輯規則數反而較原資料集規則數

少;關聯規則 Apriori 演算法之產生規則除了將原規則數含有 ALU 之規則剔除外,其餘規 則差異並不大;再觀察分群技術 DBSCAN 及 K-means 皆與原資料集實驗結果都有群聚分

佈不明確之情形。綜合上述說明,資料集剔除 ALU 值並未與原資料集之實驗結果有重大

差異,因此後續仍以原資料集之實驗結果作進一步分析說明。

建模分析 4.6

根據上述各項資料探勘技術之結果觀察說明如下表 4-31,本研究資料採用分類技術 J48 演算法分析雖然有按各屬性歸類但仍有 highly-branching 問題產生,若要消弭這現象,

勢必需再進一步合併屬性,惟如此結果便較無法看到細部資訊會影響實際判讀結果,另 JRIPPER 演算法所有得到 JRIP 規則,但數量並不多;採用分群技術不管採用 DBSCAN 或 K-means 演算法其產生之群聚關係,皆較分散且不易解析;採用關聯法則 Apriori 演算法

處理其整體產出符合業務邏輯規則較 JRIP 規則多且採規則呈現方式較用分群方式來得容

易判讀,綜合以上說明,本研究於 CRISP-DM modeling 階段建議採用關聯法則做為本研 究資料分析方式,若未來有相同類型資料應可先行採用關聯規則技術進行資料分析,其它 方式可先不予以考慮,以節省資料處理時間。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

82

表 4-31 各資料探勘技術實驗結果比較表

方法 演算法 結果

分類技術 J48 各屬性之值過多,雖有經初步歸類,但其決策樹仍然過大,不利

後續解讀。

JRIPPER 產生規則數過少且大多實驗結果之規則皆不符業務邏輯需求。

關聯規則 Apriori 配合minsup 及 minconf 設定可產生不少規則,初步檢視其規則

是較JRIPPER 方式多且較易判讀,因其規則數多,若由人工判

斷是否符合業務邏輯規則,較費神且容易遺漏。

分群技術 DBSCAN 群聚數及雜訊點皆過多且分散,不易看出其群聚分佈。

K-means 雖已設定所需群數,但經觀察其群集中資料值,仍大多將相同代

碼歸為同群,據此無法明確判讀群集分佈方式。

為使 4.3.1 各實驗所得之關聯規則資料可以更貼近實際需求,本節會依據 4.3.1 所 得之資料更進一步淬取分析,將符合業務邏輯之規則於產出時即可呈現,以利決策者可以 聚焦於有用的規則上,而不需在逐條審視。前述符合業務邏輯出規則需至少含括以下元素 及順序:

申告原因、測試原因 ==> 查修結果

申告原因、測試原因、查修結果==>退費等級 資料處理程序如下圖所示:

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

83 Weka Apriori 關聯規則結果

規則處理器

符合業務邏輯

可供決策參考 一般規則 規則

NO YES

圖 4-46 關聯規則資料處理流程圖 4.3.1 各實驗透過規則處理器,所得之可供決策參考之規則如下:

實驗1

項次 關聯規則 confidence

1 cause_id=DMG test_id=NULL ==> feedback_id=706 0.33

實驗2

項次 關聯規則 confidence

1 cause_id=DMG test_id=NULL typhoon_flag=N ==> feedback_id=706 0.33 實驗3

項次 關聯規則 confidence

1 cause_id=INT test_id=INB unit=E4 ==> feedback_id=D04 0.34

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

84

實驗4

項次 關聯規則 confidence

1 c_group_id=C15 t_group_id=T08 ==> f_group_id=F10 0.52 2 c_group_id=C01 t_group_id=T11 ==> f_group_id=F10 0.5 3 c_group_id=C15 t_group_id=T09 ==> f_group_id=F10 0.46 4 c_group_id=C01 t_group_id=T08 ==> f_group_id=F10 0.44 5 c_group_id=C01 t_group_id=T16 ==> f_group_id=F10 0.42 6 c_group_id=C01 t_group_id=T06 ==> f_group_id=F10 0.41 7 c_group_id=C15 t_group_id=T09 ==> f_group_id=F04 0.36 8 c_group_id=C01 t_group_id=T12 ==> f_group_id=F04 0.35 9 c_group_id=C01 t_group_id=T12 ==> f_group_id=F10 0.34

實驗5

項次 關聯規則 confidence

1 c_group_id=C15 t_group_id=T08 typhoon_flag=N ==> f_group_id=F10 0.52 2 c_group_id=C01 t_group_id=T11 typhoon_flag=N ==> f_group_id=F10 0.49 3 c_group_id=C15 t_group_id=T09 typhoon_flag=N ==> f_group_id=F10 0.46 4 c_group_id=C01 t_group_id=T08 typhoon_flag=N ==> f_group_id=F10 0.43 5 c_group_id=C01 t_group_id=T16 typhoon_flag=N ==> f_group_id=F10 0.42 6 c_group_id=C01 t_group_id=T06 typhoon_flag=N ==> f_group_id=F10 0.41 7 c_group_id=C15 t_group_id=T09 typhoon_flag=N ==> f_group_id=F04 0.36 8 c_group_id=C01 t_group_id=T12 typhoon_flag=N ==> f_group_id=F04 0.35 9 c_group_id=C01 t_group_id=T12 typhoon_flag=N ==> f_group_id=F10 0.34

1 c_group_id=C01 t_group_id=T16 unit=N2 ==> f_group_id=F10 0.64 2 c_group_id=C01 t_group_id=T12 unit=N2 ==> f_group_id=F10 0.54 3 c_group_id=C01 t_group_id=T16 unit=E4 ==> f_group_id=F10 0.53 4 c_group_id=C15 t_group_id=T08 ==> f_group_id=F10 0.52 5 c_group_id=C01 t_group_id=T11 ==> f_group_id=F10 0.5 6 c_group_id=C01 t_group_id=T12 unit=E5 ==> f_group_id=F04 0.49 7 c_group_id=C01 t_group_id=T16 unit=E3 ==> f_group_id=F04 0.46 8 c_group_id=C01 t_group_id=T12 unit=E3 ==> f_group_id=F04 0.46 9 c_group_id=C15 t_group_id=T09 ==> f_group_id=F10 0.46 10 c_group_id=C01 t_group_id=T16 unit=E2 ==> f_group_id=F10 0.46 11 c_group_id=C01 t_group_id=T08 ==> f_group_id=F10 0.44 12 c_group_id=C01 t_group_id=T16 unit=HH ==> f_group_id=F10 0.43 13 c_group_id=C01 t_group_id=T16 ==> f_group_id=F10 0.42 14 c_group_id=C01 t_group_id=T16 unit=E1 ==> f_group_id=F10 0.42 15 c_group_id=C01 t_group_id=T06 ==> f_group_id=F10 0.4 16 c_group_id=C01 t_group_id=T12 unit=E4 ==> f_group_id=F10 0.4 17 c_group_id=C01 t_group_id=T12 unit=HH ==> f_group_id=F04 0.4 18 c_group_id=C01 t_group_id=T12 unit=E1 ==> f_group_id=F10 0.37 19 c_group_id=C15 t_group_id=T09 ==> f_group_id=F04 0.36 20 c_group_id=C01 t_group_id=T12 unit=SH ==> f_group_id=F10 0.36 21 c_group_id=C01 t_group_id=T12 ==> f_group_id=F04 0.35 22 c_group_id=C01 t_group_id=T12 unit=E2 ==> f_group_id=F04 0.34 23 c_group_id=C01 t_group_id=T12 ==> f_group_id=F10 0.34 24 c_group_id=C01 t_group_id=T12 unit=E2 ==> f_group_id=F10 0.34 25 c_group_id=C01 t_group_id=T12 unit=HH ==> f_group_id=F10 0.32

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

86

項次 關聯規則 confidence

26 c_group_id=C01 t_group_id=T12 unit=E1 ==> f_group_id=F04 0.31 27 c_group_id=C01 t_group_id=T12 unit=E4 ==> f_group_id=F04 0.3

實驗7

項次 關聯規則 confidence

1 cause_id=ALU test_id=NULL feedback_id=706 ==> refund_level=12..24 0.36 2 cause_id=ALU test_id=NULL feedback_id=614 ==> refund_level=12..24 0.36 3 cause_id=ALU test_id=NULL feedback_id=D03 ==> refund_level=12..24 0.32

實驗8

項次 關聯規則 confidence

1 cause_id=ALU test_id=NULL feedback_id=706.0 typhoon_flag=N ==>

refund_level=12..24 0.36

2 cause_id=ALU test_id=NULL feedback_id=614.0 typhoon_flag=N ==>

refund_level=12..24 0.36

3 cause_id=ALU test_id=NULL feedback_id=706.0 ==> refund_level=12..24 0.36 4 cause_id=ALU test_id=NULL feedback_id=614.0 ==> refund_level=12..24 0.36 5 cause_id=ALU test_id=NULL feedback_id=D03 typhoon_flag=N ==>

refund_level=12..24 0.32

6 cause_id=ALU test_id=NULL feedback_id=D03 ==> refund_level=12..24 0.32

以上處理結果經採人工比對原始 weka Apriori 演算法處理資料所得規則確認相符一致,

故規則處理器應可有效的處理 weka 實驗所得之數據結果,爾後本查修資料若透過 weka

Apriori 演算法處理時,若因產製大量規則時以致無法輕易判讀時,便可以透過規則處理器,

迅速呈現合適規則,以利決策使用。

1. cause_id=DMG test_id=NULL ==> feedback_id=706

2. cause_id=DMG test_id=NULL typhoon_flag=N ==> feedback_id=706 3. cause_id=INT test_id=INB unit=E4 ==> feedback_id=D04

4. cause_id=ALU test_id=NULL feedback_id=706.0 typhoon_flag=N ==> refund_level=12..24 5. cause_id=ALU test_id=NULL feedback_id=614.0 typhoon_flag=N ==> refund_level=12..24 6. cause_id=ALU test_id=NULL feedback_id=706 ==> refund_level=12..24

7. cause_id=ALU test_id=NULL feedback_id=614 ==> refund_level=12..24

相關文件