• 沒有找到結果。

運用 WEKA 執行資料探勘

第四章 實驗分析

4.2 資料探勘工具簡介

4.2.2 運用 WEKA 執行資料探勘

本研究所使用的資料探勘軟體是 WEKA 3.7 的版本。進行資料分析前,先依 序將各因素的相同類型歸類在一起,以利資料探勘軟體進行研究資料的分析。如:

玩家、現實生活、設備相關等因素分類。分類完成後,將研究檔案轉換成.csv 檔 或.arff 檔,以利匯入 WEKA 進行分析。

本研究於分析技術上將採用貝氏網路分析及決策樹分析,藉由上述兩種分析 技術來進行分析。本研究將遊戲因素分成了 25 種的因素分類,待研究資料分析 完畢後,將分析結果記錄下來。並針對分析完成的資料,探討何因素能有助於遊 戲勝負的分類,再利用資訊獲利率發掘出決定勝負的關鍵因素,以利後續研究之 探討。

37 4.3 分類技術分析

4.3.1 貝氏網路分析

表 4-3 為貝氏網路分析中其中一種因素分類(年齡、遊戲地點)的分析結果,

貝氏網路分析表中呈現出 Precision 值、Recall 值及 F-Measure 值。

Precision 值、Recall 值及 F-Measure 值定義敘述如下:

精確率(Precision):為系統中的偵測結果,有多少正確答案的比率被偵測出來。

召回率(Recall):為系統中的實際結果,有多少比率被系統偵測到。

F 度量(F-Measure):為結合精確率與召回率的綜合性指標,當 Precision 值和 Recall 值越高,F-Measure 值也會隨之提高。

分析技術/貝氏網路分析 Precision Recall F-Measure 0.549 0.946 0.695 0.414 0.047 0.084 Weighted Avg. 0.488 0.542 0.42

系統偵測結果 實際結果

正確結果

圖 4-1 分類結果示意圖 表 4-3 貝氏網路分析表

38

tp:指答案與問題有相關,而且系統判斷正確並且回傳。

fp:指答案與問題沒有相關,但是系統判斷錯誤並且回傳。

fn:指答案與問題有相關,但是系統判斷錯誤也沒有回傳。

tn:指答案與問題沒有相關,而且系統判斷正確也沒有回傳

因此得出公式如下:

精確率(Precision): tp tp+fp

召回率(Recall): tp tp+fn

F 度量(F-Measure):2∗Precision ∗Recall Precision +Recall

本研究為避免選擇 Precision 值或 Recall 值,而造成研究發生偏頗現象。

因此本研究取最高的 F-Measure 值為研究參考依據。從表 4-3 中可以得知 F-Measure 的值有 0.695。

表 4-5 為 貝 氏 網 路 分 析 中 另 外 一 種 因 素 分 類 ( 遊 戲 角 色 、 角 色 定 位 ) F-Measure 值的研究結果,分析表中顯示的 F-Measure 值只有 0.656。由此得知,

不一樣的因素組合,將導致 F-Measure 值也會有所差異,而遊戲的勝負結果也會

相關 不相關

回傳 tp(true positive) fp(false positive) 未回傳 fn(false negative) tn(true negative)

表 4-4 系統判斷表

39 因此受到影響。

表 4-6 貝氏網路分析 F-Measure 值順序排列表為 25 種因素分類的 F-Measure 值,由表中可以得知對遊戲勝負影響最大的因素分類為(電腦型式、網路速度),

其值為 0.709。最小的因素分類為(全部因素),其值為 0.632。也就是說在遊戲 過程中如果有符合影響遊戲的因素,值越大在遊戲中獲勝的機率可能就會越高。

分析技術/貝氏網路分析 Precision Recall F-Measure 0.562 0.787 0.656 0.489 0.249 0.33 Weighted Avg. 0.529 0.545 0.51

分析方法/

貝氏網路分析

影響遊戲勝負因素分類

F-Measure 值

1 電腦型式、網路速度 0.709

2 遊戲地點、電腦型式 0.707

3 年齡、遊戲地點 0.695

4 年齡、類似遊戲、遊戲資歷 0.689

5 年齡、教育程度 0.683

6 遊戲地點、語音系統、電腦型式 0.68

7 年齡、職業、類似遊戲 0.68

8 類似遊戲、遊戲資歷 0.68

9 年齡、職業、類似遊戲、遊戲資歷 0.679

表 4-5 貝氏網路分析表

表 4-6 貝氏網路分析 F-Measure 值順序排名表

40

透過表 4-6 貝氏網路分析 F-Measure 值順序排行表,得知每項因素對遊戲勝 負的值。但是這些因素包含著基本資料及研究資料的因素。因此,本研究將貝氏 網路分析基本資料及研究資料的前五名因素,綜整如下:表 4-7 為貝氏網路分析 基本資料排名表,表 4-8 為貝氏網路分析研究資料排名表。

10 遊戲地點、認識人數、電腦型式 0.677

11 職業、類似遊戲、遊戲資歷 0.676

12 遊戲地點、認識人樹 0.675

13 居住地、付費 0.675

14 年齡、性別、職業 0.674

15 年齡、職業 0.671

16 年齡、職業、遊戲資歷 0.669

17 遊戲地點、語音系統、認識人數、電腦型式 0.667

18 遊戲地點、語音系統、認識人數 0.667

19 遊戲地點、語音系統 0.665

20 年齡、遊戲地點、網路速度 0.663

21 認識人數、語音系統 0.662

22 認識人數、遊戲地點、網路速度 0.661

23 語音系統、認識人數、電腦型式 0.66

24 遊戲角色、角色定位 0.656

25 全部因素 0.632

41

排名 影響遊戲勝負因素分類 F-Measure 值

1 年齡、遊戲地點 0.695

2 年齡、類似遊戲、遊戲資歷 0.689

3 年齡、教育程度 0.683

4 年齡、職業、類似遊戲 0.68

5 類似遊戲、遊戲資歷 0.68

排名 影響遊戲勝負因素分類 F-Measure 值

1 電腦型式、網路速度 0.709

2 遊戲地點、電腦型式 0.707

3 遊戲地點、語音系統、電腦型式 0.68

4 遊戲地點、認識人數、電腦型式 0.677

5 遊戲地點、認識人數 0.675

4.3.2 決策樹分析

表 4-9 為與上述貝氏網路分析同樣採用(年齡、遊戲地點)的因素分類來做比 較,決策樹分析表中呈現出 Precision 值、Recall 值及 F-Measure 值。

由分析表 4-9 中可以得知,使用決策樹分析後,F-Measure 值為 0.71,與貝 氏網路分析 F-Measure 值為 0.695,並無明顯差異。

表 4-7 貝氏網路分析基本資料排名表

表 4-8 貝氏網路分析研究資料排名表

42

表 4-10 為與上述貝氏網路分析同樣採用(遊戲角色、角色定位)的因素分類 來做比較,由分析表中可以得知。F-Measure 值為 0.681,與貝氏網路分析 F-Measure 值 0.656 相比,即有些許的差異。由此得知,不同的分析技術,針對 不同的因素組合,所得到的分析結果也不盡相同。

表 4-11 決策樹分析 F-Measure 值順序排名表為 25 種因素分類的 F-Measure 值,由表中可以得知對遊戲勝負影響最大的因素分類為(年齡、遊戲地點、網路 速度),其值為 0.71。

最小的因素分類為(全部因素) ,與上述貝氏網路分析一樣,其值為 0.62,

而貝氏網路分析為 0.632。

分析技術/決策樹分析 Precision Recall F-Measure

0.551 1 0.71

0 0 0

Weighted Avg. 0.303 0.551 0.391

分析技術/決策樹分析 Precision Recall F-Measure 0.54 0.924 0.681 0.273 0.035 0.062 Weighted Avg. 0.42 0.524 0.403

表 4-9 決策樹分析表

表 4-10 決策樹分析表

43 分析方法/

決策樹分析

影響遊戲勝負因素分類

F-Measure 值

1 年齡、遊戲地點、網路速度 0.71

2 電腦型式、網路速度 0.71

3 年齡、遊戲地點 0.71

4 居住地、付費 0.71

5 遊戲地點、電腦型式 0.71

6 認識人數、遊戲地點、網路速度 0.7

7 類似遊戲、遊戲資歷 0.699

8 年齡、教育程度 0.693

9 遊戲地點、認識人數 0.689

10 年齡、類似遊戲、遊戲資歷 0.688

11 遊戲腳色、遊戲定位 0.681

12 遊戲地點、語音系統、認識人數 0.676

13 認識人數、語音系統 0.676

14 遊戲地點、認識人數、電腦型式 0.669

15 遊戲地點、語音系統、電腦型式 0.667

16 遊戲地點、語音系統 0.667

17 職業、類似遊戲、遊戲資歷 0.663

18 年齡、職業 0.663

19 語音系統、認識人數、電腦型式 0.661

20 年齡、性別、職業 0.661

21 遊戲地點、語音系統、認識人數、電腦型式 0.66 表 4-11 決策樹分析 F-Measure 值順序排名表

44

透過表 4-11 決策樹分析 F-Measure 值順序排名表,得知每項因素對遊戲勝負 的值。因此,本研究將決策樹分析中的基本資料及研究資料的前五名因素,綜整 如下: 表 4-12 為決策樹分析基本資料排名表,表 4-13 為決策樹分析研究資料排 名表。

排名 影響遊戲勝負因素分類 F-Measure 值

1 年齡、遊戲地點、網路速度 0.71

2 年齡、遊戲地點 0.71

3 居住地、付費 0.71

4 類似遊戲、遊戲資歷 0.699

5 年齡、教育程度 0.693

排名 影響遊戲勝負因素分類 F-Measure 值

1 電腦型式、網路速度 0.71

2 遊戲地點、電腦型式 0.71

3 認識人數、遊戲地點、網路速度 0.7

4 遊戲地點、認識人數 0.689

5 遊戲腳色、遊戲定位 0.681

22 年齡、職業、類似遊戲、遊戲資歷 0.648

23 年齡、職業、類似遊戲、 0.648

24 年齡、職業、遊戲資歷 0.648

25 全部因素 0.62

表 4-12 決策樹分析基本資料排名表

表 4-13 決策樹分析研究資料排名表

45 4.3.3 因素分析

經過上述的貝氏網路分析及決策樹分析,得知每一項因素分類的 F-Measure 值。透過 F-Measure 值,可以了解哪些因素分類是對遊戲勝負有影響的。

接著將使用因素分析(資訊獲利率)找出真正能夠影響勝負的關鍵因素,透過 表 4-14 貝氏網路分析及決策樹分析的研究資料排名表,來得知 F-Measure 值順 序排名表的前五名,來進行因素分析。

由表 4-14 中可以得知貝氏網路分析及決策樹分析前五名的因素分類排名,

也能清楚發現前兩名都是相同的因素分類。而結果也顯示出兩種分析技術的前五 名,其影響遊戲勝負的因素分類,有些許因素是共通的。如:電腦型式、網路速 度、遊戲地點、認識人數。但是,也有幾項因素是沒有共通的。如:語音系統、

遊戲腳色、遊戲定位。

因此,本節將針對全部因素進行資訊獲利率的分析,以驗證出影響遊戲勝負 的關鍵因素,是否為上述分析所得的這四項因素。

表 4-15 為資訊獲利率順序排名表,由表中得知影響遊戲勝負關鍵因素的第 一名為認識人數 0.0363325,依序為遊戲角色、職業、網路速度...最後一名為 類似遊戲 0.0000501。由此表可以得知全部因素的對遊戲勝負的影響。

排名 貝氏網路分析 決策樹分析

1 電腦型式、網路速度 電腦型式、網路速度

2 遊戲地點、電腦型式 遊戲地點、電腦型式

3 遊戲地點、語音系統、電腦型式 認識人數、遊戲地點、網路速度 4 遊戲地點、認識人數、電腦型式 遊戲地點、認識人數

5 遊戲地點、認識人數 遊戲腳色、遊戲定位

表 4-14 貝氏網路分析及決策樹分析研究資料 F-Measure 值順序排名表

46

於上述貝氏網路分析及決策樹分析中得知影響遊戲勝負的四項因素,其資訊 獲利率排名為第一、第四、第八及第十。雖然,有些因素的值不是很高。但是透 過不同的因素分類,即可在分析中,發掘出對遊戲勝負有意想不到的影響結果。

4.4 研究資料驗證

表 4-16 及表 4-17 為上述貝氏網路分析及決策樹分析 F-Measure 值順序排名 表得到的四項共同因素(認識人數、遊戲地點、電腦型式、網路速度),所組成的 因素分類。藉由這四項共同因素再次進行貝氏網路分析及決策樹分析,以證實是 否影響遊戲的勝負。其研究分析結果如下:

排名 影響因素 資訊獲利率值

1 認識人數 0.0363325

2 遊戲角色 0.0158166

3 職業 0.0047374

4 網路速度 0.0038205

5 語音系統 0.0036247

6 遊戲資歷 0.0020035

7 年齡 0.0019099

8 遊戲地點 0.0017673

9 遊戲定位 0.001676

10 電腦型式 0.0005079

11 類似遊戲 0.0000501

表 4-15 資訊獲利率順序排名表

47

由上述分析得知表 4-16 貝氏網路分析的 F-Measure 值為 0.653,而表 4-17 決策樹分析的 F-Measure 值為 0.674。表 4-18 為新增四項因素(認識人數、遊戲 地點、電腦型式、網路速度)分類之後的貝氏網路分析及決策樹分析前十名的研 究排行表。

分析技術/貝氏網路分析 Precision Recall F-Measure 0.602 0.714 0.653 0.545 0.42 0.475 Weighted Avg. 0.576 0.576 0.573

分析技術/決策樹分析 Precision Recall F-Measure 0.595 0.778 0.674 0.563 0.35 0.432 Weighted Avg. 0.58 0.586 0.565

排名 貝氏網路分析 F-Measure 值

決策樹分析 F-Measure 值

1 電腦型式、網路速度 0.709 電腦型式、網路速度 0.71 2 遊戲地點、電腦型式 0.707 遊戲地點、電腦型式 0.71

表 4-16 貝氏網路分析表

表 4-17 決策樹分析表

表 4-17 決策樹分析表