實驗分析

第五章實驗結果與分析

5.2 實驗分析

1 Membership

Degree

MCW_High MCW_Medium

MCW_Low

0 Mapped

Weight

m

MCW1

m

MCW²⁻

α

MCW²

m

MCW1⁺

β

MCW1

m

MCW2

m

MCW³⁻

α

MCW³

m

MCW2⁺

β

MCW2

m

MCW3

圖 5-1 新聞文件與 Ontology 對應後之 MCW 的模糊集合

2. MSRPL 模糊數參數值，如表 5-2，圖 5-2 所示

表 5-2 模糊變數 MSRPL 的模糊數參數值

m α β

MSRPL_High

8 4 0

MSRPL _Medium

3 2 2

MSRPL _Low

0 0 2

1 Membership

Degree

MSRPL_High MSRPL_Medium

MSRPL_Low

0 Mapped

Length

m

MSRPL1

m

MSRPL2⁻

α

MSRPL2

m

MSRPL1⁺

β

MSRPL1

m

MSRPL2

m

MSRPL3⁻

α

MSRPL3

m

MSRPL2⁺

β

MSRPL2

m

MSRPL3

圖 5-2 新聞文件與 Ontology 對應後之 MSRPL 的模糊集合

2. MSRPW 模糊數參數值，如表 5-3，圖 5-3 所示

表 5-3 模糊變數 MSRPW 的模糊數參數值

m α β

MSRPW_High

2 0.6 0

MSRPW_Medium

1 0.7 0.7

MSRPW_Low

0 0 0.6

1 Membership

Degree

MSRPW_High MSRPW_Medium

MSRPW_Low

0 Mapped

Length Weight

m

MSRPW1

m

MSRPW²⁻

α

MSRPW²

m

MSRPW1⁺

β

MSRPW1

m

MSRPW2

m

MSRPW³⁻

α

MSRPW³

m

MSRPW2⁺

β

MSRPW2

m

MSRPW3

圖 5-3 新聞文件與 Ontology 對應後之 MSRPW 的模糊集合

5.2.2 實驗結果與分析

在實驗結果與分析部份，我們採取分析精確率(Precision)與召回率(Recall)的方式，同時為了可能產生高精確、低召回或是高召回、低精確的情形，我們也計算 F-Measure 來評估與其它分類方式效果上的差異，首先我們將分類完成的文件分為 4 部份(如表 2-1)[24]，而我們計算的精確率與召回率分別為：

b a call a

= +

Re (5-1)

c a ecision a

= +

Pr (5-2)

ecision call

ecision F call

Pr Re

* Re

* 2

= + (5-3)

實驗中，我們除了採用本論文所提之語意關係路徑(SRP)方法，另外也分析另一種由 Lee 提出的基於 Ontology 架構的模糊分類方式[30]。在分類的結果中可以發現，本論文提出的分類方式普遍會有較佳的分類效果。另外在氣象與運動類別的分類上有較好的召回率與精確率，在社會新聞上的分類結果較其它類別為低，分析的結果大致是由於社會新聞常容易與其它新聞重疊，例如地方建設、地方教育、樂透彩新聞、或是地方環保新聞等，都比較容易被錯誤判定為政治或財經等類別，未來應該可以針對社會領域 Ontology 做更詳細的建構與描述，以加強社會新聞類別的分類效果。

4000筆訓練資料

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

SRP正確率 Lee正確率

圖 5-4(a) 4000 訓練資料的正確率

1000筆測試資料

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

SRP正確率 Lee正確率

圖 5-4(b) 1000 訓練資料的正確率

政治(Training)

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

Recall Precision F-measure

圖 5-5(a) 800 筆政治新聞分類效果

社會(Training)

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

Recall Precision F-measure

圖 5-5(b) 800 筆社會新聞分類效果

氣象(Training)

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

Recall Precision F-measure

圖 5-5(c) 800 筆氣象新聞分類效果

運動(Training)

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

Recall Precision F-measure

圖 5-5(d) 800 筆運動新聞分類效果

財經(Training)

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

Recall Precision F-measure

圖 5-5(e) 800 筆財經新聞分類效果

政治(Testing)

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

Recall Precision F-measure

圖 5-6(a) 200 筆政治新聞分類效果

社會(Testing)

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

Recall Precision F-measure

圖 5-6(b) 200 筆社會新聞分類效果

氣象(Testing)

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

Recall Precision F-measure

圖 5-6(c) 200 筆氣象新聞分類效果

運動(Testing)

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

Recall Precision F-measure

圖 5-6(d) 200 筆運動新聞分類效果

財經(Testing)

50%

60%

70%

80%

90%

100%

第一次第二次第三次第四次第五次

Recall Precision F-measure

圖 5-6(e) 200 筆財經新聞分類效果

第六章結論與未來研究方向

在文檔中基於 Ontology 架構之文件分類網路服務研究與建構 (頁 54-63)

第五章 實驗結果與分析

5.2 實驗分析

m

m

α

m

β

m

m

α

m

β

m

2. MSRPL 模糊數參數值，如表 5-2，圖 5-2 所示

m α β

MSRPL_High

MSRPL _Medium

MSRPL _Low

m

m

α

m

β

m

m

α

m

β

m

2. MSRPW 模糊數參數值，如表 5-3，圖 5-3 所示

m α β

MSRPW_High

MSRPW_Medium

MSRPW_Low

m

m

α

m

β

m

m

α

m

β

m

5.2.2 實驗結果與分析

b a call a

c a ecision a

ecision call

ecision F call

4000筆訓練資料

50%

60%

70%

80%

90%

100%

第一次 第二次 第三次 第四次 第五次

SRP正確率 Lee正確率

1000筆測試資料

50%

60%

70%

80%

90%

100%

第一次 第二次 第三次 第四次 第五次

SRP正確率 Lee正確率

政治(Training)

50%

60%

70%

80%

90%

100%

第一次 第二次 第三次 第四次 第五次

Recall Precision F-measure

社會(Training)

50%

第五章實驗結果與分析

第一次第二次第三次第四次第五次

第一次第二次第三次第四次第五次

第一次第二次第三次第四次第五次

第一次第二次第三次第四次第五次

第一次第二次第三次第四次第五次

第一次第二次第三次第四次第五次

第一次第二次第三次第四次第五次

第一次第二次第三次第四次第五次

第一次第二次第三次第四次第五次

第一次第二次第三次第四次第五次

第一次第二次第三次第四次第五次