評估方法 - 相關文獻及相關方法 - 基於語境特徵及分群模型之中文多義詞消歧

第二章相關文獻及相關方法

2.3 評估方法

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

4. Spectral clustering

Spectral clustering 演變歷史悠久，首先 Donath 等人提出使用特徵向量 (eigenvectors)將圖(graph)進行分割；而 Fiedle 指出將圖進行雙分(bi-partitions)與拉普拉斯圖(graph Laplacian)第二個特徵向量概念相近，因此 Fiedler 建議透過此特徵向量將圖進行分割。而在機器學習(machine learning) 領域中， Spectral clustering 透過 Shi、Ng…等的研究後逐漸變得熱門。

2.3 評估方法

在研究中透過 purity 評估不同分群數目、embedding 架構、embedding 模型及相關句維度、窗口大小的下分群結果。並利用最優之分群結果，作為擷取目標詞彙代表句之依據。同時，透過人工標記計算擷取代表句之 precision、recall、F1 以及accuracy。以下分別說明，purity、precision、recall、F1 及 accuracy 之計算方式。

I. Purity

Purity 用以表示群集之純度，其值界於[0, 1]，當一個不好的分群，亦即每個群集中，資料點實際的類別彼此不相同，則purity 低；反之，當一個好的分群，亦即每個群集中，資料點實際的類別彼此相同，則purity 高。Purity 計算方式如(5)，

其中有

N 個資料點，     

,

, , 



代表

k 個群， C   c c

,

, , c



代表

j

個類別。

II. 二分類混淆矩陣

系統擷取代表句，根據人工標記其結果共可劃分為四種：

a. True Positive(TP)：將正類預測為正類個數。

b. False Positive(FP)：將負類預測為正類個數。

 ^,  ¹

k j

purity C Max c

N 

   

⁽⁵⁾

‧

d. True Negative(TN)：將負類預測為負類個數。

表1 二分類混淆矩陣

在研究中，透過系統擷取代表句，並根據人工所標記之結果所得到之混淆矩陣，作為衡量系統擷取代表句之準確度依據。

III. Recall

Recall 為擷取代表句之召回率。系統預測的類別，佔該所有類別之比例。計算方式如(6)，為擷取代表句之 True Positive 總量除以 True Positive 以及 False Negative 數量之和。

IV. Precision

Precision 為擷取代表句之精確率。即擷取出的代表句中，系統預測類別的精確率。

計算的方式如(7)，為擷取代表句之 True Positive 總量除以 True Positive 以及 False Positive 數量之和。

V. Accuracy

Accuracy 為擷取代表句之精確率，即擷取所有代表句正確的比例。計算的方式如 (8)，為擷取代表句之 True Positive 總量以及 True Negative 除以 True Positive、

False Positive、False Negative、True Negative 數量之和。

實際

正類負類

預測

正類 True Positive False Positive 負類 False Negative True Negative

recall TP

‧

VI. F-measure

由於當擷取代表句的數目提高時，recall 會有較大的機會提高， precision 則會有相對降低，反之，擷取代表句的數目降低時precision 可能會提高，但是 recall 可能會將低。因此透過 F-measure 則是用以衡量 recall 以及 precision 的平衡水準，計算方式如(9)。其中當

  1

時為F1。在評估擷取代表句時，會有多個類別必須同時一起考量，為考量各類別數目不一致。而有macro average、micro average 及 weighted average 計算方式。其中假設有 𝑛 個類別，macro recall、macro precision、macro average 計算方式如(10)、(11)、

(12)。micro recall、micro precision、micro average 計算方式如(13)、(14)、(15)。

weighted recall、weighted precision、weighted average 計算方式如(16)、(17)、(18)，

其中

c

_i為類別

i 之項目個數。

Macro average 2

Macro recall Macro precision Macro recall Macro precision

  



(12)

Micro precision ¹

1 1

Micro recall ¹

1 1

Micro average 2

Micro recall Micro precision Micro recall Micro precision

  



(15)

Weighted precision ¹

‧

VII. Silhouette Coefficient

一個好的分群模型須具備二特點：第一點為群集內的相似性高；第二點為群集間的相似性低，而輪廓係數(silhouette coefficient)是由 Rousseeuw[27]提出，其中無須人工標記之答案，透過計算群集中群集間距離與群集內距離的相對大小，

Weighted recall ¹

Weighted average 2

Weighted recall Weighted precision Weighted recall Weighted precision

  

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章研究方法

在文檔中基於語境特徵及分群模型之中文多義詞消歧 - 政大學術集成 (頁 25-29)

評估方法

第二章 相關文獻及相關方法

2.3 評估方法

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

2.3 評估方法

N 個資料點，     

,

, , 



k 個群， C   c c

,

, , c



j

 ,  1

purity C Max c

N 

   

‧

recall TP

‧

  1

c

i 之項目個數。

Macro recall Macro precision Macro recall Macro precision

  



Micro recall Micro precision Micro recall Micro precision

  



‧

Weighted recall Weighted precision Weighted recall Weighted precision

  

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章 研究方法

第二章相關文獻及相關方法

立政治大學

 ^,  ¹

立政治大學

第三章研究方法