• 沒有找到結果。

種子詞彙的擴充(同階層)

第三章 研究方法

第五節 種子詞彙的擴充(同階層)

經過上一節的擴充後,得到了和種子詞彙同類別的詞彙。廣義知網中的所有 詞彙根據概念式的不同,會被分類到結構中的不同位置。考慮此種分類情形,可 以嘗試在擴充的過程中納入更多詞彙。首先將階層結構展開,同樣以「高明」為 例,「高明」被分類到「wise|智」類別中。「wise|智」的上一層分類是「WisdomValue|

智慧值」,而「WisdomValue|智慧值」中有兩個子類別「wise|智」、「foolish|愚」。

子類別雖然不同、收納的詞彙也不同,但卻和上層父類別的概念或性質有關,因 此才會被分到同一個父類別之下,如圖 17 所示。

圖 17:「wise|智」類別在階層結構中的位置

以此為基礎,首先找到種子詞彙所在的類別。接著向上一層搜尋父類別,接 著往下一層找出全部的子類別。即為原先種子詞彙類別的所有兄弟類別,因為它 們均位於同樣的高度。本研究找出同樣高度類別中的詞彙,且只取一層。以「wise|

智」類別為例,透過上述方法可以增加擴充詞彙的範圍。現在將「foolish|愚」類 別中的所有詞彙如「不智」、「木雕泥塑」、「目光如豆」等,也納入擴充詞彙集中。

不同類別的擴充詞彙同樣使用投票的方式判定分類中的極性,如前一節的作法。

因此「foolish|愚」將被分類到負向擴充詞彙中。至於「wise|智」的下層還有更細 部的類別{技高一籌}、OtherWord(wise|智),將不做擷取。

由於廣義知網中某些類別的名稱前有否定字如:「無」、「不」、「沒」,像是類 別「inconsistent|沒條理」,如圖 18 所示;此外還同時存在著類別「consistent|有條 理」,如圖 19 所示。若一組互為相反概念的某一個類別能分類出極性,且同時存 在無法分類極性的另一個類別,則我們給予無法分類的類別相反的極性。例如圖

得到正向極性。

圖 18:類別「inconsistent|沒條理」

圖 19:類別「consistent|有條理」

過程中,同樣會遇到「擴充過程中產生的雙極性詞彙」問題。在此重新對正 向、負向集合分別統計詞彙出現次數,再以投票的方式決定極性。理由是相較於 同類別的擴充,同階層的擴充收錄的詞彙量更加龐大,很有可能額外收錄了詞 性、用法不同的同一個詞彙。例如詞彙「差」:「差」在同類別的擴充中只收錄了

「unqualified|不合格」一種用法,此時被分類為負面詞彙,如圖 20 所示;但在同 階層的擴充中卻多收錄了負面類別「lack|缺少」,如圖 21、正面類別「dispatch|

差遣」,如圖 22 兩種用法。最後「差」依然為負向詞彙。

圖 20:「差」在同類別「unqualified|不合格」的收錄

圖 21:「差」在同階層中「lack|缺少」的額外收錄

圖 22:「差」在同階層中「dispatch|差遣」的額外收錄

統計的過程中有時也可以解決第四節:種子詞彙的擴充(同類別)雙極性無 法解決的情況,例如詞彙「重」。「重」在同類別的擴充中共收錄兩種不同的用法,

分別是正向類別「strong|強」、負向類別「heavy|重」,如圖 23、圖 24 所示,因此 透過同類別的方式是無法分類極性的;而在同階層的擴充中額外收錄了正向類別

「PayAttention|注意」,如圖 25 所示,因此「重」得以分類為正向詞彙。

圖 23:「重」在同類別「strong|強」的收錄

圖 24:「重」在同類別「heavy|重」的收錄

圖 25:「重」在同階層「PayAttention|注意」的收錄