• 沒有找到結果。

廣義知網中帶有結構的詞彙之極性分類

第三章 研究方法

第八節 廣義知網中帶有結構的詞彙之極性分類

廣義知網所收納的詞彙,根據概念式(結構)的不同而出現在階層中的某個 位置。以下圖 27 為例:「卓」出現在「great|偉」的類別,概念式同為「great|偉」。

通常結構簡單的詞彙會出現在比較上層的位置;而結構較為複雜的詞彙會出現在 比較下層的位置,像是某些詞彙的細部分類。如:「震天」出現在{震天}類別 中,包含在「great|偉」類別底下,概念式為「great|偉:degree={extreme|極}」;或 是被放到其他無法分類的詞彙(OtherWord 類別)中,如「志在千里」,位於

「OtherWord(great|偉)」,概念式為「great|偉:theme={aspiration|意願}」。

圖 27:類別「great|偉」

結構簡單的詞彙中,一個類別往往包含好多個相同概念的成員;結構較為複 雜的詞彙則常常自成一類。又由於相同類別的詞彙有相同的概念式,因此結構複 雜的詞彙,概念式也常常彼此相異。如圖 27 中的詞彙「勞苦功高」的概念式為

「{great|偉:theme={accomplishment|成績}}」、「誰言寸草心報得三春暉」的概念式 為「{great|偉:theme={emotion({母親|mother})}}」。在前述的擴充過程中,若遇到 結構複雜的詞彙,且廣義知網沒有極性標註,則無法擴充(因為無法透過別人得 到極性)。

雖然詞彙被歸類為 OtherWord,但仍然屬於某個大分類。若大分類有極性;

則小分類也很有可能有極性。如上一段的「志在千里」,應該是屬於正向極性的 詞彙,但廣義知網未標註。此節嘗試為帶有結構(概念式中並非只有單純一個義 原),且廣義知網沒有極性標註的詞彙標註極性。

在前面的擴充階段,本研究以投票的方式為同一個類別的成員分類極性。當

用。詞彙的概念式,主要是由義原和連接詞所構成。每個詞彙均有其概念式,可 能由一到多個義原組成,端看如何定義。我們利用詞彙的概念式,將結構展開。

接著用類別的極性,為結構上的全部節點作標註。

以 含 有 多 個 義 原 的 詞 彙 「 名 利 雙 收 」 為 例 。 概 念 式 為 :「 {obtain| 得 到 :possession={or({famous| 著 名 },{money| 貨 幣 })},manner={simultaneous| 同 步}}」,邊上的 possession 和 manner 可以看成附加的描述。義原(類別)的極性 與結構展開如圖 28 所式。

圖 28:「名利雙收」的結構

這邊採用一個簡單的演算法,如圖 29 所示:觀察節點(上的義原),並以之 前對類別內成員投票找出的極性為其標註。如果結構內的義原在前述過程中沒有 分類極性、或是沒有收錄,則預設為正向,如「名利雙收」內的某一個義原「money|

貨幣」。

//第一步:標註結構中的節點極性。

將概念式中的結構展開,並幫每個節點設定 2 個紀錄的欄位,第一個欄位名稱 為 primary,第二個欄位名稱為 final。

//為展開後的所有節點標註極性。

比較節點上的義原與擴充資料庫中的義原。

若有,則標註極性,將結果記錄於每個節點的欄位 primary 中。

或無,則標註為正向。(若出現非義原節點,如 OR、NOT、PartOf,則 同樣標為正向)將結果記錄於每個節點的欄位 primary 中。

檢查邊上的描述,看有沒有「StateFin」描述。

若有,將「StateFin」描述內的義原極性取出,直接做為整體的極性。

觀察上層節點的欄位 primary 與其下一層所有節點欄位 final。如果任 一個欄位中出現負值,則上層節點的欄位 final 填入負值。

「money|貨幣」、「simultaneous|同步」和 1 個「or」。「obtain|得到」與「famous|

著名」的類別,在先前擴充的過程中顯示正向類別;「money|貨幣」、「simultaneous|

同步」、「or」則無,預設為正向類別。將正向資訊填入每個義原的 primary 欄位。

以義原「or」、「famous|著名」、「money|貨幣」子結構為例:「famous|著名」、「money|

「famous|著名」、「money|貨幣」的 final 欄位,均為正向,因此「or」的 final 欄 位為正向。以此類推,最後「名利雙收」將被標記為正向辭彙。

分析廣義知網的概念式,我們認為越上層的節點越能代表詞彙的主體;而下 層的節點主要用於是修飾、並為上層的義原增添一些描述,使之更貼近原本的概 念。因此本研究的構想是:根據階層的特性,由下層開始,逐步影響上層節點極 性,應該就能體現概念式的意義。

此外方法是著重「負面」概念出現的情況。我們認為一個詞彙若是沒有給人

「負面」的概念,則不能說它是負面的,像大多數名詞就是如此。更貼切的來說:

名詞和某些詞類本身的確不帶有極性,應該增加中性類別。但是如果想正確幫研 究的實驗語料標註極性,就必須給予一個適當的極性。

為了測試標註結構型詞彙的演算法的效能,因此找出「種子詞彙的擴充(同 類別)」、「種子詞彙的擴充(同階層)」、「利用 NTUSD 的擴充」這三節擴充過程 中,滿足以下條件的詞彙做為測試資料。

條件為:

1. 概念式中有「只用一個義原」表示以外的情形。

2. 必須是廣義知網已標註極性的詞彙。

3. 有明確極性的詞彙(不可以是雙極性詞彙)。

首先以前述的演算法試著為詞彙標註極性,接著和廣義知網的答案做比較,

以檢驗正確性。在此說明一下測試資料。經過整理後共找出 1599 個詞彙。包含

種子詞彙本身、或是種子詞彙的擴充詞,並有各種詞性。透過概念式將其展開,

劣勢 負 circumstances={disadvantageous|有弊} 1 1 破門 負 manner={bump|撞:result={separate|分

離},patient={PartOf({thing|萬

物}):telic={or({GoInto|進入},{GoOut|出 去}):LocationThru={~}}}}

6 8

肘掖生變 負 {appear|出現:theme={affairs|事

務:CoEvent={uprise|暴動:domain={politics|

政},location={surrounding({object|物 體})}}}}

5 6

惡作劇 負 {IllTreat|慢待:purpose={tease|取樂}} 2 2 學壞 負 {imitate|模仿:content={behavior({human|

人}):qualification={improper|不當}}}

4 4 遠征 正 {leave|離開:domain={military|

軍},manner={far|遠},purpose={attack|攻 打}}

2 4

從良 正 {cease|停做:content={affairs|事 務:qualification={or({lascivious|

淫},{unlawful|非法})}}}

4 5

糟透了 負 {bad|壞:attitude({speaker|說話者})={sigh|

嘆氣},degree={extreme|極}}

2 3 人人自危 負 {perception|感知:content={dangerous|

危},experiencer={human|人:quantity={all|

3 4