• 沒有找到結果。

三元詞組資訊補足

第五章 面向詞與描述詞擷取方法

5.2 三元詞組資訊補足

由於角色標註組合可能會因為資訊分析不完整,導致三元詞組有部分資訊缺 少情形,像是缺少面向詞或是缺少描述詞,因此以下將分別介紹補足面向詞或描

31

述詞的處理方法。

5.2.1

由圖 17 範例得知動詞「推出」沒有找出相對應的主詞(A0),因此本方法會 以相依性分析結果來嘗試補足資訊。而在3-1 節前處理部分有介紹到”SBV”有向 線關係,可以用來描述面向詞和關聯詞之間的關係,因此本方法藉由”SBV”有向 線關係擷取出面向詞(A0)。

<1>以”SBV”有向線方法補足面向詞

首先取得重要事實句s 的相依性分析結果,並對 s.Triple 中的關聯詞取出關 聯線,若關聯線中包含”SBV”型態線,則將線段另一端字詞當成 s.Triple 中的面 向詞。

以圖18 範例所示,關聯詞「关押」缺少面向詞,而關聯詞「关押」有 4 種 關聯線段,其中有一線段為”SBV”指向另一端「区域」字詞,並將字詞「区域」

當成s.Triple 之面向詞。

圖 18 相依性分析結果範例

32

<2>以”COO”有向線關係補足面向詞

若三元詞組中缺少面向詞,以方法<1>也無法補足的話,會繼續嘗試使用方 法<2>進行補足。

在中文語句結構中,經常會以省略主詞方式描述資訊,讓句子更為通順。

以下圖19 範例所示,「脸书(Facebook)不来高铁彰化站特定区投资兴设资 料处理中心」句子s 中的關聯詞「投資」在句子中以角色標註方式找不到其主詞。

在此範例中,本方法以關聯詞「投資」的有向關聯線段”COO”找到線段另一端關 聯詞「來」,並將「來」字詞所屬句子做三元詞組擷取和資訊補足方法,以「來」

所找出的主詞「臉書」當成「投資」的面向詞。

圖 19 相依性分析結果範例

本方法會以關聯詞w 的相依性”COO”線,往前文找到線的另一端動詞 w’,

並對 w’所屬句子進行三元詞組擷取和資訊補足方法,若 w’有擷取出其面向詞,

則將w’的主詞當成 w 的面向詞,若線段另一端的關聯詞也沒有面向詞,則遞迴 第<2>步驟,直到補足 w 的面向詞或不再有”COO”有向線。考慮到中文語句面向 詞經常是在關聯詞前,本方法只考慮往前文指向”COO”線段。COO 線段是代表

33

「並列關係」,句子 s 中關聯詞「來」和「投資」皆屬於同一面向者所施行之動 作,因此兩者關聯詞屬於等同地位,故有”COO”線段連接兩者,因此利用此一特

性即可將另一關聯詞的面向詞,當成自身關聯詞的面向詞。

5.2.2

本方法和5.2.1 節採用的補足方法概念相同,利用相依性分析中的”VOB”有 向線補足三元詞組中缺少的描述詞。VOB 線段是用來描述關聯詞與描述詞之間 關係,因此本方法藉由s.Triple 中的關聯詞之”VOB”線段擷取出描述詞(A1)。

以圖20 範例所示,關聯詞「安排」在句子中沒有相對應的描述詞,因此,

本方法透過「安排」字詞的”VOB”關聯線段,找出其相對應的描述詞。在此範例 中,”VOB”線段由「安排」指向「欢送」一詞,故「安排」的描述詞為「欢送」。

圖 20 相依性分析結果範例

5.2.3

從事實句中擷取出的三元詞組集合,有些集合會有資訊重複問題。本方 法以檢查若三元詞組中字詞 w 全部出現在其他詞組的字詞中,則此三元詞組會

34

被過濾掉

以圖21 範例所示,句子中共有三組三元詞組,第一組關聯詞為「造成」,描 述詞為「6 人死亡、12 人受伤」;第二組關聯詞為「死亡」,描述詞為「6 人」;

第三組關聯詞為「受伤」,面向詞為「12 人」,從結果可以看出,第二、三組三 元詞組字詞全部出現在第一組三元詞組中,因此在此範例中,第二、三組詞組會 被過濾掉,只留下第一組。

另外,如果三元詞組中除了關聯詞有值,面向詞和描述詞都為空值,則此三 元詞組會被過濾掉。

圖 21 語意角色標註結果範例

35

相關文件