• 沒有找到結果。

第四章 語意三元詞組擷取方法

4.1 語意三元詞組擷取

取得面向事實句集合後,我們會根據每個面向事實句𝑠𝑖的自然語言分析資訊,

對𝑠𝑖取出其中的語意角色標註結果,並將𝑠𝑖中所有的語意腳色標註結果對應到語 意三元詞組,以𝑠𝑖.Triple 表示。一個三元詞組中包括主詞、關聯詞、及描述詞。

語意腳色標註結果對應到語意三元詞組的方法為主詞(A0)對應到主詞、動詞對應 到關聯詞、受詞(A1)對應到描述詞,最後取出所有面向事實句的語意三元詞組。

圖 4.2 語意腳色標註結果

以圖 4.2 為例,「出現」為動詞,對應到關聯詞,A0 是關聯詞「出現」的動 作施行者,在此句子中是「台北市 52 歲的先生」,而 A1 是動詞「出現」的動作 受影響者,在此句子中是「頭痛、發燒等症狀」。取得了 A0、v、A1 語意腳色的 標註後,對應得到語意三元詞組的主詞為「台北市 52 歲的先生」,關聯詞為「出 現」,描述詞為「頭痛、發燒等症狀」。結果如表 4.1 所示。

表 4.1 語意腳色與語意三元詞組對應表

語意腳色標註 語意三元詞組

台北市 52 歲的先生(A0) 主詞

出現(v) 關聯詞

頭痛、發燒等症狀(A1) 描述詞

此外,一個面向事實句的語意腳色標註可能出現 A0 在句子結構的後端,而 A1 出現在句子的前端。本論文假設三元詞組結構不會出現敘述詞出現在主詞前 的倒裝敘述,因此在此情況會對 A0 和 A1 進行對調。如圖 4.3 所示,「台北市內 湖區」(A1)將對應到主詞,「發生」對應到關聯詞,「入夏以來三例登革熱本土病 例」對應到描述詞,其語意三元詞組擷取結果如表 4.2 所示。

圖 4.3 語意腳色標註結構顛倒

表 4.2 語意腳色結構顛倒與語意三元詞組對應表

語意腳色標註 語意三元詞組

台北市內湖區(A1) 主詞

發生(v) 關聯詞

入夏以來三例登革熱本土病例(A0) 描述詞

在單一面向事實句中,若出現連接詞「及」通常是連接尚未描述完的事實,

可能表達一個以上的事實資訊,如圖 4.4 所示。在範例「北市共累計確診 79 例 本土登革熱個案及 62 例境外移入個案」中,發現句子中隱含兩個疫情事實資訊,

分別是「北市共累計確診 79 例本土登革熱個案」「62 例境外移入個案」。因此會 以連接詞「及」將句子切割為兩個部分,第一部分為連接詞前面的部分,透過 LTP 擷取出語意三元詞組,如圖 4.5 與表 4.3 所示。而在連接詞後描述句部分就 對應到描述詞,與句子前段分析出的主詞、關聯詞組合為另一個語意三元詞組,

如表 4.4 所示,因此這個面向事實句會擷取出兩個語意三元詞組。

圖 4.4 多個事實之面向事實句範例

圖 4.5 切割事實句之分析結果

表 4.3 具連接詞事實句第一部分語意三元詞組擷取結果

語意腳色標註 語意三元詞組

北市(A0) 主詞

確診(v) 關聯詞

79 例本土登革熱個案(A1) 描述詞

表 4.4 具連接詞事實句第二部分語意三元詞組擷取結果

語意腳色標註 語意三元詞組

北市(A0) 主詞

確診(v) 關聯詞

62 例境外移入個案(A1) 描述詞

相關文件