第四章 語意三元詞組擷取方法
4.2 語意三元詞組資訊補足
在語意腳色標註結果中可能出現缺少主詞或描述詞的情況,本小節將分 別介紹補足主詞以及關聯詞的處理方法。此外,本論文認為在流行疾病新聞中,
疫情面向與症狀面向事實句的時間與地點資訊相當重要。因此,下面將提出擷取 時間與地點補充資訊的處理方法。
4.2.1 主詞補足方法
如圖 4.6 例句所示,「今年 7 月 6 日又開始發燒、咳嗽等」為一症狀面向事 實句,該句透過語言平台分析可擷取出語意三元詞組的關聯詞「開始」及描述詞
「發燒、咳嗽等」,但未找出主詞,如表 4.5 所示。本論文認為主詞中至少要出 現一個名詞才具有意義,因此透過語意分析找出的 SBV 與 COO 關係來補足主詞。
SBV 是一種透過關聯詞找到主詞的語意相依性關係,COO 是一種透過關聯詞找到 同等地位關聯詞的語意相依性關係。以關聯詞「開始」為始,尋找與該關聯詞有 SBV 關係的詞當作主詞,若該關聯詞沒有 SBV 關係,則以跟該關聯詞有 COO 關係 先找到相等地位的動詞「感染」,再從「感染」透過 SBV 關係找到「女性」作為 該事實句的主詞,結果如表 4.6 所示。
圖 4.6 缺少主詞之範例
表 4.5 主詞缺少之語意三元詞組擷取範例
語意腳色標註 語意三元詞組
主詞
開始(v) 關聯詞
發燒、咳嗽等(A1) 描述詞
表 4.6 主詞補足之語意三元詞組擷取範例
語意腳色標註 語意三元詞組
女性 主詞
開始(v) 關聯詞
發燒、咳嗽等(A1) 描述詞
4.2.2 描述詞補足方法
如圖 4.7 所示,「登革熱出現 6 死」為一疫情面向事實句,該句透過語言平 台分析結果擷取出語意三元詞組的主詞「登革熱」及關聯詞「出現」,但未找出 描述詞,如表 4.7 所示。透過語意分析之有線關係 VOB 填補描述詞,因此範例句
中以關聯詞「出現」為始,透過 VOB 關係,找到該關係涵蓋了「6 死」這個詞,
填補為描述詞,結果如表 4.8 所示。
圖 4.7 缺少描述詞之範例
表 4.7 描述詞缺少之語意三元詞組擷取範例
語意腳色標註 語意三元詞組
登革熱(A0) 主詞
出現(v) 關聯詞
描述詞
表 4.8 描述詞補足之語意三元詞組擷取範例
語意腳色標註 語意三元詞組
登革熱(A0) 主詞
出現(v) 關聯詞
6 死(A1) 描述詞
4.2.3 時間與地點資訊補足方法
透過語意腳色標註,可以知道句子中詞組所代表的腳色,像是時間、地點的 資訊,如圖 4.8 所示。在「台北市 52 歲的先生在 11 月 19 日出現頭痛、發燒等 症狀」語意腳色標註中,擷取出地名「台北市」與 TMP「在 11 月 19 日」為事實
補充地點及時間資訊,結果如表 4.9 所示。
圖 4.8 時間地名資訊之填補範例
表 4.9 時間、地點補足之語意三元詞組擷取範例
語意腳色標註 語意三元詞組
台北市(地名) 地點
在 11 月 19 日(TMP) 時間
台北市 52 歲的先生(A0) 主詞
出現(v) 關聯詞
頭痛、發燒等症狀(A1) 描述詞