文獻探討

第二章相關研究探討

第二節文獻探討

第二章相關研究探討

本章將探討與整理本論文參考的相關文獻以及實驗相關任務。

第一節機器閱讀問答系統評估(QA4MRE)任務介紹

機器閱讀問答系統評估(Question Answering for Machine Reading Evaluation, QA4MRE)⁵是由跨語言評估會議(Cross-Language Evaluation Forum, CLEF)⁶所舉辦的一項機器評估測試。CLEF 每年定期在資訊檢索範疇舉辦學術研究會議，並且特別提供各種語言的研究資料來源，進行跨語言的研究，主要經由實驗並制定評估標準以便評量各種議題，並分享全世界參與學術會議者的成果。其中 QA4MRE 是相當熱門的研究項目，其下細分成了許多不同領域討論，每個領域都提供不同語言的測試資料以供實驗，宗旨在於讀取一篇測試文章以便回答測試資料中的問題，另外可以挑選合適的文獻資料庫做為背景知識的來源，而問題回答則是以單選題的方式進行，每個問題包含五個選項，最後再進行實驗成果的評估。

第二節文獻探討

(一) 以詞彙為基礎(phrase-based)的方法

由於網路的蓬勃發展以及 Questions and Answers (Q&A)的流行，以社群為基

5http://nlp.uned.es/clef-qa/

6http://www.clef2013.org/

礎的 Q&A 變得越來越重要，但常常 Q&A 中的文章與查詢的問題雖然概念意義上相同，卻鮮少出現一模一樣的字之情況，學者 Zhou 等人(2011)的論文主要探討此問題，希望以詞彙做為基礎，將問答集中的文章轉換為查詢的問題。以詞彙為基礎的好處在於更能擷取出正確的意義，例如：“stuffy nose”代表感冒流鼻水，然而兩個字分開看卻無法看出其義，當視為詞彙時，就可以輕易的了解“catch a cold”

與“stuffy nose”是具有相近意義的詞彙。

(二) 詞彙特徵排名演算法(LexRank)

LexRank 是一個以圖形為基礎的演算方法(Erkan and Radev,2011)，可將其概念應用在自動摘要上，該作者先對所有文件建造一個圖，圖上的點表示文件中的句子，圖上的邊表示句子和句子之間重複的程度，因此可以利用重複出現的詞彙來計算句子與句子之間的相似性。所以若有一個句子非常重要，則和這個句子相似性接近的句子也會很重要，最後再依照句子的重要程度進行排序就可得到自動摘要之結果。

(三) 柯氏複雜性(Kolmogorov complexity)

一段文字的柯氏複雜性是衡量描述一個對象所需要的訊息量的一個尺度(Li and Vitanyi, 2008)，以下面兩個長度為 64 的字串為例：

abcdabcdabcdabcdabcdabcdabcdabcdabcdabcdabcdabcdabcdabcdabcdabcd 4c1j5b2p0cv4w1y8rx3y37umgw5q95s7traquuxdpaa2q7nieieqe9nac4cvafzf

第一個字串可以用中文簡短的描述為「重複 16 次 abcd」，而第二個字串則

沒有明顯簡短的描述，因此一個字串 s 的柯氏複雜性 K(s)表示這個字串中的最短描述之長度。

(四) 使用資訊距離(information distance)之答案驗證方法

以柯氏複雜性的理論為基礎，Li 等人於 2008 年提出利用資訊距離計算答案是否正確的方法，他們認為問題與正確答案之間的距離應小於問題與其他候選答案之距離，因此提出利用資訊距離的方法來計算問題和答案之間的相似程度，如以下公式(1)所示：

𝑑

_𝑚𝑖𝑛

(𝑥, 𝑦|𝑐) =

log 𝑓(𝑐(𝑥,𝑦))−min{log 𝑓(𝑐(𝑥,∅)),log 𝑓(𝑐(∅,𝑦))}

max{log 𝑓(𝑐(𝑥,∅)),log 𝑓(𝑐(∅,𝑦))}−log 𝑓(𝑐(∅,∅))

(1)

其中 x 表示候選答案(Candidate)，y 表示問題重點(Question Focus)，c 表示條 件樣式(Condition Pattern)。例如問題為「What city is Lake Washington by?」，則 x 表示Seattle, Bellevue, Kirkland…等等(在條件樣式中以<c>標示 x 的樣式)，y 表示 Lake Washington (在條件樣式中以<f>標示 y 的樣式)，c 表示“<c> is by <f>” (例如：

Seattle is by Lake Washington)、“<c>”“is by <f>” (例如：Seattle is a city which is by Lake Washington)...等等。

假設 Condition Pattern 為“<c> is by <f>”，Question Focus 為 Lake Washington，

Candidate 為 Seattle，則𝑓(𝑐(𝑥, ∅))表示“Seattle is by”於 Google 或 Yahoo 搜索引擎中檢索符合的頁面，𝑓(𝑐(∅, 𝑦))表示“is by Lake Washington”於搜索引擎中檢索符合的頁面，𝑓(𝑐(𝑥, 𝑦))表示“Seattle is by Lake Washington”於搜索引擎中檢索符合的頁面，以及𝑓(𝑐(∅, ∅))表示所有在搜索引擎中檢索到的頁面。

(五) 詞語擴充(query expansion)

詞語擴充指的是使用者增加額外的 query words 或 phrases 到初始查詢上做為 輸入，重新計算 query term 對應的權重值(Manning et al., 2008)。例如，一些搜索 引擎會在使用者的 query 結果中，建議一些相關的 queries，讓使用者可以選擇其中一個作為代替，使查詢結果能更符合使用者的期望，如圖 2-1 所示：

圖 2-1 詞語擴充範例(Yahoo 搜尋引擎)

在詞語擴充技術中，最普遍的方法為 Global Analysis，在 Global Analysis 中基本的想法是利用 term 在全部資料中的出現與關聯來做統計計算，如對於每個在 query 中的 term t，query 可以自動的擴充一些同義字或與 t 相關的字等。

(六) QA4MRE 之相關文獻介紹

近年來有許多問答系統相關研究者參加上述 QA4MRE 任務，相關研究技術

包括答案驗證方法(Pakray et al., 2011)、資訊檢索方法(Bhattacharya and Toldo, 2012)以及以答案驗證方法為基礎之生醫相關問答系統之研究(蔡秉翰, 2013)等等，

分別簡介如下：

1. 答案驗證(answer validation)方法

在 Bhaskar 等人(2012)及 Pakray 等人(2011)參加 QA4MRE 的任務中，作者以答案驗證的方式進行實驗。答案驗證是將問題與該問題對應的選項預先結合產生出假設，例如有一個問題為：

Where is the U.S. nuclear waste repository located?

(a) at Oklo (b) in Morsleben (c) in New Mexico

(d) in a suitable geological formation (e) in Nevada

Pakray 將其處理成以下五個假設：

H_1:the U.S. nuclear waste repository located at Oklo H_2:the U.S. nuclear waste repository located in Morsleben H_3:the U.S. nuclear waste repository located in New Mexico

H_4:the U.S. nuclear waste repository located in a suitable geological formation H_5:the U.S. nuclear waste repository located in Nevada

接著使用問題與答案中的字擷取文章中相關的句子，因此就可以產生出許多對相關句子與假設的配對，對於每個配對給予評分，最後加總每個假設所得到的分數，最高分者即為該問題的答案。

2. 資訊檢索(information retrieval)方法

在 Bhattacharya 和 Toldo (2012)參加 QA4MRE 的任務中，作者發展許多種資訊檢索的策略運用於該任務，如下所述：

(1) 將前處理過的問題使用 Indri's default language model (Strohman et al., 2005)於測試文章中檢索出候選的句子，並只取出前五句相關的句子，接著將前處理過的答案選項使用 Indri's default language model 於此五個句子中做檢索，檢索次數最多者即為正確答案。

(2) 將策略(1)中之 Indri's default language model 改為 tfidf retrieval model，其餘策略相同。

(3) 將策略(1)中只取出前五句相關的句子改為無限制句子數量，以及於答案檢索階段改為使用 tfidf retrieval model 做檢索，其餘策略相同。

(4) 將策略(3)中選擇答案的方式改為使用 tfidf 檢索分數最高者為正確答案，

其餘策略相同。

(5) 將策略(2)中選擇答案的方式改為使用 tfidf 檢索分數最高者為正確答案，

其餘策略相同。

(6) 將問題與該問題對應的選項預先結合產生出假設，因此每個問題會產生 5 個假設用於檢索策略中，並且限制只取出檢索分數最高的句子，而此句所對應的假設即為正確答案。

(7) 結合策略(1)至(5)，使用多數決的投票方式來決定正確答案為何，因此策略(1)至(5)的輸出答案中出現最多次者為此策略之答案。

3. 以答案驗證方法為基礎之生醫相關問答系統

在蔡秉翰等人(Hou and Tsai, 2014)參加 QA4MRE 的任務中，作者發展兩個研究方法之生醫相關問答系統，分別為研究方法一及研究方法二之問答系統，簡介如下：

(1) 研究方法一之問答系統

首先從 QA4MRE 的測試資料中區分出測試文章 (documents)、問題 (questions)和答案選項(answers)。此研究方法大致分為五個步驟，分別為 (一)前處理、(二) Query word 相關語句擷取、(三) Query word 權重給予、

(四)相關語句權重給予、(五)答案選擇方法，此外還加入了詞語擴充方法 (query expansion)，利用背景知識庫針對每個測試問題加入對應的擴充詞語。

(2) 研究方法二之問答系統

首先從 QA4MRE 的測試資料中區分出測試文章 (documents)、問題 (questions)和答案選項(answers)。此研究方法大致分為五個步驟，分別為 ( 一 ) 前處理、 ( 二 ) Hypothesis words/phrases 產生、 ( 三 ) Hypothesis words/phrases 權重給予、(四)相關語句權重給予、(五)Hypothesis 配分與答案選擇方法，此外還加入了詞語擴充方法，利用背景知識庫針對每個測試問題加入對應的擴充詞語。

在文檔中應用摘要系統與資訊距離方法於生醫問答系統之研究 (頁 15-22)

第二章 相關研究探討

第二節 文獻探討

第二章 相關研究探討

𝑑

(𝑥, 𝑦|𝑐) =

第二章相關研究探討

第二節文獻探討

第二章相關研究探討