• 沒有找到結果。

第一章 簡介

第一節 研究動機

阿茲海默症1(

Alzheimer's disease, AD

),俗稱老年癡呆症,會使得病患漸漸忘 卻過去中熟悉的記憶,變得如同兒童般的笨拙。隨著現代人的壽命越來越長以及 人口老化快速成長,人們對於身心的健康越來越重視,美國已有超過 500 萬人患 有阿茲海默症且 65 歲以上的美國人口的比例不斷增加,患阿茲海默症的美國人 數將每年增長,阿茲海默症會隨時間而惡化,最終會導致死亡。受影響的不僅僅 是阿茲海默症患者,他們的照護者也會受到影響。阿茲海默症已被認為是一種對 於社會大眾造成主要健康問題的疾病,也成為近年來各個國家都非常重視的研究 議題。近年來,許多國家政府持續的投入心力、資金於阿茲海默症病患的照顧以 及該症狀的相關研究,很多領域也從不同的層面探討這個議題,而資訊領域憑藉 其電腦對於巨量資訊的快速運算及龐大儲存空間的能力,對此議題進行各項整合 與分析,如疾病與基因的關聯度、生物文章摘要等。

問答系統(Question Answering, QA)是機器與人類語言中最直接的關係,讓人類能 夠用最簡單的方式取得想要的資訊,也是在自然語言處理中非常熱門的技術。因此,

本研究利用問答系統之技術,應用於阿茲海默症的領域中,使阿茲海默症的相關使 用者(如醫生、病人)因此而受益,能夠使用簡單的方式來了解與阿茲海默症相關的資 訊。

1 http://www.alz.org/asian/about/what_is_alzheimers.asp?nL=ZH&dL=ZH

2

第二節 研究背景

(一) 問答系統(Question Answering, QA)

近年來搜索引擎為大眾所習慣使用的查詢方式,如 Google 搜索引擎2、Yahoo

奇摩搜索引擎3等等,但這種查詢方式會產生大量的回傳資料,使用者必須自行找

出有興趣或是正確的資料,對於某些使用者來說反而不利於使用,例如老人、幼 兒、不懂或不熟悉電腦操作的人,因此問答系統以自然語言的方式進行問題輸入,

並以較簡潔的答案回答,較合適這些使用者。

問答系統的提問方式是一種口語化的問句,也就是自然語言型態的問句,使 用者不必思考需要以什麼樣的特定格式發問才能得到最好的回答,例如輸入「請 問誰是台灣總統?」做為問句,而問答系統分析問句後能夠直接回答「XXX 是台 灣總統」,因此使用者不必一一的檢視搜索引擎回傳的網頁,更不必在資訊量龐 大的網頁中尋找自己需要的答案。

目前也有搜尋引擎結合問答系統讓搜尋結果更明確,例如 Ask Jeeves4就能夠 以口語方式提問,得到直接答案與相關搜尋並列的結果。現今許多智慧型手機中 也同時內建智慧型語音問答系統,如蘋果公司 iPhone 手機中著名的 Siri 助手,使 用者只需要以口語化的方式下達指令,就能夠自動傳遞訊息、撥打電話等,不僅 帶給一般使用者更多的方便性,對於相關殘障人士更能利於他們操作手機。2011 年,IBM 的華森(Watson)系統更挑戰了綜藝問答節目「危險邊緣」(Jeopardy) (Wren, 2011),這是有史以來綜藝問答節目中機器與人類的對決,而華森也在最後一集中

2http://www.google.com

3http://tw.yahoo.com

4http://www.ask.com

3

打敗了其他衛冕者,呈現其優秀的知識處理能力。由此可見,問答系統是現今蓬 勃發展且被高度關注的技術。

(二) 摘要系統(Summarization System)

摘要系統是產生一個言簡意賅的文件描述之應用科技,雖然它的內容相較於 文件本身明顯較短,但卻能夠讓人一目瞭然。在生醫領域中,閱讀生醫文獻已經 被證明對於健康專家(如醫生)和消費者(如病人)是有益的,然而,大量的文獻會不 利於獲取正確資訊的方便性,而摘要系統可以協助管理這些大量的資訊,讓人們 花費更短的時間得到有用的資訊。除此之外,研究學者也可以利用摘要系統更快 速的決定文章是否為他們所感興趣的,而不必去閱讀整篇文件;醫生可以使用摘 要來辨別治療的方案、縮短診斷的時間。由此可見,摘要系統不但能減少使用者 閱讀文章的時間,也能夠提高使用者在閱讀文章上理解的能力。

摘要系統產出的摘要類型,可以是經過自然語言處理 (Natural Language Processing)所產出的重述文字,也可以是原始文件的摘錄內容。前者便是所謂的 概述摘要(abstract),而後者則直接從原始文件中節錄出足以代表該文件的語句與 段落片段(extract)。

第三節 研究目的

近年來有許多問答系統相關研究,相關研究技術包括答案驗證方法(Pakray et al., 2011)、資訊檢索方法(Bhattacharya and Toldo, 2012)、指代語的決定方法 (Bhaskar et al., 2012; Pakray et al., 2011),以及語彙鍊方法(Cao et al., 2011)等,而

4

在蔡秉翰(2013)的研究中則利用答案驗證方法及詞語擴充方法(Qiu and Frei, 1993) 應用於阿茲海默症相關問答系統中。

在本研究中,每個關於阿茲海默症的測試資料集都包含一篇測試文章,及 10 個關於該文章的測試問題,而每個問題包含 5 個答案選項。實驗內容為藉由讀取 一篇測試文章來回答測試資料中的問題,另外可以挑選適合的文獻資料庫做為背 景知識的來源,而問題回答是以單選題的方式進行,每個問題都只有一個正確答

在本論文中,針對阿茲海默症領域進行將摘要系統特性以及資訊距離方法利

用在問答系統技術的研究探討,希望能藉由機器的能力及現有的相關文獻與背景 知識庫選出此類問題的正確答案。

第四節 論文組織

本論文的組織架構如下,第一章為簡介,說明研究動機、背景與目的;第二 章為相關研究的探討,介紹該領域相關的文獻;第三章則是提出本次研究的兩個 主要架構,並詳細說明所提出的研究方法;第四章為實驗過程與實驗結果;第五 章將會說明本論文的結論以及未來的發展方向。

5

相關文件