• 沒有找到結果。

國立臺灣師範大學圖書館參考諮詢機器人建置與評估

N/A
N/A
Protected

Academic year: 2021

Share "國立臺灣師範大學圖書館參考諮詢機器人建置與評估"

Copied!
122
0
0

加載中.... (立即查看全文)

全文

(1)國立臺灣師範大學圖書資訊學研究所 碩士學位論文. 指導教授:柯 皓 仁 博士. 國立臺灣師範大學圖書館參考諮詢機器人建置 與評估 Development and Evaluation of a Chatbot for Reference Service in National Taiwan Normal University Library. 研究生:陳 宜 琳 撰. 中 華 民 國 一 ○ 八 年 八 月.

(2) 謝辭 在大學即將畢業面臨人生一大抉擇時,我來到臺師大圖資所,回顧在研究所 兩年,不確定研究方向的不安,ALIRG 日本九州大學研討會第一次在國外用英 語的報告,系統掛點的無奈,文章寫不出來的崩潰,歷歷在目,而眼下我已完成 論文,即將畢業。 感謝指導老師柯皓仁教授用心的指導與幫助,給予我很大研究自主空間,在 繁忙時仍抽出時間批閱論文,也因為老師才會有這麼溫馨的柯柯家族。感謝家人 的支持與鼓勵,讓我無後顧之憂地讀書,尤其是當我程式除錯不了時弟弟的即時 救援。謝謝懷綸的推薦讓我下定決心選擇臺師大與指導老師,也謝謝在我有疑慮 的給予很多建議與加油。謝謝柯柯家的順宏學長、佳君學姊、詩萱學姊、軒廷學 弟、怡臻在我研究迷茫時給予的幫助,還有感謝有一群小夥伴們—詠涵、怡靖、 芷瑄、盈甄—的陪伴與激勵,如果沒有你們我大概無法準時兩年畢業。謝謝元顯 老師熱心的技術指導,苑菁助教在行政上的幫忙,還有姿姐、雯涵學姊在我研究 上的協助。 到臺師大念研究所是我的幸運,幫助我的人太多感謝不完,深深覺得我是個 幸福的人,感謝一路上大家的幫助與陪伴,我們後會有期!. 陳宜琳 謹致於臺師大圖資所 中華民國 108 年 8 月. i.

(3) 摘要 通訊軟體盛行,再加上自然語言處理的進步,人工智慧的應用又以聊天機器 人更為備受關注。有圖書館將聊天機器人導入,以提供新式的即時數位參考服務, 解決人工即時參考服務的問題。本研究目的在於建置國立臺灣師範大學(簡稱臺 師大)圖書館參考諮詢機器人並調查其使用評價。 本研究建置之參考諮詢機器人採用臺師大圖書館參考問答紀錄與常問問答 集作為問答語料,LINE Bot 作為開發平台,以 Python 程式語言編寫程式,並使 用 Jieba 進行中文斷詞、提取關鍵字,運用 Dice 係數計算問題與關鍵字相似度比 對,Beautiful Soup 協助擷取臺師大圖書館網站與館藏系統資訊,達成擁有館藏 查詢、開館查詢與問答語料庫回覆三大功能之參考諮詢機器人。 使用評估測試方面,請十名臺師大學生執行以問答語料中歸納之五個分類加 上館藏與開館查詢功能,設計而成的七項任務,依據機器人之回覆給予五分量表 滿意度。結果顯示,整體而言受測者對於參考諮詢機器人之回覆感到滿意,提問 之回覆正確率為 70%,系統中的回覆正確率則為 82.86%,滿意度較高的任務回 覆,其正確率也較高,唯獨任務五—針對「資源查詢指引」類別進行提問—滿意 度是七項任務中最低的,但其系統中回覆正確率卻有 90.00%。 未來研究可以擴增問答語料庫問答紀錄、增進問題比對的精確度、改進答案 呈現方式,以更加完善參考諮詢機器人之功能並解決任務五滿意度偏低之問題。. 關鍵詞:數位參考服務、聊天機器人、參考諮詢機器人、問答系統. ii.

(4) Abstract Communication software is prevalent, and with the advancement of natural language processing, chatbots are a popular application of artificial intelligence. Some libraries have developed chatbots to provide a new type of real-time digital reference service to solve the problem of manual instant reference service. The purpose of this study is to develop a reference chatbot for National Taiwan Normal University Library (NTNU Library) and evaluate its performance from aspects of users. The reference chatbot developed in this study uses the reference question and answer set of NTNU Library and the FAQs as a question and answer corpus. The development platform is Line Bot, the programming language is Python, and the tool for performing Chinese word segmentation and keyword extraction is Jieba. Dice coefficient is used for the calculation of the similarity between a problem and keywords, and Beautiful Soup assists in crawling the inforsmation of the library website and OPAC of NTNU. The reference chatbot developed in this study comprises three functions: inquiry about library collection, inquiry about library opening hours and inquiry about Q&A corpus . In terms of the evaluation test, ten NTNU’s students were asked to perform seven tasks, and the five-level Likert scale were given according to the response of the chatbot. The results showed that the respondents were satisfied with the response of the reference chatbot. The correct response rate was 70%, and the system's response accuracy rate was 82.86%. The response with higher satisfaction was also correct. Only task five, inquiry about the library resources , receives the lowest satisfaction, but the system's response accuracy rate was 90.00%. Future research can amplify the question and answer corpus, improve the accuracy of problem comparison, and improve the way in which answers are presented, so as to further improve the function of the reference chatbot and solve the problem of low satisfaction of the task five. Keywords : Digital Reference Service, Chatbot, Reference Chatbot, Question Answering System. iii.

(5) 目次 第一章 緒論.................................................................................................................. 1 第一節 研究背景與動機.......................................................................................... 1 第二節 研究目的與問題.......................................................................................... 2 第三節 研究範圍與限制.......................................................................................... 2 第四節 名詞解釋...................................................................................................... 3 第二章 文獻探討.......................................................................................................... 4 第一節 數位參考服務.............................................................................................. 4 第二節 聊天機器人發展與技術.............................................................................. 8 第三節 聊天機器人在圖書館之應用.................................................................... 14 第四節 問答系統運作機制.................................................................................... 22 第三章 研究方法........................................................................................................ 25 第一節 開發平台與工具........................................................................................ 25 第二節 研究場域與對象........................................................................................ 27 第三節 研究方法與系統架構................................................................................ 31 第四節 研究實施與步驟........................................................................................ 33 第四章 參考諮詢機器人建置與評估........................................................................ 35 第一節 參考諮詢機器人建置流程........................................................................ 35 第二節 館藏與開館查詢功能撰寫........................................................................ 38 第三節 問答搜集與整理........................................................................................ 42 第四節 問題相似度比對........................................................................................ 45 iv.

(6) 第五節 系統展示.................................................................................................... 48 第六節 系統評估.................................................................................................... 54 第五章 結論與建議.................................................................................................... 62 第一節 結論............................................................................................................ 62 第二節 未來建議.................................................................................................... 63 參考文獻...................................................................................................................... 65. v.

(7) 表次 表 2-1 聊天機器人應用建置之研究.......................................................................... 10 表 2-2 檢索型與生成型之優缺點.............................................................................. 14 表 2-3 LISA、PIXEL、小圖之功能差異比較 ............................................................ 22 表 3-1 平台與工具之功能與目的.............................................................................. 26 表 4-1 開館查詢模組第一個判斷函式之判斷條件.................................................. 39 表 4-2 開館查詢模組第二個判斷函式之判斷條件.................................................. 40 表 4-3 開館查詢模組第三個判斷函示判斷條件 ...................................................... 41 表 4-4 問答語料庫欄位與說明.................................................................................. 42 表 4-5 不可利用問題之範例...................................................................................... 43 表 4-6 參考紀錄內容清理前後範例.......................................................................... 44 表 4-7 自訂同義詞表範例.......................................................................................... 46 表 4-8 自訂停用詞表範例.......................................................................................... 47 表 4-9 任務一提問與回覆示例.................................................................................. 55 表 4-10 任務二提問與回覆示例................................................................................ 55 表 4-11 任務三提問與回覆示例 ................................................................................ 56 表 4-12 任務四提問與回覆示例................................................................................ 56 表 4-13 任務五提問與回覆示例................................................................................ 57 表 4-14 任務六提問與回覆示例................................................................................ 57 表 4-15 任務七提問與回覆示例................................................................................ 57 表 4-16 對於機器人回覆之滿意度............................................................................ 58 vi.

(8) 表 4-17 提問的正確回覆數與正確率........................................................................ 59 表 4-18 系統中的正確回覆數與正確率.................................................................... 60. vii.

(9) 圖次 圖 2-1 數位參考服務型式............................................................................................ 6 圖 2-2 聊天機器人類別................................................................................................ 9 圖 2-3 聊天機器人組成架構...................................................................................... 11 圖 2-4 LISA 聊天介面................................................................................................. 16 圖 2-5 PIXEL 問題答覆流程 ........................................................................................ 17 圖 2-6 PIXEL 聊天介面 ................................................................................................ 18 圖 2-7 小圖系統架構.................................................................................................. 19 圖 2-8 小圖網頁版介面.............................................................................................. 20 圖 2-9 小圖應用程式版介面...................................................................................... 21 圖 2-10 問答系統架構................................................................................................ 23 圖 3-1 臺師大圖書館線上諮詢台「我要發問」...................................................... 28 圖 3-2 臺師大圖書館線上諮詢台「常問問題」...................................................... 28 圖 3-3 臺師大圖書館開放時間「學期中」.............................................................. 29 圖 3-4 臺師大圖書館開放時間「寒暑假」.............................................................. 29 圖 3-5 臺師大圖書館開放時間「每月開閉館」...................................................... 30 圖 3-6 臺師大圖書館 OPAC 關鍵字檢索 ................................................................. 30 圖 3-7 系統架構圖...................................................................................................... 32 圖 3-8 研究流程圖...................................................................................................... 33 圖 3-9 問答系統建置流程圖...................................................................................... 34 圖 4-1 參考諮詢機器人建置流程圖.......................................................................... 36 viii.

(10) 圖 4-2 判斷規則模組流程圖...................................................................................... 37 圖 4-3 開館查詢判斷流程圖...................................................................................... 39 圖 4-4 問答語料五大類別.......................................................................................... 45 圖 4-5 自訂字典範例.................................................................................................. 46 圖 4-6 館藏查詢功能示例.......................................................................................... 49 圖 4-7 館藏查詢功能回覆第一筆檢索結果連結頁面.............................................. 49 圖 4-8 館藏查詢功能回覆「更多訊息」檢索結果連結頁面 .................................. 50 圖 4-9 開館查詢功能「今天」示例.......................................................................... 50 圖 4-10 開館查詢功能「明天」示例........................................................................ 50 圖 4-11 開館查詢功能「國定假日」示例 ................................................................ 51 圖 4-12 開館查詢功能「寒暑假」示例.................................................................... 51 圖 4-13 開館查詢功能「日期」示例........................................................................ 51 圖 4-14 開館查詢功能「日期不完整」示例............................................................ 52 圖 4-15 「服務申請與說明」問題答覆示例............................................................ 52 圖 4-16 「硬體設備介紹」問題答覆示例................................................................ 53 圖 4-17 「資源查詢指引」問題答覆示例................................................................ 53 圖 4-18 「圖書館資訊」問題答覆示例.................................................................... 53 圖 4-19 「系統相關」問題答覆示例........................................................................ 53. ix.

(11) 附錄 附錄一 意圖分類類別 ................................................................................................ 70 附錄二 自訂字典 ........................................................................................................ 74 附錄三 自訂同義詞表 ................................................................................................ 81 附錄四 自訂停用詞表 ................................................................................................ 90 附錄五 實驗評估任務說明 ........................................................................................ 92 附錄六 任務之提問與回覆 ........................................................................................ 95. x.

(12) 第一章 緒論 身處人工智慧崛起、聊天機器人如雨後春筍發展的時代,科技的演進影響人 們獲取資訊的使用習慣,有時還能解決傳統方式無法處理之問題,圖書館也需應 應變化推出服務。本研究將建置圖書館參考諮詢機器人,本章將分為四節做說明, 第一節為研究背景與動機,第二節為研究目的與問題,第三節為研究範圍與限制, 第四節為名詞解釋。. 第一節 研究背景與動機 一般而言,圖書館服務最主要分為讀者服務與技術服務,而參考服務是讀者 服務中重要的一環,是回答讀者問題、協助讀者尋找資料的一種服務(張淳淳, 2003)。大學圖書館被稱為大學的心臟,肩負協助教學、支援研究、典藏資源、 提供休閒等任務,為了能支援教學與研究,參考服務更為重要。傳統參考服務是 以館員與讀者面對面的方式進行服務,蘇小鳳(2007)調查三所大學學生到圖書 館參考櫃檯直接詢問館員問題時曾經遭遇的障礙顯示,超過四分之一的學生認為 「要走很久不方便」 ,五分之一的學生認為「館員好像很忙,沒空理我的樣子」 , 點出大學傳統參考服務面臨的困難。而根據研究者自身在大學圖書館的經歷與觀 察發現,當讀者遭遇問題時如果館員與自己不是在同一樓層,甚至不是在同一地 點,會需要顧及自身的隨身物品安危,又或是發生問題的是不可移動的設備等障 礙,而打消詢問或是使用的念頭。因此讀者會希望能有即時、不受空間、時間限 制的參考服務(蘇小鳳,2007;李雅惠,2009)。 近幾年人工智慧的進步,許多產業開始結合智慧機器人進行服務與管理。根 據臺灣網路資訊中心(國立政治大學統計系,2017)的報告顯示,近九成的受試 者有使用通訊軟體,使用通訊軟體的盛行,再加上自然語言處理的進步,人工智 慧的應用又以聊天機器人更為備受關注,可被運用在客戶服務,甚至是電子商務 的交易。也有圖書館將聊天機器人導入,以提供新式的即時數位參考服務,解決 人工即時參考服務的問題,如:中國清華大學圖書館的聊天機器人—小圖,但目 前臺灣圖書資訊相關科系很少有聊天機器人應用在參考服務的研究。綜合上述原 因,本研究擬實際建置一個參考諮詢機器人並調查其使用評價。 1.

(13) 第二節 研究目的與問題 根據背景與動機,本研究將以國立臺灣師範大學(臺師大)圖書館為場域, 瞭解參考諮詢機器人在大學圖書館的應用。研究中將實際建置一個讀者可用的參 考諮詢機器人,並調查其使用評價,藉以達到輔助臺師大圖書館參考服務的非人 工即時參考資訊服務。以下為本研究擬達成之目的與問題: 一、建置國立臺灣師範大學圖書館參考諮詢機器人。 (一). 瞭解大學圖書館參考諮詢機器人之功能特性。 1.. 大學圖書館參考諮詢機器人之功能特性為何?. (二). 瞭解大學圖書館參考諮詢機器人所需模組。 1.. 大學圖書館參考諮詢機器人所需模組為何?. 二、調查國立臺灣師範大學圖書館參考諮詢機器人的使用評價。 (一).使用者使用此參考諮詢機器人的滿意度為何? (二).此參考諮詢機器人的回覆正確率為何?. 第三節 研究範圍與限制 一、本研究以國立臺灣師範大學為例,建構適用國立臺灣師範大學圖書館之參考 諮詢機器人,其他大專院校圖書館酌予參考。 二、本研究參考諮詢機器人參考問答之語料庫資料來源,取自國立臺灣師範大學 圖書館線上諮詢台問答之紀錄(2013 年 2 月 18 日至 2018 年 6 月 19 日) ,與 國立臺灣師範大學圖書館常問問答集。 三、本研究參考諮詢機器人答題範圍僅包含在國立臺灣師範大學圖書館參考紀 錄與常問問答集中與圖書館相關之指示型參考問題,並不包含即時型或研究 型參考問題。 2.

(14) 四、本研究參考諮詢機器人訊息接收與回覆僅包含中文字訊息,英文、貼圖、音 訊不在範圍內。 五、本研究參考諮詢機器人之使用評估測試對象為國立臺灣師範大學之學生,並 不包含教職員與使用圖書館之校外人士。. 第四節 名詞解釋 一、. 數位參考服務(Digital Reference Service). 數位參考服務(Digital Reference Service)定義為參考服務人員利用網際網路 與不在館員面前的使用者進行資訊需求諮商並傳遞解答或文獻的一種服務(蘇小 鳳,2005,頁 3) ,與數位參考服務相關名詞有,網路參考服務(Web-based Reference Service) 、虛擬參考服務(Virtual Reference Service)與電子參考服務(Electronic Reference Service)等(王梅玲、謝寶煖,2014,頁 196) 。數位參考服務與虛擬參 考服務是兩個較常見的名詞,但是數位參考服務涵蓋範圍較廣,虛擬參考服務只 是其中一種數位參考服務而已,在本研究中將統一採用數位參考服務一詞,並將 其定義為包含自動化概念之參考服務人員利用網際網路與使用者進行資訊需求 諮商並傳遞解答或文獻的一種服務。. 二、. 聊天機器人(Chatbot). 聊天機器人(Chatbot 或 Chatterbot)是透過文本或語音互動模擬對話或是人 類聊天行為的電腦程式(Rouse, n.d.),常見的聊天機器人主要分為兩大類:任務型 (Task-Oriented)與純聊天型(Chit-Chat),任務型聊天機器人類似個人數位助理,以 幫助使用者完成特定任務為主,所以又有人稱其為功能型聊天機器人,如: Siri(Apple)、Alexa(Amazon)語音智慧助理;Skyscanner 在 FB Messenger 推出可 以查詢機票、推薦旅遊地點的聊天機器人等。而以社交互動、閒聊或沒有特定任 務目標的純聊天型機器人,則有卡米狗、微軟小冰(Microsoft)(顏理謙,2016; 王宏仁,2017)。本研究建置之參考諮詢機器人是指互動以文字為主、功能型的 聊天機器人。. 3.

(15) 第二章 文獻探討 欲建置一個圖書館參考諮詢機器人,首先須先瞭解何謂數位參考服務、何謂 聊天機器人,因此本章將分為四節做說明,第一節先說明數位參考服務的定義、 優缺點與問題解決方式,銜接到第二節探討聊天機器人的發展與關鍵技術,接著 第三節介紹聊天機器人在圖書館之應用,最後第四節探討在聊天機器人中問答系 統的類型與運作機制。. 第一節 數位參考服務 參考服務是參考圖書館員向讀者者提供資訊服務的一種服務(Levine-Clark & Carter, 2013, pp.213),複雜來說是指幫助讀者尋找資料,回答讀者問題,是圖 書館中直接幫助讀者獲得答案,或利用館藏及各種資源從事學習或研究的一種服 務(王梅玲、謝寶煖,2014,頁 197) ,是圖書館讀者服務中不可缺少的工作,其 目的在於幫助讀者找尋資料,滿足其資訊需求。隨著科技進步,網路的快速發展, 改變的不單是科技產品,許多讀者開始從 Google 等搜尋引擎與線上資料庫,以 便利的方式取得資料,如此讀者使用習慣的改變,進而對參考服務產生了重大影 響(Hisle, 2005, pp. B6),數位參考服務也愈發重要。. 一、. 數位參考服務定義. 數位參考服務(Digital Reference Service) 沒有一個統一的定義,以下為各文 獻中對數位參考服務之定義: 1.. 由專家、仲介和資源組成的網絡,供使用者在網路環境下尋找答案 (McClure, Lankes, Gross, & Choltco-Devlin, 2002)。. 2.. 讓圖書館員與讀者可以透過網際網路達到即時溝通的服務,如:電子信 箱、聊天或即時訊息(Bakker, 2002). 3.. 在數位環境中以人為仲介來回答問題(Lankes, 2004). 4.

(16) 4.. 參考服務人員利用網際網路與不在館員面前的使用者進行資訊需求諮 商並傳遞解答或文獻的一種服務(蘇小鳳,2005,頁 3). 5.. 讀者利用電子化的方式與公共服務人員進行溝通,而無需親自到場的參 考服務(Reference and User Services Association, 2017)。. 6.. 在線上運行並透過電腦作為仲介工具的參考服務(Digital Reference, 2005). 綜合上述定義,雖然各個定義有其些微的差異,但不外乎是由館員以數位方 式提供服務與讀者能以數位方式取得所需資訊的概念。強調的是雖然透過網路, 但還是由館員協助獲取或提供資訊給讀者,而不是讀者自己搜尋(Lankes, 2004, pp. 7),本研究數位參考服務將取蘇小鳳(2005)之定義。. 二、. 數位參考服務型式. 常見的數位參考服務根據服務進行的方式可分為非同步(Asynchronous)與同 步(Synchronous)兩種,非同步數位參考服務如電子郵件(E-mail)或是網頁表單 (Web Form),是圖書館較常使用之方式(見圖 2-1) ,此方式的好處為沒有空間及 時間的限制,缺點為不一定能即時回覆讀者、書面較口語耗時,若要釐清問題, 電子郵件一來一往間又會有所延拓,且詢問者多半不再回應(蘇小鳳,2005,頁 13-15) 。而同步數位參考服務又稱為即時數位參考服務,透過不同的軟體讓館員 與讀者達到同步對話,彌補非同步的缺憾,如:網路聊天即時參考服務、視訊會 議型即時數位參考服務。 還有一種數位參考服務為自動化(Automatic),常見的服務方式為網路式常問 問題集,不過此種是否歸類到數位參考服務有其爭議性在,像 Lankes(2004)也提 及很多對於數位參考服務的定義認為自動化類型的數位參考服務不能算數位參 考服務,因為缺少了數位參考服務的獨特性質——以人為仲介在數位環境中問答。 蘇小鳳(2005,頁 5)也提及「一些關於數位參考服務的定義中並不一定包含『人』 這個元素,而只強調參考服務中網路與科技的運用」,而 Berube(2003)則將以人 工智慧回覆問題的數位參考機器人歸為也是數位參考服務的一種。. 5.

(17) 數位參考服務 (Digital Reference Service). 非同步 (Asynchronous). 同步 (Synchronous). 自動化 (Automatic). • 電子郵件(E-mail Reference) • 網頁表單(Web Form Reference). • 網路聊天即時參 考服務(Chat Reference) • 視訊會議型即時 數位參考服務 (Video Conferencing Real-time Digital Reference). • 網路式常問問題 集(FAQ) • 專家系統(Expert System) • 線上資源導覽 (Online Pathfinder). 圖 2-1 數位參考服務型式 資料來源:蘇小鳳(2005)。即時數位參考諮詢服務(頁 4)。臺北市:文華圖 書館管理。. 6.

(18) 三、. 即時數位參考服務. 即時數位參考服務通常英文會帶有「real-time」或「live」等字眼,服務進行 的方式包含:即時對談(Real-time Chat)與合作瀏覽(Co-browsing),即時對談 是指透過線上對談軟體或文字傳訊軟體進行同步的諮詢服務,也有可能是以語音 電話(Voice over Internet Protocol, VoIP)和視訊會議(Video Conference)進行; 合作瀏覽則是館員讓遠端讀者可以同時看到同一畫面,可以看到館員操作的過程 (柯皓仁,2004,頁 10)。 即時數位參考服務解決了傳統參考服務空間與時間的限制、數位參考服務無 法即時回應之問題,如此說來看似已經完美,不過即時參考服務必須有館員負責, 如此可能會有工作量大增、非工作時間無法提供服務,以及一人無法分飾兩角, 也就是當讀者訊息進來時,館員在同一時間仍只能回覆一人等問題(姚飞、纪磊、 张成昱、陈武,2011)。因此又發展出了聯合即時數位參考資訊服務,如由美國 國會圖書館(Library of Congress)與美國國際圖書館電腦中心(Online Computer Library Center, OCLC ) 合 作 開 發 全 球 性 合 作 參 考 服 務 系 統 ( QuestionPoint Cooperative Virtual Reference, QuestionPoint)。 雖然 QuestionPoint 旨在鼓勵不同時區的圖書館合作提供全年無休參考服務 (24/7 Reference,為一週七天一天二十四小時之意),也就是任何時間都可以為 在任何地點提出問題的任何人提供專業的參考服務(洪世昌,2012),但若詢問 者的慣用語言與服務的參考館員不同,對於讀者會是一個障礙,因為讀者會希望 在諮詢時能是自己熟悉的母語;另外每間圖書館之館藏、作業模式與標準不盡相 同,如此在提供參考服務時就需要一套規範(蘇小鳳,2004,頁 6-8)。 綜合本節之文獻得出,數位參考服務即是參考服務人員利用網際網路與使用 者進行資訊需求諮商並傳遞解答或文獻的一種服務,但是所謂的「參考服務人員」 不一定要直接與讀者有接觸,如同常見問答集,是由館員整理後放在網路上間接 提供讀者服務。再來即時數位參考服務面臨的問題,急需一項能同時具備同步與 自動化型式的服務,而聊天機器人兼具兩者形式,故本研究欲建置一個參考諮詢 機器人。 7.

(19) 第二節 聊天機器人發展與技術 人工智慧的一項分支—聊天機器人,如今發展蓬勃,應用在許多領域,電子 商務、氣象查詢、金融理財、旅遊搜尋、醫療保健、食品餐飲都有其蹤跡。本節 將就聊天機器人之發展與相關應用,以及聊天機器人關鍵技術做文獻探討。. 一、. 發展與相關應用. 要講聊天機器人前,不得不先提的即是人工智慧(Artificial Intelligence, AI) , John McCarthy 在 1955 年提出人工智慧的術語概念,並成立達特茅斯會議 (Dartmouth Conference)(McCarthy, Minsky, Rochester, & Shannon, 1955) , McCarthy(2007)將其解釋為「是製造智慧機器的科學和工程,特別是智慧計算機 程序,與使用計算機來理解人類智慧有關」,大英百科全書(Copeland, 1998)對其 定義為「數位計算機或以計算機控制之機器人可以執行與具智慧之生物相關任務 的能力」,劍橋字典(Artificial intelligence, n.d.)則將其解釋為「一個計算機程序, 其功能是具有人類思維的某些特性,比如理解語言的能力、識別圖片、從經驗中 學習」。 而另一位在人工智慧領域的先驅 Alan Turing 提出了一個問題「機器可以思 考嗎?(Can machines think?)」,接著做了一個實驗,讓一個受測者去詢問兩個他 不能看見的對象任意一問題,兩個對象分別為人與機器。如果經過若干問題後, 受測者無法分辨二者孰為人類、孰為機器,則此機器通過測試,這也就是著名的 圖靈測試(Turing Test) (Turing, 1950)。 聊天機器人(Chatbot)是經由對話或文字進行交談的電腦程式(或稱為人工智 慧) ,能夠模擬人類對話且通過圖靈測試(Chatbot, 2009)。公認最早出現的聊天機 器人為 Joseph Weizenbaum 在 1966 年發布的 ELIZA,僅管 ELIZA 不能真正算得 上是具有智慧,它是靠著使用者輸入的內容辨識關鍵字,並從既有的回答中作回 覆,產生它好像有智慧的錯覺(Shah, Warwick, Vallverdú, & Wu, 2016;張文宗, 2017)。. 8.

(20) 聊天機器人若要成功,有三個主要關鍵 (Sarkar, 2013) : 1.. 具備理解來自人們所輸入對話的解析器;. 2.. 能夠了解對話的上下文和其他細節的知識;. 3.. 回覆的方式,讓使用者不覺得聊天機器人是一個單純的程式。. 其實上述這三個關鍵的核心技術也就是自然語言處理,如果能達到以上三個 關鍵,那麼這個聊天機器人也就可以通過圖靈測試。 聊天機器人 之應用若 以對話 能力做區 分大致 能分為兩大 類:封閉 領域 (Closed Domain)與開放領域(Open Domain)(見圖 2-2),封閉領域的聊天機器人 通常能完成特定任務,像是氣象查詢、電影查詢,一般商業性聊天機器人也都是 此類型,例如:Skyscanner 在 FB Messenger 中的聊天機器人可以查班機、推薦旅 遊地點;開放領域的聊天機器人是針對沒有一定目標或意圖的使用者,使用者可 以詢問任何問題,而聊天機器人必須回覆有意義的資訊,例如:羅布納獎(Loebner Prize)的四次獲獎者—Mitsuku、微軟小冰等,因為封閉領域有的聊天機器人有特. 開放領域 封閉領域. 對話能力. 定任務,在實作上會比開放領域的聊天機器人簡單(Sanjeevi, 2018)。. 通用型人工智慧 (現階段不能做到). (最困難做到). 以規則為基礎. 智慧機器. (最簡單做到). (較難做到). 檢索型. 生成型 回覆機制. 圖 2-2 聊天機器人類別 資料來源:Lempinen, K. (2017, February 23). What are Chatbots and how they impact Service Management [Web blog message]. Retrieved from http://www.lempinenpartners.com/what-are-chatbots-and-how-they-impact-servicemanagement/ 9.

(21) 聊天機器人之應用若以回復機制做為區分則能分為檢索型(Retrieval-Based) 與生成型(Generative),此部分將於下一小節「關鍵技術」之自然語言生成中詳細 說明。 與聊天機器人建置的相關研究整理如表 2-1,開放領域類型聊天機器人較封 閉領域型聊天機器人為少,從文獻得知聊天機器人的建置需要考慮以下因素:聊 天機器人建置的方法、使用的平台、語料的取得方式。 表 2-1 聊天機器人應用建置之研究 聊天機器人 聊 天 機 器 研究者(年代). 名稱. 人類型. 目標. 輔助英語學習,為英語學習 Jia, Jiyou(2009). CSIEC. 開放領域. 者提供虛擬聊天夥伴。 以 AIML 為基礎的 Java 課程. 張雅雯(2011). JT-Bot. 封閉領域. 助教。 以爬蟲技術為基礎建置籃球. 魏彰村(2017). -. 封閉領域. 領域諮詢聊天機器人。 以 Dcard 論壇文章作為訓練. 彭昱傑(2017). Taigun. 開放領域. 資料建置純聊天機器人。 以 DialogFlow 處理自然語言. Holmes et al. (2018). WeightMentor 封閉領域. 建置之減肥維護的激勵型聊 天機器人。. 資料來源:研究者自行整理. 10.

(22) 二、. 關鍵技術. 一般而言,聊天機器人主要關鍵技術為自然語言處理(Natural Language Processing, NLP)與對話管理(Dialogue Management, DM)(王宏仁,2017) ,而自 然語言處理為計算機從自然語言輸入和/或生成自然語言輸出中提取有意義訊息 的過程(Warschauer & Healy, 1998, pp.67),其 運作機制又分 為自然語言 理解 (Natural Language Understanding, NLU) 與自 然語言 生成 (Natural language generation, NLG)。聊天機器人在接收使用者輸入之文本後,會經過自然語言理 解,接著進入對話管理,然後經過自然語言生成,最後將結果返回給使用者(見 圖 2-3) ,以下就聊天機器人之關鍵技術做說明。. 自然語言理解(NLU). 自然語言處理(NLP). 對話管理(DM). 自然語言生成(NLG). 圖 2-3 聊天機器人組成架構 資料來源:王宏仁(2017)。【專家剖析】Chatbot 三大技術關鍵與最新研究方向 【新聞群組】。取自 https://www.ithome.com.tw/news/113445. 11.

(23) (一). 自然語言理解. 自然語言理解是機器要理解給定文本的含義,文本內每個單詞的特性與結構 需要被理解,簡單來說就是機器要「懂」人的語言。在理解結構上,以下幾個自 然語言的歧義要注意(Gill, 2017): 1.. 詞彙歧義(Lexical Ambiguity):單詞有多重含義造成的歧異。. 2.. 句法歧義(Syntactic Ambiguity):語句因為句法而有多重解釋造成的歧異。. 3.. 語義歧義(Semantic Ambiguity):句子因語氣有多重含義造成的歧異。. 4.. 對應歧義(Anaphoric Ambiguity):在文章中先前出現的短語或單詞在後 面句子中有不同的含義造成的歧異。. 接著通過詞彙和語法規則,理解每個單詞的含義。然而,有些詞有類似的含 義(同義詞),有些詞有多重含義(多義詞),又是需要注意的部分。 (二). 對話管理. 對話管理是基於使用者輸入文本的狀態判斷聊天機器人應該採取什麼行動, 也就是聊天機器人需要表達什麼意思,其完成一項任務需要多個條件,若自然語 言理解拆解出的條件不完整,即會造成任務無法達成,所以對話管理中有三種行 為來幫助機器人可以順利完成任務:請求更多資訊(Request)、確認資訊(Confirm) 與回報資訊給使用者(Inform),以下為三種行為適用時機之說明(王宏仁,2017) : 1.. 請求更多資訊:當獲取的條件不完整時,聊天機器人即需向使用者請求 更多資訊;. 2.. 確認資訊:當提供的資訊不清楚,或是語意理解可能判斷錯誤等情形發 生時,聊天機器人需要向使用者確認資訊;. 3.. 回報資訊給使用者:當條件完整且資訊確認的情況下,聊天機器人即可 將回答回報給使用者。. 12.

(24) (三). 自然語言生成. 自然語言生成是從結構化數據中自動生成人可讀文本的過程。自然語言生成 的問題是難以處理,其過程可被分為三個階段(Gill, 2017): 文本規劃(Text Planning):完成結構化數據的排序,選擇生成語句所包含. 1.. 的基本訊息; 語句規劃(Sentence Planning):將多個語句進行合併,從而完整呈現所要. 2.. 的訊息; 實現(Realization):將所要生成的訊息進行文法修正,從而生成最終結果。. 3.. 自然語言生成的方式又可分為檢索式對話生成技術與生成式對話生成技術, 對應到聊天機器人產生回覆的方式就也分為檢索型與生成型(Britz, 2016)(見表 2-2): 檢索型(Retrieval-Based Models):使用預先定義回應的知識庫和某種啟. 1.. 發式方法來根據輸入內容和上下文選擇適當的回應,啟發式可以像基於 規則的表達式匹配一樣簡單,也可以像機器學習分類器的集合一樣複雜, 此種類型並不會生成任何新文本,只是從固定資料集中選擇回覆。 優點:實作較簡單的一種方式,且因為是從資料集中直接抓取回覆,. (1). 所以不會產生語法錯誤。 缺點:若有未定義到的問題可能就無法回覆,還有就是無法處理上. (2). 文出現的名詞等上下文實體訊息。 生成型(Generative):不依賴於預定義的回應,而是從頭開始產生新的回. 2.. 覆,生成型通常基於機器翻譯技術,但不是從一種語言翻譯成另一種語 言,而是從輸入內容(問題)轉換到輸出內容(回應)。 (1). 優點:可以參考輸入內容的實體,給予使用者一種與人交流的印象, 較智能的感覺。. 13.

(25) 缺點:不好訓練、可能會有語法錯誤的問題,且通常需要大量的數. (2). 據做訓練。 表 2-2 檢索型與生成型之優缺點 檢索型. 優點. 缺點. 生成型. 1.. 實作較簡單. 1.. 可處理上下文實體訊息. 2.. 不會有語法錯誤. 2.. 給人與人交談的智慧感. 沒對應到的問題及無法回覆. 1.. 實作困難. 1.. 無法處理上下文實體訊息. 2.. 可能有語法錯誤問題. 2.. 3.. 需大量數據做訓練. 資料來源:Britz, D. (2016, April 6). Deep Learning for Chatbots, Part 1 – Introduction [Web blog message]. Retrieved from http://www.wildml.com/2016/04/deep-learning-for-chatbots-part-1-introduction/ 根據本節文獻探討,歸納出本研究欲建置聊天機器人使用的關鍵技術,回覆 機制將選擇檢索型的自然語言生成技術,對話能力方面較偏向封閉領域,專注於 回覆與臺師大圖書館相關之參考問題,以此基礎來建置本研究之參考諮詢機器人。. 第三節 聊天機器人在圖書館之應用 聊天機器人被應用在各個領域中,圖書館也涵蓋在內,本節將會探討國外圖 書館基於參考服務聊天機器人之實際應用(現階段尚未找到臺灣的實際案例), 分別為 LISA—英國伍爾弗漢普頓大學圖書館、Pixel—美國內布拉斯加大學林肯 分校圖書館與小圖—中國清華大學圖書館。. 一、. LISA—英國伍爾弗漢普頓大學圖書館. 英國伍爾弗漢普頓大學圖書館於 2006 年 12 月推出 ASSIST (全稱為 Available Simple Supportive Information Service Today,為線上聊天參考服務) ,從該服務發 現讀者大多是詢問與圖書館基本與日常的服務資訊,又因電子資源的比例逐漸升 高,2008 年的調查結果顯示學生僅會找其所需資訊不會深入使用網站,也就是 14.

(26) 較偏向使用 Google 找尋答案,再加上受漢堡州立大學圖書館之聊天機器人「Stella」 啟發,因此於 2008 年 12 月開始聊天機器人「LISA」(全稱為 Learning and Information Services Assistant)建置計畫,以下根據 Dowd (2011)介紹 LISA: (一). 關鍵技術. LISA 的建置是圖書館與廠商合作而成,採用的是 Daden 科技公司的聊天機 器人技術,其聊天機器人「Lillian」曾在圖書館應用競賽「Mashing up library」中 獲得亞軍。 Daden 負責聊天機器人的基礎架設,而館員主要任務為搜集、整理 語料庫。 (二). 開發步驟. 館員從 ASSIST 中獲得的問答紀錄取出,在 EXCEL 試算表中進行整理,首 先將問答內容進行摘要,並附上回覆所需呈現的網址,然後將經初步整理的問答 紀錄以大眾分類法進行分類,給予對應的關鍵字。接著將問題的摘要簡化為核心 關鍵字,以配合 Daden 提供的系統,並將資料傳到系統中。 (三). 介面與功能. LISA 介面為網頁模式,左邊為對話框,右邊為與答覆相對應之網站頁面(見 圖 2-4)。LISA 允許使用者輸入簡短的自然語言進行提問,其回答是從 ASSIST 中獲得的問答紀錄經整理後所創建,並加上相對應之 URL,以推廣網站內容未 被充分利用的資訊,當然還有簡單的閒話家常功能。. 15.

(27) 圖 2-4 LISA 聊天介面 資料來源:Dowd, J. (2011). I just want my website to talk to me: implementation and trial of a chatbot at the University of Wolverhampton. SCONUL Focus, 51, 37. (四). 成果與問題改進. LISA 正式上線後,回答的正確率隨著越來越多的知識規則也逐漸提高,遭 遇問題大多與使用者如何提問有關,如:使用者不是詢問「圖書的借閱期限」, 而是直接問其圖書何時到期,又或是一字多義的問題。還有就是機器人的回覆文 字並未附上 URL,只在介面右邊直接呈現,以至於使用者有時會沒注意到,或是 因為使用者輸入了其他文字觸發機器人回覆而網頁消失。使用者對於有簡短聊天 功能感到印象深刻,這樣與機器人互動讓他們發現網頁更多可用的資訊。. 二、. Pixel—美國內布拉斯加大學林肯分校圖書館. 科技改變人們的互動方式,許多學生喜歡使用社群軟體,美國內布拉斯加大 學林肯分校圖書館覺得聊天機器人可以做為吸引年輕人的工具,提供更佳的參考 服務,且很適合處理指引性與可預期性的問題,讓館員可以空出時間處理更複雜 的問題。於是他們從 2010 年十月開始聊天機器人「Pixel」計畫,並於 2011 年二 月成功發布,以下根據 Allison(2011)為 Pixel 做詳細介紹:. 16.

(28) (一). 關鍵技術. 將 Pixel 資料存於 SQL 資料庫中,並以 PHP 程式語言與 AIML 語法結合之 軟體—Program-o 作為開發之基礎。運作模式為使用者輸入問題,將查詢傳送到 資料庫,然後回傳匹配或錯誤訊息(見圖 2-5)。. 圖 2-5 Pixel 問題答覆流程 資料來源:Allison, D. (2011). Chatbots in the library: is it time?. Faculty Publications, UNL Libraries. 280. Retrieved from https://digitalcommons.unl.edu/libraryscience/280 (二). 開發步驟. 安裝 Program-o,並將 AIML 檔案包放到到資料庫中,接著評估和修改 AIML 裡既有的對話,調整成適合大學圖書館參考服務之內容。根據圖書館的網站與參 考諮詢紀錄新增新的 AIML 類別,還有以 Google Analytics 檢查 Encore 和 Classic Catalog 較頻繁的搜索項目,並檢查其他圖書館的常見問答集以確保能盡量涵蓋 常見問題,最後每日監控 Chatbot 日誌檔以糾正遺漏或改進問題答案。. 17.

(29) (三). 介面與功能. Pixel 是直接架設在網站上,以一個文字輸入框與先前對話的基本方式呈現, 其介面為圖 2-6 之樣式。. 圖 2-6 Pixel 聊天介面 資料來源:Pixel space. Retrieved June 24, 2018, from University of NebraskaLincoln Libraries, http://pixel.unl.edu/ Pixel 允許使用者使用自然語言進行對話,可以立即回答有關圖書館服務和 資源的問題,包含:資源的引導、FAQ。擁有整合資源的功能,包含:Encore、 ResearchPro、館藏查詢系統、 DigitalCommons、ContentDM、 LibGuides 和圖書 館網站,並加上附加連結等訊息,讓對話更加完善。會以引導語來確認使用者的 問題,如:讓我知道你是否在尋找書籍或文章。 (四). 成果與問題改進. 結果發現 Pixel 對喜歡使用社群軟體的人特別有吸引力,他們通常更喜歡只 與機器人聊天,而不是詢問與圖書館有關的問題。因此可能需要對 AIML 中的類 別進行一些修改,以符合使用者想與機器人對答的樂趣需求,並嘗試將對話導向 與圖書館相關的區域。. 18.

(30) 三、. 小圖—中國清華大學圖書館. 中國清華大學圖書館為解決即時數位參考服務的問題,將人工智慧與數位參 考服務相結合,提供機器人數位參考館員,於 2010 年設計並實現了虛擬參考館 員「小圖」。以下為根據姚飞、纪磊、张成昱、陈武(2011)之小圖詳細介紹: (一). 關鍵技術. 中國清華大學圖書館選擇自由軟體 Artificial Linguistic Internet Computer Entity(簡稱 A.L.I.C.E)作為「小圖」的基礎,其架構詳見圖 2-7。語料庫是以 XML 格式儲存,以搜尋引擎技術實現檢索功能,為避免語料庫資料品質高低不 同之問題,將圖書館原本的參考紀錄、人工添加的資料與教學系統得到的問答, 分別設為第一、二、三級優先語料庫。. 圖 2-7 小圖系統架構 資料來源:姚飞、纪磊、张成昱、陈武(2011)。实时虚拟参考咨询服务新尝试 —清华大学图书馆智能聊天机器人。现代图书情报技术,2011(4),78。 語料庫檢索的模組整體流程為先進行中文斷詞,是以中國科學院計算技術研 究所(Institute of Computing Technology)基於分層隱藏式馬可夫模型(Hierarchical Hidden Markov Model, HHMM) 研 發 的 漢 語 詞 法 分 析 系 統 ( Chinese Lexical Analysis System, ICTCLAS) ,再來建立倒排索引加快對於使用者的回應,最後以 TF-IDF 演算法從語料庫中進行相似度匹配,輸出最適合之結果。. 19.

(31) 「小圖」的關鍵技術還有搜書引擎、教學系統與推理機制,搜書引擎是將 「book」設成搜書命令,其後的文字將視為關鍵字到中國清大的 INNOPAC 系統 做搜尋,結果再丟回「小圖」中;教學系統則是以「Q:問題 A:答案」的形式作為 教學命令,會將輸入的資料存於教學語料庫中;推理機制採用 A.L.I.C.E.內部之 功能,當既有資料庫中沒有適當答案時,可以從 AIML 知識庫中推理出回覆。 (二). 開發步驟. 首先選定聊天機器人的設計風格,介面以 MSN、QQ 等聊天對話風格為首 選,服務場所方面社群網站發展迅速且影響巨大,希望能夠將「小圖」 推廣到 這些社交網絡上以發揮更大的作用。接著整理清大累積大量的諮詢記錄,也整理 出很多精選的 FAQ,將這些內容作為「小圖」的核心語料庫基礎,然後將小圖 的其他功能透過問題指令系統連結起來,完成小圖的自然語言智慧問答引擎。 (三). 介面與功能. 「小圖」在圖書館網站上與人人網的介面為圖 2-8 之樣式,中國清華大學於 2014 年還推出了「小圖」應用程式版本,其介面詳見圖 2-9。. 圖 2-8 小圖網頁版介面 資料來源:姚飞、纪磊、张成昱、陈武(2011)。实时虚拟参考咨询服务新尝试 —清华大学图书馆智能聊天机器人。现代图书情报技术,2011(4),80。 20.

(32) 圖 2-9 小圖應用程式版介面 資料來源:姚飞、张成昱、陈武(2014)。清华智能聊天机器人「小图」的移动 应用。现代图书情报技术,2014(7/8),122。 「小圖」主要功能有四:能以詼諧、輕鬆的語氣做回答;能夠針對圖書館相 關問題給出專業性、權威性解答;能在清華大學圖書館館藏中幫助讀者搜索圖書; 具有自我學習功能,使用者能對「小圖」進行教學,且「小圖」能即學即用。 (四). 成果與問題改進. 「小圖」受歡迎的原因主要是以下兩個方面:基於推理機制,「小圖」幾乎 能回答所有問題,並且以詼諧、輕鬆的語氣使得讀者體驗到樂趣;教學系統讓讀 者有參與的成就感,也使得知識庫更加豐富,能有針對性地回答越來越多。 以下敘述「小圖」所遭遇的問題:1. A.L.I.C.E 尚未有大規模的 AIML 中文知 識庫;2. 有不雅詞彙被訓練至語料庫,現已有屏蔽詞表和審核機制;3. 使用者 大部分還是注重在「小圖」的逗悶子和教學系統,真正使用參考服務的很少。由 於「小圖」在參考服務方面的效能尚未彰顯,所以需要進一步挖掘「小圖」在數 位參考諮詢方面的作用,如:推廣圖書館的服務、對使用者進行引導、建立個人 化服務、提供智慧推薦書籍及相關訊息等功能,還有更佳的關鍵技術提升。 21.

(33) 四、. 小結. LISA、Pixel 與「小圖」皆為大學圖書館參考導向之聊天機器人,均結合圖 書館既有的參考問答紀錄,都很受學生歡迎。差別為 LISA 會呈現與答覆相對應 的網頁資源, Pixel 有將學校與圖書館整個資源做整合查詢的功能,而「小圖」 只有加學校圖書館館藏查詢系統;小圖有開放教學系統給使用者訓練而 LISA 與 Pixel 沒有(見表 2-3)。學校圖書館的參考諮詢機器人如此看來大多做為輔助工 具,且較適合用於網站引導、指引性與即時性參考問題的回覆,可以作為本研究 聊天機器人建構之參考。 表 2-3 LISA、Pixel、小圖之功能差異比較 LISA. 相同處. Pixel. 1.. 大學圖書館參考導向之聊天機器人. 2.. 結合圖書館參考問答紀錄. 3.. 受學生歡迎. 小圖. 呈現與 答覆相 對應 有學校 與圖書 館資 學校圖 書館 館藏查 相異處. 的網頁資源. 源的整合查詢功能. 詢系統;教學系統. 第四節 問答系統運作機制 問答系統是聊天機器人的其中一個組件,單就語料的範圍分為開放領域、封 閉領域兩種,本研究建置之參考諮詢機器人的語料來源為針對圖書館的指引性參 考問題,因此屬於一種封閉領域類型的問答系統。本節會先簡介問答系統,說明 其運作機制,並闡述常見問題問答系統的優勢。. 一、. 運作機制. 問答系統(Question Answering System, QA System)泛指所有允許使用者利用 自然語言(即人類語言)詢問問題,並依據輸入問題提供相關答案的資訊系統(葉 鎮源,2012)。問答系統在使用者需要知道非常具體的資訊,並且沒有時間,或 22.

(34) 者只是不想自行找答案的情況下特別有用(Molla & González, 2007)。 問答系統可能會因為問答語料不一樣,又或是處理方式而有所不同的運作機 制與功能模組,但一般而言問答系統功能模組分為三個流程(圖 2-10) (葉鎮源, 2007;许文涛,2018):. 問題分析 問題分類 使用者提問. 關鍵字提取. 關鍵字擴展 答案擷取 候選答案 資訊檢索. 計算排序. 最適答案. 問答系統回覆 圖 2-10 問答系統架構 資料來源:许文涛(2018)。一份关于问答系统的小结【部落格文字資料】。取 自 https://zhuanlan.zhihu.com/p/39561907 1.. 問題分析(Question Analysis):簡單來說就是分析使用者輸入之自然語言 問句,取得關鍵字及答案類型。. 2.. 資訊檢索(Information Retrieval):從問題分析得到之關鍵字,搜尋文件 資料庫中可能包含問題答案的所有高度相關文件、語句或段落。. 3.. 答案擷取(Answer Extraction):從上一步搜尋到的相關文件辨識符合答 案類型的候選答案,排序後將最適答案回傳。 23.

(35) 二、. FAQ 問答系統. 常見問題(Frequently Asked Question, FAQ)是經常被使用者詢問,與特定主題 有關,以一問一答為單位呈現的清單,能快速且有效提供使用者答案(Bhardwaj, Pakray, Bentham & Saha, 2016)。FAQ 問答系統即是以常見問題集作為問答語料 基礎建置的問答系統,也就是問題與答案均是經人工整理,系統只需在語料庫找 出最適合的答案回覆使用者。 與其他類型之問答系統運作模式較為不同在於,因為答案與問題已經過整理, 不用從資料集的文本中擷取生成答案,所以可視為是一種文本相似度比對的運作 方式,將使用者輸入之問題與語料庫中既有問題進行比對,即可回覆使用者相似 度高之問題對應到的答案。因以下特性,機構較常以 FAQ 為基礎建置問答系統 (马勇强,2018): 1.. 系統架構較為簡易:系統運作僅需考慮使用者問題與語料庫中問題的相 似度即可取得答案;. 2.. 問題垂直封閉領域:問題領域並不是開放的,只取決於開發這個問答系 統的機構或者個人的需要業務範圍;. 3.. 問答的可改性:若問題或答案因業務而有所變動,因僅比對問題,只要 有將問題指引到正確答案,不會影響系統比對效果。. 從此節得知 FAQ 問答系統適用於封閉領域的問題,且簡化一般問答系統要 提取答案的步驟,而本研究第三節聊天機器人在圖書館之應用有提及均採用學校 的參考問答紀錄作為語料,因此會以本節所述之問答系統架構,並以 FAQ 問答 系統運作方式,設計並建置參考諮詢機器人。. 24.

(36) 第三章 研究方法 本章將分為四節說明,第一節為建置參考諮詢機器人使用之開發平台與工具、 第二節為研究場域與對象、第三節為研究方法與系統架構、第四節為研究實施與 步驟。. 第一節 開發平台與工具 本研究之參考諮詢機器人使用的開發平台為 LINE Bot,以 Python 進行程式 的編寫、OpenPyXL 進行 Excel 資料表讀取與寫入,並使用 Jieba 進行中文斷詞、 Beautiful Soup 協助網頁爬蟲作業。使用評估部分則是以五分量表進行滿意度調 查,收回之滿意度與正確率以 Excel 進行計算。. 一、. LINE Bot. LINE 在 2016 年 9 月底的「LINE Developer Day 2016」大會上發表了功能性 高、且可提供開發人員豐富支援的 Messaging API(訊息應用程式介面)功能, 一般而言被稱為「LINE Bot 聊天機器人」 , 創立 LINE@帳號即可有基本的免費 功能可使用。 根據臺灣網路資訊中心(國立政治大學統計系,2017)的報告指出,回應者 中有 97.1%有在使用 LINE,而 Facebook 的 Messenger 僅 27.5%的人使用,考慮 到使用者便利性、不用再額外下載應用程式的問題,本研究決定採用 LINE Bot 作為開發平台。. 二、. Python. Python 是一種廣泛使用的高階程式語言,屬於通用型程式語言,由 Guido van Rossum 創造,第一版釋出於 1991 年。可以視之為一種改良的 LISP,加入一些 其他程式語言的優點,如物件導向。作為一種直譯語言,Python 的設計哲學強調 代碼的可讀性和簡潔的語法。 25.

(37) 三、. OpenPyXL. OpenPyXL 由 Eric Gazoni 與 Charlie Clark 創建,是一個可以讀取也可以寫 入 Excel 2010 xlsx、xlsm、xltx、xltm 檔案格式的 Python 函式庫,能支援讀取現 成的 Excel 文件或是創建全新的 Excel 文件。. 四、. Jieba. Jieba 是中國開發者 Sun Junyi 所開發的中文斷詞程式,可用於多種程式語言, 主要是使用前綴樹(Trie)資料結構結構來進行字典配對,並將配對中剩下的單字 以隱藏式馬爾可夫模型(Hidden Markov Model, HMM)來組合產生出新詞。Jieba 本 身是以處理簡體中文為主,繁體中文與臺灣慣用語的部分功能不是很全,而本研 究聊天機器人是以繁體中文做問答,故會採用專門處理臺灣繁體的 Jieba 衍生版 本「jieba-zh_TW」。. 五、. Beautiful Soup. Beautiful Soup 是一個 Python 的函式庫模組,可讓開發者快速解析網頁 HTML 或 XML 碼,從中抓取所需資訊,進行爬蟲作業。Beautiful Soup 提供三大 功能讓開發者快速解析網頁:提供簡單的 Python 方法與語法以便於導覽、搜尋、 修改分析樹(parse tree);會自動將傳入的文檔轉換為 Unicode 編碼,將傳出的文 檔轉換為 UTF-8;可用於不同 Python 解析器上,以利靈活運用。 前述五項為在本研究建置參考諮詢機器人時欲使用工具之介紹,其各自在本 研究所扮演的角色與欲達成之目的詳見表 3-1。. 表 3-1 平台與工具之功能與目的 平台與工具. 功能與目的 作為本研究建置參考諮詢機器人的開發平台,讓使用者可. LINE Bot. 以透過 LINE 使用建置完成的機器人。. 26.

(38) 平台與工具. 功能與目的. Python. 作為本研究建置參考諮詢機器人之基礎程式語言。. OpenPyXL. 用於存入斷詞與關鍵字提取結果進 Excel 表單,當要與使 用者問題進行相似度比對,則從 Excel 表單做讀取動作。. 用於處理問答語料庫的問題與使用者輸入之問題,進行斷. Jieba. 詞並提取關鍵字,以便於進行問題的相似度比對。. 用 於 進 行 臺 師 大 館 藏 查 詢 系 統 (Online Public Access Beautiful Soup. Catalog, OPAC)與臺師大圖書館「開放時間」頁面爬蟲作 業,以達參考諮詢機器人之 OPAC 與開館時間查詢功能。. 第二節 研究場域與對象 本研究場域為國立臺灣師範大學圖書館,而研究對象為國立臺灣師範大學之 學生。. 一、. 研究場域. 本研究場域為國立臺灣師範大學圖書館,根據第二章文獻探討—聊天機器人 在圖書館之應用介紹的 LISA、Pixel 與小圖,均使用其圖書館的參考紀錄與常見 問答集,還有聊天機器人適合指示性與即時性參考問題的特性,因此本研究之參 考諮詢機器人也將採用臺師大圖書館之參考紀錄與常見問答集。而要能使用必須 先瞭解它是如何產生,又是在何處,才能做資料處理。讀者可以在臺師大圖書館 線上諮詢台之「我要發問」進行提問,表單需填寫欄位有:發問者、標題、內容 與發問者身份確認(見圖 3-1),取 2013 年 2 月 18 日至 2018 年 6 月 19 日之參 考問答紀錄。. 27.

(39) 圖 3-1 臺師大圖書館線上諮詢台「我要發問」 資料來源:我要發問。2018 年 6 月 24 日,取自臺師大圖書館官方網站: http://www.lib.ntnu.edu.tw/comment/comment.add.jsp 常見問答集則是放在臺師大圖書館線上諮詢台「常問問題」頁面(見圖 3-2) , 其主題分為:館藏查詢、E-mail 圖書流通通知單、受贈圖書資料處理、校外人士 入覽服務、紙本期刊館藏、紙本期刊位置、紙本期刊找不到、紙本期刊外借、電 子期刊資源、博碩士論文系統、無線網路、資料庫校外連線、圖書附件借閱方式、 圖書資料分類編目、圖書資料遺失賠償、圖書資訊採(薦)購、辦證服務、影印 服務、公館分館場地設備申請使用,共四十個問答。. 圖 3-2 臺師大圖書館線上諮詢台「常問問題」 資料來源:常問問題。2018 年 6 月 24 日,取自臺師大圖書館官方網站: http://www.lib.ntnu.edu.tw/service/faq.jsp 28.

(40) 另有讀者會詢問與開館時間有關的參考問題,尤其是可能適逢節日有連假時, 會較不清楚開館時間,而臺師大圖書館又有不同的分館,開放時間不盡相同,增 加了讀者釐清開館時間的複雜度,關於此類的參考問題又有較需即時回覆之限制。 因此本研究建置之參考諮詢機器人會包含開館時間的查詢,臺師大圖書館開放時 間「學期中」 (圖 3-3) 、 「寒暑假」 (圖 3-4)是以表格呈現開館時間,而「每月開 閉館」則是以行事曆的方式呈現(圖 3-5)。. 圖 3-3 臺師大圖書館開放時間「學期中」 資料來源:開放時間「學期中」。2018 年 1 月 19 日,取自臺師大圖書館官方網 站:http://www.lib.ntnu.edu.tw/about/opening-hours.jsp. 圖 3-4 臺師大圖書館開放時間「寒暑假」 資料來源:開放時間「寒暑假」。2018 年 1 月 19 日,取自臺師大圖書館官方網 站:http://www.lib.ntnu.edu.tw/about/opening-hours.jsp 29.

(41) 圖 3-5 臺師大圖書館開放時間「每月開閉館」 資料來源:開放時間「每月開閉館」。2018 年 1 月 19 日,取自臺師大圖書館官 方網站:http://www.lib.ntnu.edu.tw/about/opening-hours.jsp 為增加參考諮詢機器人功能豐富度,且館藏系統也是圖書館常會使用的功能, 因此本研究建置之參考諮詢機器人也會包含館藏系統的查詢,臺師大圖書館館藏 系統查詢結果頁面見圖 3-6。. 圖 3-6 臺師大圖書館 OPAC 關鍵字檢索 資料來源:館藏資源查詢(關鍵字檢索)。臺師大圖書館官方網站。2019 年 1 月 19 日取自 http://www.lib.ntnu.edu.tw/holding/doQuickSearch.jsp 30.

(42) 二、. 研究對象. 本研究以國立臺灣師範大學之學生為主要研究對象,選擇十名受測者,依據 設計完成的任務進行實驗,並調查其對於參考諮詢機器人回覆之滿意度。. 第三節 研究方法與系統架構 本研究依研究目的分為兩大部分進行研究,第一部分採實際建置一個系統, 為建置國立臺灣師範大學圖書館參考諮詢機器人;第二部分採用實驗設計與正確 率計算,調查此參考諮詢機器人的使用評價。. 一、. 實際建置系統. 根據本研究目的一與第二章文獻探討,擬定之系統架構(見圖 3-7)將分為 三階層,第一層為使用者介面,使用者可從臺師大圖書館小幫手 LINE@發送訊 息,而訊息會在第二層訊息控制層進行接收與判斷,接著進入第三層自然語言問 答系統,經判斷規則模組判斷後會依判斷結果進入機器人功能模組,此部分包含 館藏查詢、開館查詢與問答語料庫回覆三大功能,判斷規則模組還包含拿取問答 語料庫資料,進行問題與關鍵字相似度比對、經排序後返回最適答案的任務,最 後訊息透過訊息控制層再度回到使用者介面。. 31.

(43) 使用者 介面. 臺師大圖書館小幫手 Line@. 訊息 控制層. 訊息接收. 自然語言 問答系統. 判斷規則. 文本判斷. 訊息輸出. 館藏查詢. 臺師大 OPAC. 開館查詢. 臺師大 圖書館網頁. 問答語料庫. 圖 3-7 系統架構圖. 二、. 實驗評估. 根據本研究建置之參考諮詢機器人問答語料庫,將問題分為五大類:服務申 請與說明、硬體設備介紹、資源查詢指引、圖書館資訊、系統相關,加上機器人 另外兩項功能:館藏查詢與開館查詢,設計成七項任務製成「臺師大圖書館小幫 手實驗評估」文件(附錄五) ,讓受測者根據此文件對參考諮詢機器人進行提問, 並對於機器人的回覆進行五分量表滿意度評估。另外再根據受測者之提問,比對 回覆是否為系統中的正確答案,進行正確率計算。. 32.

(44) 第四節 研究實施與步驟 本研究就步驟分為三大步驟,分別為前置作業、系統建置、使用評估與結果, 以下為詳細的實施步驟(見圖 3-8): 前置作業. 系統建置. 使用評估與結果. 發想研究動機. LINE Bot連接. 實驗設計與製作. 擬定研究目的 與問題. 伺服器架設. 實驗進行與調查. 進行文獻探討. 問答系統建置. 分析並撰寫 研究結果. 圖 3-8 研究流程圖. 一、. 前置作業. 此階段作為系統建置、使用評估與結果的前置步驟,包含發想研究動機、擬 定研究目的與問題並進行文獻探討,為了瞭解大學圖書館參考諮詢機器人之功能 特性與所需模組,以利系統的設計發想,文獻探討會包含數位參考服務、聊天機 器人發展與技術、聊天機器人在圖書館之應用、問答系統運作機制。. 二、. 系統建置. 根據前置作業得出結果設計系統,此階段首先要先建置問答系統,此步驟又 分為三部分功能:館藏查詢、開館查詢、問答語料(詳見圖 3-9) ,功能建立好接 著需設定一個判斷規則模組,以判別使用者的問題是進入哪個功能,還有與問答 語料庫問題相似度比對,從問答語料庫返回最適回覆。最後架設伺服器以連接到 LINE Bot 供使用者使用。 33.

(45) 撰寫 OPAC python 爬蟲程式. 撰寫開館時間 python 爬蟲程式. 整理與分類 參考問答紀錄. 問句文 字處理. 擷取出問題 的關鍵字. 館藏查詢. 開館查詢. 判 斷 規 則. 參考問答. 圖 3-9 問答系統建置流程圖. 三、. 使用評估與結果. 此階段依據設計好的七項任務,請受試者對研究建置完成的參考諮詢機器人 進行提問,並根據每一項任務之結果進行五分量表滿意度調查,以進行使用評估, 接著計算回覆的正確率,最後分析實驗結果並撰寫成研究結果與系統尚須改進之 處。. 34.

(46) 第四章 參考諮詢機器人建置與評估 本章共分為六節,第一節說明本研究參考諮詢機器人整體的建置流程,第二 節到第四節則是細部說明系統建置方法與過程,第二節是關於參考諮詢機器人三 大功能中的館藏查詢與開館查詢功能,在此節會詳細說明這兩項功能是如何撰寫, 運用何種條件判斷以從臺師大圖書館網站抓取所需資訊回覆讀者;第三節是說明 建置問答語料庫的前置作業,將闡述資料建檔、篩選、內容清理、分類的過程; 第四節會介紹參考諮詢機器人系統中的相似度比對方法,第五節展示本研究參考 諮詢機器人建置之成果,第六節則說明系統評估結果。. 第一節 參考諮詢機器人建置流程 本研究參考諮詢機器人建置流程分為三大區塊:功能模組建置、判斷規則模 組建置、伺服器架設(圖 4-1) 。首先會先建置功能模組,此部分包含館藏查詢模 組、開館查詢模組與問答語料庫,館藏查詢與開館查詢模組均是以 Beautiful Soup 套件進行網頁內容抓取,將獲取資料經整理後再回覆給使用者。 在此階段問答語料庫建置是最為耗時且繁雜,搜集到的參考紀錄與常問問答, 需要先經過篩選與清理才能使用,最重要的是要畫分出哪些問題是可以機器人代 為回答,哪些是需要館員親自回覆,擇適當的問答留下後進行問答分類。問答語 料庫建置後半流程,要經過斷詞、同義詞轉換、停用詞移除後,提取關鍵字儲存, 以便後續與使用者輸入問句之相似度比對,到此問答語料庫才算建置完成。 第二階段判斷規則模組建置,此模組與問答語料庫建置一樣需要問句處理的 過程,而此階段最重要的任務即為相似度計算,而為了能提升相似度的精確度, 要依據問答語料庫的關鍵字與意圖分類,建立簡易問題分類器,讓問題經過初步 主題分類後再進行相似度比對,問題進入判斷規則模組的流程可見圖 4-2。最後 因 LINE Bot 需要 https 才能與之連線,因此會透過 ngrok—一個可以從本地主機 (localhost) 對應到 https 公用域(public domain)的服務,讓資料可以順利傳到 LINE Bot。. 35.

(47) 參考紀錄 問答語料搜集 常問問題 制定問答語料欄位. 建立 EXCEL 文件 館. 開. 藏. 館. 查. 查. 詢. 詢. 模. 模. 組. 組. 建. 建. 置. 置. 問答語料篩選 問. 答. 問答內容清理. 語 料 問答分類. 人工分類. 庫. 建 問題文字處理. 提取關鍵字. 儲存 EXCEL 文件. 判斷規則模組建置. LINE Bot 連接. 圖 4-1 參考諮詢機器人建置流程圖. 36. 置.

(48) 使用者提問. 問題分析 問題分類. 找館藏. 館藏查詢模組. 關鍵字提取. 關鍵字擴展 判 斷 規 則 模 組. 資訊檢索 問答語料庫. 答案擷取 候選答案. 問題分類器. 計算排序. 最適答案. 圖書館資訊 、開館時間. 問答系統回覆 圖 4-2 判斷規則模組流程圖. 37. 開館查詢模組.

(49) 第二節 館藏與開館查詢功能撰寫 系統三大功能中其中兩項為館藏查詢與開館查詢,本節將說明這兩項功能的 模組建置過程。. 一、. 館藏查詢模組建置. 判斷規則模組判斷結果使用者輸入之字串開頭為「找館藏」,即會進入館藏 查詢功能模組,而「找館藏」後面銜接之字串則視為使用者欲在臺師大館藏系統 查詢之關鍵字。館藏查詢模組是用 Python 程式語言加上 Beautiful Soup 套件撰寫 而成,從臺師大圖書館館藏系統抓取書目資料。將搜尋的欄位設為關鍵字檢索, 接著找尋搜尋結果頁面顯示的第一筆紀錄,將書名與作者,還有該筆書目資料的 連結,回覆給使用者,為方便使用者進行更進一步獲取相關資訊,會將搜尋結果 頁面的連結,一並回覆給使用者。. 二、. 開館查詢模組建置. 開館查詢模組是為能幫助使用者獲取開館資訊,此部分一樣用 Python 程式 語言加上 Beautiful Soup 套件撰寫而成,當經過判斷規則模組進入開館查詢模組 後,會有三個函式進行判斷,判斷流程可見圖 4-3,第一個函式須先判斷是否有 特殊字串(表 4-1)以決定是否直接回覆使用者答案又或是進入其他模組。. 38.

(50) 國定假日 輸入內容是否有特殊字串 寒暑假 今天、現在 明天 (其他). 標準化輸入內容日期的格式. 「國定假日閉館一日」+「開放時間」頁面 「開放時間」寒暑假頁面 今天模組 明天模組 日期模組. 年年年年月月日 日. 判斷開館時間 切確開館時間 圖 4-3 開館查詢判斷流程圖 表 4-1 開館查詢模組第一個判斷函式之判斷條件 判斷條件. 可能情況. 最終輸出. 有「今天」或「現在」 進入今天模組 有「明天」 輸入內容是否 有「放假節日」 有特殊字串. 進入明天模組 回覆使用者「國定假日閉館一日」並附 上臺師大圖書館「開放時間」頁面. 有「寒暑假」. 回覆使用者臺師大圖書館「開放時間」 寒暑假頁面. 其他狀況. 進入日期模組. 進入日期模組後會先遇到第二個判斷函式,主要是要標準化輸入內容日期的 格式(表 4-2) ,進入函式後會先將中文字的日期擷取出來轉換為阿拉伯數字,而 接著將均為阿拉伯數字的日期統一轉化為「年年年年月月日日」格式,若有日期 不完整,例如:僅有日或是詢問一整個月份的開館時間,則輸出字串「日期不完 整」。 39.

(51) 表 4-2 開館查詢模組第二個判斷函式之判斷條件 第一層 判斷條件. 可能情況. 第二層判斷條件. 可能情況. 最終輸出. 為四位數. 僅有月、日. 年年年年月月日日 為三位數, ( 第 一 層 判 斷 可 能 情 月補零 況為「僅有月、日」時. 有西元年、 月、日. 自動補現在的西元年; 輸入內容 輸入內容日期的月 為三位數, 「有民國年、月、日」 的日期是 日是否為四位數, 日補零 時將民國年轉為西元 否有年份 有 民 國 年 、 若不是則補零 年) 為兩位數, 月、日 月、日補零. 日期不完整. —. 字串「日期不完整」. 接著處理好日期的日期模組、今天模組、明天模組會進入最後一個判斷函式 (表 4-3,藍底為最終輸出結果) ,擷取臺師大圖書館「開放時間」每月開閉館頁 面的資訊,以回覆使用者詢問日期之切確開館時間。. 40.

(52) 表 4-3 開館查詢模組第三個判斷函示判斷條件 第一層 第二層 可能情況 可能情況 判斷條件 判斷條件. 第三層判斷條件. 可能情況. 第四層 可能情況 判斷條件. 1.輸入內容的日期在行事曆 若第二層 上為開館時間有調動 判斷為 1、— — — — 2.輸入內容的日期在行事曆 2、3 是當日 上為閉館 寒暑假一到四 都開館 3.輸入內容的日期在公告中 開館時間有調動 寒暑假週五 總館開館、兩分館閉館 輸入日期 輸入日期 若第二層 總館與公館分館開館、林口 的 星 期 為 寒暑假週六 的開館狀 輸入內容 判斷為 4 輸入內容 分館閉館 4.輸入內容的日期在行事曆 何 態為何 的日期是 的日期是 上沒有註記且為寒暑假時段 都閉館(某日有開但當下查 否為特殊 寒暑假週日 否為當日 詢時間不在開放時間內) 狀況 5.輸入內容的日期在行事曆 都開館 不是當日 上沒有註記且為學期中平日 總館開館、兩分館閉館 (一到五)時段 若第二層 輸 入 日 期 — 判斷為 5、的 開 館 狀 總館與公館分館開館、林口 — 6.輸入內容的日期在行事曆 態為何 分館閉館 6 上沒有註記且為學期中假日 都閉館(某日有開但當下查 (六、日)時段 詢時間不在開放時間內). 41.

參考文獻

相關文件

國立臺北教育大學教育經營與管理學系設有文教法律碩士班及原住民文

4.6

系組名稱 英文名稱 系所分則 實習或課程規定.

配合小學數學科課程的推行,與參與的學校 協作研究及發展 推動 STEM

學校名稱 系代碼 系科名稱 名額 備   註 1110073 特殊教育學系 1 *總成績須達本類組均標。.

STEM 教育課程領導學習社群 參與者 每所參與學校的核心教師團隊成員 每所參與學校的 2-3名課程領導

就學與就業之職能 治療暨實習、職業 輔導評量學暨實 習、職業復健暨實 習、職能評估與職 業復健暨實習、職 業輔導評量專題研 究、職業輔導評量

策 – 引導資源 促進參與與發展 訂立「 財政預算 」政策 1.3 應對學生人口下降 – 訂. 立處理超額教師機制 凝聚團隊及擴充財政