人工智慧新革命人工智慧新革命 -- 超級電腦「華生超級電腦「華生」

(1)

人工智慧新革命--超級電腦「華生」

New Era for Artificial Intelligence—SuperCompuer

「Watson」

*_吳旻純 *_{高雄師範大學工業科技教育學系研究生} 摘要科技不斷地演進代表著人類生活亦跟著進步，在我們高度依賴科技的同時，是否曾思索過”科技會取代人類”？因此本文中將介紹擁有超強人類思考邏輯且可以跟人類一起在即時問答益智節目中競賽的超級電腦--「華生」，說明華生如何運用智慧打敗人類競爭者及其未來之發展應用，而華生的勝利也揭櫫人工智慧新的里程碑。關鍵字：人工智慧、超級電腦、華生 壹、前言 人工智慧（artificial intelligence）是讓電腦具有人類的知識與行為，並且具有模仿學習、推理判斷來解決問題及記憶知識和瞭解人類自然語言的能力。自 1950 年開始即有科學家開始著手從事人工智慧的研究，最先是由英國數學兼邏輯學家「圖靈」（Turing）迸發關於電腦是否擁有人類智慧並進行相關探討因而被尊稱為人工智慧之父。圖靈為了解決數學運算的問題，發展出一套簡單運算模式並將其應用在一般的電子計算機，也就是現在所稱的圖靈機（ Turing Machine），而其說明電腦具有學習和思考的能力，因為電腦只需執行新的程式，它就能改變自己的「行為」即是智慧的表現(French,2000; 韓瓊、胡靜，2008)。因而圖靈針對用來判斷電腦是否具備思考能力所提出的「圖靈測試」（Turing test）即成為了辨別電腦智能高低的標準。「圖靈測試」是圖靈透過模仿遊戲（imitation game）所發展出的概念，即當透過電腦與 X 交談，如無法分辨交談者是電腦程式抑或是真正人類使用者時，此電腦程式便通過圖靈測試認定為具備仿人類的思考邏輯能力(Turing,1950)。人工智慧的演進主要分成如下五個階段(人工智慧原理與意義，無日期)：

(2)

2 一、1940～1960 時期：電腦問世，此時期研究重心擺在定理證明與通用問題求解；如：數字理論證明、西洋棋、西洋象棋等研究。二、1960～1970 時期：研究重點在於使電腦具有理解能力。在此時期，人工智慧語言 LISP 開發出來，機器人學受到重視，除了著重於具有推論及搜尋的流程控制能力之外，還需擁有大量的知識能力，因而許多知識表示方法問世。

三、1970～1980 時期：利用述語邏輯（Predicate Logic）開發出來的 PROLOG 語言問世，針對特定問題領域所開發出來的專家系統（Expert System）大量出現。四、1980～1990 時期：技術上逐漸有所突破，尤其是機器學習與模糊資訊處理方法的發明，讓電腦逐漸可以擁有『常識』。五、1990～迄今：硬體速度及軟體發展讓人工智慧系統有強大的運算能力做後盾，網際網路的普及，更讓人工智慧系統有豐富的資訊來源與活動的空間。

最讓人類驚嘆的莫過於 1997 年由 IBM 公司所研發的 Deep Blue 電腦系統打敗世界棋王 Garry Kasparov 後，掀起了新一波人工智慧潮，著手鑽研具有更強大的電腦運算能力且具有智慧的超級電腦。因此 IBM 決定投入百億巨資與 25 位科學家歷經四年時間，開發出能聽懂人類語言、回答困難問題的超級電腦，並以 IBM 創辦人之名命名為「華生」（Watson）(王曉玟，2011)。本文將針對超級電腦「華生」做相關簡介及其在人工智慧上之發展與應用做探討。 貳、超級電腦「華生」

華生（Watson）是 IBM 繼深藍（Deep Blue）後由華生研究中心費魯奇博士（Dr. David Ferrucci）最新研發出超強人工智慧電腦，運用 IBM 開發出問答系統（DeepQA）為運算結構，而問答系統在電腦科學與人工智慧應用上是一大挑戰，因為要回答不同的問題程式系統需要迅速整合資訊檢索、自然語言處理、知識表徵及推理能力，並同時應對人機介面的互動。因此將華生的設計概念規劃在可以挑戰即時問答模式的益智節目《Jeopardy》並與人類參賽者一較高下(Ferrucci et al., 2010)。一、華生之架構

(3)

在硬體部分，華生是結合強大的平行運算處理器、90 台高速運算伺服器及 2,880 個處理器核心組成，能即時運算 15TB（terabyte）的數據，且運算速度每秒可執行 80 兆個指令。而華生的記憶體被灌輸了 100 萬本書，相當於 2 億頁的資料內容，內容包羅萬象，舉凡天文地理、醫學，甚至是百科全書跟地圖圖鑑等全是華生的智慧來源。為了要挑戰即時問答的益智節目，華生必須要具備龐大的資料庫且快速的搜尋能力，因此華生在此種硬體設備的支援下，當華生要回答問題時，會先運用 600 萬條邏輯規則來瞭解人類語言的意義脈絡，立即從資料庫中搜索、瀏覽，同時比照兩億頁的文字，交叉分析文章段落、確認語意，在沒有連上網的情況下，三秒內回答問題(Watson, 2011; 王曉玟，2011；連以婷，2011)。

在軟體部分，華生是由 C++及 JAVA 語言共同撰寫並結合 Apache Hadoop1架

構來進行分散式運算，利用 100 多種不同的方法來分析自然語言、定義來源、產生假設並透過攫取正確訊息來確認假設，進而合併排序答案，推定可能答案範圍（Watson, 2011）。二、問答系統 DeepQA IBM 所研發出的 DeepQA 問答系統是要克服電腦科學及人工智慧在自然語言上的運用，且同時結合強大資料檢索及推理的能力，可以應付開放式即時問答系統並與人類參賽者匹敵。在 DeepQA 系統中主要包含幾項重要的元素(Ferrucci, et al., 2010)： （一）資料內容攫取（content acquisition）此階段是在蒐集及定義資料以供答案資料庫（answer sources）及證據支援資料庫（evidence sources）之用。首先從題庫中去分析例題並產生對不同種類題目的描述及應用範疇的特徵，透過此步驟可免除單筆資料的比對，只需搜尋相關關鍵資訊即可以迅速的找到答案。（二）問題分析（question analysis）問題分析是整個 DeepQA 系統中是相關重要的一個階段，當系統接受到訊號後，必須快速的理解題目的內容是什麼後，並分析決定系統接下來所要處理的程序。在此階段是將許多的專家系統結合來做進一步分析，如類型劃分、深淺層語法分析、邏輯分析、語意及主賓語一致等拆解（decomposition）題目的步驟。 1 Apache Hadoop 是一種用來開發穩定及大量運算的開放碼軟體，常見於雲端運算。

(4)

4 （三）產生假設（hypothesis generation）經過問題分析之後，系統整理並搜尋相關資料從搜尋結果中挑選出可能的候選答案（candidate answer），而每個候選答案在系統裡都會產生相對的假設問題，而系統必須要能證明假設為真的能力。而此階段控制著系統決定回答或不回答的關鍵點，若在搜尋結果中判斷不出候選答案時（如信心水準不夠），即選擇放棄回答，其為針對益智節目《Jeopardy》答錯倒扣分數型態所做的回應。（四）初步篩選（soft filtering）在產生假設階段會產生約數百筆的候選答案，而系統要在答案與準確度中做衡量演算，透過演算將大筆候選答案篩減成更精確的目標答案。而此種篩選機制標準是機器經由大量資料不斷反覆練習，所獲得的資料探勘的結果。

（五）假設與證據評估（hypothesis and evidence scoring）

通過初步篩選階段後，需要更精準的評估程序來定義答案範圍。系統透過證據檢索的方式攫取更多的支持來源，再經由更細節的篩選機制不斷地比對分析，來縮小候選答案的數量。

（六）最後彙整與排序（final merging and ranking）

DeepQA 系統進行到此階段正式進入答案產生的程序，再一次的分析問題與內容以便確認答案及支持此答案的信心水準和準確度。亦即此階段的目的是去評估在不同階段篩選之後的假設其可確認出最終答案假設的可能性及正確性。（七）答案彙整（answer merging）一個問題可能會產生很多元的候選答案，若候選答案之間具有關聯性的話，系統在答案排序上會出現混淆的現象，例如國父是誰？候選答案可能會產生孫中山、孫逸仙或孫文。因此在 DeepQA 系統中會先將透過觀察去區辨形式上的關聯性，然後再整合答案及正確性評估，如得到可能候選答案為孫中山、孫逸仙或孫文時，系統會將三個答案合併為同一個答案，再將之間的關聯性結合佐以更多檢索資料的支持得出最終答案。

（八）答案排序與準確信心評估（ranking and confidence estimation）經過一連串的分析、比對及歸納等程序，系統會產生最終正確答案。DeepQA 系統是透過一連串的訓練及篩選機制模式的機器學習方法，此種階層式的訓練模式可透過反覆的訓練、修正來加強系統思考邏輯的彈性。

(5)

後進行分析歸類，產生大量候選答案假設後，再透過初步篩選機制去排除錯誤假設，檢索更多支持資訊去聚焦答案範圍，最後將答案整合並確認其正確性，而得出最終正確答案。如華生接受到問題為「第二十一屆金曲獎最佳國語女歌手且具有台灣國籍並與籃球明星交往是誰？」華生會先分析這是屬於”影視娛樂類”，然後再確認問題中「是誰=第二十一屆金曲獎最佳國語女歌手」為答案，開始產生候選答案假設，如是蔡健雅嗎？是張惠妹嗎？是陳綺貞嗎?是莫文蔚？是黃小琥？是張懸嗎？再進行初步篩選，「具有台灣國籍」即排除蔡健雅及莫文蔚兩者，剩下張惠妹、陳綺貞、黃小琥及張懸四位，再來進行「第二十一屆金曲獎最佳國語女歌手」、「具有台灣國籍」及「籃球明星交往」之間的交集檢索，即可將答案整合得出正確解答為「是張惠妹嗎？」 参、益智節目《Jeopardy》挑戰 益智節目《Jeopardy》是美國家喻戶曉的電視節目自 1984 年播放至今，其節目型態是參賽者經過 50 題問答的資格賽，之後三位挑戰者進行三回合的比賽，前兩回合由挑戰者從典型問答板上（如圖 2）先選擇類別（category），然後 圖 1 DeepQA 高階架構圖

資料來源： Ferrucci, D., Brown, E., Chu-Carroll, J., Fan, J., Gondek, D., Kalyanpur, A. A., et al. (2010). Building Watson: An Overview of the DeepQA Project（p69）. AI

(6)

6 每格獎金都隱含著一個提示（clue），當主持人唸完提示後答案板會亮起搶答燈，此時挑戰者可由手持按鈕搶答，但挑戰者若在搶答燈亮起前按鈕搶答的話，則下次按鈕則會延遲半秒，而答對可得標記獎金；答錯則會倒扣獎金，第二回合的獎金會加倍，至於第三輪則是考驗挑戰者的智慧與運氣，此回合會先顯示類別並要求寫下賭注的金額，挑戰者可以選擇少於本身獎金賭注抑或全押，賭注確定後會透露提示，挑戰者必須在 30 秒完成答案，答對者可獲得雙倍獎金，而最後獲得最多獎金者即為獲勝者(Ferrucci, et al., 2010)。要戰勝《Jeopardy》的關鍵即是挑戰者信心（confidence）、答題準確度（precision）及搶答速度（answering speed），而平均每題回答時間為三秒且還必須正確才有可能打敗其他挑戰者。對於電腦系統而言，首先必須要先瞭解複雜的自然語言模式問題，自然語言一直是人工智慧上最需要克服的挑戰，華生必須要聽得懂並理解主持人唸出的提示，在短時間（約三秒或更短）內計算出答案，且平均答題率要超過百分之七十，正確率要達百分之八十才有可能與人類競爭者抗衡。 圖 2 益智節目《Jeopardy》問答題目板

(7)

華生在挑戰過程中，代表華生的是一個智慧地球的影像（圖 3），當華生對回答充滿信心的時候，地球周圍似人類神經的軌道就會充滿綠色；對於答案不確定時會產生橘色的線條，華生的表現都著實顯示人工智慧的進步，令不少人驚嘆，且華生在挑戰的過程中面對許多雙關語或謎語都過關，甚至還會開玩笑，顯示電腦懂得人類的自然語言並與人類對話，思考能力的進步開拓未來人工智慧的發展(王曉玟，2011)。華生最後打敗兩位超強人類冠軍贏得美金 100 萬的獎金意味著人工智慧的勝利，然其實華生在參加《Jeopardy》之前就與節目製作單位達成協定，即在比賽過程中所出現的題目形態排除視聽型（audiovisual question）及解說型（special instruction）的題目，視聽型即題目是一張圖片加上主持人口述提示來回答的模式；解說型則是題目是需要主持人解說內容的模式(Ferrucci, et al., 2010)。雖說華生是第一台聽得懂人類語言的電腦，但在比賽過程中需要主持人字正腔圓的口述，否則還是會出現”會錯意 ”的現象。另華生在節目中出過相當離譜的錯誤，當主持人問道「有哪個美國城市的第一大機場是以二戰英雄為名，第二大機場則是以一場戰役為名」時，華生竟回答加拿大的「多倫多」，令現場相當錯愕。不 圖 3 益智節目《Jeopardy》比賽現場，代表華生（中）為智慧星球影像，

(8)

8 過既然是人工的智慧就多少會有失誤的情況，但華生的表現已經想當優異，還獲得網路威比獎（Webby Awards）評選為年度風雲「人物」，代表電腦科學在人工智慧上的進步贏得肯定。 肆、華生之未來展望與應用 華生除了在伺服器運算能力上的突破，在資料探勘、商業分析及自然語言處理三項演算法上也有顯著進步，因華生懂得人類的自然語言，未來可將其應用在醫療、交通及金融等領域，在醫療上，華生經過大量機器學習訓練後，可協助醫生提供診斷建議，而實際上在華生參加完益智節目後已與美國哥倫比亞大學（Columbia University）醫療中心及馬里蘭大學（University of Maryland）醫學院簽訂合作協定，將把華生運用在實際醫療現場進行測試，即先讓華生檢閱大量醫學文獻及病例，爾後在醫生看診時給予相關建議(王曉玟，2011；蕭丁瑞，2011)。在商業金融應用方面，企業可以將華生運用在客戶服務業務，如銀行或保險公司可以將不同推行方案灌輸到華生的大腦，華生可以針對不同客戶需求耐心地說明業務內容。而其他領域部分，像是報案系統、交通工具訂位，天氣查詢、市民服務中心、圖書館導覽等，以華生的智慧都是可以應用的範圍。就此觀之，人類創造有思考能力的電腦無非是為了要讓生活更加便利、充滿智慧，而不是完全取代人類，因為科技始終來自於人性，有些事情是電腦科技始終無法達成的。

(9)

參考文獻 人工智慧原理與意義（無日期）。2011 年 6 月 16 日，取自 http://content.edu.tw/senior/computer/ks_ks/et/ai/chap1/index.htm 王曉玟（2011）。電腦決戰搶答節目。藍色觀點，38，頁 20-24。 連以婷（2011）。超級電腦聰明過人?。科學月刊，498，頁 428-432。 蕭丁瑞（2011）。IBM 華生聰明問答醫生未來好幫手。科學月刊，498，頁 438-443。 韓瓊、胡靜（2008）。人工智慧之父－圖靈。歷史月刊，247，頁 65 -68 。 Ferrucci, D., Brown, E., Chu-Carroll, J., Fan, J., Gondek, D., Kalyanpur, A. A., et al.

(2010). Building Watson: An Overview of the DeepQA Project. AI Magazine,

31(3), 59-79.

French, R. M. (2000). The Turing Test: the first 50 years. [doi:

10.1016/S1364-6613(00)01453-4]. Trends in Cognitive Sciences, 4(3), 115-122.

Turing, A. M. (1950). Computing machinery and intelligence. Mind, 59, 433-460. Watson (computer). (2011, June 9). In Wikipedia, The Free Encyclopedia. Retrieved

June 16, 2011, from

http://en.wikipedia.org/w/index.php?title=Watson_(computer)&oldid=4334709

人工智慧新革命 人工智慧新革命 -- 超級電腦「華生 超級電腦「華生 」

人工智慧新革命--超級電腦「華生」

New Era for Artificial Intelligence—SuperCompuer

「Watson」

人工智慧新革命人工智慧新革命 -- 超級電腦「華生超級電腦「華生」