二、 文獻探討
2.4 智慧型代理人
2.4.3 自然語言處理
自然語言是人類溝通所使用的任何語言,人工智慧既然想將機器變得跟人一 樣有智慧,可模擬人類的行為,就應該理解人類的語言。對電腦來說「自然語言 處理」(natural language processing)是指從自然語言到機器內部表示之間的 一種映射,就是研究如何能讓電腦理解並生成人們日常所使用的(如:漢語、英 語)語言,使得電腦懂得自然語言的含義,並對人給電腦提出的問題,通過對話 的方式,用自然語言進行回答,目的在於建立起一種人與機器之間的密切而友好 的關係,讓電腦能夠理解一句話或是一篇文章,對所給材料進行摘要的功能,能 成功地回答和輸入材料有關的問題,讓電腦能夠清楚它目前可做的事,能進行高 度的資訊傳遞與認知活動,以便完成一些我們想要的功能(Mauldin, 1994)。
自然語言處理研究在電腦問世之初就開始了,並於 50 年代初展開了機器翻
生成語法得到廣泛的認可,生成語法的核心是短語結構規則,分析句子結構的過 程就是利用規則自頂向下或自底向上的文法分析樹生成過程。由於認識到生成語 法缺少表示語意知識的手段,在 70 年代隨著認知科學的興盛,研究者又相繼提 出了語意網路、CD 理論、框架等語意表示理論。這些語法和語意理論經過各自 的發展,逐漸開始趨於相互結合。到 80 年代一批新的語法理論脫穎而出,具有 代表性的有詞彙功能語法(LFG)、功能合一語法(FUG)和廣義短語結構語法(GPSG)
等。
處理自然語言需要大量的知識,想要電腦了解一個簡單的句子,必須將一個 句子分割成不同的成分來分析,即建立起一個和該簡單句相對應的機器內部表 達,需要做以下兩方面的工作:
1.理解敘述中的每一個詞。
2.以這些詞為基礎組成一個可以表達整個敘述意義的結構。
這不是一個很容易的工作,因為許多單字不只一種含意,往往需要透過語 形、文法分析、上下文關係等才能確定。要聯合單字來構成表示一個句子意義的 結構,需要依賴各種訊息源,包含所用語言的知識、敘述所涉及領域的背景知識 以及有關該語言使用者應共同遵守的習慣用法的知識。由於解釋過程涉及到許多 事情,因此常常將這項工作分成三個部分來進行(Chung & Moldovan, 1995): 1.句法分析(lexicology analysis)
為了要確保敘述含意的細節不被忽略,必須確定其敘述結構上的細節,就是要 進行文法分析。首先寫出說明該特定語言中符號字串結構的文法,以便為每個 符合文法規則的敘述產生一個被稱為文法分析樹的結構。
2.語意分析(semantics analysis)
只根據詞性來分析一個敘述文法結構,並不能保證其正確性,需要藉助詞義來 確定,也就是進行語意分析。進行語意分析是使用語意文法,在傳統的短語結 構文法的基礎上,將名詞、動詞等語法分類的概念,用各領域的專門類別來代 替。
3.語用分析(pragmatics analysis)
為確定真正含義,對表達的結構重新加以解釋,有時必須看句子的前後文、說 話當時的環境與狀況以及說話者對談論對象的認識。
實際上這三個階段之間是互相關聯的,是以各種方式相互影響的,要絕對分開是 不可能的。
但「理解」本身不是一個絕對的概念,所以一個自然語言處理程式的好壞或 成功與否是很難用一個絕對的判斷標準來衡量。現有的手段雖然基本上掌握了單 個句子的分析技術,但是還很難覆蓋全面的語言現象,特別是對於整個段落或篇
章的理解還無從下手。(Mauldin, 1994)
在電腦教學環境中,介面通常使用自然語言處理來促進智慧型教師系統與學 生的溝通(Chou, Chan, & Lin, 2003)。透過一些自然語言的技術來分析使用者的 對話,我們才可判斷使用者在說什麼,幫助我們了解並記錄使用者說話的內容,
雖然這樣做並沒有辦法百分之百完全正確地判讀,但大部分的「對話內容」已可 順利地利用此方式轉換成「分數」。