自然語言處理

二、文獻探討

2.4 智慧型代理人

2.4.3 自然語言處理

自然語言是人類溝通所使用的任何語言，人工智慧既然想將機器變得跟人一樣有智慧，可模擬人類的行為，就應該理解人類的語言。對電腦來說「自然語言處理」（natural language processing）是指從自然語言到機器內部表示之間的一種映射，就是研究如何能讓電腦理解並生成人們日常所使用的（如：漢語、英語）語言，使得電腦懂得自然語言的含義，並對人給電腦提出的問題，通過對話的方式，用自然語言進行回答，目的在於建立起一種人與機器之間的密切而友好的關係，讓電腦能夠理解一句話或是一篇文章，對所給材料進行摘要的功能，能成功地回答和輸入材料有關的問題，讓電腦能夠清楚它目前可做的事，能進行高度的資訊傳遞與認知活動，以便完成一些我們想要的功能（Mauldin, 1994）。

自然語言處理研究在電腦問世之初就開始了，並於 50 年代初展開了機器翻

生成語法得到廣泛的認可，生成語法的核心是短語結構規則，分析句子結構的過程就是利用規則自頂向下或自底向上的文法分析樹生成過程。由於認識到生成語法缺少表示語意知識的手段，在 70 年代隨著認知科學的興盛，研究者又相繼提出了語意網路、CD 理論、框架等語意表示理論。這些語法和語意理論經過各自的發展，逐漸開始趨於相互結合。到 80 年代一批新的語法理論脫穎而出，具有代表性的有詞彙功能語法（LFG）、功能合一語法（FUG）和廣義短語結構語法（GPSG）

等。

處理自然語言需要大量的知識，想要電腦了解一個簡單的句子，必須將一個句子分割成不同的成分來分析，即建立起一個和該簡單句相對應的機器內部表達，需要做以下兩方面的工作：

1.理解敘述中的每一個詞。

2.以這些詞為基礎組成一個可以表達整個敘述意義的結構。

這不是一個很容易的工作，因為許多單字不只一種含意，往往需要透過語形、文法分析、上下文關係等才能確定。要聯合單字來構成表示一個句子意義的結構，需要依賴各種訊息源，包含所用語言的知識、敘述所涉及領域的背景知識以及有關該語言使用者應共同遵守的習慣用法的知識。由於解釋過程涉及到許多事情，因此常常將這項工作分成三個部分來進行（Chung & Moldovan, 1995）： 1.句法分析（lexicology analysis）

為了要確保敘述含意的細節不被忽略，必須確定其敘述結構上的細節，就是要進行文法分析。首先寫出說明該特定語言中符號字串結構的文法，以便為每個符合文法規則的敘述產生一個被稱為文法分析樹的結構。

2.語意分析（semantics analysis）

只根據詞性來分析一個敘述文法結構，並不能保證其正確性，需要藉助詞義來確定，也就是進行語意分析。進行語意分析是使用語意文法，在傳統的短語結構文法的基礎上，將名詞、動詞等語法分類的概念，用各領域的專門類別來代替。

3.語用分析（pragmatics analysis）

為確定真正含義，對表達的結構重新加以解釋，有時必須看句子的前後文、說話當時的環境與狀況以及說話者對談論對象的認識。

實際上這三個階段之間是互相關聯的，是以各種方式相互影響的，要絕對分開是不可能的。

但「理解」本身不是一個絕對的概念，所以一個自然語言處理程式的好壞或成功與否是很難用一個絕對的判斷標準來衡量。現有的手段雖然基本上掌握了單個句子的分析技術，但是還很難覆蓋全面的語言現象，特別是對於整個段落或篇

章的理解還無從下手。（Mauldin, 1994）

在電腦教學環境中，介面通常使用自然語言處理來促進智慧型教師系統與學生的溝通（Chou, Chan, & Lin, 2003）。透過一些自然語言的技術來分析使用者的對話，我們才可判斷使用者在說什麼，幫助我們了解並記錄使用者說話的內容，

雖然這樣做並沒有辦法百分之百完全正確地判讀，但大部分的「對話內容」已可順利地利用此方式轉換成「分數」。

在文檔中網路中介模擬環境中的多元智能評量－在情境中利用Agents收集學生資訊 (頁 50-53)

二、 文獻探討

2.4 智慧型代理人

2.4.3 自然語言處理

二、文獻探討