第三章 自動化評估方法
第一節 概念擷取
論述題的答案通常是由一個到數個句子來表達主要的概念,因此本研究所 提方法的第一步驟是如何將概念從句子中抽取出來。故本節先討論概念的定義,
並根據學者的定義提出概念擷取的方法。
一、概念的定義
在認知心理學中,張春興(1999)認為人類認知的基礎在於如何呈現知識,如 何將知覺經驗所得來的資訊,與腦中所儲存的事結合,並以符號呈現出來。而 在過去二十年中,認知心裡學對於知識的研究有了很多新發展,其中一項是將 知識區分為「敘述性知識」(declarative knowledge)和「程序性知識」(procedural knowledge)。依照 Gagne (1977) 等人的說法 , 敘述性知識的最小單位是概念 (concept)。
概念藉詞來標誌,並且藉詞來形成,但是概念與詞的關係並不是一一對應 的。詞分實詞和虛詞,實詞(如名詞、形容詞、代詞、動詞等)表達概念,而虛詞
(如疑問詞等)一般不表達概念。同一個概念可以用不同的詞來表示,不同的概念 又可以用相同的詞來表示。
除此之外,陸汝鈴(1995)提到,語言學的系統功能學派認為每個句子中都有 動詞,每個動詞都指明了某種動作或某種關係,動作有動作主體(稱為 Actor),
和動作目標(稱為 Goal),代表了一個句子中最基本的內容。C-Rater 也採用了類
34
似的概念。C-Rater 進行批改的主要過程為擷取答案概念,該過程的第二個步驟
「語法變化的解析」,目的是將句子中的詞對擷取出來。表 3-1 是 C-Rater 擷取 詞對的說明,例如在句子「Most people at the country show would say that country music is the most popular music」中,C-Rater 透過語法變化的解析將句中的主詞 (subject)「most people」、「country music」及其對應的動詞「say」、「be」和受詞 (object) 「most popular music」抽取出來並形成詞對。
我們可以觀察出擷取出的詞對組合,都是主詞、受詞與動詞之間的組合,
例如動詞加上主詞(例如「say」與「most people」)或是動詞加上受詞(例如「answer」
與「country music」),而主詞或受詞則是由形容詞和名詞或是只有名詞組成。
因此 C-Rater 的擷取詞對,是抽取句子中的動詞、名詞和形容詞。
表 3-1 語法變化解析表
35
根據上述的討論,本研究所定義的「句子內的概念」,是將句中的動作主體
(動詞)和動作目標(名詞)擷取出來形成動名詞對,並且不考慮句中出現順序。這 樣設計的原因是在,中文環境下名詞放在動詞的前後皆有可能為主詞或受詞。
根據這樣的定義,本研究提出以下概念擷取的方法。另外,本研究對於詞的詞 性定義是參考中文詞類分析第三版技術報告(CKIP 詞庫小組,1993),其詞性定 義如附錄二所示。
二、概念擷取的方法
概念擷取是要將原始反應中的概念擷取出來,並以動名詞對的方式呈現,
擷取流程如圖 3-2 所示。要擷取論述題反應中的概念,必頇先找出反應中的句 子。由於每個反應可能被標點符號分隔成好幾段,每段可能是一個句子,也可 能只是長句中的一部份,因此本研究採用張道行(2007)的處理方式,不直接認定 句子的分界,而以逗號及句號切割的文字當作處理句的單位。抓取每個處理句 中的動詞及名詞,即可產生每個反應所有的動名詞對。
圖 3-2 概念擷取流程圖
若句子 S 中可擷取出動詞 V1、V2、. . .、Vx形成動詞集合 V,又可擷取出名 詞 N1、N2、. . .、Ny形成名詞集合 N,則此句的動名詞對的集合 C 為:
原始反應 概念擷取模組 代表反應的動名詞對
36
C = { (Vi , Nj ) | Vi ∈ V and Nj ∈ N } (7)
由(7)可知句子 S 產生的動名詞對集合 C 包含 x × y 組動名詞對。
一般而言,一組動名詞對會包含一個動詞及一個名詞,然而根據我們對處 理句的定義,在某些情況下句子只有包含一個動詞或是一個名詞,缺少搭配的 另一個動詞或名詞來形成一組動名詞對。由於在訓練語料較少的情況下,排除 這類句子的比對將造成無法進行後續處理的可能性大增,且這些單一動詞或名 詞仍然可能代表原始句子的部分概念,因此本系統會將此類句子的概念轉換成
「動詞-動詞」或是「名詞-名詞」的組合,我們稱之為「半動名詞對」
(Semi-Tuple)。相對的,由一個動詞和一個名詞所組合成的動名詞對,則稱「完 全動名詞對」 (Complete VN-Tuple)。
例如某反應只有一個句子「個別約談」,經斷詞及標記詞性後句子分解為「個 別(A) 約談(VC)」,只剩下一個動詞「約談」。由於「約談」可以代表原句所表 達的部分概念,因此將此動詞組合成 Semi-Tuple,也就是「約談(VC) 約談(VC)」, 這種與完全動名詞對相同的形式將於後續系統發展時,較為容易處理。
句子中有時不只包含一個動詞或名詞,這些動詞和名詞中有些不是重要概 念。在名詞方陎,定詞(例如:每、各…等,其詞性標記為「Ne」)、地方名詞 中的位置詞(例如:左、右、內…等,其詞性標記為「Nc」)、方位詞(例如:上、
37
下、時…等,其詞性標記為「Ng」)、單位詞(例如:個、位…等,其詞性標記 為「Nf」)都不能代表動作目標,因此在擷取名詞時必頇先將此類詞性的詞排除。
而代名詞(例如:你、我、他…等,其詞性標記為「Nh」) 雖然可以當作動作目 標,但其通常代表受測者本身或句中提及之名詞,因此我們在擷取動名詞對時,
也會排除詞性為「Nh」的代名詞。
在動詞方陎,我們發現以「有」字當動作主體,無法表達原句的本意,可 以發現將「有」去除之後的概念比原始反應接近。此外,有些作法的原始反應 會包含「不」、「沒」、「未」等使句子帶有否定或相反意思的否定負詞,例如某 學生寫到「不鼓勵這個學生」,由此反應的動詞及名詞所形成的動名詞對為「鼓 勵(VF) 學生(Na)」,反而與原始反應所要表達的意思相反。因此,在動名詞對 建立時若發現動詞前緊接著一個否定負詞,本研究則將此否定負詞與緊鄰的動 詞結合。以上述例子而言,保留否定負詞後所形成的動名詞對為「不鼓勵(VF) 學 生(Na)」。
本研究所提的概念擷取模組雖然和 C-Rater 類似,如皆採用了擷取詞對及否 定詞處理的方法,但是由於中英文環境不同,本研究只擷取了篩選過後動名詞 對當作反應的概念。此概念擷取模組將提供概念集建立模組使用,也可將待評 分反應轉換為概念。
38