潛在語意分析(LSA)技術與研究

第二章文獻探討

第二節潛在語意分析(LSA)技術與研究

本節共分為三部分，第一部分說明潛在語意分析基本原理，第二部分說明潛在語意分析在摘要評量上的應用，第三部分為本節之小結。

一、潛在語意分析基本原理

潛在語意分析(Latent Semantic Analysis, LSA)最先是由 Deerwester 等人於 1990 年提出一種利用數學與統計的方法來提取語意的演算模式（Deerwester, Dumais, Furnas, Landauer, & Harshman, 1990）。其演算模式的基本概念是利用文件與文件間詞語出現的頻率與詞語間彼此頻率的關聯性來表徵出文件的語意與概念。其方法是以二維的矩陣空間表徵文字和原始文件間的關係，再利用奇異值分解（Singular Value Decomposition, SVD）的方式，將語料庫中的語意結構建構出來。LSA 的特色係能夠將許多原本字面上看不到的訊息呈現出來，因此能夠大幅提昇資訊擷取的有效性，而這也是 Deerwester 將此分析技術稱之為「潛在」語意分析的原因(陳明蕾、王學誠&柯華葳，2009)。

潛在語意分析係透過建置語意空間來計算單獨的詞、整段的段落、或是整篇的文章的相似關係，這些單獨的詞、整段的段落、或是整篇的文章皆是以向量的方式呈現該詞彙、段落或是文章在語意空間裡的相對位置。當要計算兩個文件間的相似度可以用兩向量角度的餘弦值（cosine value）來表示。餘弦值愈大，表示兩向量的夾角愈小，兩文件間的語意相似度愈高。反之，餘弦值愈小，

則表示兩向量的夾角愈大，兩文件間的語意相似度愈低。因此，不論是字詞與字詞、字詞與段落、或是段落與段落間語意相似性為何的評估，都能透過 LSA 技術建構出語意空間，並將語意空間中之兩向量間的向量餘弦值推算出來

（Landauer et al., 1998）。

二、潛在語意分析在摘要評量上的應用

以 Landauer 為首的 LSA 研究團隊除了致力於同義詞及多義詞等的語意空間心理效果的檢測外 (Landauer et al., 1998），同時也致力於發展文章連貫性計算及學生摘要評分的語意空間應用（Foltz, Kintsch, & Landauer, 1998）。除此之外，

Kintsch(2000)等人利用潛在語意分析技術開發一套摘要寫作評量的系統，”State the Essence”系統為最早期開發的測試系統，”Summary Street”則為根據” State the Essence”系統的改良版本，沿用至今的版本則為”Write To Learn”系統。除此之外，尚有 Wolfgang(2011)等人開發的”conText”系統，此系統亦是以”Summary Street”系統的理念開發而來，其與”Summary Street”系統不同之處在於”conText”

系統的摘要教學是有步驟的(step by step)，學生可依循系統操作的步驟重複修改編輯其摘要的內容，上述摘要系統之回饋功能與相關研究之比較如下表 2-3。

“State the Essence”系統 回饋

功能

1. 冗長(redundancy) 2. 相關(relevance) 3. 重複(reptition)

“Summary Street”系統 回饋

功能

1. 錯別字提示與更正錯別字功能 2. 圖形化回饋功能

3. 冗長檢查(redundancy check) 4. 相關檢查(relevance check) 5. 列印輸出功能

&Stahl, G.

(2000)

&Dooley, S.

(2005)

”Write To Learn”系統 回饋

(1)Summary Street(2)Intelligent Essay

Assessor 前者為摘要寫作的回饋系統；後者

Wolfgang, l. &

herbert, b. &

darius, e.

& wolfgang,s.

&joachim, h.

(2011).

六年級學生

研究中比較兩種課程，一種是較直接、明確的教學方式，直教教導學生如何摘要以及摘要的用處(Reading detectives )。另一種方式則是透過”ConText”系統以做中學、引導練習的方式來即評量與回饋系統，本研究希冀能夠透過語意分析(Latent Semantic Analysis, LSA)技術來發展線上摘要評量與回饋系統，增加學生練習摘要的機會，並且透過本研究之系統能提升其摘要的能力。

在文檔中線上摘要評量與回饋系統之研究與應用 (頁 25-31)

第二章 文獻探討

第二節 潛在語意分析(LSA)技術與研究

第二章文獻探討

第二節潛在語意分析(LSA)技術與研究