以潛在語意分析建置斷詞測驗輔助工具及其在閱讀理解上之應用

(1)

國立臺中教育大學教育測驗統計研究所理學碩士論文

指導教授：郭伯臣博士

廖晨惠博士

以潛在語意分析建置斷詞測驗輔助工具

及其在閱讀理解上之應用

研究生：吳芷寧撰

中

華

民

國

一

○ 二

年

一

月

(2)

謝辭

時光如逝，歲月如梭，猶記得當年大學剛畢業，轉眼間兩年多的時光匆匆流逝，在念碩士的這段日子裡，是我人生中的重要階段，也是一輩子的珍貴回憶。由於所學與過去大異其趣，因此選擇就讀測統所對我來說是一個全新的挑戰，雖然一路上難免跌跌撞撞，為此衷心地感謝師長與研究室夥伴們的教導與協助，讓我在求學的階段得已畫上圓滿的句點。首先感謝郭伯臣與廖晨惠兩位指導教授的悉心指導，引領我正確的方向，對於研究方面更是不厭其煩地耐心講解，循循善誘，使我在研究所的這段期間獲益匪淺。也十分感謝口試委員陳學志教授的寶貴建議，使這份論文能夠更趨完善。兩年多的研究生涯中，非常感謝鎧誌學長和政軒學長的指導，不論在程式撰寫或是數學觀念講解，皆是深入淺出，讓我在測統所的學習歷程有著莫大的幫助。另外也感謝傑如學長，總是適時的伸出援手，使我在研究的路上能夠更加順利。感謝育隆學長、俊彥學長、暄博學長、筱倩學姐、敏嫻學姐、宗恩、嘉玲、偉民、韋任在平時的照顧與協助，還有研究室許多學弟妹的熱心幫忙。感謝我摯愛的家人，我的祖父母、父母親、弟弟、還有二姑姑，因為有你們的包容與鼓勵，是我最大的動力。最後感謝我的男朋友韋德，從大學時代相識，研究的路上相互扶持，讓我能夠支持至今。「因為需要感謝的人太多了，就感謝天罷！」（陳之藩，1961）吳芷寧 WU, CHIH-NING 臺中教育大學教育測驗統計研究所中華民國一百零二年一月

(3)

摘要

本研究旨在應用潛在語意分析來定義詞彙之熟悉度，並由專家進行評分來評

估詞彙熟悉度之成效，並利用LSA 能夠用來比對詞彙間關聯度的優點，藉以發展

LSA 斷詞測驗組卷輔助工具，並評估 LSA 斷詞測驗組卷輔助工具所產生之 LSA

斷詞測驗成效。並探討傳統專家斷詞測驗與LSA 斷詞測驗採用傳統二元計分方式與LSA 自動化計分方式，此四類型態分別對於預測閱讀理解與識字量之成效。本研究之研究對象為臺中市國小五年級兒童，有效樣本共 49 位。主要研究結果如下：一、本研究應用LSA 所定義之詞彙熟悉度與專家評分間達顯著相關，顯示其評估成效良好。二、本研究中所發展之LSA 斷詞測驗組卷輔助工具所產生之 LSA 斷詞測驗與傳統專家斷詞測驗之間達顯著高度相關，顯示LSA 斷詞測驗組卷輔助工具能夠有效節省人工組卷時間，具有良好評估之成效。三、本研究中比較傳統斷詞測驗與LSA 斷詞測驗對閱讀理解與識字量之整體解釋量與個別解釋量，分析結果發現LSA 斷詞測驗能夠有效預測閱讀理解能力與識字量。四、本研究中比較傳統計分與LSA 計分，分析結果發現 LSA 計分方式對於閱讀理解擁有較高之預測力。關鍵字：潛在語意分析、斷詞、LSA 計分、LSA 組卷、閱讀理解

(4)

ABSTRACT

The purpose of this study is to use Latent Semantic Analysis (LSA) to define the familiarity of terms and to assess the effectiveness of the familiarity of terms according to the scores given by experts. Moreover, this study also exploits the advantage of LSA that can measure the correlation between each term to develop an auxiliary tool of the LSA term-segmentation test paper, and then evaluates the effectiveness of the LSA term-segmentation test generated by the auxiliary tool of the LSA term-segmentation test paper. Furthermore, this study also explores the effectiveness of the following four methods in predicting the reading comprehension and the amount of literacy: the traditional expert term-segmentation test, the LSA term-segmentation test, the traditional binary scoring system, and the LSA automated scoring system.

In this study, the 5th grade students in the elementary schools in Taichung City were taken as the research subjects, and a total of 49 valid samples were collected. The research results are listed as follows:

1. There was a significant correlation between the familiarity of terms defined by LSA in this study and the scores given by experts, suggesting that the effectiveness of the assessment is good.

2. There was a significantly high correlation between the LSA term-segmentation test generated by the auxiliary tool of the LSA term-segmentation test paper that developed in this study and the traditional expert term-segmentation test, suggesting that the effectiveness of the assessment is good and the auxiliary tool of the LSA term-segmentation test paper can effectively save the time from developing a test paper manually.

(5)

expert term-segmentation test and the LSA term-segmentation test for the reading comprehension and the amount of literacy were compared in this study, and the analysis results show that the LSA term-segmentation test can effectively predict the reading comprehension and the amount of literacy.

4. The traditional binary scoring system and the LSA automated scoring system were compared in this study, and the analysis results show that the LSA automated scoring system has a higher predictive power for the reading comprehension.

Keywords: Latent Semantic Analysis, term-segmentation, LSA automated scoring,

(6)

目錄

摘要 ... I ABSTRACT ... II 目錄 ... IV 表目錄 ... VI 圖目錄 ... VIII 第一章緒論 ... 1 第一節研究背景與研究動機 ... 1 第二節研究目的 ... 2 第三節名詞解釋 ... 3 第二章文獻探討 ... 5 第一節潛在語意分析 ... 5 第二節閱讀理解之相關研究 ... 14 第三節斷詞在閱讀理解之相關研究 ... 19 第四節斷詞測驗在閱讀理解之相關應用 ... 21 第五節總結 ... 23 第三章研究方法 ... 25 第一節研究流程 ... 25 第二節詞彙之熟悉度定義與評估 ... 27 第三節斷詞測驗之試卷類型與分析說明 ... 28 第四節 LSA 斷詞測驗自動化計分方式 ... 30 第五節研究對象 ... 32 第六節研究工具 ... 32 第七節資料處理分析 ... 34 第四章研究結果與討論 ... 36 第一節詞彙熟悉度與專家評分之成效 ... 36

(7)

第二節傳統斷詞測驗與LSA 斷詞測驗之試卷內容 ... 38 第三節傳統斷詞測驗與LSA 斷詞測驗之相關 ... 41 第四節斷詞測驗對閱讀理解與識字量之預測度 ... 46 第五章結論與建議 ... 69 第一節結論 ... 69 第二節研究限制 ... 70 第三節建議 ... 71 參考文獻 ... 72 中文參考文獻 ... 72 英文參考文獻 ... 75 附錄 ... 79 附錄一專家組卷之斷詞測驗 ... 79 附錄二 LSA 組卷輔助工具之斷詞測驗 ... 85

(8)

表目錄

表 2-1-1 Titles for Topics on Music and Baking ... 9

表 2-1-2 The 10 x 9 Type-by-Document Matrix With Type Frequencies ... 9

表 2-1-3 The 10 x 9 Weighted Type-by-Document Matrix ... 11

表 2-2-1 各類型閱讀理解測驗整理 ... 18 表 2-4-1 斷詞測驗例題與計分 ... 22 表 3-3-1 斷詞測驗類型 ... 29 表 3-3-2 斷詞測驗類型範例 ... 29 表 3-3-2 斷詞測驗分析之四類型態 ... 30 表 3-5-1 斷詞測驗例題 ... 34 表 4-4-1 專家評分之一致性 ... 36 表 4-1-2 專家評分與詞彙熟悉度、詞頻、字頻之相關性 ... 37 表 4-2-1 斷詞測驗之題庫中詞彙類型 ... 38 表 4-2-2 傳統組卷斷詞測驗組成詞彙類型 ... 39 表 4-2-3 LSA輔助組卷斷詞測驗組成詞彙類型 ... 40 表 4-3-1 國小五年級學童在斷詞測驗之表現（原始分數）... 41 表 4-3-2 傳統組卷斷詞測驗與LSA輔助組卷斷詞測驗之相關性（詞彙高關聯）43 表 4-3-3 傳統組卷斷詞測驗與LSA輔助組卷斷詞測驗之相關性（詞彙中關聯）43 表 4-3-4 傳統組卷斷詞測驗與LSA輔助組卷斷詞測驗之相關性（詞彙低關聯） 44 表 4-3-5 傳統組卷斷詞測驗與LSA輔助組卷斷詞測驗之相關性（詞彙熟悉）... 45 表 4-3-6 傳統組卷斷詞測驗與LSA輔助組卷斷詞測驗之相關性（詞彙陌生）... 45 表 4-4-1 國小五年級學童在閱讀理解與識字量評估測驗之表現（N=52）... 47 表 4-4-2 斷詞測驗（高關聯、熟悉）對閱讀理解之預測度（N=52）... 48 表 4-4-3 斷詞測驗（高關聯、陌生）對閱讀理解之預測度（N=52）... 49 表 4-4-4 斷詞測驗（中關聯、熟悉）對閱讀理解之預測度（N=52）... 50

(9)

表 4-4-5 斷詞測驗（中關聯、陌生）對閱讀理解之預測度（N=52）... 51 表 4-4-6 斷詞測驗（低關聯、熟悉）對閱讀理解之預測度（N=52）... 53 表 4-4-7 斷詞測驗（低關聯、陌生）對閱讀理解之預測度（N=52）... 54 表 4-4-8 斷詞測驗（熟悉）分別對閱讀理解之預測度（N=52）... 55 表 4-4-9 斷詞測驗（陌生）分別對閱讀理解之預測度（N=52）... 57 表 4-4-10 斷詞測驗（高關聯、熟悉）對識字量之預測度（N=52）... 58 表 4-4-11 斷詞測驗（高關聯、陌生）對識字量之預測度（N=52）... 59 表 4-4-12 斷詞測驗（中關聯、熟悉）對識字量之預測度（N=52）... 60 表 4-4-13 斷詞測驗（中關聯、陌生）對識字量之預測度（N=52）... 62 表 4-4-14 斷詞測驗（低關聯、熟悉）對識字量之預測度（N=52）... 63 表 4-4-15 斷詞測驗（低關聯、陌生）對識字量之預測度（N=52）... 64 表 4-4-16 斷詞測驗（熟悉）分別對識字量之預測度（N=52）... 65 表 4-4-17 斷詞測驗（陌生）分別對識字量之預測度（N=52）... 66

(10)

圖目錄

圖 2-1-1 LSA 執行步驟 ... 8

圖 2-1-2 SVD 與維度約化圖示 ... 12

圖 2-1-3 The rank-2 LSA vector space for the music/baking titles collection ... 14

圖 2-4-1 斷詞測驗之系統畫面 ... 22

圖 3-1-1 研究流程圖 ... 26

(11)

第一章緒論

本章的第一節主要說明研究背景與研究動機；第二節說明研究目的；第三節為本研究之名詞解釋。

第一節研究背景與研究動機

在拼音文字的系統中，由於構成詞彙的字母與詞彙彼此之間的距離並不相同，因此兒童可以明確地辨別出詞界限；與其不同的，中文是屬於表意文字，在構成詞彙的字（character）與詞彙彼此之間的距離是完全相同的，因為中文此種特有的構詞方式，而使得斷詞成為學習中文時的重要課題與挑戰（Chang, Hung & Tzeng，1992）。當ㄧ位成熟的中文讀者在閱讀時，除了必須具備良好的文字解碼能力之外，還需擁有充足的詞彙能力與相關背景知識。雖然中文字結構複雜，與拼音文字大不相同，但在實際上使閱讀產生障礙的主要問題往往不在於識字，而是在於斷詞（洪蘭、曾志朗、張稚美，1993）。若是讀者本身的詞彙能力和背景知識不足或是發展受到限制，就容易產生斷詞錯誤的情形，並進而影響閱讀的流暢性，造成閱讀上的阻礙（楊憲明，1998a）。由此可知斷詞在閱讀理解上是十分重要的能力，因此透過斷詞測驗的實施，便能夠了解學生的斷詞能力，進而可推論出其真實之閱讀理解能力。因傳統斷詞測驗的組卷方式多是以專家組卷為主，其在於題目的選擇上，多半是使用詞頻來作為參考標準，即使有考慮到詞彙和詞彙彼此之間的關聯度以及兒童對於各個不同詞彙的熟悉度的差異性的問題，也幾乎都是建立在專家或是研究者的主觀判斷之下。再者，傳統斷詞測驗的計分方式採用二元計分方式，也就是不論所答對題目為何，皆給予相同的分數。但這並未考慮在題目中，每個詞彙都是獨一無二的，彼此都具有不同的特性與難度，因此應針對每個詞彙的彼此間關聯度與熟悉度的不同來給予不同的分數。

(12)

潛在語意分析（Latent Semantic Analysis, LSA）不同於傳統的語意學，在傳統的語意學中通常研究的是字詞中所蘊含的意義或是詞彙與詞彙之間的關係，譬

如同義詞、反義詞、近義詞等。但LSA 探討的乃是字詞背後所潛藏的意義或關聯

性，這種關聯性並非建立於詞彙的定義上，而是以詞彙的使用環境作為分析的基礎。其利用數學及統計上的方法，使用關鍵字來從文章的句子中去萃取及推論字詞間的關係（Landauer, Foltz & Laham，1998)，且能夠將統計計算方法運用於大量文本所建置而成的語料庫，進而萃取和表示上下文詞彙的意義（Landauer & Dumais，1997）。近年來，語言學及計算語言在語料庫方面的研究有著重要發展

（Church & Mercer，1993；Hsu & Huang，1995），隨著自然語言處理研究的進步，

大型語料庫的作用更是變得越來越重要，自從最早的平衡語料庫－1960 年代美國的布朗語料庫（Brown Corpus）被建置以來，世界上便接連不斷地建置出各式不同主題與特性的語料庫。而以運用大型的語料為基礎，來進行比對及描繪詞彙間的語意關係，也是語言心理學中新興的研究取向（陳明蕾、王學誠、柯華葳，2009)。且在語言心理學方面的研究也指出，若有一大型語料庫能夠適當的反映語言中的一語彙知識，即可以利用 LSA 的技術來建置一個能反映心理表徵的語意空間（Landauer、Foltz & Laham，1998) 。

因LSA的優點是能夠計算詞彙與詞彙彼此之間的語意關聯度，因此本研究使用廖晨惠（2011）的國科會計畫－「閱讀研究議題八－以LSA為基礎之電腦化閱讀認知測驗及AutoTutor建置」（編號：100-2420-H-142-001-MY3 )中所建置完成之兒童語料庫，並應用LSA來定義詞彙本身之熟悉度，接著加以發展LSA斷詞測驗組卷輔助工具，並藉以改善傳統斷詞測驗之組卷與計分方式。最後探討組卷輔助工具所產生之斷詞測驗與傳統斷詞測驗對於預測閱讀理解與識字量之成效。

第二節研究目的

本研究目的是利用LSA 能夠用來比對詞彙間關聯度的優點，接著應用 LSA 來定義詞彙之熟悉度後，並藉以發展LSA 斷詞測驗組卷輔助工具。因此在詞彙之

(13)

熟悉度的部分，首先利用在本研究中所定義的詞彙熟悉度來針對兒童語料庫中的所有詞彙進行熟悉度的計算，接著從兒童語料庫中抽取部分詞彙來請專家進行熟悉度的評分，並評估比較本研究中所定義之詞彙熟悉度與專家評分之相關度。接著請專家以兒童語料庫為依據，分別以不同的詞彙間關聯度與詞彙熟悉度來進行斷詞測驗之組卷，同時也使用LSA 斷詞測驗組卷輔助工具來產生另一份斷詞測驗，接著比較傳統斷詞測驗與使用LSA 斷詞測驗組卷輔助工具所產生之斷詞測驗之相關與預測閱讀理解能力與識字量之成效，並探討LSA 斷詞測驗自動化計分方式與傳統計分方式在預測閱讀理解能力與識字量之成效。以下為本研究的目的：一、應用LSA定義詞彙之熟悉度並評估其與專家計分之一致性。二、使用詞彙關聯度與詞彙熟悉度發展LSA斷詞測驗組卷輔助工具。三、探討在斷詞測驗中，傳統組卷與LSA組卷之成效。四、探討在斷詞測驗中，採用不同組卷方式（傳統組卷、LSA組卷）與不同計分方式（LSA計分、傳統計分）對於預測閱讀理解能力與識字量之成效。

第三節名詞解釋

壹、潛在語意分析

潛在語意分析利用大量的文本進行統計分析，並且通過奇異值分解（singular value decomposition, SVD）與維度約化（dimension reduction）的處理，使語意空間中的雜訊能夠降低甚至去除，進而讓詞彙間隱含的語意關係得到最精確的重現。

貳、斷詞

詞界限指的是詞彙與詞彙之間的空白距離，斷詞指的是判斷詞界限的位置。而斷詞測驗目的在於評量兒童斷詞能力，亦即找出詞和詞的界限之能力。本研究中所定義之斷詞能力，是指兒童在傳統斷詞測驗與使用LSA 斷詞測驗組卷輔助工

(14)

具所產生之斷詞測驗中的表現，兩種斷詞測驗測驗時間皆為一分鐘，若兒童在斷詞測驗中得分越高，表示其斷詞能力越好。

參、LSA 斷詞測驗組卷輔助工具

本研究中指的斷詞測驗組卷輔助工具為廖晨惠（2011）的國科會計畫中所發展之以LSA 為基礎之斷詞測驗組卷輔助工具。此工具以國小兒童語料庫之詞彙為基礎，主要目的是根據LSA 所計算出之詞彙間關聯度與本研究中所定義之詞彙熟悉度來自動化產生出適合之斷詞測驗。

肆、閱讀理解

閱讀理解是指讀者在閱讀時的心智活動、記憶之間與文章或文本內容積極互動所產生的結果（林寶貴、錡寶香，2000）。讀者必須具備充分的字彙知識、先備知識與策略運用能力，並擁有正確理解句子和文章意義的能力（林寶貴、錡寶香，1999）。本研究中所定義的閱讀理解能力是指兒童在林寶貴、錡寶香（1999）所編製之閱讀理解測驗中的表現，若兒童在閱讀理解測驗得分越高，表示其閱讀理解能力越好。

(15)

第二章文獻探討

本研究主要目的是根據LSA所計算出之詞彙間關聯度，並應用LSA來定義詞彙熟悉度，藉以發展LSA斷詞測驗組卷輔助工具，最後分析斷詞能力與閱讀理解能力之關係。因此本研究針對潛在語意分析、閱讀理解之相關研究、斷詞在閱讀理解之相關研究、斷詞測驗在閱讀之應用與進行文獻探討。

第一節潛在語意分析

LSA 是一種建立於向量空間模型上，並利用 SVD 和維度約化將文件所隱含的知識轉換至語意空間中的技術。其概念主要是先建置一個能夠表示詞彙與文件之間關聯性的二維矩陣空間：詞彙－文件共生矩陣（term-by-document occurrence matrix），接著利用 SVD 的分解技術，將此詞彙－文件共生矩陣加以拆解，可將此矩陣分解成三個矩陣，進而將文件所隱含的知識意義抽象化，並轉換到語意空間中，並通過維度約化將向量空間的維度降低，藉以去除文件在語意空間中的雜訊，而能夠讓LSA 夠精確地展現出文件所涵藏的知識意義。且此一經過SVD 和維度約化所重新建置之語意空間，將比原始矩陣更具代表性

（Landauer ＆ Dumais, 1997；Deerwester, Dumais, Furnas, Landauer, & Harshman, 1990）。以下就語料庫的相關研究、潛在語意空間建置流程、語意關聯度計算等研究分別進行說明。

壹、語料庫的相關研究

語料庫（Corpus）是指大型的詞語料資料庫，通常包含了大量經過分析整理的文本以及語文資料，具有既定的格式與標記，藉以提供語言學相關之研究做分析與與統計（溫文喆，2008）。過去的相關研究指出，當使用LSA在建立語意空間時，除了語料庫本身與研究目的需有一定的相關之外，語料庫來源的詞彙與文件數量則是越多越好（Wiemer-Hastings, 2004）。例如最早也最具代表

(16)

性的平衡語料庫，也就是美國的布朗語料庫（Brown Corpus）中即包含有一百多萬個詞彙；而中央研究院的現代漢語平衡語料庫（4.0版）中包含一千多萬個詞彙，是世界上第一個有完整詞類標記的漢語平衡語料庫。在各個不同的領域中，研究者常會根據其目的與需要的不同，建置各種不同類型的語料庫，如鄧守信（2005）為探討至臺灣學習華語文的學生，其華語語料所呈現的中介現象，因此建置了對外漢語中介語語料庫；謝杰雄（2007）為了研究臺灣的客家語，而建置了「T3」語料庫，內含有32619個客家語詞彙；中央研究院張顯達、張鑑如、柯華葳、蔡素娟（2011）則以臺灣一歲半至八歲半的兒童為基準，建置了臺灣兒童語言語料庫（TCCM），其中包含了362份語料檔案。而在利用語料庫建立潛在語意空間方面，Landauer等人（1998）即曾以電子版葛羅里學術百科全書（Grolier Encyclopedia）來做為語料庫來加以建置語意空間，建立出一個有60,768個詞彙×30,473份文件的詞彙－文件共生矩陣，接著再透過SVD 與維度約化，得出一個維度300的語意空間，此語意空間便可以用來比對出隱含在詞彙之中的語意關係（Landauer et al., 1998）。除此之外，科羅多大學的LSA 研究團隊，採用了擁有九百萬個詞彙的TASA（Touchstone Applied Science Associates, Inc.），並成功的建置德文與法文語料的語意空間。在中文方面，張國恩與宋曜廷（2005）蒐集了國民小學三到六年級自然與生活科技課本內容及網路相關文章，建置了以「族群與族群」和「端午節」兩個主題，分別為1557個詞彙和2921個詞彙的語意空間，並由這兩個語意空間為基礎，設計出一個能夠自動評量學生閱讀摘要寫作的系統，顯示出利用向量餘弦值為為標準的評分結果，和教師的批閱結果彼此之間有顯著的相關性。而陳明蕾、王學誠、柯華葳（2009）則使用了中央研究院建置之擁有五百萬詞彙的現代漢語平衡語料庫（3.0版）來建立一個包含49021個詞彙×40463份文件的中文語意空間，且研究結果顯示出利用LSA 所建置出的中文語意空間，能夠反應出中文讀者內在心理詞彙之語意關聯性。因本次研究對象以國小學童為主，因此所使用之語料庫為廖晨惠（2011）研究中所建置之國小兒童語料庫，其內容來源為現行國民小學一到六年級教科

(17)

書及獲得授權之兒童讀物（國語日報、大紀元時報等），共計1208篇文章，並經由LSA技術將文章切割成5219份文件，共計20022個詞彙。接著將不適合做為題目的詞彙，如人名、介係詞、短語、成語等加以刪除之後，適合成為斷詞測驗之題庫者共有10568個詞彙，最後依此建置出10568個詞彙×5219份文件的語意空間。

貳、潛在語意空間建置之流程

使用LSA建置語意空間，除了必須先建立語料庫之外，需要進行以下幾個步驟：（1）建立詞彙－文件共生矩陣（2）計算詞彙權重（3）運用SVD轉換矩陣（4）維度約化（Martin and Berry, 2007）。以下為LSA之執行步驟，而灰色部分則為建置語意空間的流程：

(18)

圖211 LSA執行步驟 一、建立詞彙－文件共生矩陣當語料庫中之資料收集完成後，接著就必須從此語料庫建立詞彙－文件共生矩陣。此矩陣以文件為行、關鍵詞為列，文件可以是句子、一段文章、書本的一個章節等，或是研究者對文章進行切割的新文件，而關鍵詞則為語料庫中所有被定義出且不重複的詞彙，最後在矩陣中所填入的值則是各個關鍵詞出現在每份文件的頻率。且根據研究顯示，在詞彙－文件共生矩陣中總共只出現一次的詞彙會對LSA語意間的比對效果產生影響（Quesada, 2006），因此在選取關鍵詞時，必建立語料庫建立詞彙－文件共生矩陣計算詞彙權重運用SVD轉換矩陣維度約化建立語意空間相似度計算

(19)

須將出現頻率僅有一次的詞彙加以刪除。以下之表2-1-1和表2-1-2為一小型語料庫

和其對應之關鍵詞與詞頻所建立的詞彙－文件共生矩陣的例子，M1-M5為音樂相

關的標題，B1-B4為烘培相關的標題（Witter & Berry, 1998）。表2-1-1 Titles for Topics on Music and Baking

文件標題

M1 Rock and Roll Music in the 1960’s

M2 Different Drum Rolls, a Demonstration of Techniques

M3 Drum and Bass Composition

M4 A Perspective of Rock Music in the 90’s

M5 Music and Composition of Popular Bands

B1 How to Make Bread and Rolls, a Demonstration

B2 Ingredients for Crescent Rolls

B3 A Recipe for Sourdough Bread

B4 A Quick Recipe for Pizza Dough using Organic Ingredients

資料來源：Handbook of Latent Semantic Analysis. (p. 37), by Martin, D.I., & Berry, M. W. Mahwah, 2007, NJ: Lawrence Erlbaum Associates.

表2-1-2 The 10 x 9 Type-by-Document Matrix With Type Frequencies

詞彙文件 M1 M2 M3 M4 M5 B1 B2 B3 B4 Bread 0 0 0 0 0 1 0 1 0 Composition 0 0 1 0 1 0 0 0 0 Demonstration 0 1 0 0 0 1 0 0 0 Dough 0 0 0 0 0 0 0 1 1 Drum 0 1 1 0 0 0 0 0 0 Ingredients 0 0 0 0 0 0 1 0 1 Music 1 0 0 1 1 0 0 0 0 Recipe 0 0 0 0 0 0 0 1 1 Rock 1 0 0 1 0 0 0 0 0 Roll 1 1 0 0 0 1 1 0 0

(20)

二、計算詞彙權重因為考量到每個不同的詞彙以及文件都具有不同的重要性，因此需要給予其不同的權重。研究中指出，與只出現在部份文件的關鍵性詞彙相較起來，一個在眾多文件裡皆頻繁出現的詞彙，不論是在語意上或是在詞彙－文件共生矩陣中都並非具有關鍵性的意義（例如：的、是、在），因此會給予此類過於頻繁出現的詞彙較低的權重，以及只出現在部份文件的關鍵性詞彙較高的權重（Landauer & Dumais, 1997）。權重計算方式分為兩個部份：local權重與global權重。local權重針對的是文件，指的是各個詞彙在每一份文件中的重要性，因此詞彙重要性通常與詞彙出現頻率成正比；global權重針對的則是語料庫，其代表了各個詞彙在語料庫中的重要性，

因此詞彙頻率愈高，往往其詞彙重要性會降得愈低（Dumais, 1991；Salton & Buckley, 1991；Landauer & Dumais, 1997；Letsche & Berry, 1997）。詞彙－文件共生矩陣之權重加權公式如下：

a local , global

（2.1）

其中的 global 代表第 i 個詞彙在語料庫的 global 權重，而 local ,

則表示第 i 個詞彙在第 j 份文件的 local 權重。而本研究中所採用的權重計算方式為Log-Entropy，公式如下： local , log 1 （2.2）其中 表示第 i 個詞彙在第 j 份文件中所出現的次數。 global 1 log log ，

(21)

（2.3）

其中 則表示第 i 個詞彙在所有文件中出現次數的總和。

表2-1-3為表2-1-2經過 Log-Entropy之權重加權後所形成的加權共生矩陣。表2-1-3 The 10 x 9 Weighted Type-by-Document Matrix

詞彙文件 M1 M2 M3 M4 M5 B1 B2 B3 B4 Bread 0 0 0 0 0 .474 0 .474 0 Composition 0 0 .474 0 .474 0 0 0 0 Demonstration 0 .474 0 0 0 .474 0 0 0 Dough 0 0 0 0 0 0 0 .474 .474 Drum 0 .474 .474 0 0 0 0 0 0 Ingredients 0 0 0 0 0 0 .474 0 .474 Music .347 0 0 .347 .347 0 0 0 0 Recipe 0 0 0 0 0 0 0 .474 .474 Rock .474 0 0 .474 0 0 0 0 0 Roll .256 .256 0 0 0 .256 .256 0 0

三、執行SVD矩陣轉換

使用SVD來分解詞彙－文件共生矩陣有以下幾個優點：第一，可以同時代表關鍵詞與文件；第二、能夠充分擷取語意結構，並允許調整關鍵詞與文件在向量空間中的維度數；第三，SVD運算在大型資料庫中易於管理（Berry & Martin, 2005）。

詞彙－文件共生矩陣基本上僅能表現出每一個關鍵詞在文件所出現的位置以及次數多寡，但並未能呈現出關鍵詞彼此間的語意關係。藉由SVD的運算過程，可以算出每個關鍵詞在對角矩陣中的特徵值，一般來說特徵值與訊息量呈現正相

(22)

關，也就是特徵值愈大的向量，訊息量便愈大，反之亦然。而經過SVD轉換的詞彙－文件共生矩陣可被拆解成：

Α = UΣVΤ

（2.4）其中U矩陣的列向量為詞彙向量（type vector），而V矩陣的列向量為文件向

量（document vector）（Landauer, Foltz & Laham, 1998）。拆解圖示如圖2-1-2所示。

圖2-1-2 SVD與維度約化圖示

四、維度約化（dimension reduction）

詞彙－文件共生矩陣經過SVD的運算處理之後，在語意空間的矩陣過大時，由於維度數量過多，因而會產生許多的雜訊（noise），進而會對語意比對的結果產生干擾，因此可利用維度約化的方式來消除語意空間中不重要之雜訊。維度約化的方式是取出在經過SVD後，前k個最大的特徵值，和U矩陣、V矩陣前k個行

向量（k<r），最後重新建置矩陣 Α = U Σ VT_{，如圖2-1-2所示（Berry, Dumais, &}

O’Brien, 1995; Witter & Berry, 1998）。

在執行維度約化時，若維度約化後剩餘的維度數量過少，則詞彙之間的相似 Ak Uk VT Σ k A（m x n） U（m x r） Σ（r x r） VT（r x n）＝ k k k

(23)

性會變得過高；而若維度約化後剩餘的維度數量過多，則無法把語意空間中之雜訊做有效率的刪除。根據過去的研究結果顯示，若將維度約化的範圍設定為100 到300個維度間，其在同義詞的測試效果最佳（Berry et al., 1999; Jessup&Martin, 2001; Lizza & Sartoretto, 2001），因此在本研究中將維度約化的維度數定為300，並用來建置新的語意空間。

參、詞彙語意關聯度計算

重新建置的矩陣 Α = U Σ VT_{，能夠將詞彙、句子、文件等呈現在向量空間}

中，因此可利用VSM（vector space model）來求得兩者間的夾角的餘弦值（cosine）之方式來得出兩者間的語意關聯度。若要計算詞彙與詞彙間的詞彙關聯度，計算公式如下： cos , （2.5）在潛在語意空間中，若計算出的cosine值愈高，則兩者間的語意關聯度愈高；反之，若計算出的cosine值愈低，則兩者間的語意關聯度愈低。圖2-1-3為Witter & Berry（1998）所建立之一小型語料庫中文件與關鍵詞彙在潛在語意空間中的情形。

(24)

資料章間兩者讀能圖2-1-3 料來源：Ha M 由圖2-1-3 間的夾角越者的語意愈「閱讀不能力的發展 The rank-2 andbook of M. W. Mah 3中可看出越小，代表兩愈無關聯性

第二

不是人類天展是人為的 2 LSA vect f Latent Se hwah, 2007 出文件與關兩者的語意性。

二節閱

天生的能力的結果，是經 tor space fo emantic An 7, NJ: Lawr 關鍵詞彙在潛意關聯度愈

閱讀理解

力」（洪儷經由學習得

for the mus

alysis. (p. rence Erlba 潛在語意空愈相似；若

解之相

儷瑜，2005 得來，而非 ic/baking t 43), by Ma aum Assoc 空間中的情若彼此之間

究

於口語的發熟的結果。 ction & Berry, 個詞彙或文越大，代表發展，閱閱讀是人文表人

(25)

在一生中重要的能力之一，不但是所有學科學習的基礎，也是知識增長的主要來源。因此一旦閱讀發生困難，不僅在學習上將產生困難，甚至在成長以及生活上也會產生難以彌補的障礙（蔡韻晴，2002）。閱讀是學習的重要基礎能力之一，主要包含了識字與理解兩個部份，而識字又是閱讀的基礎，而閱讀最小的意義單位則是詞彙，在閱讀理解中佔有舉足輕重的地位（王瓊珠、洪儷瑜、陳長益，2005；洪儷瑜，1996；柯華葳，1999；劉英茂、莊仲仁、吳瑞屯，1987）。在識字方面，相關的研究議題十分廣泛，在教育、心理學等領域皆然。如：人類如何認字（Rayner & Pollatsek, 1989）、認字量是否有限度（鄭錦全，民 87）

等等。而識字研究對閱讀障礙也相當重要，在2003 年國際讀寫障礙協會（The

International Dyslexia Association）與美國兒童健康與人類發展中心（National Institute of Child Health & Human Development）即明白指出，讀寫障礙（dyslexia）者的困難主要表現於識字的正確性和流暢性上，因為其拼字與解碼能力表現不理想，導致其產生閱讀理解困難，甚至缺乏閱讀經驗的情形（Lyon, Shaywitz, & Shaywitz, 2003）。在黃忻怡（2011）的研究中曾提到，在認字的學習過程中，文字總是被置於詞中的脈絡來學習，而為求具備國字應用能力，必須要能針對國字來造詞。在這些看似平常不過的識字學習過程背後，所代表的意義應有兩項：第一、文字為無意義的形體單位，需置於有意義的詞彙中，才能在認知歷程裡啟動意義聯結，達到識字的有效性；第二、能運用國字造詞，代表個體對於單獨形體的文字已產生意義聯結，且其詞彙量達到一定數量，文字才能成為心理詞庫中的構詞要素，也就是詞素，並且能藉而組合不同詞素，進而達到正確造詞的能力。除了識字之外，閱讀中所包含的還有理解這個部份。在過去的研究中，不同研究者對於閱讀理解的意義以及發展都各有不同的詮釋方式。蘇宜芬（1991）認為，閱讀理解是指讀者用去的經驗和知識從閱讀材料中找出許多相關訊息來建構意義的過程；呂素娥（2009）則認為，閱讀理解意義是指讀者閱讀文章所提供的

(26)

訊息時，以自身的知識為基礎，用各種不同策略去瞭解、驗證、推論、預測文章的發展做出有意義的建構聯結，進而吸收知識。人們在閱讀與學習時，認知歷程彼此相互關聯與交互運作，形成了閱讀理解的歷程。從心理運作的方面來看，閱讀包括了閱讀流暢性和閱讀理解兩大部分。除了閱讀的流暢性之外，另外一個更重要的閱讀歷程就是閱讀理解。 Cook與Mayer（1983）對閱讀學習的認知理論提出一種假設，認為閱讀者在進行閱讀工作時，都具備有一個儲存現有知識的巨大倉庫（storehouse），這個倉庫內存有三種知識：內容知識、結構知識和過程知識。所以，要使學習有意義，關鍵在於如何充實與利用已存有的先備知識內容。幸曼玲（2008）認為，閱讀理解包括四個歷程，一是運用先前知識，二是運用文章結構，三是運用推論能力，最後則是運用後設認知的能力以檢視理解的程度。 Swaby（1989）認為閱讀即是技能之表現，而技能可分為四個不同層次的理解（引自林翠玲，2007）：一、字義的理解，指的是讀者可從字句中的語意，了解文章中述說清楚的主題、思想。其相關的技能包括回憶事實、細節、次序，並且知道字的意義。二、推論的理解，指的則是指讀者根據文章中描述的訊息，再以自己的經驗，推論其隱含的意義，包括推論中心思想，做適當的解釋、預測、比較、對照、因果等皆屬於推論理解。三、評鑑的理解，是指依據文章所傳達的訊息而產生自己的觀點。其相關的技能包括價值判斷、決定主張，支持或拒絕某些意見。四、批評的理解，指分析閱讀材料的格式、內容，其包括了知道文章思想的邏輯性和一致性、區別文章字句的型式和語態等。 Carver（1973）在其研究中，曾經將閱讀的歷程共區分為四個層次：一、將字解碼（decoding），決定這些字在句子中的意義。

(27)

二、將一些個別的字的意義聯合起來，以完全了解句子。三、了解段落和段落所隱含的主旨，以及原因、結果、假設、含義。四、評價各種觀念，包括邏輯、證明、真實性、與價值判斷等問題。此四個層次的閱讀歷程包含二方面：一是字句的理解（第1、2層次），其中的歷程包括字的辨認、字義觸接（meaning accessing）、和語句整合（sentence integration）；二是文章的理解（第3、4層次），其中的歷程包括文章的內容理解和文章的推理理解。閱讀的歷程可以從簡單的一個字、一個句子，進而到一個段落，甚至是一篇文章（劉兆文、陳怡欣，1999）。 Chall（1996）則將閱讀能力發展分為六個階段，前三階段屬於「學著讀（learn to read）」，而後三階段則是屬於「讀著學（Read to learn）」。前三階段是透過閱讀來學習如何閱讀，以學習識字、培養解碼的能力，進而提升閱讀能力為主；而後三階段則是透過閱讀，來學習各種知識與得到資訊，並且分析閱讀內容，進而能夠建構出自己的知識並進行批判。而在孟瑛如（2002）的研究發現，約有80%的學習障礙者在文字認知和閱讀理解方面出現困難，其中包括聽、說、讀、寫與字彙辨認及正確掌握音韻等，顯示閱讀理解在一般能力閱讀者和閱讀障礙者之間具有區辨力。從上述研究可知，閱讀理解在閱讀過程中是不可或缺的關鍵，了解兒童之閱讀理解能力有其之必要性，因此有許多研究者針對了解兒童的閱讀理解能力，針對不同的對象以及特性編制了不同的閱讀理解測驗，如下表2-2-1。

(28)

表2-2-1 各類型閱讀理解測驗整理作者年代測驗名稱適用對象測驗內容吳武典、張正芬 1984 國語文能力測驗國小二年級至國中一年級語法測驗林寶貴、楊慧敏、許秀英 1996 中華國語文能力測驗國小一年級至國中三年級注音、詞彙、選詞、字形、文意、語法分析、重組周台傑、吳金花 1997 國民小學閱讀理解測驗國小四年級至國小六年級字句增刪、字句修改、回憶基本事實、回憶序列、回憶主題林寶貴、錡寶香 1999 中文閱讀理解測驗國小二年級至國小六年級音韻處理能力、語意能力、語法能力、理解文章基本事實、抽取文章重點大意、推論、比較分析柯華葳 1999 閱讀理解困難篩選測驗國小二年級至國小六年級字義、命題組合、句意理解、閱讀理解王瓊珠 2002 故事理解測驗閱讀障礙兒童字面理解、推論理解張世彗、楊坤堂 2005 閱讀理解測驗國小一年級字詞釋義、命題組合、句子理解、短文閱讀從以上相關文獻可知，閱讀是學習的重要基礎能力，而由於在閱讀理解的過程中，第一步皆必須辨認字詞，而詞彙身為最小的意義單位，自然在閱讀理解上扮演著重要角色，因此探究斷詞與閱讀理解相關的確有其必要性。在以上文獻探討中可知不同研究者對於閱讀理解的意義皆有不同的詮釋方式，也同時針對不同

(29)

的對象以及特性編制了不同的閱讀理解測驗，而在本研究中根據適用對象與測驗內容特性等方面，選擇林寶貴、錡寶香（1999）的中文閱讀理解測驗做為兒童閱讀理解能力的依據。

第三節斷詞在閱讀理解之相關研究

要了解斷詞能力的重要性，必須先對斷詞所欲尋找的「詞」在閱讀歷程中的角色有所了解（黃忻怡、廖晨惠，2010）。仔細分析閱讀的成分不難發現，「識字」僅是閱讀的基礎，閱讀最小的意義單位其實是「詞」（劉英茂、莊仲仁、吳瑞屯，1987），而詞彙是一個完整的意義概念，能夠表示一個甚至是一個以上的意義。在中文裡，詞彙大多數是屬於雙字詞或多字詞，也就詞彙是由兩個或兩個以上的字所組合而成，如「太陽」或「原住民」等，少部份是屬於單字詞，如「河」。統計上也顯示，中文裡有超過65%的詞彙屬於雙字詞（Sun, Sun, Huang, Li, & Xing, 1996），而在經常使用的中文語詞中，雙字詞大約占50%，但在較少使用的語詞中，雙字詞的比例甚至高達98% （胡志偉、顏乃欣，1995）。除此之外，楊憲明（1998a）也指出，中文裡存在著許多能夠單獨成詞，但同時也可以與其他字結合成詞彙的「自由詞素」（free-morpheme），例如「花」。這種自由詞素容易使讀者在斷詞時發生錯誤，造成誤解句子情形。由於在拼音文字的系統中，由於構成詞彙的字母與詞彙彼此之間的距離並不相同，因此兒童可以明確地辨別出詞界限；與其不同的，中文是屬於表意文字，在印刷排版上是以字為單位，在構成詞彙的字（character）與詞彙彼此之間的距離是完全相同的，再加上中文具有斷詞歧異的語句，因而使斷詞歷程的複雜性增加，也加深了中文閱讀歷程的困難度。因為中文此種特有的構詞方式，而使得斷詞成為學習中文時的重要課題與挑戰（Chang, Hung & Tzeng，1992）

楊立行、陳學志（1995）指出，中文與英文屬於兩個不同的書寫系統，而在閱讀中文語句時，斷詞是十分基礎的歷程，而這也同時是中文裡所獨有的現象，

(30)

而因為中文閱讀這種獨有的斷詞現象，使得中文閱讀時的一些基本眼動型態與英文的研究發現並不相同，例如研究發現在閱讀中文詞彙時並未找到眼球偏好的凝視位置（Inhoff, Liu, & Tang，1999）等。

因為在中文排版與文句呈現時，並未如拼音文字擁有明顯的空格做為詞彙之間的分界，以提供閱讀者做為判斷，因此中文詞彙是否具有心理真實性，以及詞彙在中文閱讀中所扮演的角色等問題，一直受到心理學家的關注（胡志偉，1989；陳烜之，1987；鄭昭明，1981）。從過去的許多研究，如詞優效果與詞劣效果（胡志偉，1989；鄭昭明，1981）、眼動測量（柯華葳、陳明蕾、廖家寧，2005），都顯示中文詞彙應該具有心理真實性。在許多拼音文字的閱讀相關研究發現，若移除詞間空格，對於閱讀將產生十分不利的影響（Rayner & Pollatsek，1996；Rayner, Fischer & Pollatsek，1998），因此假設中文心理真實性是存在的，那麼照理將詞與詞之間的間隔清楚的標示出來，應對於閱讀理解歷程的進行更加有利。但在楊憲明（1998a）的研究中卻發現，在中文印刷時將詞彙之界限清楚區隔出來，並不會使一般讀者的閱讀時間變快。劉英茂、葉重新、王聯慧和張迎桂（1974）的研究甚至發現當句子中的每個詞彙被清楚區隔出來之後，讀者的閱讀速度不僅沒有增快，反而會因詞彙之間的距離增加而變得更為緩慢。雖然將詞彙之間的分界空格清楚標示出來後，對於熟練的閱讀者並無明顯的實質幫助，但斷詞之所以成為閱讀障礙兒童之在閱讀時的最大障礙，原因很有可能是因為閱讀障礙兒童無法從口語詞彙上得到文意的支持，也就是說閱讀障礙兒童無法使用既有的詞彙及背景知識，來協助其將句子做有意義的詞彙切割（洪蘭、曾志朗、張稚美，1993）。因此部分學者認為詞間空格的安置對於特殊閱讀族群或情境，例如閱讀初學者、閱讀障礙、歧異語句等的閱讀，仍具有其重要性（楊憲明，1998a；洪敦明，2005；林昱成，2009）。藉由眼動儀的測量可以發現，當我們的眼睛在閱讀時，眼球並非平順的在句中移動，也非逐字停留，而是採跳躍式的方式來閱讀（蔡介立、顏妙璇、汪勁安，

(31)

2005）。在之前的研究中顯示出，一個成熟的閱讀者在閱讀之時，並非以逐字閱讀的方式在進行，而是以詞彙為單位來整合文章中前後語詞的意義（方金雅， 2001）。而 Just 和 Carpenter（1987）曾對於讀者在閱讀中文文章時的眼動情形加以追蹤，發現受試者在常見字的凝視時間比不常見字的凝視時間來得短，而且也發現詞彙的熟悉度同時也會影響受試者的閱讀速度（引自胡志偉、顏乃欣， 1995），由此可知讀者對詞彙的熟悉度越高，越能快速完成斷詞，進而使文章讀得流暢，因此閱讀速度自然就更加快速。由此可知，能夠熟練使用其具有的認知能力來統整文字，進而將文字轉換成有意義的訊息，這個文字辨識自動化的過程即是影響閱讀理解的重要因素（胡永崇，2002，2007；楊憲明，1998b；秦麗花、許家吉，2000）。從以上斷詞與閱讀理解之相關研究可知，閱讀最小的意義單位是「詞」（劉英茂等，1987），而中文的文字印刷排版並未具有明顯詞間空格，與拼音文字大不相同，但從過去的許多研究皆顯示出中文詞彙具有心理真實性（胡志偉，1989；陳烜之，1987；鄭昭明，1981；柯華葳等，2005）。雖然研究發現將詞彙之間的間隔清楚的標示出來，對於閱讀理解並無太大之實質幫助，但卻也顯示出斷詞能力對於閱讀初學者、閱讀障礙者，或在歧異語句等的閱讀上，具有其重要性（楊憲明，1998a；洪敦明，2005；林昱成，2009）。

第四節斷詞測驗在閱讀理解之相關應用

由上節的文獻探討可知，斷詞在閱讀理解上占有十分重要的地位，因此透過斷詞測驗的實施，便能夠了解學生的斷詞能力，更可以進一步推論出其真實之閱讀理解能力。 Liao和Kuo（2009）為了評量兒童斷詞的能力，編制了斷詞測驗，此測驗的編排方式是由左而右將詞彙依序排列，字詞之間距離完全相同，也就是不存在詞間空格等提供受測者做為參考或判斷，並且各個詞彙中的每個字皆無法拆開與前後的詞彙加以組合成另一個新的詞彙。作答方式是受試者必須快速且正確的判斷

(32)

出詞彙彼此之間的界限，並在界限中畫上斜線，其正確畫出的斜線數即為所得分數。以下表2-4-1為斷詞測驗之例題與計分。表2-4-1 斷詞測驗例題與計分題目山遊樂園許多答案山/遊樂園/許多得分 2 而在廖晨惠、郭伯臣（2009）的國科會計畫－中文閱讀障礙兒童認知功能探討與研究：電腦化閱讀認知功能測驗（編號：NSC 98-2410-H-142-001-MY2）中所開發之電腦化閱讀認知功能測驗系統中，更將斷詞測驗進行進一步的電腦化，使學生在測驗之後不需經過人力批改，可直接進行電腦計分。以下圖2-4-1 為斷詞測驗於電腦化閱讀認知功能測驗系統中之畫面。圖2-4-1 斷詞測驗之系統畫面

(33)

在陳雅玲（2010）的研究中，採用Liao和Kuo（2009）所編製之斷詞測驗，發現中文斷詞與認字、一分鐘讀詞、短文朗讀流暢性和寫字都有高度相關，在控制年齡和智商後，對上述四種讀寫能力都有顯著的預測力，這個結果突顯了中文斷詞對中文讀寫歷程的重要性。而在劉嘉玲、吳芷寧、廖晨惠（2012）的研究中，則採用了廖晨惠、郭伯臣（2009）之國科會計畫中所開發之電腦化斷詞測驗，結果也顯示出斷詞能力與閱讀識字正確性、流暢性皆有顯著相關。在傳統之斷詞測驗進行時，計分方式多採用二元計分方式，也就是答錯就不給分，但不論所答對題目為何，均給予相同的分數。但每個詞彙都是完全不同的，也分別具有不同的難易程度，即使斷詞測驗在編製時有考慮此一問題，但也幾乎都是建立在專家的主觀判斷之下，例如過去Liao 和 Kuo（2009）所編製之斷詞測驗，即是參考了國小教師之意見做為詞彙選用的標準，最後再以人工的方式選出題目。因此若能在給予固定分數的同時利用LSA 給予不同的詞彙界限來加權，應更能夠反映出學生真實的閱讀能力。從以上斷詞測驗之相關應用可知，傳統斷詞測驗的組卷與計分方式，以及傳統斷詞測驗進行電腦化後的實施方式，雖然研究證實了斷詞能力與讀寫能力的相關性，但若採用本研究中的詞彙熟悉度與關聯度來做為斷詞測驗組卷標準，並使用LSA加權計分方式來取代傳統的二元計分方式，應使測驗更為公正客觀，且更能反映出學生之真實能力。

第五節總結

以上文獻探討，第一部分說明使用LSA來建置語意空間，必須先建立語料庫，首先需要建立詞彙－文件共生矩陣、計算詞彙權重、運用SVD轉換矩陣、維度約化（Martin and Berry, 2007）等步驟，接著才是建立語意空間，並進行語意關聯度等的計算。第二部份在閱讀理解的相關研究探討中，說明閱讀是學習的重要基礎能力，而詞彙為閱讀時的最小意義單位，因此在閱讀理解上扮演

(34)

著重要角色，因此探究斷詞與閱讀理解相關是十分必要的。第三部份探討斷詞在閱讀理解的相關研究，在種種研究中皆顯示出，中文詞彙具有心理真實性，因此斷詞能力在閱讀上，尤其是對於閱讀初學者、閱讀障礙者，或在歧異語句等的閱讀上，扮演關鍵性的角色。第四部份在斷詞測驗在閱讀理解之相關應用簡述了傳統斷詞測驗以其電腦化後的測驗方式與計分方式。由於傳統上之專家組卷方式與二元計分方式並非完全公正客觀，因此在本研究上使用詞彙熟悉度與關聯度來做為斷詞測驗組卷標準，並以LSA加權計分方式來取代傳統的二元計分方式，以期能測驗出學生之斷詞能力，並由此預測出學生真實之閱讀理解能力。

(35)

第三章研究方法

本研究目的為應用LSA定義詞彙之熟悉度，使用詞彙間相似度與詞彙熟悉度發展LSA斷詞測驗組卷輔助工具，比較傳統斷詞測驗與使用LSA斷詞測驗組卷輔助工具所產生之斷詞測驗之成效，並探討LSA斷詞測驗自動化計分方式與傳統計分方式在預測閱讀理解能力與識字量之成效。其研究流程、詞彙之熟悉度定義與評估、斷詞測驗之試卷類型與分析說明、LSA斷詞測驗自動化計分方式、研究對象、研究工具及資料分析說明如下：

第一節研究流程

本研究之研究流程圖如圖 3-1-1 所示，本研究先蒐集潛在語意分析、斷詞、閱讀理解等的相關文獻以進行相關文獻之探討。接著應用LSA 發展詞彙熟悉度，並請語文方面專家對於詞彙的熟悉度進行評分以評估其成效。接著使用詞彙關聯度與詞彙熟悉度發展LSA 斷詞測驗組卷輔助工具及 LSA 計分方式。最後進行資料樣本蒐集，樣本蒐集完成後進行資料分析，並撰寫研究報告及提出研究結果與建議。

(36)

圖3-1-1 研究流程圖 相關文獻閱讀發展詞彙熟悉度詞彙熟悉度成效評估發展LSA斷詞測驗組卷輔助工具專家組卷與LSA組卷發展LSA自動化計分方式資料樣本蒐集資料分析與整理成效評估撰寫研究報告提出結果與建議

(37)

第二節詞彙之熟悉度定義與評估

本研究發展之 LSA 斷詞測驗組卷輔助工具，在系統組卷時最主要考量的兩項指標為語意關聯度與詞彙熟悉度，語意關聯度之計算在文獻探討中已經提及，因此本節主要探討的為詞彙熟悉度的定義。

壹、詞彙熟悉度定義

詞彙熟悉度主要指兒童對於目標詞彙的熟悉程度。由於中文裡多音節詞占了大多數，因此兒童常能夠利用熟悉的詞彙去推論陌生詞彙可能的意義（例：兒童對於「鱖魚」此詞彙是十分陌生的，但因為此詞彙含有「魚」這個兒童十分熟悉的詞彙，因此兒童能夠藉由「魚」這個詞，來加以推斷「鱖魚」這個詞的意義極有可能和魚類十分相關），故在詞彙熟悉度中不單單只考量詞頻的因素，也將字頻的因素加以考量進去。但當字頻所占的比例越高時，某些高頻字（例：的、了）在詞彙的熟悉度中所占的影響會顯得越大，使得含有高頻字的詞彙熟悉度過度地提高，進而影響語料庫整體詞彙的熟悉度排序。故在熟悉度公式中採用以詞頻為主、字頻為輔的計算方式。計算方式則是，首先將目標詞彙中各個字在語料庫中出現之字頻相加，接著除以語料庫之總字頻，並乘以字頻權重；接著再將目標詞彙之詞頻除以語料庫之 總詞頻，並且乘以詞頻權重。最後將兩者相加，即為詞彙之熟悉度 F。計算公式 如下：＝ _∑ _∑ （3.1） 其中 W 為字頻權重，T 為詞頻權重。wf 為字頻，指每個目標字在語料庫中所 出現之次數，tf 則為詞頻，指每個目標詞彙在語料庫中所出現之次數。以詞彙「三 輪車」為例：

(38)

（三輪車） 0.1 三 472 輪 467 車 362 語料庫總字頻 533101 0.9 三輪車 6 語料庫總詞頻 293808 ＝0.0002117 （3.2）將詞彙「三輪車」的字頻與詞頻分別帶入公式後，最後得出0.0002117 即為詞彙「三輪車」的詞彙熟悉度。在將語料庫中所有詞彙之詞彙熟悉度計算完成後，最後再將所有詞彙之詞彙熟悉度加以線性轉換至0~1 的區間中。

貳、詞彙熟悉度評估

本研究中所發展之詞彙熟悉度，目的在於探討兒童對於詞彙的熟悉度。本研究從兒童語料庫中根據各個詞彙的詞頻分為高、中、低三類，並從中各抽取20 個關鍵詞彙，共計60個詞彙，並請八位具有語文教育背景或在國小擔任國語科教師的專家來針對此60個詞彙進行評分。其計分方式為1～7分，7分代表兒童熟悉程度最高，1分代表熟悉程度最低。若專家認為目標詞彙對於國小兒童來說屬於較熟悉的詞彙，則給予較高分數，反之亦然。最後之評估方式為計算60個詞彙在使用不同字頻權重與詞頻權重時，詞彙熟悉度與專家評分之相關性，以評估兒童對於詞彙的熟悉度之成效，相關性愈高則代表成效愈佳。

第三節斷詞測驗之試卷類型與分析說明

壹、斷詞測驗類型

本研究中斷詞測驗分為傳統組卷斷詞測驗與LSA輔助組卷斷詞測驗兩類，並依照關聯度（高關聯度、中關聯度、低關聯）與熟悉度（熟悉、陌生）等兩類變項之不同設定，各有六種試卷，因此在本研究中共使用12種不同之斷詞測驗。詳細種類與範例如表3-3-1、表3-3-2所示：

(39)

表 3-3-1 斷詞測驗類型斷詞測驗傳統組卷斷詞測驗 LSA輔助組卷斷詞測驗傳統組卷熟悉高關聯傳統組卷陌生高關聯 LSA組卷熟悉高關聯 LSA組卷陌生高關聯傳統組卷熟悉中關聯傳統組卷陌生中關聯 LSA組卷熟悉中關聯 LSA組卷陌生中關聯傳統組卷熟悉低關聯傳統組卷陌生低關聯 LSA組卷熟悉低關聯 LSA組卷陌生低關聯表 3-3-2 斷詞測驗類型範例斷詞測驗高關聯（＞第一四分位數）中關聯（介於第一四分位數與第三四分位數）低關聯（＜第三四分位數）熟悉（＞第二四分位數）白天（0.0286）太陽（0.0282）關聯度：0.3401 白天（0.0286）熱情（0.0131）關聯度：0.0603 白天（0.0286）民主（0.0115）關聯度：-0.0433 陌生（＜第二四分位數）封底（0.0009）印刷（0.0014）關聯度：0.2621 封底（0.0009）出版社（0.0083）關聯度：0.0721 封底（0.0009）冰雹（0.0011）關聯度：-0.0451

貳、斷詞測驗分析說明

本研究在斷詞測驗組卷方面可分為傳統組卷斷詞測驗與LSA輔助組卷兩種，

(40)

而在計分方式則有傳統二元計分方式與LSA計分方式兩種，因此在本研究中斷詞測驗將會以四類型態之方式來進行說明與分析。表3-3-2 斷詞測驗分析之四類型態專家組卷 LSA組卷傳統計分專家組卷傳統計分 LSA組卷傳統計分 LSA計分專家組卷 LSA計分 LSA組卷 LSA計分

第四節

LSA 斷詞測驗自動化計分方式

不同於一般傳統斷詞計分所採用的二元計分，此自動化計分方式為根據前後詞彙關聯度以及詞彙之熟悉度，針對斷詞測驗中每個不同位置來給予不同的分數。以往的中文斷詞大多都只二元計分的方式給予兒童分數，答對就給分，答錯就不給分。但實際上每個詞彙本身之熟悉度與詞彙之間關聯度皆不同，因此應對於不同位置的得分而給予不同的加權。假設有個詞彙分別為「」、「」一直到「」，其題目為「 … … 」。例如：題目「山遊樂園許多」，作答方式是兒童必須快速且正確的判斷出詞和詞之間的界限，並畫上斜線，如「山/遊樂園/許多」，而正確畫出的斜線數即為得分。若斷詞基本給分為 S ，在此例中受試者兩條斜線都畫在正確的位置，即代表可得到2 S分。傳統計分方式如下： 0，答錯。 1，答對。（3.3）

(41)

我們可以利用LSA算出每個詞彙在兒童語料庫中的熟悉度作為加權的準則，詞彙和在兒童語料庫的熟悉度用 f（ , C）表示，而詞彙和詞彙在LSA的 關聯度用sim（ , ）表示，其關係如下圖所示：圖3-4-1 詞彙熟悉度與關聯度關係示意圖 若 f（ , C）→0 且 f（ , C）→0，表示詞彙之熟悉度低，即此詞彙對兒 童來說較為陌生，因此詞彙可能較困難，其給分應該較高；反之，若 f（ , C） →1且 f（ , C）→1，則表示此詞彙熟悉度高，因此給分較低。而 和之間的得分可以利用以下方式給定：（） 1 （ , ）（ , ） 2 （3.4）因為此測驗的目的是判斷出詞和詞之間的界限，所以不能只看單一詞彙的熟悉度，更需考慮詞彙與詞彙間的關聯性，因此也必須探討詞彙和詞彙在 LSA 的相關度對給分所造成的影響，其分數給定方式如下：（）＝（ , ）（3.5）綜合以上所述，兒童在詞彙和詞彙的斷點得分給定方式如下： 0，答錯。，答對。（3.6） f（ , C） f（ , C） f（ , C） f（ , C） f（ , C） ……

(42)

第五節研究對象

本研究在斷詞測驗部分皆採用紙筆測驗方式，選取之研究樣本則為臺中市大勇國小五年級的學童，並排除智能障礙、情緒障礙等學童之後，有效樣本共52 名學生，其中男性27 名，女性 25 名（年齡介於 10 歲 3 個月至 11 歲 7 個月，平均為10 歲 9 個月）。

第六節研究工具

研究工具包含：兒童語料庫、「瑞文氏標準矩陣推理測驗」、「識字量評估測驗」、「中文閱讀理解測驗」，以及本次研究所建置之LSA 斷詞測驗組卷輔助工具與研究者自編之「專家斷詞測驗」。茲分述如下：

壹、兒童語料庫

本研究之「兒童語料庫」係指廖晨惠（2011）之國科會計畫中所建置完成之國小兒童語料庫。其語料來源為現行國民小學一到六年級教科書及獲得授權之兒童讀物（國語日報、大紀元時報等），共計1208 篇文章，20022 個詞彙。之後進行篩選，除去不適合做為斷詞題目之詞彙，如人名、介係詞、短語、成語等，適合成為斷詞測驗之題庫者共有10568 個詞彙，並將原有之 1208 篇文章切割為 5219 份文件，每份文件大小約為200 字，並選擇維度 300 維來進行維度約化，最後依此建置出10568 個詞彙×5219 份文件的中文潛在語意空間。

貳、瑞文氏標準矩陣推理測驗

「瑞文氏標準矩陣推理測驗」係指英國心理測驗學者瑞文氏所編製之非語文智力測驗，本研究中所採用之測驗為1998年所出版之平行本（SPM-P），測驗時間為30分鐘，其功能為測量受試者的推理能力，以推斷其智能發展之程度，適用於國小三年級至六年級學生，題目共分為甲、乙、丙、丁、戊五組，每組十二題，

(43)

共有六十題。每通過一題得一分，最後即可依常模對照表，將總得分按年齡分別轉換為百分等級（PR）與標準分數。SPM-P 的折半信度為.87 ~.92，重測信度介於.73 ~.87 間。

參、識字量評估測驗

本研究中之「識字量評估測驗」指洪儷瑜、王瓊珠、張郁雯、陳秀芬（2006）所編製之識字量評估測驗（國字測驗），本研究中所採用為A39 之版本，測驗時間無限制，適用對象為國小三年級以上至國中三年級學生。測驗中共有40 題，每題皆有一個目標字，學生必須在提供的目標字後寫出正確的注音並造詞，原始分數為注音和造詞皆正確則得到一分，再依據換算表換算出學生的識字量。在本研究中若兒童在此測驗得分越高，表示其識字量越高。本測驗的內部一致性信度 Cronbachα 係數和折半信度都在.85 以上，重測信度為.85。

肆、中文閱讀理解測驗

本研究中之「中文閱讀理解測驗」係指林寶貴、錡寶香（1999）所編製之中文閱讀理解測驗，測驗時間並無限制，其目的在於評量國小二年級至六年級學的閱讀理解能力，設計架構中包含音韻處理能力、語意能力、語法能力、了解文章基本事實、比較分析、抽取文章大意、推論等七大能力，合計共一百題。在本研究中若兒童在此測驗得分越高，表示其閱讀理解能力越佳。本測驗的信度方面，內部一致性信度Cronbachα係數為.86；重測信度為.74。

伍、 LSA 斷詞測驗組卷輔助工具

本研究中所指斷詞測驗組卷輔助工具為廖晨惠（2011）的國科會計畫中所發展之以LSA 為基礎之斷詞測驗組卷輔助工具。此工具以國小兒童語料庫之詞彙為基礎，主要目的是根據LSA 所計算出之詞彙間關聯度與本研究中所定義之詞彙熟悉度等兩種可操作之變項來自動化產生出適合之斷詞測驗。

(44)

此輔助工具依照詞彙之關聯度（共有高關聯度、中關聯度、低關聯度三種級別）與本研究中所定義之詞彙熟悉度（共有熟悉、陌生兩種級別）的設定之不同共可產生六種斷詞測驗，每份斷詞測驗中各由150 個不同詞彙組成，測驗時間皆為一分鐘。在本研究中，將探討此斷詞測驗組卷輔助工具所產生之斷詞測驗與專家斷詞測驗之成效。

陸、專家斷詞測驗

本研究中所指之「專家斷詞測驗」係改編自廖晨惠（2009）之一分鐘斷詞測驗，目的在於評量學生快速斷詞的能力，意即找出詞與詞之間之界限。試卷內容依照詞彙間之關聯度（共有高關聯度、中關聯度、低關聯度三種級別）與本研究中所定義之詞彙之熟悉度（共有熟悉、陌生兩種級別）的不同，共分為六種測驗，每份測驗中各有150 個不同詞彙，測驗時間皆為一分鐘，藉以比較 LSA 斷詞測驗組卷輔助工具所產生之斷詞測驗之成效。下表為斷詞測驗例題。表3-5-1 斷詞測驗例題題目鋼琴音樂歌讚美高興進步良好觀賞博物館遊客答案鋼琴/音樂/歌/讚美/高興/進步/良好/觀賞/博物館/遊客

柒、程式撰寫工具

本研究中使用 MATLAB 程式工具來建置中文的潛在語意空間與 LSA 斷詞測驗組卷輔助工具，並發展詞彙熟悉度與LSA 斷詞自動化計分模式。

第七節資料處理分析

在本研究中，量化資料部分使用SPSS for Window來進行分析，統計方法包含敘述性統計、皮爾遜積差相關、肯德爾和諧係數與階層式迴歸等四項，簡述如下：

(45)

壹、敘述性統計

敘述兒童在傳統組卷斷詞測驗與LSA輔助組卷斷詞測驗之二元計分與LSA自動化計分，以及在閱讀理解測驗之結果，如平均值、最大值、最小值及標準差等。

貳、皮爾遜積差相關（Pearson product-moment correlation）

本研究主要使用皮爾遜積差相關來探討以下三點：第一、檢視詞彙熟悉度與專家評分成效；第二、檢視傳統組卷斷詞測驗與LSA輔助組卷斷詞測驗之成效；第三、檢視二元計分與LSA自動化計分在斷詞測驗上之成效。首先是檢視詞彙熟悉度與專家評分之成效，在這裡比較詞彙熟悉度與專家評分之相關性，相關性愈高表示成效愈佳。

參、肯德爾和諧係數（kendall＇s W）

本研究使用肯德爾和諧係數進行考驗，來判斷詞彙熟悉度中所有專家評分之間的一致性。

肆、階層式迴歸分析（Hierarchical regression）

本研究中主要使用階層式迴歸分析探討以下兩點：第一、檢視斷詞測驗（傳統組卷斷詞測驗、LSA輔助組卷斷詞測驗）對於閱讀理解之預測度，預測度愈高代表成效愈佳；第二、檢視斷詞測驗（二元計分、LSA自動化計分）對於閱讀理解之預測度，預測度愈高代表成效愈佳。

(46)

36 本研究之成果主要可分為以下幾項：詞彙熟悉度與專家評分之成效、傳統組卷斷詞測驗與LSA 輔助組卷斷詞測驗之成效，以及檢視傳統組卷斷詞測驗與 LSA 輔助組卷斷詞測驗、傳統二元計分方式與LSA 自動化計分方式對閱讀理解與識字量之預測度。分別敘述如下：

第一節詞彙熟悉度與專家評分之成效

本研究從兒童語料庫中依詞頻高低之不同，從詞頻高、中、低三種頻率中各隨機選出20個詞彙，共計60個詞彙，並請八位語文教育相關之專家針對此60個詞彙進行詞彙對兒童的熟悉度評分並評估專家評分之一致性。之後使用皮爾遜積差相關比較在使用不同字頻權重與詞頻權重時，詞彙熟悉度與專家評分之相關性，以評估兒童對於詞彙的熟悉度之成效。

壹、評分者一致性

本研究請八位語文教育相關之專家針對從語料庫依詞頻分為高、中、低各挑選20個詞彙，共計60個詞彙進行評分，以下表4-1-1為八位語文教育相關之專家評分之一致性。表4-1-1 專家評分之一致性 Kendall's W 檢定(a) .361 顯著性 .000 a Kendall 和諧係數由表4-1-1可知，kendall和諧係數達顯著，表示專家在詞彙熟悉度中的評 分具有一致性，而評分者之間則達到r =.361的相關。

(47)

37 專家評分與不同字頻權重與詞頻權重所計算出之熟悉度相關性如下表 4-1-1所示（W為字頻權重，T為詞頻權重）： 表 4-1-2 專家評分與詞彙熟悉度、詞頻、字頻之相關性專家評分專家評分 - 詞頻 0.448 字頻 0.418 W=0.1 T=0.9 0.511 W=0.2 T=0.8 0.473 W=0.3 T=0.7 0.456 W=0.4 T=0.6 0.445 W=0.5 T=0.5 0.437 W=0.4 T=0.6 0.431 W=0.3 T=0.7 0.426 W=0.2 T=0.8 0.423 W=0.1 T=0.9 0.420 表4-1-1的研究結果顯示，本研究發展之詞彙熟悉度在字頻權重採用0.1和詞頻權重採用0.9時，與八位專家評分之顯著相關性最高（平均 r =.511）。而在詞頻與字頻的部分也與專家評分同樣達顯著相關（平均 r =.448 與 r =.418），但平均而言，詞頻與字頻之相關度仍低於本研究發展之詞彙熟悉度之相關度。

(48)

38 因素，但也顯現出採用本研究發展之詞彙熟悉度以詞頻為主、字頻為輔的計算方式，較單純參考詞頻效果為佳。

第二節傳統斷詞測驗與LSA斷詞測驗之試卷內容

本研究中由兒童語料庫中篩選出之斷詞測驗之題庫中共有10568個詞彙，各類詞彙分析如表4-2-1所示：表 4-2-1 斷詞測驗之題庫中詞彙類型單字詞 470 4.447% 雙字詞 8966 84.841% 三字詞 1124 10.636% 四字詞 8 0.076% 總計 10568 100% 傳統組卷斷詞測驗與LSA輔助組卷斷詞測驗兩類共12份測驗，每份測驗中皆由150個不同詞彙所組成，詞彙類型統計如表4-2-2、表4-2-3所示：

(49)

39 傳統組卷斷詞測驗測驗內容類型數量百分比高關聯熟悉單字詞 20 13.33% 雙字詞 120 80.00% 三字詞 10 6.67% 高關聯陌生單字詞 13 8.67% 雙字詞 120 80.00% 三字詞 17 11.33% 中關聯熟悉單字詞 19 12.67% 雙字詞 122 81.33% 三字詞 9 6.00% 中關聯陌生單字詞 14 9.33% 雙字詞 121 80.67% 三字詞 15 10.00% 低關聯熟悉單字詞 15 10.00% 雙字詞 120 80.00% 三字詞 15 10.00% 低關聯陌生單字詞 10 6.67% 雙字詞 118 78.67% 三字詞 22 14.67% 傳統組卷平均單字詞 15.16667 10.11% 雙字詞 120.1667 80.11% 三字詞 14.66667 9.78%

(50)

40 LSA 輔助組卷斷詞測驗測驗內容類型數量百分比高關聯熟悉單字詞 3 2.00% 雙字詞 138 92.00% 三字詞 8 5.33% 高關聯陌生單字詞 4 2.67% 雙字詞 137 91.33% 三字詞 9 6.00% 中關聯熟悉單字詞 5 3.33% 雙字詞 129 86.00% 三字詞 16 10.67% 中關聯陌生單字詞 4 2.67% 雙字詞 136 90.67% 三字詞 10 6.67% 低關聯熟悉單字詞 7 4.67% 雙字詞 133 89.33% 三字詞 10 6.67% 低關聯陌生單字詞 7 4.67% 雙字詞 130 86.67% 三字詞 13 8.67% LSA 組卷平均單字詞 5 3.33% 雙字詞 133.8333 89.33% 三字詞 11 7.22%

以潛在語意分析建置斷詞測驗輔助工具及其在閱讀理解上之應用

國立臺中教育大學教育測驗統計研究所理學碩士論文

指導教授：郭伯臣 博士

廖晨惠 博士

以潛在語意分析建置斷詞測驗輔助工具

及其在閱讀理解上之應用

研究生： 吳芷寧 撰

中

華

民

國

一

○ 二

年

一

月

謝辭

摘要

ABSTRACT

目錄

表目錄

圖目錄

第一章 緒論

第一節 研究背景與研究動機

第二節 研究目的

第三節 名詞解釋

壹、潛在語意分析

貳、 斷詞

參、LSA 斷詞測驗組卷輔助工具

肆、閱讀理解

第二章 文獻探討

第一節 潛在語意分析

壹、語料庫的相關研究

貳、潛在語意空間建置之流程

參、詞彙語意關聯度計算

第二

二節 閱

閱讀理解

解之相

相關研究

究

第三節 斷詞在閱讀理解之相關研究

第四節 斷詞測驗在閱讀理解之相關應用

第五節 總結

第三章 研究方法

第一節 研究流程

第二節 詞彙之熟悉度定義與評估

壹、 詞彙熟悉度定義

貳、 詞彙熟悉度評估

第三節 斷詞測驗之試卷類型與分析說明

壹、 斷詞測驗類型

貳、 斷詞測驗分析說明

第四節