• 沒有找到結果。

Coh-Metrix

在文檔中 中文兒童文本特徵分析 (頁 15-21)

第二章 文獻探討

第一節 Coh-Metrix

第二章 文獻探討

本章依據前章所述之研究目的,進行相關文獻的整理與分析。文獻探討可分 為兩個部分,第一節為 Coh-Metrix 系統之簡介、第二節則統整過去已發展之中文 兒童文本分析相關指標。

第一節 Coh-Metrix

線上文本分析系統 Coh-Metrix 為美國曼菲斯大學(University of Memphis)

自 2002 年起所開發的多樣化自動化線上文本分析系統,至今已發展至 3.0 版,其 操作介面如圖 2-1-1。其中共包含 11 個類別共 106 項指標,詳如表 2-1-1。其中 11 個類別分別為:描述性指標、文本適讀性分數、參照凝聚力、潛在語意分析

(Latent Semantic Analysis,簡稱 LSA)、詞彙多樣性、關聯詞、情境模式、句法 簡明度、句法密度、詞彙訊息及可讀性公式。而透過這些類別裡多樣化指標的數 值計算,Coh-Metrix 可提供涵蓋了詞彙(words)、句型(syntax)、文本基礎

( explicittextbase )、 情 境 模 式 ( situation model ) 及 話 語 風 格 和 修 辭 結 構

(discoursegenre and rhetorical structure)」等五個面向的分析數據(McNamara et al, 2014)。

由於過去美國教科書的編排,過分依賴傳統可讀性公式所強調的平均音節數、

平均句長等表淺的語言特徵作為估算文本難度的依據。為了遷就適讀年級,反而 導致教科書充滿破碎、不連貫甚至凝聚力極低的句子,造成學生學習及理解的困 難(McNamara, Louwerse, & Graesser, 2002)。有鑑於此,Coh-Metrix 系統遂孕育 而生。有別於傳統可讀性公式多琢磨與較為表淺的指標來衡量文本的難易,

Coh-Metrix 則利用了計算語言學、語料庫語言學、資訊檢索等多種自然語言分析 技術,為學生閱讀材料的選擇提供了十分可靠的依據( McNamara, Graesser, McCarthy & Cai,2014)。透過 Coh-Metrix 系統多樣化的指標計算,我們得以瞭

6

解文章中詞彙、句子、段落以及篇章間文本的凝聚力(cohesion)及文本心理表 徵的連貫性(coherence)。凝聚力為文章組成的特性,透過凝聚力可以連結文章 中詞彙及句子的關係,並且連結作者透過文句所欲傳達的想法及概念。當一篇文 章具有高凝聚力,則讀者可以藉著作者在文句間所給予的線索及暗示,加速理解 與推論文本間的關係與概念,並產生更深層的閱讀理解。

Graesser, McNamara 與 Kulikowich(2011)使用主成份分析對 Coh-Metrix 2.0 版中的 53 個指標進行文本主成分的萃取,並運用最大變異數法進行直交轉軸,

分析出八個主成分,共可解釋文本變異達 67.3%之變異量。茲將此八成分對讀者 閱讀理解的影響分述如下:

一、描述性

可解釋文本特徵變異量達 18.5%。描述性高的文本多半是包含讀者高度熟悉 的人、事、時、地、物等內容,最簡單的例子如:我們日常的口語對話內容即是 最容易被理解的高描述性文本。

二、參照凝聚力

可解釋文本特徵變異量達 14.1%。高參照凝聚力的文本包含了較多的重複語 詞使讀者易於連接句子、段落及文章間的概念進而幫助讀者較快的達到閱讀的理 解。

三、句法簡明度

可解釋文本特徵變異量達 9.5%。當一個文本含有較少的詞彙及使用較為簡單,

令讀者熟悉的語法結構,則此文本便不難被讀者所理解。反之,若文章使用過多 的子句或是倒裝等句型,則會增加讀者理解上的負擔。

四、詞彙具體度:

可解釋文本特徵變異量達 6.3%。意指當一個文本使用的詞彙是較為具體、有 實質意義的,則此文本容易喚起讀者的心理圖像,而使的這篇文本能夠更容易的 被讀者處理及理解。

7

五、因果凝聚力

可解釋文本特徵變異量達 5.5%。當一個文本具有較多的因果關聯詞,則能夠 幫助讀者組織文本中的事件與流程的因果關係,以達成較為深入的的理解。如果 文本中包含許多關係,但卻沒有足夠的因果凝聚力,則讀者必須自行去連接及反 覆推敲文本間的關係。

六、動詞凝聚力

可解釋文本特徵變異量達 5.4%。當文本動詞重疊的程度越高,表示此文本包 含一個較為連貫的敘事結構,而這樣的文本能夠促進和加強情境模型層次上的理 解。當讀者的年紀越小,越需要高動詞凝聚力的文本以加強讀者的理解。

七、邏輯凝聚力

可解釋文本特徵變異量達 4.1%。當文本使用較多的轉折、遞進及比較關聯詞 來表達文字關係,則其文本的邏輯凝聚力較佳,可幫助讀者對文本有更深入的理 解。

八、時間凝聚力

可解釋文本特徵變異量達 4%。當文本包含較多有關時間性的線索例如時態、

時式,會使讀者更容易理解。另外,時間凝聚力也能幫助讀者在情境模型層次上 的理解。

8

圖 2-1-1 Coh-Metrix3.0 操作介面 資料來源:http://cohmetrix.memphis.edu/cohmetrixpr/index.html

表 2-2-1

Coh-Metrix 3.0 版指標類別及其細項

分類 編號 指標名稱 總數

描述性

1 段落數

11 2 句數

3 詞數

4 平均每段段落句數 5 每段落句數的標準差 6 平均每句詞數

7 每句詞數標準差 8 平均每詞彙音節數 9 詞彙音節數之標準差 10 平均每個詞彙的字母數 11 詞彙字母數之標準差

9

10

11

104 Flesch Reading Ease

3 105 Flesch-Kincaid Grade Level

106 Coh-Metrix L2 Readability 資料來源:McNamara, Graesser, McCarthy & Cai (2014)

在文檔中 中文兒童文本特徵分析 (頁 15-21)