緒論 - 兒童文本關聯詞指標分析系統建置與應用

本研究目的在建置線上中文兒童文本關聯詞指標分析系統，並藉此關聯詞指標統計分析「兒童語料庫」及國編版教科書中國小階段的教科書內關聯詞的分布情形及出現率，最後使用「中高年級文本理解測驗」題本，分別以古典測驗理論與試題反應理論計分，探討關聯詞指標與閱讀理解表現的關係。本章分為三節，

第一節說明研究動機，第二節說明研究目的，第三節為名詞解釋。

第一節研究動機

閱讀的目的在於獲得意義，它並非只是單純的編碼、解碼過程，而是經由讀者、文本、閱讀情境的互動過程並提取讀者先備知識與經驗，對文本融會貫通後得到的認知與理解，再內化成為讀者個人的文本意義(Kintsch, 1998)。傳統行為主義認為「可讀性高」的文章即被視為容易理解的文章，而一篇文章只要大致符合

「沒有太多艱難的字詞」、「文句長度適中」等條件就可以稱為可讀性高的文章 (Hiebert & Raphael, 1996)。認知論則認為除了「可讀性高」之外，仍應考慮文章的結構性及內容的連貫性對讀者的影響，若文章內容能以「親近讀者」(user- friendly)的方式來書寫，例如有清楚的文章結構、明確的標題、內容的前後連貫性等，讀者便可節省有限的認知資源或做較少的推論，而達到文意的理解(Van den Broek & Kremer, 2000)。影響閱讀理解的因素包含讀者本身的因素（讀者的動機、

閱讀技巧、閱讀策略、推論能力、背景知識等）、文章的性質以及閱讀的情境(Van den Broek & Kremer, 2000)，其中讀者的因素及閱讀的情境是較為複雜且難以掌握的，相較之下，藉著提供「可讀性高」及「親近讀者」的文本以提升讀者的閱讀理解，是較容易著力且值得嘗試的途徑，而文本分析技術的發展與應用即是為了達成此一目的。

在教育的領域上，文本分析技術運用的相當廣泛，如英文文字系統中用以判斷文章難度的可讀性公式（例如： Dale & Chall, 1948; McLaughlin, 1969; Fry,

2002…等等），運用這些公式可以找出適合學生閱讀的文章來進行教學(Anderson

& Jones, 1993; Taylor & Wahlstrom, 1986)、做為研究材料中文章選材的依據 (O’Shea, Sindelar & O’Shea, 1987)、做為教科書編輯選材的參考(Landrum &

Hormel, 2002; Spinks & Wells, 1993)、做為評鑑所使用教科書中文章難度的依據 (Brabston, Nixon & Helms, 1998; Williams, Leung, Kent & Heazlewood, 2002)、或是做為編製測驗中題幹敘寫難度之依據(Okland & Lane, 2004)等。隨著傳統可讀性公式的發展，新的文本分析工具 Coh-Metrix (Graesser et al., 2004)應運而生，

Coh-Metrix 是一個線上文本分析工具, 有別於傳統可讀性公式根據語意及語法等表淺層次的語言特徵估算文本難度，Coh-Metrix 系統特別注重文本的凝聚力 (cohesion)，重視文章的結構性及內容的連貫性對讀者的影響，其文本分類的效果已獲得心理學實徵證據的支持 (McNamara, Louwerse, McCarthy, & Graesser, 2010)。不論是傳統的可讀性公式到 Coh-Metrix 的興起，文本的選擇對學習者的閱讀理解而言，一直是相當重要的課題。

相較於西方文本分析技術的蓬勃發展，中文的相關研究顯得相對的稀少，早期的可讀性公式研究（例如：于崇先，1960；楊孝榮，1971；荊溪昱，1992，1995）

所選擇的指標主要參考西方可讀性公式的發現，著重於字、詞特徵等表淺層次的語言特徵來計算文章難度，且未發展出一套計算的程式來加以推廣，故在使用上受到限制而導致無法被普遍運用。隨著電腦科技的進步，現今中文文本分析技術也有所突破，國立臺灣師範大學可讀性研究團隊開發出一套文本可讀性指標自動化分析系統(Chinese Readability Index Explorer, CRIE；宋曜廷等，2013)，能夠自動分析文本多項特徵，而本研究團隊則以 Coh-Metrix 的系統為架構，依照中文語言特徵與結構轉化成適合中文文本分析之指標，發展中文文本自動化分析系統。

本研究團隊所建置之中文文本自動化分析系統-中文 Coh-Metrix 與 CRIE 系統除了在指標與計算公式有所不同外，語料庫的使用亦不相同，CRIE 系統當中使用 98 年審定版（K 版、H 版、N 版）國語教科書文章 386 篇文章（宋曜廷等，2013），

本研究團隊中文文本自動化分析系統所採用之語料庫為廖晨惠（2010）之國科會

｢閱讀研究議題八：以 LSA 為基礎之電腦化閱讀認知測驗及 AutoTutor 建置｣計畫

（編號：NSC 100-2420-H-142-001-MY3）所建置的國小語料庫 945 篇文章中，國小各版本跨領域之課文 787 篇做分析，研究的結果將能提供中文文本分析更多樣化的資訊。

本研究團隊以 Coh-Metrix 的系統為架構，所發展之中文文本自動化分析系統為一龐大的研究計畫，其所需之人力、物力非個人能力所及，本論文將僅針對系統內關聯詞指標進行研究，因著中文語法與英文語法的不同，Coh-Metrix 的關聯詞指標並不適合直接套用於中文文本分析系統，因此本研究將以中文語法的角度出發，將關聯詞加以定義與分類，完成中文兒童文本關聯詞指標分析系統的建置與應用。

第二節研究目的

根據上述研究動機，本研究擬以 Coh-Metrix 指標計算公式為依據，針對國小階段教科書中關聯詞語加以探究，本研究的目的如下：

一、建置線上中文兒童文本分析系統之關聯詞指標。

二、檢視國小教科書關聯詞的分布情形及出現率。

三、探討關聯詞指標與閱讀理解的關係。

第三節名詞解釋

一、閱讀理解

閱讀理解是經由讀者、文本、閱讀情境的互動過程並提取讀者先備知識與經驗，對文本融會貫通後得到的認知與理解，再內化成為讀者個人的文本意義 (Kintsch, 1988)。「閱讀理解」分為「文本理解」與「深度理解」兩部分，「文本理解」指的是文章表面意義上的理解，包括「提取訊息」與「推論分析」；深度理解指的是超越了文章本身的認識，也就是超越了「文本理解」，對文章重組、解釋、延伸、批判上有了進一步的理解，並且以批判的方式解釋文章的特性，例如：

立論觀點、語氣情緒、鋪陳邏輯等，深度理解包括了「詮釋整合」和「比較評估」

（柯華葳，2009）。

二、關聯詞語：

關聯詞語的範圍包含連接詞、關聯副詞、助詞，及一小部分起關聯作用的詞語，其目的用來連接各分句，並且可以明顯地標示分句之間的邏輯事理關係，

對複句的關係有顯示、轉化和突出強調等作用，這些起關連作用的詞語統稱「關聯詞」。關聯詞不僅可以出現在句子內部，牽引連接詞與詞、短語與短語、分句與分句之間的作用，而且可以出現在句子外部，牽引連接句子與句子、句子與句群、句群與句群、段落與段落之間的作用。關聯詞語是明確的顯示語句間邏輯事理關係的語法標誌。

三、複句：

複句是由兩個或兩個以上的分句構成的句子。而複句裡的各個分句在結構上是互相獨立的，在意義和關係上卻是互相依存的，透過「關聯詞語」，可以顯示或強化出分句之間的關聯關係。本研究即是以複句分句之間所呈現的不同邏輯事理關係作為依據，將「關聯詞語」進行分類。

四、Coh-Metrix

Coh-Metrix 是由曼菲斯大學所發展的一個線上文本分析系統，透過各項指標的計算數值，可以了解文本凝聚力和文本心理表徵的連貫性，其分析指標包含：

英文可讀性公式、文字描述性分析、詞彙多樣性、詞性分類、句法分析、潛在語意分析等等 (Graesser, McNamara, & Louwerse, 2003)。

在文檔中兒童文本關聯詞指標分析系統建置與應用 (頁 9-14)

緒論

第一節 研究動機

第二節 研究目的

第三節 名詞解釋

第一節研究動機

第二節研究目的

第三節名詞解釋