本研究目的在建置線上中文兒童文本關聯詞指標分析系統,並藉此關聯詞指 標統計分析「兒童語料庫」及國編版教科書中國小階段的教科書內關聯詞的分布 情形及出現率,最後使用「中高年級文本理解測驗」題本,分別以古典測驗理論 與試題反應理論計分,探討關聯詞指標與閱讀理解表現的關係。本章分為三節,
第一節說明研究動機,第二節說明研究目的,第三節為名詞解釋。
第一節 研究動機
閱讀的目的在於獲得意義,它並非只是單純的編碼、解碼過程,而是經由讀 者、文本、閱讀情境的互動過程並提取讀者先備知識與經驗,對文本融會貫通後 得到的認知與理解,再內化成為讀者個人的文本意義(Kintsch, 1998)。傳統行為主 義認為「可讀性高」的文章即被視為容易理解的文章,而一篇文章只要大致符合
「沒有太多艱難的字詞」、「文句長度適中」等條件就可以稱為可讀性高的文章 (Hiebert & Raphael, 1996)。認知論則認為除了「可讀性高」之外,仍應考慮文章 的結構性及內容的連貫性對讀者的影響,若文章內容能以「親近讀者」(user- friendly)的方式來書寫,例如有清楚的文章結構、明確的標題、內容的前後連貫 性等,讀者便可節省有限的認知資源或做較少的推論,而達到文意的理解(Van den Broek & Kremer, 2000)。影響閱讀理解的因素包含讀者本身的因素(讀者的動機、
閱讀技巧、閱讀策略、推論能力、背景知識等)、文章的性質以及閱讀的情境(Van den Broek & Kremer, 2000),其中讀者的因素及閱讀的情境是較為複雜且難以掌握 的,相較之下,藉著提供「可讀性高」及「親近讀者」的文本以提升讀者的閱讀 理解,是較容易著力且值得嘗試的途徑,而文本分析技術的發展與應用即是為了 達成此一目的。
在教育的領域上,文本分析技術運用的相當廣泛,如英文文字系統中用以判 斷文章難度的可讀性公式(例如: Dale & Chall, 1948; McLaughlin, 1969; Fry,
2002…等等),運用這些公式可以找出適合學生閱讀的文章來進行教學(Anderson
& Jones, 1993; Taylor & Wahlstrom, 1986)、做為研究材料中文章選材的依據 (O’Shea, Sindelar & O’Shea, 1987)、做為教科書編輯選材的參考(Landrum &
Hormel, 2002; Spinks & Wells, 1993)、做為評鑑所使用教科書中文章難度的依據 (Brabston, Nixon & Helms, 1998; Williams, Leung, Kent & Heazlewood, 2002)、或是 做為編製測驗中題幹敘寫難度之依據(Okland & Lane, 2004)等。隨著傳統可讀性公 式的發展,新的文本分析工具 Coh-Metrix (Graesser et al., 2004)應運而生,
Coh-Metrix 是一個線上文本分析工具, 有別於傳統可讀性公式根據語意及語法 等表淺層次的語言特徵估算文本難度,Coh-Metrix 系統特別注重文本的凝聚力 (cohesion),重視文章的結構性及內容的連貫性對讀者的影響,其文本分類的效果 已 獲 得 心 理 學 實 徵 證 據 的 支 持 (McNamara, Louwerse, McCarthy, & Graesser, 2010)。不論是傳統的可讀性公式到 Coh-Metrix 的興起,文本的選擇對學習者的 閱讀理解而言,一直是相當重要的課題。
相較於西方文本分析技術的蓬勃發展,中文的相關研究顯得相對的稀少,早 期的可讀性公式研究(例如:于崇先,1960;楊孝榮,1971;荊溪昱,1992,1995)
所選擇的指標主要參考西方可讀性公式的發現,著重於字、詞特徵等表淺層次的 語言特徵來計算文章難度,且未發展出一套計算的程式來加以推廣,故在使用上 受到限制而導致無法被普遍運用。隨著電腦科技的進步,現今中文文本分析技術 也有所突破,國立臺灣師範大學可讀性研究團隊開發出一套文本可讀性指標自動 化分析系統(Chinese Readability Index Explorer, CRIE;宋曜廷等,2013),能夠自 動分析文本多項特徵,而本研究團隊則以 Coh-Metrix 的系統為架構,依照中文語 言特徵與結構轉化成適合中文文本分析之指標,發展中文文本自動化分析系統。
本研究團隊所建置之中文文本自動化分析系統-中文 Coh-Metrix 與 CRIE 系統除了 在指標與計算公式有所不同外,語料庫的使用亦不相同,CRIE 系統當中使用 98 年審定版(K 版、H 版、N 版)國語教科書文章 386 篇文章(宋曜廷等,2013),
本研究團隊中文文本自動化分析系統所採用之語料庫為廖晨惠(2010)之國科會
「閱讀研究議題八:以 LSA 為基礎之電腦化閱讀認知測驗及 AutoTutor 建置」計畫
(編號:NSC 100-2420-H-142-001-MY3)所建置的國小語料庫 945 篇文章中,國 小各版本跨領域之課文 787 篇做分析,研究的結果將能提供中文文本分析更多樣 化的資訊。
本研究團隊以 Coh-Metrix 的系統為架構,所發展之中文文本自動化分析系統 為一龐大的研究計畫,其所需之人力、物力非個人能力所及,本論文將僅針對系 統內關聯詞指標進行研究,因著中文語法與英文語法的不同,Coh-Metrix 的關聯 詞指標並不適合直接套用於中文文本分析系統,因此本研究將以中文語法的角度 出發,將關聯詞加以定義與分類,完成中文兒童文本關聯詞指標分析系統的建置 與應用。
第二節 研究目的
根據上述研究動機,本研究擬以 Coh-Metrix 指標計算公式為依據,針對國小 階段教科書中關聯詞語加以探究,本研究的目的如下:
一、建置線上中文兒童文本分析系統之關聯詞指標。
二、檢視國小教科書關聯詞的分布情形及出現率。
三、探討關聯詞指標與閱讀理解的關係。
第三節 名詞解釋
一、閱讀理解
閱讀理解是經由讀者、文本、閱讀情境的互動過程並提取讀者先備知識與經 驗,對文本融會貫通後得到的認知與理解,再內化成為讀者個人的文本意義 (Kintsch, 1988)。「閱讀理解」分為「文本理解」與「深度理解」兩部分,「文本理 解」指的是文章表面意義上的理解,包括「提取訊息」與「推論分析」;深度理 解指的是超越了文章本身的認識,也就是超越了「文本理解」,對文章重組、解 釋、延伸、批判上有了進一步的理解,並且以批判的方式解釋文章的特性,例如:
立論觀點、語氣情緒、鋪陳邏輯等,深度理解包括了「詮釋整合」和「比較評估」
(柯華葳,2009)。
二、關聯詞語:
關聯詞語的範圍包含連接詞、關聯副詞、助詞,及一小部分起關聯作用的 詞語,其目的用來連接各分句,並且可以明顯地標示分句之間的邏輯事理關係,
對複句的關係有顯示、轉化和突出強調等作用,這些起關連作用的詞語統稱「關 聯詞」。關聯詞不僅可以出現在句子內部,牽引連接詞與詞、短語與短語、分句 與分句之間的作用,而且可以出現在句子外部,牽引連接句子與句子、句子與句 群、句群與句群、段落與段落之間的作用。關聯詞語是明確的顯示語句間邏輯事 理關係的語法標誌。
三、複句:
複句是由兩個或兩個以上的分句構成的句子。而複句裡的各個分句在結構上 是互相獨立的,在意義和關係上卻是互相依存的,透過「關聯詞語」,可以顯示 或強化出分句之間的關聯關係。本研究即是以複句分句之間所呈現的不同邏輯事 理關係作為依據,將「關聯詞語」進行分類。
四、Coh-Metrix
Coh-Metrix 是由曼菲斯大學所發展的一個線上文本分析系統,透過各項指標 的計算數值,可以了解文本凝聚力和文本心理表徵的連貫性,其分析指標包含:
英文可讀性公式、文字描述性分析、詞彙多樣性、詞性分類、句法分析、潛在語 意分析等等 (Graesser, McNamara, & Louwerse, 2003)。