• 沒有找到結果。

第二章 文獻探討

第四節 可讀性

壹、 可讀性定義

可讀性是指閱讀材料能夠被讀者流暢閱讀、理解並能發現其有趣之範圍(Dale

& Chall,1949);可讀性較高的文本具備某些特徵,例如:文本有較容易閱讀的 詞彙,句子結構簡單包含較少的代名詞及複合詞,內容符合讀者的先備知識,文 章呈現方式能適當的重述先前段落,提供相關知識,降低無關的干擾訊息(Klare,

1963)。在教育領域上,Lau & King(2006)提到可讀性評估(readability assessment)

是評估一份文本素材之困難度的方法,它廣泛地使用在教育領域,協助教師為學 生準備適當的素材。本研究所探討的可讀性在於運用適合中文的可讀性指標,並 以線性模式來進行可讀性分析。

貳、可讀性公式的發展

教材研究學者嘗試找出哪些是影響文本可讀性的重要因素及指標,設計各種 測量方式,把教材的難易度以量化來表示。如果教材難易度能以簡易的公式測量 得知,或以簡單的指數表示,教學的工作就是「配對的工作」(Fry, 1977a),也就 是為學生選擇難易適中的教材,供其學習,以達效果。除了須瞭解學生的學習程 度外,更需明白教材的難易度,以及如何得知教材適讀性,以做為選擇教材的依 據。以下分別介紹英文、中文的可讀性公式及選用的指標:

ㄧ、英文可讀性公式

由表 2-8 可發現研究測量教材難易度的公式大部分是影響文章理解的三個變 數:詞彙難度的多寡、音節數與句子的平均長度(Chall,1995; Harrison, 1980 )。可 讀性公式在測量語言成分可歸納為兩大特徵:

(ㄧ)詞彙或語意:詞彙是文章的意義單位,語意的理解能力包括:1.詞彙意義的 瞭解,2.詞彙意義之間結合形成短語或句子的聯結原則。閱讀是一種意義建構的 歷程,因此語意能力必然會與閱讀理解有關係(林寶貴、錡寶香,2005)。研究上

發現當閱讀內容中有較多不熟悉的詞彙時,其回顧的內容較不完整,可是當教學 者教讀者這些不熟悉的詞彙意義時,其回顧的內容會比較完整(Beck, Perfetti &

Mckeown,1982)。有些研究把一個人的詞彙能力視同理解力,具有廣博的詞彙語 庫,讀者自然容易理解文章的內涵(Thorndike, 1972)。二者的相關在 0.9 之上(Stahl, 2003)。詞彙語意測量的內容包括音節多寡、詞長及詞彙的使用頻率。以英文單字 的難易表呈現詞彙的難易度主要在音節多寡、使用頻率與衍生詞彙(Chall, 1958;

Stahl, 2003)。

(二)句子或語法:句子是影響閱讀理解的第二個主要因素,句子的長短、結構與 形態都是重要因素。閱讀時,長句多自然比長句少的文章難懂;充滿附屬子句的 文章較內容都是簡單句的文章難理解。同理,結構複雜、較少使用的句型也較不 易讀(賴伯勇,2005)。

傳統的可讀性公式 Flesch-Kincaid Grade Level 使用的指標是音節數與平均句 長,其優點是音節數、平均句長與詞彙難度、句子結構有重要的關聯性,且音節 數及平均句長指標容易計算偵測,然而語言學計算的進步發展,過去很多指標例 如:詞頻與結構複雜度無法計算出來的,現在都可以很容易的解決。

Stenner, Smith, Horabin, & Smith(1987)注意到評估文本難易度的兩個重要的 成分是詞頻和句子的複雜度,Stenner 與研究團隊發展 lexile 偵測,偵測的指標包 含詞頻和平均句長,此可讀性公式結合閱讀理解與統計迴歸分析。

Degrees of Reading Power(Koslin, et al., 1987)公式修改自 Bormuth 克漏字可讀 性公式,此公式運用三個指標分別是三千字表的使用次數、平均句長及平均字母 數,目前這個公式被 College Board 所採用,發現是預測難度很有效的公式。

建構閱讀模式學者認為讀者在閱讀過程中會主動建構文章意義(Graesser, Singer, & Trabasso, 1994)。若僅以語意與語法字表面特徵來偵測文本難度,無法 測量出文本深層的結構屬性,例如:凝聚力、推論、複雜度等(Bruce, Rubin, & Starr, 1981)。近年來研究者試著根據認知理論來分析文本的難度,不僅是探討表面特

徵的指標,甚者積極探討與文本相關的凝聚性指標,及指標間的關係(Benjamin, 2012)。Coh-Metrix 發展自動化處理文本的新方法,透過計算語言技術,分析詞、

句子、段落及篇章等較大範圍文本多層級之凝聚性與文章難度的關係(Graesser, McNamara, Louwerse, & Cai, 2004;宋曜廷等人,2013)。

凝聚性除了是文章組成的客觀特性,也是建構心理模型的重要成分,讀者需 要透過語意詮釋與心理模式的建構,才能夠產生整篇意義的深層理解,進而建構 較完整連貫心理表徵,達成較好的理解,因此凝聚性具有其重要性(Lehnert &

Ringle, 1982;宋曜廷等人,2013)。

Coh-metrix 近幾年所發展的第二外語公式(L2),運用三個指標包含:詞頻、

Coleman, 1965)

1.ㄧ音節詞數

the Fry Graph

Flesch Reading Ease(Flesch, Grade level ( Kincaid et al., 1975)

1. 平均句長 2. 平均音節數

年級=.39 ×平均句長+ 11.8×平均音節數–15.59 這個公式來自於 Flesch Reading Ease 並進一步 將分數轉換成年級,因此求出的數字即代表文

Degrees of Rading Power (Koslin et al.,

The New Dale-Chall(Edgar Dale & Jeanne S. Chall, 1995)

此公式修改自 Dall-Chall(1948),更新 Dale3000 詞彙表,並改良原始公式。難詞的定義為沒有 出現在 Dale3000 詞彙表中。

Lexile Framework (Stenner,1996)

1.平均句長對數 2.平均詞頻對數

Theoretical Logit=9.82247 ×平均句長對數 -2.14634 ×平均詞頻對數 –常數 ATOS

readability formula for books

(Crossley et al., 2008)

子比率」與閱讀理解的相關達 0.8,對依變項的解釋量達 63%,顯示這三個指標 是較佳預測變項。根據此公式,常用詞彙數與完整句子越多越容易讀、筆劃數越 多則越難讀。

荊溪昱於 1992 年至 1994 年期間對於國小、國中、高中國語教材進行一系列 之可讀性研究,此研究以課文長度、平均句長、常用字比率以及三種文體包括對 白文體、詩歌文體、文言文體為測量中文教材難易度之變項,研究結果發現國小 常用字表所得之預測效度較國中常用字表為高,而文體變項中的對白文體在國、

高中國文教材已失去預測的效果,其預測公式之相關係數達 0.9212,預測效度達 0.8486。最後以「課文長度」、「平均句長」、「常用字比率」三個指標為良好的預 測變項。

劉學濂(1996)擬定五個預測變項,非常用字比率、非常用詞比率、字筆劃數、

每句平均字數、每句平均詞數作為自變項;另外進行二項文章難易度測試效標:

專家評定與文章理解度測驗,作為依變數,以逐步迴歸方式,將五個變項分別預 測「專家評定」和「文章理解度測驗」,研究結果發現,「每句平均詞數」、「非常 用詞比率」對兩個依變項都是最佳的預測指標,預測「專家評定」的解釋量為 0.6054,預測「文章理解度測驗」的解釋量為 0.5330,其中又以「非常用詞比率」

的解釋力最好。研究者也發現以「詞」為單位的表面指標較以「字」為單位的表 面指標為佳。

胡夢珂(2010)使用支援向量機進行中文文本可讀性分類研究中以 24 個指標分 析國小國語科三個版本 386 篇文章的文本特徵,以各指標的文本特徵為自變項,

課文冊別為依變項,進行逐步迴歸分析,研究結果可讀性預測公式有效的解釋冊 別的變異量達 88.04%,然而研究者發現在低年級部份預測的準確率較高,而高年 級部份則較多課文被預測錯誤,研究者推論所採用的 24 個指標皆屬於表面特徵 (字數、句數、段落數等),未加入 Coh-metrix 裡的語意和文法剖析相關指標,高 年級的課文強調的已經不再是課本表面特徵的難易,而是課文內容所帶給學生的

啟發及意義。雖然文本的表面特徵有其重要性,但若要深入了解文本的涵義,則 語意的分析也是很重要的(胡夢珂,2010)。有學者提出文本理解的過程除了淺 層語言特徵的接收,文本深層語意在閱讀理解的過程中扮演著重要的角色 (Graesser et al., 2004; McNamara, Louserse, McCathy, & Graesser, 2010)。

宋曜廷等人(2013)研究以 24 個指標作為可讀性公式的預測變項,國小國語科 三個版本 290 篇文章之年級值為效標變項,建立逐步迴歸與 SVM 可讀性數學模 型,再以 96 篇新文章為測試資料進行模型驗證。結果顯示,逐步迴規模型中,

可解釋 83%年級的變異量,預測的正確性為 55.21%,其中難詞、單句數比率、

實詞頻對數平均與人稱代名詞為重要預測變項;SVM 模型中所得的重要預測變 項為難詞數、二字詞數、字數與中筆劃字數。預測高年級文章之正確性均低於低 年級,高年級分類錯誤的狀況較明顯,推論可能是高年級文章多為難度高的說明 文,文章中多重語意的詞彙較多,句法結構也較複雜,簡單的指標無法精確預估 整體文章的可讀性,對於影響文本理解深層類型的指標納入較少,因而預測複雜 度較高的高年級文章之正確性較低。

本研究根據中西方文獻探討,發現可讀性公式的脈絡走向,均由早期偵測文 本表面特徵的指標,例如:平均字長、平均句長、常用(難)字比率,進入到深層 理解性的指標,例如凝聚力指標:詞彙的多樣性、連接詞、代名詞等,在英文的 可讀性指標研究中已納入多元深層理解的指標如:詞彙的重複性、LSA 及句子結 構剖析等,然而中文可讀性公式的研究中尚未納入這方面的指標,因此本研究廣 泛納入多元化的指標,除了保有傳統的描述性指標,且更周延考量影響文本深層 理解的凝聚力及句子結構剖析指標,本研究選入七大類指標包含描述性、詞彙重 複性、潛在語意分析、詞彙多樣性、關聯詞、句子結構複雜度、詞彙訊息等 60 個指標,期望找到一個最佳預測效果的可讀性公式。

表 2-9

中文可讀性公式整理

研究者 選用指標 預測文本適讀年級的廻歸公式(可讀性公式)

讀物難易程度(Y)= 14.95961 +39.07746 ×列入五千 六百基本詞彙數表的詞彙比率+

1.11506 ×完整句之比率-2.48491 × 平均筆劃數

文本年級(Y) = 8.76105604+0.00272438 ×課文長度 +0.07866782 ×平均句長

文本年級(Y)=-8.01682+0.00626 ×不存在詞 +3.02871 ×音節數

(11-20)

陳文蘭

文本適讀年級(Y)=2.932+0.248 ×目的關連詞 +0.138 ×轉折關聯詞

叁、可讀性指標的內容

本研究彙整先前研究團隊所發展的指標及目前研發的指標,分為七大類,共

本研究彙整先前研究團隊所發展的指標及目前研發的指標,分為七大類,共

相關文件