第一章 前言
第一節 早期適讀性研究
壹、適讀性公式的發展
在一篇回顧整理早期適讀性研究的文章中,Klare(1976)指出,當時的適 讀性模式的建構流程如下;(一)找出幾個語言(文本)屬性。(二)選取多篇 內容不同的文本,然後計算這些屬性與這些文本適讀性指標間的相關。文本適 讀性指標可以用學生閱讀文本後,理解測驗或記憶測驗的得分,或其它的客觀 指標。(三)選取相關最高的屬性,並根據這些屬性建構文本適讀性的模式。常 用的建構方法是運用統計迴歸法建構一條適讀性公式。(四)選取另一批文本,
驗證適讀性模式對文本適讀性指標的預測效度。
也就是說,傳統公式期的研究者認為,一篇文章的難度能夠透過幾個與文 本有關的屬性計算出來。從現在的眼光看,這些屬性都是一些文章的「表層」
特徵,如詞彙難度或句長等。例如,Fry(1977)的做法是,隨機在一篇文本中 選取一段100 字的章節,然後根據其中所含音節數及句數推算該篇文章的適讀 年級。他設計了一個由「音節數」和「句數」兩個屬性為向度的「適讀性圖」, 使用者只要按圖索驥,便可以得知一篇文章的適讀年級了(見DuBay, 2014)。
也有研究者則利用一些文本屬性為預測變項,經過線性迴歸分析,即可以一條 公式的形式,計算出一篇文章的適讀性。在當時,這種作法也引來許多批評。
因為適讀性公式只是透過文本屬性來「預測」閱讀時的難易程度,並無法「測 量」閱讀時讀者和文本之間的關係。但是,透過公式計算文本適讀性的方法,
比找教師或作者主觀認定文本的難度,適讀性公式顯然具備較高的效度,所以 這些研究的結果在當時的教育、軍事、商業等領域受到廣泛的重視與應用
(Klare, 1963)。甚至,在多年後的今天,一些適讀性公式仍普遍被用來評估兒 童讀物的適讀性,甚至一些商用的文書處理軟體裡(例如,微軟文書處理軟體 Word)會內建適讀性的公式(如,Word 即內建 Flesch 適讀性公式)。
根據Klare(1976),文章難度的客觀校標是建構適讀性模式的重要依據。
因為在模式開發期,研究者需要找到一組難易不等的文章,然後藉著分析這些 文章的文本屬性,找出哪些屬性能夠預測文章的難度。當適讀性模式建構出來 以後,研究者又需要找出另一組難易不等的文章,來檢驗適讀性模式的預測效 度。早期的適讀性研究的文章難度校標,多使用讀者在閱讀理解測驗、記憶測 驗,或是填空測驗的表現(Klare, 1974)。例如,McCall-Crabbs 標準閱讀測驗
(McCall-Crabbs Standard Test Lessons in Reading)(McCall & Crabbs, 1961)的 作法是,收集多篇文章,根據文章的行文及內容設計一些選擇題,然後請程度 不等的讀者(如不同年級的學生)閱讀文章並作答。根據讀者閱讀一篇文章
後,對測驗題目的答題表現,研究者可以推斷這篇文章適合哪個年級的學生閱 讀。例如,閱讀一篇文章後,三年級學生平均能答對一半以上的題目,這篇文 章的適讀性是三年級。也就是說,這是利用讀者在測驗題目上的表現,評估一 篇文章的難易程度;這在當時是很常用的文章難度效標。
另外,將文章設計為填充測驗(cloze test)也是一種測驗文章難度的方 法。在填空測驗中,一篇文章有某些字或詞被設定為空格(如,每5 個字/詞,
就有一個被掩蓋),讀者的作業是猜測,並填入空格中的字。為了控制被掩蓋之 字在句子中的位置對讀者答題的影響,研究者可以設計不同的填空測驗的版 本;例如,在一個「逢五刪一」的測驗中,研究者至可以設計5 個不同的版 本;版本A 將第 1、6、11…詞為空格;版本 B 為第 2、7、12 詞為空格,以此 類推。Bormuth(1969)做了一個大規模的適讀性研究。他用讀者對文章填充測 驗的表現作為文章適讀性的客觀效標。在研究中,Bormuth 選了 330 篇長度約 100 詞的文章,文章中每 5 個詞,留空一詞;每篇文章依據空格位置,設計出 5 個版本。研究參與者是2,600 位 4 到 12 年級的學童;Bormuth 用參與者在填充 測驗上的表現,估計這300 篇文章的難度。在諸多評量文章難度指標的方法 中,填充測驗似乎是較為適讀性研究之研究者青睞的方法。例如,Miller
(1974)發現,填充測驗具備較能完整涵蓋文章難度的優點,而且以填充測驗 的分數作為適讀性公式的效標,也能得到較好的預測效果。又如在第一個使用 填充測驗作為驗證適讀性公式校標的研究中,Coleman(1965)發現,適讀性 公式的預測與填充測驗的結果之間的相關最高可達 .91;比以 McCall-Crabbs 分 數作為效標,得到的相關高(Szalay, 1965)。
根據Klare(1976),尋找與文本難度相關的屬性是建構適讀性模式的另一 個重要步驟。在適讀性研究發展的初期,研究者認為文章中的「詞彙負荷」
(vocabulary burden)是造成文章難度的重要因素。例如 Lively 與 Pressley
(1923)認為國中的科學教科書充滿艱澀的技術性詞彙,使得學生難以學習。
於是他們的適讀性計算每1000 個詞中不同的詞彙數量,以及在這些詞中,不在 Throndike 詞表裡的詞數。他們發現用這個簡單的屬性,可以和 700 本書的難度 達到0.80 的相關(Dubay, 2004)。適讀性和「難詞」有關的想法,影響到後續 的適讀性公式研發。例如:Lorge(1939)提出的適讀性公式可用來篩選 3-12 年級的適讀文本(Klare, 1974),該公式中用了三個屬性:
X1(年級程度) = 0.06 x 平均句長(詞數)+
0.10 x 每 100 詞中的平均介系詞片語數 +
0.10 x 難詞數(不在 Dale 詞表中的不同詞數)+
1.99 (常數項)
以McCall-Crabbs 測驗做驗證此適讀性公式時,得到頗高的相關。
Lorge 公式裡的難詞定義來自於 Dale 的 769 詞詞表。該詞表是 Dale
(1931)根據 Throndike 詞表改編而來。Dale 和 Chall(1948)再次修訂該詞 表,列出3000 個簡單詞,並提出 Dale-Chall 公式;此公式與 McCall-Crabbs 測 驗分數的相關達0.70。Dale-Chall 公式如下:
Xc50(年級程度) = 0.1579 x 難詞數(不在 Dale 詞表中的不同詞數)+
0.0496 x 平均句長(詞數) + 3.6365 (常數項)
然而,有些研究者認為,應有其他更基本的詞彙屬性可描述詞彙難度。例 如Flesch(1943)認為詞彙的抽象性和詞彙的難度有很重要的關係,而他的公 式中就用詞綴(affix)個數當作衡量詞彙抽象性的指標,他的公式如下:
年級程度 = 0.1338 x 平均句長(詞數)
+ 0.0645 x 綴詞個數 - 0.0659 x 個人指涉個數 - 0.7502 (常數項)
公式中的「個人指涉詞」指的是(在英文中)人名、代名詞(如he、
she)、人感興趣的詞(如,man、woman、child、boy、girl 等)。該公式也同樣 使用McCall-Crabbs 測驗做驗證,並得到高相關。
在當時,由於沒有其他工具的輔助,一篇文章的適讀性完全需要人工計 算。在上述的公式中,計算詞綴個數需要一個個詞檢查,讓該公式的實用性大 幅降低,同時,也因為計算個人指涉的定義較為模糊,於是Flesch(1948)提 出一個新的「閱讀簡易度公式」(reading ease)。該公式同時也是微軟文書處理 軟體(Word)到目前為止仍提供的適讀性公式:
Reading Ease = 206.835 - 0.846 x 每 100 詞中的音節數 - 1.015 x 平均句長(詞數)
如同Flesch 在 1943 年公式中的詞綴數,Flesch 認為音節數也是可代表詞抽 象度的指標。Farr、Jenkins 和 Paterson(1951)考慮到計算音節數需要公式使 用者知道音節規則,他們發現若只使用單音節詞的個數來替代音節數,也可以 達到同樣的預測效果。Farr 等的公式與 Flesch 的公式相關高達 0.93-0.95。他們 提出的新閱讀簡易度公式是:
New Reading Ease Index = 1.599 x 每 100 詞中的單音節詞數
− 1.015 x 平均句長(詞數) − 31.517
Gunning 的 Fog Index 也同樣用音節數來衡量難詞(Gunning, 1952)。他提 出用三個以上音節的詞數用來當作「難詞」的指標。McLaughlin(1969)則認 為計算平均句長需要較多時間,於是他提出更容易計算且準確率更高的SMOG 適讀性,SMOG 只用到多音節詞數(三個以上的音節),和句數。這兩個適讀 性公式是:
Gunning's Fox grade level = 0.4 x (平均句長 + 三或多音節詞數比例)
SMOG = 1.0430 ⋅ √多音節詞彙數 × 30
句數+ 3.1291
由於適讀性公式的發展動機與應用場域的關係,讓適讀性公式容易使用一 直是適讀性研究的趨勢(Klare, 1974)。例如,Danielson 與 Bryan(1963)首次 嘗試讓電腦計算適讀性公式所需要的屬性。Danielson 與 Bryan 公式含有詞長和 句長等兩個屬性,但為了讓電腦容易計算,他們改用「字母」(character)作為 計算單位:
DB Score = 131.059 − 10.364 × 空格間含有的平均字母數
−0.194 × 一個句子含有的平均字母數
為了讓適讀性公式更能廣泛應用,FORCAST 閱讀等級(RGL)公式僅包 含一個屬性(Caylor, Sticht, Fox, & Ford, 1973);這個屬性是,每 150 個詞中,
含有幾個單音節詞。該公式如下:
FORCAST RGL= 20 −單音節詞數
因為FORCAST 的方便性,美國軍方曾經使用它來評估文本的適讀性。
另一種增加適讀性公式易用程度的方法是Fry(1977)的適讀性圖。該適 讀性圖的x 軸代表每 100 個詞的音節數,y 軸則是每句的詞數。讀者只要依照 x 軸和y 軸的數值比對圖形,即可得到適讀性結果。該適讀性圖在 1980 年代間受 到非常廣泛的應用(Klare, 1988),其效度和其它適讀性公式的結果也非常相似
(Klare, 1963)。
過去的中文適讀性研究中也曾試圖以詞彙、字數等屬性預測中文文章適讀 性。例如陳世敏(1972)就用句子的平均字數和難字的多寡來預測中文文章的 適讀年級,Yang(1970)則藉常用詞彙數目、字彙的平均筆畫數以及含有主詞 及述詞的句數。荊溪昱(1995)以句子長度、課文長度、常用字比例為預測屬 性,預測國立編譯館版本的國小及國中教科書的年級。胡志偉、方文熙及李美 綾(1994)參考 Klare(1976)的適讀性模式建構流程,先以文章難度排序作 業、詞填充測驗,以及字填充作業評估21 篇短文(文章長度約 200 到 400 字)
的難度。其次以這三種不同測驗結果為效標,用多元迴歸的方法從23 個文本屬 性中,篩選少數幾個屬性,建構適讀性公式。研究發現,「文本包含的長子句數 目」這個屬性就可以解釋排序作業55.14%的變異量;「長子句數」和「高頻詞
的難度。其次以這三種不同測驗結果為效標,用多元迴歸的方法從23 個文本屬 性中,篩選少數幾個屬性,建構適讀性公式。研究發現,「文本包含的長子句數 目」這個屬性就可以解釋排序作業55.14%的變異量;「長子句數」和「高頻詞