早期適讀性研究

第一章前言

第一節早期適讀性研究

壹、適讀性公式的發展

在一篇回顧整理早期適讀性研究的文章中，Klare（1976）指出，當時的適讀性模式的建構流程如下；（一）找出幾個語言（文本）屬性。（二）選取多篇內容不同的文本，然後計算這些屬性與這些文本適讀性指標間的相關。文本適讀性指標可以用學生閱讀文本後，理解測驗或記憶測驗的得分，或其它的客觀指標。（三）選取相關最高的屬性，並根據這些屬性建構文本適讀性的模式。常用的建構方法是運用統計迴歸法建構一條適讀性公式。（四）選取另一批文本，

驗證適讀性模式對文本適讀性指標的預測效度。

也就是說，傳統公式期的研究者認為，一篇文章的難度能夠透過幾個與文本有關的屬性計算出來。從現在的眼光看，這些屬性都是一些文章的「表層」

特徵，如詞彙難度或句長等。例如，Fry（1977）的做法是，隨機在一篇文本中選取一段100 字的章節，然後根據其中所含音節數及句數推算該篇文章的適讀年級。他設計了一個由「音節數」和「句數」兩個屬性為向度的「適讀性圖」，使用者只要按圖索驥，便可以得知一篇文章的適讀年級了（見DuBay, 2014）。

也有研究者則利用一些文本屬性為預測變項，經過線性迴歸分析，即可以一條公式的形式，計算出一篇文章的適讀性。在當時，這種作法也引來許多批評。

因為適讀性公式只是透過文本屬性來「預測」閱讀時的難易程度，並無法「測量」閱讀時讀者和文本之間的關係。但是，透過公式計算文本適讀性的方法，

比找教師或作者主觀認定文本的難度，適讀性公式顯然具備較高的效度，所以這些研究的結果在當時的教育、軍事、商業等領域受到廣泛的重視與應用

（Klare, 1963）。甚至，在多年後的今天，一些適讀性公式仍普遍被用來評估兒童讀物的適讀性，甚至一些商用的文書處理軟體裡（例如，微軟文書處理軟體 Word）會內建適讀性的公式（如，Word 即內建 Flesch 適讀性公式）。

根據Klare（1976），文章難度的客觀校標是建構適讀性模式的重要依據。

因為在模式開發期，研究者需要找到一組難易不等的文章，然後藉著分析這些文章的文本屬性，找出哪些屬性能夠預測文章的難度。當適讀性模式建構出來以後，研究者又需要找出另一組難易不等的文章，來檢驗適讀性模式的預測效度。早期的適讀性研究的文章難度校標，多使用讀者在閱讀理解測驗、記憶測驗，或是填空測驗的表現（Klare, 1974）。例如，McCall-Crabbs 標準閱讀測驗

（McCall-Crabbs Standard Test Lessons in Reading）（McCall & Crabbs, 1961）的作法是，收集多篇文章，根據文章的行文及內容設計一些選擇題，然後請程度不等的讀者（如不同年級的學生）閱讀文章並作答。根據讀者閱讀一篇文章

後，對測驗題目的答題表現，研究者可以推斷這篇文章適合哪個年級的學生閱讀。例如，閱讀一篇文章後，三年級學生平均能答對一半以上的題目，這篇文章的適讀性是三年級。也就是說，這是利用讀者在測驗題目上的表現，評估一篇文章的難易程度；這在當時是很常用的文章難度效標。

另外，將文章設計為填充測驗（cloze test）也是一種測驗文章難度的方法。在填空測驗中，一篇文章有某些字或詞被設定為空格（如，每5 個字/詞，

就有一個被掩蓋），讀者的作業是猜測，並填入空格中的字。為了控制被掩蓋之字在句子中的位置對讀者答題的影響，研究者可以設計不同的填空測驗的版本；例如，在一個「逢五刪一」的測驗中，研究者至可以設計5 個不同的版本；版本A 將第 1、6、11…詞為空格；版本 B 為第 2、7、12 詞為空格，以此類推。Bormuth（1969）做了一個大規模的適讀性研究。他用讀者對文章填充測驗的表現作為文章適讀性的客觀效標。在研究中，Bormuth 選了 330 篇長度約 100 詞的文章，文章中每 5 個詞，留空一詞；每篇文章依據空格位置，設計出 5 個版本。研究參與者是2,600 位 4 到 12 年級的學童；Bormuth 用參與者在填充測驗上的表現，估計這300 篇文章的難度。在諸多評量文章難度指標的方法中，填充測驗似乎是較為適讀性研究之研究者青睞的方法。例如，Miller

（1974）發現，填充測驗具備較能完整涵蓋文章難度的優點，而且以填充測驗的分數作為適讀性公式的效標，也能得到較好的預測效果。又如在第一個使用填充測驗作為驗證適讀性公式校標的研究中，Coleman（1965）發現，適讀性公式的預測與填充測驗的結果之間的相關最高可達 .91；比以 McCall-Crabbs 分數作為效標，得到的相關高（Szalay, 1965）。

根據Klare（1976），尋找與文本難度相關的屬性是建構適讀性模式的另一個重要步驟。在適讀性研究發展的初期，研究者認為文章中的「詞彙負荷」

（vocabulary burden）是造成文章難度的重要因素。例如 Lively 與 Pressley

（1923）認為國中的科學教科書充滿艱澀的技術性詞彙，使得學生難以學習。

於是他們的適讀性計算每1000 個詞中不同的詞彙數量，以及在這些詞中，不在 Throndike 詞表裡的詞數。他們發現用這個簡單的屬性，可以和 700 本書的難度達到0.80 的相關（Dubay, 2004）。適讀性和「難詞」有關的想法，影響到後續的適讀性公式研發。例如：Lorge（1939）提出的適讀性公式可用來篩選 3-12 年級的適讀文本（Klare, 1974），該公式中用了三個屬性：

X1(年級程度) = 0.06 x 平均句長（詞數）+

0.10 x 每 100 詞中的平均介系詞片語數 +

0.10 x 難詞數（不在 Dale 詞表中的不同詞數）+

1.99 （常數項）

以McCall-Crabbs 測驗做驗證此適讀性公式時，得到頗高的相關。

Lorge 公式裡的難詞定義來自於 Dale 的 769 詞詞表。該詞表是 Dale

（1931）根據 Throndike 詞表改編而來。Dale 和 Chall（1948）再次修訂該詞表，列出3000 個簡單詞，並提出 Dale-Chall 公式；此公式與 McCall-Crabbs 測驗分數的相關達0.70。Dale-Chall 公式如下：

Xc50(年級程度) = 0.1579 x 難詞數（不在 Dale 詞表中的不同詞數）+

0.0496 x 平均句長（詞數） + 3.6365 （常數項）

然而，有些研究者認為，應有其他更基本的詞彙屬性可描述詞彙難度。例如Flesch（1943）認為詞彙的抽象性和詞彙的難度有很重要的關係，而他的公式中就用詞綴（affix）個數當作衡量詞彙抽象性的指標，他的公式如下：

年級程度 = 0.1338 x 平均句長（詞數）

+ 0.0645 x 綴詞個數 - 0.0659 x 個人指涉個數 - 0.7502 （常數項）

公式中的「個人指涉詞」指的是（在英文中）人名、代名詞（如he、

she）、人感興趣的詞（如，man、woman、child、boy、girl 等）。該公式也同樣使用McCall-Crabbs 測驗做驗證，並得到高相關。

在當時，由於沒有其他工具的輔助，一篇文章的適讀性完全需要人工計算。在上述的公式中，計算詞綴個數需要一個個詞檢查，讓該公式的實用性大幅降低，同時，也因為計算個人指涉的定義較為模糊，於是Flesch（1948）提出一個新的「閱讀簡易度公式」（reading ease）。該公式同時也是微軟文書處理軟體（Word）到目前為止仍提供的適讀性公式：

Reading Ease = 206.835 - 0.846 x 每 100 詞中的音節數 - 1.015 x 平均句長（詞數）

如同Flesch 在 1943 年公式中的詞綴數，Flesch 認為音節數也是可代表詞抽象度的指標。Farr、Jenkins 和 Paterson（1951）考慮到計算音節數需要公式使用者知道音節規則，他們發現若只使用單音節詞的個數來替代音節數，也可以達到同樣的預測效果。Farr 等的公式與 Flesch 的公式相關高達 0.93-0.95。他們提出的新閱讀簡易度公式是：

New Reading Ease Index = 1.599 x 每 100 詞中的單音節詞數

− 1.015 x 平均句長(詞數) − 31.517

Gunning 的 Fog Index 也同樣用音節數來衡量難詞（Gunning, 1952）。他提出用三個以上音節的詞數用來當作「難詞」的指標。McLaughlin（1969）則認為計算平均句長需要較多時間，於是他提出更容易計算且準確率更高的SMOG 適讀性，SMOG 只用到多音節詞數（三個以上的音節），和句數。這兩個適讀性公式是：

Gunning's Fox grade level = 0.4 x （平均句長 + 三或多音節詞數比例）

SMOG = 1.0430 ⋅ √多音節詞彙數 × 30

句數+ 3.1291

由於適讀性公式的發展動機與應用場域的關係，讓適讀性公式容易使用一直是適讀性研究的趨勢（Klare, 1974）。例如，Danielson 與 Bryan（1963）首次嘗試讓電腦計算適讀性公式所需要的屬性。Danielson 與 Bryan 公式含有詞長和句長等兩個屬性，但為了讓電腦容易計算，他們改用「字母」（character）作為計算單位：

DB Score = 131.059 − 10.364 × 空格間含有的平均字母數

−0.194 × 一個句子含有的平均字母數

為了讓適讀性公式更能廣泛應用，FORCAST 閱讀等級（RGL）公式僅包含一個屬性（Caylor, Sticht, Fox, & Ford, 1973）；這個屬性是，每 150 個詞中，

含有幾個單音節詞。該公式如下：

FORCAST RGL＝ 20 −單音節詞數

因為FORCAST 的方便性，美國軍方曾經使用它來評估文本的適讀性。

另一種增加適讀性公式易用程度的方法是Fry（1977）的適讀性圖。該適讀性圖的x 軸代表每 100 個詞的音節數，y 軸則是每句的詞數。讀者只要依照 x 軸和y 軸的數值比對圖形，即可得到適讀性結果。該適讀性圖在 1980 年代間受到非常廣泛的應用（Klare, 1988），其效度和其它適讀性公式的結果也非常相似

（Klare, 1963）。

過去的中文適讀性研究中也曾試圖以詞彙、字數等屬性預測中文文章適讀性。例如陳世敏（1972）就用句子的平均字數和難字的多寡來預測中文文章的適讀年級，Yang（1970）則藉常用詞彙數目、字彙的平均筆畫數以及含有主詞及述詞的句數。荊溪昱（1995）以句子長度、課文長度、常用字比例為預測屬性，預測國立編譯館版本的國小及國中教科書的年級。胡志偉、方文熙及李美綾（1994）參考 Klare（1976）的適讀性模式建構流程，先以文章難度排序作業、詞填充測驗，以及字填充作業評估21 篇短文（文章長度約 200 到 400 字）

的難度。其次以這三種不同測驗結果為效標，用多元迴歸的方法從23 個文本屬性中，篩選少數幾個屬性，建構適讀性公式。研究發現，「文本包含的長子句數目」這個屬性就可以解釋排序作業55.14%的變異量；「長子句數」和「高頻詞

在文檔中診斷式的適讀性評估系統：以小學文本探討四種模式的比較研究 (頁 20-28)

第一章 前言

第一節 早期適讀性研究

第一章前言

第一節早期適讀性研究