字彙涵蓋量之意涵

第二章文獻探討

第二節字彙涵蓋量之意涵

字彙在語言學習中有著舉足輕重的地位，不管是以英語為母語或是外語，學習者第一步就是學習字彙。由於字彙在學習中的重要性，許多研究者開始探究字彙學習的根本與語言學習的關係以及如何測量學習者的字彙量。在這一節當中，

研究者將介紹字彙的內涵、最常用來計算字彙量的程式 RANGE 以及分級讀本的字彙分級表。

一、字彙涵蓋量的內涵

文本中的字彙涵蓋量是影響讀者瞭解文本內容的重要指標之一，以下首先探討字彙涵蓋量的定義，接著介紹計算字彙涵蓋量的方式以及計算字彙涵蓋量所使用的常見字彙表。

（一）字彙涵蓋量的定義

字彙與閱讀之間的關係密不可分，當學習者認識較多的單字，就能夠閱讀更多文本，而藉由閱讀更多文本，也能幫助他們學習到更多單字，兩者之間存在著這樣的良性的循環。學習者字彙量的增加能同時提昇閱讀的質與量，同樣地，好的閱讀理解也能強化學習者字彙的學習（Coady, 1997）。而 Laufer（1992）與 Nation

（1993）也主張字彙學習是閱讀理解的起點。

學習者學習字彙時，書寫的文字比口說的文字提供更多樣且更豐富的上下文

（Schmitt, 2000）。根據 Schonell、Meddleton 與 Shaw 的研究（引自 Schmitt, 2000），

大部分的演講內容只使用了大約 2000 字的高頻率用字，因為在口說時為了方便溝通，通常偏好使用最常用的單字。對於無法每天沉浸在目標語環境的外語學習者，透過閱讀，就能提供他們較豐富的資源。

皮亞傑在認知發展理論中的重要概念「基模」（schema）是人類吸收知識的基本架構，是人類的背景知識。在閱讀的過程當中，字彙就扮演啟動我們基模的關鍵角色，將我們的背景知識與文章的內容相互連結（Lin, 2003；

Rumellhart,1980）。因此，有許多學者主張有意義的字彙學習仰賴上下文，有意義的上下文能夠提供讀者豐富的背景知識進而推測新單字的意思並且理解文章的內容。

而學習者究竟需要擁有多少字彙量才足夠呢? Laufer（1992, 1997）建議，為了享受閱讀的樂趣，讀者應該認識文章中 95%的單字，大約是 3000 字的字族

（word family）。而要閱讀學術性領域的文章，Hirsh 和 Nation（1992）建議需要認識 4000 字的字族，其中包含 2000 個高頻率用字、570 個學術性用字、大約 1000 個專業的或低頻率用字才足夠。Eyckmans（2004）（引自楊懿麗，2006）的研究中曾估算英文單字中 3000 個字族中大約含 5000 個字彙，因此楊懿麗（2006）在他的研究中使用 5：3 來代表字彙量與字族的比例，例如，若一個學習者認識 2000 個字彙，那麼可以推估他可能認識 1200 個字族。

Nation 和 Waring（1997）也提出要知道字彙是否實用的最有效率方式就是透過測量字彙的使用頻率。以英語為外語的學習者需著重在高頻率用字的學習，

依據 Nation 和 Waring（1997）的研究，若學習者認識 2000 個最常用字的字族，

他們就能瞭解 80%的文本內容。由此可知，初學者需要學習 2000 到 3000 個最常用字。瞭解字彙的使用頻率有助於教師及教材編輯者為學習者設計合適的內容，

讓學習者能夠浸濡並使用最實用的字彙（Nation & Waring, 1997）。Read（2000）

也主張字彙的使用頻率在設計課程、調整學習目標、字彙教學與評量及教材評選方面都相當地重要。

（二）計算字彙涵蓋量的方式

瞭解一個文本中字彙涵蓋量及使用頻率能幫助學習者選擇適當的學習教材。在計算字彙涵蓋量之前，需要先知道如何定義一個單字。計算字彙量的方式主要分為三種：字彙總量（tokens）、字彙種類（types）及字族（word family）。

以下分別說明（Yen, 2011）：

1. 字數總量：代表出現字彙的總數量。Schmitt （2000）使用莎士比亞名著哈姆雷特中的經典臺詞”To be or not to be”做為範例。在這個片語中，字彙總量為六，每個出現的單字都計算為一個字，不管當中有無重覆使用的單字，通常用於描述文本的長度。

2. 字彙種類：Nation 與 Waring（1997）將字彙種類定義為字根（base word）

加上屈折變化（inflection）。例如，read 的字彙種類包含字根 read 及過去式 read、

第三人稱現在式 reads 以及現在分詞 reading。同一個字彙種類都屬於同一種詞性，以上例而言，read、reads、reading 都是動詞。若以前面哈姆雷特的臺詞為例，

這個片語共包含了四個字彙種類，即”to、be、or、not”。

3. 字族：包含字根及詞類變化。其中詞類變化分為兩類：屈折變化及衍生變化（derivation）。屈折變化不會影響個字本身的意思，包含複數、第三人稱現在式、過去式、所有格、比較級、最高級等…而衍生變化則會改變字本身的意思或詞性，包含字首（prefixes）、字尾（suffixes）。舉例來說，read 的字族除了字根 read 之外，也包含了屈折變化 read、reads、reading 以及衍生變化 readable、

readability。除了屈折變化與衍生變化之外，縮寫也包含在字族的範圍中，例如 RD 代表 road（道路）、ST 代表 street（街道）等等。

由於大多數的學者在研究中，都以字族（word family）做為計算的單位

（Nation, 1993; Read, 2000）。且計算字彙量的工具也大多以字族做為計算的單位，因此，在本研究中，研究者仍依循以字族做為計算的單位。

（三）計算字彙涵蓋量所使用的常見字彙表

Schmitt （2000）指出，以英語為外語的學習者因為缺乏目標語的浸濡環境，

在學習目標語時，主要以實用的單字為主。為了符合這樣的需求，學者通常採用了字彙的使用頻率（frequency）、涵蓋率（coverage）及廣泛度（range）三個面向做為選取字彙表單字的標準（Coxhead, 2000）。接下來說明三種常為研究者所使用的字彙表。

1. West 的最常用字詞彙表（General Service List，簡稱 GSL）

GSL 是 Michael West（1953，引自 Bauman, 2002）所編選的字彙表，此字彙表包含了 2000 個最常用單字的字族。這個字彙表主要的選擇是依據字彙的使用頻率，這個字彙表分成前 1000 個最常用字彙及後 1000 個較低頻率字彙，前 1000 個單字的頻率大約是每五百萬個字當中使用頻率高於 332 次 higher than 332 次，

其中包含星期、日期、數字、稱謂（例如 Mr, Mrs, Miss 等等）以及常見的打招呼用語（例如 Hello、Hi 等等）。 West 根據 Thorndike 和 Lorge 在 1944 年所出版的”The Teachers Word Book of 30,000 Words”一書為依據，在每個單字上都附有一個編號，代表被使用的頻率，除了編號之外，也包含每個單字不同的意思。直到現在 GSL 仍是最具代表性的高頻率用字字彙表。Nation（2000）的研究中指出，在各種不同的文本中，都涵蓋了大多數的 GSL 字彙，例如，小說用字中有 87.4%的字彙來自 GSL，報紙用字佔了 83.3%，而學術文本用字佔了 78.1%。

2. 大學用字詞彙表（University Word List，簡稱 UWL）

UWL由Xue和Nation（1984）所編製，這個字彙表包含836個學習者最可能在學術領域上使用的單字。這個字彙表是以134篇不同領域的學術文本做為語料庫所編製而成的。Nation和Hwang （1995）在研究中指出UWL提供了學術性文本中達到8.5%的字彙涵蓋率。在學習者學習完GSL的2000高頻率用字後，學習 UWL也能幫助理解學術領域上的專業文本。

3. 學術用字詞彙表（Academic Word List，簡稱 AWL）

AWL是由Coxhead（2000）所編製的，內含的單字與GSL單字並不重覆，而是最常出現在學術文本中的頻率用字。這個字彙表包含了570個字彙，相較於 UWL的836個單字少了許多。AWL涵蓋了28個主題領域、在學術的語料庫中出現 100次以上、以及在學術性文本中更有高達10%的字彙涵蓋率，因此，若以字彙的使用頻率、涵蓋率及廣泛度三個面向來看，AWL比UWL更為適當。AWL常被教師們當成幫助學生更懂得學術用文本的不可或缺工具，換言之，在學習者學習專業領域之前，他們應該熟識這些在專業領域當中的字彙。

4.英國國家語料庫詞彙表（The British National Corpus Wordlist，簡稱 BNC wordlist）

BNC 之語料以現代英式英語為主，從 1991 年開始建製，到 1994 年完成，

由牛津大學及 Addison-Wesley Longman 出版社、British 收錄 Library’s Research and Innovation Centre 等機構共同研究的成果。此語料庫收錄了 20 世紀後半的文本與口語資料，目前已收集了近一億個單字其中文本約佔九成，包含全國與地方性的報紙、各種類別的期刊、學術論文、已出版或未出版之書信與手稿…

等；口語部份約佔一成，包含大量非正式的日常對談、較正式的商業與政府會議、甚至於廣播節目與聽眾來電（Aston & Burnard，1998）。Leech, Rayson 與 Wilson（2001）依據此字庫編製了一分最常用字詞彙表，收錄了文本及口語的最常用字彙。

二、計算字彙量的程式—RANGE

RANGE 程式是由威靈頓維多利亞大學（Victoria University of Wellington）

的 Nation 與 Heatley （2002）所研發用來估算文本字彙量的電腦軟體程式，此程式可以免費地下載。RANGE 最多可以同時比較 32 篇文本的單字量。運用這個程式，可以算出每一個字彙的分布數量（出現在幾個文本中）、目標字的出現頻

率（目標字在所有文本中出現的次數）、以及每一個文本中此字彙出現的頻率。

透過特定的字彙表，這個程式可以找出一篇文本的字彙涵蓋量、根據字彙出現頻率及範圍創造字彙表，以及找出文本中使用的特殊字彙。使用 RANGE 分析一篇文本可以找出文本中所使用的單字有哪些以及這些字彙在字彙表中所佔的比例有多少。它也可以用來比較兩篇文本的字彙，算出有多少同樣的字彙在兩篇文本中出現，以及兩篇文本使用字彙的差異。透過 RANGE，就可以知道分級讀本中有多少字彙是屬於高頻率用字，也可瞭解在一本讀本中所讀到的字彙有多少可以在另一本讀本也可被讀到。

RANGE 使用字族的單位定義一個字彙，例如目標字”able”與” abler”、”ablest”

與” ably”都視為同一個字族。此程式內建有三個字彙表：

1. West 的 GSL I：GSL 的前一千個高頻率字族，大約包含 4000 個字彙。

2. West 的 GSL II：GSL 的後一千個高頻率字族。

3. Coxhead 的 AWL：含 570 個字族

這些字彙清單可以計算美式及英式拼法的單字，而縮寫會被視為空格鍵，因此I’ve 會被當成 I 及 have 兩個單字。且它會自動檢測，確定同一個字彙不會同時涵蓋在二個字族的範圍之中。使用 RANGE 時，若選擇以三種不同的字彙表分

在文檔中國中生課外閱讀之英文分級讀本字彙涵蓋量與適讀性分布 (頁 48-57)

第二章 文獻探討

第二節 字彙涵蓋量之意涵