國小二年級電腦化適性閱讀理解測驗編製

(1)

國立臺中教育大學特殊教育學系碩士班

碩士論文

Department of special Education

National Taichung University of Education

Master Thesis

國小二年級電腦化適性閱讀理解測驗編製

The Establishment of the Computerized Adaptive Reading

Comprehension Test for the Second Grade Students in Elementary School

指導教授：廖晨惠教授

Advisor：Chen-Huei Liao Ph. D.

研究生：王千慧撰

Graduate student：Chien-Hui Wang

中華民國 103 年 6 月

June, 2014

(2)

I

摘要

閱讀是目前臺灣教育大力推廣的重要活動，閱讀能力也是學習必備的重要條件。隨著科技日新月異，目前許多測驗都以電腦測驗取代紙筆測驗，除了能縮短施測時間，也能精確估計出受試者的能力。因此本研究旨在編製一份能檢測出國小二年級學童中文閱讀理解能力的測驗，並以試題反應理論的三參數模式找出適合本測驗的能力估計方法，分析二年級學童閱讀理解能力的表現情形，及本測驗節省題數的成效，進一步建置電腦化適性測驗。研究方法是以紙筆測驗資料模擬電腦化適性測驗的結果，分析並歸納出以下結論： 1. 本測驗為一份適切性良好的閱讀理解測驗：刪題後的內部一致性信度可達.846，顯示本測驗的信度良好；根據三參數模式估計的試題參數，顯示本測驗的鑑別度與猜測度均在合理範圍內，試題難度屬於中間偏易。 2. 由受試者的能力值可知，接受本測驗的國小二年級學童的閱讀理解能力屬於中間偏高；摘要能力較弱，句法與推論能力較佳。 3. 在模擬電腦化適性測驗的結果中，最大後驗法（MAP）與期望後驗法（EAP）的能力估計精確度高，顯示此二方法為較適合本測驗的能力估計方法。 4. 在模擬電腦化適性測驗的結果中，本測驗在第 34 題即達測驗終止的標準，比起整份測驗的 54 題可以少做 20 題的題目，顯示本測驗能有效節省測驗題數。關鍵字：閱讀理解測驗、電腦化適性測驗、試題反應理論

(3)

(4)

III

Abstract

The present study aims at developing a Chinese reading comprehension test for the second grade students in Taiwan by applying the 3PL model of the IRT. The results were as followed:

1. The appropriateness of the present test was satisfying: the internal consistency reliability was .846 after deleting substandard items; according to the outcome of the 3PL estimation, both the item discrimination parameter and the pseudo-guessing parameter of the present test were within rational ranges, showing the difficulty of the test was either medium or easy to students.

2. The MAP (maximum a posteriori) and the EAP (expected a posteriori) methods were shown to have better estimation precision, indicating the abovementioned methods were appropriate for the test.

3. In the present study, all subjects reached the criteria of test discontinuation at the 34th item, which suggested that the test estimate reading comprehension ability effectively and efficiently.

Keywords: reading comprehension test, Chinese, computerized adaptive test, item response theory

(5)

(6)

V

第一章緒論 ... 1

第一節研究動機 ... 1 第二節研究目的與待答問題 ... 4 第三節名詞釋義 ... 5

第二章文獻探討 ... 7

第一節閱讀理解理論 ... 7 第二節國內閱讀理解測驗的介紹與評析 ... 21 第三節試題反應理論與電腦化適性測驗 ... 33

第三章研究方法 ... 45

第一節研究程序 ... 45 第二節研究對象 ... 47 第三節研究工具 ... 49 第四節資料處理分析 ... 56

第四章結果與討論 ... 57

第一節中文閱讀理解測驗的預試結果說明與分析 ... 57 第二節中文閱讀理解測驗的正式施測結果說明與分析 ... 69 第三節適合的能力估計方法 ... 79 第四節中文閱讀理解測驗節省題數的成效 ... 82

第五章結論與建議 ... 85

第一節結論 ... 85 第二節建議 ... 87

參考文獻 ... 89

(7)

(8)

VII

表目次

表 2-1 閱讀理解能力發展階段之比較 ... 18 表 2-2 國內標準化國語文能力測驗一覽 ... 21 表 2-3 中文閱讀理解測驗與國民小學（二至六年級）閱讀理解篩選測驗對照表 ... 24 表 2-4 國內近十年閱讀理解相關研究一覽表 ... 26 表 2-5 國內三自編閱讀理解測驗對照表 ... 29 表 2-6 古典測驗理論與試題反應理論的比較 ... 37 表 3-1 第一次預試樣本一覽表 ... 47 表 3-2 第二次預試樣本一覽表 ... 47 表 3-3 正式施測樣本一覽表 ... 48 表 4-1 Cronbach's α 係數與信度高低對照表 ... 57 表 4-2 D 值與鑑別度高低的對照表 ... 58 表 4-3 國小二年級閱讀理解測驗第一次預試試題之信度分析 ... 59 表 4-4 國小二年級閱讀理解測驗第一次預試試題以 CTT 進行之鑑別度及難度分析 ... 61 表 4-5 國小二年級閱讀理解測驗第二次預試試題之信度分析 ... 64 表 4-6 國小二年級閱讀理解測驗第二次預試試題以 CTT 進行之鑑別度及難度分析 ... 66 表 4-7 國小二年級閱讀理解測驗正式試題之信度分析 ... 69 表 4-8 國小二年級閱讀理解測驗正式試題以 CTT 進行之鑑別度及難度分析 ... 71 表 4-9 國小二年級閱讀理解測驗正式試題以 IRT 估計的試題參數分析 .. 72 表 4-10 三種能力估計方法的估計標準誤值 ... 82

(9)

(10)

IX

圖目次

圖 2-1 由下而上模式 ... 9 圖 2-2 由上而下模式 ... 10 圖 2-3 雙向互動模式 ... 11 圖 2-4 文本處理架構 ... 23 圖 2-5 閱讀理解成分分析 ... 24 圖 2-6 一參數模式的試題特徵曲線圖 ... 34 圖 2-7 二參數模式的試題特徵曲線圖 ... 35 圖 2-8 三參數模式的試題特徵曲線圖 ... 36 圖 3-1 研究流程圖 ... 45 圖 3-2 中文閱讀理解測驗設計架構圖 ... 49 圖 4-1 受試者在整份測驗中的能力值分布圖 ... 75 圖 4-2 受試者在字詞能力的答對率分布圖 ... 76 圖 4-3 受試者在句法能力的答對率分布圖 ... 76 圖 4-4 受試者在摘要能力的答對率分布圖 ... 77 圖 4-5 受試者在推論能力的答對率分布圖 ... 78 圖 4-6 SE 在不同能力估計方法上的變化情形 ... 79 圖 4-7 RMSE 在不同能力估計方法上的變化情形 ... 80

(11)

1

第一章緒論

鑒於國際性的閱讀評量推動後，各國對於學童的閱讀能力更加重視，引起了研究者對於閱讀能力及閱讀評量的興趣。以下就研究者所蒐集到的文獻來說明本研究動機的由來、研究主題與想瞭解的問題逐一說明。

第一節研究動機

研究者於任職學校的某次語文領域會議中接觸了 PIRLS，便開始瞭解 PIRLS 的組織架構、評量目的與評量方式。PIRLS 就是促進國際閱讀素養研究（Progress in International Reading Literacy Study, PIRLS），是由國際教育成就評鑑協會（ International Association for the Evaluation of Educational Achievement, IEA）主導的長期國際性研究，目的在研究世界各國或地區四年級學童的閱讀能力。該協會從 2001 年開始，每五年評量一次，分別為 PIRLS 2001、PIRLS 2006 和 PIRLS 2011，而臺灣在 2004 年加入這項國際性研究，也參加了 PIRLS 2006 的評量。在參與的 45 個國家或地區中，排名 22，而與臺灣一樣使用繁體中文的香港，排名第 2。這個數字給了當時的教育界不小的震撼，也因此獲得了重要的訊息與啟發（柯華葳、詹益綾、張建妤、游婷雅，2008）。在 PIRLS 2006 的報告中發現，臺灣學生在「直接理解歷程」的表現顯著優於「詮釋理解歷程」的表現，也就是臺灣學生在「提取訊息」（找出文章中明確寫出的訊息）與「推論分析」（推斷出文章中沒明確描述的關係）的表現顯著優於「詮釋整合」（運用先備知識去理解與建構文章中的意思）與「比較評估」（批判性考量文章中的訊息），顯示臺灣學生在訊息整合的能力上較弱。另一大型的國際型評量是 PISA。 PISA 就是國際學生能力評量計畫（Programme for International Student Assessment, PISA），是由經濟合作暨發展組織（Organisation for Economic Co-operation and Development, OECD）於 1997 年開始籌畫的持續進行的跨國性計畫，目的在評估接近完成基礎教育的 15 歲學生，對於未來生活可能面對的問題情境，準備的程度以及他們習得多少必備

(12)

2 的知識和技能。此計畫從 2000 年開始，每三年評量一次，每次由數學、科學、及閱讀三個領域中選定一個主要領域，賦予較多的重要性，另外兩個次領域則較未深入評量。PISA 2000 的主要領域為閱讀，2003 為數學，2006 為科學， 2009 為閱讀，2012 為數學，而臺灣於 2006 年開始，也參與了這項評量計畫，也參加了 PISA 2009 的閱讀評量。在參與的 68 個國家或地區中，排名 23，而與臺灣一樣使用繁體中文的香港，排名第 4；使用簡體中文的上海，排名第 1 （PISA 2009 閱讀素養應試指南，2010）。在 PISA 2009 的報告中發現，臺灣學生在「統整與解釋」（涉及文本內部的統整，了解文本各部分關係或加以推論）及「省思與評鑑」（將先備知識及經驗與文章結合，加以批判與評論）的表現較弱，尤其是「省思與評鑑」。由上述兩個國際性評量可知，臺灣學生普遍在使用先備知識及舊經驗與文章進行建構與整合、推論與批判的能力較弱，而上述這項能力剛好與 Kintsch(1988)的閱讀理解歷程中的部分歷程不謀而合。他所提出的情境模式就是讀者利用本身的先備知識及經驗，根據文章內容所建構的心理表徵。也因為每個人的先備知識及經驗的不同，所建構出的情境模式也有所不同；此也引起了研究者想要更進一步瞭解閱讀理解歷程的念頭。在詳細瞭解上述兩大國際性的閱讀評量後，研究者便想進一步瞭解目前國內閱讀相關測驗的評量內容、評量方式及評量的成效。在參考了眾多國內標準化及自編的閱讀相關測驗後，發現標準化的閱讀理解測驗只有林寶貴、錡寶香（1999）的「中文閱讀理解測驗」及柯華葳、詹益綾（2007）的「國民小學（二至六年級）閱讀理解篩選測驗」是真正要評量閱讀理解能力的，其餘的大多是要評量學生的國語文能力，閱讀理解只佔了其中的一小部分。而自編的閱讀理解測驗則只有董宜俐（2003）的「國小六年級學童中文閱讀理解測驗編製研究」、黃堯香（2007）的「國小四年級學童中文閱讀理解測驗編製與其相關研究」及黃婉玲（2010）的「以 NAEP 架構建置國小四、五年級閱讀理解測驗」是單純依據閱讀理解的歷程編製的測驗，其他的測驗都是為了探討教學策略的成

(13)

3 效。而研究者由上述的測驗中發現，幾乎所有的測驗都是依據古典測驗理論編製而成，但古典測驗理論容易有樣本依賴及測量精確度的問題（余民寧，2009）。因此，本研究擬以試題反應理論做為資料處理與分析的依據，編製一份能測量出學童真正能力的閱讀理解測驗。另外在蒐集試題反應理論資料的同時，也發現電腦化適性測驗是依據試題反應理論發展而來。目前，已有多個國家實施電腦化適性測驗，如美國、日本、新加坡、西班牙等（楊淑如、蔡蕙仲，2009；考選部，2010），而教育部也於 2004 年開始推動國家考試的電腦化測驗（CBT）（賴淑茹，2012），顯示電腦化適性測驗有其優勢，也是一種趨勢。此也讓研究者興起了將傳統的紙本測驗轉變成電腦化適性測驗的念頭。綜合上述原因，研究者將依據閱讀理解的相關理論，編製一份較能測量出學童真正能力的閱讀理解測驗，並以試題反應理論建置電腦化適性測驗。

(14)

4

第二節研究目的與待答問題

壹、研究目的 根據上述之研究動機，本研究的研究目的如下：一、編製一份能檢測出國小二年級學童閱讀理解能力的中文閱讀理解測驗。二、選擇國小二年級電腦化適性閱讀理解測驗中適合的能力估計方法。三、探討國小二年級電腦化適性閱讀理解測驗節省題數之成效。 貳、待答問題 根據上述的研究目的，本研究的待答問題如下：一、國小二年級中文閱讀理解測驗是否適切？二、何種能力估計方法較適合國小二年級電腦化適性閱讀理解測驗？三、國小二年級電腦化適性閱讀理解測驗節省題數成效之情形為何？

(15)

5

第三節名詞釋義

壹、電腦化適性測驗

電腦化適性測驗（Computerized Adaptive Testing, CAT）是指運用最精簡、準確的題目，測量出受試者在某一特定領域的能力。本研究所指之適性化測驗，為採用電腦施測方式，一次呈現一道題目。施測過程中會依據受試者答題情形，決定次一題目之難度，以有效且準確地測量出受試者之能力。貳、閱讀理解能力閱讀理解係指讀者在閱讀特定的文句、段落或文章等書面訊息後，能夠回答與該內容相關之問題，並進行回憶、摘要、重述重點之能力。本研究所指的閱讀理解能力是指學童在研究者自編的「國小二年級電腦化適性閱讀理解測驗」中的整體表現情形。參、閱讀理解次能力閱讀理解次能力係指在為達成閱讀之目的，閱讀者所需採用之心理認知歷程及處理技巧。本研究所指的閱讀理解次能力是依據 Kintsch（1988）的建構整合理論所整理與歸納而來，包括音韻處理、詞彙理解、句意理解、語法、文意理解及推論等六項次能力。（一）音韻處理能力音韻處理能力為個體對語音內在結構的後設認知能力（曾世杰，2004）。本研究所指的音韻理解能力是指在「國小二年級電腦化適性閱讀理解測驗」中音韻處理測驗的總分，得分愈高，表示音韻處理能力愈佳。（二）詞彙理解能力詞彙理解能力是指讀者對於字或詞本身意義的認知程度。本研究所指的字詞義理解能力是指在「國小二年級電腦化適性閱讀理解測驗」中詞彙理解測驗的總分，得分愈高，表示詞彙理解能力愈佳。（三）句意理解能力

(16)

6 句意理解能力是指讀者根據句中的字或詞的意義及用法，來瞭解句子所要表達的意思。本研究所指的句意理解能力是指在「國小二年級電腦化適性閱讀理解測驗」中句意理解測驗的總分，得分愈高，表示句意理解能力愈佳。（四）語法能力語法能力是指讀者使用語言的能力，而這些能力包括了詞彙排列的順序、句子結構的知識等。本研究所指的語法能力是指在「國小二年級電腦化適性閱讀理解測驗」中語法測驗的總分，得分愈高，表示語法能力愈佳。（五）文意理解能力文意理解能力是指讀者在閱讀文章段落或全文時，找出段落或文章的重點，進而瞭解作者所要表達或想要呈現的重要意涵。本研究所指的文意理解能力是指在「國小二年級電腦化適性閱讀理解測驗」中文意理解測驗的總分，得分愈高，表示文意理解能力愈佳。（六）推論能力推論能力是指讀者根據文章中的語意及脈絡，結合先備知識及自身經驗的能力，找出文章中隱藏的意義，進而建構完整的意義。本研究所指的推論能力是指在「國小二年級電腦化適性閱讀理解測驗」中推論測驗的總分，得分愈高，表示推論能力愈佳。

(17)

7

第二章文獻探討

為了編製出一份能測量出學童真實能力的閱讀理解測驗，本研究將從閱讀理解的相關理論決定測驗架構的理論依據、欲測量對象的年紀；接著由國內的閱讀理解測驗，結合閱讀理解的歷程歸納並選擇閱讀理解的次能力；最後介紹試題反應理論及電腦化適性測驗，說明本研究選擇電腦化適性測驗做為施測方式的原因，並決定欲使用的資料分析方法。

第一節閱讀理解理論

壹、閱讀理解的定義 閱讀理解包含了閱讀與理解兩個部分，而且是透過閱讀進而達到理解的目的。閱讀是讀者主動且積極地從讀物中搜尋意義的過程（Graves, M. F., Juel, C., & Graves, B. B., 1998），這是一種複雜且動態的過程（Rubin, 1980）；理解則是一種高層次的思考，是一種認知的歷程（Barchers, 1998）。由此可知，閱讀本身是由多種相關的認知歷程交互作用的結果（林寶貴、錡寶香，2000），而閱讀理解運用到的認知歷程就更多了。柯華葳（1999）及胡永崇（2008）皆認為閱讀歷程可以分為認字與理解兩部分，認字是理解的基礎但是兩者有不同的認知成分。林寶貴、錡寶香（2000）認為閱讀理解為文章或文本內容與閱讀時讀者的心智活動、記憶之間積極互動所產生的結果，而閱讀的最終目的即是在賦與文本意義，亦即理解。從前述相關研究可發現，閱讀理解可概略分成輸入訊息的辨認，以及其後的認知處理兩大過程。隨著時代的演進以及資訊呈現、流通方式的變更，對於閱讀理解的概念及意義亦需加以修正及補充。有關學者以及教育、閱讀推廣機構也對於閱讀理解有了更為全面及完整的詮釋。 Kintsch(1988)認為閱讀理解是文章內容與先備知識互動的產物，透過不斷地建構與整合命題形成完整的心理表徵。即使是同樣的語詞，在不同的語句、陳述情境亦會產生不同的意義，端視其上下文或該段落所欲陳述的主旨、概念

(18)

8

而定。精熟的閱讀者較初接觸閱讀或低成就者，更能掌握作者所想傳達之命題及意義。

美國國家教育發展評量（ National Assessment of Educational Progress[NAEP], 2011）將閱讀能力定義為一種動態且複雜的過程，並根據文章形式、目的和情境發展與詮釋文章意義(NAGB 2010, p.2)。 PIRLS(2011)將閱讀能力定義為：理解並運用社會中個人所需的書寫語言的能力。更重要的是，讀者能由各式各樣的文章中建構意義，且由閱讀中進行自我學習、以閱讀為媒介參與社團活動並獲得樂趣(Mullis et al. 2009, p.12)。 PISA將閱讀能力定義為理解、運用以及省思文章內容，以便實現個人目標，增進知識、發揮潛能以及參與社會的能力。也就是說，閱讀能力超越了文字解析和詞彙理解的層次，更涉及因各種目的去理解、運用及省思語文訊息。讀者的角色不是被動的資訊接受者—對所閱讀的東西不加思索照單全收，而應該是積極主動省思和批判閱讀內容，並與作者互動，探索作者心靈世界（引自 PISA閱讀素養應試指南，2010）。綜合上述，可知閱讀是一種動態且複雜的心理歷程。讀者在閱讀時會主動建構知識，並根據文章訊息與本身的先備知識加以整合，進而理解文章內容，瞭解作者真正要傳達的意義。並從閱讀中學習，增進個人知識、發揮內在潛能及社會適應的能力。 貳、閱讀理解的模式 早期對於閱讀的歷程大多是由認知心理學家根據訊息處理模式（information processing model）發展出來的，依據訊息流動的方向，可分為由下而上、由上而下及雙向互動模式（曾世杰，2004）。而近期較具影響力的閱讀歷程模式則是 Kintsch 於 1988 年所提出的「建構 ─ 整合」模式（construction-integration model），分別介紹如下。

一、由下而上模式（Bottom-up Model）：

(19)

9 （由外而內）的知覺歷程。閱讀的過程是有組織、有層次性的，要達到一定的水準，必須先達到基本的水準；但達到基本的水準並不一定保證能達到更高一層的水準(Gough, 1972)。閱讀始於視覺刺激，眼睛將看到的字彙進行辨識（不一定需要轉成語音），再將字彙組合成詞彙，進而瞭解詞彙。之後再根據語法瞭解句義，最後理解全文的意義，如圖 2-1 所示。此模式強調「解碼」的歷程，認為「字彙辨識」是閱讀的第一步，然而相關研究者在發展此理論時，並未考量讀者的先備知識及後設認知能力（曾世杰， 2004），而這些能力都是理解時不可或缺的重要能力，因此，該理論較適宜說明閱讀初學者、閱讀能力落後者，以及一般能力閱讀者接觸較陌生或艱深之內容時之處理過程。圖 2-1 由下而上模式資料來源：曾世杰（1996）。閱讀低成就學童及一般學童的閱讀歷程成份分析研究。八十五學年度師範學院教育學術論文發表會論文集（頁 209-225）。臺東縣：國立臺東師範學院。二、由上而下模式（Top-down Model）：此模式認為閱讀是一種心理語言猜測遊戲 (a psycholinguistic guessing game) (Goodman, 1967)，是讀者用其自身的先備知識及後設認知能力，將文字資料加以組織、預測及理解（由內而外）的歷程（曾世杰， 2004）。閱讀的過程為聚焦、注視、感知、選擇、預期、猜測、檢查、修正，讀者於閱讀時利用本身的先備知識及策略，選擇有用的訊息，組織並閱讀段落文章閱讀句閱讀詞閱讀字

(20)

10 猜測答案，若無法猜出答案，便會進一步蒐集更多的文字線索，直到找到答案為止，並檢查這個答案在前後文中的語法和句義是否適當。若不適當，則讀者必須重讀一次，直到發現其他適合的答案為止(Goodman, 1967)，如圖 2-2 所示。此模式強調「先備知識」的能力，認為文章內容愈接近個人的舊經驗，讀者愈不需要依賴字詞本身的意義，閱讀時就愈容易瞭解並吸收（Barchers, 1998）。此理論強調讀者本身之先備知識及舊經驗，若能妥善運用讀者已具備、習得之相關技巧，將能裨益其知識學習、新事物及閱讀內容之理解。故此理論較適宜闡述精熟閱讀者及一般閱讀者接觸相似、熟悉之內容時，其心理運作、針對輸入內容之處理歷程。圖 2-2 由上而下模式資料來源：曾世杰（1996）。閱讀低成就學童及一般學童的閱讀歷程成份分析研究。八十五學年度師範學院教育學術論文發表會論文集（頁 209-225）。臺東縣：國立臺東師範學院。三、雙向互動模式（Interactive Model）：此模式認為閱讀是讀者運用本身的先備知識和文章內容互動的過程，並從中建構文章的意義。讀者透過視覺輸入對獲得的資訊做一連串的預測或假設，這些預測或假設是建立在字、詞、片語、句子及大量語料的知識結構中，包含前後文情境中的非語文部分。當獲得的資訊有效時，那些一致的假設將被留下，不一致的則被清除，直到適合為止。此模式結合了表層的資料取向模式─由下而上模式及深層的概念取向模式─由上而下模式，強調閱讀是這兩模式同時發生、合作處理且交互作用的結果。模式中的每先備知識、經驗、後設認知策略閱讀目的閱讀理解

(21)

11 一階段都是相連的，且彼此活化(Rumelhart, 1977)，如圖 2-3 所示。雖然結合了兩種模式較為完整，卻忽略了閱讀除了上述與閱讀能力有關的影響，還會受到個人與環境的影響，因此雙向互動模式也不能算是一個完整的閱讀理解模式。圖 2-3 雙向互動模式資料來源：曾世杰（1996）。閱讀低成就學童及一般學童的閱讀歷程成份分析研究。八十五學年度師範學院教育學術論文發表會論文集（頁 209-225）。臺東縣：國立臺東師範學院。四、「建構─整合」模式（construction-integration model）：此模式認為閱讀是一種心理表徵不斷建構與統整的循環歷程（Kintsch, 1988）。以由下而上模式為基礎，將閱讀分為「建構」與「整合」兩階段。在建構階段，讀者會根據自身的語言知識對文章內容的字彙、詞彙及句子意義的理解形成命題，而與文章內容無直接相關的或不一致的一般性知識先備知識、經驗、後設認知策略閱讀目的閱讀理解閱讀文章段落閱讀句閱讀詞閱讀字

(22)

12

（general knowledge）也會一併被提出；在整合階段，讀者會將自身的先備知識及經驗與建構階段產生的命題及一般性知識做連結與修正，直到心理表徵穩定為止（van Dijk & Kintsch, 1983）。整合階段融入了情境模式（situation model），此為讀者透過自身的先備知識及經驗對文章整體內容的解讀，因此就算讀同一篇文章，每個人對這篇文章的理解也會有所不同（Kintsch, 1988）。Kintsch 的建構─整合模式雖然是以由下而上模式為基礎，也融入了由上而下模式的觀念，最後加上讀者的背景知識所建構出的文章理解情境，是一個較為完整的閱讀理解模式。因此，本研究選擇以 Kintsch 的「建構─整合」模式做為本閱讀理解測驗編製的理論依據。 參、閱讀理解的歷程 在閱讀書面文字、數字或是圖表內容時，要能成功理解所傳達之訊息，需透過一些適當的心理認知過程以及運用適當的策略，由此建立屬於個人的概念及知識庫網絡。當讀者於基本的處理層次，包含拼讀、識字、字形處理等工作達自動化階段後，便能將認知的資源及精力置於較高層次的處理工作。閱讀歷程本身便是以一些生產法則集組（sets of productions）來呈現，當成為一個熟練的閱讀者時，其中的一項結果即是達成閱讀歷程的自動化（automatization）（引自岳修平譯，1998）。本段落將探討國內外與閱讀理解歷程相關之文獻，以釐清各項策略、處理程序之運作原則及歷程。一、Pearson 與 Johnson(1978)的閱讀理解歷程 Pearson 與 Johnson(1978)的閱讀理解歷程是由問題理解的分類而來，此分類是根據三個「問題─答案關係」而來：文章中明示的問題、文章中隱含的問題及與先備知識有關的問題。而這三個「問題─答案關係」是由文章中的訊息及讀者先備知識（也稱為「腳本」（script）或「基模」（schema））的關係所歸納出來的。

(23)

13

讀者於閱讀時所產生的問題和答案都可以直接在文章中找到線索，只要瞭解字義就能找到問題的答案，這類型的理解也稱為「文章內容的直接理解」（reading the lines）。

（二）文本的隱喻理解（textually implicit comprehesion）

讀者於閱讀時所產生的問題和答案也能從文章中找到線索，但並不是那麼明顯，通常需要透過一定程度的邏輯思考及推論才能達成。在這種情況下，讀者會推論出他認為合理的答案，因此這類型的理解也稱為「文章內容的推論理解」（reading between the lines）。

（三）融入先備知識的推論理解（scriptally implicit comprehesion）讀者在閱讀時需利用自身的先備知識來回答問題，而問題的答案是由讀者先備知識的累積而來的。這類型的理解也需要推論，但和文本的隱喻理解所需要的推論不同，此推論所需的資料庫存在於讀者的腦中而非文章內容裡。這類型的理解通常發生在文章中問題的非文本答案是否適當，因此也稱為「文章內容之外的理解」（reading beyond the lines）。二、Kintsch (1978,1998)的閱讀理解歷程 Kintsch 認為閱讀理解是建構與整合兩個歷程不斷循環且交錯進行的結果，直到形成穩定的心裡表徵為止。而閱讀理解的歷程可以分成三個層次：微觀結構（microstructure）、宏觀結構（macrostructure）及情境模式（situation model），其中微觀及宏觀結構屬於文本基礎（textbase）的心理表徵。（一）微觀結構（microstructure）讀者在閱讀時，文章中的每一個字都會激發出長期記憶中所有相關的字義，透過文章的背景訊息刪掉不相關的意義並保留相關的意義，再將其整合成詞及句子，此為文章本身的概念或細節的初步理解。（二）宏觀結構（macrostructure）將微觀結構中的句子加以整合形成一連串的命題，也就是段落大意，再將段落大意加以整合形成整篇文章的主旨及大意，此為文章本身的整

(24)

14 體性理解。（三）情境模式（situation model）讀者利用本身的先備知識及經驗，根據宏觀結構的結果所建構的心理表徵。情境模以各種形式呈現，如心像或命題，是較高層次的知識結構。此為讀者本身對文章的深層理解，也因為每個人的先備知識及經驗的不同，所建構出的情境模式也不會一樣。三、Gagné 等人(1993)的閱讀理解歷程（引自岳修平譯，1998） Gagné、C.W.Yekovich 與 F.R.Yekovich 將閱讀理解的歷程分為四個層次：解碼（decoding）、字義理解（literal comprehension）、推論理解（inferential comprehension）及理解監控（comprehension monitoring）。在閱讀活動發生的過程的每分每秒中，包含於所有次群組中的歷程很可能都會以平行（parallel）處理的方式來進行（Frederiksen, 1982; Just & Carpenter, 1987; Thibadeau, Just & Carpenter, 1982）。

（一）解碼（decoding）─自動化基本技能解碼是指破解一個訊號代碼，這也正是解碼歷程本身的功能─破解書面文字符號並使其具有意義。Ehri(1982)指出解碼有兩種主要的歷程：配對（matching）及譯碼（recoding）。配對是指書面文字會與一已知字的型態（pattern）相配對，從而活化該字儲存在長期記憶中的字義。讀者的「視覺字彙詞典」（sight vocabulary）─可以迅速辨識出的書面文字組，會直接與一個內部的、敘述性的知識表徵相配對，並活化讀者個人對該字義所有的相關知識；譯碼是指書面文字會被轉化成為聲音的形式，從而活化該字儲存在長期記憶中的字義。此歷程需要運用次文字單元的敘述性知識，如音素（phonemes）、音節（syllables）及詞素（morphemes）等。（二）字義理解（literal comprehension）─自動化基本技能與概念性理解的混合

(25)

15 字義理解是指由書面文字來追溯推論每個字義，包含兩個歷程：字義取得（lexical access）及語法分析（parsing）。字義取得是指運用解碼歷程中所得的產品來辨識及選擇適當的字義；語法分析是指利用某種語言之句法和語言學的原則，將一些字組合在一起，以形成有意義的概念。命題（propositions）便是語法分析的產品。（三）推論理解（inferential comprehension）─自動化基本技能、概念性理解及策略的混合推論理解可以提供讀者對於正在閱讀的事物更深層且較廣博的理解，包含三個歷程：整合（integration）、摘要（summarization）及詳細論述（elaboration）。整合是指把兩個或兩個以上的命題結合在一起，且需要一些認知資源來幫助整合文章中的概念。常出現在複合句、不相連的兩句子間或不相連的段落間；摘要是指使讀者在其敘述性記憶內產生一個全盤性或是一個巨觀的結構（macrostructure），來涵括一篇文章中的主要概念（Kintsch & van Dijk, 1978; van Dijk & Kintsch, 1983）。巨觀的結構有如心像大綱一般，可以想像成一組按層級排列的命題，幫助讀者擷取文章中的主要概念，而讀者必須對文章主題有某些概念性的瞭解才能進行摘要；詳細論述是指讀者的思考過程，也就是將先備知識帶入文章中內容的意義來增進相關訊息。（四）理解監控（comprehension monitoring）─自動化基本技能與策略的混合理解監控在於確保讀者能夠既有效率又有效能地達成其閱讀目標。包含四個歷程：目標設定（goal setting）、策略選擇（strategy selection）、目標檢視（goal checking）及修正補強（remediation）。此歷程被稱為後設認知歷程（Baker & Brown, 1984; Flavell, 1979），是一個人對於自己本身認知歷程的覺察。

(26)

16 閱讀歷程可以分為認字與理解兩部分，認字是理解的基礎但是兩者有不同的認知成分。認字，包括聲韻處理、字形辨認、字義提取，涉及到讀者中文拼音知識，組字、部件的知識以及字彙知識；理解，分為部分處理與本文處理，部分處理是指處理少量的文本，建構初級意義單位，包括字義搜尋、形成命題及命題的組合，本文處理是指對較長文本的理解，包括文義理解與推論。五、林寶貴、錡寶香（1999）的閱讀理解歷程閱讀內容的意義是由讀者所建構的，涉及下列三項歷程：以命題形式建構文本的基本意義、提取相關知識解釋文本內容、經解釋所獲得之義與已儲存在記憶系統中的相關訊息做比較。若將上述的處理歷程以評量的方式觀之，則包括：語言處理能力、文本內容基本事實的了解、推論、摘取文章大意或重點、比較分析相關訊息等。語言處理能力包括音韻處理、語意及語法能力。綜合以上學者對閱讀理解的歷程所提出的見解，可以歸納出以下幾個步驟：音韻處理、字義理解、語法分析、文義理解、整合、摘要、推論、與先備知識有關的理解、理解監控等，而這些閱讀理解的歷程也將作為研究者選擇閱讀次能力的重要依據。 肆、閱讀理解的發展階段 一、Chall 的閱讀發展階段Ｃhall(1983)將閱讀發展分為六個階段，其中又分為兩大區域，前三個階段為「學習閱讀」（learning to read），後三個階段為「由閱讀中學習」（reading to learn）。

階段 0：前閱讀期（6 個月～6 歲）

這個階段的孩子會「假裝」閱讀，若他/她們之前已經看過這個故事，他/她們會再重述一遍。開始認識字母及某些符號，也開始練習寫自己的名字；開始掌控語言，幼稚園的孩子大約有 6000 字的識字量。

(27)

17 階段 1：閱讀前期（識字期）（6～7 歲）這個階段的孩子開始學習如何在文字與口語間連結字母與字音，他們能閱讀具有高頻字及正常發音的字的簡單的文章，用技巧及洞察力去「猜測」新的單音節的字。階段 2：閱讀流暢期（7～8 歲）這個階段的孩子開始提升閱讀的流暢性。藉由閱讀簡單且熟悉的故事和文章來發展解碼技巧、字彙及其他策略來產生意義以瞭解文章內容。階段 3：學習新知期（9～14 歲）一般來說，這個階段的閱讀是用來學習新的概念及知識的，體驗不同的感覺及學習不同的態度。階段 4：多元觀點期（15～17 歲）這個階段的閱讀材料較為複雜且廣泛，文章形式包含說明文及記敘文。階段 5：建構和重建期（18 歲以上）這個階段的閱讀通常是為了個人的需求和目的（工作的和個人的）而讀。閱讀可以快速又有效地使自己和他人的知識互相交流、融合並創造出新的知識。二、Gunning 的閱讀發展階段 Gunning (1996)將閱讀發展分為五個階段。第一階段：閱讀萌芽期（0～5歲）此階段語言的聽覺能力發展迅速，奠定了閱讀的基礎。開始察覺並區辨文字與非文字的不同，認識常用字及與自身有關的文字，並藉由聽故事、看繪本開始累積閱讀的相關知識。第二階段：開始閱讀期（幼稚園～國小1年級）此階段為文字解碼的階段，需逐字唸讀，再從資料庫中提取字義，處於建立自動化的過程，因此閱讀速度非常緩慢。

(28)

18 第三階段：閱讀能力進步期（國小2～3年級）此階段的學童在文字解碼的速度、流暢性及理解文章內容的能力上都大幅提升，因此閱讀著重在文章意義的瞭解，而非字詞的意義上。學童也能從閱讀素材中認識大量的字彙，也能瞭解其以口語形式表達的意義。第四階段：由閱讀中學習期（國小4～6年級）此階段的知識與概念會較為複雜且抽象，句子與文章也變得較長、較複雜。因此學童需利用閱讀策略來瞭解文章內容，而非只靠文章的背景知識，他們能透過閱讀學得很多較難的字彙及新的知識，為閱讀能力發展過程中最關鍵的階段。第五階段：閱讀建構期（國中1年級以上）此階段不再只靠背誦和記憶的方式學習新的概念與知識，而是從發現事物的組織結構與系統，由不同的角度、不同的觀點思考問題，找出問題的原因與解決的方式。根據 Chall 及 Gunning 的閱讀發展階段，可以發現國小二年級學童正發展到「閱讀流暢期」及「閱讀能力進步期」的階段，如表 2-1。此二個階段皆為開始發展基本的閱讀技巧及流暢性，也是開始發展文章意義的理解能力，其發展的狀況，將影響日後的閱讀理解及其他深層的閱讀能力。因此，本研究決定以國小二年級學童為研究對象進行研究。表 2-1 閱讀理解能力發展階段之比較學者 Chall(1983) Gunning (1996) 各階段開始發展的能力前閱讀期（6 個月～6 歲） 1. 「假裝」閱讀，若他/她們之前已經看過這個故事，他/她們會再重述一遍。 2. 開始認識字母及某些符號。閱讀萌芽期（0～5 歲） 1. 語言的聽覺能力發展迅速，奠定了閱讀的基礎。 2. 開始察覺並區辨文字與非文字的不同。（續下頁）

(29)

19 學者 Chall(1983) Gunning (1996) 各階段開始發展的能力 3. 開始練習寫自己的名字。 4. 開始掌控語言，幼稚園的孩子大約有 6000 字的識字量。 3. 認識常用字及與自身有關的文字，並藉由聽故事、看繪本開始累積閱讀的相關知識。閱讀前期（識字期）（6～7 歲） 1. 開始學習如何在文字與口語間連結字母與字音。 2. 能閱讀具有高頻字及正常發音的字的簡單的文章。 3. 用技巧及洞察力去「猜測」新的單音節的字。開始閱讀期（幼稚園～國小 1 年級） 1. 為文字解碼的階段，需逐字唸讀，再從資料庫中提取字義，處於建立自動化的過程。 2. 閱讀速度非常緩慢。閱讀流暢期（7～8 歲） 1. 開始提升閱讀的流暢性。 2. 藉由閱讀簡單且熟悉的故事和文章來發展解碼技巧、字彙及其他策略來產生意義以瞭解文章內容。閱讀能力進步期（國小 2～3 年級） 1. 文字解碼的速度、流暢性及理解文章內容的能力上都大幅提升。 2. 閱讀著重在文章意義的瞭解，而非字詞的意義上。 3. 能從閱讀素材中認識大量的字彙，也能瞭解其以口語形式表達的意義。學習新知期（9～14 歲） 1. 閱讀是用來學習新的概念及知識的。 2. 體驗不同的感覺及學習不同的態度。由閱讀中學習期（國小 4～6 年級） 1. 知識與概念會較為複雜且抽象，句子與文章也變得較長、較複雜。 2. 需利用閱讀策略來瞭解文章內容，而非只靠文章的背景知識。 3. 能透過閱讀學得很多較難的字彙及新的知識，為閱讀能力發展過程中最關鍵的階段。（續下頁）

(30)

20 學者 Chall(1983) Gunning (1996) 各階段開始發展的能力閱讀建構期（國一以上） 1. 不再只靠背誦和記憶的方式學習新的概念與知識，而是從發現事物的組織結構與系統。 2. 由不同的角度、不同的觀點思考問題，找出問題的原因與解決的方式。多元觀點期（15～17 歲） 1. 閱讀材料較為複雜且廣泛。 2. 文章形式包含說明文及記敘文。建構和重建期（18 歲以上） 1. 閱讀通常是為了個人的需求和目的（工作的和個人的）而讀。 2. 閱讀可以快速又有效地使自己和他人的知識互相交流、融合並創造出新的知識。

資料來源：整理自 Chall, J. S. (1983). Stages of reading development. N.Y.: McGraw-Hill Book Company. 及 Gunning, T. G. (1996). Creating reading

instruction for all children. Boston, MA: Allyn & Bacon.

綜合上述可知閱讀是一種複雜且動態的心理歷程，閱讀的過程中須不斷建構與整合文章中的訊息與自身知識的理解，而此論點與 Kintsch 的「建構─整合」模式幾乎一致。因此本研究將以 Kintsch 的「建構─整合」模式做為閱讀理解測驗的理論依據，由其所提出的閱讀理解歷程發展測驗架構，並參考各學者的閱讀理解歷程，歸納並決定閱讀理解的次能力作為測驗內容的編製依據。

(31)

21

第二節國內閱讀理解測驗的介紹與評析

由前一節所述可知，閱讀本身就是一種動態且複雜的心理歷程，而各學者對於閱讀理解的定義與歷程也不盡相同，由於本研究是以編製一份中文閱讀理解測驗為目的，所以本節將只介紹目前國內標準化及自編的閱讀理解測驗，並說明本研究閱讀理解次能力選擇之原因。壹、國內標準化的閱讀理解測驗國內目前有數種標準化語文能力測驗，依據測驗目的、施測對象、評量花費時間，教師、研究者及專業團隊成員可依據其個別需求，選擇適當測驗工具加以運用。然而在此類測驗中，可發現其施測目的多為評估學生整體語文能力、瞭解其在國語文學習、社區獨立生活、人際溝通等普遍性用途。如「國語文能力測驗」（吳武典、張正芬，1984）、「國民小學國語文成就測驗」（周台傑，1992）、「中華國語文能力測驗」（林寶貴、楊慧敏、許秀英，1995）及「國民中小學國語文成就測驗」（洪碧霞、邱上真，1999）等測驗皆屬此類，詳見表 2-2。表 2-2 國內標準化國語文能力測驗一覽測驗名稱編製者測驗目的測驗對象測驗內容國語文能力測驗吳武典張正芬（1984）分析兒童語文能力發展的情形及其內在的差異。 2～7 年級測量語文能力的五個向度：聽、說、讀、寫、作。閱讀理解測驗在評量學生對視覺符號（文字）刺激的接收及統整的能力。國民小學國語文成就測驗周台傑（1992）評量學生的國語文成就，並可作為初步篩選閱讀障礙兒童之用。 1～6 年級五個分測驗：注音、詞彙、字形辨別、語法及閱讀。閱讀測驗內容是根據國中小國語文課本內容及生活上最常接觸的閱讀內容來編選閱讀測驗材料。（續下頁）

(32)

22 測驗名稱編製者測驗目的測驗對象測驗內容中華國語文能力測驗林寶貴楊慧敏許秀英（1995）評量學生的國語文能力，以做為特殊學生鑑定、安置、編班、能力分組及設計國語文教材之參考。 1～9 年級七個分測驗：注音、詞彙、選詞、字形、文意、語法分析及重組。國民中小學國語文成就測驗洪碧霞邱上真（1999）評量學生的國語文成就，並作為初步篩選閱讀低成就及閱讀障礙學生之用。 1～7 年級以各年級學生所學習的語文教材為閱讀成份，依照閱讀成份分成聽力測驗、書面測驗與短文閱讀測驗。資料來源：研究者自行整理。但若欲探究閱讀理解相關能力方面，則目前可選用之工具仍有限，如「中文閱讀理解測驗」（林寶貴、錡寶香，1999）、「閱讀理解測驗」（張世彗、楊坤堂，2004）及「國民小學（二至六年級）閱讀理解篩選測驗」（柯華葳、詹益綾，2007）。在前述三項測驗中，「國民小學（二至六年級）閱讀理解篩選測驗」為由「閱讀理解困難篩選測驗」發展而來，且其編製原理一致，但題目設計、常模建置更為完善，因此以下僅就「中文閱讀理解測驗」（林寶貴、錡寶香， 1999）及「國民小學（二至六年級）閱讀理解篩選測驗」（柯華葳、詹益綾， 2007）加以介紹與說明。一、中文閱讀理解測驗此測驗是由林寶貴、錡寶香（1999）所編製的，目的在篩選評量國小 2 ～6 年級學生的閱讀理解能力的測驗，以作為篩選在閱讀理解上有困難的學生之用，或是作為探討身心障礙學生閱讀理解能力之用。林寶貴認為閱讀的最終目的就是賦予文本意義，也就是理解。其設計架構參考了國內外閱讀測驗的內涵，分別探討語言能力及一般知識與閱讀理解的關係，交互作用後，進而理解文章大意，瞭解其閱讀理解產物的層次，如圖 2-4。

(33)

23 圖 2-4 文本處理架構資料來源：引自林寶貴、錡寶香（1999）。中文閱讀理解測驗指導手冊、題本（頁 3）。臺北市：教育部特殊教育工作小組。二、國民小學（二至六年級）閱讀理解篩選測驗此測驗是由柯華葳、詹益綾（2007）所編製的，目的在評估國小 2～6 年級學生的閱讀理解能力，以作為篩選閱讀障礙學生的初步工具。順便改善「閱讀理解困難篩選測驗」的不足，為每個年級設計兩份難度相當的試題，除了可避免練習效果，也較能說明學生的閱讀理解能力所屬的年級程度。柯華葳認為閱讀歷程可以分為認字與理解兩部分，認字是理解的基礎但是兩者有不同的認知成分。認字，包括聲韻處理、字形辨認、字義提取，涉及到讀者中文拼音知識，組字、部件的知識以及字彙知識。理解，分為部分處理與本文處理。部分處理是指處理少量的文本，建構初級意義單位，包括字義搜尋、形成命題及命題的組合；本文處理是指對較長文本的理解，包括文義理解與推論，如圖 2-5。

(34)

24 圖 2-5 閱讀理解成分分析資料來源：引自柯華葳、詹益綾（2007）。國民小學（二至六年級）閱讀理解篩選測驗指導手冊（頁 2）。臺北市：教育部特殊教育工作小組。茲將上述兩測驗依測驗目的、測驗架構、測驗對象、測驗內容、測驗題型與題數、計分方法與解釋及信、效度做一整理及對照，如表 2-3。表 2-3 中文閱讀理解測驗與國民小學（二至六年級）閱讀理解篩選測驗對照表測驗名稱中文閱讀理解測驗國民小學（二至六年級）閱讀理解篩選測驗測驗目的 1. 評量國小 2～6 年級學生的閱讀理解能力。 2. 篩選閱讀理解困難的學生。 3. 探討身心障礙學生閱讀理解能力。 1. 評量國小 2～6 年級學生的閱讀理解能力。 2. 篩選閱讀障礙的學生。測驗架構閱讀的最終目的是理解，設計架構如圖 2-4。閱讀可以分為認字與理解兩部分，而認字是理解的基礎，設計架構如圖 2-5。測驗對象國小 2～6 年級。國小 2～6 年級。測驗內容測量「音韻處理」、「語意」、「語法」、「了解文章基本事實」、「比較分析」、「抽取文章大意」、「推論」七項閱讀理解的次能力。 1. 2 年級：命題組合、句子理解、短文理解。 2. 3～6 年級：多字義題、命題組合、句子理解、短文理解。測驗題型與題數 1. 題型：四選一的選擇題。 2. 題數：100 題。 1. 題型：四選一的選擇題。 2. 題數：19～30 題不等。（續下頁）

(35)

25 測驗名稱中文閱讀理解測驗國民小學（二至六年級）閱讀理解篩選測驗計分方法與解釋 1. 每題 1 分，答對 1 題得 1 分，答錯得 0 分。 2. 得分愈高者表示閱讀理解能力愈佳。 1. 每題 1 分，答對 1 題得 1 分，答錯得 0 分。 2. 得分愈高者表示閱讀理解能力愈佳，但總分的 PR 值若低於 25 則表示學生可能有閱讀理解的困難。信度 1. 內部一致性信度係數 Cronbach’ α 值為.96。 2. 間隔兩週的重測信度係數為.89。 3. 庫李信度係數為.90。 4. 折半信度係數為.95。 1. 內部一致性信度係數 Cronbach’ α 值為.70～.86 之間。 2. 間隔兩週的重測信度係數為.70～.94 之間。效度 1. 「中華國語文能力測驗」與此測驗全測驗的相關為.80。 2. 與各閱讀理解次能力的相關則介於.69～.83 之間。 3. 各項閱讀次能力均有正相關，介於.79～.98 之間。 4. 不同年級的學生在各閱讀理解次能力及閱讀理解總分的也有達顯著差異。 1. 效度：每個年級的各分測驗均有顯著相關。 2. 每個年級中，高、低分組的學生在每個題型的表現上也都達到了顯著差異。 3. 年級間達顯著差異，較高年級的表現比較低年級的好，說明了年級上的區辨力。優點 1. 閱讀理解次能力的涵蓋層面較廣。 2. 題型皆為選擇題，計分方便。 1. 每個年級都有各自的試題，適切性較高。 2. 題型皆為選擇題，計分方便。缺點 1. 2～6 年級皆用同一份試題，其適切性有待考證。 2. 測驗題數太多，受試者較易失去耐性。 3. 以古典測驗理論做為資料分析的解釋，易有樣本依賴及測量精確度的問題。 1. 閱讀理解次能力的涵蓋層面較狹隘。 2. 以古典測驗理論做為資料分析的解釋，易有樣本依賴及測量精確度的問題。資料來源：研究者自行整理。由上表可知，前述二測驗的測驗目的均在於篩選閱讀理解有困難的學童，且測驗對象均為國小 2～6 年級的學童。但隨著年齡增加，閱讀能力亦會有所累積，若不同年級之受試者均採用相同的測驗題目，或僅以年段作為題目選用區隔，則測驗結果恐無法充分反應學童真實的閱讀表現，及其

(36)

26 待提升與協助之能力。在測驗內容方面，此二項測驗的閱讀理解次能力間均有達顯著相關，顯示其閱讀理解次能力與閱讀均有一定程度的關連，而「中文閱讀理解測驗」所包含的次能力又比「閱讀理解篩選測驗」為廣：前者的「語意」其實就包含了後者的「多字義題」與「命題組合」，而前者的「推論」則包含了後者的「句子理解」及與「短文理解」。因此上述二測驗的閱讀理解次能力包含了「音韻處理」、「字義理解」、「命題組合」、「語法」、「了解文章基本事實」、「比較分析」、「抽取文章大意」及「推論」能力，此閱讀理解次能力的向度也將作為本研究選擇閱讀理解次能力的依據。貳、國內自編的閱讀理解測驗本研究所指的國內自編的閱讀理解測驗為為了學術研究目的而編製，具有一定信效度的閱讀理解測驗，而非一般教師為了理解學生的閱讀能力而從坊間出版社出版的閱讀理解測驗中挑選部分，或從各版本的命題光碟改編題目所編成的測驗。為了瞭解本研究所選擇的閱讀理解次能力是否適當，研究者參考了近十年國內與閱讀理解相關的研究，但發現大多數的測驗都是為了探討教學策略的成效，進一步做為日後教學改進的參考，自編的閱讀理解測驗著實不多，詳見表 2-4。表 2-4 國內近十年閱讀理解相關研究一覽表論文名稱研究者測驗對象測驗內容檢測能力文章結構分析策略教學對增進學童閱讀理解與寫作成效之研究蔡銘津（1995） 3、5 年級使用自編的四個分測驗：文章結構覺察測驗、選擇式閱讀理解測驗、自由回憶測驗、重點摘要測驗。 1. 文脈承接覺察能力。 2. 閱讀理解能力。 3. 自由回憶能力。 4. 重點摘要能力。國民小學閱讀障礙學生閱讀錯誤類型分析之研究吳金花（1997） 4～6 年級使用自編的國民小學閱讀理解測驗，進行閱讀錯誤類型的分析。 1. 字句增刪。 2. 字句修改。 3. 回憶基本事實。 4. 回憶序列。 5. 回憶主題。（續下頁）

(37)

27 論文名稱研究者測驗對象測驗內容檢測能力合作學習融入閱讀教學模式對國小六年級學生閱讀理解、後設認知、閱讀動機影響之研究洪慧萍（2002） 6 年級使用柯平順（1994）編製的國語科閱讀成就測驗，包括字彙量表和閱讀量表。 1. 字彙理解。 2. 細節理解。 3. 主旨理解。 4. 推理能力。相互教學法對國小五年級學童閱讀歷程中自我調整學習與閱讀理解之影響黃智淵（2004） 5 年級使用胡永崇（1995）編製的閱讀理解測驗，有甲、乙、丙三種複本。 1. 文意理解。 2. 推論理解。交互教學策略對不同組型障礙兒童增進閱讀理解效果之研究林秉武（2004） 4～6 年級使用自編的國小兒童語文理解測驗。其中，閱讀理解測驗包含：部首測驗、選出正確的字音、字詞能力測驗、語句變化測驗、句意理解測驗、短文理解測驗。 1. 閱讀識字：判斷部首、字音與字詞的能力。 2. 閱讀理解：判斷語句變化、句意理解與短文理解的能力。分享式閱讀教學對國小低年級學童閱讀理解能力及閱讀動機之影響李燕妮（2006） 1～2 年級使用李麗綺（2002）編製的閱讀測驗，測量學童在閱讀完文章後，能否瞭解文章隱含的意義。 1. 字面理解。 2. 推論理解之統整。 3. 推論理解之摘要。 4. 推論理解之引申。班級讀書會對國小四年級學童閱讀影響之研究莊佳芹（2007） 4 年級從教科書選取文章，自編閱讀理解測驗的前後測。 1. 字面理解。 2. 詮釋性理解。 3. 批判性理解。 4. 創造性理解。分享式閱讀教學對國小一年級學童認字能力、閱讀流暢及閱讀理解之影響林翠玲（2007） 1 年級根據柯華葳閱讀理論自編測驗，內容包含字詞釋義、命題組合、句子理解及短文閱讀。 1. 本文處理：理解字義、推論。 2. 部分處理：搜尋字義、形成命題、命題組合。（續下頁）

(38)

28 論文名稱研究者測驗對象測驗內容檢測能力廣泛閱讀與重複閱讀教學法對國小一年級學童識字能力、口語閱讀流暢力及閱讀理解之影響洪采菱（2008） 1 年級由國民小學國語補充讀物中選擇文章編製閱讀測驗。 1. 字詞釋義。 2. 命題組合。 3. 句子理解。 4. 短文理解。多媒體註解輔助低閱讀能力學生在線上閱讀理解表現之成效王詩妮（2012） 4 年級使用黃堯香（2007）的國小四年級學童中文閱讀理解測驗。 1. 字義理解能力。 2. 文本理解能力。 3. 推論理解能力。 4. 摘取要旨能力。國民小學高年級學生線上閱讀理解測驗編製與實驗教學驗證之分析曾雅瑛（2012） 5～6 年級使用自編及董宜琍（2003）的國小六年級學童中文閱讀理解測驗與洪碧霞、邱上真（1998）的國小中高年級閱讀理解與摘要能力測驗。 1. 擷取檢索資訊。 2. 統整與解釋。 3. 省思與評鑑。 CEFR 基礎級之華語文能力與閱讀理解能力測驗研發與電腦化適性評量系統建置王暄博（2013） 5～ 10 年級使用自編的華語文理解能力測驗。 1. 視覺理解能力。 2. 詞彙與語法能力。 3. 閱讀理解能力。資料來源：研究者自行整理。單純依據理論架構編製的閱讀理解測驗，只有董宜俐（2003）的「國小六年級學童中文閱讀理解測驗編製研究」、黃堯香（2007）的「國小四年級學童中文閱讀理解測驗編製與其相關研究」及黃婉玲（2010）的「以 NAEP 架構建置國小四、五年級閱讀理解測驗」，以下將依研究目的、研究架構、研究對象、測驗內容、測驗題型與題數、計分方法與解釋及信、效度做一整理及對照，如表 2-5。（續下頁）

(39)

29 表 2-5 國內三自編閱讀理解測驗對照表論文名稱國小六年級學童中文閱讀理解測驗編製研究國小四年級學童中文閱讀理解測驗編製與其相關研究以 NAEP 架構建置國小四、五年級閱讀理解測驗研究者董宜俐（2003）黃堯香（2007）黃婉玲（2010）研究目的發展一份中文閱讀理解測驗，以檢測國小六年級學童閱讀理解能力之表現。發展一份中文閱讀理解測驗，以檢測國小四年級學童的字義理解、文本理解、推論理解、摘取要旨等閱讀理解能力。編製一份適用於國小四、五年級學童的閱讀理解測驗，協助教師進一步瞭解學童的閱讀理解能力。研究架構以中文閱讀理解測驗（林寶貴、錡寶香， 1999）為測驗架構。以 Gagné 等人及 Pearson & Johnson 的閱讀理解歷程為測驗架構。以 NAEP 2009 的閱讀評量架構為測驗架構。研究對象 6 年級 4 年級 4～5 年級測驗內容測量五項閱讀理解次能力：「字義理解能力」、「文本理解能力」、「推論理解能力」、「摘要能力」及「布題能力」。測量四項閱讀理解次能力：「字義理解能力」、「文本理解能力」、「推論理解能力」及「摘取要旨能力」。測量三項閱讀理解次能力：「尋找和回憶」、「整合和解釋」及「批評和評鑑」。測驗題型與題數 1. 題型：四選一的選擇題及開放式問答題。 2. 題數：50 題。 1. 題型：四選一的選擇題。 2. 題數：40 題。 1. 題型：四選一的選擇題及開放式問答題。 2. 題數：41 題。計分方法與解釋 1. 選擇題每題 1 分，問答題每題 1～3 分，但若答案不合理或未作答則不給分。 1. 每題 1 分。 1. 選擇題每題 1 分，問答題每題 1 ～ 2 分，總分為 46 分。 2. 以 Rasch logit 能力估計值解釋學童的閱讀理解能力。信度 1. 內部一致性信度係數Cronbach’ α 值為.74。 2. 間隔兩週的重測信度係數為.95 1. 內部一致性信度係數 Cronbach’ α 值為.85。 2. 間隔兩週的重測信度係數為.86。 1. 受試者與試題分隔信度係數分別為.89 與.99。 2. 間隔兩週的重測信度係數為.89。（續下頁）

(40)

30 論文名稱國小六年級學童中文閱讀理解測驗編製研究國小四年級學童中文閱讀理解測驗編製與其相關研究以 NAEP 架構建置國小四、五年級閱讀理解測驗效度 1. 專家效度。 2. 與「中文閱讀理解測驗」的效標關聯效度為.71。 3. 與六上國語、數學學期成績之 T 分數的效標關聯效度為.56、.53。 4. 各項閱讀理解次能力間均有正相關，介於.35～.76 之間。 5. 閱讀理解次能力與整體能力有正相關，介於 .64 ～.96 之間。 1. 專家效度。 2. 與四上國語、數學學期成績之 T 分數的效標關聯效度為.61、 .56。 3. 各項閱讀理解次能力間均有正相關，介於.49～.85 之間。 1. 專家效度。 2. 個別試題適合度指標、整體適合度指標及年級/性別 DIF 檢視結果均符合單向度假定。 3. 與「中文閱讀理解測驗」的效標關聯效度為.77。 4. 與國語、數學學期成績之 Z 分數的效標關聯效度為.58、.47 優點 1. 只針對一個年級編製試題，適切性較高。 2. 以學者的閱讀理解歷程為測驗架構，測量的次能力較廣。 3. 題型除了選擇題還有開放式問答題，較能評量高層次的閱讀能力。 1. 只針對一個年級編製試題，適切性較高。 2. 以學者的閱讀理解歷程為測驗架構，測量的次能力較廣。 3. 題型皆為選擇題，計分方便。 1. 只針對二個年級編製試題，適切性較高。 2. 以文獻、研究報告及國際性的閱讀評量資訊為測驗架構，測量的次能力較廣。 3. 題型除了選擇題還有開放式問答題，較能評量高層次的閱讀能力。 4. 以試題反應理論作為測驗資料分析的解釋，測量精確度較高。缺點 1. 以古典測驗理論做為資料分析的解釋，易有樣本依賴及測量精確度的問題。 2. 內部一致性信度較低。 3. 閱讀理解次能力間的相關較低。 1. 題型只有選擇題，較難評量高層次的閱讀能力。 2. 以古典測驗理論做為資料分析的解釋，易有樣本依賴及測量精確度的問題。 1. 以試題反應理論中的 Rasch 模式作為資料分析的解釋，忽略了鑑別度和猜測度參數，較無法呈現試題的內部一致性。資料來源：研究者自行整理。由上表可知，前述三測驗的測驗目的都是編製一份適合的閱讀理解測驗，

(41)

31 瞭解學童閱讀理解能力的表現。值得注意的是，在測驗內容方面，NAEP 的「尋找和回憶」其實就是找尋文章基本事實的能力，「整合和解釋」就是摘要、推論及比較分析的能力，而「批判和評鑑」則是整合後加以評論的能力。因此上述三測驗的閱讀理解次能力包含了「字義理解」、「文本理解」、「推論理解」、「摘要理解」、「比較分析」、「評論」及「布題」能力，此閱讀理解次能力的向度也將作為本研究選擇閱讀理解次能力的參考。另外，只有「以 NAEP 架構建置國小四、五年級閱讀理解測驗」比照國際性閱讀評量使用 Rasch 模式作為資料分析的解釋，測驗的測量精確度較高。綜合上述，本研究的測驗目的與諸多中文閱讀理解測驗一樣，都是為了發展一份適合的閱讀理解測驗，並瞭解學童的閱讀理解能力。測驗對象則只以國小二年級的學童做為研究對象，除了能控制字彙量不足影響閱讀理解的能力外，還可避免適性版本的問題。架構設計是以 Kintsch 的「建構─整合」模式為理論依據，並以其閱讀理解歷程做為測驗架構，分為四個向度：字詞能力、句法能力、摘要能力及推論能力。四大向度中，又包含了由 Kintsch 的閱讀理解歷程所歸納出來的次能力，並參考國內標準化的閱讀理解測驗：「中文閱讀理解測驗」（林寶貴、錡寶香，1999）、「國民小學（二至六年級）閱讀理解篩選測驗」（柯華葳，2007）及國內自編的閱讀理解測驗：「國小四年級學童中文閱讀理解測驗編製與其相關研究」（黃堯香，2007）、「分享式閱讀教學對國小低年級學童閱讀理解能力及閱讀動機之影響」（李燕妮，2006）、「分享式閱讀教學對國小一年級學童認字能力、閱讀流暢度及閱讀理解之影響」（林翠玲，2007）、「廣泛閱讀與重複閱讀教學法對國小一年級學童識字能力、口語閱讀流暢力及閱讀理解之影響」（洪采菱，2008），最後決定以「音韻處理」、「詞彙理解」、「句意理解」、「語法」、「摘要」及「推論」做為本研究閱讀理解測驗的次能力。上述的閱讀理解測驗只有「中文閱讀理解測驗」有「音韻處理能力」這項次能力，但因本研究是以國小二年級的學童為研究對象，音韻處理能力在國小低年級階段與識字能力均有顯著相關（江政如，1999；柯華葳、李俊仁，1996；曾世杰，

(42)

32

1997；黃秀霜，1997；黃秀霜、詹欣蓉，1997；蕭淳元，1995），因此決定將「音韻處理能力」放入次能力中。因為適性化的緣故，測驗內容是以上述的六項次能力編製四選一的選擇題，並以假設較為合理的試題反應理論確保測驗的精確度。

(43)

33

第三節試題反應理論與電腦化適性測驗

科技日新月異，隨著電腦運算能力的提升，加上適性測驗理論的發展，電腦化適性測驗逐漸被應用在實務中。電腦化適性測驗是由試題反應理論發展而來的，而試題反應理論則是促進當今測驗進步的重要關鍵。因此本節將介紹試題反應理論及其優缺點與電腦化適性測驗。

壹、試題反應理論（item response theory, IRT）

為了改善古典測驗理論的缺失，現代測驗理論因運而生。現代測驗理論是以試題反應理論作為理論架構，由 Lord 於 1980 年正式命名。雖然理論的發展較晚，理論的模式也還在發展中，加上計算公式繁複，但因理論與假設較為嚴謹，對測驗資料也有較嚴格的限制，因此深受測驗學者們的喜愛，自 1990 年代後大規模應用在教育測驗方案或教育研究中（Drasgow & Hulin, 1990; Embretson & Yang, 2006; Hambleton, 1989; Yen, 1992; Yen & Fitzpatrick, 2006）。一、試題反應理論的定義 IRT 主要是用來估計試題特性（難易度、鑑別度、猜測度）與受試者的能力（潛在特質）影響其作答反應機率的一種數學模式（余民寧，2009）。二、試題反應理論的模式 IRT 的模式依據計分方式的不同分為二元化計分與多元化計分。二元化計分又分為一參數模式（ one-parameter logistic model ）、二參數模式（two-parameter logistic model）與三參數模式（three-parameter logistic model）（Birnbaum, 1968）；而多元化計分則分為等級反應模式（graded response model, GRM）、名義反應模式（nominal response model, NRM）、評定量表模式（rating scale model, RSM）與部分計分模式（partial credit model, PCM）。因本研究設計的關係，因此只介紹二元化計分的部分，分別介紹如下（余民寧，2009）。

(44)

34

（一）一參數模式（one-parameter logistic model）

一參數模式因為與 Rasch 模式相通，因此又叫做 Rasch 模式，如公式 (1)所示（Rasch, 1960）。

i＝1,2,…,n (1) 其中 是受試者答對某個題目的機率，i 是 n 個試題中第 i 個試題，θ 是受試者的能力，是試題 i 的難度，e 是底為 2.718 的指數，n 是測驗 的總題數。是一種 S 型曲線，其值介於 0 與 1 之間，其試題特徵曲線圖如圖 2-6。圖 2-6 一參數模式的試題特徵曲線圖資料來源：引自余民寧（2009）。試題反應理論（IRT）及其應用（頁 63）。 臺北市：心理。由圖 2-6 可看出四條曲線的形狀是一致的，但其能力量尺的位置則有所不同。這表示一參數模式認為影響受試者作答表現的試題特性是「難易度」，並假設所有試題的鑑別度都是 1.0、猜對率為 0，也就是不考慮猜測度的問題。此模式對試題特性及受試者的作答反應有較嚴格的要求，若這些要求都能符合，則估計出來的能力值就是受試者的真實能力，且其能力量尺是等距的。若正確率為 0.5，則會落在能力量尺上。也就是說，當能力值等於難度參數時，受試者答對的機率有 50%；當能力值大於難度參數時，受試者答對的機率會高於 50%；當能力值小於難度參數時，

(45)

35

受試者答對的機率會低於 50%。受試者的能力愈高，其答對的機率就愈高。

（二）二參數模式（two-parameter logistic model）

二參數模式為 Lord(1952)發表二參數常態肩型模式時提出來的，此模式也被視為是 IRT 的源起，之後再經 Birnbaum(1968)修改成較簡單的對數模式，如公式(2)所示。

i＝1,2,…,n (2) 其中是試題 i 的鑑別度，其值介於 0～2 之間。其他的符號意義與公式 (1)相同，其試題特徵曲線圖如圖 2-7。圖 2-7 二參數模式的試題特徵曲線圖資料來源：引自余民寧（2009）。試題反應理論（IRT）及其應用（頁 66）。 臺北市：心理。由公式(2)可知，二參數模式多了試題的鑑別度，而鑑別度為難度在試題特徵曲線上的斜率值。由圖 2-7 可看出有的曲線的中段是比較陡峭的（如試題 1、3、4），有的是比較平緩的（如試題 2）。試題特徵曲線愈陡峭的，表示試題的鑑別度愈高；愈平緩的表示試題的鑑別度預低。當受試者的能力值等於試題難度時，此時的正確率為 0.5，表示能力的變化與答對率的變化的關係最為強烈。在二參數模式中，與一參數最大的不

(46)

36 同點是題目可以被允許有不同的鑑別度，而這些不同的鑑別度會對受試者答對題目的機率有不同程度的調節性影響。這種模式與實際資料的分析結果較為接近，因為命題者所設計出來的試題很難都具有相同的高鑑別度，有些題目的鑑別度總是不符合預期，但是依然能發揮部份的測量功能。

（三）三參數模式（three-parameter logistic model）

三參數模式為 Lord(1952) 的三參數常態肩型模式經過 Lord & Novick(1968)與 Lord (1980)修改來的。這種模式主要是針對那些可以經由猜測來答對試題的測驗情況，如是非題、選擇題等，如公式(3)所示。

i＝1,2,…,n (3) 其中是試題 i 的猜對率，此猜對率指的是能力極低者猜對該題的機率。 其他的符號意義與公式(2)相同，其試題特徵曲線圖如圖 2-8。圖 2-8 三參數模式的試題特徵曲線圖資料來源：引自余民寧（2009）。試題反應理論（IRT）及其應用（頁 69）。 臺北市：心理。由公式(3)可知，三參數模式多了試題的猜對率，每個題目除了有難易度與鑑別度的特徵外，還有可以被猜對的可能性，因此這種模式比二參數模式更能符合實際的資料。由圖 2-8 可看出試題特徵曲線更具有多

國小二年級電腦化適性閱讀理解測驗編製

國立臺中教育大學特殊教育學系碩士班

碩士論文

Department of special Education

National Taichung University of Education

Master Thesis

國小二年級電腦化適性閱讀理解測驗編製

The Establishment of the Computerized Adaptive Reading

Comprehension Test for the Second Grade Students in Elementary School

指導教授：廖晨惠教授

Advisor：Chen-Huei Liao Ph. D.

研究生：王千慧 撰

Graduate student：Chien-Hui Wang

中華民國 103 年 6 月

June, 2014

摘要

Abstract

目次

第一章 緒論 ... 1

第二章 文獻探討 ... 7

第三章 研究方法 ... 45

第四章 結果與討論 ... 57

第五章 結論與建議 ... 85

參考文獻 ... 89

表目次

圖目次

第一章 緒論

第一節 研究動機

第二節 研究目的與待答問題

第三節 名詞釋義

第二章 文獻探討

第一節 閱讀理解理論

第二節 國內閱讀理解測驗的介紹與評析

第三節 試題反應理論與電腦化適性測驗

研究生：王千慧撰

第一章緒論 ... 1

第二章文獻探討 ... 7

第三章研究方法 ... 45

第四章結果與討論 ... 57

第五章結論與建議 ... 85

第一章緒論

第一節研究動機

第二節研究目的與待答問題

第三節名詞釋義

第二章文獻探討

第一節閱讀理解理論

第二節國內閱讀理解測驗的介紹與評析

第三節試題反應理論與電腦化適性測驗