促進中文閱讀理解教學成效量化研究統合：調節變項影響與評估

(1)

謝進昌閱讀理解量化研究統合 175 教育科學研究期刊第六十四卷第四期 2019 年，64（4），175-206 doi:10.6209/JORIES.201912_64(4).0007

促進中文閱讀理解教學成效量化研究統合：

調節變項影響與評估

謝進昌

* 國家教育研究院測驗及評量研究中心

摘要

以實徵研究證據為基礎，探討促進學生中文閱讀理解教學議題逐漸受到重視，而使用量化統合技術推動本議題的研究，亦愈趨興盛，然而，受限研究數量，鮮少文獻針對調節變項進行深入分析，據此，本研究目的除了分析促進中文閱讀理解教學之量化統合效果外，更聚焦於探討教學介入、參與者背景特徵、個別研究品質評估等因素，對於教學效果量可能產生的調節影響。本研究經統合分析與刪除極端值，發現國內促進中文閱讀理解教學平均效果量，分別具有+0.43 立即效果（168 筆）與+0.39 延宕效果（46 筆），為近中等程度教學成效，續經調節變項分析，發現文本重複閱讀具有顯著偏低平均教學效果、使用預測策略則具有較高教學成效，同時，參與者為特殊生或國中階段學生、使用研究者自編評量工具、實驗設計：其他與納入個別研究的品質較差者，皆可產生顯著偏高教學平均效果量。最後針對分析結果提出幾點未來實務與研究建議。關鍵詞：中文閱讀理解、個別研究品質評估、統合分析、量化研究統合、調節變項分析通訊作者：謝進昌，E-mail: [email protected] 收稿日期：2018/11/02；修正日期：2019/06/25；接受日期：2019/08/20。

(2)

176 閱讀理解量化研究統合謝進昌

壹、研究背景與目的

國內民眾逐漸認同閱讀理解的重要性，推力之一緣自於臺灣參與許多國際大型閱讀評量計畫，決策者可經由國際評比結果瞭解學生閱讀理解表現，以作為政策制定之參考，若根據促進國際閱讀素養研究（Progress in International Reading Literacy Study, PIRLS）2016 年調查教師指導學生使用閱讀策略頻率，結果顯示除了對於文本風格或結構描述外，其餘閱讀策略使用，如擷取文本訊息、辨識大意、詮釋文本意涵等，使用頻率皆低於國際平均值（Mullis, Martin, Foy, & Hooper, 2017, p. 259），而此雷同於國際學生能力評量計畫（Programme for International Student Assessment, PISA）2009 年以閱讀素養為主軸的調查結果，顯示臺灣學生在知覺使用有效策略以瞭解、掌握與摘要文本訊息等面向，皆低於全體經濟合作暨發展組織的平均值（Organisation for Economic Co-operation and Development, 2010），整體而言，顯示學生對於閱讀策略使用處於相對缺乏狀態。面對此現象與脈絡，政府與學者皆曾投入心力以提升閱讀策略教學於實務現場的影響力，以專書出版（柯華葳、幸曼玲、陸怡琮、辜玉旻，2010）、培訓與輔導工作坊，甚至是納入 108 年度國家課程綱要內容（行政院公報資訊網，2018）中，企圖引領教師於實務現場閱讀理解教學，而其依據是扎根於研究為基礎（research-based）所得結論，引用的實徵研究證據來源為單一教學實徵研究或多個研究的統合結果，然而，細究可發現這些研究尚缺乏年級、學生類型、策略間或可能影響教學成效之調節因素探討。檢視過去國內外促進學生閱讀理解教學文獻可發現，大多數統合分析研究（meta-analytic research）或量化研究統合（quantitative research synthesis），是以促進學生英語文閱讀理解為導向（Hebert, Bohaty, Nelson, & Brown, 2016; National Institute of Child Health and Human Development [NICHD], 2000; Suggate, 2016），探討特定閱讀策略或不同教學取徑對於學生英語文理解統合效果。此外，就學習者特徵，過去統合研究則多以特殊學生為標的，分析閱讀困難、學習或認知障礙、低閱讀表現參與者於接受促進閱讀理解教學統合效果（Hall & Burns, 2018; Scammacca, Roberts, Vaughn, & Stuebing, 2015; Stevens, Park, & Vaugh, 2019; Wood, Moxley, Tighe, & Wagner, 2018），以及少部分統合研究涉及參與者為英語文為第二外語學習者的閱讀理解教學成效（Ardasheva, Wang, Adesope, & Valentine, 2017; Cole, 2014）。而陳明蕾（2019）系統性分析臺灣近 10 年參與 PIRLS 資料，以大型評量與調查研究觀點來探討閱讀策略教學與學生閱讀理解表現關聯。

反觀國內中文閱讀理解研究範疇，僅有少數統合研究以促進學生中文閱讀理解為目標，王玳雅（2013）、連啟舜（2002）分別以故事結構教學成效與中文閱讀理解教學進行統合分析，而謝進昌（2015）以整合最佳教學實徵研究之閱讀策略為目標，然而，這些統合研究仍存在

(3)

謝進昌閱讀理解量化研究統合 177 某些待發展議題，一是納入統合文獻數量偏少，容易影響調節變項分析結果的強韌性，甚至無法同時探討多個調節變項之相對影響，如王玳雅、連啟舜僅分別納入 9 篇及 26 篇閱讀教學文獻；另一是過去國內統合研究對於調節變項分析，鮮少於評估閱讀策略、教學取徑等有效性時，同時檢視研究品質影響，較無法評估「在控制潛在研究設計、方法特徵（methodological features）等檢核品質指標偏差下，是否會因此高估了教學效果的可能性」。為適時回應過去相關促進中文閱讀理解統合研究待發展的議題，本研究企圖透過系統性文獻評估與訊息建檔，除了探討促進中文閱讀理解教學之量化統合效果外，更聚焦分析教學介入（教學取徑、促進理解的閱讀策略、教學時間、教學者）、參與者背景（類型、學習階段）、研究品質評估（實驗設計、評量工具、研究品質評估）等因素，個別、同時對於教學效果量的調節效果，以期就發現提供閱讀教學研究者，瞭解如哪些研究方法特徵可能影響教學效果，於未來設計時適時避免及提供實務教學者掌握如在何種條件或情境下，教導哪些閱讀教學策略會具有較佳教學效果等。茲條列本研究待答問題如下：一、國內促進學生中文閱讀理解教學之整體統合平均效果量為何？二、個別教學介入、參與者背景特徵及研究品質評估指標與納入研究之促進中文閱讀理解教學效果量的關聯程度為何？三、教學介入、參與者背景特徵及研究品質評估指標同時與納入研究之促進中文閱讀理解教學效果量的關聯為何？

貳、文獻探討

閱讀理解係讀者透過自身有意向的思考（intentional thinking），主動參與文本建構意義的歷程，有別於單純理解文本內容活動，而是影響閱讀理解的歷程，是牽涉到讀者與文本因素、活動或任務（Snow, 2002）。其中，閱讀教學研究的重要性在於探究如何在特定社會文化情境脈絡下，促進學生主動利用其背景知識，以建構文本心像表徵，進而記憶、理解與應用所讀內容（Cote & Goldman, 1999），從單純文本意義掌握，進而期望能監督自身理解，以激發更多的學習途徑，然而，從過去許多閱讀理解教學研究可發現，教學有效與否及其影響程度，彼此間存在相當差異，顯示此教學效果可能受到某些因素的調節。

過去採用量化研究統合觀點，以系統性文獻評估與統合分析（systematic review and meta-analysis）技術針對閱讀教學主題進行研究結果整合，已逐漸成為趨勢，現行有相當數量的統合結果被提出，詳見 Scammacca 等（2016）回顧，然而，受限於納入個別研究數量偏少與新興影響因子的提出，調節變項議題始終仍屬待探究領域。此外，在統合研究脈絡，調節變項定位是有別於單一實驗研究脈絡，由於統合研究屬於事後聚集多個研究結果，其變項分類具彈性且能配合研究者探究焦點調整（Lipsey, 2009），據此，本研究依目的將調節變項大致

(4)

178 閱讀理解量化研究統合謝進昌分為兩類：連結教學實務特徵及品質控制特徵，就前者，多數如教學介入與策略、參與者背景等，為探究哪些特徵可能具備較佳教學效果，結果作為教學實務啟示；就後者，多數如研究方法特徵或品質評估指標等，為探究前述議題時，作為研究品質控制或評估潛在偏誤影響等用途。以下就本研究探討可能影響促進閱讀理解教學成效之調節變項，簡要進行文獻回顧。

一、教學介入與策略

學者曾針對閱讀教學提出許多見解，而隨著社會建構（social constructivism）概念興起，也產生許多教學取徑，其內涵強調閱讀理解是透過與他人互動以建構出文本意義，除了個人與文本交流外，更重視社會情況、同儕互動的影響力（De Lemos, 2002），使得在以教師為中心推動的直接教學（direct instruction）外，更延伸出以學生為中心的合作學習閱讀教學模式，其一是透過不同合作學習模式教導，推動學生分組與互動，達到教學目標，其模式包含如：Slavin （1978）學生小組成就區分法（student’s team achievement division）、合作式統整閱讀寫作法（cooperative integrated reading and composition）（Stevens, Madden, Slavin, & Farnish, 1987）等；另一取徑則是依據可能發展區（zone of proximal development）與專家鷹架（expert scaffolding）等理論所建構的合作式對話閱讀教學，重視師生間對話與學習責任轉移，如交互教學法（reciprocal instruction）（Palincsar & Brown, 1984）。此外，在社會互動理論框架下，另一焦點在學生主動的理解與意義建構，其教學理念強調著動機概念的融入，據此發展出諸如概念取向閱讀教學（concept oriented reading instruction）（Guthrie et al., 1996）或其他以引起動機為出發點的教學取徑。最後，伴隨科技的發展，電腦或數位輔助亦逐漸融入閱讀教學研究中，而根據 Cheung 與 Slavin（2012）的統合研究結果也多支持其正向教學效果。

在閱讀教學中，促進學生理解的策略往往是被廣泛研究與討論的議題，其分類與理論基礎十分多元，美國閱讀研究小組（National Reading Panel）從統合研究觀點綜合整理提出七大類閱讀策略有效性的證據，包含理解監控、合作學習、圖形組織、故事結構、提問、摘要及交互教學（NICHD, 2000），而依據國內、外統合研究結果，也多支持不論是使用單一閱讀策略或同時輔助多元閱讀策略進行教學，皆具有正向助益。然而，不同閱讀策略對於學生所產生的統合效果量卻不盡相同，顯示其影響教學程度具有差異性（王玳雅，2013；連啟舜，2002；謝進昌，2015；Davis, 2010; Graham & Hebert, 2011; Hebert et al., 2016; Rosenshine & Meister, 1994; Rosenshine, Meister, & Chapman, 1996），也隱含不同理解策略的選擇可能是具有差異教學效果。

二、參與者背景特徵

有關參與者背景特徵，過去統合研究較常觸及的因子是參與者的年齡（級）與能力類型。就前者而言，研究者大多是考量 Chall（1996）所提出的學生閱讀能力發展進程，將年齡（級）視為是重要調節因子，如同 García 與 Cain（2014）在探討解碼與理解能力的關聯時，就發現

(5)

謝進昌閱讀理解量化研究統合 179

兩者具有高度相關，然而，隨著年齡上升，兩者關聯強度會顯著下降，而在教學脈絡下，過往閱讀相關統合研究也發現年齡（級）差異亦具有不同教學成效（Cheung & Slavin, 2012; Suggate, 2010）。就後者而言，不同能力類型參與者在接受閱讀教學時，其成效的差異除了肇因於表現起點的不同，所產生可進步的空間是以弱勢學生較大外，另一考量點在於研究設計，一般以弱勢學生為教學目標之研究，多伴隨是小樣本或小群體的實驗介入研究，然而，根據過去研究，人數少的教學組似乎往往較容易產生較高的教學成效（Vaughn et al., 2003）。此外，依據過去閱讀教學統合結果也發現以特殊生或學習、閱讀障礙學生為探討標的之統合研究（王玳雅，2013；黃瓊儀，2012；Hall & Burns, 2018; Scammacca et al., 2015; Stevens et al., 2019; Wood et al., 2018），是與以一般學生為探討標的之統合研究（連啟舜，2002；謝進昌，2015； Davis, 2010; Graham & Hebert, 2011; Hebert et al., 2016; NICHD, 2000; Rosenshine et al., 1996），兩者教學統合平均效果具有差異性。

三、個別研究品質評估指標

在統合研究框架下，針對個別研究品質（quality assessment of primary research）評估指標進行系統性探討者僅有少數研究，大多針對少數指標進行個別分析，如教學時間長短、教學者是否為研究者、實驗教學設計、評量工具來源等，但不論為何，其理論基礎多建立在效度理論，以 Shadish、Cook 與 Campbell（2002）的研究區分，大致為內部、外部、構念與統計結論效度等。

內部效度強調實驗及對照組教學內容或設計差異是否能真正凸顯欲操弄標的，並降低其他無關干擾因素影響，包含 Cook 等（2015）、Slavin（2008）、What Works Clearinghouse（WWC, 2017）所提出的受試者是否隨機分派、前測表現基準是否均等、參與者流失率、教學者是否為研究者等指標；而外部效度則強調實驗效果的可類推程度，然而，由於統合研究目的某程度就具有累積研究以進行結果概化，因此，單一研究即使不具備充足代表性，也多能經由結果的累積，增加其代表性，致使較少被採用作為評估指標。此外，構念效度重視該實驗教學標的是否確實被反映及測量的程度，其指標包含教學時間、評量工具品質等，其中，就教學時間而言，不同學者有差異觀點：Slavin 認為得排除教學時間未滿 12 週之研究，因為，過短教學時程無法真正反映實驗教學內容，但其疑慮在於實驗操弄週數不一定等於實際教學投入時間，因此，Gersten 等（2005）、Valentine 與 Cooper（2008）認為教學時間可納入統合研究中，作為影響評估標的。另一方面，就評量工具，使用一份具品質的工具，多半是一般實驗教學研究的基本要求，因此，若以品質高低作為評估調節變項的標的，往往不易獲得充足研究數量，進而，若參照過去統合研究結果，可發現評量工具來源（使用標準化評量工具、抑或是使用研究者自編的評量工具）曾被發現具有顯著調節功能（Slavin & Madden, 2011），其原因在於研究自編的評量工具往往易與實驗教學內容產生重疊性，以致不利於控制組學生作

(6)

180 閱讀理解量化研究統合謝進昌答。最後，就統計結論效度而言，它代表實驗教學結果及其成效檢定之統計程序的合理性及強度，其評估指標包含如參與者人數、統計分析方法等，然考量這些研究內統計訊息的呈現方式與內容，會直接反映在效果量計算與量尺選擇，多半也較少作為調節變項來探討。

四、促進中文閱讀理解教學統合實徵研究

有關促進中文閱讀理解教學統合實徵研究，多數文獻以探討整體教學成效為主軸（王玳雅，2013；連啟舜，2002；謝進昌，2015），以及探討促進英語文或特殊學生閱讀理解為標的（Scammacca et al., 2016），整體而言，其統合結果大多支持閱讀教學對於促進學生理解具有正向助益，然而，在調節變項議題探討方面，就存在較多歧異性。 Puzio 與 Colby（2013）在統合以合作學習進行素養教學研究時，發現各效果量具有相當同質性，並不存在調節因素；連啟舜（2002）卻發現不同教學法及參與者年級存在顯著差異效果，其中，參與者為國中生具有較大的教學成效，然而，此結果卻不同於 Davis（2010）的觀點，他發現研究多涉及跨年級參與者，致使無法顯示出學習階段間是否存在顯著差異教學效果。另一方面，就其他教學特徵，De Boer、Donker 與 van der Werf（2014）發現研究者或其助理為教學者時，其平均效果量為 0.93，大於以教師為教學者（平均效果量 0.60），同時， 10週教學介入時間，其平均效果量為 0.1，高於 20 週的教學介入時間，可解釋達 20.2%變異量，雖然，此發現雷同於 Slavin、Lake、Chambers、Cheung 與 Davis（2009）提出的時程效果（duration effect），但在 Bangert-Drowns、Hurley 與 Wilkinson（2004）的統合研究中則未發現介入時間對於教學成效的影響。就研究設計特徵而言，De Boer 等（2014）發現隨機分派設計其平均效果量為 0.70，高於未使用隨機分派設計者的平均效果量 0.58，但經考驗，並未達到顯著差異。謝進昌（2015）在統合國內閱讀教學策略對於一般學生閱讀理解成效時，卻發現混合結果，即使用 Slavin 等（2009）的研究設計定義進行探討，在提問、圖形組織繪製、摘要策略教學上，皆發現使用隨機準實驗設計之平均效果量，較使用配對控制設計來得高，然而，在交互教學則未發現此一現象，同時，Cheung 與 Slavin（2016）在分析教育介入範疇高達 645 筆比較研究時，則發現使用準實驗研究設計者較使用參與者隨機分派實驗設計者，平均效果量也來得大（0.23 vs. 0.16）。最後，就評量工具而言，有別於前述歧異結果，大多數研究均一致發現使用研究者自編評量工具，其平均效果量會較使用現成標準化評量工具相對來得高（Cheung & Slavin, 2016; Davis, 2010; Wanzek, Wexler, Vaughn, & Ciullo, 2010），其背後因素多指向評量工具與實驗教學介入內容若存在相關性（measure inherent to treatment）（Slavin & Madden, 2011），則容易間接提升實驗教學效果。

(7)

參、研究方法

一、特定主題文獻蒐集

為探討促進學生中文閱讀理解教學成效，本研究以窮竭搜尋（exhaustive search）為原則進行相關文獻蒐集。首先，研究者透過國內期刊與博碩士論文資料庫進行文獻資料檢索，經以數個主題相關關鍵詞（如文本（text）、閱讀（reading）、國語文教學（Chinese instruction））等詞彙進行搜尋，截至 2012 年 1 月 6 日，以交集方式於臺灣博碩士論文系統的論文名稱與關鍵詞進行檢索時，回傳 3,521 筆資料，於臺灣期刊論文索引系統的篇名與關鍵詞進行檢索時，回傳 5,832 筆資料。針對每筆回傳訊息，研究者採取兩階段篩選，一是利用下述納入與排除準則，就主題、摘要進行第一階段篩選，其次針對無法判斷者，經獲得全文內容，進行第二階段篩選。於文獻資料庫檢索外，研究者覆核國內曾發表相關閱讀主題之統合分析或後設分析研究參考文獻，經與前述檢索結果進行交叉比對，以避免缺漏重要文獻。利用前述搜尋機制經排除第一階段明顯主題不符、重複文獻後，再經內容檢核排除非中文閱讀教學研究（304 篇）、依變項未涉及中文閱讀理解（74 篇）、無對照組或單一受試者研究（268 篇）、未提供充足訊息以計算效果量（42 篇）等，計獲得 195 篇文獻，覆經排除 22 篇係來自相同研究受試者，如博碩論文轉投期刊者（僅以單篇計數），最後，就 173 篇文獻進行正式文獻回顧與統合分析。

二、主題相關文獻之納入與排除準則

（一）該文獻必須涉入教導學生促進中文閱讀理解策略或相關閱讀教學文獻，其策略包含如提問、圖形組織繪製、文本結構分析等單一或多元策略，而教學取徑包含直接教學、合作學習或其他取徑閱讀教學，但排除探討如影響學生閱讀理解的因素。（二）該文獻研究參與者納入各學習階段、各學習類型，如一般生、特殊或低成就學生，但排除以華語為第二外語學習者。（三）該文獻研究教學成效必須涉及中文閱讀理解之評量，但排除僅有評量學生閱讀動機、閱讀策略等。（四）該文獻研究設計必須涉及群體實驗教學研究，其設計如參與者隨機分派研究設計、準實驗研究設計或其他提供對照組別之實驗設計，但排除單一受試者（或未提供對照組）的相關研究設計。（五）文獻研究結果必須提供學生閱讀理解表現量化數據，以計算組間表現差異效果量，並排除無法計算效果量者，包含如未提供充足訊息且無法透過適當訊息進行補插者、非屬本研究效果量量尺範疇之單一受試者研究設計者，此外，本研究納入截至檢索時間前，國內所

(8)

182 閱讀理解量化研究統合謝進昌有相關期刊、博碩士論文文獻。

三、建檔者訓練、訊息建檔與覆核

對於符合納入準則的文獻，研究者接續執行資料蒐集與建檔，在考量本任務不單是文獻內訊息的擷取，更涉及部分閱讀專業與邏輯判斷，例如，建檔者需基本瞭解交互教學概念，因此，具相當認知負荷，其中，研究者為降低可能的人為建檔錯誤，採用三項策略，分別是各建檔指標依照原文所述內容進行記載，再進行判讀歸類、建檔者訓練與訊息雙重覆核，其中，對於建檔者訓練是預先由研究者針對各建檔指標進行內涵的說明，再交由建檔者實作練習、共同針對疑義處進行討論與回饋修訂，以利建檔者熟悉本研究指標內涵。此外，每篇文獻訊息皆經由兩位建檔者依指標進行建檔與交叉覆核，若某指標內訊息存在不一致者，會再次比對原文，經討論以確立各指標的訊息建檔一致性達到 100%。最後，兩位建檔者背景皆至少有 2 年以上相關閱讀教學研究建檔經驗，具有一定實務執行專業度。有關建檔指標，本研究包含有六大要點：文獻背景特徵、教學特徵、中文閱讀理解評估、研究參與者特徵、實驗設計與研究品質評估指標，以及計算效果量資料，其中，除了具體可記載與分類者，如文獻基本資料（作者、年代）、實驗教學總時間、教學者身分、研究參與者學習階段及類型、延宕施測時間、效果量計算相關資料等訊息外，某些需涉及較專業背景知識判斷的指標，則由研究者依據文獻內容執行細部檢核，包含：教學取徑、促進理解的閱讀策略、研究品質評估與實驗設計等。有關教學取徑分類，考量調節變項為本研究探究重點且該類別研究數量多寡會影響後續調節變項分析穩定性及理論顯著不同其他者之特徵與可融合性，分類為：（一）直接教學：係指以教師為中心，直接教導學生某種閱讀理解策略或經有系統組織的課程內容或活動，其過程多透過教師示範、引導練習與回饋及學生獨立練習等；（二）交互教學：係指由 Palincsar 與 Brown（1984）所發展教學模式及相關概念延伸教學取徑，如告知學習策略教學（Paris, Cross, & Lipson, 1984）；（三）合作學習：係指學生透過分組及小組成員互動過程，以達成教學目標的學習方法，其合作模式如共同學習法、學生小組成就區分法等；（四）引起動機：係指該研究顯著有別於其他教學取徑者，雖涉及不同閱讀策略教學，然可引起學生學習動機為共同核心之一，包含：說（讀）故事、分享式閱讀、概念取向閱讀教學等；（五）文本重複閱讀：係指學生透過重複或長時間持續性閱讀方式，以提升自我閱讀理解，如持續靜讀、相同文本重複閱讀等；（六）電腦輔助：係指教師透過電腦或科技工具以進行閱讀理解教學取徑；（七）其他：係指其他未能分類於上述閱讀理解教學取徑者，如全語言教學、建構式教學等。以閱讀理解策略類型進行分類時，在考量理論可融合性及研究數量下，依據策略多寡、理論（品牌）來源等，歸類如下的策略類型，簡要說明之：（一）預測：針對個別預測策略進行實驗教學，為教師指導學生運用有關文本的背景知識，就閱讀內容產生預期與驗證推測策

(9)

略教學過程；（二）提問：針對個別提問策略進行實驗教學，而提問為透過問題作為策略教學核心，其內涵包含如問題─答案關係（Raphael, 1986）、自我發問（King, 1994）、質問作者（Beck & McKeown, 2006）等；（三）文本結構分析：透過文本架構元素與組織的教學，指導學生瞭解不同類型文本內容，包含故事結構（Rumelhart, 1975）、圖形組織、前導組織或概念構圖，如吳裕聖（2007）的研究等；（四）摘要與畫重點：嘗試教導學生連結自身背景知識與文本內容，以擷取重點、經整合、組織形成文本重要大意的過程；（五）交互教學慣用多元策略：該研究針對交互教學慣用的預測、提問、摘要與澄清等多元策略進行的實驗教學；（六）有特定理論品牌的多元策略：該研究針對特定理論品牌的多元閱讀策略進行實驗教學，如 SQ3R （瀏覽、提問、閱讀、記誦、複習）策略；（七）無特定理論品牌多元策略：該研究未針對特定理論品牌的多元閱讀策略進行實驗教學，如郭玥妦（2009）的閱讀策略教學是納入預測、提問、偵錯、重點畫線、概念圖、摘要、推論等策略；（八）未具體說明之閱讀策略或其他：該研究未具體說明使用之閱讀策略或無法歸類上述之其他者。有關實驗設計，研究者區分為參與者隨機分派、前測校正及其他。就參與者隨機分派而言，包含以參與者個體或群體進行隨機分派，而此類別相當 Slavin 等（2009）的隨機準實驗（randomized quasi-experiment）。有關前測校正，包含參與者隨機分派之迴歸─不連續設計（regression discontinuity design）與依前測表現結果進行統計校正，其概念類似於 Slavin 等人所稱配對設計（matched design）。最後，有關其他設計，包含如未符合上述條件，僅分別針對前、後測進行顯著差異檢測者、單純主觀選取參與者背景類似者進行配對等。有關個別研究品質評估，其取徑有兩類：一是依照評量工具來源，另一則採用修訂 WWC （2017）的建議評估機制。就評量工具來源，分為引用現成標準化評量工具與研究者自編或修訂。Slavin（2008）認為標準化評量工具較實驗者發展的評量工具為佳，原因在於後者的評量內容往往會配合實驗教學中教學者教導範疇，如此較不利於控制組學生，易產生實驗教學偏誤。就修訂 WWC 的建議評估機制，可分為符合標準、保守符合標準、不符合標準等，其評估指標包含前測表現基準均等程度、參與者流失率等，其中，均等程度可細分為均等、保守均等及不均等，若兩群體前測表現差異效果量在 0.05 以下，或界於 0.05～0.25 且採用統計校正分析者，則視為均等；保守均等係指兩群體前測表現差異效果量界於 0.05～0.25 或 0.25 ～0.5 且採用統計校正分析者；不均等係指差異效果量超過 0.5 抑或是界於 0.25～0.5 且未採用任何統計校正分析者。此外，參與者流失率則參考 WWC 的建議，區分為無參與者流失、整體參與者流失比率高於 50%或兩群組參與者流失差異比率高於 10%者，視為高參與者流失。最後，低於上述百分比者，則視為低參與者流失率。本研究採用的評估機制如圖 1 所示，以符合標準之個別研究為例，其多具有均等的前測表現基準及無（或低）參與者流失率。

(10)

圖1. 個別研究品質評估機制

四、效果量計算與統合分析

有關實驗教學效果量計算，本研究採用標準化平均數差異效果量（standardized mean difference），公式為 Hedges（1981）的不偏 g 效果量，而在考量不同文獻提供訊息具相當落差，其公式會有些許差異，但大致可分為共變項（或前測）校正分數（covariate adjusted score）與原始分數（raw score）等量尺（謝進昌，2012）。就共變項（或前測）校正分數而言，其效果量計算如公式一： 1 2 ₁ 2 ′ ′ − ′ = G G − XY pooled Y Y Y g r SD （公式一）其中，Y′G1為經共變項校正的實驗組平均數、Y′G2為經共變項校正的對照組平均數、共變項校正分數整合標準差 pooled Y SD ′ ，同時，rXY2 為共變項與依變項相關係數平方值。此外，就原始分數效果量（或稱後測平均數差異效果量）可發現，其與前者差異除了採用原始（實驗、對照組）後測平均數及其整合標準差外，最大不同在於 2 XY r ，若研究者假設共變項（或前測）、後測相關係數為 0 時，兩者效果量計算公式可謂結構雷同，但就實務經驗而言，該相關係數值往往不等於 0，因此，本研究以該篇研究有提供相關係數者，經統合後進行補插，其值為 0.77。此外，該研究未提供前述閱讀理解整體表現數據，本研究就研究所提供子評量（multiple outcome）或子群體（independent subgroup within a study）數據，依照 Borenstein、Hedges、 Higgins與 Rothstein（2009, p. 215）的建議進行效果量計算，以避免參與者人數重複計算問題。高高低低保守均等均等不均等參與者流失率（整體流失與組別流失差異比率）符合標準保守符合標準不符合標準兩群體前測表現基準均等程度

(11)

就統合分析而言，本研究以變異數倒數作為個別研究加權值（ Marín-Martínez & Sánchez-Meca, 2010），以及 Viechtbauer 與 Cheung（2010）的建議策略進行影響值（influential case）檢測。此外，依照 Q 統計量，以及 Higgins 與 Thompson（2002）提出I2指標進行研究間效果量異質性評估，其中，研究者認為本研究納入閱讀實驗教學成效屬於一分配型態，並未有一固定教學效果值，因此，在針對類別變項進行虛擬建檔（dummy coding）與資料整理後，採用混合效果模式進行調節變項分析，後續再利用漏斗圖（funnel plot）（Light & Pillemer, 1984）及以漏斗圖為基礎所發展的 trim 與 fill 方法（Duval & Tweedie, 2000）評估可能因出版偏誤所導致的缺失研究與效果量影響。最後，使用軟體為 R 界面下，以 Viechtbauer（2019）開發的 metafor 套件進行相關統合分析程序。

肆、結果與討論

一、國內促進中文閱讀理解教學研究概況

經納入及排除準則進行文獻篩選，本研究計獲得 173 篇文獻並進行資料建檔，其中，由於單篇文獻可能有超過一個以上比較研究數，如魏筱珊（2011）同時提供一般學生、低閱讀理解者之教學結果，因此，某些研究背景特徵的比較研究數會超過總文獻數量，分布概況如表 1 所示。就文獻出版年代而言，限於文獻資料繁多，拉長研究期限，無法即時更新至最近日期，據此，本研究現行獲得文獻出版時間介於 1989～2011 年，可明顯觀察隨著年代演進，文獻數量亦隨之上升，顯示中文閱讀教學實驗研究逐漸受到國內研究者重視。此外，本研究所納入的文獻，以未出版博、碩士論文居多，可能反映出研究品質或源自文獻類型不均衡之影響，對此，本研究後續將採透過出版偏誤與其他研究品質指標檢核以評估其影響。表 1 本研究納入文獻分布概況研究背景特徵、大分類與細項研究數研究背景特徵、大分類與細項研究數出版年代出版類型 1989 1 期刊 6 1990～1995 14 已出版論文轉投期刊 22 1996～2000 15 博士論文 6 2001～2005 32 未出版 Ref.a _{碩士論文 139} 2006～2010 78 2011 33 （續）

(12)

186 閱讀理解量化研究統合謝進昌表 1 本研究納入文獻分布概況（續）研究背景特徵、大分類與細項研究數研究背景特徵、大分類與細項研究數教學取徑實驗教學總時間（分鐘）直接教學直接教學 46 640分鐘（不含）以下 64 Ref. 引導閱讀與思考活動 2 640分鐘（含）至800分鐘 25 交互教學及其修訂 34 800分鐘（含）至960分鐘 35 交互教學告知學習策略教學 4 960分鐘（含）至1,120分鐘 19 交互轉化策略教學 1 1,120分鐘（含）至1,280分鐘 9 同儕協助學習策略 2 1,280分鐘（含）以上 19 合作閱讀教學策略 1 NAb 未說明 2 合作統整閱讀寫作法 3 閱讀與寫作整合教學 1 _{教學者身分} （非品牌） Ref. 非研究者 11 學生小組成就區分法 7 研究者 146 改良式拼圖 1 電腦輔助 6 共同學習法 1 NA 無法判斷 10 同儕合作（非品牌） 3 融合多種品牌合作學習 11 參與者學習階段非特定品牌合作協同 17 Ref. 學前幼兒 1 合作學習（網路）讀書會 6 國小低年級 25 教師朗讀、說（讀）故事、 10 國小中年級 45 分享式閱讀、可預測書、國小高年級 84 引起動機概念取向閱讀教學國中 19 文本重複閱讀、靜讀、廣泛 7 高中職以上 4 閱讀、學生朗讀、晨讀、文本重複閱讀讀報教育實驗設計電腦輔助電腦或資訊科技融入 11 隨機分派個體隨機分派 5 其他批判思考閱讀教學、建構式 Ref. 群體隨機分派 50 教學、全語言教學、專題式 10 前測樣本隨機分派之迴歸 11 學習與閱讀教學、自我調整 ─不連續設計閱讀理解教學、其他校正依前測進行統計校正 82 其他分別針對前後測進行差異 25 檢測、主觀選取類似背景進行配對等（續）

(13)

謝進昌閱讀理解量化研究統合 187 表 1 本研究納入文獻分布概況（續）研究背景特徵、大分類與細項研究數研究背景特徵、大分類與細項研究數促進理解的閱讀策略參與者類型預測預測 3 Ref. 一般生 158 問題─答案關係策略 5 低成就（含閱讀障礙） 11 提問Ref. 自我提問 8 特殊生 5 質問作者 1 提問（無品牌） 3 類WWC研究品質評估文本結構分析 2 符合標準 44 故事結構分析 11 保守符合標準 97 文本結構分析圖形組織 28 Ref. 不符合標準 32 6 摘要與畫重點摘要畫重點 1 評量工具來源交互教學交互教學涉及閱讀策略 36 研究者自編或修訂 93 有品牌有品牌多元閱讀策略 11 Ref. 引用現成評量工具 82 多元策略無品牌融合多種閱讀策略 38 延宕施測週數多元策略（無品牌） 4週（含）內 34 非特定非特定（或具體說明）閱讀 15 4～8週（含） 12 策略 8～12週（含） 1 閱讀策略其他 12 a_{執行統合迴歸分析時，針對該類別變項進行虛擬變項建檔轉換之參照水平；}b_{執行統合迴歸分析} 時，視為缺失值，不計入調節變項分析。在教學背景特徵方面，教學取徑最多的是採用合作學習相關取徑（54 個），而以閱讀理解策略使用而言，以涉及文本結構分析策略最多（41 個），此外，各實驗研究教學時間，自八週（每週兩節）640 分鐘至 16 週（每週兩節）1,280 分鐘不等，而 173 筆研究中，有 47 筆另提供延宕教學實驗效果，其延宕時間以四週（含）內占多數，計有 34 個。教學者身分以研究者本身即教學者占多數，計有 146 個，進一步分析，此現象反映博、碩士論文教學者，多由研究者自身擔任現況，然是否會因研究者自身期望而造成教學偏差，仍待分析。在參與者背景特徵方面，研究者最常探討國小學生閱讀教學實驗成效，尤以高年級學生占最多，計有 84 筆，而此現況也雷同過往國內、外閱讀策略實驗教學成效統合研究結果（連啟舜，2002；Davis, 2010），顯示學生早期閱讀發展與教學較受到多數學者關注。就參與者類型而言，本研究納入較多一般學生為標的的研究，計有 158 筆，其次為低成就（11 筆）、特殊生（5 筆）。

(14)

188 閱讀理解量化研究統合謝進昌就研究品質評估指標方面，本研究區分實驗研究設計、評量工具來源及修訂 WWC（2017）的評估機制，就第一種指標而言，最多是依前測進行統計校正（82 筆），其次為以群體進行隨機分派（50 筆）；就第二種指標而言，研究者自編或修訂的評量工具，計有 93 筆，而使用現成評量工具者，計有 82 筆；就第三種指標而言，多數研究是被判定為保守符合標準，計有 97 筆，其次為符合標準，計有 44 筆。整體而言，本研究納入的研究多能涵蓋大部分重要水平類別，然某些研究數較少之類別，在考量類別同質性與後續調節變項分析穩定性後，予以進行合併，再進行分析。

二、促進中文閱讀理解教學統合成效

為回應待答問題一，以下分別就立即、延宕效果進行探討，結果如表 2 所示。進而輔助以漏斗圖及以漏斗圖為基礎所發展的 trim 與 fill 方法，檢定可能出版偏誤的影響。表 2 本研究閱讀理解實驗教學立即及延宕統合結果 95% CI 類別 k Hedges’s g p g _{LL UL}Q（T） pQ T( ) I2 立即後測（全部） 173 0.47 ＜.0001 0.41 0.52 700.7 ＜.0001 76 立即後測─刪除影響值 168 0.43 ＜.0001 0.38 0.47 504.2 ＜.0001 67 延宕後測（全部） 47 0.45 ＜.0001 0.31 0.59 306.8 ＜.0001 85 延宕後測─刪除影響值 46 0.39 ＜.0001 0.29 0.50 154.1 ＜.0001 71 註：k＝總研究數；pg＝整體平均效果量顯著考驗；CI＝整體平均效果量信賴區間；LL＝整體平均效果量最下限；UL＝整體平均效果量最上限；Q（T）＝全部異質性評估值；pQ＝Q（T）值的顯著考驗；_I2_{＝Higgins 與 Thompson（2002）的異質性評估值。} 就國內閱讀理解實驗教學的立即效果而言，本研究總計統合了 173 筆研究，參與實驗教學組者計有 6,457 位，參與對照組者計有 5,707 位，全部總計 12,164 位，經利用隨機效果模式進行統合分析，整體平均效果量為 0.47，95% CI 介於 0.41～0.52，屬於 Cohen（1992）建議的近中等效果量，此外，就檢定 Q（T）值與_I2_{，顯示在可能機運因素外，各研究間效果量仍存} 在某些異質性，進而，利用 Viechtbauer 與 Cheung（2010）的檢核指標，在統合研究中線性迴歸分析框架檢定出兼具極端與影響值者，經分析，發現五個潛在影響值，分別是程炳林（1995）（g＝2.21）、吳潔蓉（2010）（g＝1.71）、許慧君（2011）（g＝1.86）、林容妃（2005）（g＝1.52）及吳庭耀（2009）（g＝1.67），經刪除，整體平均效果量降為 0.43，仍屬於近中等教學成效，然而，異質性評估指標呈現大幅度的下降，Q（T）值減少 196.5，成為 504.2，而_I2_{則降為 67，} 呈現顯著改善。

(15)

謝進昌閱讀理解量化研究統合 189 就國內閱讀理解實驗教學延宕效果而言，本研究總計統合了 46 筆研究，參與實驗教學組者計有 1,345 位，參與對照組者計有 1,200 位，全部總計有 2,545 位，經利用隨機效果模式進行統合分析，整體延宕平均效果量為 0.45，屬於近中等教學成效，同樣，就 Q（T）值與_I2_分析結果，仍顯示各研究間延宕效果量存在某些異質性，經檢定影響值，發現存在一個潛在影響值，為程炳林（1995）（g＝2.50），經刪除再進行統合分析，整體平均延宕效果量降為 0.39，然而，異質性評估 Q（T）值減少 152.7，呈現大幅度下降，而_I2_{則降為 71。} 整體而言，本研究檢定影響值後，發現僅有極少數影響值，經刪除再進行統合分析，不論立即或延宕效果，整體平均效果量皆維持近中等教學成效，大致雷同於過去王玳雅（2013）、連啟舜（2002）、謝進昌（2015）等人以不同角度對於閱讀教學的統合結果，然而，考量不同研究間異質性出現大幅度顯著改善，據此，後續刪除影響值之研究數，進行調節變項分析與檢定。另一方面，就出版偏誤可能影響而言，立即、延宕效果量之漏斗圖分布分別如圖 2 及圖 3 所示，除了極少數較偏離外，大致仍維持兩側均衡對稱分布，進一步以 trim 與 fill方法進行檢核，分析結果亦未發現任何待補插潛在缺失值，顯示潛在出版偏誤對於本研究影響可暫時予以忽略。圖2. 立即效果量漏斗圖分布 1.5 1 0.5 0 -0.5 效果量 0.42 0.32 0.21 0.1 1 0 效果量標準誤

(16)

190 閱讀理解量化研究統合謝進昌圖3. 延宕效果量漏斗圖分布

三、影響中文閱讀理解教學成效之調節變項分析結果

為回應待答問題二、三，以下就個別調節變項及同時投入多元調節變項，進行探討。

（一）個別調節變項分析

回應研究待答問題二，就個別調節變項逐一分析，依文獻出版類型、教學背景及參與者背景特徵、研究品質評估指標等進行說明，結果如表 3 所示。就文獻出版類型檢定，某些為呼應 Glass、McGaw 與 Smith（1981）對於出版偏誤評估建議，結果顯示，出版的實驗教學研究效果，並未顯著高於未出版類型實驗教學研究，其迴歸係數為 0.05（ pβ＝ .48），結果雷同於本研究前述的發現，可暫時忽略出版偏誤對於本研究的可能影響。表 3 個別調節變項逐一分析結果 95% CI 類別 β SEβ pβ LL UL Q（E） pQ E( ) Q（M）pQ M( ) I2 R2 出版類型截距出版 .4200 .0500 .03 .07 ＜.0100 .4800 0.37 -0.08 0.47 0.17 503.9 ＜.01 00.49 .480 67 − （續） 1.5 1 0.5 0 -0.5 效果量 0.33 0.25 0.17 0.08 0 效果量標準誤

(17)

謝進昌閱讀理解量化研究統合 191 表 3 個別調節變項逐一分析結果（續） 95% CI 類別 β SEβ pβ LL UL Q（E） pQ E( ) Q（M）pQ M( ) I2 R2 截距 .4500 .05 ＜.0100 0.36 0.54 交互教學 -.0400 .07 .5700 -0.18 0.10 合作協同 -.0100 .06 .9100 -0.13 0.11 引起動機 .0500 .12 .6500 -0.17 0.28 文本重複閱讀 -.4200 .13 ＜.0100 -0.68 -0.15 其他教學 -.0100 .12 .9600 -0.24 0.23 教學取徑電腦資訊融入 .0005 .10 .9900 -0.20 0.20 499.3 ＜.01 11.00 .090 67 1.40 截距 .4900 .09 ＜.0100 0.32 0.66 預測 .7300 .23 ＜.0100 0.28 1.18 文本結構 -.1100 .10 .2500 -0.31 0.08 摘要與重點 -.1900 .16 .2300 -0.51 0.12 交互教學類 -.0600 .10 .5500 -0.26 0.14 有品牌多元策略 -.0900 .13 .4800 -0.34 0.16 無品牌多元策略 -.0200 .10 .8300 -0.22 0.17 促進理解的閱讀策略其他 -.1200 .10 .2700 -0.32 0.09 512.0 ＜.01 17.70 .010 68 5.17 截距 .4800 .05 ＜.0100 0.39 0.56 教學時間教學時間 -.0200 .01 .1700 -0.05 0.01 499.1 ＜.01 1.90 .170 67 − 截距 .4100 .10 ＜.0100 0.22 0.60 教學者 _{研究者 .03}00 .10 .7400 -0.16 0.23 473.2 ＜.01 0.11 .740 68 − 截距 .4100 .02 ＜.0100 0.36 0.45 低成就 .1600 .12 .1800 -0.07 0.40 參與者類型 _{特殊生 .52}₀₀_.15_＜.01₀₀_0.22 _0.83 491.0 ＜.01 13.20 .010 66 3.53 截距 .4200 .06 ＜.0100 0.30 0.54 國小中年級 -.0030 .08 .9700 -0.15 0.15 國小高年級 -.0300 .07 .6800 -0.17 0.11 國中 -.2300 .10 .0200 -0.04 0.42 參與者學習階段高中職（以上） -.1000 .15 .5200 -0.40 0.20 489.0 ＜.01 10.70 .030 66 4.08 （續）

(18)

192 閱讀理解量化研究統合謝進昌表 3 個別調節變項逐一分析結果（續） 95% CI 類別 β SEβ pβ LL UL Q（E） pQ E( ) Q（M）pQ M( ) I2 R2 截距 -.4200 .04 ＜.0100 -0.34 0.50 前測校正 -.0300 .05 .5900 -0.13 0.07 實驗設計其他 -.1700 .08 .0400 -0.01 0.33 487.0 ＜.01 6.50 .04 66 2.87 截距 -.3700 .03 ＜.0100 -0.30 0.43 評量工具研究者自編 -.1200 .05 .0100 -0.02 0.21 488.7 ＜.01 6.20 .01 66 4.53 截距 .5600 .06 ＜.0100 0.44 0.67 保守符合標準 -.1100 .07 .1300 -0.26 0.03 品質評估符合標準 -.1800 .07 .0100 -0.31 -0.05 483.3 ＜.01 7.30 .03 66 3.81 截距 .4700 .10 ＜.0100 0.27 0.67 延宕施測時間延宕施測時間 -.0100 .02 .7300 -0.05 0.04 122.3 ＜.01 0.12 .73 64 − 註：β＝迴歸係數；SEβ＝迴歸係數標準誤；pβ＝迴歸係數顯著考驗；CI＝迴歸係數信賴區間；LL ＝迴歸係數最下限；UL＝迴歸係數最上限；Q（E）、pQ E( )＝組內異質性評估值及其顯著考驗；Q （M）、pQ M( )＝組間異質性評估值及其顯著考驗；I2＝Higgins 與 Thompson（2002）的異質性評估；_R2_{＝整體解釋變異量。} 就教學背景特徵而言，除了文本重複閱讀（β＝-.42, pβ＜ .01）外，其餘教學取徑皆雷同直接教學，具有近中等教學效果，其中，文本重複閱讀成效為 0.45−0.42＝0.03，出現未顯著教學成效，而教學取徑整體解釋量為 1.4%，回顧過去文獻結果，此點是略不同於連啟舜（2002）發現合作學習較直接教學具有相對較高的教學成效，然而，由於連啟舜當時僅納入六個合作學習相關的比較研究，相對於本研究的 54 筆比較研究，兩者分析穩定性具有差異性。此外，就文本重複閱讀，有別於過去國外統合結果，Therrien（2004）發現重複閱讀對於閱讀流暢性與理解，具有顯著教學統合成效，然而，Therrien 結論所指稱重複閱讀教學（repeated reading）重點在於學生是否被教導與習得來回多遍檢視及閱讀文本以促進整體有意義理解的策略，而此點不同於國內如晨讀、讀報教育或相同文本重複閱讀等研究的教學重點。以促進理解的閱讀策略而言，除了使用預測策略的教學研究（β＝ .73, pβ＜ .01）外，其餘策略皆雷同於提問策略，具有中等教學效果，其中，使用預測策略的研究，其統合教學成效可高達 0.49＋0.73＝1.22，屬於高度教學效果，其解釋量達 5.17%。此外，在檢視教學時間長短、教學者類型或延宕施測時間長短方面，結果顯示迴歸係數 β 分別為-.02（ pβ＝ .17）、 .03 （ pβ＝ .74）、-.01（ pβ＝ .73），皆未達顯著，反映出不論教學時間長短、教學者是否為研究者或延宕時間長短，皆未顯著影響教學成效，此結果降低了 Slavin（2008）認為教學時間未滿 12週及 WWC（2017）認為研究者同時為教學者時，可能對教學成效產生差異影響疑慮。

(19)

謝進昌閱讀理解量化研究統合 193 就參與者背景特徵而言，結果隱約顯示弱勢學生是較一般學生具有較高的教學成效，其中，以特殊生迴歸係數 β 值 .52（ pβ＜ .01）達到顯著水準，顯示弱勢學生原有表現基準較低，具有更大的教學進步彈性空間；此外，就參與者年級階段，結果顯示參與者為國中生，具有顯著較高的教學成效（β＝ .23, pβ＝ .02）。整體而言，此結果大致雷同於過去閱讀教學的統合結果（連啟舜，2002）。就實驗教學研究設計而言，結果顯示其他的研究設計具有較高的教學成效，迴歸係數 β 值為 .17（ pβ＝ .04），然而，隨機分派並未與前測校正設計產生顯著差異效果量，而在回顧

如 Cheung 與 Slavin（2016）、De Boer 等（2014）、Slavin 等（2009）的研究，發現過去研究結果彼此也並未具一致共識發現，對此，研究者認為實驗研究設計可能不是造成效果量差異的主因，其影響應是來自於效果量計算量尺類型的選擇差異。對此，進一步說明過去多數國內、外統合研究對於效果量計算，不論其實驗研究設計為何，往往皆統一使用（實驗 vs.控制組）後測原始平均數差異進行效果量計算（即謝進昌（2012）所稱的原始量尺效果量），然而，原始量尺效果量多僅適用於參與者隨機分派設計（或實驗與對照組前測表現基準實質相同者），並不適合使用以校正前測表現之設計（如使用共變數分析研究），其因在於若參照本研究效果量計算公式一，可發現此舉在計算效果量時，不僅忽略（校正）前測表現基準的不一致，也忽略了前後測相關性，致使高估該類設計之教學效果量，而此點也能解釋本研究所發現，其他設計的平均效果量是高於參與者隨機分派，以前測校正的設計，因為其他設計的文獻往往屬於未提供前測表現資料（或使用校正前測的統計方法），也未能提供兩組別參與者是否表現基準均等的訊息，致使易產生較高的平均效果量。就修訂 WWC 的研究品質評估指標而言，其發現也呼應上述結果（如表 3），較不符合標準研究平均效果量，顯著來得低（β＝-.18, pβ＝ .01），使得符合標準研究整體平均效果量變為 0.56−0.18＝0.38，其因在於大部分被歸類為其他研究設計者，除非其兩組別前測平均表現差異低，參與者流失率低，否則多可能被判訂為不符合標準。最後，就評量工具來源而言，使用研究者自編評量工具的教學效果，顯著高於使用既有的標準化評量工具，迴歸係數 β 值為 .12（ pβ＝ .01），而此結果與多數國外統合研究文獻的發現一致（Davis, 2010; Wanzek et

al., 2010），其中，根據 Slavin 與 Madden（2011）的觀點，其原因在於評量工具是否與教學介入內容存在相關性。由於研究者自編的評量工具，其內容與實驗教學內容相關性往往較使用標準化評量工具來得大，若加諸教學內容並未同步教導於控制組時，就容易產生此現象。 Slavin 與 Madden 發現若評量內容（content）僅教授於實驗組而非對照組（treatment inherent measures），抑或是評量內容皆均衡教授於實驗、對照組（treatment independent measures），其產生的平均教學效果，兩者會產生顯著差異性。在研究者未教導對照組學生相應的評量內容下，若實驗介入主題是以教學方法（instruction based）為主軸，而非以課程內容為主軸（curriculum based）時，即易產生評量涉及內容教學的不均衡現象。

(20)

（二）多元調節變項分析

回應待答問題三，進行多元調節變項，研究者在考量不論是以閱讀教學取徑或促進理解的閱讀策略進行分類，某些可能存在重疊性，例如，交互教學取徑幾乎就是採用預測、理解、摘要與澄清四種特定策略，若將此兩變項同時投入分析，易造成共線性疑慮，因此，各自於表 4 與表 5 進行分析；此外，以實驗研究設計與以類 WWC 的研究品質評估進行分類結果，也存在重疊性，考量被歸類為「其他」設計者多為未符合標準品質，據此，在此僅二擇一，投入實驗研究設計進行控制。以下分析結果僅就上述兩主軸，分別進行多元調節變項分析與說明。表 4 同時投入多元調節變項分析（以教學取徑為主軸） 95%CI 類別 β SEβ pβ LL UL Q（E） pQ E( ) Q（M） pQ M( ) 2 I _R2 截距 .35 .14 .01 0.0700 0.63 教學取徑─交互教學 .05 .08 .54 -0.1000 0.19 教學取徑─合作協同 .11 .07 .08 -0.0200 0.24 教學取徑─引起動機 .16 .13 .19 -0.0800 0.41 教學取徑─文本重複閱讀 -.40 .18 .02 -0.7500 -0.05 教學取徑─其他 .05 .15 .76 -0.2500 0.34 教學取徑─電腦資訊融入 .19 .14 .17 -0.0800 0.45 文獻類型─已出版 .01 .08 .92 -0.1400 0.16 教學時間 -.01 .02 .41 -0.0400 0.02 教學者─研究者 .04 .10 .72 -0.1600 0.23 參與者─低成就 .23 .16 .15 -0.0800 0.53 參與者─特殊生 .36 .18 .04 0.0100 0.71 參與者─國小中年級 -.02 .09 .81 -0.1900 0.15 參與者─國小高年級 -.05 .08 .51 -0.2200 0.11 參與者─國中 .14 .12 .27 -0.1000 0.38 參與者─高中職（以上） -.13 .16 .42 -0.4500 0.19 評量工具─研究者自編 .10 .05 .05 -0.0003 0.20 實驗設計─前測校正 -.05 .06 .35 -0.1600 0.06 368.4 ＜.01 42.6 ＜.01 64 12.75 實驗設計─其他 .20 .10 .04 0.0100 0.39 註：β＝迴歸係數； SEβ＝迴歸係數標準誤； pβ＝迴歸係數顯著考驗；CI＝迴歸係數信賴區間；LL ＝迴歸係數最下限；UL＝迴歸係數最上限；Q（E）、pQ E( )＝組內異質性評估值及其顯著考驗；Q （M）、pQ M( )＝組間異質性評估值及其顯著考驗；I2＝Higgins 與 Thompson（2002）的異質性評估；_R2_{＝整體解釋變異量。}

(21)

謝進昌閱讀理解量化研究統合 ₁₉₅ 表 5 同時投入多元調節變項分析（以促進理解策略主軸） 95%CI 類別 β SEβ pβ LL UL Q（E） pQ E( ) Q（M） pQ M( ) 2 I _R2 截距 .37 .16 .02 0.05 0.68 策略─預測 .55 .27 .04 0.02 1.08 策略─文本結構 -.02 .11 .89 -0.22 0.19 策略─摘要與重點 -.11 .18 .54 -0.47 0.24 策略─交互教學類 .08 .11 .48 -0.14 0.29 策略─有品牌多元策略 -.02 .13 .90 -0.27 0.24 策略─無品牌多元策略 .08 .11 .48 -0.14 0.29 策略─其他 .08 .12 .48 -0.15 0.31 文獻類型─已出版 -.01 .08 .87 -0.17 0.14 教學時間 -.02 .02 .24 -0.05 0.01 教學者─研究者 .03 .10 .79 -0.17 0.22 參與者─低成就 .18 .16 .27 -0.14 0.49 參與者─特殊生 .12 .20 .50 -0.26 0.52 參與者─國小中年級 .02 .08 .68 -0.13 0.20 參與者─國小高年級 -.02 .08 .85 -0.17 0.14 參與者─國中 .16 .12 .20 -0.09 0.40 參與者─高中職（以上） -.15 .17 .38 -0.47 0.18 評量工具─研究者自編 .09 .05 .07 -0.01 0.20 實驗設計─前測校正 -.05 .06 .35 -0.17 0.06 實驗設計─其他 .15 .10 .11 -0.03 0.34 369.9 ＜.01 37.1 .01 64 9.34 註：β＝迴歸係數； SEβ＝迴歸係數標準誤； pβ＝迴歸係數顯著考驗；CI＝迴歸係數信賴區間；LL ＝迴歸係數最下限；UL＝迴歸係數最上限；Q（E）、pQ E( )＝組內異質性評估值及其顯著考驗；Q （M）、pQ M( )＝組間異質性評估值及其顯著考驗；I2＝Higgins 與 Thompson（2002）的異質性評估；_R2_{＝整體解釋變異量。} 以教學取徑為主軸進行多元調節變項分析結果如表 4 所示，在同時考量文獻出版類型、教學時間長短、參與者背景特徵與實驗研究設計等因子下，直接教學取徑效果為 0.35，同樣具備顯著教學效果，為介於小至中等的平均教學效果量，其中，文本重複閱讀相對於直接教學，出現顯著較低的教學成效（β＝-.40, pβ＝ .02），此外，參與者為特殊生則顯示相對（一般生）較高教學成效（β＝ .36, pβ＝ .04）；另一方面，在評估研究品質指標時，發現使用研究者自編的評量工具亦顯示相對（引用現成評量工具）有顯著較高的教學差異效果（β＝ .10,

(22)

196 閱讀理解量化研究統合謝進昌 pβ＝ .05），使用其他實驗研究設計者，則出現相對（參與者隨機分派設計）較高教學效果（β＝ .20, pβ＝ .04），不論是個別投入分析（如表 3），抑或是同時（考量其他因子）共同投入分析（如表 4）實驗設計、評量工具來源之影響，皆顯示出此二因子具備教學效果影響力，而整體解釋變異量達 12.75%。以促進理解的閱讀策略為主軸進行多元調節變項的分析結果（如表 5），在同時考量文獻出版類型、教學時間長短、參與者背景特徵、實驗研究設計等因子下，提問策略教學效果為 0.37，達顯著水準，為介於小至中等的平均教學效果，其中，以使用預測策略之研究具有顯著相對（提問策略）較高的教學成效（β＝ .55, pβ＝ .04），然而，策略：其他分析結果則未顯示出差異教學效果，此外，在檢視其他如參與者背景、評量工具來源、實驗研究設計，同樣亦顯示出未具顯著差異結果，此點有別於以教學取徑為主軸的分析結果，似乎顯示在控制其他影響因子下，以教學取徑為調節變項分類主軸，較（以策略為分類主軸）能區別出其下不同水平之教學效果差異，而此點也能從表 4 整體解釋變異量由 12.75%降低至表 5 的 9.34%看出，顯示不同理解策略教學效果，彼此區別性差異相對較小，推測其原因在於不同理解策略間，具有一定程度的理論重疊性，例如，文本結構（如繪製概念圖）與摘要策略教學同樣具有協助學生發展文本整體性理解效果，而交互教學所納入的策略是同時包含有摘要、預測、提問等策略。

伍、結論與建議

統合研究結果除了能給予過去某主題暫時性的整合結果外，其優點在於透過調節變項分析，探討一般實驗教學研究所未能觸及的因子與評估其影響力，提供未來再研究基礎。整體而言，統合研究兼具回顧性與前瞻性研究功能。然而，過去往往受限於研究數目，較易忽視具前瞻性調節變項分析，據此，本研究以此為主軸進行探討，提出幾點結論與建議。

一、結論

就整體教學效果而言，不論立即或延宕效果，本研究發現閱讀教學整體平均效果量皆維持近中等教學成效，此外，在同時考量出版偏誤、教學者教學偏差、教學時間長短與研究品質等影響因素下，本研究發現除文本重複閱讀外，國內閱讀教學取徑、策略，包含合作協同、交互教學、抑或是引起動機後，教導學生預測、提問、摘要、故事結構分析、圖形組織繪製等策略，多數是具有 Cohen（1992）認為的界於中等至小程度教學成效，能有效促進不同學習階段學生的閱讀理解，此點大多符合美國閱讀研究小組（NICHD, 2002）所建議的教學取徑與策略，值得未來實務教學現場推廣。本研究發現學生文本重複閱讀（包含如晨讀、靜讀等）並未產生顯著教學成效，略不同於 Therrien（2004）的統合研究發現，若細究國內文本重複閱讀研究，多是學生針對文本內容

(23)

謝進昌閱讀理解量化研究統合 197 重複或長時間持續靜讀為主，較少伴隨教導學生適合的理解策略，如洪采菱（2008）的實驗研究，然而，Therrien 的統合研究建議可透過暗示學生聚焦內容的理解、或針對錯誤，教師提供回饋、設定熟練標準等，以使學生在靜讀時，能習得促進有意義理解的策略，推測此點可能是造成本研究與相關重複閱讀教學統合研究結果差異之因，值得未來閱讀教學研究者參考。就其他調節變項而言，本研究發現教學者是否為研究者、教學時間長短與延宕時間長短，並不會對閱讀教學效果產生顯著調節影響，然而，不同參與者身分（一般生、低成就或特殊生）與學習階段及研究品質（包含實驗設計、評量工具來源、類 WWC 的品質評估機制等）則會對閱讀教學出現顯著差異影響，代表教學成效會隨著參與者背景特徵與研究品質落差而有所影響，此點值得未來統合研究者於推動自身統合研究參考。在同時控制相同影響因素（如參與者背景、研究品質）時，本研究比較表 4 與表 5 的結果，發現「以教學取徑為分類主軸」較「以理解策略為分類主軸」具有較大的解釋變異量，顯示以不同理解策略作為調節變項，彼此內區別性差異相對較小，此點值得未來統合研究者在選擇與界定調節變項時參考。

二、建議

本研究發現參與者為特殊生具有較高閱讀教學成效，然而，礙於參與者為特殊生者，多數可能採用單一受試者研究設計，其效果量計算途徑不同於本研究，致使本研究並未能完整呈現以特殊生為標的的統合結果，建議未來可考慮以特殊生為標的，同時並列不同研究設計統合結果，以深入探討閱讀教學對於該類群學生的教學效果與因子影響力。本研究結果發現，不同實驗研究設計對於教學成效具顯著解釋力，尤其是被歸類為「實驗設計：其他」者，具有偏高平均效果量，細究其原因似乎在於效果量計算量尺（原始分數量尺、或校正共變項分數量尺）選擇，考量多數過去統合研究，不論原始個別研究實驗設計為何，皆傾向統一以原始分數量尺效果量為計算標的，然此舉易導致計算效果量時忽略兩組別前測表現不均等、與前、後測相關等，加諸被歸類為「實驗設計：其他」者，往往就是未能確保前測表現均等者，因此，容易錯估（高估）整體平均效果量，然而，不同實驗設計與效果量計算量尺的選擇間，彼此交互影響程度為何，仍有待未來研究進一步探討。近年統合研究關注個別研究品質評估議題，而此點可由 WWC（2017）提出的評估標準及 Slavin（2008）所強調的最佳品質研究證據進行統合（best evidence synthesis）概念一窺端倪，後續也有許多統合研究者針對此議題進行分析，然而，不同研究結果或學者主張，彼此存在些許差異性，WWC 認為參與者是否隨機分派為整個研究品質評估的核心，然而，許多統合研究（含本研究結果）卻指出評量工具來源具有相當一致性的實質影響力，因此，哪些個別研究評估指標才是同時具有理論與實務功能，有待未來研究系統性的探討。

(24)

198 閱讀理解量化研究統合謝進昌本研究已納入高達 173 筆研究量，可謂高出許多，然而，就執行同時多元統合迴歸分析時，若同時考量的因子過多，仍會存在某些類別下研究數量偏少的疑慮，致使影響其分析的穩定性與統計檢定考驗力，加諸本研究在考量編碼負荷與時間、人力成本，並未更新 2012 年之後的研究文獻，使得本研究統合結果有其時近性限制，據此，建議未來研究可逐步更新議題研究數量，以提供更穩定的調節變項分析結果。

誌謝

本研究感謝科技部經費補助（計畫編號：MOST106-2410-H-656-003），以及陳敏瑜、李漢岳等人不辭辛勞協助文獻編碼，使本研究得以順利完成。

(25)

參考文獻

一、中文文獻

王玳雅（2013）。故事結構教學對國小學童閱讀理解能力影響之後設分析（未出版碩士論文）。國立臺北教育大學，臺北市。

【Wang, T.-Y. (2013). The effects of story grammar instruction on reading comprehension for elementary school students in Taiwan: A meta-analysis (Unpublished master’s thesis). National Taipei University of Education, Taipei, Taiwan.】

行政院公報資訊網（2018）。十二年國民基本教育課程綱要國民中小學暨普通型高級中等學校語文領域：國語文。取自 http://gazette2.nat.gov.tw/EG_FileManager/eguploadpub/eg024018/ ch05/type2/gov40/num11/images/BB.pdf

【The Executive Yuan Gazette Online. (2018). The national curriculum of 12-year basic education for elementary and high school: Chinese. Retrieved from http://gazette2.nat.gov.tw/EG_FileManager/eguploadpub/eg024018/ ch05/type2/gov40/num11/images/BB.pdf】

吳庭耀（2009）。比較不同閱讀理解策略對國小中年級低閱讀能力學童在不同文體之閱讀流暢度與閱讀理解表現之差異研究（未出版碩士論文）。國立臺南大學，臺南市。

【Wu, T.-Y. (2009). Comparison research of different reading comprehension strategies toward middle-grade students with low reading skills on reading fluency and comprehension in different text forms (Unpublished master’s thesis). The National Tainan University, Tainan, Taiwan.】

吳潔蓉（2010）。運用交互教學法促進國小學童科學閱讀之成效（未出版碩士論文）。國立臺北教育大學，臺北市。

【Wu, C.-J. (2010). Using reciprocal teaching to improve science reading performance using reciprocal teaching to improve science reading performance (Unpublished master’s thesis). The National Taipei University of Education, Taipei, Taiwan.】

吳裕聖（2007）。鷹架概念構圖教學模式的建立與實施成效研究（未出版博士論文）。國立中正大學，嘉義縣。

【 Wu, Y.-S. (2007). Scaffold-concept-mapping instruction: A model and its effects (Unpublished doctoral dissertation). National Chung Cheng University, Chiayi County, Taiwan.】

林容妃（2005）。兒童科普讀物的閱讀理解教學對國小學童自然科學習之相關研究（未出版碩士論文）。國立臺北師範學院，臺北市。

【Lin, J.-F. (2005). Research on the influence of reading comprehension instructions from children’s science books on pupils’ science learning (Unpublished master’s thesis). National Taipei Teachers College, Taipei, Taiwan.】

柯華葳、幸曼玲、陸怡琮、辜玉旻（2010）。閱讀理解策略教學手冊。臺北市：教育部。

【Ko, H.-W., Shing, M.-L., Lu, I.-C., & Ku, Y.-M. (2010). Reading comprehension strategies instruction manual. Taipei, Taiwan: Ministry of Education.】

洪采菱（2008）。廣泛閱讀與重複閱讀教學法對國小一年級學童識字能力、口語閱讀流暢力及閱讀理解之影響（未出版碩士論文）。國立屏東教育大學，屏東縣。

(26)

reading fluency and comprehension (Unpublished master’s thesis). The National Pingtung University, Pingtung, Taiwan.】

許慧君（2011）。摘要策略教學對國小五年級學童閱讀理解成效之研究（未出版碩士論文）。銘傳大學，臺北市。

【Hsu, H.-C. (2011). The study on the effects of reading comprehension via summary instruction for the fifth graders (Unpublished master’s thesis). Ming Chuan University, Taipei, Taiwan.】

連啟舜（2002）。國內閱讀理解教學研究成效之統合分析研究（未出版碩士論文）。國立臺灣師範大學，臺北市。

【Lien, C.-S. (2002). Meta-analysis of reading comprehension instruction studies’ outcome (Unpublished master’s thesis). National Taiwan Normal University, Taipei, Taiwan.】

郭玥妦（2009）。引導式閱讀策略融入網路讀書會於提升國小五年級閱讀素養成效之研究（未出版碩士論文）。淡江大學，新北市。

【Kuo, Y.-F. (2009). The effects of guided reading strategy into the online reading club on reading literacy for the 5th graders (Unpublished master’s thesis). Tamkang University, New Taipei City, Taiwan.】

陳明蕾（2019）。台灣十年來教師閱讀教學與學生閱讀表現關係之探討：來自 PIRLS 2006、 2011與 2016 的證據。教育心理學報，51（1），51-82。doi:10.6251/bep.201909_51(1).0003

【Chen, M.-L. (2019). The relationship between teacher reading instruction and students’ reading performance in the past ten years of Taiwan: Evidence from PIRLS 2006, 2011 and 2016. Bulletin of Educational Psychology, 51(1), 51-82. doi:10.6251/bep.201909_51(1).0003】

程炳林（1995）。自我調整學習的模式驗證及其教學效果之研究（未出版博士論文）。國立臺灣師範大學，臺北市。

【Cherng, B.-L. (1995). Study of certification of the self-regulated learning model and its instruction effect (Unpublished doctoral dissertation). National Taiwan Normal University, Taipei, Taiwan.】

黃瓊儀（2012）。台灣近十年閱讀障礙學童閱讀理解策略教學成效之後設分析。東臺灣特殊教育學報，14，243-268。

【Huang, C.-Y. (2012). Meta-analysis of reading comprehension instruction studies’ outcome in Taiwan: A quantitative synthesis of single-subject researches. Bulletin of Eastern-Taiwan Special Education, 14, 243-268.】

謝進昌（2012）。不同實驗設計之標準化平均數差異效果量整合探討。屏東教育大學學報，38， 57-92。

【Hsieh, J.-C. (2012). Combining effect size estimates across different experimental designs in meta-analysis. Journal of National Pingtung University Education, 38, 57-92.】

謝進昌（2015）。有效的中文閱讀理解策略：國內實徵研究之最佳證據整合。教育科學研究期刊，60（2），33-77。doi:10.6209/JORIES.2015.60(2).02

【Hsieh, J.-C. (2015). Effective Chinese reading comprehension strategy: Best-evidence synthesis of Taiwanese empirical studies. Journal of Research in Education Sciences, 60(2), 33-77. doi:10.6209/JORIES.2015.60(2). 02】

魏筱珊（2011）。多媒體閱讀公路教學策略對低閱讀理解能力學生閱讀理解學習成效之研究（未出版碩士論文）。國立臺南大學，臺南市。

(27)

strategy for students with low comprehension performance (Unpublished master’s thesis). National University of Tainan, Tainan, Taiwan.】

二、外文文獻

Ardasheva, Y., Wang, Z., Adesope, O. O., & Valentine, J. C. (2017). Exploring effectiveness and moderators of language learning strategy instruction on second language and self-regulated learning outcomes. Review of Educational Research, 87(3), 544-582. doi:10.3102/003465431 6689135

Bangert-Drowns, R. L., Hurley, M. M., & Wilkinson, B. (2004). The effects of school based writing-to-learn interventions on academic achievement: A meta-analysis. Review of Educational Research, 74(1), 29-58. doi:10.3102/00346543074001029

Beck, I. L., & McKeown, M. G. (2006). Improving comprehension with questioning the author: A fresh and expanded view of a powerful approach. New York, NY: Scholastic.

Borenstein, M., Hedges, L. V., Higgins, J. P. T., & Rothstein, H. R. (2009). Introduction to meta-analysis. Chichester, UK: John Wiley & Sons. doi:10.1002/9780470743386

Chall, J. S. (1996). Stages of reading development (2nd ed.). Fort Worth, TX: Harcourt Brace. Cheung, A. C. K., & Slavin, R. E. (2012). How features of educational technology applications

affect student reading outcomes: A meta-analysis. Educational Research Review, 7(3), 198-215. doi:10.1016/j.edurev.2012.05.002

Cheung, A. C. K., & Slavin, R. E. (2016). How methodological features affect effect sizes in education. Educational Researcher, 45(5), 283-292. doi:10.3102/0013189X16656615

Cohen, J. (1992). A power primer. Psychological Bulletin, 112(1), 155-159. doi:10.1037/0033-2909. 112.1.155

Cole, M. W. (2014). Speaking to read: Meta-analysis of peer-mediated learning for English language learners. Journal of Literacy Research, 46(3), 358-382. doi:10.1177/1086296X14552179 Cook, B. G., Buysse, V., Klingner, J., Landrum, T. J., McWilliam, R. A., Tankersley, M., & Test, D.

W. (2015). CEC’s standards for classifying the evidence base of practices in special education. Remedial and Special Education, 36(4), 220-234. doi:10.1177/0741932514557271

Cote, N., & Goldman, S. R. (1999). Building representations of informational text: Evidence from children’s think-aloud protocols. In H. van Oostendorp & S. R. Goldman (Eds.), The construction of mental representations during reading (pp. 169-193). Mahwah, NJ: Erlbaum. Davis, D. S. (2010). A met-analysis of comprehension strategy instruction for upper elementary and

middle school students (Unpublished doctoral dissertation). Graduate School of Vanderbilt University, Nashville, TN.