以第二層級介入做為閱讀障礙鑑定工具之相關議題

第二章文獻探討

第三節以第二層級介入做為閱讀障礙鑑定工具之相關議題

一、第二層級介入中無教學反應者的操作指標

所有 RTI 模式都使用多層次介入系統，RTI 對於預防、鑑別及處遇閱讀障礙是一種大有可為的作法，然而也存在許多技術性問題。

其中，第二層級介入部分，由於它是實務工作者用來執行 RTI 早期密集介入的一種手段，讓普通班高危險學生能夠提升表現以成功回到普通班教室學習；同時也是一種測驗，評量學生在一個比較支持性、明確、

系統化教學環境的學習能力，因此在技術上訂定「無教學反應者」（NR）

的具體標準顯得相當重要（Dexter, & Hughes,2008; Fuchs & Fuchs, 2006；

Fuchs, Compton, Fuchs, Bryant, & Davis, 2008）。

Fuchs 等人（2005）提出雙重差距（Dual Discrepancy）的概念，認為只看表現水準，看不到低表現者的成長（不敏感），只看成長速率，則會忽略了高表現者（因為成長不足）(Fuchs, Fuchs, McMaster, & Al Otaiba, 2005)。Speece 與 Case（2001）使用雙重差距法，每週及介入結束時實施篇章閱讀流暢性測驗，以成長速率、最後表現水準低於同儕一個標準差以下的標準來界定，同時比較另外兩種傳統鑑定學障的方法

（IQ-achievement discrepancy, low achievement），結果發現在普通教育教學情境下（Tier 1），雙重差距法可以找到比較年幼、具代表性（種族、

性別）的族群，他們的行為和聲韻處理能力也是比較有缺陷的，顯示出 RTI 模式的效度證據。

此外，Fuchs（2003）認為，評量介入反應要考慮三個重要的評量成分，分別是測驗的時機、決定是否有教學反應的標準以及介入情境。

Fuchs、Compton、Fuchs、Bryant 和 Davis（2008）則提出，必須針對決定標準、指標能力、切截分數進行技術性的分析。Barth 等人（2008)則認為無教學反應的界定方法、參照組別、評量進步的測量工具、切截點等是決定關鍵。綜合幾位學者對於判別無教學反應者的看法，可分為以下幾部分（Barth, Stuebing, Anthony, Denton, Mathes, Fletcher, & Francis, 2008; Fuchs, 2003; Fuchs, Compton, Fuchs, Bryant, & Davis, 2008; Fuchs &

Deshler, 2007）：

（一）在選擇能力參照指標方面

選擇指標能力與選擇測驗工具是一體之兩面。以測驗工具來談，用來篩選、監控成長及做為教學參考的工具有四大類：(1)成長測量，跨時間重複施測以得到學習速度，最後一次測量也可視同為能力基準

（benchmark）；(2)課程本位測量，評量學生的基本技能或讀寫算學科知識表現；(3)常模參照測驗，與常模中的同儕比較以瞭解優劣情形；(4)標準參照測驗，通常提供切截分數以得知是否為高危險群者(at risk)。其中，

後兩類涉及不同參照團體的選擇，前者可用常模樣本 (normative sample )，例如比較學生與常模參照測驗中 PR30 者的表現情形，或是有限的常模樣本(limited norm sample)，以參與相同介入（例如 Tier 2）的學生做為參照對象，後者則是是能力基準(benchmark approach)的概念，通常是以是否達到班級、學校或全國的同年級同儕的某個特定水準（例如每分鐘能正確唸出 40 個字）做為設定的目標。

至於能力指標內涵來說，目前只有低年級的最佳篩選工具被確認，

包括常見的聲韻覺識能力之外，口頭閱讀流暢度(ORF)、篇章理解、快速

唸名測驗都能有效區分不同能力的組別（Gersten & Dimino, 2006；Vaughn

& Fuchs, 2003），至於高年級的敏感性指標則尚未獲得一致性的實證支持證據。

（二）在界定教學反應的方法

Fuchs（2003）整理相關研究後指出，在成長監控評量實施方面，依據實施的時機主要有三種類型：第一種是在介入結束後實施以檢驗介入效果，可稱之為「最後表現水準」(final status)、第二種是在介入期間內定時評估成長曲線，可稱之為「成長速率」(growth)、第三種是比較接受介入的學生與一般同儕之間的能力差距，包含最後表現水準和成長速率，可稱之為「雙重差距」（dual discrepancy）。決定最後表現水準的能力參照方式有兩種：一是常模參照（ normative ）、另一是標準參照

（benchmark）。Fuchs, Compton, Fuchs, Bryant 和 Davis（2008）整理相關文獻後，綜合施測時機與決定標準兩項指標，提出有五種方式可用來定義有無教學反應，分別為：

1.中位數切截法（median split）：屬於成長速率取向的一種。Vellutino, Scanlon, Sipay, Small, Chen 和 Pratt （1996）利用 WRMT（Woodcock Reading Mastery Tests）進行多次測量，並用 HLM 技術得到每名學生的進步斜率，再將所有斜率排序後選擇中位數作為切截點，斜率在中位數以下者，視為無教學反應者（NR）。

2.斜率差距法（slope discrepancy）：屬於成長速率取向的一種。Fuchs

（2004）則是讓接受介入的學生定時接受測驗並計算進步斜率，表現若低於該班級、地區或全國常模切截分數者，則視為無教學反應者。

3.常模對照法（normalization）：屬於最後表現水準取向的一種。

Torgesen, Alexander, Wagner, Rashotte, Rashotte, Voeller 和 Conway (2001) 在介入結束時實施 WRMT（Woodcock Reading Mastery Tests）測驗並計算標準分數，將百分等級 25 以下（標準分數 90 以下）者，視為無教學反應者。

4.最後標準參照法（final benchmark）：屬於最後表現水準取向的一種。Good, Simmons, & Kame’enui（2001）以未來表現水準做為參照基準來評量介入後的表現，他們以 DIBELS(Dynamic Indicators of Basic Early Literacy Skills )測驗中的口語流暢性評量為工具，將學生得分與奧瑞岡三年級正式測驗比較，一年級學生的得分必須超過 39 分才被認為有教學反應。

5.雙重差距法（dual discrepancy）：Fuchs（1998）和 Speece & Case

（2001）則是用課程本位評量（CBM）的概念，定時評量學生在篇章閱讀流暢性的表現。他們同時考量介入期間的成長斜率及介入後的表現水準，必須同時表現出成長斜率、表現水準同時低於班級同儕 1 個標準差以上者，才會被視為無教學反應者。

（三）在決定切截點方面

切截點的目的在用來得到最佳決定，低於平均數 0.5、1.0 或 1.5 個標準差，或是百分等級 25，都是被建議使用過的標準(Fuchs, 2004；

Torgesen, et al., 2001)。

二、不同操作指標的診斷正確率

Fuchs（2004）認為，評估第二層級介入反應操作指標的合理性可以考慮兩種效標，一是得到適當的閱讀障礙盛行率(prevalence，約為 7%）、

二是所判定的無教學反應者（NR）與閱讀表現低落程度的一致性高。

若以盛行率為效標，美國學者們多建議閱讀障礙盛行率的基本率估計應在 7-10%之間（Fuchs & Fuchs, 2004; VanDerHeyden, Witt, & Barnette, 2005)。

Fuchs & Fuchs （2004）比較三種測驗工具（Dolch Word List, Nonsense Word Fluency, CBM Oral Reading Fluency）和四種方法（Dolch 成長速率 -中位數折半法、Nonsense Word Fluency 成長速率-中位數折半法、最後表現水準-常模參照法、最後表現水準-標準參照法），所有接受 T2 教學的低年級學生都是屬於在成長速率及表現水準皆低於平均數 0.5 個標準差者，結果發現：（1）閱讀障礙的出現率（incidence）因方法而異，「最後表現水準-常模參照法」最低（1.4%）、「成長速率-中位數折半法」次之（3.5%）、「最後表現水準-標準參照法」最高（8.4%）；（2）「成長速率 -中位數折半法」運用於認字流暢性(Word Fluency) 比非字認讀流暢性 (Nonsense Word Fluency) 更能區分有無教學反應；（3）「最後表現水準-常模參照法」的分類正確率比「最後表現水準-標準參照法」為佳。

Fuchs 和 Deshler（2007）的比較亦指出，「最後表現水準-常模參照法」的學障發生率較合理，但是擊中率、敏感性及特異性等指標之效果不一致，「最後表現水準-標準參照法」和「成長速率-中位數折半法」通常會造成過度鑑定，斜率法和雙重差距法也有此現象，但是其擊中率、

敏感性及特異性等指標的結果尚稱合理。

以成就低落比例做為比較標準的研究較少，McMaster、Fuchs、Fuchs 和 Compton （2005）比較最後表現水準（標準參照）、雙重差距和成長速率三種方式，發現被界定為無教學反應者的比例以最後表現水準最高，雙重差距次之，成長速率最少。

Barth 等人（2008）進一步比較用來鑑別無教學反應者的一些操作標準，包括測量工具（7 種測驗，分別評量測量認字、流暢性、篇章理解等能力）、界定教學反應的方法（最後水準、成長速率和雙重差距）、切截點（-0.5SD、-1.0SD、-1.5SD）所組成 543 種兩兩配對的一致性分析，

結果發現幾乎所有比較的一致性均不高（kappa 係數在 .31-.45 之間），

顯示使用不同工具傾向鑑別出不同的對象，較高的 kappa 係數主要出現在評量構念相近語文能力之測驗工具、相近之切截點，其中，切截點是最重要的影響因素。

三、第二層級教學介入之效益及困難

國外目前已累積非常多 RTI 模式進行教學介入的實徵研究（Case, Speece, & Malloy, 2003； Fuchs, 2004；Fuchs, Compton, Fuchs, Bryant, &

Davis, 2008 ； Vaughn, 2003; VanDerHeyden, Witt, & Naquin, 2003;

McMaster, Fuchs, Fuchs, & Compton,2003 ； VanDerHeyden, Witt,

&Barmett, 2005; VanDerHeyden, Witt, &Gilbertson, 2007），過去十年來大多都集中在國小階段介入成效的探討，近五年來開始有中學階段的介入研究成果報告出現，但多數呈現極小的介入效果。

（一）美國方面相關研究 1.Vaughn 等人系列研究

美國學者 Vaughn 等人的研究團隊(Vaughn, Cirino, et al., 2010;

Vaughn, Wanzek, et al., 2010; Vaughn, Wexler, & Roberts, et al., 2011) 在 2006 年到 2008 年以三年的時間針對 1867 名六到八年級的中學學生進行四層次的 RTI 介入研究。研究者每年針對個別教學者實施 4-5 次執行精準度檢驗，入班觀課的檢核項目包括老師是否確切執行教學活動，以及觀察學生參與度來評估老師的教學品質。整體結果在 Likert 三點式量表平均(1-3 分，由低到高)在 2.26-2.56 之間，尚稱理想。

研究者在各校之第一層級教學是由學校學科教師接受 6 小時專業成長課程後執行，並以兩個月為間距，使用 AIMSweb 線上實施閱讀昧字

（MAZE）和篇章流暢性測驗來追蹤學生進步情形。第二層級教學為每日外加 50 分鐘的閱讀教學，由研究者另聘教師，教學還可細分三個子階段，包含相同成分但區別不同重點（階段一重視字詞和流暢性、階段二強調詞彙及理解，階段三聚焦在說明文的閱讀策略）。教學分組部分，在

六年級採 10-15 人一組（Vaughn, & Cirino, 2010），七、八年級則分別採 3-5 人或 10-15 人一組（Vaughn & Wanzek, 2010）。

在第二層級介入部分，研究者用來評估學生教學反應之測驗標準為需在德州州立績效測驗─TAKS（Texas Assessment of Knowledge and Skills，Texas Education Agency, 2004)得分通過 PR30 以上之水準。

綜合各研究之分析結果可得知：（1）在介入效果部分，T2、T3 階段針對閱讀成就低落的學生提供長達一年及二年，每天外加 50 分鐘閱讀教學的效果值不大（T2 median d=.16；T3 median d=.23）（Vaughn, & Cirino, et al., 2010；Vaughn & Wanzek, et al., 2010；Vaughn, Wexler, & Roberts, et

在文檔中教學反應模式在國中閱讀障礙鑑定系統之建構 (頁 38-56)

第二章 文獻探討

第三節 以第二層級介入做為閱讀障礙鑑定工具之相關議題

一、第二層級介入中無教學反應者的操作指標

二、不同操作指標的診斷正確率

三、第二層級教學介入之效益及困難

第二章文獻探討

第三節以第二層級介入做為閱讀障礙鑑定工具之相關議題