第二章 文獻探討
第三節 以第二層級介入做為閱讀障礙鑑定工具之相關議題
一、第二層級介入中無教學反應者的操作指標
所有 RTI 模式都使用多層次介入系統,RTI 對於預防、鑑別及處遇 閱讀障礙是一種大有可為的作法,然而也存在許多技術性問題。
其中,第二層級介入部分,由於它是實務工作者用來執行 RTI 早期 密集介入的一種手段,讓普通班高危險學生能夠提升表現以成功回到普 通班教室學習;同時也是一種測驗,評量學生在一個比較支持性、明確、
系統化教學環境的學習能力,因此在技術上訂定「無教學反應者」(NR)
的具體標準顯得相當重要(Dexter, & Hughes,2008; Fuchs & Fuchs, 2006;
Fuchs, Compton, Fuchs, Bryant, & Davis, 2008)。
Fuchs 等人(2005)提出雙重差距(Dual Discrepancy)的概念,認 為只看表現水準,看不到低表現者的成長(不敏感),只看成長速率,則 會忽略了高表現者(因為成長不足)(Fuchs, Fuchs, McMaster, & Al Otaiba, 2005)。Speece 與 Case(2001)使用雙重差距法,每週及介入結束時實 施篇章閱讀流暢性測驗,以成長速率、最後表現水準低於同儕一個標準 差 以 下 的 標 準 來 界 定 , 同 時 比 較 另 外 兩 種 傳 統 鑑 定 學 障 的 方 法
(IQ-achievement discrepancy, low achievement),結果發現在普通教育教 學情境下(Tier 1),雙重差距法可以找到比較年幼、具代表性(種族、
性別)的族群,他們的行為和聲韻處理能力也是比較有缺陷的,顯示出 RTI 模式的效度證據。
29
此外,Fuchs(2003)認為,評量介入反應要考慮三個重要的評量成 分,分別是測驗的時機、決定是否有教學反應的標準以及介入情境。
Fuchs、Compton、Fuchs、Bryant 和 Davis(2008)則提出,必須針對決 定標準、指標能力、切截分數進行技術性的分析。Barth 等人(2008)則 認為無教學反應的界定方法、參照組別、評量進步的測量工具、切截點 等是決定關鍵。綜合幾位學者對於判別無教學反應者的看法,可分為以 下幾部分(Barth, Stuebing, Anthony, Denton, Mathes, Fletcher, & Francis, 2008; Fuchs, 2003; Fuchs, Compton, Fuchs, Bryant, & Davis, 2008; Fuchs &
Deshler, 2007):
(一)在選擇能力參照指標方面
選擇指標能力與選擇測驗工具是一體之兩面。以測驗工具來談,用 來篩選、監控成長及做為教學參考的工具有四大類:(1)成長測量,跨時 間 重 複 施 測 以 得 到 學 習 速 度 , 最 後 一 次 測 量 也 可 視 同 為 能 力 基 準
(benchmark);(2)課程本位測量,評量學生的基本技能或讀寫算學科知 識表現;(3)常模參照測驗,與常模中的同儕比較以瞭解優劣情形;(4)標 準參照測驗,通常提供切截分數以得知是否為高危險群者(at risk)。其中,
後 兩 類 涉 及 不 同 參 照 團 體 的 選 擇 , 前 者 可 用 常 模 樣 本 (normative sample ),例如比較學生與常模參照測驗中 PR30 者的表現情形,或是有 限的常模樣本(limited norm sample),以參與相同介入(例如 Tier 2)的學 生做為參照對象,後者則是是能力基準(benchmark approach)的概念,通 常是以是否達到班級、學校或全國的同年級同儕的某個特定水準(例如 每分鐘能正確唸出 40 個字)做為設定的目標。
至於能力指標內涵來說,目前只有低年級的最佳篩選工具被確認,
包括常見的聲韻覺識能力之外,口頭閱讀流暢度(ORF)、篇章理解、快速
30
唸名測驗都能有效區分不同能力的組別(Gersten & Dimino, 2006;Vaughn
& Fuchs, 2003),至於高年級的敏感性指標則尚未獲得一致性的實證支持 證據。
(二)在界定教學反應的方法
Fuchs(2003)整理相關研究後指出,在成長監控評量實施方面,依 據實施的時機主要有三種類型:第一種是在介入結束後實施以檢驗介入 效果,可稱之為「最後表現水準」(final status)、第二種是在介入期間內 定時評估成長曲線,可稱之為「成長速率」(growth)、第三種是比較接受 介入的學生與一般同儕之間的能力差距,包含最後表現水準和成長速 率,可稱之為「雙重差距」(dual discrepancy)。決定最後表現水準的能 力 參 照 方 式 有 兩 種 : 一 是 常 模 參 照 ( normative )、 另 一 是 標 準 參 照
(benchmark)。Fuchs, Compton, Fuchs, Bryant 和 Davis(2008)整理相關 文獻後,綜合施測時機與決定標準兩項指標,提出有五種方式可用來定 義有無教學反應,分別為:
1.中位數切截法(median split):屬於成長速率取向的一種。Vellutino, Scanlon, Sipay, Small, Chen 和 Pratt (1996)利用 WRMT(Woodcock Reading Mastery Tests)進行多次測量,並用 HLM 技術得到每名學生的 進步斜率,再將所有斜率排序後選擇中位數作為切截點,斜率在中位數 以下者,視為無教學反應者(NR)。
2.斜率差距法(slope discrepancy):屬於成長速率取向的一種。Fuchs
(2004)則是讓接受介入的學生定時接受測驗並計算進步斜率,表現若 低於該班級、地區或全國常模切截分數者,則視為無教學反應者。
3.常模對照法(normalization):屬於最後表現水準取向的一種。
31
Torgesen, Alexander, Wagner, Rashotte, Rashotte, Voeller 和 Conway (2001) 在介入結束時實施 WRMT(Woodcock Reading Mastery Tests)測驗並計 算標準分數,將百分等級 25 以下(標準分數 90 以下)者,視為無教學 反應者。
4.最後標準參照法(final benchmark):屬於最後表現水準取向的一 種。Good, Simmons, & Kame’enui(2001)以未來表現水準做為參照基準 來評量介入後的表現,他們以 DIBELS(Dynamic Indicators of Basic Early Literacy Skills )測驗中的口語流暢性評量為工具,將學生得分與奧瑞岡三 年級正式測驗比較,一年級學生的得分必須超過 39 分才被認為有教學反 應。
5.雙重差距法(dual discrepancy):Fuchs(1998)和 Speece & Case
(2001)則是用課程本位評量(CBM)的概念,定時評量學生在篇章閱 讀流暢性的表現。他們同時考量介入期間的成長斜率及介入後的表現水 準,必須同時表現出成長斜率、表現水準同時低於班級同儕 1 個標準差 以上者,才會被視為無教學反應者。
(三)在決定切截點方面
切截點的目的在用來得到最佳決定,低於平均數 0.5、1.0 或 1.5 個 標準差,或是百分等級 25,都是被建議使用過的標準(Fuchs, 2004;
Torgesen, et al., 2001)。
32
二、不同操作指標的診斷正確率
Fuchs(2004)認為,評估第二層級介入反應操作指標的合理性可以 考慮兩種效標,一是得到適當的閱讀障礙盛行率(prevalence,約為 7%)、
二是所判定的無教學反應者(NR)與閱讀表現低落程度的一致性高。
若以盛行率為效標,美國學者們多建議閱讀障礙盛行率的基本率估 計應在 7-10%之間(Fuchs & Fuchs, 2004; VanDerHeyden, Witt, & Barnette, 2005)。
Fuchs & Fuchs (2004)比較三種測驗工具(Dolch Word List, Nonsense Word Fluency, CBM Oral Reading Fluency)和四種方法(Dolch 成長速率 -中位數折半法、Nonsense Word Fluency 成長速率-中位數折半法、最後 表現水準-常模參照法、最後表現水準-標準參照法),所有接受 T2 教學 的低年級學生都是屬於在成長速率及表現水準皆低於平均數 0.5 個標準 差者,結果發現:(1)閱讀障礙的出現率(incidence)因方法而異,「最 後表現水準-常模參照法」最低(1.4%)、「成長速率-中位數折半法」次 之(3.5%)、「最後表現水準-標準參照法」最高(8.4%);(2)「成長速率 -中位數折半法」運用於認字流暢性(Word Fluency) 比非字認讀流暢性 (Nonsense Word Fluency) 更能區分有無教學反應; (3)「最後表現水準-常模參照法」的分類正確率比「最後表現水準-標準參照法」為佳。
Fuchs 和 Deshler(2007)的比較亦指出,「最後表現水準-常模參照 法」的學障發生率較合理,但是擊中率、敏感性及特異性等指標之效果 不一致,「最後表現水準-標準參照法」和「成長速率-中位數折半法」通 常會造成過度鑑定,斜率法和雙重差距法也有此現象,但是其擊中率、
敏感性及特異性等指標的結果尚稱合理。
33
以成就低落比例做為比較標準的研究較少,McMaster、Fuchs、Fuchs 和 Compton (2005)比較最後表現水準(標準參照)、雙重差距和成長 速率三種方式,發現被界定為無教學反應者的比例以最後表現水準最 高,雙重差距次之,成長速率最少。
Barth 等人(2008)進一步比較用來鑑別無教學反應者的一些操作標 準,包括測量工具(7 種測驗,分別評量測量認字、流暢性、篇章理解 等能力)、界定教學反應的方法(最後水準、成長速率和雙重差距)、切 截點(-0.5SD、-1.0SD、-1.5SD)所組成 543 種兩兩配對的一致性分析,
結果發現幾乎所有比較的一致性均不高(kappa 係數在 .31-.45 之間),
顯示使用不同工具傾向鑑別出不同的對象,較高的 kappa 係數主要出現 在評量構念相近語文能力之測驗工具、相近之切截點,其中,切截點是 最重要的影響因素。
34
三、第二層級教學介入之效益及困難
國外目前已累積非常多 RTI 模式進行教學介入的實徵研究(Case, Speece, & Malloy, 2003; Fuchs, 2004;Fuchs, Compton, Fuchs, Bryant, &
Davis, 2008 ; Vaughn, 2003; VanDerHeyden, Witt, & Naquin, 2003;
McMaster, Fuchs, Fuchs, & Compton,2003 ; VanDerHeyden, Witt,
&Barmett, 2005; VanDerHeyden, Witt, &Gilbertson, 2007),過去十年來大 多都集中在國小階段介入成效的探討,近五年來開始有中學階段的介入 研究成果報告出現,但多數呈現極小的介入效果。
(一)美國方面相關研究 1.Vaughn 等人系列研究
美國 學 者 Vaughn 等 人 的 研 究團 隊(Vaughn, Cirino, et al., 2010;
Vaughn, Wanzek, et al., 2010; Vaughn, Wexler, & Roberts, et al., 2011) 在 2006 年到 2008 年以三年的時間針對 1867 名六到八年級的中學學生進行 四層次的 RTI 介入研究。研究者每年針對個別教學者實施 4-5 次執行精 準度檢驗,入班觀課的檢核項目包括老師是否確切執行教學活動,以及 觀察學生參與度來評估老師的教學品質。整體結果在 Likert 三點式量表 平均(1-3 分,由低到高)在 2.26-2.56 之間,尚稱理想。
研究者在各校之第一層級教學是由學校學科教師接受 6 小時專業成 長課程後執行,並以兩個月為間距,使用 AIMSweb 線上實施閱讀昧字
(MAZE)和篇章流暢性測驗來追蹤學生進步情形。第二層級教學為每 日外加 50 分鐘的閱讀教學,由研究者另聘教師,教學還可細分三個子階 段,包含相同成分但區別不同重點(階段一重視字詞和流暢性、階段二 強調詞彙及理解,階段三聚焦在說明文的閱讀策略)。教學分組部分,在
35
六年級採 10-15 人一組(Vaughn, & Cirino, 2010),七、八年級則分別採 3-5 人或 10-15 人一組(Vaughn & Wanzek, 2010)。
在第二層級介入部分,研究者用來評估學生教學反應之測驗標準為 需在德州州立績效測驗─TAKS(Texas Assessment of Knowledge and Skills,Texas Education Agency, 2004)得分通過 PR30 以上之水準。
綜合各研究之分析結果可得知:(1)在介入效果部分,T2、T3 階段 針對閱讀成就低落的學生提供長達一年及二年,每天外加 50 分鐘閱讀教 學的效果值不大(T2 median d=.16;T3 median d=.23)(Vaughn, & Cirino, et al., 2010;Vaughn & Wanzek, et al., 2010;Vaughn, Wexler, & Roberts, et
綜合各研究之分析結果可得知:(1)在介入效果部分,T2、T3 階段 針對閱讀成就低落的學生提供長達一年及二年,每天外加 50 分鐘閱讀教 學的效果值不大(T2 median d=.16;T3 median d=.23)(Vaughn, & Cirino, et al., 2010;Vaughn & Wanzek, et al., 2010;Vaughn, Wexler, & Roberts, et