民 99
'
35 卷 3 期, 27-50 頁
美國身心障礙學生考試調整策略成效之
後設分析
張萬烽
高雄市明華園中資源班教師鈕文英
高雄師範大學特教主教授 本文旨在後設分析美國 1999 到 2008 年間, 38 篇考試調整策略對一般和全體 身心障礙學生的成效;接著分析考試調整的效果是否會因學科、策略額型,以及 身心障礙學生的障礙特性、教育階段和人數而有差異。結果顯示考試調整對一般 學生為些微效果;對身心障礙學生為小效果量,符合「差別增長」和「互動」假 設。未接受考試調整之一般學生的測驗成績,高於接受調整之身心障礙學生,二 者間呈現「中」效果量的差異,顯示考試調整能維持「公平與權益的平衡」。考試 調整對其他學科的效果最佳,其次分別為閱讀和數學。於調整策略上,以延長時 間的效果較佳,報讀較差。在考試調整實施的教育階段上,以國中最佳,國小次 之,而高中職效果最差。考試調整對 100 人以下身心障礙學生人數的效果最佳, 人數愈多,效果愈差。最後,考試調整對學障學生的效果,優於其他身心障礙學 生。 關鍵詞:考試調整、身心障礙學生、後設分析· 28 .
特殊教育研究學刊緒論
一、研究背景與動機Schnirman
(2005) 指出在 1997 年之前,
身心障礙學牛被排除在全州或全學區的評量之外,然而隨著「標準本位改革J
(standard-based
reform) 的興起,情況隨之改變。;你-過
去 10 年之間,美國特殊教育重視「緝效責任」( accountability)
,關注身心障礙學主在攸關百 級,及未來教育和牛j 主計畫決策之「高利益考 試 J(high-stakes
testing) 上的表現,因此如何讓身心障礙學生不因其障礙阻撓其參與考試,
提升考試的公平和有效性,讓學生獲得「有 效」的成績,成為一項重要挑戰(Philli阱,1994; Tindal
&
Fuchs
,
2000; Thompson
,
Blou訓,&
Thurlow
,
2002)
0Thompson 等人認為「考試
調整 J
(test
accommodation) 是使身心障礙學
中參與大型考試的有效方式之一0 美國 1997年〈身心障礙者教育法案~
(Individual
Dis-abilities with Education Act
,
IDEA) 、 2001 年
《不讓孩子落後法案~
(No
Cω'hiω蚵 Lei拼f丹t Beh咐hμIn叫dNCLB)卜,以及 2泊00側4 年{身d心L心、障礙者教育增進
法案~
(Individual
川It的hwDisabilities Education
Improvement Act
,
/DE/A) 均強調提供考試調 整,協助身心障礙學生參與「全州或全學區的 評量 J(Elbaum
,
2007
)。隨著考試調整的提供,參加考試的身心障礙學生也漸增(
Bielinski
,
Ysseldyke
,
Bolt
,
Friedebach
,
&
Friedebach
,
2001 ) ;
Thurlow 、 Moen 和 Altman (2006) 調 查發現在國小到高中階段間,有 61%到 66%的 身心障礙學生接受考試調整服務。 對教育人員和研究者來說,考試調整是否 能符合身心障礙學生的需求,讓他們獲得「有 效 J (是指與一般學生在未調整 F的得分具有 相同意義) ,而非「理想」的成績一直備受關切 (Thurlow
&
Bolt
,
2001; Thurlow
,
House
,
Boys
,
Scott
, &
Y
sseldyke弓 2000;Thurlow
,
McGrew
,
Tindal
,
Thompson
,
Ysseldyke
, &
Ellio仗,2000;
Tind祉,
2002; Tindal
&
Fuel芯, 2000 )。相關研究
指出學校不願意提供考試調整,尤其是當學校 認為調整花費時間、經費和人力,又無法確切 掌握成效時,因此更需要提供調整對身心障礙
學生是古有助益的證據以改變其迷思 (Bolt
&
Thurlow
,
2004; Elliott
,
Thurlow
, &
Y
sseldyk巴,1996
)。另外,教育人員在決定考試調整策略 時,亦需實設資料為依據,正如 Tindal 、Helwig 和 Hollenbeck
(1999
,
p.l 2) 所言: I 考
試調整應是基於個人需求而非盲目提供。」相 關研究指出缺乏實證本位的資料,學校可能基 於學生障礙特質或是擔心家長訴訟,而以個人 的主觀意見決定調整策略 O 由此可知非常需要 考試調整成效的研究資料 (Fuchs, Fuel芯,&Capizzi
,
2006; Hollenbeck
,
2005; Lindstrom
,
2007;
Lindstrom
&
Gre臣, 2007;
Schnirman
,2005)
0關於考試調整的成效,相關研究發現調整 策略對身心障礙學生多數有正面的效果,但亦 有部分研究顯示效果有限,而哪些考試調整策
略較具成效,研究結果亦不-致 (Bolt
&
Thurlow
,
2004; Bolt
&
Ysseldyke
,
2008; Fuchs
&
Fuchs
,
1999;
Johnston巴,Altman
,
Thurlow
, &
Thompson
,
2006; Schnirman
,
2005; Sireci
,
Scar-pati、&
Li
,
2005; Thompson et a
l.,
2002; Zenisky
&
Sireci
,
2007) 。這些考試調整策略中,以延長時間 (extended time) 和報讀 (read
aloud)
居多; Ofiesh 、 Hughes ;f日 Scott (2004) 更指 出延長時間是最常使用的一項調整策略。由此 可知,延長時間和報讀為探討最多的考試調整 策略,卻無一致的結論,值得探究。造成考試 調整效果變異的原因包括研究方法和對象不 同,以往研究大多採團體比較研究,分析身心 障礙學生考試調整前後之表現,學生異質性 日,此種方法不符合考試調整之「個別化」原 則;除此,部分研究分析不同的考試調整策略
亦是原因;即使調整策略相同,執行過程有變
異亦會影響成效 (Ketterlin-Geller,
Yovanoff
, &
Tindal
,
2007; Sireci
,
Li
, &
Scarpati
,
2003
)。
其中考試調整效果不一致的研究多以學習障礙 (learning
disabilities
'簡稱學障)學牛。為對象;例如 Fuchs 和 Fuchs (1999) 的研究指 出延長時間無法補價學障學生的困難,使其在 傳統考試中獲益。 Fuchs 、 Fuchs 、 Hamlett 、
Eaton 、 Binkley 和 Crouch 等人 (2000 )的研究
以 181 和 184 位學障和一般學生為對象,比較 延長時間、報讀、放大字體和標準化施測方式 um末調整)的效果,結果發現學障學生從報 讀中獲益的分數,明顯高於採用延長時間和放 大字體者。然而, Helwig 、 Rozek-Tedesco 和Tindal
(2002) 的研究顯示報讀對於數學計算 技能佳,但閱讀能力差的國小中高年級學障學 生有顯著的效果;而對於數學計算技能羔的學 生,不論其閱讀能力高或低,皆無法從報讀中 獲益 O 延長時間對學障學生在數學解題上有助 益,特別是學障者本身閱讀理解能力愈佳者獲益愈大(
Fuchs
,
Fuchs
,
Eaton
,
Hamlett
, &
Kar肘,
2000 )
0Elbaum
(2007) 分析過去的研究發現 報讀對國小學障學生數學的成效優於中學者, 這可能是由於中學的課程難度提高,即使報讀 後,學障學生還是無法理解題意,以致於無法 達到效果。 Fuchs ;f日 Fuchs(200 I
)表示學障 學生在聽、說、讀、寫、算的限制,易與評量 (尤其是紙筆測驗)互相干擾,致使教師不容 易反映其考試調整的需求;而考試調整確實對 部分學障學生有幫助,但由於他們的異質性 大,加上不同學科適用的調整策略有異,閃此 沒有任何單一策略對所有學障學牛都有助益。 另外, Ketterlin-Geller 、 Alonzo 、 BraunMonegan
;f日 Tindal (2007) 指出學生人數會影 響考試調整的實施。由此可知,考試調整實施 在什麼學科、運用何種考試調整策略,以及身 心障礙學生的人數、障礙特性和教育階段會影響其成效 o Lewandowski 、 Lovett ;f日 Rogers
(2008
)認為要了解考試調整成效的細微差 異,有必要尋找「調節變項J(moderator
vari-able) 。總之,在分析考試調整成效峙,可將學 科、考試調整策略類型,以及身心障礙學生的 教育階段、障礙特性和人數視為調節變項,注 意其影響。 對於目前考試調整效果變異的問題,後設 分析( meta-analysis) 正好可解決此問題。 Cook 等人( 1994) 指出當各研究的發現不一 致時,正是運用後設分析整合研究的時機。鈕 丈英 (2009 )表示透過後設分析,可檢視實務 是否為證據本位( evidence-based) 。美國至 2008 年為止,僅 Chiu 和 Pearson( 1999
)針對 1986 至 1998 年間身心障礙和英語不精熟(limited English
proficie肘, LEP) 學生,以及
Elbaum
(2007) 針對 1998 至 2004 年問學障學 生數學考試調整之後設分析研究。由此可知考 試調整後設分析的研究仍非常有限,且未分析 2005 年以後的研究。 我國不管團中基本學力測驗或大學入學學 科能力測驗等考試,均依據〈特殊教育法〉 (教育部, 2009) 提供考場服務,保障身心障 礙學生公平參與升學考試的機會。然而,搜尋 國科會研究報告、碩博士、期刊和會議論文, 我國平 2008 年底前有六篇研究探討考試調整 實施現況與問題(李佩蓉,2007
;洪靜怡,2008
;莊虹姿,2008
;黃鳳蔥,2006
;陳明 聰、張靖卿,2004
;鍾素香,2004)
;僅有四 篇研究探討考試調整之成效(林筱汶、陳明 聰,2006
;黃巧雲、陳明聰、陳政見,2007 ;
陳蓓蓉,2003
;劉婷好、陳明聰、陳政見,2008)
,四篇均探討數學和自然科的考試調 整,沒有研究針對語文科;探討的策略僅陳蓓 蓉以園中基測試題的呈現形式,以及延長時 間,分析對三位視障學生的成效;其他三篇則 討論不同電腦化試題、語音調整策略,以及比·30·
特殊教育研究學刊 較語音合成與真人錄音對-般學生之成效。由 於國內身J心障礙學生考試調整策略成效的研究 量尚不足,且實施上面臨訐多問題,非常需要 國外後設分析的研究,引導國內身心障礙學生 考試調整實務之發展。 綜上所述,考試調整成效的後設分析實有 必要,而 1999 到 2008 年間,分析考試調整對 學障學生成效的研究僅有的篇,DeCoster
(2004
)表示宜有至少 30 篇以上的研究才適 合做後設分析,由於篇數較不足,加上僅Chiu和 Pearson (1999) 的研究以 1986 至 1998 年
間之身心障礙學生為對象,尚缺乏1999 至2008 年間以身心障礙學生為對象的後設分
析;因此,研究者擴大分析的對象範圍,以身 心障礙學生為對象,後設分析美國考試調整對身心障礙學生的成效,在針對身心障礙學生分
析時,還會分析考試調整對一般學生的成效, 並且比較身J心障礙與未接受調整之一般學生的 成效差異,以了解考試調整是否能讓身心障礙 學生獲得有效成績,又不會損及對一般學生的 公平性。接著分析考試調整的效果是否會因學 科、策略額型,以及身心障礙學生的障礙特 性、教育階段和人數而有差異。二、研究目的與問題
根據上述背景和動機,本研究有以下兩個 目的: 1.探究考試調整對身心障礙和一般學生的成效。
2.分析考試調整對身心障礙學生之成效因
調節變項造成的差異情形。 配合上述兩個研究目的,探討以F研究問 題: I- I.考試調整是否能提升身心障礙學生的 測驗成績? 1-2.考試調整是否能提升一般學生的測驗 成績? 1-3. 身心障礙學生接受考試調整後的成 績,是否低於未接受調整的一般學生? 2- 1.考試調整對身心障礙學生的效果是否 會閃「學科」而有差異? 2-2.考試調整對身心障礙學生的效果是否 會因「考試調整策略類型」而有差異? 2-3.考試調整對身心障礙學生的效果是否 會l大l其「教育階段、障礙特性和人數」而有差 里。三、名詞解釋
(一)身心障曬學生ODEIA>
2004 年指出身心障礙包括了以 下 14 個類別:學障、智能障礙、情緒困擾、 說話或語言損傷、廣泛性自閉症、發展遲緩、 形體損傷、其他健康損傷、聽覺損傷、聾、視 覺損傷(包含全盲)、盲/聾、多重障礙、頭 部外傷(司|自 Smith ,2007
,
pp.
I
卜 12 )。本研究 所指身心障礙乃依據上述定義,在 1999 至 2008 年間於美國接受考試調整的對象。 (二)考試調整策略成妞調整之英文為 I
accommodation
J'它和
「修改 J (modification) 不同處在於修改是指
改變試題欲評量之構念;而調整則不會改變它們 (Stretch
&
Osborne
,
2005)
0Wasburn-Moses
(2003
)指出考試調整冒在許量學生的能力,而不是障礙。 Byrnes (2005) 則表示它在撤除 學魚因障礙造成學習和接受考試的阻力,而末 改變考試活動的必要目的。考試調整僅改變 「試題形式」或「測驗程序J '使身心障礙學
生不內其障礙阻撓其參與考試(Fuchs
&
Fuchs
,
1999 ; Tindal
&
Fuchs
,
2000) 。本研究的考試 調整策略成效是指測驗成績,包括了州立標準 參照測驗、標準化測驗,以及論文作者自編的 評量工具。(三)調節單項
independent variable)
,它會影響主要自變項與
依變項關係的方向和強度 (Baron
& Kenny
,
1986
)。本研究以學科(閱讀、數學和其他科 目,其他包含了社會、科學或未特別指明的科 目)、考試調整策略類型(報讀和延長時間兩 種) ,以及身心障礙學生的教育階段(國小、 國中和高中職)、障礙特性(全體身心障礙和個別學障學生) ,以及人數( 100 人以下、
100 至 1000 人,以及 1000 人以上三組)為調
節變項。 考試調整策略類型中,報讀是改變試題的 呈現方式,將文字改變為口頭的方式呈現,其 形式包括人工報讀及機器(含錄音機或電腦軟 體)報讀,較常運用於閱讀題目有困難之身心障礙學生 (Thurlow
&
Bolt
,
2001) 。延長時間係指增加應試時間,讓因閱讀和訊息處理速度 較慢的身心障礙學生,能有較充裕的時間作答
( Lewandowski et a!.
,
2008
)。
文獻探討
一、考試調整之重要理論
為提供本研究後設分析之論述基礎,以下 簡述考試調整之重要理論,以作為本研究後續 討論之依據。(一)最大潛能論點(
maximum
potent凶 thesis ,MPT)
Zuriff ( 2000
)提出最大潛能論點,主張 一般學生在延長時間的調整中並不會獲益,因 為他們已在有時限的考試中發揮最大能力了; 反觀學障學生由於處理訊息上的緩慢,導致在 時間限制下無法完全發揮潛能。 Stretch 和Osborne
(2005) 進一步說明研究如何運用 「最大潛能論點」評鑑考試調整的成效,他們 認為研究應包括兩個成果:(
I
)學障學生在未 限制考試時間的情境下,其分數會顯著高於有 時間限制者; (2) 一般學生在未限制時間的情 境中不會有較高的分數。 上述論點又稱為「互動假設 J(interaction
hypothesis)
,並擴展此概念至所有類型之考 試調整,假定提供考試調整給身心障礙學生 峙,會提升其分數;而一般學生即使接受調整 也不會有較高的分數(Gre肥,2008; Sireci et
泣,2005)
,如圖一。(二)差別增長假設 (differential
boost
hypothe-由於互動{假自設界定
任{柯可改變,過於嚴謹,凶此 Tindal f口 Fuchs
(2000
)提出「差別增長」假設,它強調有效的考試調整為身心障礙學生狀|調整而進步的分 數,優於。般學生在相同調整F 進步者
(Finch
,
Barton
, &
Meyer
,
2009)
,如國 >
Hi
S
此觀點也被後續研究者引用11z目前登 (Koenig
&
Bachman
,
2004) 。互動假設和差別增長的差 'I主...
.... ....
一-
一般學生 士句.... ....
....
...
-
--障礙學正主 分.... ....
數 末調整 已調整 圖一互動假設圖示--
..-I 特殊教育研究學刊· 32 .
.--to ...
未調整...
...
...
...
... ...
...
A
已調整 --一一般學生-
--障礙學生 圖二差別增長圖示 異在於:差別增長認為一般學牛透過調整分數 仍會進步,互動假設則否 O 本研究將利用這兩 項觀點,比較考試調整對一股與身心障礙學生 的成效,以驗證之 O(三)公平與權益的平衡 (leveling
of the
play-ing field)
公平與權益平衡的觀點強調考試調整允許 身心障礙學生展現其所能,但不會使其超越一 般學生的表現,兼顧了身心障礙學生的權益和
一般學生的公平( Elli帥,
Kratochwill
, &
McKevitt
,
200 I
,
2002; Fuchs
&
Fuchs
,
200 I;
Fuel芯, Fuel芯,
Eaton
,
Hamlett
, &
Karns
,
2000)
0 Elliott 等人 (2002 )表示考試調整就如同戴上 眼鏡,能讓近視者考駕照路考時看得清楚,而 非直接取得駕照:因此身心障礙學生接受考試 調整後,無法超越一般學生未調整的表現,符 合公平原則。本研究以此觀點討論身心障礙學 生接受考試調整後,是否會超越一般學生未調 整的表現,以驗譚之。二、考試調整成效的分析研究
有關考試調整成效的分析研究,有三篇採取投票法 (voting
method) (Johnstone et a!.
,
2006; Thompson et a!.
,
2002; Zenisky
&
Sireci
,
2007)
,一篇採用敘述性的文獻回顧(narrative
reviews) (Sireci et a!.
,
2005 )
c 兩種方法均有其限制,敘述性的文獻凹顧不能整合和比較不同 的研究發現;投票法則是容易落入顯著與不顯 著研究數量之比較,且容易造成「勝者全拿」 的結果,忽略了研究對象人數、顯著水準和研
究品質不同等議題,導致結論有偏差(
Kavale
&
Glass
,
1981; Rosenthal
,
1991) 。日前僅兩篇
考試調整之後設分析研究 (Chiu
&
Pearson
,
1999; Elbaum
,
2007
)。
Chiu
,f日 Pearson (1999) 分析 1986 至 1998
年間, 30 篇考試調整之研究;結果發現延長時 間為最常運用的策略,而學障學生為所有障礙 中最常被探討的類別;調整能有效增進身心障 礙學生成績的效果量為 0.16 '一般學生的加權 效果量為 O.俑,身心障礙學生優於一般學生調 整之效果。另外,該研究也分別分析考試調整 成效是否會因學生障礙類別和年級,以及調整 策略類型而有差異;結果顯示「時間調整」 (包含延長時間等)的加權效果量為 0.31'
「呈現方式調整 J (包含報讀等)的加權效果 量為-0.12'
,綜合調整」則為 0.1 '時間調整策 略的效果優於呈現方式的調整。教育階段方面 以跨階段的調整效果最佳(0.67)
,國小(幼 稚園到小五)的加權效果量為-0.肘,國中 (7 到 8 年級)為 0.14 '高中職 (9 到 12 年級)為 0.22 '高中職後則為 0.28
0 障礙類別中,不 分類的效果量為 0.01 '注意力缺陷過動症為0
.4
7
'學障為 0.12 '肢體障礙為 0.19 '視覺障
礙則為 0.62 ;整體來說,以對視障學生的效果 最佳,可能與調整策略如報讀、放大字體等方 式直接可協助視障學生有效作答所致。對一般 學生來說,除了時間調整策略較有效外,其他 調整策略並無太大效果。Elbaum
(2007) 分析 1998 至 2004 年間,
比較報讀策略對學障和一般學生數學成效的 17 篇研究(其中有兩篇無對照組) ,總平均效 果量為 O.的,國中小階段 (8 篇)的效果量為0.20'
95%信賴區間為 0.10 到 0.30 ;而高中職階段 (6 篇)的效果量為-0.12
'
95%信賴區間
為-0.03 到-0.21 。然而, Elbaum 的研究未計算
加權效果量,無法考量研究對象人數帶來的影 響。 總之,兩篇後設分析研究發現:考試調整對於身心障礙學生均有助益,但屬於小效果
量;而就教育階段言之, Chiu 和 Pearson( 1999
)和 Elbaum (2007) 的研究結果剛好 相反,前者發現教育階段愈高效果愈好,後者 則顯示國小的效果優於中學階段 O 而 Kim 、 Schneider 和 Siskind (2009) 認為雖然考試調 整在教育階段上的效果無一致結論,但隨著學 生年級增加,調整效果隨之減弱的趨勢似乎難 以避免。 綜合文獻,考試調整成效的後設分析實有 必要,而美國至 2008 年為止,僅兩篇考試調 整成效之後設分析研究;因此,本研究後設分 析美國 1999 至 2008 年間,考試調整對身心障 礙學生的成效,在針對身心障礙學生分析時, 還會依據互動和差別增長假設,以及公平與權 益平衡的觀點,分析考試調整對一般學生的成 效,並且比較考試調整對身心障礙與未接受調 整之一般學生的成效差異,以了解考試調整是 否能讓身心障礙學生獲得有效成績,又不會損 及對一般學生的公平性。接著分析考試調整的 效果是否會因學科、策略類型,以及身心障礙 學生的障礙特性、教育階段和人數而有差異。研究方法
本研究依據 Littell 、 Corcoran 和 Pillai
(2008
)對後設分析之建議,採取以下步驟。 一、確立研究架構 本研究依據目的,確立研究架構如圖三。 自變項 研究對象 依變項 l 未接受考試調輕折入
I. 肯史學生|產生
I.有無接受考試調整之一般學生測驗 2.有接受考試調整• ....
2.身心障礙,學生••
成績的比較 2. 有無接受考試調整之身心障礙學生 測驗成績的比較 調節變項 3. 有接受考試調聽之身心障礙學生, l 調整的學科 與未接受調整之 般學生測驗成績 2. 考試調整策略的類型 的比較 3. 身心障礙學生的教育階 4. 考試調需要對身心障礙學生之成效閃 段、障礙特性和人數 調節變項造成的差異情形 圖三研究架構· 34 .
特殊教育研究學刊二、界定文獻搜尋的來源和範圍
(一)文獻搜尋的來源 為了減少出版偏差的問題,研究者利用以 下三種方式蒐集發表之期刊論文、未發表的碩博 卡論文,以及政府和會議報告等:一為電腦資料 庫查詢,搜尋年代從 1999 至 2008 年底為止,以關鍵字 (test
accommodation
、 oralpresentation
、read aloud
、 extendedtime
、 disabilities 、 learningdisabilities
、 largeassessment
、 high-s個kes testing) 搜尋 EBSCO 、 ERIC 、 PQDT 、 ProQuest 等電子資料庫系統。二為人工回溯查詢,美國國家教育成果中心分別於 1999 至 2001
(Thompson et
泣, 2002) 、 2002 至 2004( Johnstone et
泣, 2006) ,以及 2005 至 2007 年
間 (Zenisky
&
Sir悶, 2007) ,回顧身心障礙學生考試調整的研究,搜尋三篇文獻中所列之研 究 O 三為從研究中的參考文獻查詢,在蒐集上 述研究後,檢視所列之參考文獻,尋找額外的 研究。若有兩篇或以仁的文獻為相同資料來源 時,採用最早發表之文獻。 (二)文獻搜尋的範圍 文獻搜尋的範圍包括以下標準﹒ I.符合本研究目的,亦即探討考試調整對 一般和身心障礙學生的成效。
2.選取 1999 至 2008 年間的研究,以延續
Chiu 和 Pearson(
1999
)的研究,並比較之。 3.選取研究對象為一般和身心障礙學生, 如僅說明是特殊班學生或IEP 服務對象則不納入。
4.選取方法為實驗或準實驗研究,設計為 有兩組比較(實驗組和對照組)或前後測資料 之研究,以便於進行後設分析,排除個案、相 關、調查和單一受試研究。 5.選取考試調整策略為延長時間和報讀兩 種之研究。 6.提供計算效果量所需數據之研究,包括 平均數、標準差、 t 、 r 或 F 值等。依據上述六項標準,最後選取 38 篇研
究,研究資料蒐集來源及選用情形如表一。 二、登錄研究資料並計算編碼者信度 本研究從以下三個部分登錄研究資料:( I
)研究特徵'包括出版年代、作者、資料 來源,以及研究對象、目的、方法和設計; (2) 調節變項的特徵'包括學科、考試調整 策略額型,以及身心障礙學生的教育階段、障 礙特性和人數; (3) 計算效果量所需數據, 包括平均數、標準差、 t 、 r 或 F 值等。 在完成登錄工作後,研究者委請一位特教 系博士班研究生,從 38 篇研究中隨機選取 9 篇(即 24%) 的文獻,登錄資料,之後計算編碼者信度 (coder's
reliability)
,結果顯示
Kappa
一致性為.肘。 表 後設分析研究資料蒐集來源及選用情形 資料來源 篩選篇數 捨棄篇數 選取篇數 碩博士論文4 (4%)
。 (0%)4 ( 1
1.4%)
期刊論文41 (66.1%)
17 (68.0%)
24 (60.0%)
政府報告10 (16.1%)
3 (12.0%)
7 (20.0%)
會議報告8 (12.9%)
5 (20.0%)
3 (8.6%)
合計 的(100%)
25 (100%)
38 (100%)
三、決定資料分析和程序
本研究首先以 Hedges 和 Olkin (1985) 之
技術計算各研究效果量 d 值。計算過程中,發 現部分單一研究因採取不同的方式(多個評量 工具、階段、調整策略類型)檢視考試調整成 效,造成單一研究多重效果量的問題;本研究 依據 Littell 等人 (2008 )的建議,將兩個以上 之效果量平均,以獲得單一效果量,避免重複 計算導致整體效果量偏高或偏低的現象。 而在實際分析上,由於整體效果量的分析 每篇研究僅能提供一個效果量,並且不是每篇 研究都包含一般和身心障礙生,因此篇數不相 同;而在調節變項之分析上,由於線性階層模 式將研究間的變異程度納入考量,因此一篇研 究可針對不同變項分別計算其效果量,例如一 篇研究針對國小、國中、高中職三個教育階段 做分析,即可分別計算三個效果量,因此各調 節變項間的效果量數不同,茲整理整體與調節 變項分析之研究篇數和效果量數如表二。 獲得各研究效果量 d 值後,以 Rosenthal( 1991
)提出之 Winer 合併檢定(
combined
test) 計算合併效果量,以了解是否需要合併 計算所有研究之d 值,並計算加權後之d 值, 表二 整體與調節變項分析之研究篇數和如果量數 分析內涵 研究篇數 效果量數 整體效果量之分析 一般學生20
20
身IL、障礙學生24
24
身心障礙學生與一般學生之比較33
33
調節變項之分析 學科28
56
閱讀11
19
數學16
30
其他6
7
考試調整策略的類型28
56
報讀17
26
延長時間11
30
身心障礙學生的教育階段28
56
國小16
18
園中13
18
高中職7
20
身心障礙學生的人數28
41
100 人以下
15
20
100 至 1000 人8
16
1000 人以上5
5
身IL、障礙學生的障礙特性28
28
全體身J心障礙學生13
13
個別學障學生15
15
· 36 .
特殊教育研究學刊 給予研究對象人數較多者較高的「權數」( weight)
,以避免研究偏差。之後計算Cooper 之 Fail S,收 N(N/
5
)' 以考驗出版偏差
可能的影響,另外在出版偏差的檢定上,一般 來說 ,Fail-Safe
N 值愈大,愈沒有出版偏差的因素在;若 Fail-Safe N 值比 Rosenthal 提出的
「容忍層次 J
(tolerance level)
(5K
+
10) 大得
多,則此結果具高度有效性(黃寶園、林世 華,2002
)。最後進行同質性檢定,林邦傑(
198 7)指出若結果未達顯著水準,則表示各 研究間的差異為抽樣誤差所致,則直接合併效 果量,計算效果量和 95%的信賴區間;若結果 達顯著水準,則須進一步分析調節變項對於效 果量之影響。效果量 d 值、 Winer 合併檢定、Fail Safe
N 和同質性檢定皆採用吳裕益 (2009b) 撰寫之 SPSS 語法。一般而言,調 節變項之分析大多採用變異數分析或多元迴 歸;但由於後設分析的資料本身具有階層結構,因此, Raudenbush 和 Bryk 於 2008 年建議
利用「階層線性模式 J
(hierarchical linear
modeli時, HLM)' 它不但可處理階層結構之需 求,同時解決了後設分析中差異成分的問題, 較變異數分析或多元迴歸為佳( 51 自吳裕益, 2009a) 。因此本研究以階層線性模式,分析考 試調整成效因調節變項造成的差異。本研究以 Cohen 於 1977 年之建議,將效果
量 0.20 、 0.50 和 0.80 界定為小、中、大 (51 自
Littell et a
I.,
2008
)。除此,以 Hunter 和 Schmidt於 1990 年發展之「的不重疊量數 J '作為另一
項效果量解釋指標, 1有效果量 d 的「考驗力分析 J
(power analysis)
,其意義係指「較高平均
群組超過較低平均群組多少百分比J (引自吳裕 益, 2009b) 。另外在調節變項的分析中,無條 件模式冒在評鑑其實效果參數中的變異情形, 可估計其實效果的平均數和標準差;而條件模 式則是解釋產生變異的來源,也就是估計其實 效果的殘差變異數,在各調節變項中,截距的 選擇其隨意安排(吳裕益, 2009a) 。研究結果與討論
於研究結果與討論中,首先針對考試調整 對身心障礙和一般學生之成效,以及考試調整 對身心障礙學生成效之調節變項做分析與討 論,最後討論研究過程發現的問題。一、考試調整對身心障礙和一般學
生成交宜之分析與討論
(一)考試調整對身心障曬學生之成致 在比較身{J\障礙學生有無接受考試調整之 差異上,共納入 28 篇研究。 Winer 合併檢定為9.65
(p 三 .00) ,顯示適合以合併效果量分析,d
為 0.39 '加權後平均效果量(
d
w) 為
0.0304
'二者間差異很大,檢視研究後發現有 四篇效果量搞負值,這四篇取樣自參加大型考 試的人,為不等組設計,未接受考試調整之身心障礙學生人數較多(超過 1000 人) ,而且可
能為能力較佳,不須申請調整之學生。為避免 此四篇造成研究結果之偏誤,因此刪除這四篇 研究後重新分析,結果如表三 o Winer 檢定值 為 1 1.1 9(p
=.00)
,表示適合以合併效果量分析 ,
d
1起 0 .48 '加權後平均效果量 (dw) 為
0.31 '
95%信賴區間為 0.258 至 0.326 '的為
O
肘,顯示身心障礙學生接受考試調整的表 現,大約高於 65%未接受調整者,且高了 0.31 個標準差,身心障礙學生有無接受考試調整之 差異為「小」效果量。另外,同質性檢定 Q (23)1有 485.74(p
=.00)
,顯示效果量變異大於 抽樣誤差,將進行調節變項之分析。出版偏差爪15(.05)為 1019 '只要再有 1019 篇研究無效果,
合併檢定就無法達到.05 之顯著水準;而Nj5(Olj 為 495.9 '只要再有 496 篇研究無效果,合併 檢定就無法達到.01 之顯著水準,遠超過 130 篇 (5K+IO) 的容忍層次。(二)考試調整對一般學生之成鼓 在比較一般學生有無接受考試調整之差異 上,共納入 20 篇研究,分析結果如表四。 附ner 檢定值為 1. 85
(p
= .00)' 表示適合以合併效果量分析 'd 為 0.12 '的則為 0.55 '亦
即 A 般學生接受考試調整的表現,大約高於 55%未接受調整者,且高了。.12 個標準差;然 加權後平均效果量(仇)為 -0.003'
95%信賴 區間為軀。 119 至 0.126 '顯示一般學生有無接 受考試調整之差異其「些微效果」。另外,同質性檢定 Q(19) 為 398.19
(p
=.00)
,顯示效果
量變異大於抽樣誤差,可進行調節變項之分 析,唯並非本研究探討之範圍,故不執行。出 版偏差 N州的)為 4.肘,表示只要再有5 篇無效 果的研究,合併檢定就無法拒絕虛無假設;而N
j5
(OI)為 -7.61 '表示如果要達到.01 之顯著水
準'須減少 8 篇沒有任何效果之研究。 (三)考試調整對身心障醋的成放和一般學生 未調整之比較 比較身心障礙學生接受考試調整和a般學 生未接受調整之差異,以驗證調整是否能維持「公平與權益的平衡J '共納入 33 篇文獻,結
果如表五。 Winer 合併檢定為國46.07(p
=.00)
,達顯著水準,顯示效果量可以合併分析 'd 為-0.75
'
u3 屆 0.23 '加權後平均效果
量 (dw) 為 -0.52
'
95%信賴區間為-0.514 至
0.526
'顯示一般學生未接受調整的表現,大 約高於 23%身心障礙學生接受調整者,且高了 表三 考試調整對身心障曬學生成殼的後設分析(n=
24)
後設分析內涵 身心障礙學生未調整和身心障礙學生有調整 Winer 檢定 Zc (未加權) 1 1.1 9抖 Winer 檢定 WeightedZ
,
9.65 抖 效果量 dOA8
加權效果量 dw0.31
效果量信賴區間 95% Cl0.258-0.362
不重疊量數的0.68
|司質性檢定 Q ~5.M抖 出版偏差檢定 Nj5
(05)1019
出版偏差檢定 Nj5( O])495.9
**p<.OI 表四 考試調整對一般學生成殼的後設分析(n=
20)
後設分析內涵 一般學生末調整和♂般學生有調整 Winer 檢定 Zc (未加權) Winer 檢定 ~~~dZ Qn抖 效果量 d0.12
加權效果量 dw
0.014
效果量信賴區間 95%Cl0.062--0.034
不重疊量數的0.55
同質性檢定 Q398.19**
出版偏差檢定 N們(.05)4.87
出版偏差檢定 N冊。1)-7.61
**p<.OI特殊教育研究學刊 表五 考試調整對身心障礙的成效和一般學生未調整相較之後設分析 (n
=
33)
後設分析內涵 身心障礙學生有調整和一般學生未調整 Winer 檢定 Zc ( 未加權)-46.07**
Winer 檢定 WeightedZc
-43.01 **
效果量 d ~.~ 加權效果呈~ ~.~ 效果是信賴區間 95%CI-0.516--0.524
不重疊量數 Wo.n
同質性檢定 Q 24496.79抖 出版偏差檢定 Nt們叫26003.3
出版偏差檢定 N/5I Oi)12944.78
**p<.OI 0.52 個標準差,二者間呈現「中」效果量的差 異 O 另外,效果量同質性檢定 Q (32) 為24496.79
(p
=.00)
,顯示效果量變異大於抽樣 誤差,可進行調節變項之分析,唯並非本研究 探討之範圍,故不執行。出版偏差Nβ(.05)為26003.3
'表示只要再有 26003 篇研究無效
果,合併檢定就無法達到.05 之顯著水準;而Nf5(OI)為 12944.78 '表示只要再有 12945 篇研
究無效果,合併檢定就無法達到 01 之顯著水 準'遠超過可容忍層次的 175 篇。 整體而言,考試調整對身心障礙學生為小 效果量;對一般學生的成效措些微效果,符合 「差別增長」和「互動」假設;比較身心障礙 學生接受考試調整和一般學生未接受調整,二 者問呈現「中」效果量的差異,顯示考試調整能維持「公平與權益的平衡J '身心障礙學生接
受考試調整並不會超過一般學生的表現,而此 結果與 Chiu 和 Pearson( 1999
)的研究類似。二、考試調整對身心障礙學生成奴
之調節變項分析與討論 以學科、考試調整策略類型,以及身心障 礙學生的教育階段、人數及障礙特性為調節變 項,分析考試調整對身心障礙學生的效果是否 會因這些調節變項而有差異。 (一)學科 以學科為調節變頃,共納入 28 篇研究,56 個效果量,如表六。先進行無條件模式檢
定,效果量總平均估計值為 0.3 9 '顯示接受調 整的身心障礙學生平均數較未接受調整者高 0.3 9 個標準差,屬於小效果量,而變異數估計 值為 0 .2 1 '呈現各篇研究真正效果量 0.21 '相 當於標準差 0.46 '正為 1760 .3 8(p
=
.00)
,表 示考試調整對身心障礙學生的效果會因「學 科」而有顯著差異。另外以條件模式進行檢定,以其他科目作為截距,係數為0.57
'
t 為
3.5
(p
=.00)
,達顯著水準;而閱讀和數學兩 科分別低於其他科目 0.26 和 0.15 個標準差, 且均未達顯著水準,顯示其他學科的調整效果最佳,其次為閱讀(係數為0.42)' 最低為數
學(係數為 0.31 )。這可能由於閱讀與數學兩 科須具備認知能力,而身心障礙學生在認知能 力上的限制,使他們在閱讀和數學科上的調整 效果未明顯呈現;加上其他科目的效果量數僅 7 個,閱讀與數學兩科的效果量數亦有一些差距(分別為 19 和 30 個) ,恐因比較之效果量
數的差距影響結果。 (二)考試調整策略的顛型 以考試調整策略的類型為調節變項,共納入 28 篇研究, 56 個效果量,如表七。先進行
0.39
0.57
-0.26
-0.15
標準差0
.46
0
.46
p 。 .075.77**
55
AVAV0.16
0.16
0.22
3.5**
-MωHim-ny
句J 司3 .、, dm 、, 6. 、, ν -1.61
-0.68
變異數成分 自由度 J X 。 2155
1760.38**
AV仇V0.21
53
1804.53**
仇U 仇U**p<.OI
表七 無條件和條件模式下考試調整在策略頓型上之成如差異分析(n=
56)
固定效果 係數 標準誤 I 自由度 p 無條件模式下 調整策略類型克思平均值巾 。 390.07
5.7 料55
.00
條件模式下 截距 yo (延長時間)O.5l
0.11
4.5 抖 抖 的 報讀-0.20
0.14
-1
.454
.15
隨機效果 標準芳: 變異數成分 自由度 X J 無條件模式下 調整策略類型真實效果量的0
.46
0.21
55
1760.38**
條件模式下 排除調整策略類型後效果是 VII 。.450.21
54
1526.96**
**p<.OI
p AV AV AV AV 無條件模式檢定,效果量總平均估計值起0
.3
9
'顯示接受調整的身心障礙學生平均數較
未接受調整者高 0.39 個標準差,屬於小效果 量,而變異數估計值為 0.21 '呈現各篇研究真正效果量 0.21 '相當於標準差 0.46 '正為
1760.38 (p
=.00)
,表示考試調整對身心障礙學 生的效果會因「考試調整策略的類型」而有顯 著差異。另外以條件模式進行檢定,以延長時間作為截距,係數~0.51
'
t 為 4.5
(p
=.00)'
達顯著水準;而報讀低於延長時間0.20 個標準 差(係數為 0 .3 1)
,未達顯著水準 C 此結果與 。nu 和 Pearson(
1999
)的研究類似,時間調 整優於呈現方式調整,唯值得注意的是:他們 研究的調整策略較本研究的範聞廣,解釋上須 謹慎 oElbaum
(2007) 指出報讀不一定對所有 身心障礙學生均有益,它僅對識字有困難的學 生有幫助,對於能識字但閱讀理解或書寫表達 有困難學生,報讀將增加聽覺處理的負擔,反 而會干擾他們的思考,影響作答速度,助益較4、 o Fuchs 、 Fuchs 、 Hamlett 、 Eaton 、 Binkley
和 Crouch 等人 (2000 )雖認為報讀的成效優 於延長時間,但 Elbaum 指出隨著年級的增·40· 特殊教育研究學刊 表八 無條件和條件模式下考試調整在研究對象教育階段上之成如差異分析(n
=
56)
固定效果 係數 標準誤 t 自由度 p 無條件模式下 教育階段總平均值吊 條件模式下 截~Ryo
(高中職) 國中 國小 表九 無條件和條件模式下考試調整在身心障礙學生人數上之成妓差異分析 (n=41) 固定效果 係數 標準誤 I 自由度 無條件模式下 人數總平均值,有 條件模式下 截距 γ。( 100 人以 f) 100 人以上到 1000 人以下 1000 人以上 隨機效果 無條件模式下 人數其實效果量的 條件模式下 排除研究對象人數後效果量的 加,由於學障學生在基礎能力上的低落,報讀 成效反而不明顯 o (三)身心障曬學生的教育階段 以身心障礙學生的教育階段為調節變項, 共納入 28 篇研究, 56 個效果量,如表八。先 進行無條件模式檢定,效果量總平均估計值為。.39 '顯示接受調整的身心障礙學生平均數較
未接受調整者高。"個標準差,屬於小效果 量,而變異數估計值為 0 .2 1 '呈現各篇研究真正效果量 0.21 '相當於標準差 o.峙, x2 搞
1760.38
(p
=.00)
,表示考試調整對身心障礙學
生的效果會因「身心障礙學魚的教育階段」而 有顯著差異。另外以條件模式進行檢定,以高0.39
隨機效果 無條件模式下 教育階段長實效果量 VII 條件模式下 排除教育階段後效呆星 VII *p<
.05;
**p<
.01
0.29
0.23
0.08
標準弄一0
.46
0.460.33
0.55-0.30
0.65
標準是 。.360.27
中職作為截距,係數為 0 凹 , t 為 2.6(p
三 01) ,達顯著水準;而國中和國小分別高於高中職 0.23 和 0.08 個標準差,但均未達顯著水
準,顯示國中的調整效果最佳(係數為0.52),
其次為國小(係數為 0.37) ,最低為高中職。此 結果與 Chiu 和 Pearson (1999) 的研究部分類 似,國中優於國小,可能原因為國中課程難度 較高,學生對考試調整的需求相對較高,能顯 現有無調整之成效差異,但對高中職的成效則 不像 Chiu 和 Pearson 的研究高於國中小。 (四)身心障曬學生的人數 以身心障礙學生的人數為調節變項,共納入 28 篇研究, 41 個效果量,如表九。先進行
0.07
5.77**
55 AUAV0.11
0.17
0.16
變異數成分2.60*
1.400.50
自由度 司、 d 句、 d 吋‘ u 戶、 J 戶、 JF 、 J -IGOt-AV'-LO X p0.21
55
1760.3 日** AUAU 。 .2153
1860
.43**
AUAU p0.063
5.19**
40 AUAυ0.09
0.12
0.13
變異數成分6.18**
-2.61 *
-5.10**
.0001
.00
。目。 80δ 司、 d 句、 d 句、 d ? X 自由度 p 。 13 40768.35**
AVAU0.08
38
228.85**
AUAU *p<
.05;
**p<
.01
無條件模式檢定,效果量總平均估計值為
0.33
'顯示接受調整的身心障礙學生平均數較 未接受調整者高 0.3 3 個標準差,屬於小效果 量,而變異數估計值為 0.13 '呈現各篇研究真正效果量 0.13 '相當於標準差 0.36
'
X2~
768 .3 5
(p
=.00)
,表示考試調整對身心障礙學 生的效果會因「身心障礙學生的人數」而有顯著差異。另外以條件模式進行檢定,以100 人
以下的人數作為截距,係數為0.5 5
'
t
1;有 6.18
(p
=.00)
,達顯著水準;而 100 以上到 1000人以下和 1000 人以上分別低於 100 人以下
。 30 和 0.65 個標準差,均達顯著水準,顯示
100 人以下人數的調整效果最佳,其次為100
以上到 1000 人以下(係數為 0.25) ,最低為
1000 人以上(係數為-0.10 )。這可能原因為在 人數少的情況下,考試調整策略的設計較符合 學生的需求,也較能有效掌控調整策略的實 施。 (五)身心障礙學生的障碩特性 以身心障礙學生的障礙特性為調節變項, 共納入 28 篇研究, 28 個效果量,如表十。先 進行無條件模式檢定,效果量總平均估計值為O.刃,顯示接受調整的身心障礙學生平均數較
未接受調整者高 0.33 個標準差,屬於小效果 量,而變異數估計值為0.19 '呈現各篇研究真 正效果量 O. 凹,相當於標準差 0.44 '正為760.99
(p
=.00)
,表示考試調整對身心障礙學 生的效果會因「身心障礙學生的障礙特性」而 有顯著差異。另外以條件模式進行檢定,以全體身心障礙學生作為截距,係數為0.28
'
t 為
2
.4
4
(p
=.02)
,達顯著水準;而學障學生高於 全體身心障礙學生 0.12 個標準差(係數為0
.4
0)
,未達顯著水準。此結果與 Chiu 和Pearson
(1999) 的研究類似,均顯示考試調整 對不分障礙類別學生的效果較低;可能原因為 身心障礙學生異質性大,不分類別進行調整, 無法考量不同障礙的特徵和需求,例如感官和 動作障礙與心智障礙者(例如智障、學障)間 特徵和需求有差異,調整效果可能存在不一致 的現象 O 本研究實施過程中發現以下問題,首先, 部分文獻如會議論文或其他出版品在搜尋過程 中僅有篇名,無法從資料庫中取得,對於全面 了解考試調整的成效,有不足之處。其次,本 研究考試調整對身心障礙學生成效之調節變項 分析中,其他科目和用在 1000 人以上人數的 表十 無條件和條件模式下考試調整在研究對象障礙特性上之成強差異分析 (n=
28)
固定效果 係數 標:準誤 自由度 p 無條件模式下 研究對象障礙特性總平均值吊0.33
0.09
3.68**
27
00
條件模式下 截~Eyo
(全體身心障礙)0.28
0.11
2
.44*
26
.02
學障0.12
。 180.70
26
.49
隨機效果 標準差 變異數成分 自由度 x2 p 無條件模式下 研究對象障礙特性真實效果量的0
.44
0.19
27
760.99**
00
條件模式下 排除研究對象障礙特性後效果量的0
.44
0.20
26
668.20**
仇廿 仇廿*p
<.05;
**p
<.01
· 42 .
特殊教育研究學刊 研究篇數和效果量數都較少,故在解釋研究結 果上宜謹慎,另需要更多研究探討考試調整對身心障礙學生其他科目,以及接受調整人數多
之應用成效。再者,研究者發現研究對象的學 科能力及智力,可能會影響調整策略的成效; 但多數研究未提供這兩方面的資料,也無法確 認比較之組問研究對象的學科能力及智力是否 相似 O 因此,調整策略的成效是否會因研究對 象的學科能力與智力而有差異,值得探究。最 後,部分研究末呈現各障礙類別之考試調整策 略成效資料,因此,無法分析調整策略的成效 是否因研究對象的障礙類別而有差異,此部分 的研究值得探討。研究結論與建議
一、研究結論 本文冒在後設分析美國 1999 到 2008 年 間, 38 篇考試調整策略對對一般和身心障礙 學生的成效;接著分析考試調整的效果是否會 因學科、策略類型,以及身心障礙學生的障礙 特性、教育階段和人數而有差異。結論如下: I.在考試調整對一般和身心障礙學生的成 效上,對一般學生為些微效果;對身心障礙學 生為小效果量,符合「差別增長」和「互動」 假設。未接受考試調整之才史學生的測驗成 績,高於接受調整之身心障礙學生,二者問呈 現「中」效果量的差異,顯示考試調整能維持「公平與權益的平衡 J '身心障礙學生接受考
試調整並不會超過一般學生的表現。 2. 在考試調整對身心障礙學生之成效因調 節變項造成的差異上,調整的科目以其他學科 最佳,其次分別為閱讀和數學 o 於調整策略 上,以延長時間的效果較佳,報讀較差。在考 試調整實施的教育階段上,以國中最佳,國小 次之,而高中職效果最差。關於身心障礙學生的人數,考試調整對 100 人以下人數的效果最
佳,其次為 100 以上到 1000 人以下,最低為
1000 人以上 C 最後,考試調整對學障學生的效果, f憂於於全體身心障礙學生。
二、研究建議
(一)對實施考試調整策略之建讀 I.本研究發現考試調整可提升身心障礙學 生的測驗成績,而且對國中的效果最好,國小 次之,因此,建議對學生有困難的學科,平時 評量即提供相同的調整策略,以協助學生更有 效運用考試調整策略,提升考試調整的效果。 2. 從研究結果來看調整可提升障礙學生考 試成績,因此為了讓學生能更有效運用調整, 應該在平常教學過程即提供相同調整策略,除 可增進教學成效外,亦可使考試調整效果提 升,透過考試前的適當訓練,使學生得以有效 運用調整策略,達成事半功倍之效。 3 以考試調整策略在各教育階段的結果來 看,年級越小效果較佳,就如同馬太效應(Matthew's effect)
I 貧者愈貧,富者愈富」 所言,學習上的困難使得他們在自尊和動機上 產生低落,同時讓他們在閱讀能力、獲得字彙 和閱讀理解等能力上漸趨落後,因此在平日應 提供補救教學和培養閱讀能力使學生獲得應具 備之學科能力來面對考試。 4 調整的提供應視學生的需求與考試的目 的,如同時提供三個以上的調整,有時反造成 學生負擔,僅提供學生真正需要的評量調整策 略,太多的調整將造成學生本身的負擔,因此 當調整策略超過一種以上時,必須確認這些調 整都是適合學生需求的。4.早期發現,早期介入
在教育階段上的結果發現,愈早提供調 整,對身心障礙學生的助益也愈大,如何早期 發現其考試調整需求,並加以判斷提供服務, 使學生在考試過程提升動機,獲得成就感,可 使學生學習成果與努力成正比。(二)對未來研究之建議 1.建議未來考試調整研究的設計,能納入 調節變項(例如:學科、策略類型,以及身心 障礙學生的障礙類別、教育階段、學科能力和 人數) ,形成多閃子設計,以了解調節變項與 考試調整的交互作用。而後由調節變項的分析 為基礎,進一步建構身心障礙學生考試調整的 決策流程。 2.建議未來考試調整的研究,可以加入除 了報讀和延長時間以外調整策略的探討。 3 建議在國內實施考試調整對身心障礙學 生成效之研究,以累積考試調整效果之實徵研 究基礎。 4. 建議未來細分身心障礙類別,以了解考 試調整對不同身心障礙類別的成效。另外,學 障學生異質性大,建議細分特定障礙類型,例 如閱讀障礙、書寫障礙、數學障礙等,以了解 考試調整對不同學障類型的成效。 5. 建議未來可針對兩個以上的調節變項, 運用階層線性模式了解變項間的關聯性,例如 考試調整策略類型和科目等變項間如何影響效 果量。
參考文獻
(文獻前加註星號*者為本研究納入後設分析 之論文) 吳裕益(2009a) :
HLM 在整合分析之應用 變異數已翔的分析。未出版的于稿,國 立高雄師範大學特殊教育學系。 吳裕益 (2009b) :能說分析。未出版的于稿, 國立高雄師範大學特殊教育學系。 李佩蓉 (2007) :南部三縣市國中小普通班教 師對身,e.,障礙學生考試調整方式的看法與 實施之調查研究。國立臺南大學特殊教育 研究所碩士論文(未出版)。 林邦傑 (198 7) :整合分析的理論及其在國內 的應用。教育與心理研究,10 '
1-38 。 林筱汶、陳明聰 (2006) :語音調整策略對不 同能力學生數學文字題解題表現成效之研 究。載於國立嘉義大學特殊教育系主編: 2006 年特殊教育國際學術研討會論文集(
113-131 頁)。嘉義:編者。 洪靜↑台(2008)
:國小普通班教師對學習障礙 學生實施評量調整之調查研究。國立畫中 教育大學特殊教育學系碩士論文(未出 版)。 教育部 (2009) :特殊教育法。臺北:教育部。 莊虹姿 (2008) :國民小學資源班教師對身心 障礙學生評量調整意見之研究。國立畫中 教育大學特殊教育學系碩士論文(未出 版)。 陳明聰、張靖卿 (2004) :特殊教育工作者對 身心障礙學生測驗調整意見之調查研究。 特殊教育與復健學報,12 '
55-80 。 陳蓓蓉(2 003) :探討全盲生處理園中基捌數 學題表現的外在因素及內在因素。國立臺 灣師範大學科學教育研究所碩士論文(未 出版)。 鈕文英 (2009) :如何運用復說分析方法檢視 證據本位實務 O 未出版的于稿,國立高雄 師範大學特殊教育學系。 黃巧雲、陳明聰、陳政見 (2007) :語音合成 與真人錄音對國小高年級低閱讀能力數學 文字題解題表現差異之研究。載於國立臺 東教育大學特殊教育系主偏:特殊教育學 術研討會論文集( 81-106 頁)。臺東:編 者。 黃鳳慈 (2006) :台南地區國民中學學習障礙 學生評量調整措施之探討。國立彰化師範 大學特殊教育學系碩士論文(未出版)。 黃寶園、林世華 (2002) :合作學習對學習效 果影響之研究一統合分析。教育心理學 報,34
(1) ,
21-42 。· 44 .
特殊教育研究學刊 劉婷好、陳明聰、陳政見 (2008) ;不同電腦 化試題呈現方式對國小五年級學生在自然 科成就測驗表現影響之研究。載於國立臺 東教育大學特殊教育系主編:九十七年度 東台灣特殊教育學術研討會論文集( 23-40 頁)。臺東:編者。 鍾素香 (2004) :學習障礙學生家長對評量調 整的看法。載於國立臺灣師範大學特殊教 育系主編: 2004 年「追求研究卓越」特 殊教育學術研討會論文集( 100-105 頁)。 臺北:編者。*Baker
,
1.
S. (2006). Effect of extended time
test-ing accommodations on grade point averages
of college students with learning disabilities.
Dissertation Abstracts International
,
67( 1)
,
574 B.
Baron
,
R. M.
,
& Kenny
,
D. A.
(1
986). The
mod-erator-mediator variable distinction in social
psychological research: Conceptual
,
strategic
,
and statistical considerations.
Journal of
Personali矽 and
Social
Psychology, 刃,1173-1182.
Bielinski
, 1.,
Ysseldyke
, 1. E.,
Bolt
,
S.
,
Friedebach
,
M.
,
& Friedebach
,
1.
(200 I). Prevalence of
accommodations for students with
disabili-ties participating in a statewide testing
pro-gram.
Assess!仰11 戶rEffective Intervention.
26
,
21-28.
Bolt
,
S. E.
,
& Thurlow
,
M.
L.
(2004). Five of the
most frequently allowed testing
accommoda-tions in state policy.
Remedial and Special
Education
,
25(3)
,
141-152.
*Bolt
,
S. E.
, &
Ysseldyke
, 1.
E. (2006).
Compar-ing DIF across math and readCompar-ing/language
arts tests far students receiving a read-aloud
accommodation.
Applied Measurement in
Education
,
19(4)
,
329-355.
Bolt
,
S. E.
,
& Ysseldyke
, 1.
E. (2008).
Accommo-dating students with disabilities in
large-scale testing: A comparison of differential
item functioning (DIF) identified across
dis-ability types.
Journal of Psychoeducational
Assessment
,
26(2)
,
232-238
*Booth
,
D.
A.
(2003). The effects oftape recorded
testing for college students with and without
learning disabilities in reading and
process-ing speed.
Dissertation Abstracts
Interna-tional
,
54(01)
,
534B.
Byrnes
,
M. (2005).
Taking sides: Clashing views
on controversial issues in special education
(2
nded.). Chicago
,
lL: Irwin Press.
*Camara
,
W.
1.,
& Schneider
,
D. (2000).
Testing
with extended time on the SAT I: Effects for
students with learning disabilities.
New
York: College Entrance.
*Cahalan,仁,
Mandinach E.
,
& Camara
,
W.
1.
(2002). Predictive
validi砂 ofSAT I:
Reason-ing testfor test-takers with learnReason-ing
disabili-ties and extended time accommodations
New York: The College Reporting Board.
*Cahalan-Laitusis
, c.,
King
,
T.
,
Cline
,
F.
,
&
Bridgeman
,
B. (2006).
Observational timing
study on the SAT reasoning testfor test
的kers
with
learning
disabilities
and/or
ADD/ADHD. New Yark: The College
En-trance Examination Board.
*Calhoon
,
M. B.
,
Fuel芯,L.鼠,&
Hamlett
, C. L.
(2000). Effects of computer-based test
ac-commodations on mathematics perfonnance
assessments for secondary students with
learning
disabilities.
Learning
Disabili矽Quarter令"
23
,
271-282.
Chiu
, C.
W.
T., &
Pearson
,
P. D.
(1
999
,
June).
-l ;l jjIO .