第二章 文獻回顧
第三節 動作評估工具於發展遲緩兒童信效度之相關研究
一個良好的評估工具需要下列的幾點特性:(1)可接受性;(2)簡單;
(3)耗費;(4)適用性;(5)信度;(6)效度(廖華芳,2006)。在建構評估工具 之初,會考量施測方式是否易被教導、以及所耗費的時間和金錢;再者,
新建構的評估工具是否向其他的評估工具一樣,具有良好的心理計量特 性,如信度與效度;最後,評估工具運用於各族群的適用性與可信性是 否不減。換言之,良好的評估工具不僅應具備使用的簡易條件外,評估 的結果在各族群中也能具有良好的信效度來支持。因此,本節將著重於 發展遲緩兒童在使用動作評估工具時,相關的信效度之建立與探討。
壹、 信度
信度代表評估工具的一致性或穩定性(吳明隆,2007),主要可分成兩 個層面:包含施測者和評估工具本身。施測者的信度又可分成施測者內 信度以及施測者間信度,施測者內信度是指同一受試者,由同一個施測 者在不同的時間內施測相同的內容,結果是否會因施測者本身而有所差 異;施測者間信度,則是指同一受試者,由不同的施測者來進行施測,
結果是否會因不同的施測者而有所差異,這類的研究方式大多會透過影 帶的紀錄進行再評估(Burton & Miller, 1998)。一個具有良好的施測者信 度,是不會因施測者本身或是不同施測者而在結果上出現極大的差異。
此外,評估工具本身的內部一致性是指測驗題目間的同質性與穩定性,
施測內容是否能緊緊的相扣著施測的目的或潛在的概念,這部分大多透 過內部一致性係數(Cronbach α)的統計方式來進行探討 (朱倍毅,2007;
Burton & Miller, 1998)。
貳、 效度
效度是指評估工具本身所施測的結果是否適切、以及有意義的呈現出 評估工具當初設計時所要探討的行為特質。效度本身所討論的不是針對 評估工具本身,而是評估工具的結果是否為正確或可靠。效度主要又可 分成內容效度(context validity)、效標關聯效度(criterion-related validity)、
以及建構效度(construct validity) (吳明隆,2007)。內容效度是指評估工具 本身的內容,是否有包含欲施測領域中所有的相關行為,例如動作評估 是否有包含粗大動作以及精細動作的部分,通常透過題目分布的合理性 來判斷。效標關聯效度,指的是評估工具的結果與效標之間的相關性來 顯示評估工具效度的高低,其中所提及的效標又可稱為黃金標準,以評 估工具而言,通常會選取常被使用且具有良好心理計量的評估工具當效 標。效標關聯的效度可分成同時效度(concurrent validity)以及預測效度 (predictive validity),同時效度通常使用相關係數來探討,透過比對黃金 標準以及新建構的評估工具之結果,兩者相關係數越高則可代表新的評 估工具的同時效度越佳,同時效度的應證對於新建構的評估工具來說是 很重要(廖華芳,2006);預測效度則為評估工具的結果是否能預測未來 受試者在某方面能力的表現。
最後為建構效度,是指評估的結果能夠解釋多少理論所提及的概念 或特性,通常一個評估工具的建構是透過文獻回顧和理論基礎而成的,
因此,一個具有良好建構效度的評估工具應該能回應當初建構所引用的 理論、概念或特質,所以一個具有良好健構效度之評估工具,應該能呈 現出下面五點的關係:(1)各分測驗間應有中度之相關;(2)總分與分測驗 間應達高度之相關;(3)與另一個黃金標準的評估工具至少有中度之相 關;(4)能反映出年齡對於發展的影響;(5)能反映出與正常發展的兒童之 差異(朱倍毅,2007;Burton & Miller, 1998; Folio & Fewell, 2000)。
參、 發展遲緩兒童動作評估工具的相關信度之研究
有研究針對 7 到 10 歲智能障礙兒童使用 TGMD-II 的信度研究,結 果在各分測驗與總分的再測信度皆有高度相關(Simons et al., 2007)。此 外,智能障礙兒童使用BOTMP 的信度,再測信度為 0.88 ~ 0.99 有著極 佳的信度(Wang & Su, 2009)。然後,有研究討論 AIMS 於早產兒身上的 信度,研究結果顯示在施測者間信度與施測者內信度皆達高度的相關性 (Jeng et al., 2000)。最後,Wang, Liao 與 Hsieh(2006)探討腦性麻痺兒童使 用PDMS-II 的相關信度,再測信度的結果為 0.88 ~ 0.99 亦有高度的相關 性。因此,研究者整理相關文獻後發現,具有良好信度的評估工具不會 因不同的族群或類型而影響施測的結果。
肆、 發展遲緩兒童動作評估工具的相關效度之研究
Simons 等人(2007)探討 7 到 10 歲智能障礙兒童使用 TGMD-II 的表 現,在效度部分預期年齡的效益會與總分和各分測驗的結果有相關性,
最後則顯示年齡的效益僅於物品傳接能力有相關。另一個研究則探討 AIMS 使用於早產兒之與 BSID II 的同時效度,受試者為六個月與十二個 月兒童,皆接受AIMS 與 BSID-II 的評估,結果皆具有高度相關(r = .78
~ .90, p < .0001) (Jeng et al., 2000),反映出 AIMS 與 BSID-II 間具有良好 的同時效度之關係。此外,有研究探討BSID-II 和 PDMS-II 於發展遲緩 兒童的同時效度,受試者各別接受BSID-II 與 PDMS-II 的評估,結果在 年齡分數相關性為 r = .85 ~ .97,而在標準分數的相關性則為 r = .67
~ .75,皆具有中度至極高的相關性。最後,Maring 與 Elbaum(2007)針對 Early Intervention Developmental Profile 運用於發展遲緩兒童進行同時效 度的研究,選以PDMS-II 當作效標並使用皮爾森積差相關來瞭解兩者的 相關性,結果為兩個評估工具間有著高度的相關性。
除了上述相關評估工具著重於同時效度的建構外,新的評估工具還
需要有建構效度的建立,像是有研究探討BOTMP 的 Short-Form 與 MABC 於發展協調障礙兒童的建構效度分析,主要想瞭解身體質量指 數、體適能以及日常活動這三者與兩個評估工具上的相關,結果顯示這 三者的分數與兩個評估工具的分數有相關,BMI 越高、體適能差與日常 活動少,則BOTMP 的分數越高而 MABC 的分數越差,表示體重越重、
體力較差以及活動量過少的兒童的動作協調性也較差,則顯示出兩個評 估工具皆具有良好的建構效度,並將這三者的因素反映到發展遲緩兒童 的動作能力(Spironello, Hay, Missiuna, Faught, & Cairney, 2010);由此可 以看出建構效度的重要性,而且建構效度須透過一系列相關的研究才能 建構的更完善(朱倍毅,2007)。
研究者由文獻回顧後發現,在建構新的評估工具的同時,也須瞭解 不同族群上是否能有一樣的效度,以及評估工具所建構的內容是否完善 且能準確反映到相關因素的影響。
伍、PGMQ 信效度之相關研究:
本研究選取 PGMQ 為探討發展遲緩兒童動作品質之評估工具,然而 研究者發現PGMQ 尚未建立運用發展遲緩兒童的信效度。先前在正常發 展的兒童身上具有良好的施測者信度以及與PDMSII-GM 有良好的同時 效度(Liu, Zhu, & Sun, 2010;Sun et al, 2010),但在建構效度以及效標關聯 效度中還有不足的地方。以建構效度而言,相關文獻提及一個良好建構 效度應該能呈現至少五種關係(Folio & Fewell, 2000),而回顧 PGMQ 運 用於正常發展兒童之研究結果,發現PGMQ 各分測驗間有達中度以上的 相關、PGMQ 的總分與各分測驗有達中度以上的相關、PGMQ 與
PDMSII-GM 在各分測驗與總分具有中度以上的相關、以及 PGMQ 能反 映出年齡因素對於正常發展兒童的動作品質之影響,共四種相關於建構 效度之關係(Sun et al, 2010),然而缺乏 PGMQ 是否能反映出發展遲緩兒
童與正常發展兒童之間的差異,因此本研究的建構效度有一部分為為探 討PGMQ 是否能反映發展遲緩對於動作品質之影響。
此外,先前 PGMQ 相關同時效度的研究中,是以 PDMSII-GM 為黃 金標準來與PGMQ 進行同時效度探討(Sun et al, 2010),而研究者回顧相 關的動作評估工具後也發現, PDMS-II-GM 所評估的面向較 TGMD-II 完善,而且適用年齡比起AIMS 僅能評估 0 ~ 18 個月的嬰幼兒來的合適,
也是目前常用於評估各類型發展遲緩兒童動作能力的評估工具,因此研 究者也與先前的研究一樣,仍以PDMSII-GM 為黃金標準來與 PGMQ 進 行同時效度探討。最後,探討PGMQ 之施測者內信度與施測者間信度在 發展遲緩兒童身上,是否能有高度的穩定性。
六、總結
本節透過相關的文獻發現,一個具有良好信度之評估工具不會因樣 本的特性或是施測者而有太大的變動,而具有良好效度之評估工具則可 能會因樣本特性不同而有所差異,所以在不同族群如發展遲緩兒童,仍 須建立評估工具相關的信效度,以確認其評估工具的準確性。此外,由 於PGMQ 為先新建構的動作評估工具,其相關的文獻較為缺乏,尤其尚 未運用於發展遲緩兒童這個族群,因此,唯有透過先確立PGMQ 於發展 遲緩兒童身上是否具有良好的信效度,才能更進一步的探討PGMQ 結果 來分析發展遲緩兒童在動作品質上是否有所差異。