動作評估工具於發展遲緩兒童信效度之相關研究

第二章文獻回顧

第三節動作評估工具於發展遲緩兒童信效度之相關研究

一個良好的評估工具需要下列的幾點特性：(1)可接受性；(2)簡單；

(3)耗費；(4)適用性；(5)信度；(6)效度(廖華芳，2006)。在建構評估工具之初，會考量施測方式是否易被教導、以及所耗費的時間和金錢；再者，

新建構的評估工具是否向其他的評估工具一樣，具有良好的心理計量特性，如信度與效度；最後，評估工具運用於各族群的適用性與可信性是否不減。換言之，良好的評估工具不僅應具備使用的簡易條件外，評估的結果在各族群中也能具有良好的信效度來支持。因此，本節將著重於發展遲緩兒童在使用動作評估工具時，相關的信效度之建立與探討。

壹、信度

信度代表評估工具的一致性或穩定性(吳明隆，2007)，主要可分成兩個層面：包含施測者和評估工具本身。施測者的信度又可分成施測者內信度以及施測者間信度，施測者內信度是指同一受試者，由同一個施測者在不同的時間內施測相同的內容，結果是否會因施測者本身而有所差異；施測者間信度，則是指同一受試者，由不同的施測者來進行施測，

結果是否會因不同的施測者而有所差異，這類的研究方式大多會透過影帶的紀錄進行再評估(Burton & Miller, 1998)。一個具有良好的施測者信度，是不會因施測者本身或是不同施測者而在結果上出現極大的差異。

此外，評估工具本身的內部一致性是指測驗題目間的同質性與穩定性，

施測內容是否能緊緊的相扣著施測的目的或潛在的概念，這部分大多透過內部一致性係數(Cronbach α)的統計方式來進行探討 (朱倍毅，2007；

Burton & Miller, 1998)。

貳、效度

效度是指評估工具本身所施測的結果是否適切、以及有意義的呈現出評估工具當初設計時所要探討的行為特質。效度本身所討論的不是針對評估工具本身，而是評估工具的結果是否為正確或可靠。效度主要又可分成內容效度(context validity)、效標關聯效度(criterion-related validity)、

以及建構效度(construct validity) (吳明隆，2007)。內容效度是指評估工具本身的內容，是否有包含欲施測領域中所有的相關行為，例如動作評估是否有包含粗大動作以及精細動作的部分，通常透過題目分布的合理性來判斷。效標關聯效度，指的是評估工具的結果與效標之間的相關性來顯示評估工具效度的高低，其中所提及的效標又可稱為黃金標準，以評估工具而言，通常會選取常被使用且具有良好心理計量的評估工具當效標。效標關聯的效度可分成同時效度(concurrent validity)以及預測效度 (predictive validity)，同時效度通常使用相關係數來探討，透過比對黃金標準以及新建構的評估工具之結果，兩者相關係數越高則可代表新的評估工具的同時效度越佳，同時效度的應證對於新建構的評估工具來說是很重要(廖華芳，2006)；預測效度則為評估工具的結果是否能預測未來受試者在某方面能力的表現。

最後為建構效度，是指評估的結果能夠解釋多少理論所提及的概念或特性，通常一個評估工具的建構是透過文獻回顧和理論基礎而成的，

因此，一個具有良好建構效度的評估工具應該能回應當初建構所引用的理論、概念或特質，所以一個具有良好健構效度之評估工具，應該能呈現出下面五點的關係：(1)各分測驗間應有中度之相關；(2)總分與分測驗間應達高度之相關；(3)與另一個黃金標準的評估工具至少有中度之相關；(4)能反映出年齡對於發展的影響；(5)能反映出與正常發展的兒童之差異(朱倍毅，2007；Burton & Miller, 1998; Folio & Fewell, 2000)。

參、發展遲緩兒童動作評估工具的相關信度之研究

有研究針對 7 到 10 歲智能障礙兒童使用 TGMD-II 的信度研究，結果在各分測驗與總分的再測信度皆有高度相關(Simons et al., 2007)。此外，智能障礙兒童使用BOTMP 的信度，再測信度為 0.88 ~ 0.99 有著極佳的信度(Wang & Su, 2009)。然後，有研究討論 AIMS 於早產兒身上的信度，研究結果顯示在施測者間信度與施測者內信度皆達高度的相關性 (Jeng et al., 2000)。最後，Wang, Liao 與 Hsieh(2006)探討腦性麻痺兒童使用PDMS-II 的相關信度，再測信度的結果為 0.88 ~ 0.99 亦有高度的相關性。因此，研究者整理相關文獻後發現，具有良好信度的評估工具不會因不同的族群或類型而影響施測的結果。

肆、發展遲緩兒童動作評估工具的相關效度之研究

Simons 等人(2007)探討 7 到 10 歲智能障礙兒童使用 TGMD-II 的表現，在效度部分預期年齡的效益會與總分和各分測驗的結果有相關性，

最後則顯示年齡的效益僅於物品傳接能力有相關。另一個研究則探討 AIMS 使用於早產兒之與 BSID II 的同時效度，受試者為六個月與十二個月兒童，皆接受AIMS 與 BSID-II 的評估，結果皆具有高度相關(r = .78

~ .90, p < .0001) (Jeng et al., 2000)，反映出 AIMS 與 BSID-II 間具有良好 的同時效度之關係。此外，有研究探討BSID-II 和 PDMS-II 於發展遲緩兒童的同時效度，受試者各別接受BSID-II 與 PDMS-II 的評估，結果在 年齡分數相關性為 r = .85 ~ .97，而在標準分數的相關性則為 r = .67

~ .75，皆具有中度至極高的相關性。最後，Maring 與 Elbaum(2007)針對 Early Intervention Developmental Profile 運用於發展遲緩兒童進行同時效度的研究，選以PDMS-II 當作效標並使用皮爾森積差相關來瞭解兩者的相關性，結果為兩個評估工具間有著高度的相關性。

除了上述相關評估工具著重於同時效度的建構外，新的評估工具還

需要有建構效度的建立，像是有研究探討BOTMP 的 Short-Form 與 MABC 於發展協調障礙兒童的建構效度分析，主要想瞭解身體質量指數、體適能以及日常活動這三者與兩個評估工具上的相關，結果顯示這三者的分數與兩個評估工具的分數有相關，BMI 越高、體適能差與日常活動少，則BOTMP 的分數越高而 MABC 的分數越差，表示體重越重、

體力較差以及活動量過少的兒童的動作協調性也較差，則顯示出兩個評估工具皆具有良好的建構效度，並將這三者的因素反映到發展遲緩兒童的動作能力(Spironello, Hay, Missiuna, Faught, & Cairney, 2010)；由此可以看出建構效度的重要性，而且建構效度須透過一系列相關的研究才能建構的更完善(朱倍毅，2007)。

研究者由文獻回顧後發現，在建構新的評估工具的同時，也須瞭解不同族群上是否能有一樣的效度，以及評估工具所建構的內容是否完善且能準確反映到相關因素的影響。

伍、PGMQ 信效度之相關研究：

本研究選取 PGMQ 為探討發展遲緩兒童動作品質之評估工具，然而研究者發現PGMQ 尚未建立運用發展遲緩兒童的信效度。先前在正常發展的兒童身上具有良好的施測者信度以及與PDMSII-GM 有良好的同時效度(Liu, Zhu, & Sun, 2010;Sun et al, 2010)，但在建構效度以及效標關聯效度中還有不足的地方。以建構效度而言，相關文獻提及一個良好建構效度應該能呈現至少五種關係(Folio & Fewell, 2000)，而回顧 PGMQ 運用於正常發展兒童之研究結果，發現PGMQ 各分測驗間有達中度以上的相關、PGMQ 的總分與各分測驗有達中度以上的相關、PGMQ 與

PDMSII-GM 在各分測驗與總分具有中度以上的相關、以及 PGMQ 能反映出年齡因素對於正常發展兒童的動作品質之影響，共四種相關於建構效度之關係(Sun et al, 2010)，然而缺乏 PGMQ 是否能反映出發展遲緩兒

童與正常發展兒童之間的差異，因此本研究的建構效度有一部分為為探討PGMQ 是否能反映發展遲緩對於動作品質之影響。

此外，先前 PGMQ 相關同時效度的研究中，是以 PDMSII-GM 為黃金標準來與PGMQ 進行同時效度探討(Sun et al, 2010)，而研究者回顧相關的動作評估工具後也發現， PDMS-II-GM 所評估的面向較 TGMD-II 完善，而且適用年齡比起AIMS 僅能評估 0 ~ 18 個月的嬰幼兒來的合適，

也是目前常用於評估各類型發展遲緩兒童動作能力的評估工具，因此研究者也與先前的研究一樣，仍以PDMSII-GM 為黃金標準來與 PGMQ 進行同時效度探討。最後，探討PGMQ 之施測者內信度與施測者間信度在發展遲緩兒童身上，是否能有高度的穩定性。

六、總結

本節透過相關的文獻發現，一個具有良好信度之評估工具不會因樣本的特性或是施測者而有太大的變動，而具有良好效度之評估工具則可能會因樣本特性不同而有所差異，所以在不同族群如發展遲緩兒童，仍須建立評估工具相關的信效度，以確認其評估工具的準確性。此外，由於PGMQ 為先新建構的動作評估工具，其相關的文獻較為缺乏，尤其尚未運用於發展遲緩兒童這個族群，因此，唯有透過先確立PGMQ 於發展遲緩兒童身上是否具有良好的信效度，才能更進一步的探討PGMQ 結果來分析發展遲緩兒童在動作品質上是否有所差異。

在文檔中學前粗大動作品質量表運用於發展遲緩兒童之信效度 (頁 40-45)

第二章 文獻回顧

第三節 動作評估工具於發展遲緩兒童信效度之相關研究

第二章文獻回顧

第三節動作評估工具於發展遲緩兒童信效度之相關研究