第二章 文獻探討
第五節 粗動作發展測驗第二版之簡介
2-5-1 粗動作發展測驗第二版之起源
Ulrich 於 1985 年 發 展 一 套 粗 動 作 發 展 測 驗 工 具 (Test for Gross Motor Development,簡稱TGMD),主要依據「基本動作型態評量工具」(Fundamental Movement Pattern Assessment Instrument;簡稱 FMPAI)及「基本動作技能發 展程序量表」 (Development Sequence of Fundamental Motor Skill Inventory;
簡稱 DSFMSI) 發展而來,FMPAI包含肩上投擲、接球、踢、跑及平衡跳躍動作 等評估項目;DSFMSI包含走路的基本動作、韻律跳躍、單足跳躍、跑步、打擊、
踢、接球、投擲及空中踢球等基本動作。TGMD測驗工具提供7項移位能力及5 項物品傳接能力(Ulrich, 1985);經過十幾年不斷編修後於2000年重新修訂設計 了一套粗動作發展測驗第二版 (Test for Gross Motor Development-II,簡稱 TGMD-II)﹔TGMD-II是一套標準化且具有美國常模的參照測試工具,它為一套以 觀察式為主的基本動作能力測量工具,主要評估動作發展過程中”質”的表現結果 (Burton, 2001),常模收集於1997年至1998年的秋季來自美國十個州共計1208 位兒童,常模收集的特性包括:地理區域,性別和種族,居住地(城市或偏遠地 區),父母的教育程度等。
2-5-2 粗動作發展測驗第二版之評估目的及內容
TGMD-II 主要評估 3-10 歲 11 個月兒童之軀幹及四肢的基本動作品質表現 之協調性。量表共有移位能力及物品傳接能力兩個分測驗,分別各有六個測試項 目,移動性動作測驗(Locomotor)包括跑步、躍馬步、單腳連續跳、跨步跳、立 定跳遠及滑步側移;物品傳接動作測驗(Object Control)包括打擊靜止的球、原地 拍球、接球、踢球、過肩投球及低手滾球。每個測試項目依照其動作特性分別有 不同的評分標準。整個測試時間大約 20 至 30 分鐘,測試時間會隨著兒童的年 齡、能力、測試人員而有所改變。測試時應該盡量安排減少分心的環境。
2-5-3 粗動作發展測驗第二版之計分方式
TGMD-II的記分方式,主要依照每個動作技能項目所設定的3-5項評分標準 給予分數,當兒童執行動作時,若能正確符合各評分標準時,則每一評分標準給 予1分,若無法正確達成則不給分。最後將分數加總即可得到每個動作項目及分 測驗的原始總分,測試結果與常模樣本進行分析比較。
2-5-4 粗動作發展測驗第二版之信效度
評估工具必須具備良好之信效度,先前的研究結果顯示 TGMD-II 具有高度 的敏感性及效度(Evaggelinou, Tsigilis & Papa, 2002; Ulrich, 1985),信效度方面 包括探索性及驗證性因素分析,每項分測驗的項目在實證研究上獲得支持,評分 者間信度為 r=0.98,移位能力測驗之再測信度為 r=0.88,物品傳接能力測驗之 再測信度為 r=0.93,粗動作商數之再測信度為 r=0.96。α 值在各分測驗及綜合分 數的相關係數達0.90 以上;除此之外,Ulrich (2000)研究指出 TGMD-II 在移位 能力及物品傳接能力之內部一致性、穩定性及評分者之間的一致性相關係數範圍 為 r=0.84-0.96,建構效度方面由 Evaggelinou 等學者 (2002)針對 3-10 歲希臘 兒童調查,α 相關係數為 r=0.74-0.75。由以上資料顯示 TGMD-II 是一份具有合 宜信效度的評估工具。
2-5-5、粗動作發展測驗第二版之相關研究
TGMD-II 在 臨 床 及 研 究 上 也 經 常 運 用 , 2003 年 Niemeijer, Bouwien, Engelsman, Reynders與Schoemaker等人研究物理治療之語言行動是否可提高 發展協調障礙兒童的動作學習能力,作者調查物理治療師在動作協調障礙兒童之 神經動作任務訓練及動作教學原則分類,並在荷蘭進行神經動作的訓練,研究重 點在於直接教學;小兒物理治療師使用Movement-ABC及TGMD-II來確認兒童在 不同動作任務上現有的動作表現水準,了解TGMD-II及Movement-ABC在動作教 學原則下其動作能力之間的關係,經Spearman相關分析結果顯示,運用動作學 習理論觀察兒童動作訓練及教學原則,目的是為了提高三種動作學習項目第一、
給予指示,第二、提供或要求回饋,第三、分享知識。在組內間一致性方面,以 Kappa統計分析,組內相關係數ICCs範圍r=.60-.77之間,再測信度Kappa值 為.63-.99之間,顯示高度至極高度的相關,Niemeijer, Bouwien, Engelsman, Reynders與Schoemaker (2003)研究發現動作教學原則分類的信度與效度結果 進行課程上的介入,研究者以TGMD-II 及 Movement-ABC 作為研究工具,測量 動作教學原則與使用頻率的關連性,研究結果顯示,若研究重點放在動作品質的 表現上時,應該提供更多口頭上的線索及任務上的解釋,讓兒童在動作品質的表 現上能更正確。
2007年巴西學者Catenassi, Marques, Bastos, Basso, Ronque與Gerage等 人驗證4-6歲兒童之身體質量指數與粗大動作技巧之間的關係,實驗對象共計27
名兒童,平均年齡5.64±0.67,作者選擇TGMD-II(移位能力、物品傳接能力)與 KTK(平衡木倒退走、單腳跳跨越障礙物、左右交替跳躍及木箱上側向移動)進行 施測,以Spearman統計進行分析,研究結果顯示男女生的身體質量指數與年齡 無顯著相關性,而且TGMD-II及KTK測驗工具在身體質量的測量上亦無顯著相關 性。
2009 年 Hakimeh, Behroz, Mohsen, Hasan, Samaneh 與 Vahid 等人探討 7 至 9 歲伊朗的男孩在傳統遊戲訓練 8 週對基本動作技能的影響。作者以隨機抽 樣方式選取1000 名 7-9 歲男孩執行 TGMD-II 量表的預測,包括粗動作技巧、移 位能力、物品傳接能力等,測驗後隨機劃分為兩個組別。第一組接受傳統遊戲為 實驗組,第二組接受日常生活活動為對照組。第一組兒童接受24 堂傳統遊戲的 課程。分別在第 12 及 24 堂課結束後將實驗組及對照組進行中期和後期測試。
結果顯示,傳統遊戲在基本動作技能的平均數差異(17.12,p<.001),在移位能 力的平均數差異(2.23, p = .002),物品傳接能力(2.27, p = .002)說明了傳統 遊戲比日常活動有顯著差異。
第六節 效度
2-6-1 效度之意義
效度係指該測量工具是否能正確測量到所欲測量特性的程度(Anastasi &
Urbina, 1997),測量的效度越高,表示測量的結果越能顯現其所預測良內容的真 正 特 徵( 邱 皓 政 , 2006) , 效 度 係 數 最 常 用 到 的 計 量 方 法 就 是 相 關 係 數 。 Anastasi(1997)指出,效度係數就是測驗分數與效標間的相關,它可以反應測驗 所測量的特質與另一個概念間變動的一致性的程度,利用相關係數,可以很容易 的將兩個變項間的關係強度顯示出來。此外,測驗工具的區域性、時效性及測驗 結果的表現都需要加以考量與審慎使用(Lee & Harris, 2005)。
2-6-2 效度的種類:
1985 年 教 育 與 心 理 測 驗 標 準 (The standards for Educational and Psychological Testing) 將 效 度 分 成 三 類 : (1) 內 容 相 關 效 度 (content-related validity)目的在於了解該測驗能否充分的代表所欲測量範疇(domain),而不受其 他相關的因素影響,測驗分數間的差異全部來自於該測驗所定義的範疇。而與內 容相關效度有關的概念是「表面效度」(face validity),它主要為「支持一個領域 相關性的判斷證據,並且測驗工具內容的代表性而不是從測驗分數來推論所支持 的證據」。(2)效標關聯效度(criterion- related validity)目的在於檢視測驗分數能否 預測受測者在某些「效標」(criterion)上的表現,而「效標」係指測驗所想要預 測的一個測量(measurement)。另外一種則是同時收集測驗分數以及效標測量的 相關,舉例來說,在同一時間執行兩種量表的測試,並由兩位獨立觀察員進行個 別觀察同時進行比較,此種相關稱為「同時效度」(concurrent validity);同時效 度是一種標準效度類型,內容涉及文書審議及一些具有相同結構的測驗項目;因 PGMQ 量表之測驗項目與黃金標準測驗工具 TGMD-II 項目接近,故本論文將進 行此兩種工具之同時效度分析。(3)構念相關效度 (construct-related validity)目 的在於探討測驗已達某一個理論構念或特質的程度。其構念相關效度兩個重要的
概念為「收斂效度」(convergent validity)與「辨別效度」(divergent validity)。收 斂效度表示,若兩測驗工具具有相同的理論構念或特質,其兩個測驗分數的相關 性應該要高;辨別效度指若兩個測驗測量不同的理論概念獲特質時,那麼測驗分 數的相關性應該要很低(鄭麗玉、陳秀蓉、危芷芬、留佳莉,2006)。
2-6-3 影響效度的因素
(一)測量過程因素:測量過程是影響測驗分數波動的主要因素,它不僅影響 測量的穩定性,不良的測驗實施程序更可能降低其效度。例如:施測人員不當的 控制測驗情境,有意圖的引導作答方向,皆可能影響測驗結果的正確性。因此測 試過程的標準化可以說是測驗實施的重要原則,若無遵照標準化程序進行測量,
必然使效度降低而失去客觀測量的意義。
(二)樣本性質:效度的評估與選用的樣本具有密切的關係。同質樣本所得到 的測量分數變異量較低,在信度估計時不至於影響內部一致性等指標的估計,但 是可能因為測量變易量不足,導致與效標之間的相關性降低,而造成效度的低估。
(三)效標因素:效標關聯研究的價值取決於效標是否與欲測行為特質具關聯 性及效標是否具信度與效度(AERA, APA & NCME, 1999),不適當的效標選用可 能造成效度無法顯現或有低估的可能。在統計上,測驗本身的信度、效標的信度,
以及測驗與效標間的真正關係是影響效度係數高低的決定因素,PGMQ 與 TGMD-II 同為測量兒童的動作品質,不少文獻上指出 TGMD-II 是一套具有合宜 信效度的評估工具,但因PGMQ 所測驗之適用年齡範圍為 3-6 歲,而 TGMD-II 所測驗之適用年齡範圍為3-10 歲 11 個月兒童,測驗年齡層範圍較廣,因此對於 3-6 歲之學齡前兒童其測驗內容項目有部份較為困難。
(四)干擾變項:檢測時容易受到其他特質或干擾測量的影響,造成效度的混 淆,同時可能伴隨著測量工具的標準刺激而反應在測驗分數中,成為效度評估的 干擾變項。如果某些特質具有關鍵的影響,而研究者無力將其效果以統計控制或 平衡測量來進行分割,即可能受到影響,而失去效度的主要價值(張麗麗,民 98)。
2-6-4 同時效度相關研究
2008年Snyder, Eason, Philibert, Ridgway與McCaughney等人探討AIMS與 PDGMS-II總分之間的同時效度,樣本收集於35位患有雙重障礙(出生體重低於 1500公克以及出生為低收入家庭)或遲緩的嬰幼兒,這些經歷過高度危險的受測 者皆要執行AIMS與PDGMS-II的測量,研究結果顯示AIMS與PDGMS-II之皮爾森 積差相關係數為r=.90~.97,PDGMS-II之移位能力分測驗與AIMS的總分有高度 的相關性,而大於9個月的嬰幼兒之相關性降低,研究結果支持AIMS與PDGMS-II 在雙重障礙嬰幼兒之高危險之後續方案的同時效度是有效的,特別是在評估動作
2008年Snyder, Eason, Philibert, Ridgway與McCaughney等人探討AIMS與 PDGMS-II總分之間的同時效度,樣本收集於35位患有雙重障礙(出生體重低於 1500公克以及出生為低收入家庭)或遲緩的嬰幼兒,這些經歷過高度危險的受測 者皆要執行AIMS與PDGMS-II的測量,研究結果顯示AIMS與PDGMS-II之皮爾森 積差相關係數為r=.90~.97,PDGMS-II之移位能力分測驗與AIMS的總分有高度 的相關性,而大於9個月的嬰幼兒之相關性降低,研究結果支持AIMS與PDGMS-II 在雙重障礙嬰幼兒之高危險之後續方案的同時效度是有效的,特別是在評估動作