• 沒有找到結果。

第三章 研究結果

第二節 心智理論測驗信效度分析

立 政 治 大 學

Na tiona

l Ch engchi University

40

第二節 心智理論測驗信效度分析

壹、項目分析

首先針對本測驗之各題項進行題項之難度分析(見表7)。整體題項之難度 介於.25~1 之間。部分「慾望或情境引起的情緒與信念」以及「基本信念」題項 偏易,全數TD 受試者皆正確回答(難度為 1),題項本身不存在變異性。最困 難的題目為第44 題,難度為.25,該題為「第二階錯誤信念」分測驗中「散 步」故事的確認題項。

「第一階錯誤信念」分測驗中第24 和 25 題的「積木在哪裡」故事,兩題 難度分別為.57 和.55,約僅有一半 TD 受試兒童通過;同分測驗第 30 和 31 題的

「餅乾盒」故事難度則分別達.94 和.92。由於過去研究顯示多數學齡前的兒童 即能通過第一階錯誤信念作業,而本研究中的學齡受試兒童在屬於第一階錯誤 信念作業的「餅乾盒」故事上雖與過去表現相當,另一個「積木在哪裡」故事 通過率卻只有約一半。細看受試者在「積木在哪裡」故事中第24 和 25 題的反 應,雖有少數受試者在24 題答錯的受試者在 25 題的確認問題中回答出其他合 理化的答案(例如:「弟弟跟他(姊姊)說」、「因為他(姐姐)可能剛才有聽到 那個,應該說他可能已經知道積木是放在哪個桶子裡」),多數受試兒童的回答 仍反映其缺乏第一階錯誤信念概念的答案(例如:「因為積木在左邊那個桶子 裡」、「因為弟弟打開左邊的桶子裡面是積木,所以姊姊也會打開那個」)。

與過去國外研究所使用的第一階錯誤信念作業相較,「積木在哪裡」故事的 架構為「甲發現了應該放在A 處的物品被錯放在 B 處,後來乙走了進來,乙會 去哪裡尋找應該放在A 處的物品呢?」,而 Baron-Cohen、Leslie 與 Frith

(1985)Sally-Anne 故事架構則是「乙將物品放在 A 處,甲在乙沒看到時將物 品從A 處移到 B 處,乙回來了,乙會去哪裡尋找該物品呢?」,可見兩個故事 架構不同的地方在於「積木在哪裡」故事中並沒有引導受試者思考原本乙的信 念為何,這可能導致兩個故事不同的測量結果。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

41

「諷刺」分測驗中,第48、51、54 題難度皆為 1(題項內容為「OOO 說 的話是真的嗎?」),但相對應第49、52、55 題的確認問題難度則介於.43 至.63

(題項內容為「為什麼OOO 要這樣說?」)。顯示所有 TD 受試者皆可正確辨識 出說話者的話語表面並非其真正的意思,但未必能夠正確回答說話者如此說的 原因或意圖。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

42

表 7、心智理論測驗各題項難度分析結果

分測驗 慾望或情境引起的情緒與信念問題

題號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 難度 1 .98 1 .94 .98 .92 .98 .94 .96 .92 .92 .92 .98 .96 1 .92 .84

分測驗 基本信念問題 第一階錯誤信念

題號 18 19 20 21 22 23 24 25 26 27 28 29 30 31 難度 .90 .51 .94 .73 1 .98 .57 .55 .88 .98 .98 1 .94 .92

分測驗 第二階錯誤信念

題號 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 難度 .98 .98 .86 1 .92 .65 .39 1 1 .76 1 .39 .25 .92 .98

分測驗 諷刺

題號 47 48 49 49A* 50 51 52 52A* 53 54 55 55A*

難度 .98 1 .43 .83 1 1 .55 .87 .98 1 .63 .68

分測驗 隱喻

題號 56 57 57A* 58* 58A* 59 60 60A* 61* 61A* 62 63 63A* 64* 64A*

難度 1 .57 .86 .98 1 1 .69 .87 .96 1 .98 .78 .85 1 1

分測驗 失態

題號 65 66 67 68* 69* 70 71 72 73 74* 75* 76* 77 78 79 80* 81*

難度 .88 1 .90 .89 .85 .75 1 .98 .63 .92 .83 .70 .94 .90 .96 1 1 題號 82 83 84 85 86* 87* 88

難度 .88 .90 .63 .80 .93 .81 .84

註1:灰底的題項為控制問題或額外的追問題項,不列入總分計算。

2:n = 51;唯打*符號的題項可能因測驗中止原則或遺漏值等因素,n = 13 ~ 50。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

43

貳、心智理論測驗和其他測驗表現之相關

將心智理論測驗和生理年齡、智力測驗、社會溝通問卷(SCQ)、語言發展 等測驗表現進行相關分析(見表8)。

以生理年齡來看,心智理論測驗和生理年齡在TD 組中存在顯著之正相關

(p < .01),但 HFA 組中則無此趨勢(p > .05)。智商方面,心智理論測驗在 TD 組和 HFA 組中皆有顯著正相關(p < .05);但若將語言智商和操作智商分開 來看,語言智商僅在HFA 組中存在顯著正相關(p < .001),操作智商則僅在 TD 組中存在顯著正相關(p < .05)。語言發展方面,以修訂學齡兒童語言障礙 評量表進行評估,HFA 組和 TD 組的心智理論測驗總分皆和語言表達、語言理 解、語言發展有顯著正相關(p < .05)。此外,心智理論測驗總分則與 TD 組的 SCQ 總分存在顯著負相關(p < .01),若將 SCQ 視為自閉症傾向的粗估測量工 具,心智理論測驗的表現和一般兒童表現出的自閉症傾向存在負相關。

同樣為評量語言能力的工具,心智理論測驗的總分和修訂學齡兒童語言障 礙評量表的表現在TD 及 HFA 兩組皆呈現顯著正相關,但和簡版 WISC-III 所測 量之語文智商上僅有HFA 組呈現顯著正相關。比較兩個測驗的不同,簡版 WISC-III 僅評估到兒童的詞彙理解表達以及推理能力,修訂學齡兒童語言障礙 評量表除了評估上述能力外,也評估到兒童的與生活情境相關的語文問題、語 句記憶和重述、短篇故事的理解和敘述等能力,後者應更能反映受試者的整體 語言發展情形。這顯示整體語言發展確實和心智理論能力的表現,唯HFA 組可 能較TD 組兒童在心智理論發展上可能更仰賴語言發展中的詞彙理解表達和語 言推理能力的使用。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

45

參、內部一致性信度

「慾望或情境引起的情緒與信念」以及「基本信念」兩個分量表,因其中 部分題項偏易、全數TD 受試者皆正確回答,使題項本身不存在變異性,不宜 進行內部一致性分析。此外,考量到同一故事內的心智理論問題以及其對應之 確認問題在計分上並非互相獨立,亦即當心智理論的問題未通過時其對應的確 認問題也必定未通過(例如:若受試者在「弟弟會打開哪一個箱子?」的題項 上答錯,則在「為什麼弟弟會打開那一個箱子?」題項上則必定也會答錯),若 將兩個相關題項作為獨立題項進行內部一致性信度分析會有高估信度的情形,

因此各分量表以同一故事之得分加總,再進行內部一致性信度考驗,以了解測 驗內所測量的構念是否一致。另外,除了分測驗內之內部一致性信度的檢驗 外,也將各分測驗間的表現進行相關分析,以了解測驗間所測量的構念是否一 致。

整體內部一致性信度(見表9)Cronbach’s α 為.69,表現尚可。各分量表 的內部一致性信度表現方面:「諷刺」和「隱喻」的Cronbach’s α 較佳,分別 為.86 和.88。其他表現較不佳的分測驗包括:「第一階錯誤信念」Cronbach’s α

= .41,「第二階錯誤信念」Cronbach’s α = .53,「失態」Cronbach’s α = .56。

由各分測驗表現的相關矩陣可見,「第一階錯誤信念」和「第二階錯誤信 念」與其他分測驗之間的表現皆無顯著相關(p > .05),顯示此兩個分測驗所測 量的構念和其他心智理論分測驗的測量較不相似;「諷刺」、「隱喻」和「失態」

三個分測驗間則皆達到顯著相關(p < .05),顯示三個分測驗間所測量的構念相 似。

結果顯示,整體測驗之內部一致性尚可,其中「諷刺」和「隱喻」分量表 的不同故事間具良好之內部一致性信度,「第一階錯誤信念」、「第二階錯誤信 念」等分測驗之內部一致性信度不佳;「失態」分測驗內的內部一致性信度雖不 佳,但整體測驗表現與其他測驗間尚有較佳的一致性。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

46

表 9、心智理論測驗各分測驗之內部一致性信度以及測驗間表現之相關矩陣 第一階錯誤信念

Cronbach’s α = .41

第二階錯誤信念 Cronbach’s α = .53

諷刺

Cronbach’s α = .86

隱喻

Cronbach’s α = .88

失態

Cronbach’s α = .56

第一階錯誤信念 .18 .01 .06 -.03

第二階錯誤信念 .12 .21 .14

諷刺 .30* .37**

隱喻 .31*

失態

*p < .05; **p < .01; ***p < .001 註:TD 組 n = 51

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

47

肆、評分者間一致性信度

為探討心智理論測驗所使用的計分系統之評分者間信度,研究者招募另一 名不清楚本研究目的和受試兒童所屬組別的大學部學生擔任第二評分者,並進 行測驗計分系統的訓練,完成2 份逐字稿的計分練習以及討論,計分系統亦包 含物理及心理辯證內容的歸類(計分標準可參考附錄一和表4 的說明)。完成訓 練後,研究者隨機抽取共24 份受試者的回答逐字稿(為全體受試者的 20%,其 中包含TD 組和 HFA 組各 12 名受試者),予第二評分者進行評分,期間不再給 予指導,唯第二評分者有遺漏時提醒其補上計分。控制問題多為具標準答案之 故事理解題,不列入信度分析。考量測驗本測驗計分屬於類別變項,各題項以 Cohen’s Kappa 係數評估題項的評分者間信度。

評估者間信度分析結果顯示(見表10),大多數題目 Kappa 值可達.60 以 上。第6 和 12 題的 Kappa 係數雖分別只有.33 和.51,但考量到該兩個題項的難 度接近1,Kappa 係數在此情況下對於不一致的反應會特別敏感,且評分者間 一致性仍皆高達.88,因此判定該兩個題項的評分者間信度表現尚可接受。

其餘表現較差的題項,包含58、61 和 64 題,皆為「隱喻」分測驗中相對 應的確認題項,Kappa 值為.37 至.59,一致性則為.54 至.71。細看不一致的反 應,多為研究者判定為物理辯證內容,第二評分者則判定為心理辯證內容(例 如:60 題為:「同學說:『小美是大水桶」,同學說的話是真的嗎?」,61 題為:

「同學為什麼要這樣說?」,受試者回答「因為小美吃得很胖,所以有點像水 桶。」,此即為研究者判定為物理辯證內容,第二評分者則判定為心理辯證內容 的例子。)。由於研究者已於研究前進行訓練,仍在最後得出不一致的判斷,這 顯示使用目前的計分系統在「隱喻」分測驗的辯證問題上仍不穩定,容易導致 不同評分者在判斷物理或心理辯證內容時出現不一致的判斷;相較之下Happé

(1994)的研究中評分者間一致性可達.92 以上。

整體來說,本測驗尚有不錯的的評分者間一致性信度,唯在「隱喻」分測 驗確認問題的辯證內容向度的判斷上仍可能容易出現評分者間不一致的判斷。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

48

表 10、心智理論測驗各題項評分者間一致性信度分析

分測驗 慾望或情境引起的情緒與信念問題

題號 1 2 3 4 5 a 6 7 8 9 10 11 12 13 14 16 17 一致性 1 1 1 .96 .96 .88 1 .96 1 1 .92 .88 .96 .96 1 .96 Kappa 1 1 1 .65 NA .33 1 .65 1 1 .70 .51 .65 .65 .65 .83 分測驗 基本信念問題 第一階錯誤信念 第二階錯誤信念 題號 18 19 20a 21 22 23 24 25 30 31 37 38 43 44 一致性 1 .92 .88 .79 1 .88 1 .75 .92 .83 .92 .83 1 .88 Kappa 1 .88 NA .65 1 .77 1 .65 .78 .73 .83 .71 1 .81 分測驗 諷刺 隱喻

題號 48 49 51 52 54 55 57 58 60 61 63 64 一致性 1 .88 1 .83 .96 .88 .92 .71 .88 .54 .96 .71 Kappa 1 .84 1 .79 .65 .84 .83 .53 .72 .37 .90 .59 分測驗 失態

題號 67 68 69 73 74 75 79 80 81 85 86 87 一致性 1 .96 .96 .88 .92 .92 .96 1 1 1 .96 .96 Kappa 1 .85 .92 .68 .76 .76 .83 1 1 1 .85 .93

註1:a 第 5 題和第 20 題,因其中一個計分者一致給予其中一種計分,而無法計算一致性的期望值及 Kappa 係數。

註1:a 第 5 題和第 20 題,因其中一個計分者一致給予其中一種計分,而無法計算一致性的期望值及 Kappa 係數。