‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
有 64 個刺激,可能會意識到這些刺激都可以用對立捷思來解釋,因而在區段二 採用捷思來進行判斷,造成區段一二可能會有不同的策略運用。
圖 10:實驗二訓練階段出現的刺激材料
註:y 軸表示灰階,數字越大表示顏色越淺,數字越小表示顏色越深。
方法
實驗參與者與儀器。實驗參與者來自國立政治大學在學學生共 48 人,在實驗結 束後會給予參與者車馬費或心理學相關課程的加分。實驗以 IBM-PC 相容之個人 電腦進行,電腦皆使用 4:3 螢幕且固定為 1024*768 解析度。實驗流程、刺激呈 現以及資料收集皆由 Matlab 的 Psychotoolbox 套件(Brainard & Vision, 1997)的程式 碼控制。
實驗刺激材料。在類別學習部分,實驗材料參考 Conaway 與 Kurtz (2015) 的研究,
使用由邊長長度(像素)和顏色(灰階黑到白)兩個特徵向度所組成的填色矩形 作為刺激。矩形大小及矩形顏色都是連續尺度,以此二特徵可以畫成一個二維的 類別空間,X 軸數值表示邊長長度,Y 軸數值表示灰階顏色(0 表示黑色,255 表示白色),空間中的點就是一個填色矩形的刺激。將大小取出等距的 8 個值:
‧
140、200、260、320、380、440、500、560;灰階取出等距的 8 個值:25、50、
75、100、120、150、175、200,總共形成 64 個特徵組合,在訓練階段使用其 中的 6 種作為刺激:(140, 25)、(200, 50)、(500, 175)、(560, 200)為 A 類別,
(140, 200)、(260, 150)為 B 類別,而在測驗階段中則全部使用。
在工作記憶廣度測驗中,本實驗採用 Lewandowsky, Oberauer, Yang 與 Ecker (2010) 研發的 Matlab 程式套件,總共有四個分測驗:memory updating(MU)、
operational span(OS)、sentence span(SS)、spatial short-term memory (SSTM)。
這四個測驗能涵蓋工作記憶大部分的範疇:言語面向對應空間面向,及儲存功能 是 B 則按下「;」鍵,按下後螢幕會出現「Correct」或「Wrong」的回饋訊息。
測驗階段中有兩個區段,每個區段中使用類別空間中 8 x 8 所有的點,共 64 種填色矩形刺激,每種刺激各出現一次,共 64 個嘗試次。每個嘗試次中會出一
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
個填色矩形刺激,參與者要判斷該圖形屬於類別 A 或類別 B,若認為是 A 則按下 鍵盤上的「S」鍵,若認為是 B 則按下「;」鍵,但不會給予回饋。在區段一結 束後有提供間隔,參與者可以稍作休息後再進入區段二。區段二的流程與區段一 相同,但刺激呈現的順序為另一組隨機序列,不與區段一相同。
結果
總共有 48 位參與者進行實驗,其中有 1 位因為程式當機或主試者的操作失 誤而在工作記憶廣度的部分分測驗上有遺漏,另有 1 位因為資料毀損而沒有工作 記憶廣度分數,這兩位參與者其他完好的資料仍會納入計算。
圖 11:實驗二訓練階段的正確率
類別學習整體的表現。以正確率為依變項,區段(1 到 12)為獨變項做單因子受 試者內變異數分析,發現區段的主要效果顯著(F(11, 517) = 43.85, MSe = 0.58,
p < .01),事後檢定顯示正確率從區段 1 到 3 有逐漸提升,並在區段 4 後穩定。
在最後幾個區段中平均正確率達到 .95,表示實驗參與者有確實精熟訓練階段的 範例。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
24
圖 12:實驗二測驗階段合併區段一二的答 A 機率值
在測驗階段中,參與者會對所有 64 個刺激進行分類,回答該圖形屬於 A 或 B 類別,平均所有參與者的答案繪製出圖 8,其中顏色越深表示回答 A 類別的比 例越高,越淺則 B 類別的比例越高。從圖 8 可以發現,延續訓練階段,參與者在 測驗階段時能掌握第一、三象限為 A 類別,第二象限為 B 類別的規則,而第四 象限則為搖擺的象限,有些人認為是 A 有些人認為是 B,因而呈現中間機率的灰 色。以下將參與者分為使用 XOR 策略者與使用接近性策略者兩組來進行探討。
劃分策略組。如同實驗一,設定 XOR 標準答案與接近性標準答案(圖 13),並計 算參與者的反應與兩標準答案的距離值。參與者的表現會被分入距離值較小的那 組策略,如果參與者兩個典型性值相同,則分入 50/506組。參與者在測驗階段中 區段一、二的表現分開計算,可以各自被歸入不同的策略組。
6實驗二中 XOR 與接近性標準答案只在第四象限有差異,意即若第四象限回答 A 類別的比例大於 0.5,則參與者在測驗階段的表現會被歸類為接近性策略使用者;若回答 A 類別的比例小於 0.5,
則會被歸類為 XOR 策略使用者;若參與者回答 A 類別的比例與 B 類別的比例相等就會無法確定 屬於 XOR 抑或接近性策略,只好歸入 50/50 組。50/50 組也同字面意思表示此組內參與者第四象 限的回答 AB 類別比例各半。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
圖 13:實驗二預測及測驗階段所使用的標準答案
表 1 實驗二參與者在測驗階段區段間使用策略列聯表 Block1
Block2 XOR 策略 50/50 接近性策略
XOR 策略 11 1 3
50/50 1 0 2
接近性策略 5 2 23
表 2 實驗二參與者在測驗階段各區段使用策略列聯表
XOR 策略 50/50 接近性策略
Block1 17 3 28
Block2 15 3 30
跨區段的策略運用。表 1 為測驗階段各區段間採用策略的列聯表。從表中會發現 參與者在區段間會傾向使用相同的策略,排除 50/50 組後使用 McNemar 卡方計 算改變顯著性,結果為 𝒳2 (1, n = 42)= 0.13, p = .72,表示區段一與區段二策 略的改變不顯著,參與者可能沒有如實驗預期般在區段間改變回答的策略。
表 2 為測驗階段區段一二採用策略的人次表,由表中可以得知在 XOR 策略 與接近性策略的比例上,區段一二分別為:17(35.42%)比 28(58.33%)、15(32.61%)
‧
二分別和實驗一所觀察到的 13(35.14%)比 24(64.86%)作卡方同質性檢定得 到 𝒳2 (1, n = 82) = 0.00, p = .99 和 𝒳2 (1, n = 82) = 0.00, p = 1 表示實驗二不‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
或接近性策略那樣的極端可能是因為參與者在判斷時並不一定使用中間值作為 界線(參考圖 12 中的界線),或是實驗中不小心按錯鍵所造成。為檢驗測驗區段 間是否有改變,以區段、象限作為獨變項、回答 A 類別的比例作為依變項進行變 異數分析,結果象限的主要效果顯著(F(3, 141) = 87.58, MSe = 9.17, p < .01)
顯著象限間有差異。此外,區段的主要效果(F(1, 47) = 9.38, MSe = 0.09, p < .01)
和區段與象限的交互作用(F(3, 141)= 6.41, MSe = 0.10, p < .01)都顯著,檢驗 單純主要效果後發現區段的差異來自於第一象限(F(1, 47)= 19.35, MSe = 0.35,
p < .01),而在關鍵的第四象限中區段一與區段二並無顯著差異(F(1, 47)= 0.42,
MSe = 0.01, p = .52),與實驗預期不完全相同。
實驗二另外也預期實驗操弄會使得參與者 XOR 策略傾向降低,取實驗一的 資料作為對照基準,實驗二的回答 A 類別比例應該較低。記錄實驗二區段一與區 段二關鍵第四象限的比例,並分別對實驗一關鍵第一象限的數值進行 t 檢定,結 果得到前者 t(83)= -1.34, p = .18,後者 t(83)= -1.16, p = .25,皆無顯著差異,
表示實驗二中 XOR 策略傾向與實驗一相仿,並不如預期般有所減少。
圖 14:測驗階段各象限回答 A 類別之比例
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
28
圖 15:單維度結構範例
結構的對稱性。除了上述所說的差異外,XOR 策略結構上非常對稱,既在 X 軸與 Y 軸上有對稱軸,更同時對稱右上到左下的對角線和左上到右下的對角線。相比 之下,接近性策略只對稱左上到右下的對角線,而若受試者只是單純地使用單一 特徵向度來進行分類,譬如圖 15 所示,這種單維度(uni-dimensional)的結構就 僅會在其中一個特徵向度上有對稱軸,也不會在任何對角線對稱。依循這種想法,
本研究建立了一個 S 指標(s 表示 symmetry)來展現類別結構的對稱性,這種指 標能區分出 XOR 策略與其他結構在對稱性上的差異,除了能用來將參與者的表 現劃分策略組,更能將結構數值化,得以記錄結構間的不同。
為了捕捉對稱性,首先找出類別空間中在四個角上的刺激作為基準點,將原 先每個刺激點的二維座標改寫成在空間中此刺激點到四個基準點的歐幾里得距 離,故新生成一含有四個元素的座標。舉例而言,第二象限的基準座標點的新座 標就為(7, 0, 7, 7√2)。之後,將此座標丟入一個兩層類神經網絡(neural network)
來進行學習,輸入層有四個節點分別對應四個座標元素,輸入經過各自的鍵結在 一個輸出節點上加總,最後若加總興奮值大於 0 則表示判斷為 A,小於 0 表示判 斷為 B。跟據 Abdi, Valentin 與 Edelman (1999, pp. 58-60),此處使用的兩層類神 經網絡可以使用擬反矩陣(pseudo inverse)直接忽略學習過程得到最後鍵結值。
‧
‧
XOR 策略組的反應時間會顯著低於接近性策略組(p<.01)以及 50/50(p<.05)組。而區段二中則沒有差異(F(2, 765) = 0.33, MSe = 5.22, p = .72)。
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
32
實驗二否定了以對立捷思作為 XOR 策略生成原因的想法,雖非刻意為之,
但與先前相仿的結果也使得實驗二的資料恰好能作為實驗三、四比較的基準點,
使得我們能除了人數比例之外,將第四象限回答 A 類別的比例或對稱性等指標納 入分析,能更精細的比較異同。在對立捷思遭受反駁後,實驗三、四中,以知識 分化作為理論,檢驗分類表現是否會分別受到類別結構和刺激特徵特性的影響。
最後,工作記憶廣度與 XOR 策略的使用並沒有穩定的相關,可能無法確立 工作記憶廣度大小為 XOR 策略生成與否的原因。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討