國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
實驗三
以知識分化的觀點來看部分 XOR 作業,第一個分歧點是參與者在訓練階段 時是否要將知識分化成不同封包。在 Conaway 與 Kurt (2015) 的研究及實驗一、
二中,訓練階段總共只有 6 個刺激需要學習,且學習嘗試次眾多,要達到 100%
正確率並不困難,因此參與者可不必使用知識分化的策略。若參與者在訓練階段 並沒有動用知識分化,那麼當進入到測驗階段並遭遇到未見過的刺激圖形時,參 與者就該會也僅會將新的刺激放入整合無分化的類別空間中,單純地使用相似性 進行判斷,即成為了接近性策略使用者。
若參與者嘗試在訓練階段進行知識分化,當其進入到測驗階段並遭遇到未見 過的刺激圖形時,就會視新刺激出現在哪個區域而套用不同的分類知識。因為在 部分 XOR 作業的典範下,並無額外情境線索,故只能依刺激的 X 特徵或 Y 特徵 進行劃分,而不論是哪種分化方法,都會使得有一區域含有 A、B 兩類別範例,
另一區域則只有 A 類別範例跟更多先前未見過的特徵組合。
接下來就第二個分歧點:是否有兩類別錯覺。若稱有 A、B 兩類別範例的區 域為空間一,只有 A 類別範例的區域為空間二,當參與者沒有意識到或不採用錯 覺,則其可以簡單的將空間二直接都認為是 A 類別。若參與者有激發兩類別錯覺,
那麼他便會認為空間二中也會有屬於類別 B 的圖形,於是將比較不像既有 A 類 別範例的新刺激歸類為 B 類別,是為 XOR 結構。
實驗二依循上述流程,並透過更改訓練階段的類別結構嘗試促使參與者知識 分化;一旦知識分化的比例上升,儘管不操弄兩類別錯覺,XOR 策略人數比例也 該會跟著上升(圖 16)。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
34
圖 16:實驗三中 XOR 策略產生的流程
註:流程中實心線為通往 XOR 策略的過程(O 表示採用、X 表示不採用),並在上方舉例類別空 間的劃分。
方法
實驗參與者與儀器。實驗參與者來自國立政治大學在學學生共 52 人,參與者會 被隨機分配進入兩個情境,其中顏色組有 28 人,邊長組有 24 人。在實驗結束後 會給予參與者費或心理學相關課程的加分。實驗會以 IBM-PC 相容之個人電腦進 行,電腦皆使用 4:3 螢幕且固定為 1024*768 解析度。實驗流程、刺激呈現以及 資料收集將皆由 Matlab 的 Psychotoolbox 套件(Brainard & Vision, 1997)的程式碼控 制。
實驗刺激材料。刺激材料如同實驗二,使用由大小及顏色兩特徵所組合成的填色 方塊,圖 17 左為顏色組,該訓練階段的結構中顏色比較單純,只有 4 種灰階色,
而在邊長特徵則出現較多不同的大小。如前述所言,在部分 XOR 作業中參與者 僅能使用顏色與邊長作為情境線索,而在顏色組的結構中,顏色是比較簡單的特
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
徵向度,參與者應會依照顏色分化兩個區域;邊長是比較複雜的向度但同時也蘊 含較高的訊息量,參與者應會以邊長數值作為類別的界線。因此預期顏色組的參 與者會以顏色作為知識分化的情境線索,將類別空間分成淺色(上半部)區域與 深色(下半部)區域。圖 17 右為邊長組,根據同樣道理,會預期該組參與者會 以邊長作為知識分化的情境線索,將類別空間分成大方塊(右半部)區域與小方 塊(左半部)區域。
此外,若去計算結構中類別內特徵的相關性,會發現不論顏色組與邊長組 A 類別範例特徵間都為正相關,然而 B 類別內卻都是零相關,且可以看成是一組正 相關的兩個範例,間隔一點距離再加上一組負相關的兩個範例。若參與者如同 DIVA 模型所言使用類別內特徵的關連性作為分類的判準,則會無法清楚區分 AB 兩類別。
另外,工作記憶廣度測驗如同實驗一使用 WMCBattery 套件,測量 MU、OS、
SS、SSTM 四個分測驗。
圖 17:實驗三訓練階段的類別結構
註:y 軸表示灰階,數字越大表示顏色越淺,數字越小表示顏色越深。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
36
實驗程序。參與者會先閱讀實驗指導語(指導語並不特別鼓勵或反對使用假設檢 定方式來發現規則),在確認沒有問題後才開始進行實驗。實驗流程分作兩部分,
一個部分 XOR 作業的分類實驗,另一部分則為工作記憶廣度的測驗,為了消除 疲勞可能造成的影響,所有參與者會先進行分類實驗,並在一天以後進行工作記 憶測驗。
所有參與者被隨機分配進入顏色組或邊長組,但兩情境除了訓練階段的類別 結構不同之外,其他流程皆相同。分類實驗為一個部分 XOR 測驗,實驗設置與 進行如同實驗二,唯 B 類別範例使用不同的四個刺激,並且在區段內不再重複。
結果
總共有 52 位參與者進行實驗,其中有 4 位僅進行完分類實驗就退出研究,
因此並沒有他們的工作記憶廣度分數,這些人其他完好的資料仍會納入計算。
圖 18:實驗三訓練階段的正確率
類別學習整體的表現。以正確率為依變項,區段(1 到 12)、情境(顏色組與邊 長組)為獨變項做二因子混和變異數分析,得到情境的主要效果邊緣顯著(F(1, 50) = 3.17, MSe = 0.46, p = .08),其中邊長組正確率表現有較高的趨勢。另外,
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
區段的主要效果顯著(F(11, 550) = 42.33, MSe = 0.61, p < .01),事後檢定顯示 正確率從區段 1 到 5 有逐漸提升,並在區段 5 後穩定,交互作用則無顯著(F(11, 550) = 1.46, MSe = 0.02, p = .14)。在最後幾個區段中兩組的平均正確率都達 到 .90,表示實驗參與者有確實精熟訓練階段的範例。
圖 19:實驗三測驗階段合併區段一二的答 A 機率值
圖 20:實驗三區段內的分類等高線圖傾向 註:左圖為顏色組的組內表現,右圖為邊長組的組內平均表現。
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
圖 21:實驗三顏色組與邊長組測驗階段的分類等高線圖 註:左圖為顏色組的組內表現,右圖為邊長組的組內平均表現。
圖 22:測驗階段的分群
註:分群時將參與者在測驗階段中區段一、二的表現全部放入,num 表示該群中有多少筆資料。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
40
劃分策略組。在實驗三中,鑒於訓練階段的刺激已經改變,使用原本的標準 XOR 或標準接近性策略結構(圖 13)可能不是一個適當的分類答案,因此採用由下 而上(bottom-up)的方法將參與者的表現劃分成不同群聚。圖 22 顯示了七種群 聚中的平均表現,其中可以見到第 5 群聚為一混亂的反應,因此排除,剩餘的六 種群聚經過清理,將邊界劃分清楚後作為分類的模板,並且為了跟先前的實驗做 比較,納入標準的 XOR 策略表現與標準的接近性策略(圖 13)表現,形成總共 八種標準答案(圖 23),後續以這八種策略作為 K-means 分析方法中的種子(seed)
將參與者在測驗階段的表現進行劃分。
圖 23:測驗階段群聚的標準答案
註:1 到 4 為 XOR 策略及 XOR 策略的變形,5 到 8 為接近性策略與其變形。
‧
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
44
0.18, MSe = 0.4, p = .68),沒有支持實驗三與實驗二有差異。此外,區段和實驗之 間的交互作用項也都沒有顯著。
第四象限回答 A 的比例之所以沒有下降,可能是因為類別結構的改變使得有 些 XOR 答案中的比例不高(譬如:圖 23 中第 4 標準答案),所以儘管人次上升,
平均起來回答 A 類別的比例仍與實驗一沒有顯著差異。
若將第四象限中靠近象限與象限間邊界的刺激材料獨立出來計算,以其回答 A 類別的比例為依變項,實驗別為獨變項,則結果得到實驗別效果邊緣顯著 F(1, 198)= 3.15, MSe = 0.26, p = .078,實驗二相較於實驗三更傾向將第四象限邊界附 近的刺激分入 A 類別。這些介於邊界的刺激與第一、三象限的 A 範例相當接近,
容易受到距離的影響而認為較相似於 A 類別。然而,在實驗三中可能因為參與者 被鼓勵使用知識分化,於是當類別空間被劃分成不同的區域時,跨區域的距離會 被放大,處於第四象限邊界的刺激因而能免除受到一部份 A 範例的影響,回答 A 的傾向也就減少了。是故第四象限邊界刺激的回答 A 比例下降可為一支持參與者 採用知識分化的證據。
圖 24:測驗階段各情境在四個象限回答 A 類別之比例
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
圖 25:測驗區段各象限回答 A 類別之比例
結構的對稱性。先將圖 23 的八個標準答案拿來以公式(1)計算 S 指標,結果得到 XOR 策略組依序為 0.000、0.012、0.003、0.019,而接近性策略組依序為 0.020、
0.039、0.032、0.036,後四者顯著大於前四者(t(6)= -3.94, p < .01)。此外,
也可發現 XY 軸翻轉的結構(如第 2、第 4 標準答案)仍會保有相近的 S 值,表 示指標不會偏好 X 軸或 Y 軸。
雖然八個標準答案依然符合 XOR 策略組大於接近性策略組,然而有些組間 數值相當接近(譬如:第 4 標準答案與第 5 標準答案),再加上前述劃分策略組 和回答 A 類別比例的結果,顯然實驗三中 XOR 策略組已經不能單純以標準 XOR 結構來統一代表,必須將圖 23 中其他 XOR 答案納入討論。為此,本研究將 S 指 標的公式改寫成如下:
𝑆 = [ (
|𝑊1−𝑊3|+|𝑊2−𝑊4|2
) −
1𝑥
∗ ∑ (
|𝑊𝑖1−𝑊𝑖3|+|𝑊𝑖2−𝑊𝑖4|2
)
𝑥𝑖=1
]
2 (2)其中 x 表示有幾個 XOR 策略組的標準答案。這個公式意思是,每個結構都可以 用四個類神經網絡算得的鍵結值來表徵,此外這四個參數交錯相減 |𝑊1− 𝑊3| +
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
XOR 策略探討
48
比例增加了,即使不操弄兩類別錯覺,XOR 策略的比例依舊會上升。結果顯示 XOR 策略與接近性策略人次比例上升到接近 1 比 1,S 指標與第四象限回答類別 A 的比例也都較實驗二來得傾向 XOR,支持知識分化觀點。
工作記憶的分數在各分測驗的關聯性與實驗二大不相同,可能表示實驗三與 實驗二的人群在工作記憶特性上有差異,然而,儘管如此,在實驗三的參與者中,
工作記憶廣度也仍與各項 XOR 傾向的指標無顯著關聯,顯示工作記憶廣度可能
工作記憶廣度也仍與各項 XOR 傾向的指標無顯著關聯,顯示工作記憶廣度可能