實驗三 - 以部分XOR作業探討類別學習中XOR策略生成的原因

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

XOR 策略探討

實驗三

以知識分化的觀點來看部分 XOR 作業，第一個分歧點是參與者在訓練階段時是否要將知識分化成不同封包。在 Conaway 與 Kurt (2015) 的研究及實驗一、

二中，訓練階段總共只有 6 個刺激需要學習，且學習嘗試次眾多，要達到 100%

正確率並不困難，因此參與者可不必使用知識分化的策略。若參與者在訓練階段並沒有動用知識分化，那麼當進入到測驗階段並遭遇到未見過的刺激圖形時，參與者就該會也僅會將新的刺激放入整合無分化的類別空間中，單純地使用相似性進行判斷，即成為了接近性策略使用者。

若參與者嘗試在訓練階段進行知識分化，當其進入到測驗階段並遭遇到未見過的刺激圖形時，就會視新刺激出現在哪個區域而套用不同的分類知識。因為在部分 XOR 作業的典範下，並無額外情境線索，故只能依刺激的 X 特徵或 Y 特徵進行劃分，而不論是哪種分化方法，都會使得有一區域含有 A、B 兩類別範例，

另一區域則只有 A 類別範例跟更多先前未見過的特徵組合。

接下來就第二個分歧點：是否有兩類別錯覺。若稱有 A、B 兩類別範例的區域為空間一，只有 A 類別範例的區域為空間二，當參與者沒有意識到或不採用錯覺，則其可以簡單的將空間二直接都認為是 A 類別。若參與者有激發兩類別錯覺，

那麼他便會認為空間二中也會有屬於類別 B 的圖形，於是將比較不像既有 A 類別範例的新刺激歸類為 B 類別，是為 XOR 結構。

實驗二依循上述流程，並透過更改訓練階段的類別結構嘗試促使參與者知識分化；一旦知識分化的比例上升，儘管不操弄兩類別錯覺，XOR 策略人數比例也該會跟著上升（圖 16）。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

XOR 策略探討

圖 16：實驗三中 XOR 策略產生的流程

註：流程中實心線為通往 XOR 策略的過程（O 表示採用、X 表示不採用），並在上方舉例類別空間的劃分。

方法

實驗參與者與儀器。實驗參與者來自國立政治大學在學學生共 52 人，參與者會被隨機分配進入兩個情境，其中顏色組有 28 人，邊長組有 24 人。在實驗結束後會給予參與者費或心理學相關課程的加分。實驗會以 IBM-PC 相容之個人電腦進行，電腦皆使用 4:3 螢幕且固定為 1024*768 解析度。實驗流程、刺激呈現以及資料收集將皆由 Matlab 的 Psychotoolbox 套件(Brainard & Vision, 1997)的程式碼控制。

實驗刺激材料。刺激材料如同實驗二，使用由大小及顏色兩特徵所組合成的填色方塊，圖 17 左為顏色組，該訓練階段的結構中顏色比較單純，只有 4 種灰階色，

而在邊長特徵則出現較多不同的大小。如前述所言，在部分 XOR 作業中參與者僅能使用顏色與邊長作為情境線索，而在顏色組的結構中，顏色是比較簡單的特

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

XOR 策略探討

徵向度，參與者應會依照顏色分化兩個區域；邊長是比較複雜的向度但同時也蘊含較高的訊息量，參與者應會以邊長數值作為類別的界線。因此預期顏色組的參與者會以顏色作為知識分化的情境線索，將類別空間分成淺色（上半部）區域與深色（下半部）區域。圖 17 右為邊長組，根據同樣道理，會預期該組參與者會以邊長作為知識分化的情境線索，將類別空間分成大方塊（右半部）區域與小方塊（左半部）區域。

此外，若去計算結構中類別內特徵的相關性，會發現不論顏色組與邊長組 A 類別範例特徵間都為正相關，然而 B 類別內卻都是零相關，且可以看成是一組正相關的兩個範例，間隔一點距離再加上一組負相關的兩個範例。若參與者如同 DIVA 模型所言使用類別內特徵的關連性作為分類的判準，則會無法清楚區分 AB 兩類別。

另外，工作記憶廣度測驗如同實驗一使用 WMCBattery 套件，測量 MU、OS、

SS、SSTM 四個分測驗。

圖 17：實驗三訓練階段的類別結構

註：y 軸表示灰階，數字越大表示顏色越淺，數字越小表示顏色越深。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

XOR 策略探討

實驗程序。參與者會先閱讀實驗指導語（指導語並不特別鼓勵或反對使用假設檢定方式來發現規則），在確認沒有問題後才開始進行實驗。實驗流程分作兩部分，

一個部分 XOR 作業的分類實驗，另一部分則為工作記憶廣度的測驗，為了消除疲勞可能造成的影響，所有參與者會先進行分類實驗，並在一天以後進行工作記憶測驗。

所有參與者被隨機分配進入顏色組或邊長組，但兩情境除了訓練階段的類別結構不同之外，其他流程皆相同。分類實驗為一個部分 XOR 測驗，實驗設置與進行如同實驗二，唯 B 類別範例使用不同的四個刺激，並且在區段內不再重複。

結果

總共有 52 位參與者進行實驗，其中有 4 位僅進行完分類實驗就退出研究，

因此並沒有他們的工作記憶廣度分數，這些人其他完好的資料仍會納入計算。

圖 18：實驗三訓練階段的正確率

類別學習整體的表現。以正確率為依變項，區段（1 到 12）、情境（顏色組與邊 長組）為獨變項做二因子混和變異數分析，得到情境的主要效果邊緣顯著（F（1, 50） = 3.17, MSe = 0.46, p = .08），其中邊長組正確率表現有較高的趨勢。另外，

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

XOR 策略探討

區段的主要效果顯著（F（11, 550） = 42.33, MSe = 0.61, p < .01），事後檢定顯示 正確率從區段 1 到 5 有逐漸提升，並在區段 5 後穩定，交互作用則無顯著（F（11, 550） = 1.46, MSe = 0.02, p = .14）。在最後幾個區段中兩組的平均正確率都達到 .90，表示實驗參與者有確實精熟訓練階段的範例。

圖 19：實驗三測驗階段合併區段一二的答 A 機率值

圖 20：實驗三區段內的分類等高線圖傾向 註：左圖為顏色組的組內表現，右圖為邊長組的組內平均表現。

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

XOR 策略探討

圖 21：實驗三顏色組與邊長組測驗階段的分類等高線圖 註：左圖為顏色組的組內表現，右圖為邊長組的組內平均表現。

圖 22：測驗階段的分群

註：分群時將參與者在測驗階段中區段一、二的表現全部放入，num 表示該群中有多少筆資料。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

XOR 策略探討

劃分策略組。在實驗三中，鑒於訓練階段的刺激已經改變，使用原本的標準 XOR 或標準接近性策略結構（圖 13）可能不是一個適當的分類答案，因此採用由下而上（bottom-up）的方法將參與者的表現劃分成不同群聚。圖 22 顯示了七種群聚中的平均表現，其中可以見到第 5 群聚為一混亂的反應，因此排除，剩餘的六種群聚經過清理，將邊界劃分清楚後作為分類的模板，並且為了跟先前的實驗做比較，納入標準的 XOR 策略表現與標準的接近性策略（圖 13）表現，形成總共八種標準答案（圖 23），後續以這八種策略作為 K-means 分析方法中的種子（seed）

將參與者在測驗階段的表現進行劃分。

圖 23：測驗階段群聚的標準答案

註：1 到 4 為 XOR 策略及 XOR 策略的變形，5 到 8 為接近性策略與其變形。

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

XOR 策略探討

0.18, MSe = 0.4, p = .68），沒有支持實驗三與實驗二有差異。此外，區段和實驗之間的交互作用項也都沒有顯著。

第四象限回答 A 的比例之所以沒有下降，可能是因為類別結構的改變使得有些 XOR 答案中的比例不高（譬如：圖 23 中第 4 標準答案），所以儘管人次上升，

平均起來回答 A 類別的比例仍與實驗一沒有顯著差異。

若將第四象限中靠近象限與象限間邊界的刺激材料獨立出來計算，以其回答 A 類別的比例為依變項，實驗別為獨變項，則結果得到實驗別效果邊緣顯著 F（1, 198）= 3.15, MSe = 0.26, p = .078，實驗二相較於實驗三更傾向將第四象限邊界附 近的刺激分入 A 類別。這些介於邊界的刺激與第一、三象限的 A 範例相當接近，

容易受到距離的影響而認為較相似於 A 類別。然而，在實驗三中可能因為參與者被鼓勵使用知識分化，於是當類別空間被劃分成不同的區域時，跨區域的距離會被放大，處於第四象限邊界的刺激因而能免除受到一部份 A 範例的影響，回答 A 的傾向也就減少了。是故第四象限邊界刺激的回答 A 比例下降可為一支持參與者採用知識分化的證據。

圖 24：測驗階段各情境在四個象限回答 A 類別之比例

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

XOR 策略探討

圖 25：測驗區段各象限回答 A 類別之比例

結構的對稱性。先將圖 23 的八個標準答案拿來以公式(1)計算 S 指標，結果得到 XOR 策略組依序為 0.000、0.012、0.003、0.019，而接近性策略組依序為 0.020、

0.039、0.032、0.036，後四者顯著大於前四者（t（6）= -3.94, p < .01）。此外，

也可發現 XY 軸翻轉的結構（如第 2、第 4 標準答案）仍會保有相近的 S 值，表 示指標不會偏好 X 軸或 Y 軸。

雖然八個標準答案依然符合 XOR 策略組大於接近性策略組，然而有些組間數值相當接近（譬如：第 4 標準答案與第 5 標準答案），再加上前述劃分策略組和回答 A 類別比例的結果，顯然實驗三中 XOR 策略組已經不能單純以標準 XOR 結構來統一代表，必須將圖 23 中其他 XOR 答案納入討論。為此，本研究將 S 指標的公式改寫成如下：

𝑆 = [ (

^|𝑊¹^−𝑊³^|+|𝑊²^−𝑊⁴^|

) −

𝑥

∗ ∑ (

^|𝑊^𝑖1^−𝑊^𝑖3^|+|𝑊^𝑖2^−𝑊^𝑖4^|

)

𝑥𝑖=1

]

² (2)

其中 x 表示有幾個 XOR 策略組的標準答案。這個公式意思是，每個結構都可以用四個類神經網絡算得的鍵結值來表徵，此外這四個參數交錯相減 |𝑊₁− 𝑊₃| +

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

XOR 策略探討

比例增加了，即使不操弄兩類別錯覺，XOR 策略的比例依舊會上升。結果顯示 XOR 策略與接近性策略人次比例上升到接近 1 比 1，S 指標與第四象限回答類別 A 的比例也都較實驗二來得傾向 XOR，支持知識分化觀點。

工作記憶的分數在各分測驗的關聯性與實驗二大不相同，可能表示實驗三與實驗二的人群在工作記憶特性上有差異，然而，儘管如此，在實驗三的參與者中，

工作記憶廣度也仍與各項 XOR 傾向的指標無顯著關聯，顯示工作記憶廣度可能

在文檔中以部分XOR作業探討類別學習中XOR策略生成的原因 - 政大學術集成 (頁 40-56)

實驗三

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

實驗三

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

𝑆 = [ (

) −

∗ ∑ (

)

]

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學