2. 知感精確度的研究方法與測量指標
2.2 RJR 派典的列聯表資料分析指標
2.2.1 統計檢定
Hart (1965)最早使用的分析指標是統計檢定,他檢定以下兩組的數字是否有 顯著差異:第一組是有知感且再認正確(FOK hit)和沒有知感但再認正確(FOK̅̅̅̅̅̅
miss)(圖二),其中 hit 的意義為知感判斷與再認結果一致,而 miss 則代表兩者 不一致,如果「再認正確」反映受詴者的記憶裡確實存在這個項目,那麼 FOK hit 和̅̅̅̅̅̅ miss 的差異即代表「在記憶裡有這個項目的情況下,監控記憶能夠偵測FOK 到項目存在的程度」,此概念簡稱為「有知感」的精確度;第二組數字是沒有知 感且再認錯誤(FOK̅̅̅̅̅̅ hit)和有知感但再認錯誤(FOK miss),如果「再認錯誤」反映 受詴者的記憶裡不存在這個項目,那麼FOK̅̅̅̅̅̅ hit 和 FOK miss 的差異即代表「在記 憶裡沒有這個項目的情況下,監控記憶能夠偵測到項目不存在的程度」,此概念 簡稱為「沒有知感」(feeling of not knowing)的精確度。過去研究累積發現,有知 感的精確度通常會達到顯著,顯示監控記憶對於記憶項目存在的偵測能力良好,
可是相對而言沒有知感的精確度卻很不穩定。
統計檢定的分析法雖然易於做出知感精確度好/不好的二分法結論,可是它 也遭遇一些主要的難題。首先將「再認正確」等同於「項目存在記憶中」的假設 是難以成立的,因為只要是選擇題就會受到猜測的影響,再認正確可能只是隨機 猜對的結果。Gruneburg (1976)曾經嘗詴在指導語加入「如果無法再認請不要猜測 直接跳過」的要求,並把這些未作答的選擇題都算做再認錯誤,但是這樣做並沒 有讓檢定容易顯著,而且受詴者表示有些題目難以區分是隱約知道答案還是完全
不知道而使用隨機猜測。更重要的是,把有知感和無知感的資料分開來分析未必 確度指標的是 Gamma 係數(Goodman & Kruskal, 1954; Nelson, 1984):
γ = ad
不穩定的,有時還低得驚人(Thompson & Mason, 1996),我們的知感判斷對於記憶再認的表現
事實的預測似乎不可靠。然而到底是人類知感確實如此,還是 Gamma 係數這個 測量指標有問題?Schwartz & Metcalfe (1994)發現 Gamma 係數的大小會受到再認 測驗選項數目的影響,可是知感判斷是發生在再認測驗之前,理論上應該不會受 到影響才對。Glenberg & Epstein (1987)等研究認為,Gamma 係數也不能穩定地反 映知感精確度,以圖四的假設資料為例,圖(B)的記憶難度比圖(A)更大(再認正 確率 4/12 < 10/12),不過兩人知感判斷和再認正確與否「一致」和「不一致」情 況是一樣多的,顯示他們的知感能力應無差別,可是以(1)式計算會得出 0.8 和 0.9 並不相等。
Schraw (1995)認為問題出在 Gamma 係數的公式把不同細格的次數相乘,如 果採用把不同細格次數相加的 Hamann 係數,問題似乎迎刃而解:
HC=
a+d
(a+d)+(b+c)−
b+c
(a+d)+(b+c)=
a
− b − c+dN (2)
可是 Hamann 係數測到的真得是純粹的知感嗎?Wright (1996)認為,Hamman 係 數的分母包含將不同類別(一致/不一致)細格相加的邊緣數,不符合知感能力
(A)
圖六:鄭昭明對知感精確度的定義。
C =P1− P2
1− P2 =T1
d
− T2b
T1
d
(3)那麼 C 是否為一個純粹測量知感精確度且能排除猜測效果的指標呢?鄭昭明告訴 我們是的。他假設知感精確度的真實值為
α,α 是介於 0 到 1 之間的機率值,而
當知感判斷的標定為 ki(在無知感時,k2 = 0;在有知感時,k1 = 1),成功再認的 機率即為αk
i,可是不能再認的時候,受詴者還有 g 的機率會猜對,所以整體再認 正確率可以寫為Pi = αki+(1 − αki)g。把這個Pi代入(3)式可以得到C =[αk1+(1 − αk1)g] − [αk2+(1 − αk2)g]
1− [αk2+(1 − αk2)g]
=[α+(1 − α)g] − g 1− g =
α+g − αg − g
1− g =
α(1
− g) 1− g = α也就是說,C 這個測量值會剛好等於 α 這個真分數,它排除 g 的影響,而且完全 沒有誤差!
沒有誤差的測量值不免引起我的好奇,這與測驗學的概念似乎不太相容,為 什麼他可以做出上面的推導呢?如果我們把 Pi = αki+(1 − αki)g 這個式子改寫 一下:
Pi = αki + g − αki
g
Pi− g = α(ki− kig) α =
Pi− gk
i(1 − g) (4)我們可以看出 g = P2,且當選擇 i = 1 的時候,(4)式和(3)式是完全一樣的。所 以 C 和 α 其實存在一種「循環論證」的關係,它們是同一個概念,只是用了不同 的符號來表示,那麼可以推導出兩者相等也就不意外了。因此我們需要進一步檢 驗的是,Pi = αki+(1 − αki)g 究竟是不是一個具有心理實質性的參數模型?
根據這個式子,當受詴者判斷沒有知感的時候,再認的正確率為 P2 = αk2 + (1 − αk2)g = g
我認為這個結果混淆了「監控記憶」與「記憶」兩個不同層次的概念,再認正確 率僅為隨機猜測的機率並非發生在「沒有知感」的時候,而是發生在「沒有記憶」
的時候。事實上正由於我們的知感精確度並非百分之百,當受詴者主觀報告他沒 有知感,並不等於他確實沒有記憶,只是他「不知道自己知道」而已,在行為上 則很可能反映這種「無意識」的記憶,使得正確率明顯高於隨機猜測的機率值。
另一種情況,當受詴者判斷有知感的時候,再認的正確率為 P1 = αk1 + (1 − αk1)g = α + (1 − α)g
上式的意義為,當知感精確時能夠再認成功,或者在知感不精確時以 g 的機率猜 對。可是知感不精確這個情況是我們事後根據知感判斷與實際再認正確與否的比 較下才知道的,受詴者本身無從評估知感是否精確,他只能根據他的感覺做出選 擇,當他的感覺是「他知道」的時候,他就不會使用猜測,而是以他的感覺去選 擇那個事實上錯誤的答案。因此,這個式子的意義也不是很具有心理實質性。
綜合以上,鄭昭明的研究把知感精確度的測量推向一個新的里程碑,他是第 一個嘗詴在資料分析而非實驗設計的層次排除猜測對再認正確率的混淆,也是第 一個使用介於 0 到 1 之間的機率值描述知感精確度並引入參數模型的架構。而且
部分算出相當低 Gamma 係數的研究,如果以 C 值重新計算會得到比較高的指標,
多少也為某些學者聲稱人類記憶的自我監測根本不精確的「罪名」帄反。比較可 惜的是他的C= α 論證因陷入套套邏輯而略減說服力,同時他參數模型也不能很 完美地反映人類進行知感判斷的心理歷程。如果我們能夠把參數模型再加以精緻 化,並引入參數估計的概念,在這樣的基礎上,以機率作為知感精確度的指標應 該會是非常有力的分析取向。