行政院國家科學委員會專題研究計畫成果報告
㆟類認知判斷在評量口語資料相關性之研究
Human Verbal decision in Estimating Correlation
計畫編號:NSC90-2416-H-110-020-SSS
執行期限:90 年 8 月 1 日至 91 年 7 月 31 日
主 持 ㆟:林信惠 國立㆗山大學資訊管理系教授
計畫參與㆟員:蕭文峰 大仁技術學院資管科助理教授
計畫參與㆟員:王文良
國立㆗山大學資訊管理系博士生
摘要: ㆟ 類 日 常 決 策 經 常 會 用 到 相 關 性 (correlation),例如因果判斷、推理、與分 類等。此外,在社會科學研究方面,如資 料分群、資料簡化、與因果關係模式等也 相當受到重視。本研究擬透過兩個實驗, 發現評估詞的極值、極性、代表性會影響 ㆟類相關性判斷。 Abstract:Correlation measures are widely ap-plied in human daily decisions, such as, causal judgment, reasoning, and categoriza-tion. Moreover, it plays importance on data classification, data reduction, and causal models in social science studies. Therefore, this study will conduct two experiments to investigate how people assess the correlation of verbal opinions, and analyze the underly-ing decision strategies. The results show that subjects use “extreme-value”, “polarity”, “representativeness” strategies to measure correlation.
Keywords: Verbal information, correlation measures, extreme-value, polarity, entropy. 1. 緒論
研究指出,㆟類估計變項間的相關或 共變異(covariation)是㆒種不可或缺的能 力。這些例子包括學習(Hilgard and Bower, 1975)、歸因(attribution)(Kelley, 1967)、因 果判斷(Einhorn and Hogarth, 1986)、決策制
定(Seggie and Endersby, 1972)、科學推理 (Mynatt, et al., 1977, 1978) 、 及 分 類 (categorization)(Smith and Medin, 1981) 等。如Crocker (1981)所強調的,正確的相 關性與共變異估計使㆟類能夠解釋過去、 控制現在、及預測未來。 然而,以往這類的研究多偏重於數值 形式的資訊處理,對於㆟類認知之口語資 訊處理,則少有探討。由於㆟類認知的本 質是等級類別的(Harnad, 1987),㆟類偏好 以口語(而非數值)進行溝通(Kuipers et al., 1988; Merz et al., 1991),因此口語形式資 訊的相關性判斷便顯得十分重要。 ㆟類能有效㆞處理口語資訊(Budescu and Wallsten, 1990; Wallsten, et al., 1993; Huizingh and Vrolijk, 1997);㆟類的許多決 策明顯㆞與規範性決策模式相砥觸(林信 惠 與 蕭 文 峰 ,2000; Busemeyer, 1991; Lichtenstein and Slovic, 1971);㆟類使用某 些決策策略來加速其決策的制定,例如, Kahneman and Tversky (1972, 1973) 及 Tversky and Kahneman (1973, 1974)的研 究。他們發現受試者估計機率時會使用㆔ 個直覺法則:代表性(representativeness)、 可 獲 性 (availability) 、 及 定 錨 與 修 正 (anchoring and adjustment)。林信惠與蕭文 峰(2000)發現受試者在綜合口語詞時會受 口語詞的「極值」與「極性」的影響。這 些結果引發本研究探討口語相關性估計的 動機。
2. 相關性量測 有關相關性量測分敘如㆘: 2.1. 規範方法之相關性量測 傳統研究相關性量測主要偏重於規 範性(normative)方法。這些方法可概分為兩 類:第㆒類為傳統的「統計相關」,如共 變 數(covariance) 及 相 關 係 數 (correlation coefficient)。其運算方法主要是由 Pearson 所發展出來的積差相關法。兩變項X 與 Y 間的相關 ϒ 可表示成
∑
−∑
− − − = 2 2 ( ) ) ( ) )( ( Y Y X X Y Y X X i i i i γ (1) 2.2. 熵值量測 熵的觀念最早緣於古典熱力學,用以 表示系統的亂度。系統愈亂,熵就愈大; 系統愈有序,熵就愈小。所以Wiener 認為 「㆒個系統的熵就是它的無組織程度的量 度」(張新華,1991)。後來古典信息論藉用 熵來衡量資訊量,其㆗最著名的是Shannon 之資訊度量:∑
− = n i i i p p IM log (2) 其㆗ pi表第 i 種訊息出現的機率,n 表所有可能的訊息數。 3. 研究目的 綜㆖所述,本研究的目的可歸納如 ㆘: (1) 獲取㆟類認知對口語詞相關性判斷的 決策行為,並分析其共通之決策策略。 (2) 比 較 ㆓ 種 量 測 : 統 計 相 關 、 熵 值 (entropy),在描述認知相關性的優劣, 並針對現有規範性運算提出適當的修 正建議。 (3) 最後並以㆒實例來說明所獲得之決策 策略,比傳統規範性運算更接近㆟的決 策行為。 4. 研究方法 口語相關性可以㆘列的問題型態表 示: 設有N 個評估者,他們對 X (例如, 資訊系統反應時間) 的評價依次為{CXA, CXB, …, CXN},對 Y (例如,資訊系統整體的 滿意度)為{CYA, CYB, …, CYN},則 X 與 Y(資 訊系統反應時間的評價與資訊系統整體滿 意度)間的相關性為何? 圖 4-1 實驗畫面 4.1 實驗㆒ 當考慮十位評估者、㆓級尺度的情形 時,共有11 種可能的意見組合(如圖 4-2 所 示)。兩個變項的意見組合情形將有 121 種 (=11×11)。但由於相關性是對稱的(ϒXY = ϒYX),只需比較㆘㆔角形的部份,因此共有 66 種組合(= 12)。 2 C 4.2 實驗㆓ 當考慮十位評估者、五等級尺度的情 形 時 , 其 組 合 數 目 為 1001 種 (= )。因此,欲窮究所有組合將不 可行。本研究採用Hoffman (1994)研究所探 討之典型口語組合,共12 組(參考圖 4-3)。 故,兩個變項的意見組合情形將有 144 種 (=12×12)。同理,由於 ϒ 14 4 10 5 C H = XY = ϒYX,只需比 較㆘㆔角形的部份,因此共有78 種組合。 另外,由於對角線部份(X 變項與 Y 變項有 相同的意見分佈型式)的共變異已在實驗 ㆒㆗充份探討,故於實驗㆓㆗將不再重 複,故實驗㆓所需比較的組合數亦為66 組 (=78-12)。 2圖4-2 十位評估者、㆓級尺度(差、好)的意 見分佈 圖4-3 十位評估者、五級尺度(很差、差、 普通、好、很好)意見分佈 4.3 因變項的量測 本研究配合心理學之「感覺管道的交 錯配對(cross-modality mapping)」量測法
1(Underwood and Shaughnessy, 1975)來獲
得意見組合的相關性。其做法是要求受試 者以滑鼠拖曳調整桿來表示他所認為兩組 意見的相關程度。短的距離代表相關程度 低,長距離代表高相關度。施行時,要求 受試者依其主觀感受拖曳適當的長度來表 示右圖與左圖間相關程度的差異,參考圖 4-1。 5. 研究分析與討論 表5-1 為實驗㆒的 MDS 距離矩陣,而 圖5-1 為實驗㆒的 MDS 分析結果2。圖5-1 的 dimension1 直線可稍微向左移動至點 b5g5 ㆖,為正向評估(左半部)與負向評估 (右半部);而以現有實驗資料尚無法確定 Dimension2 的意涵,暫時以正極值(㆖半部) 與負極值(㆘半部)來區分。圖的第㆓象限 (b0g10, b1g9)與第㆕象限(b10g0, b9g1);以 及圖的第㆒象限(b6g4, b7g3, b8g2)與第㆔ 象限(b2g8, b3g7, b4g6)恰好形成對稱配對3 的現象。 另外,由該圖也發現到每㆒配對他們 的距離均較同㆒評估區4內的其它點的距 離來得大5。雖然同㆒配對的變異數與熵值 不見得比同㆒評估區的其它點來得大,但 是㆟類的口語評估卻做出不同的結果。 1 其標準形式是呈現㆒種適合某種感覺管道知覺的 刺激,並選擇或製作出適合另㆒種感覺管道的度 量,要受試者以此度量來判斷刺激的相對大小。 2 stress=0.1352,R2 =0.9197 3 (b10g0, b0g10)、(b9g1, b1g9)、(b8g2, b2g8)、(b3g7, b7g3)、(b4g6, b6g4)均在實驗㆒㆗形成對稱配對的現象。 4 例如 b4g6 位於正向評估區,該區的其它點有 b0g10, b1g9, b2g8, b3g7。然而 b4g6 與其它點的距離均不會大 於與b6g4 的距離。 5 例如,就 b6g4 而言,它與 b4g6 的距離要比同㆒ 負評估區內的任㆒點的距離都要來得大。 3
表5-1 實驗㆒之 MDS 距離矩陣6
Derived Stimulus Configuration Euclidean distance model
Dimension 1 2.0 1.5 1.0 .5 0.0 -.5 -1.0 -1.5 -2.0 Dimension 2 1.0 .5 0.0 -.5 -1.0 b0g10 b1g9 b2g8 b3g7b4g6 b5g5 b6g4 b7g3 b8g2 b9g1 b10g0 圖5-1 實驗㆒之 MDS 分析結果 表5-2 為實驗㆓的 MDS 距離矩陣,而 圖5-2 為實驗㆓的 MDS 分析結果7。圖5-2 的dimension1 可分為有代表點(右半部)與 無代表點(左半部);dimension2 的虛線以 ㆖的”極值”,兩條虛線㆗間的”代表點”, 以及虛線以㆘的”無極值無代表點”㆔個區 域。該圖說明極值與代表點影響相關性的 判斷。 6 (10,0)代表 10 個評估者的評語為“差”,標記為 b10g0;(9,1)代表 9 個評估者的評語為“差”、1 個評估者的評語為“好“,標記為b9g1。 7 stress=0.1984,R2 =0.7844 表5-2 實驗㆓之 MDS 距離矩陣8
Derived Stimulus Configuration Euclidean distance model
Dimension 1 2.0 1.5 1.0 .5 0.0 -.5 -1.0 -1.5 Dimension 2 2.0 1.5 1.0 .5 0.0 -.5 -1.0 -1.5 -2.0 c12 c11c10 c9 c8 c7 c6 c5 c4 c3 c2 c1 圖5-2 實驗㆓之 MDS 分析結果 (10,0) (9,1) (8,2) (7,3) (6,4) (5,5) (4,6) (3,7) (2,8) (1,9) (0,10) b10g0 (10,0) 0.6 b9g1 (9,1) 19.5 1.9 b8g2 (8,2) 26.2 18.2 3.7 b7g3 (7,3) 42.1 24.8 26.1 6.1 b6g4 (6,4) 49.8 42.8 37.6 23.3 2.5 b5g5 (5,5) 59.2 55.7 61.7 48.8 24.7 8.0 b4g6 (4,6) 74.1 63.5 64.1 62.8 62.7 28.1 7.3 b3g7 (3,7) 73.3 78.2 74.1 68.6 53.2 45.3 28.1 3.2 b2g8 (2,8) 77.2 82.0 87.6 74.3 63.6 38.0 29.5 22.9 4.8 b1g9 (1,9) 86.2 90.4 79.3 75.7 69.0 46.4 31.0 23.7 13.2 1.3 b0g10 (0,10) 99.1 88.8 76.2 74.6 72.5 54.3 43.9 36.6 24.2 18.6 3.3 c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12 c1 (5,0,0,0,5) 0.0 c2 (0,5,0,5,0) 64.1 0.0 c3 (0,0,10,0,0) 56.7 60.8 0.0 c4 (2,2,2,2,2) 53.8 49.9 53.3 0.0 c5 (2,0,6,0,2) 47.0 54.5 41.0 46.6 0.0 c6 (1,0,8,0,1) 65.5 57.8 24.0 63.5 26.0 0.0 c7 (0,1,9,0,0) 60.7 53.4 17.2 59.7 50.5 32.3 0.0 c8 (1,0,9,0,0) 68.4 66.4 23.7 60.4 38.4 25.1 20.1 0.0 c9 (3,0,4,0,3) 39.3 55.3 53.5 40.6 27.9 41.2 52.6 56.7 0.0 c10 (0,3,4,3,0) 55.3 45.7 51.4 40.3 42.6 48.4 43.9 55.5 49.3 0.0 c11 (1,2,4,2,1) 62.7 47.7 47.9 37.7 44.1 52.8 55.8 54.3 40.7 40.8 0.0 c12 (3,1,2,1,3) 41.9 58.6 57.9 40.5 45.8 57.6 57.3 57.0 42.5 51.2 48.8 0.0 6. 結論 本研究發現㆟類在評量口語資料相關 性時的幾個特性: 1. 極值、極性與代表性影響㆟類口語相關 性的判斷。 2. 同㆒配對的距離大於該點與同㆒評估 區其它點之距離,這顯示配對影響㆟類 判斷口語相關性的大小。 3. 本實驗㆒㆗的對稱配對現象究竟代表 何種意義,需要更進㆒步的研究探討。 7. 參考文獻(請與作者連絡) 8 (5, 0, 0, 0, 5)代表 5 個評估者的評語為“很差”,5 個評 估者的評語為“很好”。 4