• 沒有找到結果。

探討替代性假設在規則發現作業中的重要性—比較不同問題難度與作業類型

N/A
N/A
Protected

Academic year: 2021

Share "探討替代性假設在規則發現作業中的重要性—比較不同問題難度與作業類型"

Copied!
7
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會補助專題研究計畫成果報告

※※※※※※※※※※※※※※※※※※※※※※※※※

※ ※

探討替代性假設在規則發現作業中的重要性

—比較不同問題難度與作業類型

※※※※※※※※※※※※※※※※※※※※※※※※※

計畫類別:□個別型計畫 □整合型計畫

計畫編號:NSC 89-2413-H-002-040-

執行期間:89 年 8 月 1 日至 90 年 7 月 31 日

計畫主持人: 連韻文

共同主持人:

本成果報告包括以下應繳交之附件:

□赴國外出差或研習心得報告一份

□赴大陸地區出差或研習心得報告一份

□出席國際學術會議心得報告及發表之論文各一份

□國際合作研究計畫國外研究報告書一份

執行單位: 台灣大學心理學研究所

民 國 91 年 1 月 20 日

(2)

行政院國家科學委員會專題研究計畫成果報告

國科會專題研究計畫成果報告撰寫格式說明

Pr epar ation of NSC Pr oject Repor ts

計畫編號:NSC 89-2413-H-002-040

執行期限:89 年 8 月 01 日至 90 年 7 月 31 日

主持人:連韻文 執行機構及單位名稱:台大心理系

中文摘要 近年來我們發現影響假設檢驗推理作 業成敗的關鍵在於是否能夠產生新角度的 假設。在本研究中,我們進一步澄清與過 去文獻與我們的發現不一致之處,藉以探 討上述發現的普遍性。兩個實驗分別探討 規則難易度與不同形態的作業的影響。 Abstract

We found that, rather than searching for disconfirmatory information, the ability to view the data from a different viewpoint was more critical for better performance in a hypothesis-testing task (246 task). The current research discuss whether the above finding would be hold for problems with various levels of difficulty and those rule-discovery tasks with different format, in which too many alternative hypotheses waited to be ruled out (e.g., concept learning tasks composed of visual features.)

緣由與目的 發現事物背後的關係或規則(因果的或 類別的)是預測或理解事物的依據,因此 我們可以說規則發現能力是人類一個基本 且重要的認知能力。規則發現又可分為規 則產生(或稱之為假設產生,hypothesis generation)與規則測試(或假設檢驗, hypothesis testing)兩個部份。過去心理學 在這方面研究最常被提起的發現是受試者 常傾向於尋找支持自己目前假設的例子來 測試假設是否為真。Popper(1959)曾指 出得到否證才是一個科學理論或假設得以 修正的要素,因此人們這種尋求正例的傾 向 常 被 心 理 學 家 視 為 是 一 種 肯 證 偏 誤 (confirmation bias),也用來解釋受試 者在某些規則發現的作業的失敗(e.g., Wason,1960)。許多研究者因而試圖增加推 理者得到否證的機會(e.g.,Tweney, 1980 ; Gorman, 1984, 1987; Klayman & Ha, 1989),但並沒有一致的效果。我們近年的 研究則指出這是因為以往研究所重視的否 證訊息並不是假設檢驗推理的成功的唯一 要件,得到否證後如何修改原先的假設可 能更為關鍵,因此我們進一步分析受試者 所產生的假設。若受試者常僅對原假設 H 做出擴大或縮小範圍的修正,則我們稱新 假設 H′為互包性另有假設(新假設包含或 被包含於舊假設)。若是受試者跳脫原假設 的範疇,從新的角度或面向審視所有的證 據,則我們稱新假設為「交疊性另有性假 設」(overlapped alternative hypothesis 新舊假設沒有包含的關係)。推理者在得到 否證之後常只是部分修改原假設,在某些 情況下這種傾向可能使推理者無法脫離既 有窠臼而增加推理失敗的機率。在測試策

(3)

略方面,除了過去研究者著墨許多的正例 與 反 例 法 (positive- and negative-testing strategy)之外,我們 也發現有些推理者會同時測試兩個假設 (雙假設測試)。根據所產生的兩個假設之 間的關係,雙假設測試又可分為交疊性測 試法(同時測試兩個有部份疊合關係的假 設)與互包性測試法(同時測試兩個有包 含關係的假設)。(詳見連韻文,1998;林 緯倫與連韻文,2001) 簡言之,我們區分出交疊性另有假設 與互包性另有假設,並發現工作記憶的負 擔會影響前者的產生,但不會影響後者或 總假設個數,顯示此區分有其意義,更重 要的是推理成功者穩定地產生較多交疊性 另有假設。本研究計畫則進一步探討上述 發現的普遍性。有幾個因素可能會影響我 們先前發現的普遍性,分別是規則的難易 度以及不同形態的作業,以下分述之。 我們過去的研究結果雖然顯示否證 或互包性另有假設的多寡並不是成功歸納 出規則者與失敗者主要的分野,但這並不 是意涵否證對於規則的發現全然無足輕 重,或是互包性另有假設就是沒有用的另 有假設。不論是肯證或否證都是在假設檢 驗推理過程中必要的訊息。如果沒有肯 證,推理者無法有任何依據形成可能的假 設;否證則可以指出原假設的不足,提供 修正假設的契機,也可淘汰掉不正確的假 設;而當假設已經與目標範疇十分逼近時 (亦即在推理的後期或所找的規則較簡單 時),推理者僅需在原假設的範圍上稍作修 改(即產生新的互包性的假設)就可找出 正確的規則,因此產生交疊性另有假設是 否是成敗的關鍵可能和問題的難易度有 關。在過去探討假設檢驗的研究中,多採 用 Wason(1960)所設計的「 2 4 6 作業」。 在他原始作業中的規則(由小排到大的數 列)是一個推理者較不容易一開始就想到 的(亦即是一個較困難的題目),但後來的 研究者在採用此作業時常加入其他題目, 有可能因為他們並未控制題目的難易度, 而無法發現交疊性另有假設的重要(例如 Klayman & Ha,1989),這是實驗一所要探 討的。 此外,在上述作業中,推理者所要測試 與歸納出的是一個和數字概念有關的規 則,而且推理者必須自己產生要測試的例 子,在這種作業中並不容易想到很多不同 角度的假設。但有些規則發現的作業並不 需要受試者產生測試例子,而是主動給予 例子或讓受試者在所有可能例子中挑選所 要 測 試 的 , 例 如 許 多 對 聯 列 表 (contingency table)學習或概念學習 (concept formation)的作業都屬於這一 類。在日常生活中也有這樣的情形,例如 小孩在學習狗的概念時,他並無法自己產 生一個例子去測試,而是接受環境所給予 的例子。 Bruner et al. (1956) 曾採用的一個 作業可作為代表。此作業呈現 81 卡片,每 張卡片包含四個面向的視覺特徵(圖案形 狀、顏色、數目,以及邊框的數目),這些 卡當中有某些卡符合實驗者心中的概念, 受試者的任務是找出此概念的規則。由於 規則都是由具體知覺刺激所組成,推理者 很容易形成不同面向的假設(例如顏色方 面或形狀方面)。不同於 246 作業,推理者 在這類知覺作業中所面對到的問題反而是 可能的假設太多,無法輕易的得知何者才 是正確的規則(排除多餘假設在日常生活 也常碰到)。我們過去的發現在這種情形下 是否仍然成立﹖或者在這種情況下測試策 略會比產生不同面向的新假設更為關鍵? 實驗二將探討這個問題。

(4)

實驗一 難易度的影響

方法 採「2 4 6 作業」。除了上述數字題 外,又增加姓名題(起始正例為「黃小 英、蕭小紅、藍小美」)與撲克牌題(起 始正例為「梅花 6、磚塊 3、黑桃 6」)。 在前測中,我們分別給予 37 位台大的受 試者上述三個起使正例,要求他們分別 寫下所有可能包含此一正例的規則,以 每一個規則被寫出的比例來決定其難易 度。簡單題的正確規則約 50%的受試者 會提及,困難題的規則少於 20%的受試 者提到。實驗設計和各個狀況組中的正 確規則見下表一。規則下方的數字則為 各組受試者的人數,共 78 名。 受試者在開始時都先被告知他們 的任務就是要去猜出某預設規則(例 如:「由小排到大的數列」)。實驗者會先 給予受試者一個符合此規則的正例(例 如:「2、4、6」),並告知此預設規則所 衍生的例子都由三個項目所組成。受試 者先根據此正例形成第一個假設,然後 進行 12 次的測試,在每一次測試中,受 試者先提出一個自認為對猜出正確規則 有幫助的例子,然後寫下他測試此例子 的理由,接著實驗者會根據所測試的例 表二、各組成功率表(%,刮號中為成 功人數 / 各組人數) 難 易 度 題目類型 數字題 姓名題 撲克牌題 易 61.54 (8/13) 71.43 (10/14) 50.00 (7/14) 難 23.08 (3/13) 33.33 (4/12) 33.33 (4/12) 子是否符合預設的規則而給予「是」或 「否」的回饋。接著受試者寫下他目前 認為最有可能的規則。完成作業的時間 沒有限制,但不管猜出的規則對否,受 試者要做完 12 個測試後才結束作業。 結果與討論 成功率 各組的成功率如下表三所示,除了 撲克牌簡單題與困難題的成功率沒有顯 著差異外,數字題與姓名題難易題目的 成功率皆有顯著差異(p < 0.05)。 假設種類、假設總數與測試策略 我們根據過去研究中的標準區分受 試者的假設種類與測試策略(詳見林緯 倫和連韻文,2001),並進行三因子變異 數分析(題目類型 3×難易度 2×成敗 2)。結果題目類型的主效果在交疊性測 表一、難易度實驗各組起始正例與正確規則 起始正例 數字題 「2、4、6」 姓名題 黃小英、蕭小紅、藍小美 撲克牌題 梅花 6、磚塊 3、黑桃 6 易 正整數等差數列 N=13 三個字的姓名 N=14 第1、 3 張牌數字相等 N=14 難 由小到大排列的數字 N=13 任一字相同的姓名 N=12 中央數字最小的撲克牌 N=12

(5)

試與交疊性另有假設個數上達到邊際顯 著的差異(p=.06)。LSD 事後比較顯示, 在姓名題中使用交疊性測試法顯著地多 於數字題與撲克牌題;而在交疊性另有 假設方面,撲克牌題的受試者顯著地多 於數字題。此結果顯示不同的題目類型 可能對交疊性另有假設是否容易產生有 所影響。 在難易度方面,受試者在困難題目 上產生較多互包性另有假設(p < .05)、 有較多假設總數(p < .05),也較常採用 互包性測試策略(p < .05)與雙假設測 試策略(p < .05)。此結果可能是由於在 簡單的題目中,大部分受試者很容易便 能找出正確的規則,並不需要繼續再尋 找其他的規則,但在困難的題目中,受 試者較常發現自己原有假設有誤,必須 繼續想假設,因此得到如上的結果。但 有趣的是,困難題目的受試者雖然想更 多的假設,也多半想出互包性的假設, 這或許也是困難題成功率不高的原因之 一,誠如我們之前的分析,在困難的題 目中產生互包性的假設對成功與否並沒 有幫助。 但難易度與成敗在假設種類或測試策略 上並未有我們所預期的交互作用出現。 雖然如此,我們仍進一步分析簡單與困 難的題目中成功者與失敗者是否有所差 異。在假設總數與不同假設種類方面, 無論在簡單或困難的題目中,成功者與 失敗者在假設總數、交疊性另有假設個 數與互包性另有假設個數上均不達統計 上的顯著差異,但我們發現其傾向並不 違反我們原先的預期,即在困難題上, 成功和失敗者在交疊性另有假設個數的 差異大於簡單題,但在互包性假設與假 設總數方面,成功與失敗者的差異不因 題目難度而有改變(如圖一所示)。上述 傾向並未達統計上的差異有可能在不同 的題目中,受試者想到交疊性另有假設 的容易度不同,致使交疊性另有假設個 數的變異量增加,致使在統計上便較不 易達到顯著的效果。 1.27 0.69 0.96 1.00 0.4 0.6 0.8 1 1.2 1.4 簡單 困難 成功者 失敗者 交疊性另有假設 5.68 7.09 4.44 6.00 2 3 4 5 6 7 8 9 簡單 困難 成功者 失敗者 互包性另有假設 7.64 9.36 6.44 7.69 4 5 6 7 8 9 10 簡單 困難 成功者 失敗者 假設總數 圖一、在不同難易程度題目中,成功與 失敗者之假設總數與不同假設種類個數

(6)

實驗二 不同作業的影響

方法 本實驗所採用之規則發現作業改自 Bruner(1956). 採個別施測,共 24 名台大 學生參與實驗。作業一開始呈現 192 張卡 片,每張卡片包含五個向度的視覺特徵, 分別為顏色(紅色或綠色)、中央圖形形狀 (六邊形或五邊形或菱形或三角形)、中央 圖形個數(一或二或三)、邊線(有或無)、 角落星形(八角星或五角星或十字星或無 星形);卡片依序排列成矩陣。受試者被告 知這些卡片分符合或不符合一個預定的規 則,此規則與卡片上的圖案特徵有關,可 能牽涉到一個或多個圖案特徵的組合,受 試者的任務是找出預定的規則。 每位受試者做兩個問題(即找尋兩個不同 的規則),簡單題的規則為單一向度(例 如:綠色)、困難題的規則為兩向度的聯集 (例如:菱形或十字星),題目的順序採隨 機分派。每個問題開始時給予受試者一張 已知符合規則的卡片,受試者先根據這張 卡片形成第一個假設,接著受試者可依次 選取多張卡片來做測試,實驗者每次都會 根據這張卡片是否符合規則給予「是」或 「否」的回饋。受試者每選取一張卡片都 要寫下測試的理由,實驗者給予回饋之後 再寫下受試者認為目前最有可能的規則, 並 評 估 此 規 則 是 否 正 確 的 信 心 程 度 (0-100%,0 為沒有信心,100 為非常有信 心)。每一題在三十分鐘的測試時間內,受 試者可做多次測試,直到受試者覺得非常 有信心的時候便可公布規則,受試者事先 被告知只有一次公布規則的機會。 結果與討論 由於受試者在簡單題中全數在時間內找 到正確規則,在此先不予討論。在困難題 中(規則為聯言形式,A 或 B),則有 37.5% 的受試者在時間內找到規則。如所預期, 受試者在一開始就可同時形成多個假設 (以「和」、「或」組合不同面向特徵),但 我們在計算假設個數時是以受試者真正拿 來測試的假設為準。此外,由於受試者假 設的修正多為增加或減少特徵數或是改變 同面向內特徵的值,一般皆視為只是原假 設範圍的修正,只有當新假設包含不同於 原有假設的面向,且被當作獨立的假設來 測試以與舊假設區辨時,才視為新角度的 假設。 結 果 顯 示 成 功 者 所 得 到 的 反 例 數 (「否 」回饋的次 數 )顯著 多於 失敗者 (p=0.06)。交疊性另有假設數(新角度的 假設)與交疊性測試法也皆顯著多於失敗 者(兩者皆 p<0.03)。互包性假設數、假 設總數、其餘的測試法、以及否證數等皆 無差異。 上述結果和我們過去的發現雷同,顯 示在不同性質的假設檢驗作業時,能產生 與測試新角度假設仍是推理成功者與失敗 者主要的差異。仔細觀察成功者的策略, 可以簡單分為兩個關鍵點:1) 找到一個反 例(若規則為 A 或 B,則反例為~A 且~ B),這是不同於以往的發現。2) 若確定一 個變項為規則後,在測試其他變項時會將 其排除(亦即去除混淆變項。若受試有此 測試,我們會將其視為交疊性測試,因為 兩個假設沒有互包的關係)。相反的,失敗 者則常是沒有去除混淆變項的動作或是找 到一個可能假設後,沒有進一步測試此假 設的反例(若得到否證,則知道有第二個 規則)。 有 趣 的 是 受 試 者 的 測 試 順 序 多 像 Bruner(1956)所描述的有系統地一次改 變一個變項值,來測試該變項是否是正例

(7)

的必要條件。Bruner 及其他研究者多認為 這是一個對且有效的測試策略,但若規則 是聯言形式的,採用此策略的受試者會錯 誤地推論出所有變項都是無關的或是只找 到一個可能的假設,除非他能有意或無意 地得到反例,將其視為比較基礎,再逐次 改變各個變項。事實上,在因果推理或實 驗法中,這就是在排除其他所有可能原因 後,比較一個變項出現與不出現時效果的 差異。以此角度觀之,有系統的一次變一 個變項並非規範性的策略。它在規則是單 一變項或變項的交集時,不失為一簡便的 策略,但在規則包含兩個變項的聯集時(亦 即有多重互相獨立的原因時)便容易導入 死胡同。 參考文獻 [1] 林緯倫和連韻文(2001),科學教育學 刊,第九卷第三期,1-24。 [2] 連韻文(1998):科學資優生哪裡資 優?--以假設檢驗能力為例。資優教育 二十五週年研討會論文專輯, 135-147。

[3] Bruner, J. S., Goodnow, J. J., & Austin, G. (1956, 1986). A study of Thinking. New York: Wiley.

[4] Gorman, M. E., & Gorman M. E. (1984). A comparison of disconfirmatory,

confirmatory and control strategies on

Wason’s 2-4-6 task. The Quarterly Journal of Experimental Psychology, 36A, 629-648.

[5] Gorman, M. E., Stafford, A., & Gorman M. E. (1987). Disconfirmation and dual hypotheses on a more difficult version of Wason’s 2,4,6 task. Quarterly Journal of Experimental Psychology, 39A, 1-28.

[6] Klayman, J., & Ha. Y.W. (1989). Hypothesis testing in rule discovery: strategy, structure, and content. Journal of Experimental Psychology: Learning, Memory and Cognition, 15, 596-604.

[7] Popper, K. R. (1959). The logic of scientific discovery. New York: Basic

Books.

[8] Tweney, R. D., Doherty, M. E., Worner, W. J., Pliske, D. B., Mynatt, C. R., Gross, K. A., & Arkkelin,D.L. (1980).

Strategies of rule discovery in an inference task. Quarterly Journal of Experimental Psychology,32,109-123.

[9] Wason, P. C. (1960). On the failure to eliminate hypotheses in a conceptual task. Quarterly Journal of Experimental Psychology, 12, 129-140.

參考文獻

相關文件

為降低藥品安全性與有效性試驗的成本與其耗費的時間, 合併第一期

步驟二: 發展出一份全部議題的共同清單,並設法將每個議題歸 類為:(1) 相容性 ──利益相同;(2) 交換性

本次修正是因藥物 Canagliflozin 詴驗團隊發布之 安全性資訊更新資料顯示,比較使用詴驗藥物 Canagliflozin

經查受試者同意書 afatinib 相關副作用有 不常見的副作用(0.1-1%),但不一定與 afatinib 有關,包括敗血性休克(嚴重血液 感染)。另查 Uptodate 相關 afatinib 資料

 結果顯示,進食蘋果後, 14 位受試者中有 12 位血液

設計了正立方體框架的組合,在計算方塊個數與框架的差異性可透過等差數列的概念作 結合;而作品「腳踏實地」

比較(可與不同時期、不同藝術家,對同類型/主題創 作的處理進行比較。例:Donatello的《David》)、分

假設 H1 經驗開放性會影響 Instagram 的使用行為 部分成立 假設 H2 盡責性會影響 Instagram 的使用行為 不成立 假設 H3 外向性會影響 Instagram 的使用行為 部分成立 假設