• 沒有找到結果。

第一章 緒論

第二節 文獻探討

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

2

並透過同理心量表探討同理心對於觀察學習機制的影響;實驗二將透過操弄同理 他人的程度高低,探討同理心對於觀察學習的調節。

第二節 文獻探討

壹、 決策的類型

決策被定義為決策者有著未被滿足的目標,而存在著數個選項可以滿足這個 目標;決策者必須評估這些選項,進行選擇以滿足目標(Markman & Medin, 2002)。

有許多的經濟學理論(Bernoulli, 1954/1738; Kahneman & Tversky, 1979; Tversky &

Kahneman, 1992; Von Neumann & Morgenstern, 1944)提出人們如何在決策時評估 選項,考慮到選項的結果與發生的機率,選擇期望最大的選項,即最能滿足目標 的選項。

根據瞭解訊息的多寡,決策分成不同的類型:風險下的決策(decisions under risk)」與不確定下的決策(decisions under uncertainty)(Knight, 1921)。風險下的 決策為,知道選項的數個可能結果與確切的發生機率;不確定下的決策為,知道 選項的數個可能結果,卻不知道這些結果發生的機率。風險與不確定差別在於訊 息瞭解的多寡,瞭解的訊息越多,不確定性就越低,不確定下的決策逐漸轉變成 為風險下的決策(Weber & Johnson, 2009a)。不確定下的決策中,訊息的瞭解並不 完整,不瞭解結果發生的機率。面臨這種類型的決策時,重點在於獲得訊息,對 於選項有正確的評估,以做出適當決策。

訊息的形式可以是描述式(decisions from description)或經驗式(decisions from experience)(Hertwig, Barron, Weber, & Erev, 2004),描述式的訊息,會呈現 出選項的數個可能結果與發生的機率,提供決策者完整的訊息。而經驗式的訊息,

則需要決策者透過多次經驗選項的結果,從中瞭解到發生的機率。

貳、 增強學習理論與神經機制

雖然知道選項完整的訊息,能夠正確的評估選項的期望,做出適當的選擇。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

3

然而,真實生活中的訊息非常複雜,很少能夠以描述的方式提供完整的訊息。大 部分的情境中,人們都是經由不斷的經驗決策並學習,幫助日後做出適當的決策。

學習的方法有很多,歸納多次的訊息再調整決策或是每次獲得新訊息即調整一次 決策等等。每次進行決策後即調整下一次決策是最有效率的方法,不需要記憶大 量的訊息,亦能根據每次的訊息彈性調整下一次的決策。增強學習理論

(reinforcement learning theory)即是一種解釋不確定下的經驗式決策理論,面臨 決策時,會根據對於每個選項的期望進行選擇,透過每一次獲得的經驗,調整對 於下一次期望,透過不斷的調適過程(adaptive process),幫助日後做出最適當 的決策(Sutton & Barto, 1998)。調整是透過比較回饋與對於選項的期望,產生出 預期錯誤(prediction error),結果比預期好時,為正向預期錯誤(positive prediction error),將期望往正向調整,增加選擇該選項的機率;結果比預期差時,為負向 預期錯誤(negative prediction error),將期望往負向調整,減少選擇該選項的機 率。其中的 actor-critic 模式將歷程分成兩個階段:第一階段 critic 為期望調整,

透過預期錯誤調整期望,形成新的期望,學習到刺激-回饋的關係。第二階段 actor 為動作調整,透過期望調整選擇選項的機率值,學習到刺激-反應或刺激-反應-回饋的關係,機率高的選項被選擇的機會較大,幫助做出最佳選擇。

藉由傳統制約(classical conditioning)與操作制約(instrumental conditioning)

的派典,有許多行為與生理的證據支持增強學習理論。傳統制約中,學習的是刺 激-回饋聯結,學習初期時,對於刺激的期望為零,刺激出現後,獲得酬賞,產 生正向預期錯誤,形成對於新的期望。出現酬賞時,因為是預期的結果,不會有 預期錯誤;然而,沒有獲得酬賞時,產生負向預期錯誤。猴子研究中,回饋呈現 時,多巴胺神經元(dopamine neuron)會隨著正向預期錯誤增強活動;沒有預期 錯誤時,維持平常的活動狀態,然而,負向預期錯誤產生時,會降低活動,甚至 比平常狀態更低(Schultz, Dayan, & Montague, 1997)。人類功能性磁振造影

(Functional Magnetic Resonance Imaging, fMRI)研究亦顯示,多巴胺的目標腦

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

4

區紋狀體(striatum)與預期錯誤處理有關,腹側紋狀體(ventral striatum)的活 動程度隨著預期錯誤的大小而改變(Abler, Walter, Erk, Kammerer, & Spitzer, 2006;

McClure, Berns, & Montague, 2003; O'Doherty, Dayan, Friston, Critchley, & Dolan, 2003)。操作制約中,根據刺激做出正確的反應,才能獲得回饋,學習的是刺激-反應或刺激-反應-回饋的連結,相同地,也能發現多巴胺神經元與預期錯誤的處 理有關(Bayer & Glimcher, 2005)。人類 fMRI 研究顯示,背側紋狀體(dorsal striatum)

的活化程度會隨著預期錯誤大小而改變(O'Doherty et al., 2004)。比較傳統制約與 操作制約處理預期錯誤的腦區,傳統制約與操作制約皆有腹側紋狀體的活化,學 習刺激-回饋的連結;而只有在需要進行動作的操作制約會涉及背側紋狀體的活 化,學習刺激-反應或刺激-反應-回饋的連結。這些結果顯示了調整期望與調整動 作的分離,分別與腹側紋狀體與背側紋狀體相關(Haruno et al., 2004; O'Doherty et al., 2004; Tricomi, Delgado, & Fiez, 2004)。

腹側紋狀體會傳遞神經訊號至前扣帶皮質(antierior cingulate cortex, ACC)

(Liljeholm & O Doherty, 2012),此處與行為監測和認知控制有關(Holroyd & Coles, 2002; Walsh & Anderson, 2012)。事件相關電位(Event Related Potential, ERP)研 究中,ACC 亦被認為是錯誤關聯負波(Error-Related Negativity, ERN)與回饋關 聯負波(Feedback-Related Negativity, FRN)的來源位置(Holroyd & Coles, 2002;

Walsh & Anderson, 2012)。ERN 為一負向振幅的腦波,在反應後 100 毫秒間出現 最大的負值尖峰,與自己行為反應的錯誤(例如:按錯鍵)有關,相較於做出正 確反應,不小心按錯的錯誤反應會引發較大的 ERN(Holroyd & Coles, 2002);FRN 為一負向振幅的腦波,在回饋後 200-300 毫秒間出現最大的負值尖峰,與正負向 回饋有關,相較於正向回饋,接受到負向回饋時,會引發較大的 FRN(Holroyd &

Coles, 2002; Miltner, Braun, & Coles, 1997; Walsh & Anderson, 2012)。除了反應回 饋正負向,FRN 亦被認為與預期錯誤相關,ACC 接收來自基底核(basal ganglia)

的預期錯誤訊號,以調節行為表現。回饋比預期差時,預期錯誤越負向,基底核

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

5

活動降低,ACC 活動增加,FRN 越負向(Holroyd & Coles, 2002; Miltner et al., 1997;

Walsh & Anderson, 2012)。

參、 觀察學習

經驗可以自己獲得,亦能藉由觀察他人所獲得。生活中有些情況,無法自身 經驗,必須透過觀察他人建立經驗以作為決策判斷的重要依據。例如:延伸選擇 道路問題,道路的結果不再是順暢或塞車,假使目前選擇的道路是山路,道路上 可能會遇到落石。如果自己行駛道路,而遇到落石,可能會因此受傷或有生命危 險;若能經由他人行駛道路的結果,選擇一條落石機率低的道路,就能安全到達 目的地。

觀察他人的經驗

根據模擬理論(simulation theory),觀察他人經驗時,可以透過想像自身經 歷相同經驗,來理解他人(Goldman, 2006)。神經生理研究上,當觀察他人的經驗 時,與自身經歷相同經驗的相關神經迴路亦會活化(Frith & Singer, 2008)。早期的 鏡像神經系統(mirror neuron system)研究顯示,觀察他人進行動作時,自身進 行相同動作的相關腦區會活化,以理解他人的動作(Dinstein, Hasson, Rubin, &

Heeger, 2007; Rizzolatti & Craighero, 2004; Rizzolatti & Sinigaglia, 2010)。情緒方 面,亦發現鏡像他人情緒經驗的現象。觀察到他人知覺厭惡(disgust)時,會活 化與自身經歷厭惡相關的腦島(insula)(Wicker et al., 2003);觀察到他人知覺痛 覺(pain)時,會活化與自身經歷痛覺相關的腦島與 ACC(Singer et al., 2004);觀 察到他人知覺恐懼(fear)時,亦會活化與恐懼相關的杏仁核(amygdala)(Olsson, Nearing, & Phelps, 2007)。決策方面,近年來亦顯示相同的鏡像機制。觀察到他 人犯錯時,亦如同自己犯錯一般,都會引發 ERN(Bates, Patel, & Liddle, 2005;

Miltner, Brauer, Hecht, Trippe, & Coles, 2004; van Schie, Mars, Coles, & Bekkering, 2004)與 ACC 活動(Shane, Stevens, Harenski, & Kiehl, 2008)。而觀察他人的回饋時,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

6

相較於正向回饋,負向回饋亦會引發較大的 FRN(Bellebaum, Kobza, Thiele, &

Daum, 2010; Fukushima & Hiraki, 2006, 2009; Itagaki & Katayama, 2008; Yu &

Zhou, 2006)。

面臨自己的回饋訊息與他人的回饋訊息,皆會引發相似的處理機制。然而,

會根據訊息的意義或重要性,影響了觀察訊息的處理機制。呈現自己選擇與未選 擇選項的回饋時,只有在處理自己選擇的回饋時,才有 FRN 的正負向回饋差異,

處理未選擇的回饋時,則無此 FRN 差異(Yeung & Sanfey, 2004)。觀察到的回饋 訊息是被電腦所選擇時,亦沒有 FRN 差異(Fukushima & Hiraki, 2009)。根據這些 結果,推論只有當接受到的訊息是會被人所接受時,才具重要性,自身會鏡像他 人的經驗,引發相同的處理機制。

縱使處理自身或他人回饋皆會引發相同的處理機制,但處理程度會有所不同。

相較於自身回饋,觀察他人的回饋會引發較小的 FRN(Bellebaum et al., 2010;

Fukushima & Hiraki, 2006, 2009; Itagaki & Katayama, 2008)。可能的原因是,自身 接受到的回饋會引起較強烈的情緒與動機反應,引發較大的 FRN(Yu & Zhou, 2006)。動機的差異亦可反應在行為表現上,猴子研究中,兩隻猴子配對進行決 策作業,根據出現的刺激進行反應,刺激有四種類型,正確反應後分別可以讓自 己、對方、雙方或是無人獲得酬賞。相較於不會讓自己獲得酬賞的刺激(對方或 無人),當出現的刺激可以讓自己(自己或雙方)獲得酬賞時,猴子會有較強烈 的動機與情緒反應,反應錯誤率較低(Chang, Winecoff, & Platt, 2011)。

將觀察的經驗用以學習

除了處理來自觀察他人的經驗,我們亦能將這樣的經驗用以學習,幫助我們 在相同情境中做出適當的行為。觀察學習不是單純的模仿被觀察者的行為,而是 需要理解觀察到的訊息,將訊息處理及轉換,採取適當策略以達成目的(Torriero, Oliveri, Koch, Caltagirone, & Petrosini, 2007)。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

7

傳統恐懼制約(classical fear conditioning)的實驗中,制約刺激(例如:符 號)出現後,會伴隨著嫌惡非制約刺激(例如:電擊),引發制約反應(例如:

較大的膚電反應)。成功制約後,制約刺激單獨出現,不伴隨著嫌惡非制約刺激,

亦會引發參與者的制約反應。人們不需要自身經歷電擊刺激,亦能透過觀察他人 經歷恐懼制約的過程而成功制約,比起其他刺激,制約刺激會引發較大的膚電反 應,學習到制約刺激與電擊間的連結關係(Olsson & Phelps, 2004)。

近年來的決策研究,也開始探討觀察學習,讓參與者觀察他人進行決策作業,

觀察到決策的過程與選項的結果;之後的測驗階段,參與者需要自己選擇時,亦

觀察到決策的過程與選項的結果;之後的測驗階段,參與者需要自己選擇時,亦

相關文件