文獻探討

第一章緒論

第二節文獻探討

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

並透過同理心量表探討同理心對於觀察學習機制的影響；實驗二將透過操弄同理他人的程度高低，探討同理心對於觀察學習的調節。

第二節文獻探討

壹、決策的類型

決策被定義為決策者有著未被滿足的目標，而存在著數個選項可以滿足這個目標；決策者必須評估這些選項，進行選擇以滿足目標(Markman & Medin, 2002)。

有許多的經濟學理論(Bernoulli, 1954/1738; Kahneman & Tversky, 1979; Tversky &

Kahneman, 1992; Von Neumann & Morgenstern, 1944)提出人們如何在決策時評估選項，考慮到選項的結果與發生的機率，選擇期望最大的選項，即最能滿足目標的選項。

根據瞭解訊息的多寡，決策分成不同的類型：風險下的決策（decisions under risk）」與不確定下的決策（decisions under uncertainty）(Knight, 1921)。風險下的決策為，知道選項的數個可能結果與確切的發生機率；不確定下的決策為，知道選項的數個可能結果，卻不知道這些結果發生的機率。風險與不確定差別在於訊息瞭解的多寡，瞭解的訊息越多，不確定性就越低，不確定下的決策逐漸轉變成為風險下的決策(Weber & Johnson, 2009a)。不確定下的決策中，訊息的瞭解並不完整，不瞭解結果發生的機率。面臨這種類型的決策時，重點在於獲得訊息，對於選項有正確的評估，以做出適當決策。

訊息的形式可以是描述式（decisions from description）或經驗式（decisions from experience）(Hertwig, Barron, Weber, & Erev, 2004)，描述式的訊息，會呈現出選項的數個可能結果與發生的機率，提供決策者完整的訊息。而經驗式的訊息，

則需要決策者透過多次經驗選項的結果，從中瞭解到發生的機率。

貳、增強學習理論與神經機制

雖然知道選項完整的訊息，能夠正確的評估選項的期望，做出適當的選擇。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

然而，真實生活中的訊息非常複雜，很少能夠以描述的方式提供完整的訊息。大部分的情境中，人們都是經由不斷的經驗決策並學習，幫助日後做出適當的決策。

學習的方法有很多，歸納多次的訊息再調整決策或是每次獲得新訊息即調整一次決策等等。每次進行決策後即調整下一次決策是最有效率的方法，不需要記憶大量的訊息，亦能根據每次的訊息彈性調整下一次的決策。增強學習理論

（reinforcement learning theory）即是一種解釋不確定下的經驗式決策理論，面臨決策時，會根據對於每個選項的期望進行選擇，透過每一次獲得的經驗，調整對於下一次期望，透過不斷的調適過程（adaptive process），幫助日後做出最適當的決策(Sutton & Barto, 1998)。調整是透過比較回饋與對於選項的期望，產生出預期錯誤（prediction error），結果比預期好時，為正向預期錯誤（positive prediction error），將期望往正向調整，增加選擇該選項的機率；結果比預期差時，為負向預期錯誤（negative prediction error），將期望往負向調整，減少選擇該選項的機率。其中的 actor-critic 模式將歷程分成兩個階段：第一階段 critic 為期望調整，

透過預期錯誤調整期望，形成新的期望，學習到刺激-回饋的關係。第二階段 actor 為動作調整，透過期望調整選擇選項的機率值，學習到刺激-反應或刺激-反應-回饋的關係，機率高的選項被選擇的機會較大，幫助做出最佳選擇。

藉由傳統制約（classical conditioning）與操作制約（instrumental conditioning）

的派典，有許多行為與生理的證據支持增強學習理論。傳統制約中，學習的是刺激-回饋聯結，學習初期時，對於刺激的期望為零，刺激出現後，獲得酬賞，產生正向預期錯誤，形成對於新的期望。出現酬賞時，因為是預期的結果，不會有預期錯誤；然而，沒有獲得酬賞時，產生負向預期錯誤。猴子研究中，回饋呈現時，多巴胺神經元（dopamine neuron）會隨著正向預期錯誤增強活動；沒有預期錯誤時，維持平常的活動狀態，然而，負向預期錯誤產生時，會降低活動，甚至比平常狀態更低(Schultz, Dayan, & Montague, 1997)。人類功能性磁振造影

（Functional Magnetic Resonance Imaging, fMRI）研究亦顯示，多巴胺的目標腦

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

區紋狀體（striatum）與預期錯誤處理有關，腹側紋狀體（ventral striatum）的活動程度隨著預期錯誤的大小而改變(Abler, Walter, Erk, Kammerer, & Spitzer, 2006;

McClure, Berns, & Montague, 2003; O'Doherty, Dayan, Friston, Critchley, & Dolan, 2003)。操作制約中，根據刺激做出正確的反應，才能獲得回饋，學習的是刺激-反應或刺激-反應-回饋的連結，相同地，也能發現多巴胺神經元與預期錯誤的處理有關(Bayer & Glimcher, 2005)。人類 fMRI 研究顯示，背側紋狀體（dorsal striatum）

的活化程度會隨著預期錯誤大小而改變(O'Doherty et al., 2004)。比較傳統制約與操作制約處理預期錯誤的腦區，傳統制約與操作制約皆有腹側紋狀體的活化，學習刺激-回饋的連結；而只有在需要進行動作的操作制約會涉及背側紋狀體的活化，學習刺激-反應或刺激-反應-回饋的連結。這些結果顯示了調整期望與調整動作的分離，分別與腹側紋狀體與背側紋狀體相關(Haruno et al., 2004; O'Doherty et al., 2004; Tricomi, Delgado, & Fiez, 2004)。

腹側紋狀體會傳遞神經訊號至前扣帶皮質（antierior cingulate cortex, ACC）

(Liljeholm & O Doherty, 2012)，此處與行為監測和認知控制有關(Holroyd & Coles, 2002; Walsh & Anderson, 2012)。事件相關電位（Event Related Potential, ERP）研究中，ACC 亦被認為是錯誤關聯負波（Error-Related Negativity, ERN）與回饋關聯負波（Feedback-Related Negativity, FRN）的來源位置(Holroyd & Coles, 2002;

Walsh & Anderson, 2012)。ERN 為一負向振幅的腦波，在反應後 100 毫秒間出現最大的負值尖峰，與自己行為反應的錯誤（例如：按錯鍵）有關，相較於做出正確反應，不小心按錯的錯誤反應會引發較大的 ERN(Holroyd & Coles, 2002)；FRN 為一負向振幅的腦波，在回饋後 200-300 毫秒間出現最大的負值尖峰，與正負向回饋有關，相較於正向回饋，接受到負向回饋時，會引發較大的 FRN(Holroyd &

Coles, 2002; Miltner, Braun, & Coles, 1997; Walsh & Anderson, 2012)。除了反應回饋正負向，FRN 亦被認為與預期錯誤相關，ACC 接收來自基底核（basal ganglia）

的預期錯誤訊號，以調節行為表現。回饋比預期差時，預期錯誤越負向，基底核

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

活動降低，ACC 活動增加，FRN 越負向(Holroyd & Coles, 2002; Miltner et al., 1997;

Walsh & Anderson, 2012)。

參、觀察學習

經驗可以自己獲得，亦能藉由觀察他人所獲得。生活中有些情況，無法自身經驗，必須透過觀察他人建立經驗以作為決策判斷的重要依據。例如：延伸選擇道路問題，道路的結果不再是順暢或塞車，假使目前選擇的道路是山路，道路上可能會遇到落石。如果自己行駛道路，而遇到落石，可能會因此受傷或有生命危險；若能經由他人行駛道路的結果，選擇一條落石機率低的道路，就能安全到達目的地。

觀察他人的經驗

根據模擬理論（simulation theory），觀察他人經驗時，可以透過想像自身經歷相同經驗，來理解他人(Goldman, 2006)。神經生理研究上，當觀察他人的經驗時，與自身經歷相同經驗的相關神經迴路亦會活化(Frith & Singer, 2008)。早期的鏡像神經系統（mirror neuron system）研究顯示，觀察他人進行動作時，自身進行相同動作的相關腦區會活化，以理解他人的動作(Dinstein, Hasson, Rubin, &

Heeger, 2007; Rizzolatti & Craighero, 2004; Rizzolatti & Sinigaglia, 2010)。情緒方面，亦發現鏡像他人情緒經驗的現象。觀察到他人知覺厭惡（disgust）時，會活化與自身經歷厭惡相關的腦島（insula）(Wicker et al., 2003)；觀察到他人知覺痛覺（pain）時，會活化與自身經歷痛覺相關的腦島與 ACC(Singer et al., 2004)；觀察到他人知覺恐懼（fear）時，亦會活化與恐懼相關的杏仁核（amygdala）(Olsson, Nearing, & Phelps, 2007)。決策方面，近年來亦顯示相同的鏡像機制。觀察到他人犯錯時，亦如同自己犯錯一般，都會引發 ERN(Bates, Patel, & Liddle, 2005;

Miltner, Brauer, Hecht, Trippe, & Coles, 2004; van Schie, Mars, Coles, & Bekkering, 2004)與 ACC 活動(Shane, Stevens, Harenski, & Kiehl, 2008)。而觀察他人的回饋時，

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

相較於正向回饋，負向回饋亦會引發較大的 FRN(Bellebaum, Kobza, Thiele, &

Daum, 2010; Fukushima & Hiraki, 2006, 2009; Itagaki & Katayama, 2008; Yu &

Zhou, 2006)。

面臨自己的回饋訊息與他人的回饋訊息，皆會引發相似的處理機制。然而，

會根據訊息的意義或重要性，影響了觀察訊息的處理機制。呈現自己選擇與未選擇選項的回饋時，只有在處理自己選擇的回饋時，才有 FRN 的正負向回饋差異，

處理未選擇的回饋時，則無此 FRN 差異(Yeung & Sanfey, 2004)。觀察到的回饋訊息是被電腦所選擇時，亦沒有 FRN 差異(Fukushima & Hiraki, 2009)。根據這些結果，推論只有當接受到的訊息是會被人所接受時，才具重要性，自身會鏡像他人的經驗，引發相同的處理機制。

縱使處理自身或他人回饋皆會引發相同的處理機制，但處理程度會有所不同。

相較於自身回饋，觀察他人的回饋會引發較小的 FRN(Bellebaum et al., 2010;

Fukushima & Hiraki, 2006, 2009; Itagaki & Katayama, 2008)。可能的原因是，自身接受到的回饋會引起較強烈的情緒與動機反應，引發較大的 FRN(Yu & Zhou, 2006)。動機的差異亦可反應在行為表現上，猴子研究中，兩隻猴子配對進行決策作業，根據出現的刺激進行反應，刺激有四種類型，正確反應後分別可以讓自己、對方、雙方或是無人獲得酬賞。相較於不會讓自己獲得酬賞的刺激（對方或無人），當出現的刺激可以讓自己（自己或雙方）獲得酬賞時，猴子會有較強烈的動機與情緒反應，反應錯誤率較低(Chang, Winecoff, & Platt, 2011)。

將觀察的經驗用以學習

除了處理來自觀察他人的經驗，我們亦能將這樣的經驗用以學習，幫助我們在相同情境中做出適當的行為。觀察學習不是單純的模仿被觀察者的行為，而是需要理解觀察到的訊息，將訊息處理及轉換，採取適當策略以達成目的(Torriero, Oliveri, Koch, Caltagirone, & Petrosini, 2007)。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

傳統恐懼制約（classical fear conditioning）的實驗中，制約刺激（例如：符號）出現後，會伴隨著嫌惡非制約刺激（例如：電擊），引發制約反應（例如：

較大的膚電反應）。成功制約後，制約刺激單獨出現，不伴隨著嫌惡非制約刺激，

亦會引發參與者的制約反應。人們不需要自身經歷電擊刺激，亦能透過觀察他人經歷恐懼制約的過程而成功制約，比起其他刺激，制約刺激會引發較大的膚電反應，學習到制約刺激與電擊間的連結關係(Olsson & Phelps, 2004)。

近年來的決策研究，也開始探討觀察學習，讓參與者觀察他人進行決策作業，

觀察到決策的過程與選項的結果；之後的測驗階段，參與者需要自己選擇時，亦

在文檔中同理心對於決策中觀察學習的調節作用 - 政大學術集成 (頁 11-22)

第一章 緒論

第二節 文獻探討

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第二節 文獻探討

壹、 決策的類型

貳、 增強學習理論與神經機制

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

參、 觀察學習

觀察他人的經驗

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

將觀察的經驗用以學習

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第一章緒論

第二節文獻探討

立政治大學

第二節文獻探討

壹、決策的類型

貳、增強學習理論與神經機制

立政治大學

立政治大學

立政治大學

參、觀察學習

立政治大學

立政治大學