第一節、多巴胺與酬賞典範
一、多巴胺神經傳導物質介紹
在個體大腦中,兒茶酚胺類(catecholamine)投射神經數目約為 500,000,並集 中於少數的神經核區(nuclei),但是其投射位置及功能對於個體卻相當重要。兒 茶酚胺類神經傳導物質包括了多巴胺(dopamine)、正腎上腺素(noepinephrine)及腎 上腺素(epinephrine)等。由於多巴胺被生成後可經由多巴胺-β-羥化酶(dopamine β-hydroxulase; DBH)轉化成正腎上腺素。因此早期多巴胺僅被視為正腎上腺素的 前驅物質(precursor)功能,直到 1950 年代末期才確認其於中樞神經系統中具有神 經傳導物質功能(Carlsson, Lindqvist, Magnusson, 1957; Carlsson, Lindqvist,
Magnusson, & Waldeck, 1958)。
在多巴胺的生成過程中,多巴胺前驅物質酪胺酸(tyrosine)受到酪胺酸水合酶 (tyrosine hydroxylase)的催化轉變成度巴(dopa)。度巴可再經由芳香族 L-胺基酸類 脫羧酶(L-Aromatio amino acid decarboxylase; AADC)的轉化變成多巴胺。生成後 的多巴胺會被先包覆在囊泡(vesicle)中以等待被釋放到突觸(synapse)間以作用在 突觸後膜(postsynaptic membrane)的受器(receptor)上。當多巴胺一旦被釋放至突觸 間,其除可經由突觸前膜(presynaptic membrane)上的回收器(transporter)回收外,
也可被分解酶如單胺氧化酶(monoamine oxidase; MAO)或是兒茶酚胺氧甲基移位 酶(catelchol-O-methyl-transferase; COMT)所代謝。
多巴胺的受器均隸屬於促代謝型(metabotropic)受器類型,意即當多巴胺與專 屬受器結合後,會導致附著在細胞膜內側的G 蛋白質(G-protein)產生型態上的改 變(conformational change),使 G 蛋白質 α 與 βγ 分離。當 α 脫離 βγ 後可以活化其
後續的二級信差(second messenger)傳導路徑(signal transduction)。Kebabian 與 Calne(1979)提出多巴胺有不同的受器類型存在,其中 D1 受器藉由活化 Gs 蛋白 質而促進細胞內的二級信差cAMP 訊息傳導路徑;D2 受器被活化後則是經由活 化Gi 蛋白質抑制了 cAMP 訊息傳導路徑。到了 1990 年代,發現 D3 受器後 (Sokoloff, Giros, Martres, Bouthenet, & Schwartz, 1990),陸續再發現其他多巴胺受 器。在受器的分類上,將D1 及 D5 受器稱為 D1 家族(D1-family),D2、D3 及 D4 受器稱為 D2 家族(D2-family)(Vallone, Picetti, & Borrelli, 2000)。這兩大類受器 家族目前已各有其專屬的促進劑(agonist)及拮抗劑(antagonist)。雖然在大多數的 多巴胺神經投射區都有這兩類受器家族的分佈,但分佈數目或區域仍有些差異。
如在前額葉皮質區D2 受器數目相對於 D1 受器來的少(Arnsten, 1998)。
在多巴胺神經投射路徑部分,多巴胺的投射來自中腦(midbrain)處的腹側頂 蓋區(ventral tegmental area)或是黑質體(substantia nigra)。其中黑質體多投射至紋 狀體(striatum),故此路徑被命名為黑質紋狀體多巴胺系統(nigrostriatal dopamine system),與運動功能(motor)較相關。腹側頂蓋區則投射往邊緣系統(limbic system),如前額葉皮質(prefrontal cortex)、杏仁核(amygdala)、海馬(hippocampus) 或是依核(nucleus accumbens)等處。因此被命名為皮質多巴胺系統(mesocortical dopamine system)或是邊緣多巴胺系統(mesolimbic dopamine system)。皮質及邊緣 多巴胺系統的功能被認為與情緒(emotion)、酬賞(reward)或動機(motivation)功能 相關(Alexander, Crutcher, & DeLong, 1990),所以近來兩系統也被合稱為皮質邊緣 多巴胺系統(mesocortico-limbic dopamine system)(Fibiger & Phillips, 1988; Phillips, Ahn, & Howland, 2003; Roth, Tam, Ida, Yang, & Deutch, 1988)。
二、多巴胺與酬賞典範之建立:anhedonia hypothesis.
有關多巴胺神經傳導物質的功能探討部分,Wise、Spindler、Witt 及 Gerber (1978)發現在實驗動物學習壓桿(lever-press)得食物(food)或蔗糖液(sucrose)的操 作式制約(operant conditioning)行為作業中,多巴胺受器拮抗劑 pimozide 會對已 習得該作業的實驗動物的壓桿行為形成削弱效果(extinction)。Fouriezos 與 Wise (1980)發現多巴胺受器拮抗劑 pimozide 會造成已習得壓桿得自我電刺激
(intracranial self-stimulation; ICSS)的實驗動物的壓桿次數下降。Wise (1982)整理 了多巴胺受器拮抗劑藥物對實驗動物在操作式制約行為上的影響,並排除多巴胺 受器拮抗劑藥物造成實驗動物在行為動作能力上缺損的疑慮後,提出了
anhedonia hypothesis。該假說主張實驗動物大腦中的多巴胺應與刺激物(stimulus) 所具有的酬賞價值(rewarding value)有關,其所指稱的刺激物範圍包括了自然 (natural)酬賞物及非自然(non-natural)酬賞物。前者如食物、蔗糖液、糖精
(saccharin)、性(sex)等,後者則包括了心理興奮性藥物(psychostimulants)等。另外,
多巴胺受器拮抗劑藉由抑制實驗動物大腦中的多巴胺(酬賞系統),來達到頓化 (blunt)酬賞物的對個體的快樂價值效果(the hedonic impact of reward)。
大腦中的多巴胺投射終點區塊也被證明與酬賞效果有關,當實驗動物壓桿以 獲得自然酬賞物如牛奶或果汁時,其大腦中的依核或是前額葉皮質的細胞外液 (extracellular)所含的多巴胺釋放量會增加(Richardson & Gratton, 1996; Schultz, Apicella, Scarnati, & Ljungberg, 1992)。具濫用特性的藥物,如安非他命
(amphetamine)、酒精(alcohol)、及鴉片類藥物(opiates)等會導致依核處的多巴胺 釋放量增加(Di Chiara & Imperato, 1986)。上述證據增加了 anhedonia hypothesis 的外在效度(external validity),使大腦多巴胺系統為大腦的酬賞系統及多巴胺為
大腦中的酬賞貨幣(reward currency)的想法於近年有普及之勢(Pierce &
Kumaresan, 2006; Wise, 2004)。
三、檢視多巴胺與酬賞典範
(一)、重新檢視多巴胺與操作式制約行為的關係
依據anhedonia hypothesis,實驗動物在操作式制約行為作業中獲得酬賞物 時,其腦內細胞外液的多巴胺量增加。若給予多巴胺受器拮抗劑減抑多巴胺的作 用效果,應可以抑制實驗動物獲得酬賞物的行為。但是,一些相關研究的結果,
並不盡然支持這假說的推論。
Blackburn、Phillips 及 Fibiger (1987)將實驗動物獲得酬賞物的操作式行為區 分成朝向、趨近酬賞物所在區域的「預備行為」(preparatory)以及吃食酬賞物的
「完成行為」(consummatory)等。結果發現僅有「預備行為」會受到多巴胺受器 拮抗劑的影響,例如減緩實驗動物趨近酬賞物的速度,但不影響「完成行為」。
Salamone、Steipreis、McCullough、Smith、Grebel 及 Mahan (1991)提供實驗 動物可以進行一次壓桿(Fixed ratio 1; FR1)獲得一顆較偏好的食物(Bioserve pellet),或可自由取食散布於實驗箱地板上的普通食物粒(lab chow)等兩類行為選 擇時,發現實驗動物傾向產生較多壓桿行為以得到偏好食物,而較少取用地板上 的普通食物粒。但若將實驗動物壓桿得到酬賞的行為要求(requirement)提高時(如 將FR1 提高為 FR5、FR10 或 FR20),則實驗動物開始增加取食地板上普通食物 粒的行為反應量而減少壓桿取得偏好食物的行為反應。
在FR5 作業中,實驗動物在接受過多巴胺 D1 專屬受器拮抗劑 SCH23390 或 D2 專屬受器拮抗劑 haloperidol 或非專屬性受器拮抗劑 flupentixol 後,會傾向多
取食實驗箱地板上的普通食物粒而非壓桿獲得偏好食物行為(Cousins &
Salamone, 1994; Cousins , Wei, & Salamone, 1994)。另同樣在 FR5 作業中,若先以 多巴胺神經毒素6-OHDA 破壞依核後,實驗動物也會出現如上述施打多巴胺受 器拮抗劑的行為改變(Cousin, Sokolowski, & Salamone, 1993)。
若依照Wise 的 anhedonia hypothesis 推論,在 Salamone 的操作式制約作業環 境中,不論是壓桿獲得較偏好食物或是取用散佈地上的食物兩種行為反應都應受 到多巴胺受器拮抗劑的影響而大量減少行為反應。但是結果顯示多巴胺受器拮抗 劑的影響效果與提高作業行為需求的操弄相類似。因此Salamone, Correa, Mingote 及 Weber (2005)認為 Wise 所主張的多巴胺受器拮抗劑頓化刺激物的酬賞 價值或削弱動機的主張並不正確。他們認為多巴胺並不等同酬賞,而是與實驗動 物動作在操作式作業中的成本與利益(cost and benefit)的考量有關。
(二)、多巴胺神經活動與酬賞物的時間鄰近性關係
依據anhedonia hypothesis 推論多巴胺與酬賞的關係,則大腦中多巴胺量變 化時間點應該與酬賞物的出現時間點緊密相扣。
Richardson 與 Gratton (1996, 1998)以神經化學伏安法(voltammetry)技術分析 實驗動物進行壓桿行為以獲得酬賞物時,其依核或前額葉皮質處的多巴胺釋放量 變化。結果發現依核及前額葉皮質處多巴胺釋放量大量增加現象,只在作業初期 實驗動物獲得酬賞物時;但隨者作業次數增加,此多巴胺釋放量增加現象時間點 由酬賞物轉移到可預測(predicted)酬賞物出現的燈光(light)制約刺激(conditioned stimulus; CS)。
Schultz 等人(1992)讓靈長類實驗動物進行以燈光刺激做為制約刺激學習壓
桿獲得酬賞物果汁,同時並以電生理(electrophysiology)儀器紀錄其大腦中多巴胺 神經活動量變化。結果發現實驗動物大腦中腹側紋狀體處(ventral striatum,相當 於依核)的多巴胺神經活動,在實驗初期時在獲得酬賞物果汁時有大量活動的情 形。但當實驗動物逐漸學會該項作業後,腹側紋狀體處的多巴胺神經興奮活動現 象,則是在可預測酬賞物出現的燈光制約刺激出現時。但當酬賞物在制約刺激出 現後應該出現的時間點未出現時(omission),該時間點的多巴胺神經活動量會出 現比原本基準線(baseline)更低的現象(Schultz, Dayan, & Montague, 1997)。
Fiorillo、Tobler 及 Schultz (2003)發現這多巴胺電生理神經活動除了由制約刺激引 發之的「短暫性神經活動」(phasic activity);另外在制約刺激出現後到非制約刺 激(unconditioned stimulus; US)出現前這段時間中的「持續性神經活動」(sustained activity),應與制約刺激的不確定性(uncertainty)有關。因為在這段時間的神經活 動在酬賞物獲得機率為50%時最大。根據上述實驗結果,Schultz (2007)認為多 巴胺對制約刺激的「短暫性神經活動」,反應了個體將外界所發生的事件(event) 與其預期(expectancy)進行一比較,為「酬賞-預期誤差」(reward-predicting errors)
功能。另一多巴胺的「持續性神經活動」則代表了對制約刺激的不確定性考慮。
由上述研究結果可知,多巴胺投射終點處的依核、前額葉皮質區的多巴胺神 經活動會隨著制約作業的進行有不同的變化,並且多巴胺的神經活動並非僅有單 一的活動或功能。這些結果反駁了Wise 在 anhedonia hypothesis 所主張的多巴胺 神經活動僅與酬賞刺激有關的看法。
(三)、多巴胺基因剔除小鼠與酬賞物關係之行為資料
依據anhedonia hypothesis 所主張多巴胺與酬賞物的關係,可推論若是先利
用基因技術剔除(knock out)多巴胺,則這類缺乏多巴胺的實驗動物應在酬賞物相 關行為上產生缺損現象。
多巴胺基因剔除的小鼠(mice),因為先天缺乏酪胺酸水合酶不能轉化多巴胺 前驅物酪胺酸,使得這類小鼠體內不能自行製造多巴胺。在對酬賞物偏好測試 中,Cannon 與 Bseikri (2004)發現這些多巴胺基因剔除小鼠與控制組(wild-type) 小鼠在雙管舔液(licking)行為測試情境中,都能展現出對蔗糖液的偏好高於控制 液的行為。另外在酬賞行為習得部分,多巴胺基因剔除小鼠與控制組小鼠都可習 得嗎啡(morphine)或是古柯鹼(cocaine)引發之場地制約偏好(conditioned place preference; CPP)作業(Hnasko, Sotak, & Palmiter, 2005; Hnasko, Sotak, & Palmiter, 2007)。
上述研究資料顯示,多巴胺剔除小鼠在先天即缺乏多巴胺情況下,仍可以展 現出對酬賞物的偏好行為以及建立由藥物酬賞刺激引發之場地制約偏好行為。因 此可知多巴胺的功能,並非如Wise 所主張與酬賞緊密相扣的簡易關係。
(四)、酬賞物是否為一單一歷程?
根據anhedonia hypothesis 對於多巴胺與酬賞物的關係推論,則多巴胺應該
根據anhedonia hypothesis 對於多巴胺與酬賞物的關係推論,則多巴胺應該