• 沒有找到結果。

第二章 實驗一

第六節 資料分析

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

20

實驗結束後,卸掉記錄電極後,請參與者填寫人際反應量表。最後,主試者 向參與者說明實驗目的,並請參與者對於實驗內容保密,避免影響其他參與者來 參加實驗的結果。給予基本參加費與表現獎金,實驗正式結束。

第五節 儀器設定

膚電反應記錄使用 Schuhfried 公司生產的 Biopac Systems MP150,記錄電極 為 Ag\AgCl 材質。訊號以連續方式記錄,採樣頻率設定為 1000Hz。使用兩個記 錄電極,分別黏貼於參與者左手手掌 thenar 與 hypothenar 的位置,以獲得訊號良 好的膚電反應(Dawson, Schell, & Filion, 2007)。

第六節 資料分析

壹、 行為表現

測驗階段中,一組符號配對中,選擇較高機率的符號時,記為 1 分,否則記 為 0 分,分別計算出每位參與者三種學習情境下的正確率。更進一步,為了釐清 觀察學習中正向學習與負向學習,將行為表現分為正向學習與負向學習(Frank et al., 2004; Frank et al., 2007)。正向學習為參與者趨向選擇機率最高的符號,將 80%–60%與 80%–40%的表現作為正向學習的表現;負向學習為參與者避開選擇 機率最低的符號,將 60%–20% 與 40%–20%的表現作為負向學習的表現。

貳、 增強學習模型

以 Q-learning 模型進行適配(fitting),計算出參與者作業中的學習速率。為 了釐清觀察學習中正向學習與負向學習機制,將學習速率分為酬賞後或損失後對 於期望的調整(見公式一)(Frank et al., 2007)。i 為各個符號,Q(t)為第 t 個嘗試 次時對於符號的期望,r(t)為第 t 個嘗試次出現的回饋,加分為 1,減分為 0。訓 練階段中,當回饋為加分時,會以αG進行期望調整;回饋為減分時,會以αL進 行期望調整。α反應了參與者對於新近回饋的權重,範圍介於 0-1 之間,越接近 0,新近回饋對於期望調整影響較小,較依賴先前的期望,越接近 1,新近回饋

以最大概似法(Maximum Log-Likelihood Estimation,MLE),相乘所有測驗階段 中,參與者於第 t 個嘗試次選擇符號 i 的機率(見公式三)。分別於三種學習情境,

為了檢驗模型是否能預測參與者測驗階段行為,將 Q-learning 模型與基準模 型比較,基準模型為參與者測驗階段隨機選擇符號,配對組合中兩個符號機率皆 為.5(Pi=.5,Pj=1- Pi)。由於 Q-learning 模型使用三個參數(αG、αL與β),基 準模型使用一個參數(Pi),將透過貝氏訊息標準(Bayesian Information Criterion, BIC)校正參數數量差異,n 為參數數量,trials 為測驗階段嘗試次數量(見公式 四),BIC 越小代表適配越好。接著將基準模型 BIC 減去 Q-learning 模型 BIC,

先將資料進行 0.05-10Hz 的 Band pass 的過濾(filter),去除低頻的慢波偏移 與高頻的動作影響(Naqvi & Bechara, 2006)。膚電反應指標採用 peak-to-peak,以 回饋呈現後 1-3 秒鐘的最小值做為膚電反應的起點,以起點至回饋呈現後 6 秒鐘 最大值做為膚電反應的最高點,起點與最高點之間的振幅(Amplitude)做為分 析的指標。個別參與者中,計算出每個嘗試次的振幅,刪除小於 0.02μs 振幅的 嘗試次,視為雜訊(noise);進行範圍校正(range correction),去除個別差異的 影響(見公式五),並將資料進行根號轉換,校正正偏(positive skewness),以 符合常態分配(Dawson et al., 2007)。膚電反應再根據回饋分為酬賞後或損失後,

平均刪除雜訊後剩餘的膚電反應,計算出每位參與者在三種學習情境下,不同回

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

23

相關文件