實驗一至四綜合討論 - 檢驗以比較為基礎的決策理論-Decision by sampling theory之適切性

本研究為了在行為實驗上檢驗抽樣決策理論的假設，以 Brown 等人（2008）

使用的實驗程序為基礎，並對該實驗的結果提出「指導語」及「評量程序」兩點

實驗一與 Brown 等人（2008）的實驗程序相同，結果無論在滿意度差異分析或模型適配上都得到排名效果優勢的結果，但也是最可能促進受試者使用比較歷程進行決策的設計。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

實驗三的實驗設計與 Brown 等人（2008）的實驗程序相差最大，但整體設計與日常生活及一般研究採用的方式最貼近，滿意度差異分析的結果未能見到排名對評量的影響，模型適配中排名權重也未高於範圍效果的權重，符合範圍頻次理論認為評量共同受到排名與相對位置影響的假設。

實驗二和實驗四的設計介於實驗一、三間，可以單獨檢驗指導語或評量方式對評量的影響。實驗二維持指導語，更改評量方式，結果在滿意度差異分析時排名效果達顯著，但模型適配結果較支持範圍頻次理論。由於本研究著重在探討行為背後的理論，當變異數分析與模型適配結果有分歧時，較採信模型適配的結果，

表示即使指導語未更改，評量方式確實會影響受試者的行為表現。

然而實驗四更改指導語、維持評量方式，結果在滿意度分析上展現出排名效果，模型適配的排名權重（實驗層次 0.62）也比範圍效果權重高，結果與實驗一較相似。

綜合實驗二和實驗四的結果，可以發現只更改指導語並不會顯著影響受試者表現，而評量方式對受試者的行為表現影響較顯著。

然而，實驗程序除了指導語和評量方式兩個主要差異之外，在細節上仍有其他不同之處，因此本研究還進行了一些分析來檢驗上述四個實驗結果的可靠性。

首先，由於使用量尺的評量方式在記錄受試者反應時到小數第一位，而使用七點量表及數線的評量方式在紀錄受試者反應時只記錄到整數位，為了確認紀錄單位的不同是否影響模型適配結果，本研究將實驗一 A 的資料四捨五入至整數位後重新分析，檢驗與原先的分析結果是否不同。由於先前分析已經說明有無刪除不適配資料對結果影響不大，故此處僅列出刪除不適配受試者後的結果。

如下表 18，將資料四捨五入後的分析結果幾乎沒有任何差異，故紀錄單位並不會影響分析結果。

‧

1161.75，p < .001）都高。表示排名效果與範圍效果對滿意度均有影響，且排名 效果的影響力較高。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

表 19

實驗一正負偏資料模型適配結果

實驗層次個人層次

排名權重 𝑅² 平均排名權重標準差平均𝑅² 刪除不適配資料前 0.65 0.68 0.61 0.40 0.20 刪除不適配資料後 0.62 0.77 0.60 0.38 0.77 註：資料不適配資料共 13 筆，正偏 9 筆、負偏 4 筆

就模型適配的結果而言，和實驗一 A 與實驗一 B 分開分析且包含六個分配的結果相比（表 8 及表 10），雖然排名權重數值較低，但排名效果依然大於相對位置效果，表示分析資料及分配的多寡對模型適配結果的影響不大。此外，更換資料分析方式後所得數據與實驗四（表 16）幾乎相同，亦反映了指導語的更動對實驗結果並無影響。

綜合先前的各種分析與檢驗，可以得出四個結論：

1. 即使在實驗一至實驗四中都有在個人層次模型不適配的受試者，但採用嚴格標準將這些資料刪除後，並不影響對實驗結果的解讀。

2. 模型不適配受試者為傾向非極端回答，可能暗示範圍頻次模型之不足（如實驗三 B 的討論）。

3. 受試者反應的紀錄單位並不影響模型適配的結果。

4. 雖然實驗一至實驗四包含的分配數目與實驗設計（受試者間設計或受試者內設計）並不完全相同，但即使更改分析方式，也不影響對實驗結果的解讀。

排除以上影響，增加四個實驗的結果可信度後，以下進一步針對實驗結果進行討論。

‧

差異。雖然在重製 Brown 等人（2008）的實驗時得到排名效果優勢的實驗結果，

但在改變實驗程序後，排名效果的優勢消失。

至於使用 Brown 等人（2008）的評量工具，與使用問卷的七點量表及數線，

為何會造成受試者反應的差異，本研究分別從範圍頻次理論及抽樣決策理論的觀

因此可能是 Brown 等人（2008）的評量工具使排名效果比起在其他實驗下容易展現出來，造成本研究的實驗差異。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

從抽樣決策理論來看，決策歷程包含抽樣及比較兩個步驟，當確定決策樣本時便可預測目標選項的效用。若使用 Brown 等人（2008）的評量工具，由於所有需要評量的刺激都呈現在量尺上，受試者無須記憶或抽樣以形成決策樣本，可直接將刺激當成決策樣本進行評量。

但在實驗二及實驗三中，不同刺激需要分開評量，受試者每一次評量所使用的決策樣本可能不等於實驗設計的 11 筆資料。特別是實驗三使用問卷為測量工具時，因為並未要求受試者特別記住分配內容，若受試者若在第二頁時無法記住 11 筆資料形成的分配型態，比較的結果可能會偏離排名效果的預測，造成模型適配時兩個原則的權重差不多。

由於本研究並未要求受試者在實驗結束後回憶分配內容，故無法檢驗此假設是否成立，是本研究的限制之一。

若是上述第一種解釋，那麼排名權重的差異就純粹是由於程序不同而產生，

受試者的決策歷程仍然符合範圍頻次理論，抽樣決策模型則過於簡單。

若是第二種解釋，則暗示抽樣決策理論若要增加對行為資料的解釋力，就必須將記憶與抽樣時可能發生的偏誤也納入考量。譬如受試者在一開始就記不住分配內容，或即使記住分配內容，在形成決策樣本時可能只提取部分選項進行比較，

此時能被提取的選項數量或選項性質就需要進一步討論，且可能存在明顯的個人差異。

無論是哪一種解釋，都表示現有的抽樣決策模型在適配實證資料上仍有相當的限制，需納入其他的因素才較可能貼近受試者的行為反應。此外，無論是抽樣決策理論或範圍頻次模型都未考慮個人心理感受的差異及物理變異在心理空間的對應關係，也是未來研究的可能方向。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在文檔中檢驗以比較為基礎的決策理論-Decision by sampling theory之適切性 - 政大學術集成 (頁 101-107)

實驗一至四綜合討論

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

立政治大學

立政治大學

立政治大學

立政治大學