國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
79
實驗三 B
由於實驗二及實驗三 A 採用七點量表進行評量,若受試者評量時傾向非極 端回答,由於範圍頻次模型對刺激材料中最大與最小的刺激預測值為 1 和 0,使 得範圍頻次模型與這樣的資料並不適配。然而受試者的非極端回答傾向也可能是 真實反應選項在心中的價值。
為了檢驗此不適配的情形是否只是實驗設計的影響,而與本研究主要探討的 問題無關。實驗三 B 對實驗三 A 的評量程序進行修改,在維持指導語及評量方 式均不加強受試者採用比較歷程來評量的原則下,檢驗更改設計後是否能改善模 型適配的情形。
此外,由於實驗三 B 與實驗三 A 的設計同樣維持不暗示受試者使用比較歷 程的設計原則,本研究也將實驗三 B 視為實驗三 A 的驗證,預期排名權重的分 析結果應與實驗三 A 相同。
受試者
本實驗共施測 50 份問卷,一部分受試者為修習心理測驗學的政治大學心理 系學生,於課堂後施測,無提供課程加分或禮金,另一部分受試者為網路招募的 政治大學在學大學生,完成問卷填答後可獲得 50 元禮金。
實驗材料
薪資分配
實驗三 B 採受試者間設計,操弄薪資分配,分為正偏與負偏分配兩種版本 的問卷,具體數據與實驗三 A 使用的薪資相同,可參考表 12。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
施測問卷
本實驗的問卷亦有三頁(附錄四),前兩頁與實驗三 A 使用的問卷相同。第 一頁是資料保密聲明與基本資料調查,第二頁先呈現一段薪資相關的引言,接著 呈現 11 位虛擬大學生的就業資料,包含編號(1 到 11)、姓名及初次就業薪資(正 偏或負偏分配的薪資),最下方是用來檢驗受試者有無確實閱讀分配資料的三題 篩選題,受試者必須回答 11 位大學生中的最高薪資、最低薪資及編號 6 之畢業 生薪資。
第三頁則是薪資的評量頁,受試者必須對陳列的 11 筆薪資想像該薪資為自 己初次就業的薪資,並評量其滿意程度,依據滿意程度在數線上劃記。11 筆薪 資顯示於頁面左側,以和實驗三 A 相同的順序由上到下排列。每筆薪資的右方 有一條數線,中間無任何刻度。受試者必須在數線上劃記來表示滿意程度,數線 越右端表示越滿意,越左端代表越不滿意。
受試者完成評量後,主試者將數線分成七個區段,依據畫線位置紀錄受試者 反應,紀錄單位到整數,例如劃記在第一個區段則記錄為 1。
資料分析與結果
刪除答錯篩選題及漏答選項的 9 位受試者後,本實驗分析的 41 份資料來自 正偏分配 20 位及負偏分配 21 位受試者。兩分配的平均薪資滿意度如圖 29。資 料分析的方式與程序與先前實驗相同,分成平均滿意度差異檢驗及模型適配。
平均滿意度差異檢驗
對正負分配中相同薪資(23,500 元和 30,100 元)進行變異數分析的結果,
分配主效果未達顯著(F (1,39) = 0.38,MSe = 0.75,p = .54,𝜂2 = .01),薪資的 主效果達顯著(F (1,39) = 193.72,MSe = 134.34,p < .001,𝜂2 = .83),交互作 用未達顯著(F (1,39) = 0.003,MSe = 0.002,p = .95,𝜂2 < .001)。
‧
事前比較的結果顯示 23,500 元在正偏分配(C1)與負偏分配(D1)中的滿 意度並無差異(t (39) = 0.62,p = .54,𝜂2 = .01),30,100 元在正偏分配(C2)與
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
刪除此 12 位受試者資料後重新分析,得到實驗層次的排名權重為 0.23,𝑅2為 0.74,個人層次的排名權重之平均為 0.38,標準差為 0.37,平均 𝑅2為 0.66。模 型適配結果如表 14。
表 14
實驗三 B 模型適配結果
實驗層次 個人層次
排名權重 𝑅2 平均排名權重 標準差 平均𝑅2 刪除不適配資料前 0.37 0.36 0.42 0.42 -1.01 刪除不適配資料後 0.23 0.74 0.38 0.37 0.66 註:資料不適配受試者共 12 人,其中 7 人屬正偏分配,5 人屬負偏分配
模型比較的結果顯示排名權重為 0.23 之模型適配度比純粹比較模型(𝜒2(1)
= 150.91,p < .001)、均重模型(𝜒2(1) = 23.32,p < .001)與純粹範圍模型(𝜒2(1) = 16.03,p < .001)都高。表示排名效果與範圍效果對滿意度均有影響,較符合範 圍頻次模型的觀點,但相對位置的影響力較高。
討論
在實驗三 B 的模型適配中,個人層次適配不佳的受試者有 12 位,個人𝑅2正 值與𝑅2為負值的兩類受試者薪資滿意度如圖 30 與圖 31,由圖中可知仍有許多受 試者的反應全距較小,導致模型適配不佳。
依據𝑅2正值或負值將實驗三 A 及三 B 的受試者分為兩類,進行卡方同質性 檢定的結果並未顯著(𝜒2(1) = 0.97,p = 0.32),表示更改評量方式後並未改善個 人層次模型適配的情況,實驗三的個人層次模型不適配人數如表 15。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
83
表 15
實驗三個人層次模型不適配人數
𝑅2為正值 𝑅2為負值 總人數
實驗三 A 38 24 62
實驗三 B 29 12 41
圖 30 實驗三 B 正偏分配中 R-square 正值與負值受試者之平均滿意度
2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2
x 104 1
2 3 4 5 6 7
薪 資(單 位: 萬 元 新 台 幣)
滿意度
R-square正 值 R-square負 值
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 31 實驗三 B 負偏分配中 R-square 正值與負值受試者之平均滿意度
實驗三 B 將評量方式由七點量表改為數線劃記,同時不使用「非常不、非 常」這類強烈詞彙來描述選項,已盡力降低因實驗設計而造成受試者採用中立回 答的可能。雖然沒有改善個人層次模型不適配的情形,但排除了受試者反應全距 較小是由描述七點量表的詞彙所造成的可能性。
受試者傾向非極端的回答,可能是受試者本身不願表示強烈態度或真實反應 受試者的感覺。若是受試者不願表示強烈態度,暗示的是實驗法研究的限制,但 若非極端回答其實已真實反應受試者的感覺,暗示的就是模型之不足。
無論是範圍頻次理論或抽樣決策理論,其模型之預測範圍介於 0 到 1 之間,
且對數值最低的資料點的預測值必為 0,對數值最高的資料點預測值必為 1,而 在實驗設計裡,0 與 1 代表著與「非常不滿意」與「非常滿意」相似的概念。
2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2
x 104 1
2 3 4 5 6 7
薪 資(單 位:萬 元 新 台 幣)
滿意度
R-square正 值 R-square負 值
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
85
此處可延伸出幾個疑問,第一個是「對我們來說,最不好的選項一定是非常 滿意,最好的選項一定是非常滿意嗎?」即使是進行完全相同的實驗,使用相同 的認知歷程來評價,每個人的心理感受傾向仍可能存在差異。
第二個疑問是「物理空間上的差距是否能對應到心理空間?」也許受試者傾 向非極端回答是因為不同薪資在數字上雖有差異,但心理感受上的差異極小。在 實驗一用量尺排序的作業中,即有受試者將多個不同的薪資完全重疊在量尺上。
雖然受限於實驗設計,本研究無法區分非極端回答是因為實驗設計的因素或 真實反應受試者的感覺,亦無法回答以上兩個疑問,但這些疑問暗示著本研究使 用的範圍頻次模型並未考慮個人心理感受的差異及物理變異在心理空間的對應 關係,未來可以進一步修改模型或進行新的研究。
由先前實驗的結果可以發現資料刪除後與刪除前的結果在解釋上並沒有衝 突或不同,因此本研究選擇較嚴格的標準,將這些不適配的資料刪除,以數量較 少但模型較能解釋的資料來當作解釋各實驗結果的依據,畢竟實驗的主要目的是 檢驗實驗之間的差異造成受試者行為的改變。
最後,從將實驗三 B 視為實驗三 A 的驗證的角度來看,實驗三 B 無論是滿 意度差異檢驗或模型適配的結果,都未支持抽樣決策理論的預期,在模型比較中 顯示受試者在評量時並非只考量選項在決策樣本中的排名,與實驗三 A 的結論 相同,增強了實驗三 A 結果的可信程度。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
87