實驗一：主角與地點的視覺辨識曲線 - 研究方法 - 以故事性的自然場景探討主角與地點在動態視覺處理上的相互影響

第二章研究方法

第二節實驗一：主角與地點的視覺辨識曲線

Schettino 等人(2011, 2012)的做法，此實驗設計所涉及的統計分析方式以及指標分數所代表的意涵，將在本實驗中被建立起來。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

人電腦搭配 19 吋螢幕進行實驗，並且以麥克風收集參與者的口頭反應內容。螢幕解析度是 1024*768 像素。耳麥通訊設備兩套，一套給參與者使用，另一套給主試者使用，讓雙方能達到通訊之用途。參與者看完圖片後，隨即以口頭方式透過麥克風錄製下他們對於主角與地點的口頭回答內容。參與者需使用下巴架，藉以控制眼睛與螢幕的觀察距離固定為85 公分。

實驗材料

本實驗採用自製的場景圖片圖庫(包含主角與地點)，共有 16 組圖(請參考附錄一)。每一組圖有二張主角圖，以及二張地點圖，所以總共有 32 張主角圖以及 32 張地點圖。本實驗的練習區間，固定選取以下二組圖片作為練習，分別是第 15 組圖和第 16 組圖。除此之外的其他圖片做為正式實驗的嘗試，主角圖片共有 28 張圖，地點圖片共有28 張圖。

每張圖片的解析度固定為1024 像素 x1024 像素，視角是 17.06^∘x18.39^∘。以 ImageJ 1.47 版軟體(http://rsb.infonih.gov/ij/)對單一張圖片先分層出 R、G、B 三個圖層，每張圖層在空間頻率上濾波，進而生成十個影像層次圖片，由低空間頻率圖逐漸累加高空間頻率圖而製成的(Schettino, et al., 2011; Schettino et al., 2012)。這三個圖層在濾波結束後，再進行圖層的合併，藉此即可形成十張不同影像層次，

而且是「從粗略到細緻」的彩圖，請參考圖6 和圖 7。濾波的頻帶是根據 Delplanque, N’diaye, Scherer, 與 Grandjean(2007)的作法(請見表 5)而來。Delplanque 等人(2007) 只有選取層次1 到 5，以及層次 9 作為其操弄。本實驗的作業比起 Delplanque 等人(2007)是更為困難的，因此本實驗多增加層次 6 到層次 8，以及最後一張原圖(層次10)，以確保參與者確實能正確作答出來。

‧

層次頻帶(pixels/cycle) 空間頻率(cpd)

1 256-512 0.07-0.15

LSF

↓

HSF+LSF

2 128-512 0.07-0.31

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

回答。但重點是參與者被要求，盡可能確保在這十次的作答機會中，至少有一個正確答案才結束嘗試。除此之外，參與者被要求以具體方式作答。譬如：在主角辨識作業中，「一個人在跑步」是太過簡略的描述，「接線生在接聽電話」就是比較具體的描述。地點辨識作業中，「室內、室外」就是太過簡略的說法，「教室」

就是一個比較具體的描述。指導語請參考附錄三之範本。

圖6 「從粗略到細緻」的十個影像層次的圖(以主角為例) 層次 1

層次 2

層次 3

層次 4

層次 5 層次 6

層次 7

層次 8

層次 9

層次 10

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖7 「從粗略到細緻」的十個影像層次的圖 (以地點為例)

層次 1

層次 2

層次 3

層次 4

層次 5 層次 6

層次 7

層次 8

層次 9

層次 10

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖8 Mondrian 遮蔽刺激

本實驗分為兩種作業，分別是「地點辨識作業」和「主角辨識作業」。在地點作業中，參與者需判斷畫面中的地點是什麼地方；在主角作業中，參與者則需判斷畫面中的主角以及主角正在做的事情。本實驗進行對抗平衡ABBA 設計，也就是有一半人數的參與者進行作業的流程是地點作業、主角作業、主角作業、以及地點作業。另外一半人數的參與者進行BAAB 流程，進行作業的流程是主角作業、

地點作業、地點作業、以及主角作業。藉此，排除作業順序對於辨識表現的影響。

本實驗共有四個正式實驗區段，正式實驗開始之前會進行練習區段，確保參與者瞭解作業流程與作業要求。在地點辨識作業的每個區段內有 14 個嘗試，在主角辨識作業中的每個區段內有 14 個嘗試。在每個區段內的每個嘗試之間的呈現順序是隨機安排的，每張圖並不會重複出現。本實驗總共有56 個嘗試，歷時大約 1 個小時。

實驗設計

本實驗採用二因子參與者內設計，獨變項是「作業類型」以及「影像層次」。

「作業類型」分為「主角辨識作業」以及「地點辨識作業」兩種。「影像層次」

則是分為十個層次，分別是低空間頻率訊息逐漸累加高空間頻率訊息的十種層次的圖片。依變項則是場景內容的「正確回答率」，以及「正確反應的平均正確率」。

三、結果分析

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

「正確回答率」的計算方式是：假設十個嘗試之中正確回答出來的嘗試有八個，則正確回答率計為 (8/10)*100=80%。「正確反應的平均正確率」則是只考慮正確反應的嘗試中，每個影像層次可以正確回答的累積百分比。以上述為例，便是只考慮正確回答出來的這八個嘗試，此八個嘗試在各個影像層次累積正確反應的百分比。累積百分比的「累積」這個概念，源於若第五個層次能夠正確回答的話，則第六至十個層次也能夠正確回答；若第三個層次能正確回答出來，則第四至十個層次也能正確回答。據此，隨著影像層次提升，正確回答的次數隨之提升，

累積百分比也將隨之提升，最終「正確反應的平均正確率」必定為100%。更詳細地說明，在正確反應的一個嘗試之中，參與者在依序呈現的每個影像層次之間，

若有反覆做出正確與錯誤反應的特性，本實驗將以最後一個答案作為判斷是否作出正確反應的依據，而且是以最後一個做出正確反應的影像層次開始計為正確反應(計為 1)，在此之前的影像層次皆計為錯誤反應(計為 0)。藉此，正確反應的一個嘗試裡面，每個影像層次的正確與錯誤反應先被編碼計分出來後，再縱覽這些做出正確反應的所有嘗試，即可計算出各個影像層次的「正確反應的平均正確率」。

正確回答率

本實驗的總正確率達93.24%。本實驗採用單因子重複量數變異數分析 (one-way repeated measure ANOVA)進行統計考驗。獨變項是「作業類型」，依變項則是「正確回答率」。如圖9 所示，其結果顯示「作業類型」的主要效果達顯著，也就是說主角作業的正確回答率[M=94.90%, SD=4.79]比起地點作業的正確回答率[M=91.58%, SD=6.04])高，且其差異達統計顯著[F(1,13)=6.84, MSE=11.25,

p<0.05, η

²=0.90]。

‧

本實驗亦進行二因子重複量數變異數分析(two-way repeated measure

ANOVA)。獨變項是「作業類型」與「影像層次」，依變項則是「正確反應的平均正確率」。各種情況下的平均數以及標準差請參考表6。其結果顯示「作業類型」

的主要效果達顯著，也就是說主角作業的「正確反應的平均正確率」(M=57.49%) 比地點作業(M=54.62%)高[F(1,13)=13.70, MSE=42.20, p<0.01, η²=0.01]。「影像層次」

的主要效果達顯著[F(9,117)=358.70, MSE=142.69, p<0.001, η²=0.98]。兩者交互作用達顯著[F(9,117)=2.77, MSE=20.65, p<0.01, η²=0.001]。

進一步對「影像層次」的主要效果進行HSD 事後比較，其結果顯示大部分兩

‧

(proportion odds model)進行分析(參考附錄四)。嚴格說，以此模型進行統計分析較符合研究問題。本實驗中的影像層次這個變項其實是次序變項，而且每個層次之間並非獨立。第五個層次可以做出正確反應，表示第六至十個層次也都可以做出正確反應了。實際上，正如同「正確反應的平均正確率」的定義，當第N 個層次可以正確反應，則第N+1 至第十個層次，也應該可以正確反應。以影像層次這個次序變項做為依變項，在定義上較符合本實驗設計的原意。據此，本實驗以作業類型變項作為固定效果(fixed effect)，以參與者變項作為隨機效果(random effect)，將影像層次視為次序變項的依變項。藉此，即可用一個數字，亦即：優勢比(odds ratio)表示這兩條隨著影像層次越高而隨之越高的曲線是否有所差異，

譬如：某一條曲線比起另一條曲線是否向左偏移，又或者向右偏移。本實驗結果顯示主角辨識的曲線比起地點辨識而言有向左偏移的情況，且其差異達統計顯著 (odds ratio=0.73，p<0.05，95% CI [0.56, 0.94])。換言之，主角辨識比起地點辨識 而言只需較低的空間頻率訊息即可達到相同的表現正確率。

空間頻率的閾值估計

本實驗根據表6 結果，亦即：各個影像層次所相對應之「正確反應的平均正確率」的資料，以最小平方法(method of least squares)找出適配的直線方程式後，

求「正確反應的平均正確率」為50%所對應之空間頻率，以此作為閾值。不同於

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

來的數值，再以基數為2 的指數關係還原為空間頻率的數值。

結果顯示主角辨識作業的閾值是2.31cpd，地點辨識作業的閾值是 2.80cpd。

主角比地點只需累積較低空間頻率訊息即可被辨識。

表 6 實驗一結果：不同作業與影像層次下「正確反應的平均正確率」之平均數和標準差

影像層次主角地點

1 0.00 (0.00) 0.00 (0.00)

2 1.08 (2.33) 0.00 (0.00)

3 9.09 (11.34) 2.69 (4.94)

4 34.87 (22.20) 27.05 (22.75) 5 60.01 (22.74) 55.56 (19.07) 6 83.18 (10.78) 78.54 (10.43) 7 92.93 (6.58) 89.70 (6.61) 8 96.21 (4.92) 95.21 (3.57) 9 97.54 (3.55) 97.42 (3.78) 10 100.00 (0.00) 100.00 (0.00) 註：括弧內的數值是標準差

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 10 實驗一結果：主角與地點辨識在不同影像層次的「正確反應的平均正確率」

主角辨識曲線比起地點辨識曲線而言有向左偏移的現象，且其差異達統計顯著 (p<0.05)。

四、討論

實驗一以逐步揭露作業探討自然場景中的主角與地點在動態視覺處理歷程中，

尤其是在空間頻率上的累積性，藉此確立此作業被落實之可行性。值得注意的是，

就本實驗所採用的視覺刺激，尤其在第四個層次到第六個層次之間是具有診斷特性的空間頻率範圍。具診斷特性的空間頻率範圍，是指稱能幫助視覺系統分辨出場景內容的關鍵空間頻率範圍。誠如結果所顯示，大約在第四個影像層次之後，

視覺系統開始能辨識出主角或地點內容，並且在第六個層次之後則有很高的正確率而且正確率趨於平緩，並形成S 型的心理計量函數(psychometric function)。此現象顯示參與者對於不同空間頻率訊息(亦即：不同影像層次)並非隨機反應，而是逐步累積足夠高空間頻率訊息，視覺系統才作出判斷。參與者約莫是累積訊息到第四個影像層次左右，由低空間頻率形成對於地點或主角的臆測，爾後逐步累積高空間頻率訊息，並將「累積訊息」與「臆測內容」進行比對。隨著影像層次

*

‧

的正確反應。這種逐步累積訊息的特性，與Schettino 等人(2011, 2012)結果一致。

除此之外，本實驗進一步探討「主角的視覺辨識」比起「地點的視覺辨識」

是否有其優勢？結果發現，主角比起地點在較低影像層次就可以達到相同「正確反應的平均正確率」，其中主角辨識的閾值是2.31cpd，而地點辨識的閾值則是 2.80cpd。不僅如此，本實驗結果顯示：主角作業的正確回答率(M=94.90%)也是顯 著比起地點作業有較高的正確回答率(M=91.58%)。此結果與 Davenport 與

在文檔中以故事性的自然場景探討主角與地點在動態視覺處理上的相互影響 - 政大學術集成 (頁 44-57)

實驗一：主角與地點的視覺辨識曲線

第二章 研究方法

第二節 實驗一：主角與地點的視覺辨識曲線

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

↓

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

p<0.05, η

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

*

‧

第二章研究方法

第二節實驗一：主角與地點的視覺辨識曲線

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學