研究背景與研究動機 - 緒論 - 以故事性的自然場景探討主角與地點在動態視覺處理上的相互影響

第一章緒論

第一節研究背景與研究動機

人類對於自然場景的視覺辨識(visual recognition)是相當快速而且正確的 (Potter, 1975; Biederman,1972)。然而，此短暫瞬間實則經歷一系列的視覺運算 (computation)(Marr, 1982)，而且並非一蹴可幾。本研究以動態視覺處理歷程的觀點探討此一短暫瞬間，並援引預測編碼模型(predictive coding models)、從粗略到細緻(coarse-to-fine)、與累積器模型(accumulator models)等三個面向描述此動態歷程。根據這三個面向，視覺系統的運作被認為是藉萃取低空間率訊息形成初始臆測(initial guess)，初始臆測進一步導引並累積高空間頻率的視覺輸入，透過比對臆測內容與視覺輸入，若比對出現錯誤則會修改臆測內容，修改後再繼續重複比對臆測內容與視覺輸入，直到視覺系統形成單一個穩定的知覺結果的過程。本文的研究背景便是從此動態視覺處理的觀點出發。

至於本文的研究動機則在於：在眾多自然場景研究中，尚無學者探討故事性的自然場景(narrative natural scene)，亦即：有主角在某地做某事的場景。這類具有人物之場景通常與個體在社會上的人際互動息息相關，以至在生存上深具意義與背景的研究，著重知覺層次(perceptual level)的分析，少有涉及語意層次

(semantic level)。換言之，傳統上「圖形與背景」的研究結果不見得能適用於故事性自然場景，故有必要另行加以探討。本研究探討之故事性自然場景比起傳統

‧

背景之相互影響」以及「物體較背景具處理優勢」的特性(Davenport & Potter, 2004, Davenport, 2007)，但他們對其在動態視覺歷程之著墨較少。而目前也只有 Bar 模型(2003, 2004, 2007, 2009)嘗試用動態視覺處理歷程的觀點，探討物體辨識以及背景處理路徑對物體處理路徑之影響。此外，本研究關心的故事性自然場景，其中態視覺處理之各項心理成份的逐步揭露作業(progressive revelation task)(Schettino, Loeys, Delphanque, & Pourtois, 2011; Schettino, Loeys, Bossi, & Pourtois, 2012)，尤以動態辨識過程中所需累積空間頻率的量的不同來探討本研究的問題。

為了詳述上述的研究背景與研究動機，緒論先仔細介紹過去在動態視覺運算上的核心論述及其實徵研究，說明動態視覺辨識的主要內涵，包含：預測編碼模

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

型、從粗略到細緻的視覺處理、與累積器模型。爾後，再詳細介紹逐步揭露作業，

以及此作業的內涵與動態視覺處理之間的對應關係。Bar 模型(2003, 2004, 2007, 2009)採用此動態處理歷程的觀點探討背景處理對物體處理之影響，但過去許多研究指出物體處理對背景處理亦具影響力(Joubert, Rousselet, Fize, & Fabre-Thorpe, 2007; Mack & Palmeri, 2010)。因此，本研究從動態視覺處理觀點探討故事性自然場景時，亦嘗試補足物體處理路徑是否對背景處理路徑具影響力的探討。除此之外，本研究在作業內容與實驗材料的選用與修改，包括：以內容呈報作業進行實驗的原因，以及採用故事性自然場景作為實驗材料的原因，皆將在緒論中作說明，

並在緒論最後提出本研究的研究問題與架構。

‧

著實是一系列複雜而且極具挑戰的視覺運算(Marr, 1982)。Hegdé(2008)文獻回顧中便嘗試說明，視覺系統如何從影像中萃取出特徵，並進行多次的貝斯推論 (Bayesian inference)，亦即：根據現有的影像特徵訊息並且從機率的角度進一步推敲出場景中的可能內容。這個一系列的視覺運算過程不僅僅仰賴被動地由下而上 (bottom-up)的感官輸入(sensory input)，個體主動(proactive)¹由上而下(top-down) 的作用更是影響著視覺系統對於外界訊息的辨識與理解，從近年來視覺辨識的模型可以窺見一二(Bar, 2009; Summerfield & Egner, 2009)。這些模型主要強調「預期(expectation)」或者是「預測(prediction)」在視覺系統中所扮演的重要角色 (Summerfield & Egner, 2009; Enns & Lleras, 2008)。他們假設視覺系統能從感官輸入的內容中主動生成最有可能的知覺內容，進而使用這些內容引導視覺系統進一步萃取外在訊息，也能幫助視覺系統解釋模稜兩可(ambiguous)的刺激。「預測編碼模型」是從神經生理角度說明視覺處理繁複過程的模型。此類模型認為從早期視覺皮質區域而來的前饋(feed-forward)訊息在視覺處理階層的每個階段能與由上而下的預期(top-down expectation)進行比對，主要透過反覆反饋(recurrent feedback)的連結進行比對。假如比對結果出現錯誤訊號(error signal)，那麼錯誤訊號會透過前饋連結傳遞給較高層次的大腦區域。錯誤訊號是用來修正在視覺處理階層每個階段對於輸入內容的判斷。「預期的訊息」以及「觀察到的訊息」兩者之間會不斷修正與調整，直到視覺系統對於感官輸入產生一個穩定的知覺解釋 (Summerfield & Egner, 2009; Enns & Lleras, 2008)。

Bar(2003, 2004, 2007, 2009)所提出的模型正說明了物體辨識過程中，由上而

1 Proactive 是指由下而上的訊息尚未進入視覺系統，個體便主動預備好，等待著訊息的輸入。

在文檔中以故事性的自然場景探討主角與地點在動態視覺處理上的相互影響 - 政大學術集成 (頁 9-12)

研究背景與研究動機

第一章 緒論

第一節 研究背景與研究動機

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

第一章緒論

第一節研究背景與研究動機

立政治大學