視覺研究中的立體深度 - 立體深度的注意力攫取效果

第二節視覺研究中的立體深度

立體畫面包含不同的雙眼像差，可讓人眼察覺畫面深度成像平面的差異產生各個物體的深度區別，這些深度區別包含正像差（positive disparity）、零像差（zero disparity）、

負像差（negative disparity），是立體畫面主要的深度類型(Finlayson, Remington, & Grove, 2012)。以立體顯示器作為立體成像的螢幕平面而言，人眼感受到影像凹陷於螢幕後方，

則雙眼的凝視平面會在螢幕之後，且雙眼視軸在螢幕平面之前不會交錯，此時的深度類型稱為正像差或者非交叉視差（uncrossed disparity）；相反的，若是影像突出螢幕，則凝視平面在螢幕之前且為視軸相互交錯，稱為負像差或者交叉視差（crossed disparity）；而一般的平面影像，因為沒有任何立體深度，因此雙眼聚焦與凝視的位置皆在螢幕平面上，為零像差的視覺畫面，像差類型如圖 2-1 所示(Jansen et al., 2009; Ohzawa, Deangelis,

& Freeman, 1990)。

負像差（交叉） 零像差 正像差（非交叉）

圖 2-1：立體視覺的像差類型（types of disparity）與凝視點位置

這些像差類型會因為凝視平面的差異，影響雙眼到物體之間的視角範圍。視角

（visual angle）是視覺研究中使用的視覺單位，意旨的是物體投影到視網膜上的成像大小，雙眼的凝視平面相同時則物體會在視角 0^o成像，此時物體的畫面在視野中視最清晰的；而立體視覺的深度類型，主要是以物體偏移的概念產生雙眼像差，讓左、右視網膜成像的平面視角與原本凝視點的平面不同。學者即利用雙眼水平的分開距離、雙眼到螢幕之間的距離以及雙眼到凝視點之間的距離，計算出被凝視物體與觀者眼睛的視角大小 (Arnott & Shedden, 2000)。視角單位包含，度（^o ; degree）、分角（'; arc sec）、秒角（"; arc min），而 1^o等於 60'，1'又等於 60''。

回顧立體視覺研究，本文以實驗畫面包含的深度複雜程度，將研究類型分為「純粹深度設計研究（Pure-depth design study）」以及「立體畫面與平面畫面的比較研究（The comparative research of 3D image and 2D image）」。第一，純粹深度設計研究是透過單一

Vliegen, 1999, 2000; Yano, Emoto, & Mitsuhashi, 2004)。

第二，立體畫面與平面畫面的比較研究則是著重媒介效果，目的在透過眼球運動指標檢視立體深度與平面影像的差異，藉此計算出有效的深度顯著地圖（salience map）。

此類研究中的立體畫面是以立體顯示器（3D display）播放影像，透過立體顯示器內建的深度運算法，將平面影像直接轉換成立體影像，或者以原始拍攝時製作的像差距離來呈現立體畫面。參與者在實驗中會以 2D 或 3D 的兩種方式觀看相同的靜態或動態畫面，

不過在 3D 的情境中會同時接收多種深度的像差類型（兩種以上），且記錄參與者的眼球運動 (Banos et al., 2008; Emoto, Nojiri, & Okano, 2004; Hakkinen, Kawai, Takatalo, Mitsuya, & Nyman, 2010; Huynh-Thu & Schiatti, 2011; Jansen et al., 2009; C. Lang et al., 2012; Pölönen, Salmimaa, Aaltonen, Hakkinen, & Takatalo, 2009; Pölönen, Salmimaa, Takatalo, & Hakkinen, 2012; Tam, Stelmach, & Corriveau, 1998) 。

表 2-1：立體視覺的研究類型（本文自行整理）

ㄧ純粹深度設計研究

純粹深度設計研究（pure-depth design study）的立體視覺研究是藉由將畫面的視覺特徵單純化，排除其它可能影響處理機制的視覺變項，釐清立體深度是否可以造成注意力的轉換，或是優先取得認知資源的配置，進而對含有深度的物體進行資訊處理。立體深度可透過視角的計算準確控制雙眼像差，產生正像差、零像差與負像差，確保參與者在深度的情境下可以知覺到深度感。

早期學者將立體畫面的深度距離，以三維空間的 Z 座標位置比喻，如學者 Posner, Snyder& Davidson(1980)以空間為基的概念提出「注意力導引線索典範（attentional cueing paradigm」，指涉三維空間中的注意力若被某一物體吸引則會被驅動注意力加快對目標物的反應時間。該典範中提出的導引線索包含有效線索（valid cue）、中性線索（neutral cue）

以及無效線索（invalid cue）；有效線索代表線索出現或含有與目標物相同指向性的位置或方向，無效線索則是相反，中性線索則沒有任何位置的指向性(Ghirardelli & Folk, 1996)。因此，有效線索情境下，搜尋目標物的反應時間（reaction time）與正確率（correct rate），會比沒有任何方向性的中性線索、反方向的無效線索還要快且精準。Downing

&Pinker(1985)即以空間導引線索典範，在實驗中設計兩行各包含四盞燈的直線，四盞燈則各代表一種深度為 Z 座標；結果發現，當導引線索出現的深度與目標物不同時，搜尋目標物的反應時間會比較慢；且從較遠深度轉換到較近深度的反應時間，比從近到遠的反應時間還要快。

近年學者以視角計算來控制立體深度，He & Nakayama(1995)將深度視角控制在正、負像差（±13 分角、±27 分角），操弄目標物與背景平面的立體深度，以傾斜的方式改變畫面的方位（orientation），如目標物平面與背景平面相互平行但呈現在不同的深度平面，或是相互垂直呈直角，以及目標物垂直但背景傾斜；結果發現在只有在無效線索情境，且目標物與背景分別在不同深度，若是深度差異愈大反應時間愈慢，而在其它條件情境的反應時間則沒有影響。He 與同僚(1995)認為這是因為注意力會根據空間中的表面特徵（surface feature），選擇性的將認知資源配置到相同或相似的特徵上，而深度的差異愈大代表表面的特徵差異愈大，因此無法有效的吸引注意力達到快速的反應時間。

Ghirardelli & Folk(1996)則不認為深度會影響反應時間，他將正、負像差（±26 分角）加入導引線索中與平面的情境相互比較，發現深度線索無法影響反應時間，且指出導引線索的效果只會發生在平面空間(Ghirardelli & Folk, 1996; Iavecchia & Folk, 1994)。

因此，Atchley, Kramer, Andersen & Theeuwes(1997)控制目標物與情境線索皆在不同的位置，將深度只加入無效線索的情境中，分別有無效線索但與目標物相同深度、無效線索但與目標物不同深度。結果發現在無效線索情境下，目標物與線索出現在不同深度比在相同深度條件下，搜尋目標物的平均反應時間還要慢，且在相同的條件下，畫面包含干擾物比沒有干擾物的反應時間還要慢。雖然學者 Arnott & Shedden(2000)指出干擾物的有無，會造成單眼視覺中深度線索的增加，導致目標物被歸類在相同深度的特徵群組裡，增加畫面的認知負載程度且直接反應搜尋目標物的時間上；然而，無論有無干擾物，

不同深度都會導致較長的反應時間，因此排除掉干擾物造成認知負載變高的影響，實驗結果顯示深度的確在無效線索的確影響搜尋目標物的過程。

為排除單眼視覺產生的深度線索，學者以裸視立體隨機圖（random-dot stereograms, RDSs）設計深度實驗，以隨機亂點圖作為背景排除單眼線索的操作控制，刺激物畫面 Downing &Pinker(1985)的實驗結果相同，亦即從較遠的凝視平面轉換到較近的凝視平面，比從較近的轉換到較遠的反應時間還要快；不過在此實驗中的深度類型都是正像差，為凹陷於螢幕之後的立體視覺，因此雖排除單眼線索，不過卻無法說明正、零、負像差之間轉換的差異。

除了在不同的靜態物體探究立體視覺對注意力造成的影響，學者讓含有深度的物體在空間中移動，如目標物以動態的方式遠離（approaching motion）或是靠近（receding motion）參與者，且在畫面中加入與目標物。遠離參與者是利用目標物原本的深度平面，

為凹陷於螢幕後方的正像差（30 分角），設計以六個畫面（Frame／33.3ms／5 分角）將目標物的像差縮小為零像差；靠近則是從零像差轉換成負像差（-30 分角）。實驗結果與 Harris et al.(1998)結論相同，干擾物深度的有無並不會影響(Finlayson et al., 2012)，不過在目標物改變深度移動的條件下（往螢幕前方突出），比相同深度下的移動（往螢幕右方移動），前者花費在搜尋目標物的反應時間比較慢。然而，眼球轉換凝視點到不同像差的物體上時，需考慮到眼球幅驟與調節的肌肉運動，其間會比相同深度平面轉換的時間還要慢，且接收愈多深度會產生較多眼動線索近而影響目標物的搜尋時間。如學者 Yano, Emoto, & Mitsuhashi(2004)與 Hirahara, Shiraishi, & Kawai(2012)都將深度控制在正、零、負像差（前者視角為±0°、±0.82°、±1.36°、±1.90°；後者視角為 0.02°、0.05°、

0.06°、±0.08°、0.07°、0.09°、0.10°、±0.11°、0.12°、0.14°、0.15°、0.16°、0.20°、0.25°、

0.30°、0.40°），結果皆顯示接收的深度種類愈多、像差差異愈大且觀看時間愈久時，會產生較多的眼動線索如福驟與調節作用，這些作用皆會影響搜尋目標物的反應時間與視覺疲勞的程度(IJsselsteijn et al., 1999, 2000)。

由上述文獻可知，不論在靜態或者動態型式，深度物體對搜尋目標物的反應時間存

＋14400〞－14400〞反應時間偏光式 50 cm Ghirardelli & Folk（1996）

＋1560〞－1560〞反應時間快門式 75 cm Atchley, Kramer, Andersen

& Theeuwes（1997）

＋698〞無

＋2952" -2952"

視覺舒適度快門式 108 cm Yano, Emoto & Mitsuhashi

（2004）

＋4896" -4896"

＋6840" -6840"

＋1440" -396" 視覺舒適度偏光式 156 cm Hirahara, Shiraishi & Kawai

（2012）

二立體與平面影像的比較研究

立體與平面影像比較研究（The comparative research of 3D image and 2D image）的實驗中，是以立體顯示器直接呈現 2D 或 3D 影像。在 3D 情境下，以畫面呈現的方式選擇立體顯示器可分為：偏光式顯示器（polarized display）與快門式顯示器（shutter display）

兩大類型。實驗參與者在實驗中會搭配偏光式（polarized glasses）或快門式（shutter glasses）的立體眼鏡，呈現的影像會包含兩種以上的深度像差類型，在實驗過程中再藉由眼球追蹤的技術記錄眼球觀看不同畫面時的運動變化。因此，除立體深度的不同對反應時間造成的影響差異之外，透過紀錄且比較眼球在立體影像或平面影像的運動，可以直接或者間接解讀立體深度對眼球運動的影響，以及理解眼球動在不同的視覺特徵區域的敏銳度差異。

如學者 Huynh-Thu & Schiatti(2011)讓參與者直接觀看立體／平面無聲影片，包含卡通、體育賽事、現場音樂會、廣告以及電影預告片等，結果顯示在立體情境下每一點凝視點的平均總凝視時間（average fixation duration），以及整體凝視點的持續時間（duration of ﬁxations）會較短，因此凝視頻率（fixation frequency）會較快。與 Jansen, Onat &

在文檔中立體深度的注意力攫取效果 (頁 14-21)