視線感知系統

第三節視線感知系統

現今科技產品環伺，人機互動關係愈趨多元，而屢次與電腦裝置接觸無疑是對使用者疲勞轟炸。為了因應未來複雜的環境且減少人們的認知負擔，

Nielson（1993）認為非指令型使用者介面能提供適當的協助，亦即系統不再被動接受使用者指令，而是主動偵測其生理與心理狀態、行為、乃至環境變化，

諸如語音、眼動、臉部表情、肢體動作等，據此資訊預測並給予適當之回饋。

其中，「眼球追蹤」屬最能反映個體注意力的互動途徑，尤其應用於虛擬實境

（virtual reality）、擴增實境（augmented reality）或混合實境（mixed reality），

更能明確地辨識使用者的意圖。同樣概念的自然用戶介面（Natural User Interfaces）派典相繼提出，例如情感計算（affective computing）、情境感知

（context-aware）、透明運算（transparent computing）以及普及運算（ubiquitous computing）等。此研究取向訴求由電腦主導互動，透過行為指標揣摩使用者的動機，再決定將傳遞何種內容，藉此，讓使用者保有餘力應對任務本身而非溝通過程（Tennenhouse, 2000）。

本實驗所關心的注意力感知系統（Attention Aware Systems, AAS），或稱注意力使用者介面（Attentive User Interfaces, AUI）雖與上述案例共享目標，卻更強調任何安排皆須配合個體在各作業下的注意力歷程（Vertegaal, 2003; Roda &

Thomas 2006），於多重任務的動態環境中適應、支持其行為，且避免無謂的任務中斷。Maglio 等人（2000）則歸結所謂的注意力感知必須能偵測行為、模擬目標、預測需求、補足資訊並與使用者互動，故該系統通常仰賴感測器收錄相關線索（Horvitz, Kadie, Paek, & Hovel, 2003）。除了膚電、腦波等生理回饋外，

長期累積的數位足跡（digital footprint），例如網頁瀏覽歷史、社群媒體發布或電子產品使用狀況，皆蘊含不少有價值的訊息，諸多應用從中抽絲剝繭列舉可能的偏好與問題。

基於本章第一節「眼動之特性與困境」所述，Hyrskykari（2006）指出唯有眼球追蹤得以充分反映注意力投入程度。將眼動表現納入考量促使系統「意識」到使用者的心理狀態，俾利權衡任務優先順序、迎合當下行為模式，遂由視線感知預判使用者需求再適合不過。而相關應用早在Starker 與 Bolt（1990）

就發表小王子說書人（Little Prince Storyteller），根據讀者眼動軌跡判斷其感興趣的區域，局部放大並播送更詳細的旁白，藉此引導故事演進；SUITOR

（Simple User Interest Tracker, Maglio & Campbell, 2003）注意力代理（attentive

agents）利用瀏覽網頁時的注視行為，推斷讀者所關心的議題，並自動查找相應資訊呈現在螢幕四周，其目的在於促進人機溝通的效率；EASE（Eye Assisted Selection and Entry, Wang, Zhai, & Su, 2001）則嘗試解決中文拼音輸入法為人詬病的選字問題。當同音異義的候選對象過多時，系統便會提前標記視線焦點，

使用者只須按下空白鍵確認，即可選取凝視點就近的目標。省略查看數字鍵的流程，好讓注意力資源更充分利用，從而減少該任務的認知負荷；同樣做指引之用的EyeGuide（Eaddy, Blaskó, Babcock, & Feiner, 2004）、iTourist（Qvarfordt,

& Zhai, 2005）、Museum Guide 2.0（Toyama et al., 2011）及 GazeGIS（Tateosian, Glatz, Shukunobe, & Chopra, 2014）皆依循使用者的視線動向，給予貼題的照片、地圖、方向導航、或語音導覽，憑著注意力誘發（attention-contingent）機制即時補充其所見事物與所處情境之資訊。且評估結果一致顯示數位個人助理對作業表現與使用經驗有正向影響。

有鑑於閱讀乃人機互動的基本要件，又閱讀歷程關乎使用者資訊獲取的品質，故該領域的輔具設計為實務上熱門的主題。譬如Takagi（1998）提出的翻譯支援系統（Translation Support System），即隨著使用者瀏覽文章，系統自動移除無用段落並持續更新文本，當偵測到眼神遲疑時便從日英對照的語料庫中提取關鍵字翻譯；而Sibert 等人（2000）的閱讀助理（Reading Assistant）強調閱讀外語時的行為變化，若停滯時間超過設限，便劃記提醒（閾值1 為

240ms）再附註該詞彙的母語發音與文字釋義（閾值 2 為 360ms），取代過往以滑鼠觸發的方式。經實驗證實有輔具從旁協助之閱讀障礙者，其詞彙再認與答題正確率皆顯著改善，且凝視時間與個數銳減、閱讀速度增快。再者，基於凝視的注釋（gaze-based annotations）應用則整合時間和比例指標，將學生閱讀緩慢或反覆多次的文句畫線、填色，且標註篇章間的閱覽順序，以揭示教材艱澀難懂之處，方便教師察覺原因對症下藥。結果顯示對學習成效有所幫助

（Buscher, Dengel, van Elst, & Mittag, 2008; Okoso, Kunze, & Kise, 2014; Cheng,

Sun, Sun, Yee, & Dey, 2015）。數位學習（e-learning）平台與智慧型輔導系統

（intelligent tutor system）亦根據參與者的注視位置，適時播放教學影片或補救教材，比如在圖表處停駐許久便會加註解釋、或顯現動畫引導觀看重點，有效促進其投入與學習（Calvi, Porta, & Sacchi, 2008; D'Mello, Olney, Williams, &

Hays, 2012）。此外，Biedert 等人（2010）所開發的 eyeBook 及 Text 2.0 電子書軟體，則利用眼球追蹤與預先規劃的演算法，監測使用者在閱讀文章時的眼動型態。當視線經過（閾值為750ms）網頁上特定文件物件模型（Document Object Model, DOM）元素時即呈現翻譯、註腳、發音、或語境所對應的圖案、

動畫，期望藉此幫助理解文意。同時融入眼控機制，進行如選取、換頁、滾動等外顯互動，該應用結合多媒體以增強閱讀體驗並展示眼動應用的穩定性。問卷調查指出視線響應文本（gaze responsive text）原型屢獲佳評（Biedert et al., 2010; Hosseiny et al., 2011）。近年，學者如 Ishiguro 與 Rekimoto（2011）及 Toyama 等人（2014）將注意力使用者介面移植至擴增實境，借助視線管理虛擬資訊的顯示位置、類型、亮度與細節層次（level-of-detail），即愈接近視野中心者愈清晰詳盡。甚至辨識、即時翻譯使用者以視線手勢所框選的文字內容，幫助非母語者瞭解工作或公共場域的指示標語，避免因語言不通的溝通障礙。

可惜在眾多閱讀相關應用中，僅有iDict（Hyrskykari et al., 2000;

Hyrskykari, Majaranta, & Räihä, 2003; Hyrskykari, 2006）無摻雜過多主觀設定，

明確地參照心理學在閱讀上的發現。此系列研究進一步聚焦於翻譯功能上，旨在幫助非母語者讀懂外語電子文件，以自然的眼動表現與詞彙特性推估文本難易程度，讓視線互動的效果更貼近使用者的需求。當任一單字的總凝視時間高於該詞頻的詞彙所對應之理論閾限（註：最早版本設800ms 為固定閾值；之後改為2000-0.17freq, 100 < freq < 6000），即意味著不熟悉或遭遇障礙。程式便自動在目標字上方與右側視窗顯示翻譯、例句和詞性變化等介紹。讓使用者在意識到困難前，不經意瞥見系統協助，最小化手動查詢字典所造成的切換成本

（switching cost）以及對語意理解的干擾，好專注於主要任務－閱讀本身。再者，iDict 導入演算法以視線軌跡、凝視與回視狀況，區辨閱讀、掃視

（scanning）、休眠（dormant gazing）、遇到困難（encountering difficulties）四種眼動型態，藉此減少系統誤判，最適化回饋呈現時機。且更進一步分析詞彙與語法，提前注釋可能有問題的單字、詞組、片語以及複雜句型結構，並存取個人使用偏好，記錄其閱讀習慣以客製化輔助內容。該研究從參與者主觀報告總結出視線感知輔具的確提升了閱讀體驗，雖然評價仍略遜滑鼠一籌，但搭配視線游標（gaze cursor）與線標（line marker）兩視覺回饋，滿意程度堪比傳統介面。另從註解觸發狀況檢驗，發現實際操作時的假警報（false alarm）比例低於百分之三，表示其判定有翻譯需求的詞彙與使用者主觀感受有困難者相符。然而，iDict 採用基於停滯時間的互動模式，並自行推算簡易的數學模型以規避

「點石成金」的問題，卻因為疏忽詞長、詞頻與個體差異等因素而預測失準，

導致部分使用者反映系統響應性不佳且與期望產生落差。

綜合上述，傳統的圖形介面若能適時融入注意力感知系統，將有助於優化例行事務的流程、改進注意力資源分配。但是，實務應用的研究方向仍屬原型設計與系統開發居多，且一致宣稱眼動誘發機制對用戶獲益匪淺，未討論實際場域的體驗與即時回饋如何影響個體表現。僅在李克氏五點量表中得正面的使用評價，欠缺客觀數據佐證。其中，亦有部分學者提出視線互動個人化與客製化的展望，由於眼球運動變異甚大，因人而異、量身打造的系統設定有其必要性，固定的閾值或互動模式容易與使用者認知有所出入。是故本研究將考量詞彙特性與個體差異撰寫判斷式，並檢視互動當下的眼動型態，藉各項指標瞭解感知系統是否如過去預期所述，能顯著促進訊息整合且增加閱讀效率。

在文檔中視線感知即時翻譯工具的開發與評估 (頁 20-24)

第三節 視線感知系統

第三節視線感知系統