• 沒有找到結果。

第三節 視線感知系統

現今科技產品環伺,人機互動關係愈趨多元,而屢次與電腦裝置接觸無疑 是對使用者疲勞轟炸。為了因應未來複雜的環境且減少人們的認知負擔,

Nielson(1993)認為非指令型使用者介面能提供適當的協助,亦即系統不再被 動接受使用者指令,而是主動偵測其生理與心理狀態、行為、乃至環境變化,

諸如語音、眼動、臉部表情、肢體動作等,據此資訊預測並給予適當之回饋。

其中,「眼球追蹤」屬最能反映個體注意力的互動途徑,尤其應用於虛擬實境

(virtual reality)、擴增實境(augmented reality)或混合實境(mixed reality),

更能明確地辨識使用者的意圖。同樣概念的自然用戶介面(Natural User Interfaces)派典相繼提出,例如情感計算(affective computing)、情境感知

(context-aware)、透明運算(transparent computing)以及普及運算(ubiquitous computing)等。此研究取向訴求由電腦主導互動,透過行為指標揣摩使用者的 動機,再決定將傳遞何種內容,藉此,讓使用者保有餘力應對任務本身而非溝 通過程(Tennenhouse, 2000)。

本實驗所關心的注意力感知系統(Attention Aware Systems, AAS),或稱注 意力使用者介面(Attentive User Interfaces, AUI)雖與上述案例共享目標,卻更 強調任何安排皆須配合個體在各作業下的注意力歷程(Vertegaal, 2003; Roda &

Thomas 2006),於多重任務的動態環境中適應、支持其行為,且避免無謂的任 務中斷。Maglio 等人(2000)則歸結所謂的注意力感知必須能偵測行為、模擬 目標、預測需求、補足資訊並與使用者互動,故該系統通常仰賴感測器收錄相 關線索(Horvitz, Kadie, Paek, & Hovel, 2003)。除了膚電、腦波等生理回饋外,

長期累積的數位足跡(digital footprint),例如網頁瀏覽歷史、社群媒體發布或 電子產品使用狀況,皆蘊含不少有價值的訊息,諸多應用從中抽絲剝繭列舉可 能的偏好與問題。

基於本章第一節「眼動之特性與困境」所述,Hyrskykari(2006)指出唯有 眼球追蹤得以充分反映注意力投入程度。將眼動表現納入考量促使系統「意 識」到使用者的心理狀態,俾利權衡任務優先順序、迎合當下行為模式,遂由 視線感知預判使用者需求再適合不過。而相關應用早在Starker 與 Bolt(1990)

就發表小王子說書人(Little Prince Storyteller),根據讀者眼動軌跡判斷其感興 趣的區域,局部放大並播送更詳細的旁白,藉此引導故事演進;SUITOR

(Simple User Interest Tracker, Maglio & Campbell, 2003)注意力代理(attentive

agents)利用瀏覽網頁時的注視行為,推斷讀者所關心的議題,並自動查找相應 資訊呈現在螢幕四周,其目的在於促進人機溝通的效率;EASE(Eye Assisted Selection and Entry, Wang, Zhai, & Su, 2001)則嘗試解決中文拼音輸入法為人詬 病的選字問題。當同音異義的候選對象過多時,系統便會提前標記視線焦點,

使用者只須按下空白鍵確認,即可選取凝視點就近的目標。省略查看數字鍵的 流程,好讓注意力資源更充分利用,從而減少該任務的認知負荷;同樣做指引 之用的EyeGuide(Eaddy, Blaskó, Babcock, & Feiner, 2004)、iTourist(Qvarfordt,

& Zhai, 2005)、Museum Guide 2.0(Toyama et al., 2011)及 GazeGIS(Tateosian, Glatz, Shukunobe, & Chopra, 2014)皆依循使用者的視線動向,給予貼題的照 片、地圖、方向導航、或語音導覽,憑著注意力誘發(attention-contingent)機 制即時補充其所見事物與所處情境之資訊。且評估結果一致顯示數位個人助理 對作業表現與使用經驗有正向影響。

有鑑於閱讀乃人機互動的基本要件,又閱讀歷程關乎使用者資訊獲取的品 質,故該領域的輔具設計為實務上熱門的主題。譬如Takagi(1998)提出的翻 譯支援系統(Translation Support System),即隨著使用者瀏覽文章,系統自動 移除無用段落並持續更新文本,當偵測到眼神遲疑時便從日英對照的語料庫中 提取關鍵字翻譯;而Sibert 等人(2000)的閱讀助理(Reading Assistant)強調 閱讀外語時的行為變化,若停滯時間超過設限,便劃記提醒(閾值1 為

240ms)再附註該詞彙的母語發音與文字釋義(閾值 2 為 360ms),取代過往以 滑鼠觸發的方式。經實驗證實有輔具從旁協助之閱讀障礙者,其詞彙再認與答 題正確率皆顯著改善,且凝視時間與個數銳減、閱讀速度增快。再者,基於凝 視的注釋(gaze-based annotations)應用則整合時間和比例指標,將學生閱讀緩 慢或反覆多次的文句畫線、填色,且標註篇章間的閱覽順序,以揭示教材艱澀 難懂之處,方便教師察覺原因對症下藥。結果顯示對學習成效有所幫助

(Buscher, Dengel, van Elst, & Mittag, 2008; Okoso, Kunze, & Kise, 2014; Cheng,

Sun, Sun, Yee, & Dey, 2015)。數位學習(e-learning)平台與智慧型輔導系統

(intelligent tutor system)亦根據參與者的注視位置,適時播放教學影片或補救 教材,比如在圖表處停駐許久便會加註解釋、或顯現動畫引導觀看重點,有效 促進其投入與學習(Calvi, Porta, & Sacchi, 2008; D'Mello, Olney, Williams, &

Hays, 2012)。此外,Biedert 等人(2010)所開發的 eyeBook 及 Text 2.0 電子書 軟體,則利用眼球追蹤與預先規劃的演算法,監測使用者在閱讀文章時的眼動 型態。當視線經過(閾值為750ms)網頁上特定文件物件模型(Document Object Model, DOM)元素時即呈現翻譯、註腳、發音、或語境所對應的圖案、

動畫,期望藉此幫助理解文意。同時融入眼控機制,進行如選取、換頁、滾動 等外顯互動,該應用結合多媒體以增強閱讀體驗並展示眼動應用的穩定性。問 卷調查指出視線響應文本(gaze responsive text)原型屢獲佳評(Biedert et al., 2010; Hosseiny et al., 2011)。近年,學者如 Ishiguro 與 Rekimoto(2011)及 Toyama 等人(2014)將注意力使用者介面移植至擴增實境,借助視線管理虛擬 資訊的顯示位置、類型、亮度與細節層次(level-of-detail),即愈接近視野中心 者愈清晰詳盡。甚至辨識、即時翻譯使用者以視線手勢所框選的文字內容,幫 助非母語者瞭解工作或公共場域的指示標語,避免因語言不通的溝通障礙。

可惜在眾多閱讀相關應用中,僅有iDict(Hyrskykari et al., 2000;

Hyrskykari, Majaranta, & Räihä, 2003; Hyrskykari, 2006)無摻雜過多主觀設定,

明確地參照心理學在閱讀上的發現。此系列研究進一步聚焦於翻譯功能上,旨 在幫助非母語者讀懂外語電子文件,以自然的眼動表現與詞彙特性推估文本難 易程度,讓視線互動的效果更貼近使用者的需求。當任一單字的總凝視時間高 於該詞頻的詞彙所對應之理論閾限(註:最早版本設800ms 為固定閾值;之後 改為2000-0.17freq, 100 < freq < 6000),即意味著不熟悉或遭遇障礙。程式便自 動在目標字上方與右側視窗顯示翻譯、例句和詞性變化等介紹。讓使用者在意 識到困難前,不經意瞥見系統協助,最小化手動查詢字典所造成的切換成本

(switching cost)以及對語意理解的干擾,好專注於主要任務-閱讀本身。再 者,iDict 導入演算法以視線軌跡、凝視與回視狀況,區辨閱讀、掃視

(scanning)、休眠(dormant gazing)、遇到困難(encountering difficulties)四種 眼動型態,藉此減少系統誤判,最適化回饋呈現時機。且更進一步分析詞彙與 語法,提前注釋可能有問題的單字、詞組、片語以及複雜句型結構,並存取個 人使用偏好,記錄其閱讀習慣以客製化輔助內容。該研究從參與者主觀報告總 結出視線感知輔具的確提升了閱讀體驗,雖然評價仍略遜滑鼠一籌,但搭配視 線游標(gaze cursor)與線標(line marker)兩視覺回饋,滿意程度堪比傳統介 面。另從註解觸發狀況檢驗,發現實際操作時的假警報(false alarm)比例低於 百分之三,表示其判定有翻譯需求的詞彙與使用者主觀感受有困難者相符。然 而,iDict 採用基於停滯時間的互動模式,並自行推算簡易的數學模型以規避

「點石成金」的問題,卻因為疏忽詞長、詞頻與個體差異等因素而預測失準,

導致部分使用者反映系統響應性不佳且與期望產生落差。

綜合上述,傳統的圖形介面若能適時融入注意力感知系統,將有助於優化 例行事務的流程、改進注意力資源分配。但是,實務應用的研究方向仍屬原型 設計與系統開發居多,且一致宣稱眼動誘發機制對用戶獲益匪淺,未討論實際 場域的體驗與即時回饋如何影響個體表現。僅在李克氏五點量表中得正面的使 用評價,欠缺客觀數據佐證。其中,亦有部分學者提出視線互動個人化與客製 化的展望,由於眼球運動變異甚大,因人而異、量身打造的系統設定有其必要 性,固定的閾值或互動模式容易與使用者認知有所出入。是故本研究將考量詞 彙特性與個體差異撰寫判斷式,並檢視互動當下的眼動型態,藉各項指標瞭解 感知系統是否如過去預期所述,能顯著促進訊息整合且增加閱讀效率。