以情緒為中心之情境資訊觀察與評估

(1)

以情緒為中心之情境資訊觀察與評估

劉吉軒、吳建良國立政治大學資訊科學系

摘要

情境感知計算必須具備一個完善的情境資訊模型，以做為情境運算的知識基礎。情境資訊模型發展的最大困難之一，

在於缺乏一個有效的情境資訊來源，同時也無法自動取得情境資訊的種類及彼此的關聯。本研究以情緒為情境資訊之焦點，

嘗試從大量文本中建立人的情緒與事物概念之關聯性，並以問卷調查驗證其關聯是否符合一般之情緒感受認知。我們以情緒詞與特定詞性之字詞為節點，將文本轉換為網路結構，同時，提出四種節點關聯指標，以評估特定情緒節點與相關事物概念節點之關聯強弱。實驗結果顯示，本研究方法能有效的從文本中取得影響人的情緒之事物概念之相關資訊。

關鍵詞：情境感知計算、情緒、情境資訊一、序論

電腦的功能發展一直以能滿足人的需求為目的，協助我們進行各種資訊的處理，提供各種工作上及生活上的服務，幫助我們解決問題，甚至開創各種前所未有的應用。前瞻性的研究指出，人與電腦之間的互動方式，將從使用者操作式的直接控制，進展為電腦體貼式的主動服務。這種人機互動能力必須以對使用者的需求、

行為模式、環境等面向的掌握為基礎，才能適時的、準確的推論使用者在當下場景所需的功能與服務，進而提供讓使用者感到貼心及滿意的過程與結果。情境感知計算(context aware computing)是近幾年興起

的研究領域，其目的即在掌握使用者問題之情境，提供適切之服務，滿足其真正之需求。

許多研究都指出，情境的概念還缺乏一個清楚而明確的具體定義，很大的原因是情境的概念橫跨了許多不同的領域，包括哲學、心理學、語言學、語用學、電腦科學、及人工智慧等，而各領域到目前為止都還無法發展出一個通用的、統一的、

正式的情境模型。在電腦科學領域中，情境的定義大致可以分為三類。第一類是以應用 (applications) 為情境的焦點，例如 Moran & Dourish [12]定義情境為計算裝置被包覆的物理與社會狀況，而 Chen &

Kotz [5]定義情境為決定應用行為或關係使用者的應用事件之相關狀態與設定。第二類是以使用者(users)為情境的焦點，例如 Dey, Abowd, and Wood [8]定義情境為使用者的物理、社會、情緒、及資訊狀態。

第三類是以事物(entity)為情境的焦點，例如 Schmidt [13]定義情境為與應用、使用者、或裝置有關的事實資訊。到目前為止，

最詳盡而複雜的情境模型大概是 Bradley

& Dunlop [4]嘗試結合各個領域的情境定義，而將情境區分為工作任務的情境、物理環境的情境、社會關係的情境、時間的情境、使用者認知的情境、及應用的情境等。然而其模型仍是以概念性為主，著重於觀念的建立、分類、對應、與描述，尚無法轉換為實質的運作機制。

情境感知計算的進一步發展至少面臨著兩個問題，第一個問題是目前研究中情境資訊的少量而薄弱。情境的構成除了時與地之外，還有許多的面向，例如人、事、

物等，而每一個情境建構的面向又可以展

(2)

開出更多的變數。例如在人的面向中，除了使用者的身份之外，還有性別、年齡、

喜好、工作、甚至情緒等因素。在所有可能的情境變數所構成的空間中，目前許多情境計算研究所考慮的情境資訊可以說只佔了很小很小的比例。第二個問題是情境變數與應用目的之間的關連。當情境變數有什麼樣的狀態時，應該提供什麼樣的適當資訊、功能、或服務。例如，在下午三點時提供的餐飲服務資訊以下午茶或輕食為主，而在夜間十點以後提供的餐飲服務以宵夜為主。這些情境狀態與系統輸出之間的對應關係，目前只能依賴系統發展者個別的設計。這種特製式(ad hoc)的方法只能處理少量的情境狀態的對應關係，如果我們要考慮更多的情境面向與變數，就必須具備更通用的、更有結構性的、更有邏輯性的關連建立方式。這兩個問題都根基於缺乏一個良好而完整的情境資訊模型，

造成目前情境變數的使用受到相當的限制並且顯得零散，同時，情境狀態與系統回應的關連也只能仰賴薄弱的人為設計，而無法達成以強健的結構性質與關係為依據的自動引導與啟動。

情境資訊模型發展的最大困難之一，

在於缺乏一個有效的情境資訊來源，同時也無法自動取得情境資訊的種類及彼此的關聯。目前大部分的研究是以應用目的之需求做有限的考量，其來源是發展者的主觀想像，並且是以人工的方式做單一目的及有限範圍的建構，在通用性與延伸性上有明顯的不足。情境資訊既然是以人事時地物為主的資訊，其來源除了個人本身的經驗之外，更多人的經驗，甚至從過去到現在的全體人類的認知經驗，都可以是情境資訊來源。事實上，這些廣泛的、長期的認知經驗除了存在於人心中之外，也被記錄於大量的各種文字描述中，包括文章、故事、報導、日記等。因此，我們認為各式各樣的文件可以被利用為情境資訊的有效來源，提供各種應用目的所需的情境資訊種類及其相關概念之連結關係，同時，也兼具範圍大小可依應用目的所需而彈性調整或擴充之優點。

本研究將聚焦於情緒為中心的情境資訊，希望從大量文本中取得事物概念與特定情緒之關聯性。我們於第二節探討情境模型及情緒與文本之相關研究，第三節提出文本中之情緒與情境資訊關聯建構方式，並設計四個關聯強度指標，以評估特定情緒與相關事物概念之關聯強弱。於第四節中，我們以問卷調查的方式驗證情緒之情境資訊是否符合一般人之情緒感受認知，並進行實驗結果之說明與分析。最後，

我們於第五節總結研究成果，並規劃未來之研究方向。

二、相關研究

在情境模型的建構方面，Chen 等人[6]

提出以本體知識(ontology)為情境感知系統之實質運作機制，其推論基礎包括：(1) 共同的本體知識可以讓不同的系統達成知識分享；(2)具有清楚的語意定義的本體知識可以讓系統對於情境資訊進行推理；(3) 明確表示的本體知識可以讓原先未設計一起運作的系統與裝置有機會達成不預期的合作。不同系統可能有個別的本體知識，

再由本體知識仲介者(ontology broker)的協助，進行情境的轉換與傳遞。然而，不論是本體知識的實際建構或是情境的轉換依據，仍然必須依賴人工設計與建置。本研究從文本中獲取情境資訊與關聯性，可以做為情境本體知識之內容建置來源。

在語言文本與情緒面向之研究上，林宇中[2]提出了針對文本內容之情緒分類系統，其作法大致為先定義表達特定語意的語意標籤，再以語意標籤為中心，擷取文句中其他非語意標籤定義的詞。運用資料探勘技術，自動產生出情緒規則，並以 SVM 分類技術訓練出一套文本內容之情緒分類模組。Liu 等人[10]以文字與生活常識(Open Mind Common Sense Corpus [15]) 為基礎，建立一個判斷文句情緒之機制，

並設計出一個電子郵件介面，根據郵件內容中的每一句話，賦予一個對應的臉部情緒圖案，藉以增進使用者之間訊息之趣味性。Ma 等人[11]針對即時的對話訊息，以

(3)

情意詞(affective word)及其對應的情緒向量為基礎，提出進階的關鍵字查找 (keyword spotting)技術，並採用文法進行情緒意義之偵測，最後利用動畫人物顯示情緒判斷結果。本研究同樣是關注於文本中之情緒資訊，但以取得文本內容中所描述的情緒與特定事物概念的關聯性資訊為目的。

三、情緒與情境資訊之關聯建構情緒是人對自身狀態的心理反應，對週邊環境、事件、行為、物體的經驗及其影響的一種自然而直接的感受，如快樂、

喜悅、憤怒、害怕、悲傷等。大部分人對特定事物的情緒反應有相當程度的共通性，例如對食物、音樂的反應是喜悅，對戰爭的反應是害怕。長久以來，語言就是用來表達人的經驗與感受的重要工具，許多事物與人的情緒反應之間的因果關係存在於大量的文本當中。因此，如果我們建立有效獲取這些資訊的方法，就能以大量文本為情境感知計算所需的人與週遭環境的關連，提供可依賴的及完整的資訊來源。

過去計算語言學相關研究中，對於字詞資訊的分析探討，曾經基於網路結構的通用性與彈性，採取了不同類別的網路模型，以表示文本中的字詞現象，例如共現網路 (co-occurrence network) 、語法網路 (syntactic network) 、語意網路 (semantic network)等。本研究的目的為掌握文本中所呈現的情緒詞與各種事物概念詞之間的聯結關係，所以我們採用共現網路模型，

以情緒詞及事物概念詞為節點，將設定文本範圍內共同出現的詞語，以節點之間的連結來表示其關連。我們將與人的情緒相關之情境定義為：「與各種特定情緒具有較強關連之事物概念集合。」因此，我們將文本中與情緒相關的描述，表示成情緒與事物概念之共現網路，再從此共現網路的內容中，得到與特定情緒相關的情境資訊。

(一) 情緒情境共現網路

情緒情境共現網路的最主要特性為記錄文本中哪些情緒字詞與哪些事物概念字詞在設定範圍內一同出現過，而文本中其他的無關字詞及較深入的語法語意關係則予與忽略。情緒詞是一個表達具體情緒感受的字詞集合，我們以高臺茜與倪珮晶研究中[3]對二千多個中文情緒字詞的整理為基礎，挑選其中較常見的 58 個為我們的情緒字詞集合，分別屬於憤怒、害怕、悲傷、愛與喜悅等四大類。在事物概念字詞方面，我們以詞性為主要的篩選依據。中研院詞庫小組將中文詞分為八種詞類：體詞(N)、述詞(V)、副詞(D)、非謂形容詞 (A)、介詞(P)、連接詞(C)、語助詞(T)與感嘆詞(I)。體詞包含了名詞(例如：物品、時間、地點等)、定詞(例如：這個、其他、

一些等)、量詞(例如：一「本」書、三「根」

棍子等)、代名詞、方位詞等。述詞包含動作詞(例如：走、使用、跑等)、狀態詞(例如：高大、開心、擅長等)以及其他有明確訊息卻無主體的詞。其他詞性的字詞大多為修飾、連接、表達語氣或態度的功能，

和體詞與述詞相較之下，不具特別具體的意義。因此，我們選擇以體詞與述詞兩種詞性篩選出事物概念的字詞集合，希望能夠代表某件事情、某物體或是行為動作等。另外，我們以一個子句為情緒詞與事物概念詞共同出現的觀察範圍。

我們定義情緒情境共現網路建構演算法如下：

Step1. 將文本中含有情緒詞的文句取出。

Step2. 保留情緒詞與詞性為體詞與述詞 的字詞，刪除其他字詞。

Step3. 依照每一文句中的共現關係，以情 緒詞節點為中心，向前後的字詞節點進行連結。網路中的連結關係不重覆建立。

假設經過斷詞與標註詞性後的文本中 有三句含有情緒詞的文句：a1(N) b1(V) C(e)

d

₁(N)，a₂(N) p₁(N) d₁(N) C(e) y₁(V) b₂(N)，

p

1(N) E(e) a1(N)，其中(N)、(V)、(e)代表體 詞、述詞、情緒詞。圖一顯示由這三個文句所建構出的情緒情境初階共現網路，灰底為情緒詞節點，白底為事物概念字詞節

(4)

點。在初階共現網路中，只要是不同的字詞就會以一個節點來代表。因此，當文本的量增加時，初階共現網路的大小也隨之成長，而每個節點所代表的字詞在文本中重複出現的次數也不高。為了解決這些問題，我們依據中研院「中文一詞泛讀」[1]

中的語料資源，取得一般字詞之上的第一層上位詞，將上位詞相同的同義詞合併為單一節點，形成情緒情境概念共現網路。

在語料資源中無法取得上位詞的字詞如人名、團體名等，則歸類為未知詞而不予納入。

圖一：情緒情境初階共現網路

圖二：情緒情境概念共現網路圖二顯示由圖一的情緒情境初階共現網路進一步建置的情緒情境概念共現網 路，其中 a1、 a2 的上位詞為 A，b1、b2

的上位詞為 B，d1的上位詞為 D，p1的上 位詞為 P，y₁的上位詞為 Y。

(二) 關聯性指標

情緒情境概念共現網路雖然表示了特定情緒與特定事物概念之間的連結關係，

但是對於這些連結關係的差異則缺乏進一步的區分。為了能有效的評估情緒詞與事物概念之間的關聯強弱，我們使用三種指標，分別為：距離強度、相互訊息、概念變異，再將前三種指標合併為第四個綜合指標。

1. 距離強度

在中文的使用方式中，通常兩個字詞在文句中的距離越接近，則可被視為彼此在意義連結上的關係越密切。距離強度指標就是嘗試反應這樣的一般性認知。我們不希望事物概念詞與情緒詞之間的距離受到文句中一些較無具體意義的詞穿插影響，所以，我們以詞性(體詞與述詞)及情緒詞篩選簡化後的文句，計算事物概念詞與情緒詞之間的平均距離。若以圖一所示 的三個文句為範例，事物概念 A 與情緒詞 C 的平均距離為(2+3)/2 = 2.5，而事物概念 A 與情緒詞 E 的平均距離則為 1。

eq. (1)：

D(X, E) = Σ freq(xk, e_k) / Σ | l(xk) – l(e_k) | 距離強度做為關聯性指標之一是希望反應文本中出現的字詞之間的密切程度，

指標數值的大小直接對應為關聯性的強弱。因此，我們取平均距離的倒數為距離 強度。公式一表示事物概念詞 X 與情緒詞 E 之間的距離強度 D，其中Σ freq(x_k, e_k)為 文本中 X 與 E 共同出現的次數，l(xk)及 l(ek) 為個別事物字詞 xk及情緒詞 ek在某一個文句中出現的位置。

2. 相互訊息

相互訊息為計算語言學文獻中常見的 mutual information[7]，其目的為評估兩個字詞在設定範圍內被連同一起使用的情形，其計算方式為比較兩個字詞在文本中共同出現的機率相較於其個別單獨出現的機率。在此，我們可以使用為事物概念字詞與情緒詞一同出現在一個文句中的情形，而推測此事物概念與特定情緒之間 E p1

C a1

d1

y1

b1

a2

b2

E P

C A

B D

Y

(5)

的關聯強弱。

eq. (2)：

M(X, E) = log (P(X, E)/P(X)P(E))

= log [(Σ freq(xk, e_k)/T) / (Σ freq(xk)/T) (Σ freq(ek)/T)]

其中，freq(xk)為事物字詞 xk在文本中 出現的次數，freq(e_k)為情緒字詞 e_k在文本 中出現的次數，freq(xk, ek)為 xk與 ek同時在一個文句中出現的次數，Σ為對同屬一 個概念上位詞 X 的 x_k加總及對同屬一個情 緒類別 E 的 ek加總，最後，T 為文本中所 有體詞、述詞與情緒詞出現之總次數。

3. 概念變異

由於我們將體詞、述詞與情緒詞之間的關聯提升到其上位詞的概念層次進行觀察，同一個概念中的不同字詞與特定情緒的連結廣度可能也反應了該概念與特 定情緒之間的關聯強度。以圖三為例，{x1, x₂, x₃, x₄, x₅}為事物概念 X 的同義詞，並分 別與情緒概念 E₁與 E₂相關，其中，E₁只 與 x1, x2共同出現，而 E2則分別與 x2, x3, x4, x₅共同出現，這種差異可能代表 X 與 E₂ 的關係較密切。

圖三：概念關聯之差異

概念變異之目的為評估某一個事物概念與特定情緒之間經由不同的同義詞的連結情形，希望能反應連結廣度對關聯強弱的影響。我們設計的概念變異計算公式為：

eq. (3) :

V(X, E) = | (x_k and e_k) | / | X | + Σ freq(xk, e_k) / Σ freq(ek) + log | (xk and ek) |

其中，| (xk and ek) |為 X 概念中與特定 情緒 E 共同出現於文句中的不同同義字個 數，而| X |為 X 概念在文本中出現過的不 同同義字個數。公式中的第二個分項與第三個分項為對同義字較多且連結較廣的事物概念之強度補償。

4. 綜合指標

不論是距離強度、相互訊息或是概念變異，對特定事物概念與特定情緒之間的關聯情形，在觀察角度與評估效能上皆有其侷限性，因此，我們也提出了一個將這三個指標簡單加總的綜合指標，希望能兼顧不同的連結觀察角度。為了因應各個指標在數值變化範圍上的差異，我們先將各指標的數值進行線性正規化，調整為介於 0 到 1 之間後，再行加總。綜合指標之計算公式為：

eq.(4)：

C(X, E) = N(D(X, E)) + N(M(X, E)) + N(V(X, E))

其中，N( )代表個別指標數值之線性 正規，調整方式為實際數值與最小數值之差除以最大數值與最小數值之差。

(三) 關聯強弱之排序分群

透過這些關聯性指標，特定事物概念與不同情緒之間或特定情緒與不同事物概念之間的關聯強弱程度，可以得到數值化的評量與區辨。然而關聯程度經過指標公式所計算出的數值，尤其當差距不顯著時，其線性排序之個別名次來反應關聯強度上之差異，並不是特別的有意義。例如，

與快樂情緒有關的事物概念中，經由特定指標的數值計算得到的大小排序中，第五名與第七名的數值差異也許在 0.0001 以內。因此，關聯程度之間的線性排序並不是特別明確的反應我們對事物概念與情緒之間關聯程度區辨的需求。大部分時候，

我們需要的是程度等級的區辨，例如，將與快樂情緒有關的事物概念之關聯程度區分為五種或三種的強弱程度等級，在相同程度等級中個別事物概念的關聯強度大致上是相似的。因此，我們需要的是分群的

E

1

E

2

x

1

x

2

x

3

x

4

x

5

X

(6)

概念，而在分群的做法上，不論是以關聯對象的數目或是以數值大小來平均區分，

都不是合適的方法，只有以指標數值的相似度來區分較為恰當。如圖四所示，某一個指標所計算得到的 15 個概念關聯程度數值分布於 0 與 1 之間(圖四上)，以數值相似度分群的方式(圖四下)顯然較以平均每五個為一群的方式(圖四中)為恰當。

圖四：關聯強度之等級分群我們以統計學上常用的 K-means 為分群的方法，其主要過程為把 n 個物件分為 k 個叢集(cluster)，以使叢集內具有較高的相似度，而叢集間的相似度較低。相似度的評估是根據一個叢集中所有物件的平均值(也可以稱之為叢集的重心)來計算。在實際運算上，我們直接採用 Weka[17]提供的 K-means 軟體工具。

四、實驗設計與結果分析本研究之基本想法為從大量文本中取得與情緒相關的事物概念關聯性，並以此建構出特定情緒初略之情境資訊，做為後續相關情境計算應用之依據。我們將情緒與事物概念之關聯性以網路結構表示，並提出四種關聯強度指標，評估情緒節點與事物概念節點間之關聯強弱，以滿足情境計算應用相關選項在情緒考量下之選擇與區辨需求。因此，我們的實驗目的為：(1) 驗證從大量文本中取得情緒與事物概念關聯性資訊之過程與可行性；(2)驗證關聯強度指標之作用與效能。

(一) 實驗資料

我們採用中研院「現代漢語平衡語料

庫」3.1 版為大量文本的來源，該語料庫涵蓋文學、生活、社會、科學、哲學、藝術等不同主題之各類文章，共有約五百萬詞，廣泛而且具代表性，因此，適合用來探討情緒與情境之關聯資訊。我們以語料庫中文章內容之文句結構與字詞切割及詞性標註為後續處理之依據。

在情緒詞的部分，我們依據高臺茜與倪珮晶[3]對網路言論之情緒詞研究，做為情緒詞庫之來源。高與倪的研究將情緒詞分類為憤怒、害怕、悲傷、同情、愛與喜悅以及謾罵等六類，共收集 2378 個情緒字詞。我們選用其中的憤怒、害怕、悲傷、

愛與喜悅等四類較為核心的情緒，同時將

「現代漢語平衡語料庫」中沒有出現或出現次數很少的情緒字詞刪除，最後獲得採用的情緒字詞共有 58 個，如表一。

表一：本研究採用之情緒類別與字詞

類別情緒字詞

憤怒憤怒、生氣、激憤、惱怒、氣沖沖、氣

惱、惱火、動怒、憤激、悻悻、憤憤然

害怕害怕、恐怖、恐懼、畏懼、生怕、惶恐、

驚恐、惶惶、戒懼、疑懼、驚訝、驚異

悲傷痛苦、難過、傷心、悲傷、痛心、悲哀、

難受、傷感、悲痛、悲苦、淒然、傷悲、

愴然、哀痛、悲愁愛與

喜悅

喜歡、快樂、高興、愉快、歡樂、喜悅、

歡喜、快活、慶幸、興高采烈、愉悅、

歡欣、欣喜、興沖沖、歡愉、歡天喜地、

喜出望外、心花怒放、樂不可支、狂喜、

滿面春風、樂呵呵

由於本研究在以網路結構表示關聯資訊的部分，區分為字詞階層與概念階層，

並且是以概念階層為關聯性之計算對象，

因此，除了文本資源之外，本研究也需要一般字詞及其第一層上位詞之語料概念資源，這一部分我們採用中研院「中文一詞泛讀」[1]中的語料資源。

(二) 實驗過程與方法

我們首先從語料庫中剔除不含任何 58 個情緒字詞之一的文句，剩下的文句共

0 低中高 1

0 1低中高

0 1

(7)

有 7853 句。這些文句再經過詞類的篩選，

成為由體詞、述詞、情緒詞等字詞組成的精簡文句，其中最短的長度為 2，即一個情緒詞與一個事物概念字詞的組合，如「傷心哭」，最長的長度為 21，整體平均長度為 4.13，代表平均一個精簡文句大致上包含一個情緒詞與三個事物概念字詞。

我們接著以這些精簡文句中情緒詞與事物概念字詞的共同出現關係，建構出情緒情境初階共現網路，此網路共有 26269 個事物概念字詞節點與 58 個情緒字詞節點互相連結。這個初階共現網路再被依照一般字詞的上位詞及情緒詞的類別提升至情緒情境概念共現網路，其中 1252 個一般事物概念字詞(如專有名詞)節點沒有上位詞的資訊，無法被提升至概念層而被歸類為未知詞並與予捨棄。最後的情緒情境概念共現網路共有 9192 個一般事物概念節點及 4 個情緒類別節點。

經由這些實作過程，我們基本上驗證了從大量文本中篩選出情緒與事物概念關聯資訊之可行性，這些關聯資訊以共現網路的方式表示，提供進一步探索與取用。

我們接下來針對共現網路中的關聯資訊經過四種關聯強度指標的區分之後，是否與一般人的情緒認知相符，進行觀察與驗證。我們首先必須決定情緒反應評估方式。

情緒研究在心理學領域的發展相當長久，評估情緒的方法通常有兩類，一類為客觀評估，是以一些生理訊號指標，如心跳、血壓、腦電波等，作為情緒辨識的依據；另一類為主觀評估，通常也稱為「主觀自我評估報告」，也就是由受測者本身告知其經過某種刺激所引起的情緒為何。

Selye 的研究[14]發現，許多情緒的生理反應是相似的，很難從生理訊號的細微差異來辨別目前的情緒，同時，受測者的生理訊號必須依靠一些昂貴的接觸式量測設備取得，部分受測者在知道有儀器觀察的情形下，也會產生心理層面的變化，而影響了觀測的準確性。

主觀評估的情緒測量方式通常都以問卷型態進行，然而情緒是一種相當主觀的

認知，受到個人過往歷史與經驗的影響，

因此，情緒主觀評估的準確性也受到質疑。不過一些研究[9][16]發現，主觀自我評估報告的方式仍然具有相當程度的準確性，甚至過個幾年對不同人在進行同樣的測試，其結果仍是相當類似，代表主觀評估的穩定性也相當充分。心理學領域的專家經過長時間的驗證比較之後，仍然信賴主觀評估的方式，因此，本研究採用主觀評估方式進行關聯強度指標的效能驗證。

情緒感知的主觀評估主要是以問卷調查方式進行，而問卷內容則是以問題與選項的方式，針對特定情緒與事物概念之關聯性，取得受測者的主觀認知回應。本實驗的主要目的是驗證經由關聯強度指標所反應之情緒與事物概念關聯性與受測者認知之符合程度，並比較分析四種指標之成效差異。在問卷內容設計方面，我們選擇害怕與高興兩種情緒，同時，將關聯性之等級區分為高、中、低三個等級，分別以一個問題針對特定情緒搭配一組某個關聯等級之事物概念選項，由受測者依其認知情形反應其主觀之選擇。因此，我們初步的問卷內容包含二個情緒、四個指標、三個等級共二十四種組合，亦即二十四個測試題目。每一個題目針對一個情緒，經由一個關聯指標，選定一個關聯等級的二十個事物概念為選項，供受測者依其主觀認知選擇哪些事物概念與該題之情緒有明顯關聯。

我們將初步規劃的問卷內容，由約十位研究生進行前測，其目的在於檢測問卷內容的設計是否有矛盾與錯誤之處，受測者在受測過程中，是否有任何疑惑與困難，並據以修正問卷內容。前測受測者做完問卷後的反應與建議及我們本身的評估所綜合的問題包括：(1)題目數量過多；(2) 選項重複率過高；(3)應避免爭議性感受之概念選項，如宗教信仰與政治。這些問題的存在的確可能影響實驗的準確性，例如：不同關聯指標可能選出同一個事物概念字詞，使得受測者在不同的問題中遭遇相同的選項，而被迫思考回憶是否在先前的題目中曾經出現並選擇過。另外，不同

(8)

的宗教信仰與政治立場也會對相同的事物概念產生非常不同的情緒感受。這些干擾性的因素都必須排除，以提高測試結果的可信度。

我們根據這些前測所發現的問題，修正了問卷內容。最後的問卷共包含六個測試題目，其中害怕與高興兩種情緒各三題，分別提供三個關聯強度(高、中、低) 等級的事物概念選項群組，每一個選項群組為經由四個關聯指標各自篩選出六個事物概念字詞的聯集。也就是說，我們將原來每個關聯指標各自篩選選定等級的事物概念字詞，以聯集的方式，合併為在同一題目的選項中，包含由不同指標所篩選出的相同等級的事物概念字詞。這樣的處理方式並不影響我們評估指標效能的目的，

因為我們仍然可以依照某一個選項是由哪些指標提出及該選項是否被測試者選擇等資訊，估算個別指標的關聯強度篩選成效。圖五為實際問卷中的其中一題，選項的代表字詞既為事物概念字詞(上位詞)，

括弧中的字詞為屬於該上位詞並在文本中出現的一般事物字詞。

圖五：部分問卷內容 (三) 結果呈現與分析討論

我們以大學校園內的人員為問卷實施對象，實際參與實驗的受測者為年齡介於 18 歲至 50 歲之間的大學生、研究生及行政人員，共 91 人，男女比率約為 2 比 1。

依照統計學的原理，受測人數 91 人乃屬於抽樣調查的大樣本，較能代表真正的母體現象。

我們使用假說檢定驗證關聯強度指標 的作用，虛無假說 H₀(null hypothesis)為：

依據關聯強度指標選出不同等級之事物概

念群組之間，在一般人的情緒感受認知上 沒有差異；而對立假說 H1(alternative hypothesis)為：依據關聯強度指標選出不同等級之事物概念群組之間，在一般人的情緒感受認知上有所差異。也就是說，我們將從問卷結果的統計上，觀測我們定義的關聯強度指標是否能正確的區辨事物概念與特定情緒的關連性，例如：高關聯度的事物概念是普遍的受測者認為在某個特定情緒下會發生的，或是受測者會因為這些事物概念而引發出特定的情緒；而低關聯度的事物概念是普遍的受測者認為在某個特定情緒下可以排除的，或是受測者不會因為這些事物概念而引發出特定的情緒。我們期望調查結果能在統計上拒絕虛 無假說 H0，而接受對立假說 H1，以證實我們提出的關聯強度指標能確實篩選出與指定情緒符合的事物概念。

我們首先呈現害怕情緒的事物概念關聯選擇統計結果，表二、表三、表四分別為與害怕情緒有高、中、低三個關聯等級之事物概念，在未告知受測者其關聯程度之等級差異的情形下，由受測者依據個人主觀經驗與認知所作之選擇結果。

表二：害怕情緒之高關聯概念測試

概念 ^勾選比 ^指標依據概念 ^勾選比 ^指標依據慌張 0.73 M, V, C 粗暴 0.45 C 危險 0.70 D,C 孤單 0.37 D

怯懦 0.65 C 仇人 0.30 M

動盪 0.60 D 彈藥 0.30 V

逃跑 0.59 M, V, C 革命 0.24 V

緊張 0.52 D 變化 0.14 V

被害人 0.49 M, V 助手 0.02 M

強盜 0.47 M 表示 0.01 D

擔心 0.45 D, C

表格中之勾選比皆為選擇該概念之人數與總受測人數之比率，而指標依據則為該概念是由哪一個關聯指標所篩選出的。

每一個指標皆選出六個指定關聯等級之事物概念，由於部份概念同時由兩個或三個指標選出，所以，三個等級的事物概念總數皆不到 24 個，而分別是 17 個、22 個、

20 個。如果我們以 30%的勾選比率為與一

(9)

般人認知的符合程度之門檻，我們發現表二的高關聯強度群組中，有 13/17( 約 76.5%)的比率是符合的。但同時，表三的中關聯強度與表四的低關聯強度的群組中也各有 2/24 (約 8.3%)與 2/22 (約 9.1%) 的比率被選出為與害怕情緒有關。

表三：害怕情緒之中關聯概念測試

表四：害怕情緒之低關聯概念測試

概念 ^勾選比 ^指標依據概念 ^勾選比 ^指標依據

槍 0.73 D 認為 0.03 C

異常 0.36 M 希望 0.02 M, V, C 勇敢 0.09 D 一生 0.02 M

車 0.07 V, C 房間 0.02 V 男人 0.06 M 和睦 0.02 C 時間 0.05 M 寶物 0.01 D 工廠 0.04 D 臉 0.00 D 發電站 0.04 D 母 0.00 M, C

話 0.04 V 方法 0.00 V

體制 0.03 V ^通信器材 0.00 C

另外，反向來看，若我們以 5%以下的勾選比為認定可排除與害怕相關的門檻，表二的高關聯強度與表三的中關聯強度的群組中，各有 2/17 (約 11.8%)與 14/24(約 58.3%)的比率是應該被排除的，

而表四的低關聯強度的群組中則有 17/22(約 77.3%)的比率可被選出為與害怕情緒無關。由以上的數據分析可以推知，

高關聯強度與低關聯強度在害怕情緒方面，大約有七成至八成左右的可信度，可以用來挑選或排除害怕情緒的因素，但也各有約一成左右的失敗率。另外，中關聯

強度的意義不大，也無明顯的區辨作用。

表五：四個指標之害怕情緒平均勾選比

關聯等級

距離強度 (D)

相互訊息 (M)

概念變異 (V)

綜合指標 (C)

高 0.442 0.433 0.415 0.595

中 0.183 0.042 0.033 0.080

低 0.152 0.085 0.030 0.023

我們接著觀察四個指標對害怕情緒個別的關連程度區辨效能，表五為在不同關聯強度的群組中，個別指標選出的害怕情緒事物概念的平均被勾選比。同樣的，若以 30%的勾選比率為與一般人認知的符合程度之門檻，在高關聯等級的群組中，四個指標皆能達到目的，但綜合指標的成效明顯領先；而以 5%以下的勾選比為認定可排除的門檻，只有概念變異與綜合指標能得到效果。整體而言，綜合指標對害怕情緒所提供的區辨效能較佳。

表六：害怕情緒測試結果之 ANOVA 分析

Sum of

squares df Mean of

squares F Sig.

D BG WG Total

166.24 248.62 414.86

2 270 272

83.12

0.92 90.271 0.000 M BG

WG Total

305.06 289.65 594.71

2 270 272

152.53

1.07 142.184 0.000 V BG

WG Total

323.10 286.77 609.87

2 270 272

161.55

1.06 152.103 0.000 C BG

WG Total

648.67 293.89 942.56

2 270 272

324.44

1.09 297.969 0.000

最後，我們進一步的以變異數分析 (Analysis of Variance - ANOVA)來檢測四個指標是否在受測者於不同群組之間的反應差異具有顯著性，也就是說，我們將檢測調查結果的數據，在彼此的差異上，是否具備統計上的顯著性，以決定是否拒絕虛無假說，而接受對立假說。表六為針對害怕情緒事物概念被勾選次數的 ANOVA 分析結果，其中 Between Groups(BG)為組間變異，Within Groups(WG)為組內變異。

以距離強度指標來看， F(2, 270) = 90.271, p < 0.01，代表在 99%的信心水

概念勾選比指標依據概念勾選比指標依據闖禍 0.96 D 看 0.02 V

沖 0.39 C 使用 0.02 V

內 0.10 V 學生 0.02 D

相遇 0.10 M 生活 0.01 D 發生 0.10 M 中 0.01 M, V, C 領導 0.08 D 城市 0.01 V 對象 0.04 V 製造 0.01 C 事情 0.03 D 根據 0.01 C 想法 0.03 M 時期 0.01 M 生物 0.03 C 了解 0.00 D 內容 0.03 C 富翁 0.00 M

(10)

準之下，數據上的差異是具有統計上的意義的，也就是說，觀測到的差異的確可以 代表實際現象的差異。其他三個指標的 F 值更高，代表其觀測到的群組之間差異更顯著，也更強烈的証實其差異區辨效果。

因此，我們可以拒絕虛無假說，而接受對立假說，驗證了四個指標的確能提供關聯程度的區辨功能，而其中的綜合指標成效最好，與之前的觀察分析結果吻合。

表七: 高興情緒之高關聯概念測試

表八: 高興情緒之中關聯概念測試

我們接著呈現高興情緒的事物概念關聯選擇統計結果，表七、表八、表九分別為與高興情緒有高、中、低三個關聯等級之事物概念由受測者選擇的結果。若仍然以 30%的勾選比率為與一般人認知的符合程度之門檻，我們發現表七的高關聯強度群組中，只有 12/21(約 57.1%)的比率是符

合的。同時，表八的中關聯強度與表九的低關聯強度的群組中也各有 9/23( 約 39.1%)與 2/19 (約 10.5%)的比率被選出為與高興情緒有關。另外，若仍然以 5%以下的勾選比為認定可排除與害怕相關的門檻，表七的高關聯強度與表八的中關聯強度的群組中，各有 2/21(約 9.5%)與 6/23 (約 26.1%)的比率是應該被排除的，而表九的低關聯強度的群組中則有 12/19(約 63.2%)的比率可被選出為與高興情緒無關。

表九: 高興情緒之低關聯概念測試

由以上的數據分析可以推知，高關聯強度與低關聯強度在高興情緒方面，大約有六成上下的可信度，可以用來挑選或排除高興情緒的因素，但也各有約一成左右的失敗率。另外，中關聯強度的意義不大，

也無明顯的區辨作用。

表十：四個指標之高興情緒平均勾選比

關聯等級

距離強度 (D)

相互訊息 (M)

概念變異 (V)

綜合指標 (C)

高 0.377 0.488 0.237 0.285

中 0.105 0.098 0.310 0.375

低 0.080 0.030 0.090 0.043

我們接著觀察四個指標對高興情緒個別的關連程度區辨效能，表十為在不同關聯強度的群組中，個別指標選出的高興情緒事物概念的平均被勾選比。同樣的，若以 30%的勾選比率為與一般人認知的符合程度之門檻，在高關聯等級的群組中，只有二個指標能達到目的，其中相互訊息的

概念勾選比指標依據概念勾選比指標依據福氣 0.89 M 閱讀 0.34 D, C 和睦 0.75 D 遊戲 0.26 M 逍遙 0.71 M 合併 0.23 V, C 健康 0.58 M 空前 0.22 D 女人 0.49 V 球 0.17 V, C 情致 0.49 C 來源 0.15 D 和緩 0.45 M 事情 0.13 V 演奏 0.41 D 居住 0.13 C 值得 0.39 D 講話 0.05 V 商店 0.35 V 豐富 0.04 M

打球 0.35 C

概念勾選比指標依據概念勾選比指標依據行樂 0.69 C 比賽 0.12 M 充滿 0.63 V 父 0.11 D 眷屬 0.48 V 描寫 0.08 D 歌 0.39 C 鏡頭 0.07 V 團聚 0.37 C 意味 0.06 M, V 幻想 0.35 C 過程 0.05 D 感覺 0.34 V 尋找 0.04 D 顏色 0.33 M 教師 0.04 D 返回 0.31 D 訓練 0.04 M 波浪 0.28 V 意思 0.02 M 活 0.24 C 作戰 0.02 M

灘 0.21 C

概念勾選比指標依據概念勾選比指標依據景象 0.39 V 頁張 0.03 D 五穀 0.31 D 災禍 0.03 M, V 主持 0.12 D 動盪 0.02 M, C 謹慎 0.08 C 擔心 0.02 M 醫治 0.06 M 危險 0.02 M, C

決意 0.06 V 暗 0.01 D

革命 0.06 C 文件 0.01 D 避免 0.05 C 庸人 0.00 D 煩悶 0.03 M,V 江河 0.00 V 憂愁 0.03 V, C

(11)

成效較好；而以 5%以下的勾選比為認定可排除的門檻，只有相互訊息與綜合指標能得到效果。整體而言，相互指標對高興情緒所提供的區辨效能較佳。

表十一：高興情緒測試結果 ANOVA 分析

Sum of

squares df Mean of

squares F Sig.

D BG WG Total

178.38 353.60 531.98

2 270 272

89.19

1.31 68.103 0.000 M BG

WG Total

755.36 349.50 1104.86

2 270 272

377.68

1.29 291.776 0.000 V BG

WG Total

83.23 362.31 445.54

2 270 272

41.62

1.34 31.013 0.000 C BG

WG Total

184.62 426.00 610.62

2 270 272

92.31

1.58 58.505 0.000

表十一為針對高興情緒事物概念被勾選次數的 ANOVA 分析結果，其中 Between Groups(BG) 為組間變異， Within Groups (WG)為組內變異。四個指標的 p 值皆小於 0.01，代表在 99%的信心水準之下，數據上的差異是具有統計上的意義的，也就是說，觀測到的差異的確可以代表實際現象 的差異。其中，相互訊息的 F 值最高，代 表其觀測到的群組之間差異最顯著，支持其較佳的差異區辨效果，與之前的觀察分析結果吻合。

綜合以上的實驗結果，對於害怕情緒的事物概念關聯程度辨別能力，四個指標大約有七成至八成左右的可信度，但也約一成左右的失敗率，其中表現最好的是綜合指標，其次為相互訊息。在高興情緒方面，四個指標約有六成上下的可信度及約一成左右的失敗率，其中表現最好的是相互訊息，其次是距離強度。四個指標在害怕與高興兩種情緒上的事物概念關聯程度區辨能力有所差異，可能是由於兩類情緒詞的數量之不同所造成。本次實驗中所採用的害怕類情緒詞共有 12 個，而高興類情緒詞則有 22 個(見表一)，因此，與高興情緒關聯之事物概念可能產生較為發散的現象，而影響了指標的表現，並使其可信度降低。綜合兩類情緒的實驗結果，四個關聯強度指標當中，以相互訊息的表現較穩定，而概念變異的效果較差。

整體而言，我們認為這個實驗結果大致上驗證了本研究目的與方法的可行性。

我們從情緒情境概念共現網路所取出的不同關聯等級的概念群組中，以受測者主觀判斷的方式認定其合理性的存在，證明了從文本中取得情境資訊的可能性。

五、結論與未來研究

本研究以情緒為情境資訊之焦點，嘗試從大量文本中建立人的情緒與事物概念之關聯性，並以問卷調查驗證其關聯是否符合一般之情緒感受認知。我們以情緒詞與特定詞性之字詞為節點，將文本轉換為網路結構，同時，提出四個節點關聯指標，

以評估特定情緒節點與相關事物概念節點之關聯強弱。實驗結果顯示，本研究方法能有效的從文本中取得影響人的情緒之事物概念之相關資訊。

本研究以文本中情緒詞與事物概念詞之共現關係為基礎而建構其關聯性，尚未考慮彼此真實的語意關係，例如，可能的否定關係或更深入的從屬關係。因此，本研究得未來延伸將朝向語意關係的辨識，

以強化情境資訊之準確性。本研究之意義為開創以語言文本與情境資訊來源之初步探討，相關議題的研究發展，也將為情境資訊的有效建立與應用帶來後續的進展。

誌謝

本研究獲得國科會計畫 NSC96-2422-H- 004-001 及 NSC95-2627-E-004-002 之部分資助，特此誌謝。

六、參考文獻

[1] “中文一詞泛讀”，

http://elearning.ling.sinica.edu.tw/, accessed date: May 15, 2007.

[2] 林宇中，“基於語意內容分析之情緒分

類系統”，國立成功大學資訊工程研究所，碩士論文，2003。

(12)

[3] 高臺茜、倪珮晶，“華語文網路言論負

向情緒用詞檢核軟體研發”，第三屆全球華文網路教育研討會(ICICE2003) 論文集，第 393-402 頁，2003。

[4] N. Bradley and M. Dunlop, “Toward a multidisciplinary model of context to support context-aware computing”, Human Computer Interaction, Volume 20, pp. 403–446, 2005.

[5] G. Chen and D. Kotz, “A survey of context-aware mobile computing research”, Technical Report TR2000- 381, Dept. of Computer Science, Dartmouth College, U. S. A., 2000.

[6] H. Chen, T. Finin, A. Joshi, “An ontology for context-aware pervasive computing environments”, Knowledge Engineering Review, Vol. 18:3, pp.

197-207, 2004.

[7] K. Church and P. Hanks, “Word association norms, mutual information, and lexicography”, Computational Linguistics, Vol.16, No. 1, pp. 22-29, 1990.

[8] A. Dey, G. Abowd, and A. Wood,

“CyberDesk: a framework for providing self-integrating context-aware services”, Knowledge-Based Systems, 11, 3–13.

1999.

[9] C. Izard, D. Libero, P. Putnam, and O.

Haynes, “Stability of emotion

experiences and their relations to trait of personality”, Journal of Personality and Social Psychology, Vol. 64, pp.847-860, 1993.

[10] H. Liu, H. Lieberman, and T. Selker, “A

model of textual affect sensing using real-world knowledge”, Proceedings of the 8th International Conference on Intelligent User Interfaces, pp.125-132, New York: ACM Press.

[11] C. Ma, H. Prendinger, and M. Ishizuka,

“Emotion estimation and reasoning based on affective textual interaction”, Proceedings of the 1st International Conference on Affective Computing and Intelligent Interaction, Springer LNCS 3784, pp 622-628, 2005.

[12] T. Moran and P. Dourish, (Eds.)

“Introduction to context-aware computing”, Human Computer Interaction, Vo. 16, pp. 87–95, 2001.

[13] A. Schmidt, “Implicit human computer interaction through context”, Personal and Ubiquitous Computing, Vol. 4, No.

2-3, pp. 191-199, 2000.

[14] H. Seyle, “Stress without distress”, New York: Signet, 1974.

[15] P. Singh, “The public acquisition of commonsense knowledge”, Proceedings of AAAI Spring Symposium, pp.47-52, 2002.

[16] D. Watson and L. Walker, “The long-term stability and predictive validity of trait measures of affect”, Journal of Personality and Social

Psychology, Vol. 70, pp.567-577, 1996.

[17] H. Witten and E. Frank, “Data Mining:

practical machine learning tools and techniques”, 2nd edition, Morgan Kaufmann, San Francisco, 2005.