• 沒有找到結果。

憂鬱傾向之資料考掘探索

第二章 文獻探討

第四節 憂鬱傾向之資料考掘探索

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

31

圖 2-1:自殺防禦早期辨識機制概念圖

社群媒體作為自殺預防的早期辨識工具,即用戶透過微博書寫自療的方式以 舒緩憂鬱情緒,若書寫自療有效,憂鬱情緒好轉;若書寫自療無效,持續憂鬱的 用戶可能選擇繼續書寫或是尋求其他治療方式。對於持續憂鬱超過兩週的用戶,

該辨識機制將啟動,從情緒到行為的發展過程中,同質用戶所留下的文本可運用 來追溯用戶當時的情緒狀況,從而進行憂鬱傾向之辨識並推播治療訊息,在用戶 企圖執行自殺行為前提供治療指引和幫助,儘早預防自殺行為的發生,而這中間 機制的建立則須要破譯用戶的「情緒密碼」。本文將聚焦在憂鬱情緒的文本中,

探尋憂鬱人群在網絡中的針對不同主題書寫的情緒程度。

第四節 憂鬱傾向之資料考掘探索

一、資料考掘的分類

透過對已有相關文獻的檢視,憂鬱症的網路資料考掘可分為兩類:一類是介 入式研究,即受眾直接透過固定網站、網址或電郵填寫個人資訊,受眾主動且有 意識地提供資料供研究者收集。一類為非介入式研究,即受眾將其個人資訊曝露 在網絡中,研究者對資料進行收集,受眾處於被動且無意識狀態。兩種資料考掘 方式的主要差異,在於受眾是在主動還是被動的狀態下產生資料的,由於侷限在

僅起傳輸作用,同時也讓調查者較為容易地找到調查對象。Houston et al.(2001)

在美國透過設計網站的憂鬱症自測(CES-D8)對受眾進行線上憂鬱篩檢,並對

9又名 Beck 憂鬱自測量表(Beck depression rating scale),由美國著名心理學家 Beck AT 編制於 20 世紀 60 年代,後被廣泛運用於臨床流行病學調查。

10SDS(Self-Rating Depression Scale)是由美國杜克大學醫學院的 William W. K. Zung 於 1965 年編 編製,是目前應用最為廣泛的憂鬱自測量表之一,用於衡量憂鬱狀態的輕重程度及其在治療中的 變化。

11BDC(Burns Depression Checklist)由美國新一代心理治療專家、賓夕法尼亞大學的 David D.

Burns 博士設計,該憂鬱症的自我診斷表可幫助快速診斷出是否存在著憂鬱症。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

33

調查與傳統社會調查最大不同之處是基於互聯網路這一載體。網絡上獲取數據從 人口統計學來說固然存在一定程度的數位鴻溝,但線下憂鬱篩檢在中國尚未普 及,未必比線上篩檢接觸的受眾廣泛,線上的憂鬱自測量表可接觸更多有憂鬱傾 向受眾之數據,提升他們對憂鬱知識的普及。網站上大多都是被廣泛使用的憂鬱 自測量表,也有報導質疑心理健康自測的科學性:一方面,網路自測沒有設定年 齡範圍及測試環境,非專業的結論可能對自測者進行心理誤導。另一方面,憂鬱 自測量表多是根據國外量表翻譯而來,翻譯的質量參差不齊,量表本身未經修訂 可能已過時,國外的過去測試不一定符合中國當代社會的實際,儘管強調了本土 化的修改,但心理測量量表與全球通用標尺不同,也可能會導致量表準確性低(李 玉衡,2008)。

2. 非介入式研究

區別于問卷調查法與深度訪談法的介入式研究,E.Babbie(1995)將內容分 析法與其他對既存統計資料的分析和歷史比較法同列為「非幹擾性的研究

(Unobtrusive Research) 」。內容分析法是研究者檢視某一類社會成品(social artifacts),主要是對各種不同的溝通形式,如書籍、雜誌、詩集、報紙、歌曲、

畫作、演講、信函、法條等加以分析。Barelson(1952)則認為「內容分析是針 對傳播的明顯內容,做客觀、系統、定量的描述」。所謂「不同的溝通形式」及

「傳播的明顯內容」隨著 Web 1.0 至 Web 3.0 的變遷,內容分析之對象即網路資 料考掘也隨之發展,不再限於書籍、報紙等資料。從 Web 1.0 的獲取資訊僅能獲 得單面發佈的資訊,如雅虎門戶新聞,線上新聞資料庫等。吳孟津、徐美苓(2011)

透過對《中國時報》及《蘋果日報》之憂鬱症新聞進行內容分析,探討憂鬱症背 後的生物醫學真實、社會文化真實與新聞再現。直到 Web 2.0 的雙向互動開始可 以獲取資訊本身及反饋狀況,如論壇上的帖子及留言、部落客的書寫,陳憶寧

(2011)透過對癌症部落客書寫的研究,認為部落客的書寫不僅對醫者深入瞭解 疾病,亦或是患者本身自我療癒疾病之痛苦都有幫助,在將個人情緒公共化的過 程中,進一步得到了社會支持。直到 Web 3.0 的開放技術、定位資訊、雲計算與 智能語義的推進,才進一步有了在社群網站上偵測憂鬱傾向受眾之可能性。Johan, B.、Huina, M.與 Xiao-Jun, Z.(2010)透過對 Twitter 文本進行正負面及六個面向 的情緒分析,可以高準確度預測股票市場的漲跌。Jeremy(2009)透過監測世界

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

34

各地使用 Google 在線搜尋引擎的搜索痕跡,作為定位及跟蹤季節性流感的方 法,由於某些搜索痕跡與就診高度相關,可以精確估計美國任一區域流感活動的 當前級別,報告的產出僅滯後一天,而原有預測方法須滯後一兩週,以網路搜尋 引擎痕跡預測更能提前預警,協助有效控制疫情。中國最大的電子商務平臺阿裡 巴巴則是透過分析實時交易數據記錄,結合追蹤系統及辨識技術聯手公安搗入製 假窩點,相較傳統打假途徑的追蹤困難、消費者反饋慢、難以實施監控、取證困 難等缺點,網路數據實時、海量的特點為更有價值的內容分析提供了肥沃的土 壤。Viktor Mayer-Schönberger(2012)在《大數據時代》毫不避諱地說大數據時 代開啟了一場尋寶遊戲,而人們對數據的看法以及對於由因果關係向相關關係轉 化時釋放出的潛在價值態度,正是主宰這場遊戲的關鍵。新興技術工具的使用使 這一切稱為可能。寶貝不止一件,每個數據集內部都隱藏著某些未被發掘的價 值,這場發覺和利用數據價值的競賽正開始在全球上演。

二、憂鬱與社群媒體之資料考掘

社交媒體持續發展為人類表達自我的主要平臺,允許個體以至全球範圍分享 其想法、意見及其他感興趣的事件。發佈的內容不僅是自然的且客觀存在的,一 定程度體現個人情感(如孤獨,憂鬱)以至全球範圍的公共情緒及價值標尺(如 關於政治候選人的想法、新產品發佈及對全球經濟的思考)(Bollen et al., 2011;

Thelwall et al., 2011)。而情緒影響人的行為、應對和社會關係。瞭解在社交媒體 上的情緒,有助於破譯集體行為密碼。隨著移動設備的滲透,使這一願望成為可 能,透過發佈狀態訴說一天的生活,或是報告身邊的小趣事已經成為個人日常生 活的一部分。社群媒體已成為豐富情感表達的一個場所,亦帶著研究者走入成千 上萬個體的行為世界。當一個人使用社交媒體時,意味著他同時也選擇部分公開 私人訊息,包括:內容訊息(文字與圖片)、社交圈訊息(關注者及粉絲)、地理 訊息和行為訊息等。社群媒體的出現讓透過網路收集受眾被動提供的資料,以內 容分析法獲得有價值的資訊成為多個研究團隊的努力方向,且已在辨別憂鬱情緒 上獲得進展,憂鬱傾向資料考掘的文獻主要基於文本分析與社交圈分析。文本分 析及社交圈分析多數時候同時滲透在研究方法中,以獲得更精準的研究結果。文 本分析主要是針對社群媒體之文本語言進行分析,著重於詞彙內涵的分析,具體 包括詞頻分析,積極與消極情緒分析,情緒分析等。而社交圈分析則是更關注易

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

35

感人群與社交圈特質,主要研究受眾的關注者及粉絲之間點(Node)與邊(Edge)

的關係、關注著與粉絲的比率等。

在這些前沿的研究當中,Minsu, P. et al.(2012)先以前測透過對一定時間內 Twitter 上含關鍵字「憂鬱(depression) 」的 21103 則文本數據中隨機抽取 1000 則進行編碼後,其分析結果發現:42.4%的文本在討論「述說自己憂鬱的心情」,

34.1%的文本則在「傳遞憂鬱資訊」,10.73%的文本著重於「分享關於憂鬱的想 法」。隨後,研究者透過 CES-D 自測結果,將受測者分為正常組及憂鬱組,並對 兩組受測者的 Twitter 內容進行分析,分析結果顯示正常組與憂鬱組在正面情 緒、正面感覺及樂觀的維度中沒有表現出明顯差異,但在負面情緒及憤怒的維度 中,表現出明顯差異,即憂鬱組較正常組更多地表達負面情緒,但在焦慮及悲傷 的維度上沒有體現。由於受測者人數限制,研究結果尚待進一步深化,但該研究 肯定了人們會在 Twitter 上披露私密及詳細的個人資訊,如什麼讓他們憂鬱,什 麼會讓他們感到憂鬱,部分人甚至會在文本中透露醫療診斷、用藥訊息及自我療 癒的方式等。憂鬱傾向者獨白式的文本中,某些類別的詞彙以高頻率出現,如憤 怒、因果、試探、交流及朋友。但他們的研究仍停留在情緒的表層,只注重情緒 積極和消極的影響,錯過了更為細緻的情緒表達。如憤怒和悲傷都是負面的,但 他們表達兩個非常不同的情緒狀態,憂鬱比起難過存在更高的喚醒成分(higher in arousal)。為瞭解決這一難題,情緒可定義為一個組合,以價(valence)和活性

(activation)來共同呈現,這種方式在心理學中被廣泛推崇(Russell, 1980;

Tellengen, 1985),其中以 circumple 模型的應用最具有代表性。Munmun, D. C.、

Scott, C.與 Michael, G.(2012)透過 circumple 模型對社群媒體上的內容進行情緒 分析,雖然仍是內容分析,但其中的元素加入了情緒分區的成分。在情緒分析的 基礎上獲得了創新的發現:總體而言,低價低活性的情緒詞彙在社交媒體中被廣 泛使用,如難過、無聊、懊惱、懶惰等,還有一小部分高價高活性的詞彙,如開 心,樂觀等。即,低價情緒的使用頻率超過高價情緒。以此研究者推測,社群媒

Scott, C.與 Michael, G.(2012)透過 circumple 模型對社群媒體上的內容進行情緒 分析,雖然仍是內容分析,但其中的元素加入了情緒分區的成分。在情緒分析的 基礎上獲得了創新的發現:總體而言,低價低活性的情緒詞彙在社交媒體中被廣 泛使用,如難過、無聊、懊惱、懶惰等,還有一小部分高價高活性的詞彙,如開 心,樂觀等。即,低價情緒的使用頻率超過高價情緒。以此研究者推測,社群媒