應用壓力事件導向模型預測網路使用者的憂鬱傾向
129
0
0
全文
(2) . I .
(3) . II .
(4) . 摘要. 應用壓力事件導向模型預測網路使用者的憂鬱傾向 洪勝家* 盧文祥** 中華民國國立成功大學醫學資訊研究所 隨著網路科技的演變,越來越多人在網路上發表個人生活記事的言論, 本論文的重點在於透過分析網路使用者所撰寫文章的壓力事件、負面情緒、 症狀與負面行為特徵來預測憂鬱傾向。研究中所提出的壓力事件導向模型 (Stressful Life Event-Driven Model)即是用以判斷網路使用者是否有憂鬱傾 向。分析台大知名 BBS 站(PTT)的憂鬱症版(Prozac)的使用者文章,用以觀 察與訓練,並利用中央研究院 CKIP 斷詞系統做文章斷詞處理。利用各特 徵值計算一段時間區間內文章的憂鬱傾向分數值,對照心理學專家的標記 結果當成判斷的依據,便可協助預測網路使用者的憂鬱傾向。針對壓力事 件的擷取,我們主要是參照臨床在壓力事件評估所用到的兩個量表,包括 社會再調適量表(Social Readjustment Rating Scale)及日常瑣事量表(Hassles Scale)。然後整理成問卷進行調查,以此判斷各壓力事件對於網路使用者 的影響程度,並利用 HowNet 知識庫來擴展相關的壓力事件詞,由實驗結 果可以發現擴展的詞彙對於整體的效能有顯著的幫助。而與其他評估準則 的預測效能相比,本研究的整體憂鬱傾向預測效能也要來得好。. 關鍵字:憂鬱傾向、壓力事件、負面情緒、症狀、負面行為 *作者 **指導教授 III .
(5) . Abstract Using Stressful Life Event-Driven Model To Predict Web User’s Depression Tendency Sheng-Jia Hong* Wen-Hsiang Lu** Institute of Medical Informatics National Cheng Kung University, Tainan, Taiwan, ROC With the evolution of Internet technology, more and more people begin to post their story or daily on the blog, micro blog or Twitter. The purpose of this paper is to predict web authors’ depression tendency by analyze stressful life event, negative emotion, symptom and negative behavior in their posts. In this work, Stressful Life Event-Driven Model is introduced to determine web authors whether they have depression tendency. We collected and analyzed web articles from the Prozac Board of a well-known BBS site (PTT) constructed by Taiwan University. The articles were segmented and labeled by using Chinese Word Segmentation System with Unknown Word Extraction that developed by ACADEMIA SINICA. We combine Social Readjustment Rating Scale, Hassles scale and HowNet knowledge base to extract stressful life event lexicon. The depression tendency score was calculated. Thus we could predict web authors’ depression tendency. The final result shows the precision, recall, and F-measure is about 61% and the performance of proposed model is better than other baseline model.. IV .
(6) . Keywords: Depression tendency, Stressful Life Event, Negative Emotion, Symptom, Negative Behavior.. *The Author **The Advisor. V .
(7) . 誌謝. 碩士生涯很快的就要接近尾聲了,在這一段期間,讓我學習到不少新 的知識並有許多的人生體悟。隨著求學生活的結束,這也代表自己將邁向 一個新的階段。 在這一路上,非常感謝許多人的幫助。首先我要先感謝盧老師的教導, 讓我學習到專業的知識,用不同的想法與觀點來解決事情。而家銘學長在 撰寫論文的過程中,給予許多的見解,讓我能夠突破瓶頸。賢輝學長在開 會時,時常提出精闢的見解,十分令人敬佩。廷軒學長身為實驗室的大總 管,在各種突發事件發生時皆能夠進行協助,並且能夠觸發大家有更多新 的想法。再來則是要感謝小柏、閔閔學長與卡茲學姊在碩一時傳授許多實 驗室所要必備專業技能,生活同樣充滿了許多樂趣。而實驗室的同儕們更 是重要的夥伴,堯堯時常會介紹許多美食,讓大家生活更加方便;昭儀則 是時常提供大家專業的建議,使專業能力能有所精進;小龜在聊天時,經 常能夠提出有趣的話題,讓每個人感到相當歡樂。另外,也要感謝各位學 弟,在這段期間幫助我們處理實驗室裡的各項雜務,讓我們能夠心無旁鶩 的專心做研究。 最後,則是要感謝我的家人,讓我在經濟上能夠沒有後顧之憂,並持 續地給我精神上的支持與鼓勵,真的是非常感謝你們。. 勝家 八月于台南. VI .
(8) . 目錄 摘要 ................................................................................................................... III ABSTRACT ...................................................................................................... IV 誌謝 ................................................................................................................... VI 目錄 .................................................................................................................. VII 表目錄 ............................................................................................................... IX 圖目錄 ................................................................................................................ X 第一章 序論 ....................................................................................................... 1 1.1 研究背景 ................................................................................................... 1 1.2 研究動機與問題....................................................................................... 3 1.3 研究目標 ................................................................................................... 4 1.4 研究方法 ................................................................................................... 5 1.5 論文架構 ................................................................................................... 6 第二章 文獻探討............................................................................................... 7 2.1 憂鬱症 ....................................................................................................... 7 2.1.1 症狀 .................................................................................................... 7 2.1.2 診斷 .................................................................................................... 9 2.2 壓力 ........................................................................................................... 9 2.2.1 引起壓力的因素................................................................................ 9 2.2.2 評估 .................................................................................................. 10 2.3 壓力與憂鬱症......................................................................................... 11 2.4 相似目標研究......................................................................................... 11 第三章 研究方法............................................................................................. 13 3.1 系統架構 ................................................................................................. 13 3.2 相關辭典 ................................................................................................. 15 3.2.1 壓力事件辭典.................................................................................. 15 3.2.2 負面行為辭典.................................................................................. 18 3.2.3 負面情緒辭典.................................................................................. 19 3.2.4 症狀辭典.......................................................................................... 20 3.3 壓力事件導向模型................................................................................. 21 VII .
(9) . 3.4 特徵函數 ................................................................................................. 25 3.4.1 壓力事件壓力分數特徵函數.......................................................... 25 3.4.2 負面情緒重要性特徵函數.............................................................. 26 3.4.3 壓力事件-症狀距離特徵函數 ........................................................ 27 3.4.4 壓力事件-負面行為特徵函數 ........................................................ 27 第四章 實驗與分析......................................................................................... 29 4.1 實驗資料與評估方法............................................................................. 29 4.1.1 網路使用者文章資料集.................................................................. 29 4.1.2 網路使用者壓力事件問卷資料集 ................................................. 29 4.1.3 評估方法.......................................................................................... 34 4.2 實驗評估 ................................................................................................. 35 4.2.1 憂鬱因素辭典................................................................................. 35 4.2.2 特徵函數權重估計.......................................................................... 35 4.2.3 壓力事件詞與負面情緒,症狀,負面行為相互距離門檻值參數 ... 36 4.2.4 驗證壓力事件詞彙擴展的有效性 ................................................. 37 4.2.5 評估壓力事件導向模型 (Stressful Life Event-Driven Model) ..... 38 4.3 實驗結果分析......................................................................................... 39 4.3.1 專家標記成有憂鬱傾向.................................................................. 39 4.3.2 專家標記成無憂鬱傾向.................................................................. 54 4.3.3 實驗結果分析討論.......................................................................... 62 第五章 結論與未來工作................................................................................. 64 5.1 結論 ......................................................................................................... 64 5.2 未來研究方向......................................................................................... 64 參考文獻 ........................................................................................................... 65 附件 A ............................................................................................................... 68 附錄 B ............................................................................................................. 104. VIII .
(10) . 表目錄 表 1.1 預防醫學層級定義 ................................................................................. 2 表 1.2 PTT BBS 站 PROZAC 板文章中出現 DEPRESSION FACTOR ................... 4 表 3.1 階層式壓力事件分類表 ....................................................................... 16 表 3.2 負面行為詞彙例子 ............................................................................... 18 表 3.3 三種情緒強度的負面情緒詞彙例子 ................................................... 19 表 3.4 症狀辭典例子 ....................................................................................... 20 表 4.1 壓力事件問卷分析 ............................................................................... 30 表 4.2 壓力事件列表 ....................................................................................... 31 表 4.3 憂鬱因素辭典數量 ............................................................................... 35 表 4.4 特徵函數權重 ....................................................................................... 36 表 4.5 特徵詞彙相互距離門檻值 ................................................................... 37 表 4.6 壓力事件詞彙擴展的有效性................................................................ 38 模型評估 ..................................................................................... 39 表 4.7 表 4.8 專家標記成有憂鬱傾向的正向例子 ................................................... 40 表 4.9 專家標記成有憂鬱傾向的錯誤例子 ................................................... 48 表 4.10 專家標記成無憂鬱傾向的正向例子 ................................................. 54 表 4.11 專家標記成無憂鬱傾向的錯誤例子.................................................. 58 . IX .
(11) . 圖目錄. 圖 3.1 系統架構圖 ........................................................................................... 14 圖 3.2 網路使用者的文章含有憂鬱因素 ....................................................... 21. X .
(12) . 第一章 序論. 1.1 研究背景. 隨著社會文明的迅速演變,環境中充斥著許多的干擾,對現代人的生 活機能產生了不良的影響。通常面對眾多生活事件的變化時,便會引發壓 力,進而使得罹患疾病的風險增加。 近年來,國民的健康意識逐漸崛起,個人的身心健康議題亦備受關注。 在預防醫學學門中,針對疾病的預防訂定了三個層級,如表 1.1 所示,包 括了初級預防(primary prevention)、二級預防(secondary prevention)及三級 預防(tertiary prevention),其中初級預防主要是針對普遍大眾進行疾病衛生 的宣導,第二級預防則是針對高風險的對象進行建議以避免後續引發疾病, 而通常到了第三級的預防,針對的對象便是已經確切罹患疾病的患者,在 整體醫療成本相對便會提高。因此,若不能提早針對廣大的社會大眾進行 完善的疾病預防宣導及實行改善措施,勢必會造成不必要的醫療資源浪費。 根據美國心理學會(American Psychological Association)研究[3]顯示,人們 在處於壓力的環境下,會直接對於個人的生理及心理健康造成不良的影響, 如會有易怒、緊張、憂鬱等現象發生,成為罹患憂鬱症的高危險群。所以 如何有效的幫助使用者了解本身的壓力狀態,進而達成預防罹患憂鬱症的 功效,便是一個重要的議題。 目前在憂鬱症的預防上,通常只能做到第三級的預防,也就是通常是 到了就診階段時,才得知是罹患了憂鬱症,接著才採取治療措施。而在臨 1 .
(13) . 床上,病患的相關生活資訊通常相當匱乏,所以在憂鬱症的預防也有著一 定的困難度。另外,Asia Barometer 機構[28]2009 年對東亞七個國家的生 活素質做了調查,報告中指出台灣人的快樂指數是敬陪末座,由此可見台 灣人潛在的憂鬱傾向人口與 2002 年由衛生署調查報告中估計台灣罹患憂 鬱的人口將近百萬(4.3%)相比,仍然有不斷成長的趨勢,世界衛生組織 (WHO)估計到 2020 年憂鬱症將成為全球「疾病負擔」的第二位,僅次於 心臟血管疾病,根據流行病學調查顯示,全世界約有百分之三的人口罹患 各類憂鬱症,憂鬱症的終身盛行率高達 15%,每六個人中就有一人會有罹 患憂鬱症的可能(柯慧貞、陸汝斌 2002),這些現象不只顯示憂鬱症在台灣 社會已經是不容忽視的醫療衛生議題,更是全世界人民正在持續關注的健 康焦點。 表 1.1 預防醫學層級定義 Level. Definition. primary prevention. Methods to avoid occurrence of disease. Most population-based health promotion efforts are of this type.. secondary prevention. Methods to diagnose and treat existent disease in early stages before it causes significant morbidity.. tertiary prevention. Methods to reduce negative impact of existent disease by restoring function and reducing disease-related complications.. 2 .
(14) . 1.2 研究動機與問題. 由於科技的成長進步,驅使著現代人嘗試運用不同於以往的網路技術, 如無名小站、痞客邦 PIXNET 等知名部落格網站,並結合各種行動通訊裝 置及軟體,撰寫不同於傳統紙本日記的線上生活記錄。在這些生活紀錄中, 通常有著許多代表性的壓力事件,並引發不同的負面情緒、症狀及負面行 為表現。當壓力事件的影響力到達一定的程度後,便會讓使用者罹患憂鬱 症的風險提高,因此我們希望透過資訊的技術來擷取使用者的生活紀錄, 以得知使用者的壓力來源,並依此來預測網路使用者的憂鬱傾向。 藉由觀察網路使用者所撰寫的文章中的內容,便可以發現造成壓力的 來源。我們在實際觀察網路使用者所撰寫的文章後,發現在文章中會具有 壓力事件(Stressful Life Event)的詞彙,之後引發了負面情緒(Negative Emotion)、症狀(Symptom)、負面行為(Negative Behavior)。此四種因素稱 為憂鬱因素(Depression Factor),接著我們會利用這四種因素來預測網路使 用者的憂鬱傾向。如表 1.2 中,便呈現了網路使用者所撰寫文章的各個特 徵值的標記內容,文章的例子中,我們可以發現造成該使用者主要來源的 壓力事件的描述吃藥,害怕是負面情緒詞,失眠是症狀詞,最後則是負面 行為自殺。在臨床治療上,通常患者不會將過往相關的生活歷程完整記錄 及表達,這也使得整體的診治資源顯得較不充裕。所以我們期望能夠研發 新的偵測技術,提供更多的診治資源給醫護人員,使醫療品質能夠有所提 升。. 3 .
(15) . 表 1.2 PTT BBS 站 Prozac 板文章中出現 Depression Factor 我覺得我的失眠情況一直沒有改善 自律神經一直好不了..... 自律神經除了靠運動之外 還有什麼方法可以讓它好起來呢..... 我現在都是靠吃藥來維持至少吃一些東西 之前一天吃兩次抗焦慮藥 現在一天照三餐吃... 很害怕下一次醫生會不會又加重失眠藥與抗焦慮的藥量...... 我每天都在懷疑自己到底好不好得起來 每天都覺得生活毫無目標 好想自殺. 很怕一直靠藥 真的很怕...... 1.3 研究目標. 本研究的目標在於提出一個有效的壓力事件導向模型(Stressful Life Event-Driven Model, SLEM),分析網路使用者的憂鬱傾向,協助偵測造成 壓力來源的壓力事件,進一步在臨床治療上,協助專業醫療人士診治的資 源。 4 .
(16) . 研究中將分析網路作者在網路透過各種平台所分享的文章,經由文章 中透漏出來造成壓力的事件、負面情緒、症狀及負面行為量化成指標,藉 此來判斷文章中所透漏出來的憂鬱傾向。. 1.4 研究方法. 本研究的解決方法在於以造成壓力的事件、負面情緒、症狀及負面行 為四類的辭典為基礎的分析模型,針對同一位作者在網路所撰寫的文章做 分析,擷取造成壓力的事件,進一步搭配負面情緒、症狀與負面行為,來 預測使用者的憂鬱傾向。整體的方法分成以下步驟: 首先要先蒐集高度潛在具有憂鬱傾向可能性的文章,所以先從國內知 名 BBS 網站 PTT 裡的憂鬱症板(Prozac 板)找出相關文章,然後把這些大量 的文章進行正規處理,抓取我們需要的資訊像是使用者 ID、文章標題、文 章內文等等。 第二步,我們必須先了解現今醫學上是如何對憂鬱症及壓力進行評估, 並建構憂鬱症與壓力評估間的相互關係。根據美國精神疾病協會(American Psychiatric Association, APA)出版的精神疾病診斷與統計手冊第四版修訂 版(DSM-IV-TR)[1]的症狀,我們可以歸納出以壓力事件為基礎所衍伸出來 的四種詞彙來當成壓力事件驅動模型(SLEM)的判別特徵。我們透過壓力事 件驅動模型(SLEM)的概念,再結合目前實際臨床上診斷患者壓力的判別標 準上,常用到的壓力事件(Stressful Life Event)判別量表當成主要的壓力事 件索引依據,其中包括了社會再調適量表(Social Readjustment Rating Scale) 及日常瑣事量表(Hassles Scale),依照以上所述的評估資料來與模型中所會 5 .
(17) . 用到的各種特徵值做結合,進一步提出各個特徵函數。 最後我們利用本研究提出的壓力事件驅動模型(SLEM)計算網路使用 者所撰寫文章的憂鬱傾向分數,呈現網路使用者因為壓力事件(Stressful Life Event)而導致憂鬱傾向的影響程度,以此幫助判斷網路使用者的憂鬱 傾向。. 1.5 論文架構. 本論文的第二章節介紹相關文獻探討,其中提及憂鬱症與壓力評估的 相關文獻;第三章說明本研究的方法;第四章為實驗與結果分析;第五章 則是結論及未來工作。. 6 .
(18) . 第二章 文獻探討. 2.1 憂鬱症. 憂鬱症(depression)是一種常見的精神疾病,會發生於各個年齡層的兒 童與成年人,是一種憂愁、悲傷、消沉等多種不愉快情緒綜合而成的心理 狀態。憂鬱症與遺傳、生理、心理及環境方面皆有相關。從遺傳的前置因 素與早期的發展經驗、性格特性,到受到生活壓力事件、缺乏社會支持等 環境因素影響,使得生理內分泌受到影響,進而導致憂鬱症。. 2.1.1 症狀. 根據美國精神疾病協會(American Psychiatric Association, APA)的精神 疾病診斷與統計手冊第四版修訂版(DSM-IV-TR)[1]診斷內容針對憂鬱症主 要分成以下幾類,包括了重鬱症(Major depressive disorder),低落性情感疾患 (Dysthymic disorder),精神病性憂鬱症(Psychotic depression),產後憂鬱症 (Postpartum depression),季節性憂鬱症(Seasonal affective disorder)與雙極性 疾患 (Bipolar Disorder)。而本研究主要是針對重鬱症 (Major depressive disorder)的相關內容做探討,有關的評估準則有以下幾項,診斷是否有憂 鬱症的標準在於兩週內,評估準則(1)與(2)至少出現一項,以及所有評估準 則至少出現五項,則會被判斷成有憂鬱症: (1)憂鬱情緒:快樂不起來、煩躁和鬱悶。 (Depressed mood most of the day)。 7 .
(19) . (2)興趣與喜樂減少:提不起興趣。 (Diminished interest or pleasure in all or most activities)。 (3)無法專注:無法決斷、矛盾猶豫、無法專心。 (Diminished ability to think or concentrate, or indecisiveness)。 (4)體重和食慾失常:體重下降或增加、食慾下降或增加。 (Significant unintentional weight loss or gain)。 (5)失眠(或嗜睡):難入睡或整天想睡。 (Insomnia or sleeping too much)。 (6)精神運動性遲滯(或激動):思考動作變緩慢、腦筋變鈍。 (Agitation or psychomotor retardation noticed by others)。 (7)疲累失去活力:整天想躺床、體力變差。 (Fatigue or loss of energy)。 (8)無價值感或罪惡感:覺得活著沒意思、自責難過。 (Feelings of worthlessness or excessive guilt)。 (9)自殺意圖:反覆想到死亡,甚至有自殺意念、企圖或計畫。 (Recurrent thoughts of death)。 8 .
(20) . 2.1.2 診斷. 目前沒有生物學面的檢測可以直接確診憂鬱症,所以必須從各方面進 行綜合判斷。首先,診斷的醫生通常會對患者進行一次體檢,用以排除和 憂鬱症類似症狀的疾病。然後根據目前的診斷標準對病患做觀察和診斷。 現今的醫學診斷標準是美國精神疾病協會(American Psychiatric Association, APA)的精神疾病診斷與統計手冊第四版修訂版(DSM-IV-TR)和世界衛生 組織(World Health Organization, WHO)的國際疾病與相關健康問題統計分 類(ICD-10)[27]。另外若是有懷疑自己罹患憂鬱症,許多單位皆有提供自我 診斷方法,例如董氏基金會即有提供憂鬱症的自我診斷評量表。. 2.2 壓力. 壓力是一個心理學與生物學的術語,由學者 Han Selye 所提出[29], 定義為「任何一種刺激」,意指人類或動物面對情緒上或身體上的有形或 無形威脅時,無法正常回應的感受狀態,進而誘發身心狀態的改變。. 2.2.1 引起壓力的因素. 引發壓力的因素稱為壓力源(Stressor),為讓人們產生壓力的事物與處 境[26]。通常內在或外在變化會造成生理與心理的平衡失調,進而影響個 人健康,而這些引起壓力的變化便稱為壓力事件(Stressful Life Event)[19], 如考試、交友、結婚等,即是相關的壓力事件。 9 .
(21) . 2.2.2 評估. 在壓力的評估上,臨床使用的評估技術主要有擷取生理訊號、提供問 卷 或 量 表 評 估 兩 種 主 要 的 方 法 。 在 Jorn Bakker et al.[10], Mykola Pechenizkiy et al.[11]中,其主要利用了生理訊號擷取感測器 Galvanic Skin Response(GSR)來預測員工在工作時間的壓力狀態,以進行員工的工時與工 作內容的調整;研究 Rafal Kocielnik et al.[17]中,亦利用了 GSR 來偵測學 生的壓力狀態,並發現在考試期間、作業專案截止前,學生的壓力會相對 較高。該研究期望能透過感測器的偵測結果,以進行相關教育方針的擬定 參考。 在研究 P. G. Holeyannavar et al.[13], Alan H.S et al.[4]中,針對了教師身 處的環境條件,設計了標準的問卷來調查,藉此來觀察教師們常見的壓力 來源,包括了工作時間過長、管理學生學習、與同事間的互動、薪資降低、 校園暴力等壓力事件,並進一步於問卷中調查教師們的教育程度及性別等 資料,觀察是否會和教師的壓力來源有顯著相關性存在。另一方面,亦針 對所產生的壓力管理的策略進行調查,以提供相關壓力管理策略給教師 們。 目前在實際臨床壓力評估事件的擷取上,是使用專家們所提出的壓力 評估量表來進行研究[15],常見的評估量表包括社會再調適量表(Social Readjustment Rating Scale)[9],日常瑣事量表(Hassles Scale)[14], 壓力知覺 量表(Perceived Stress Scale)[5]。本研究中主要使用的量表有社會再調適量 表(Social Readjustment Rating Scale)與日常瑣事量表(Hassles Scale),社會再 調適量表為美國華盛頓醫學大學的研究學者 Tomas Holmes 和 Richard Rahe 10 .
(22) . 所提出,其列出了 43 個人們在生活中所會經歷的壓力事件。接著以配偶 的死亡為調適的基準點,來看一個人對於某一事件的調適能力,來訂出該 表中壓力事件的壓力值。 而日常瑣事量表則是由柏克萊大學美國加州分校心理學系的研究學 者 Richard S.Lazarus 所提出,在該量表中列出了 119 個會造成壓力的生活 瑣事。以上兩個量表是本研究在針對壓力事件擷取上的主要來源。. 2.3 壓力與憂鬱症. 有眾多的研究指出,壓力與憂鬱症間有密切的相關性存在。在研究[25] 中便指出,當人們處於壓力的狀態下,便會刺激多巴胺的分泌,而該激素 也被證實確實與憂鬱症間有強烈的相關性存在。 另外,研究[2]中,其針對老鼠進行實驗,針對其所處的環境進行改變, 以營造出會造成壓力的外在環境。結果發現老鼠表現出許多憂鬱症患者身 上所會見到的症狀,包括了睡眠問題、學習能力下降、記憶力降低等症狀。 以上研究均顯示兩者間是有密切的關係存在,而本研究的主要目的便在於 偵測會造成壓力的事件,並預測網路使用者的憂鬱傾向。. 2.4 相似目標研究. 目前針對文章的情緒偵測方面的一般研究不少,但專注於以壓力事件 引起憂鬱傾向的研究並不多。與本論文相似的研究例如 Huang.[21],即是 11 .
(23) . 利用詞頻和權重的文字處理技術,以及透過 SQL 的資料庫語法「like」 ,對 部落格文章中的情緒詞彙做查詢統計,最後計算出情緒分數。而 Yao.在其 碩士論文則是提出利用層級分析法(Analytic Hierarchy Process,AHP) [20] 做憂鬱情緒的量化分析與評估系統。Chiang.研究針對網路部落格內可能具 自殺意念傾向之訊息進行研究[8],透過文件探勘 (Text Mining)及人工智慧 (Artificial Intelligence)等技術,發展一個有效之自動線上擷取與偵測。 本研究則主要是分析網路使用者撰寫的文章,擷取導致憂鬱傾向的壓 力事件,透過推導機率模型的計算,計算出憂鬱傾向分數,而本研究著重 在於利用壓力事件的影響力與結合負面情緒、症狀與負面行為來判定憂鬱 傾向。. 12 .
(24) . 第三章 研究方法. 本章節主要介紹本研究提出的方法。3.1 說明系統架構。3.2 介紹相關 的詞典(Lexicon)。3.3 是本研究的機率模型推導,並導入特徵函數。3.4 特 徵函數的計算方法。. 3.1 系統架構. 圖 3.1 為本研究的系統架構圖,分成 Training Part 和 Testing Part 兩部 分。在 Training Part 的部分主要是利用半自動化方式擷取文章中壓力事件 相關詞以建立本研究所需之壓力事件辭典,並建立壓力事件線上問卷以調 查各壓力事件之壓力值,接著本研究導入 DSM-IV-TR 對 Major Depressive Disorder 之定義,以兩週為一個時間區間擷取網路使用者的文章,進一步 搭配負面情緒、症狀與負面行為辭典找出文章中的各個特徵詞彙配對結果 算出憂鬱傾向分數值並與專家的標記結果訓練出模型的最佳參數值,再應 用到我們所提出的壓力事件導向模型(Stressful Life Event-Driven Model)中。 而 Testing Part 的測試資料則也是以兩週為一個時間區間的網路使用者的 文章,在進行文章斷詞的前處理後,透過擷取文章中相關詞(壓力事件、負 面情緒、症狀、負面行為),接著利用壓力事件導向模型(Stressful Life Event-Driven Model)計算出時間區段內文章的憂鬱傾向分數,來判斷此作 者的憂鬱傾向。. 13 .
(25) . 圖 3.1 系統 統架構圖 14 .
(26) . 3.2 相關辭典. 以下分別介紹研究中所使用的各個辭典。. 3.2.1 壓力事件辭典. 在本研究中主要探討壓力事件對該使用者在特定時段內憂鬱傾向的 分析與評估。本研究所謂之壓力事件乃參考心理學及臨床評估中常用之壓 力事件量表,其中包括了社會再調適量表(Social Readjustment Rating Scale) 及日常瑣事量表(Hassles Scale),整合後共得到 135 個壓力事件。本研究將 整合後之壓力事件進行分類,將相關事件集合成一壓力事件群組,為了使 整理後量表的壓力事件能夠具有結構化,所以我們將兩份量表的壓力事件 詞先以階層式(Multi-Layer)的概念進行分類。 在第一層的分類上,我們主要是將兩份壓力量表的事件整理後,分成 主要的五大類,包括了家庭、校園、醫療、工作與生活議題;依照第一層 的壓力事件分類,我們在觀察量表中所述的壓力事件來將第一層的各類壓 力事件做進一步的分類,以列出第二層相關的壓力事件,詳細的壓力事件 階層式分類列表如表 3.1 所示。 由於在研究中,為了瞭解壓力事件的影響程度,所以我們將整理後的 壓力事件做成問卷,請網路使用者針對該問卷做壓力事件影響程度的選填, 再統計這網路使用者對量表中的壓力事件的標記結果來進行影響程度的 換算,接著依照階層式壓力事件表的內容整合產生一份壓力事件分數的對 應表,然後再進行壓力事件壓力分數特徵函數的分數換算。針對所整理出 來的壓力事件,我們對於各個壓力事件主要利用了半自動的詞彙抓取方式, 15 .
(27) . 由 HowNet[6]所提供的詞庫來進行我們壓力事件詞彙的同義詞擴充。針對 所有壓力事件,我們先以人工定義出一群核心詞彙(seed lexicon),再以這 些核心詞彙到 HowNet 進行自動化搜尋並以人工過濾不恰當的詞彙,找出 能與壓力事件對應的詞彙。而我們亦將 Su.[12]所採用的事件詞彙篩選出與 壓力事件相關的詞彙,來當成我們壓力事件詞彙的內容,另外,我們再從 文章中分別找有關壓力事件的相關名詞與動詞來輔助壓力事件的抓取。以 在 HowNet 用半自動化所擷取到的壓力事件詞,再加上參照 Su.[12]的壓力 事件詞,以及由文章中觀察得到的相關名詞與動詞,將上述壓力事件詞對 應到階層式壓力事件表,便是我們在實驗中所用來擷取壓力事件詞彙的資 料來源。 表 3.1 階層式壓力事件分類表 Layer-1. Layer-2. 家庭. 人際 經濟 一般事務. 校園. 人際 學校生活. 醫療. 健康議題 疾病. 16 .
(28) . 工作. 人際 工作內容. 生活議題. 消費 貸款 法律相關 自然環境 人際 社會現況. 17 .
(29) . 3.2.2 負面行為辭典. 此部分的詞彙主要是聚焦在特定的負面行為,也就是針對與憂鬱症相 關或是具有自殺意圖的詞彙。例如:跳樓、割腕等等強烈負面行為,而負 面行為的內容敘述上,我們假設該使用者在有了相關意圖與認知後,接著 才可能實際行動而造成可能傷害他人或自已的行為,所以我們將 Wang. [18] 研究中提出的負面想法詞彙當成研究中的負面行為辭典,其主要是由憂鬱 症患者和自殺者部落格文章所擷取出來的詞彙。表 3.2 為負面行為詞彙的 例子。. 表 3.2 負面行為詞彙例子 Negative Behavior Terms 自殺. 割腕. 跳樓. 尋死. 勒死. 燒炭. 輕生. 自殘. 上吊. …. 18 .
(30) . 3.2.3 負面情緒辭典. 此詞典是參照 Wang.[18]所提出的情緒詞典,研究中主要是要探討情 緒詞所產生的不良影響,因此主要是參考情緒辭典中的負面情緒辭典來作 探討。另外,Wang.[18]在研究中依照 R. Plutchik[16]的情緒分類原則來進 行分級,給予每個情緒詞彙一個強度值,代表該情緒詞彙的情緒強度 (Intensity of Emotion)。情緒詞的強度愈強,其強度值就愈高,反之就愈低。 舉例來說, 『傷心』和『悲憤』所呈現的強度就不同, 『傷心』較輕而『悲 憤』較為嚴重。將正面與負面的情緒強度皆分為 3 級。並給予最輕的情緒 強度為 0.25,中度的情緒強度為 0.50,最重的情緒強度為 0.75,表 3.3 列 出一些不同強度的負面情緒詞。 表 3.3 三種情緒強度的負面情緒詞彙例子 Negative Emotion Terms Level1. Level2. Level3. (Intensity:0.25). (Intensity:0.50). (Intensity:0.75). 沉思(pensiveness). 難過(sadness). 悲痛(grief). 無聊(boredom). 厭惡(disgust). 憎恨(loathing). 憂慮(apprehension). 害怕(fear). 驚恐(terror). 煩惱(annoyance). 生氣(anger). 憤怒(rage). 19 .
(31) . 3.2.4 症狀辭典. 症狀辭典方面,Wang.[18]提出憂鬱症常見的症狀詞,其是透過人工抽 取 Bilingual MeSH 專業醫學詞彙[22][24]中與憂鬱症相關的症狀詞,並同 時利用搜尋引擎 Google、Wikipedia 搜尋和憂鬱症相關的常見症狀或相似 詞。表 3.4 為症狀辭典的例子。 表 3.4 症狀辭典例子 Symptom Terms 失眠. 嘔吐. 嗜睡. 抽痛. 消化不良. 心悸. 胃口差. 早醒. 幻聽. 口渴. 耳鳴. 頭痛. 眩暈. …. 20 .
(32) . 3.3 壓力事件導向模型. 一篇部落格文章 (Depressive Tendency) 傾向. ,我們想要知道這篇文章透露出憂鬱傾向 的強度。也就是給定一篇網路文章. ,算出憂鬱. 的機率。 |. (1). 根據研究觀察具有高度憂鬱傾向作者的部落格文章,發現作者寫下具 有壓力事件(Stressful Life Event)的部落格文章時,我們假設在引發壓力後, 會造成作者產生負面情緒(Negative Emotion),或是伴隨著症狀(Symptom)、 更甚有不好的負面行為(Negative Behavior)。. Web User’s Post Depression Factor. Stressful Life Event. Negative Emotion. Symptom. Negative Behavior. Depression Tendency. 圖 3.2 網路使用者的文章含有憂鬱因素 21 .
(33) . 由於憂鬱是一個抽象的概念,無法直接從文章中看出來。所以本研究 轉而透過找出該篇文章中的各種憂鬱因素,以間接了解並量化一篇文章是 否透露出憂鬱傾向。因此我們將公式(1)轉化為找尋部落格文章 鬱因素. 中的憂. ,使原本要求的憂鬱傾向機率轉變成下面這個機率公式(2):. |. 憂鬱因素. |. (2). 涵蓋了壓力事件、負面情緒、症狀及負面行為,也就是下. 面公式(3):. ,. , ,. |. (3). 在四個憂鬱因素之中,本研究主要著重『壓力事件』,這是因為憂鬱 症和壓力事件有直接的對應關係。所以我們先找出部落格中的壓力事件 (Stressful Life Event),將公式(3)的針對憂鬱因素中的壓力事件展開,即為 下列公式(4):. ,. , ,. |. |. 22 . , ,. | ,. (4).
(34) . 又 負 面 情 緒 、 症 狀 及 負 面 行 為 相 互 獨 立 。 故 我 們 可 將 公 式 (4) 的 , ,. |. 展開即為下列公式(5):. | ,. , ,. | ,. | ,. | ,. (5). 因為此部分皆在同一篇部落格文章中做討論,所以我們將 的因素省 略,公式(5)即可改寫成下列這條機率公式(6):. , ,. | ,. |. |. |. (6). 接著把公式(2)、公式(3)、公式(4)、公式(6)整理後,便可將. |. 改. 寫成下列公式(7):. |. |. ∙. |. ∙. |. ∙. |. (7). 公式(7)即是本研究的模型,稱做壓力事件導向模型(Stressful Life Event-Driven Model)。 在針對網路使用者的憂鬱傾向進行預測時,必須要分析一段時間裡該 23 .
(35) . 使用者所撰寫的文章以計算憂鬱傾向分數,實驗判斷時間區間內的文章是 否有憂鬱傾向主要是依照所有時間區間的憂鬱傾向分數平均當臨界值。公 式(7)是針對單篇文章進行特徵剖析擷取運算,為了能夠達到準確預測網路 使用者的憂鬱傾向,我們將依照 DSM-IV-TR 對憂鬱症的診斷標準,擷取 兩週內的文章,並用壓力事件導向模型(Stressful Life Event-Driven Model) 剖析時間區間內各篇文章的結果,接著進行平均,所得到的分數便是憂鬱 傾向分數(Depressed Score)。如公式(8)所示。 ∑ ∈ . . 1, 2, … ,. , . . |. (8). | 的最大機率值。. 接下來本研究利用 Log Linear Model 找出整體. 在公式(7)中的四個子項值我們假設會正比於自然指數 e 的函數,所以 P. |. ∝. ,. ,. ,. |. 、P. 、P S|. ∝. ∝ ,. 、. P. |. ∝. ,我們將以上四項函數做為 Log Linear Model[7]的特徵. 函數,公式如下: |. ∑. ∗. ,. ∈. , ,. (9). F. ,. ,. ,. ,. ,. ,. 公式(9)的 為權重係數,在第四章實驗的部分會說明如何估計各個參數值。. 24 . ,.
(36) . 我們將. ,. 稱作壓力事件壓力分數特徵函數(Stressful. Life Event Stress Score Feature Function);. ,. 稱作負面情. 緒重要性特徵函數(Negative Life Event Importance Feature Function);. ,. 稱作壓力事件-症狀距離特徵函數(Symptom Distance. Feature Function);. ,. 稱作壓力事件-負面行為距離特徵. 函數(Negative Behavior Distance Feature Function)。 接下來的小節會詳細介紹這各個特徵函數的計算方法。. 3.4 特徵函數. 3.4.1 壓力事件壓力分數特徵函數. 此特徵函數為比對文章中所出現的壓力事件詞彙與目前的壓力事件 量表的詞彙做比對,以判別壓力事件的壓力分數值。 其中, 代表文章中所有的壓力事件詞彙,. ,. ,…,. ,我們. 由目前臨床上針對壓力診斷所常用到的兩份壓力事件量表整理成問卷進 行調查,. 為壓力事件的等級,依照造成壓力的程度總共分成 5 級, 則是被標記的筆數。依照選填的結果作重要性的排名,當. 成壓力事件的壓力分數值,壓力分數值的計算方式如公式(10)所示。 ∗. 其中,. ∑ ∈. (10). 為該篇文章中壓力事件詞彙的個數,再搭配各. 壓力事件詞的壓力分數來判別影響程度。而針對對應到多個壓力事件的壓 25 .
(37) . 力事件詞彙,我們主要是將整理出來量表的壓力事件分成主要五類。另外, 在一篇文章當中,作者所撰寫到的壓力事件詞可能不只一個,因此我們針 對目前的文章資料,針對文章進行壓力事件標記後,抓出所有的壓力事件 詞。count. 為該篇文章中壓力事件詞彙的個數。這樣便能呈現文章中抓. 取到所有的壓力事件。此特徵函數的公式如公式(11)所示。. ,. ∑ . ∈. ∗. (11). 3.4.2 負面情緒重要性特徵函數. 在文章中,若負面情緒出現的詞彙距離越近,表示某壓力事件所引起 的負面情緒影響程度越大,而在文章中的負面情緒辭是對應到哪個壓力事 件詞,我們將一篇文章中所有負面情緒詞與各個壓力事件做字詞距離的換 算,將負面情緒詞分到對應的壓力事件詞,而以字詞間的距離,來換算成 文章中負面情緒詞的影響力,字詞間的距離越短,則影響力越大,此結果 符合. [23]的現象,也就是特徵函數中. ,. 的意義。. 因此,在特徵函數中,我們將該文章中所有抓取到的負面情緒詞做所屬壓 力事件詞的距離換算,並搭配該負面情緒詞的強度做計算,每一個負面情 緒詞. 都有情緒強度. ,每一個情緒詞的情緒強度值介於 0. 到 1 之間,最後得到該函數的分數值。公式(12)為此特徵函數的公式,為 利用在文章找到壓力事件詞彙乘上對應的負面情緒強度進行運算。而為了 使抓取到的配對能更加精準,我們針對所有文章壓力事件詞彙與負面情緒 詞彙的所有配對進行平均相互距離的計算,訂定壓力事件詞彙與負面情緒 26 .
(38) . 詞彙的臨界距離(. ,. ∑. ),藉此來輔助特徵函數的計算。. ,. ∈. ,. ∗. ∈. ,. ∗. ,. (12). 3.4.3 壓力事件-症狀距離特徵函數. 在此特徵函數,我們主要以字詞間的距離,來換算成文章中症狀詞的 影響力。若某壓力事件所屬的症狀群集間的平均距離越小,則代表了症狀 群集對該壓力事件的影響程度越大。而特徵函數針對距離的計算採用了常 態分配的假設,. 為文章中某壓力事件詞的位置, 與 則分別是所屬症. 狀詞與該壓力事件詞的平均距離及標準差。詳細的特徵函數如公式(13)所 示。為了使抓取到的配對能更加精準,我們針對所有文章壓力事件詞彙與 所屬症狀詞彙的所有結果進行平均距離的計算,訂定壓力事件詞彙與所屬 症狀詞彙的臨界距離(. ,. ,. ∑. ∈. ),藉此來輔助特徵函數的計算。. √. exp. (13). 3.4.4 壓力事件-負面行為特徵函數. 在此特徵函數,我們主要以字詞間的距離,來換算成文章中負面行為 27 .
(39) . 詞的影響力。若某壓力事件所屬的負面行為群集間的平均距離越小,則代 表了負面行為群集對該壓力事件的影響程度越大。而特徵函數針對距離的 計算採用了常態分配的假設,. 為文章中某壓力事件詞的位置,. 與. 則分別是所屬負面行為詞與該壓力事件詞的平均距離及標準差。詳細的特 徵函數如公式(14)所示。為了使抓取到的配對能更加精準,我們針對所有 文章壓力事件詞彙與所屬負面行為詞彙的所有結果進行平均距離的計算, 訂定壓力事件詞彙與所屬負面行為詞彙的臨界距離(. ,. ),藉此. 來輔助特徵函數的計算。. ,. ∑. ∈. √. exp (14). 28 .
(40) . 第四章 實驗與分析. 本章節主要介紹本研究提出方法的實驗與結果分析。4.1 介紹實驗資 料的內容以及評估的方法。4.2 實驗評估 4.3 實驗結果分析。. 4.1 實驗資料與評估方法. 4.1.1 網路使用者文章資料集. 本研究所分析的網路使用者的文章主要是由台大 BBS 站台(PPT)的憂 鬱版(Prozac)所蒐集到的 17948 篇文章,挑選文章數量前 30 多的作者文章, 共 724 篇文章,並將這 30 位作者的文章排除內容過短與類似詩歌的文章, 結果共剩下 656 篇文章以進行實驗,依照 DSM-IV-TR 對重鬱症的診斷標 準,以兩週為一個時間區間(time duration)做切割,總共會有 136 個時間區 間。而時間區間內各篇文章. ,. ,…,. 的憂鬱傾向的標準答案判定. 主要是依照成功大學三位行為醫學研究所的研究生,依據 DSM-IV-TR 評 估準則的標記結果,其中準則一與準則二至少要出現一項,全部九項最少 要出現五項,才會被判定成有憂鬱傾向。結果則是採多數決的方式,來判 斷是否有憂鬱傾向。. 4.1.2 網路使用者壓力事件問卷資料集. 由於在研究中,我們想要了解由社會再調適量表(Social Readjustment Rating Scale)及日常瑣事量表(Hassles Scale)所整理出來的 135 個壓力事件 29 .
(41) . (Stressful Life Event)對網路使用者所造成的壓力程度,因此我們將全部的 壓力事件做成問卷的形式進行調查,並依照壓力程度的大小分成五級(壓 力分數最低:1, 壓力分數最高:5)。 最後,我們總共蒐集到了 106 份有效的問卷,詳細的問卷分析內容如 表 4.1 所示。而為了瞭解我們所蒐集到的問卷的可信度,我們將所有問卷 利用 SPSS 軟體進行信效度的檢定,在信度檢定的結果中,其 Cronbach’s Alpha 值高達 0.966,由此可證明我們所蒐集到的問卷內容可信程度相當高; 而效度檢定的結果,絕大多數的問卷項目的檢定結果也是相當有效的,詳 細的檢定結果如附錄 B 所示。 表 4.1 壓力事件問卷分析 性別. 年齡. 類型. 男. 女. 20 歲以下. 21-29 歲. 30 歲以上. 數量. 84. 22. 57. 48. 1. 由於在我們所整理出來的 135 個壓力事件中,有部分的壓力事件相似, 所以我們將類似的壓力事件集結成 46 個項目並對應到我們所提出的階層 式架構作對應,並將各個項目的壓力事件對應的壓力分數值做平均。而我 們在方法中特徵函數的壓力分數值運算便是以各群的壓力分數值來進行 運算。詳細的各群壓力事件內容如表 4.2 所示。. 30 .
(42) . 表 4.2 壓力事件列表 Layer1. Layer2. Layer’s Event. Stress Severity Score. 家庭. 校園. 醫療. 人際. 家人相處. 3.51. 家庭成員數有變化. 3.71. 婚姻關係有困難. 3.72. 與愛人的問題. 3.60. 婚姻結合. 3.21. 經濟. 家事責任. 3.17. 一般事務. 居家條件的改變. 2.96. 外務管理. 2.53. 家庭成員的問題. 3.88. 人際. 親密朋友的死亡. 4.36. 學校生活. 課業內容有問題. 3.18. 學校生活改變. 2.93. 沒足夠的休息. 3.64. 健康議題. 31 .
(43) . 疾病. 工作. 人際. 工作內容. 生活議題. 消費. 關注醫療問題. 3.27. 個人傷害或疾病. 3.75. 傳宗接代. 3.65. 藥物問題. 3.13. 妻子工作. 2.96. 工作性別歧視. 3.40. 難纏的客戶. 3.77. 員工相處. 3.02. 上司相處. 3.86. 同事相處. 3.30. 傑出的個人成就. 3.07. 工作條件變化. 3.60. 失去工作. 4.49. 退休. 2.64. 社交娛樂活動變化. 2.20. 經濟問題. 3.40. 32 .
(44) . 貸款投資. 貸款議題. 3.75. 法律相關. 社會義務. 2.92. 法律議題. 3.93. 自然環境. 天氣. 2.11. 人際. 抽菸干擾. 3.46. 人際關係. 3.49. 飼養寵物. 2.37. 個人外貌. 3.12. 例行的問題. 2.64. 害怕被拒絕. 3.62. 太多時間. 1.77. 關注意外. 3.22. 個人習慣. 3.23. 時間議題. 3.19. 生活雜項. 3.25. 社會現況. 33 .
(45) . 4.1.3 評估方法 . 精確率(Precision) 衡量在所有系統回傳正確的結果中,確實是正確答案的比率。其中. 代表回傳為正確答案的個數, 為在回傳是正確答案中確實是正確答案的 個數,精確率的計算如公式(16)所示: (16) . 召回率(Recall) 衡量在正確答案之中,被系統回傳為正確的比率。其中. 代表正確答. 案的個數, 為在正確答案中被系統判定為正確的個數,召回率的計算如 公式(17)所示: (17) . F-Measure F-Measure 是精確率(Precision)與召回率(Recall)二個數值的協調值,其. 可評量系統抓取資料的精確率與召回率,F-Measure 的計算如公式(18)所 示:. ∗. 34 . ∗. (18).
(46) . 4.2 實驗評估. 4.2.1 憂鬱因素辭典. 在實驗中,我們所用來判斷憂鬱傾向的憂鬱因素主要有壓力事件、負 面情緒、症狀與負面行為。其中壓力事件辭典的內容中,文章中所觀察到 的部分壓力事件名詞與動詞分別有 71 個與 53 個,其與 HowNet 及 Su.[12] 的壓力事件詞有重複,所以便予以扣除剩 181 個與 153 個,故最後包括 HowNet,Su.[12]與文章中所觀察到的壓力事件詞共有 1202 個,詳細的辭典 數量如表 4.3 所示。 表 4.3 憂鬱因素辭典數量 Stressful Life Event. Depression. Negative Symptom Negative Emotion. Factor HowNet. Synonyms term(Su.. Count. Behavior. Previous Posts’ Posts’ Total. term. [12]). 641. 227. Noun. Verb. 181. 153. 1202. 1316. 177. 4.2.2 特徵函數權重估計. 此實驗的目的在於估計四個特徵函數的權重值,也就是. ,. ,. ,. 35 . 的特徵函數權重. 73.
(47) . 值,這些權重可用來幫助我們後續進行測試資料的憂鬱傾向分數計算。本 研究使用 5 倍交叉驗證(Cross Validation),先將資料切割成 5 個子集合,取 其中 4 個集合做訓練,所得到的參數值如表 4.4 所示,我們將結果所得到 的 F-Measure 值最高的參數值當成特徵函數的權重值。 表 4.4 特徵函數權重 1. 2. 3. 4. 5. 0.3475. 0.3414. 0.3465. 0.3455. 0.3452. 0.2743. 0.2735. 0.2688. 0.2762. 0.2747. 0.0547. 0.0568. 0.0526. 0.0559. 0.054. 0.3235. 0.3283. 0.3321. 0.3224. 0.3261. 0.6097. 0.6008. 0.6061. 0.6012. 0.6181. 4.2.3 壓力事件詞與負面情緒,症狀,負面行為相互距離門檻值參數. 在我們的所提出的方法中,我們針對文章中的負面情緒詞,症狀詞與負 面行為詞找尋所屬壓力事件詞的方法為搜尋距離最短的壓力事件詞來進 行群聚,但是這樣的方式會使得抓取配對的內容有所偏差。因此,我們將 原本做完斷詞後所有文章包括負面情緒詞與壓力事件詞、症狀詞與壓力事 件詞及負面行為詞與壓力事件詞的相互距離的所有組合,分別進行所有組 合的加總平均當成我們抓取配對的門檻值。各個門檻值如表 4.5 所示。. 36 .
(48) . 表 4.5 特徵詞彙相互距離門檻值 特徵. 門檻值. Negative Emotion 與 Stressful Life 46.93 個單位詞 Event Symptom 與 Stressful Life Event. 40.06 個單位詞. Negative Behavior 與 Stressful Life 36.01 個單位詞 Event. 4.2.4 驗證壓力事件詞彙擴展的有效性. 我們為了驗證利用 HowNet 針對壓力事件半自動方式所擴展的壓力事 件詞對我們所提出的方法的有效性。我們將壓力事件詞中屬於由 HowNet 擴展的壓力事件詞去除與我們的模型互相比較。 由表 4.6 中,我們可以發現加入 HowNet 擴展的壓力事件詞彙後,在 Precision ,Recall 與 F-Measure 的值都有所提升,確實可以有效的增進我們 的評估效能。. 37 .
(49) . 表 4.6 壓力事件詞彙擴展的有效性 Method. Precision. Recall. F-Measure. 0.6219. 0.6144. 0.6181. 0.4791. 0.2771. 0.3511. 4.2.5 評 估 壓 力 事 件 導 向 模 型 (Stressful Life Event-Driven Model). 為了評估我們所提出的. 模型是否有效,我們訂定三個 Baseline,. 分別是將壓力事件、負面情緒、症狀與負面行為分開計算的 及將壓力事件的壓力分數值都定為一的. ;. 來做計算;還有在社會再. 調適量表(Social Readjustment Rating Scale)的學者所訂定的壓力事件與壓 力分數值套用到我們的模型中進行運算,結果為 以發現我們的方法. 。由表 4.7 中可. 的預測效能與上述所提的 Baseline 相比,都要來. 的更有效。. 38 .
(50) . 表 4.7. 模型評估. Precision. Recall. F-Measure. 0.6219. 0.6144. 0.6181. 0.5308. 0.5180. 0.5243. 0.4762. 0.4109. 0.4411. 0.5806. 0.4337. 0.4965. 4.3 實驗結果分析. 我們針對實驗的結果,分成專家標記成有憂鬱傾向的正向與錯誤例子, 以及專家標計成無憂鬱傾向的正向與錯誤例子作探討。例子中,粗體底線 標記為壓力事件詞,粗斜體字底加陰影為負面情緒詞,粗斜體底線為症狀 詞,粗斜體底線加外框為負面行為詞。. 4.3.1 專家標記成有憂鬱傾向. 4.3.1.1 正向例子. 由表 4.8 中可以看出,在此時間區間內共有四篇文章,在 PostID5655 的文章內容中,有出現了「生病」、「孤獨」高壓力分數值的壓力事件詞, 其分別屬於我們壓力事件中的「個人傷害或疾病」、「人際關係」,使得壓 39 .
(51) . 力事件壓力分數值函數分數增高。PostID5733 的文章內容,出現了 「生病」 、 「好朋友, 沒人緣」的壓力事件詞,分別屬於我們壓力事件詞的「個人傷 害或疾病」、「人際關係」,並且有「傷害」、「活下來」的負面行為詞,使 得壓力事件壓力分數值函數與壓力事件-負面行為特徵函數的分數增高。 而 PostID5738 的文章內容出現了「憂鬱症,生病」 、 「朋友, 友情」多個屬於 壓力事件的詞彙,並且有「傷害」的負面行為詞,使得壓力事件壓力分數 值函數與壓力事件-負面行為特徵函數的分數增高。最後,PostID5774 的 文章內容出現的壓力事件詞彙則是「放假」、「玩遊戲」,其屬於我們壓力 事件中的「社交娛樂活動的變化」的壓力事件,因此壓力分數相對較低。 整體來說,此時間區間內的文章的分數因為多數的文章由模型判別出來的 影響程度都較大,因此與專家所標記的結果相符。 表 4.8 專家標記成有憂鬱傾向的正向例子 PostID:5655 自從生病後 看到書籍也好、電視上的專訪也好 或者是一些人在網路上紓發自己心情的文字也好. 我終於發現有些人跟我的想法是很貼近的 終於,我感到自己不是那麼樣的孤獨. 40 .
(52) . 原來也有人跟我一樣 是這麼樣的體貼不想讓別人擔心,所以強迫自己去成熟、去壓抑自己 原來也有人跟我一樣 一樣那麼樣的渴望別人的關心和關注. 昨天我還一口氣看完「不善表達愛的媽媽和渴望愛的孩子」 然後淚流不止...為什麼我跟書裡面那個小女孩思妤是這麼樣的相像? 好多好多的情結,好多好多的狀況,好多好多的感受 我都好像有什麼記憶被再次喚醒了一樣.... 自卑的覺得自己不該擁有任何人的關心 但是卻又渴望有人能夠給我那份我所希望的關心 把自己困在那個小小的角落渴望有人願意來敲敲門,跟我說說話... 有一天,我會像思妤一樣恢復自信嗎?. 有一天,我會像思妤一樣得到我所渴望的關心嗎?. 41 .
(53) . PostID:5733 生日好像應該要讓自己快樂點才是. 我也的確做到了...不過這一切都只是別人看起來>"<. 我自己呢?我真的快樂嗎?. 我想,不是吧!. 我不知道這生日還有什麼意思呢?. 這生日似乎就是告訴我...「妳輸了,妳依然要繼續痛苦的 活下來 ...」 其實自己也很清楚,所有的一切都是自找的>"<. 誰叫自己想不開、鑽牛角尖、放不下.... 42 .
(54) . 誰叫自己要生病、誰叫自己當初要這樣子 傷害 別人.... 任何人都沒錯,錯都是我的. 反正我本來就沒人緣,反正本來大家就都會受不了我離我而去反正...我的 存在本來就不具有任何的意義反正...根本就沒有人在乎我 為什麼... 只是想要有人在乎、只是想要多點關心、只是想要有個好朋友可以放心 的說說話...可是這一切居然會這麼的困難? PostID:5738 憂鬱症,這是一個多麼需要大家理解的疾病阿!. 當初我一被如此宣判的時候,妳是怎麼樣對待我的?. 說我根本就沒病,說我假借生病之名來 傷害 身旁的人. 在我最害怕、最需要週遭的人給我安慰的時候. 43 .
(55) . 妳卻不肯給我任何的安慰和鼓勵. 反倒是狠狠的把我往外推,把我給推的遠遠的. 妳的一句「我們都沒資格當你的朋友」. 給了我重重的一擊,沒資格當朋友的人不是妳們,而是我!!! 如果不是我生病了...如果不是我傷害了妳們...如果不是我...如果不是我生 病了...如果不是我傷害了妳們...如果不是我.... 我們大家都會過得很好,我們就不會有任何人因為我而受到傷害.... 是我,是我不夠資格擁有妳們的友情...有多少個夜裡,我因為想起妳的那 句「不夠資格」而難過的睡不著有多少的夜裡,我做夢夢到妳跟我說那 句「不夠資格」 ,而從睡夢中驚醒事情一年多了,我卻還是常常會因為想 起這件事情而失眠、而作惡夢、而大哭剛生病的時候,我甚至希望妳來 得這種病看看,感受一下這一切是有多麼的難以承受但是,這樣的想法 很快的就被我否決定了我不應該這麼樣的自私,雖然妳說的話狠狠的傷 44 .
(56) . 害了我但是,或許正因為我懂有多難受,所以我不希望妳也來承受這一 切最近...看到妳因為工作上和個性上的關係,而被醫生診斷得了憂鬱症我 好心疼,也好不捨 我好心疼,也好不捨 多麼希望可以跟妳聊聊 多麼希望可以關心關心妳的近況 多麼希望可以給妳個溫暖的大擁抱 但是,當 msn 對話視窗打開後,那句「不夠資格」又在我耳邊響起... 自從那一天,我已經失去當妳朋友的資格了,我也失去關心妳的資格了 對妳的關心,也只能永遠的放在心裡了.... Fenny... 我相信妳一定可以早日康復的! 我相信妳一定可以早日變回本來那樂觀積極的大女孩的! 我永遠都在這裡關心著妳:) PostID:5774 自從放假後. 45 .
(57) . 我不知道為什麼,我開始完全不想動. 不想讀書、不想看書、不想出門、不想玩遊戲、不想去當志工. 很多很多本來都是我喜歡的啊!. 失去了動力,很多時候只是一直睡、一直睡.... 越來越覺得自己像是個廢人. 這樣下去,我還有什麼希望?. 這樣下去,我活著到底還有什麼意義?. 失去了求生意志、失去了繼續努力下去的動力.... 46 .
(58) . 很多很多本來都是我喜歡的啊!. 失去了動力,很多時候只是一直睡、一直睡.... 越來越覺得自己像是個廢人這樣下去,我還有什麼希望?這樣下去,我 活著到底還有什麼意義?失去了求生意志、失去了繼續努力下去的動力... 我到底該怎麼辦才好?. 4.3.1.2 錯誤例子. 由表 4.9 中可以看出,在該時間區間內共有三篇文章,PostID4195 的 文章內容中,雖然出現了「躁鬱症」壓力分數值較高的壓力事件詞,其屬 於我們壓力事件中的「個人傷害或疾病」,並且有出現「割腕」、「犧牲」 的負面行為詞與負面情緒詞「激動」、「眷戀」,但是由於我們在抓取壓力 事件詞與負面行為詞配對時,有訂定抓取的門檻值,因此出現在文章中後 段的負面行為詞便無法與文章前段的壓力事件詞做搭配,文中的負面情緒 詞亦有相同情況,使得分數降低。PostID4264 的文章內容中,出現了「過 年」 、 「結婚」壓力分數值較低的壓力事件詞,其屬於我們壓力事件中的「社 交娛樂活動變化」 、 「婚姻結合」的壓力事件,而症狀詞與負面行為詞更是 完全沒有,使得分數降低。而 PostID4292 的文章內容中,出現「念書」 、 「考 試」 、 「上課」中等壓力分數的壓力事件詞,其屬於我們壓力事件中的「學 校生活改變」的壓力事件,而症狀詞與負面行為詞也是完全沒有,使得分 47 .
(59) . 數降低。整體來說,雖然該時間區間內的文章出現的壓力事件詞的壓力分 數值算中等,又其他特徵詞彙出現過少,所以與專家判斷該區間有憂鬱傾 向便有所差異。 表 4.9 專家標記成有憂鬱傾向的錯誤例子 PostID:4195 朋友遠在香港的朋友得了躁鬱症 透過 MSN 希望我能夠給予那個小女孩一些建議. 我苦笑 要我講什麼呢? 下午我也才剛哭完 是要我講什麼要我去說什麼?. 自己走過 都已經知道安慰的話沒有屁用. 所以我說 "不管你做了什麼 請你答應我 活下去". 48 .
(60) . "這世界對你不好 為什麼是你要死? 為什麼不是其他人要死?" "難道就不能活下去看著其他人死嗎?憑什麼 犧牲 的是我們?""我只想讓你 知道 我在 也許我什麼也做不到 但是我能看能聽你說" "我不知道自己為什麼要活著 我只想找到一個證明我自己有用的理由所 以活著""我不想講什麼安慰的話 這世界 就是這樣殘酷" "也許就是要等到你抓狂了沒了理智做出無法痊癒的事情才會清醒.." "就像我 割腕 過 才知道疤痕一輩子都跟著我 連閉上眼 都會有血在流 動的感受". 我不知道小女生聽進去了沒有 但是這端的我 情緒很激動. 想拉她但是我連自己都拉不暸 只希望... 這些支撐著我的信念 能夠傳到他的心理只要多活一天 就多一點看到陽光的機會即使好長的時間都在黑暗裡 我還是眷戀太陽。 PostID:4264. 49 .
(61) . 上一次看診是國三的時候 現在我都已經大二了.... 中間沒有再就診 因為我信任的諮商師到國外深造考執照 然後順便在那嫁人結婚生子 偶爾過年過節回來台灣我才有機會見到她.... 最近狀況好像變糟了... 我又完全連絡不到那位女士 昨晚甚至因為半夜動怒完全沒辦法睡著 (整個我也覺得很莫名奇妙..) 關於負面的想法好像也越來越多 沒有在高雄看診過的經驗 所以想問問看... 我不是想要找名醫 默默無名的也沒關係. 50 .
(62) . 沒有在高雄看診過的經驗 所以想問問看... 我不是想要找名醫 默默無名的也沒關係 我需要的是 認真的聽我說 而不是敷衍的醫師..如果有必要的話 我也不 排斥服藥希望是夠專業 而不是那種亂七八糟的諮商師(應該懂我在說哪 種吧 囧") 麻煩大家了<(_ _)> PostID:4292 開學以來第二次... 第一次是因為老爹說要跟我賭斷絕關係 所以連去了兩天 只上了 2 堂課... 明天... 其實我不想去. 51 .
(63) . 當初跟媽說要休學 結果不讓我休.. 一直說我想太多. 上學期末故意不去考試... 果然 0 學分被 21 了. 本來想說 不去辦助貸 就等於不念了 結果又被媽發現 家庭革命我輸了 老爹本來已經站在我這邊了 老爹本來已經站在我這邊了 媽堅持不肯 又被逼著辦助貸 辦了助貸我故意不繳學校通知 想說自然而然被退學結果這次連老爹都火了...這學期在被 21 我就掰掰 了 但是.. 爸媽.. 掌管了我的經濟來源連閃光都被要求 要看住我 不准我去. 52 .
(64) . 打工.. 我很想說 我知道你們對我很失望可是我對你們 也很失望你們知道嘛 現在的我找不到理由繼續唸書我承認我很逃避我很爛..但是逼我 我會比 較好嘛? "既然繳了錢 就要乖乖去念書"我這樣跟自己說 但是還是提不起勇氣你 們知道嘛 夠了.... 好煩我又睡不著了... 今天又等著看日出了.... 有沒有人 可以教教我乖乖去上課可以完全不在意那些會中傷自己的人 事物?還是要借我勇氣.. 讓我去面對?. 53 .
(65) . 4.3.2 專家標記成無憂鬱傾向. 4.3.2.1 正向例子. 由表 4.10 中可以看出,在此時間區間內共有兩篇文章,PostID5193 的文章內容中,出現「考試」的壓力事件詞,其屬於我們壓力事件中的「學 校生活改變」,並且沒有出現症狀與負面行為詞,使得分數降低。而 PostID5368 的文章中,出現「友誼」的壓力事件詞,其屬於我們壓力事件 中的「人際關係」,亦沒有症狀與負面行為詞,使得的分數降低。整體來 說,該時間區間內的文章的壓力事件詞的數量算少,而其他特徵詞會出現 的次數也較少,故判定成無憂鬱傾向的結果與專家判定的結果相符。 表 4.10 專家標記成無憂鬱傾向的正向例子 PostID:5193 其實道理我都很清楚. 其實盲點在哪其實我都很清楚. 但是,明知道自己遇到了盲點卻還是跳脫不出來. 54 .
(66) . 這種感覺好悲哀阿.... 明知道人生不像考試一樣可以用分數來衡量. 明明知道人生沒有什麼最好或是最完美的狀況.... 可是,我卻還是不斷的再追求最好、第一、滿分= =. 我不知道到底為什麼我會有這麼嚴重的完美主義?. 我好想像其他人一樣.... 容許自己犯錯、容許自己表現的不夠好...唉... 誰可以幫幫我,告訴我到底該怎麼半才好? PostID:5368 生日快樂. 55 .
(67) . 又一年過去了. 還記得那一年.... 我和妳的友誼是從妳生日的時候開始的. 不過,一年的時間還沒到. 我就把妳給傷得遍體麟傷. 所有過去的互動和回憶都還歷歷在目. 對妳的那份愧疚、那份自責. 自始至終絲毫都沒有減輕. 56 .
(68) . 「妳好嗎?」 始終都是我最想知道的、也是我最關心的多希望可以再看看妳多希望可 以再聽聽妳對我說些什麼為什麼現在就連要見妳一面都變得如此的奢 侈、遙不可及呢?對不起... 真的真的很對不起... 儘管我心裡有著再多的愧欠與自責妳卻也已經都不會知道了 這份自責、這份遺憾將會在我未來的生命中永遠的跟著我一輩子. 我願意用所有我所擁有的一切來換取妳的原諒 我願意用所有我所擁有的一切來換取妳順遂的未來 我願意用盡全身的力量去達成所有妳所希望我做的事情 我真的真的都願意 儘管妳要我從這世界上消失,我也願意.... 4.3.2.2 錯誤例子. 由表 4.11 中可以看出,在該時間區間內共有兩篇文章,PostID13118 57 .
(69) . 的文章內容中,出現「憂鬱症」 、 「論文」的壓力事件詞,其分別屬於我們 壓力事件中的「個人傷害或疾病」與「學校生活改變」,而文章中出現的 負面情緒、症狀與負面行為詞亦 有一定的影響裡,使得分數提高。 PostID13140 的文章內容中,出現「吃藥」、 「憂鬱症」壓力分數高的壓力 事件詞,其分別屬於我們壓力事件中的「藥物問題」與「個人傷害或疾病」 , 而文章中出現的負面情緒與症狀詞亦有一定的影響力,使得分數提高。整 體來說,因為該時間區間出現的壓力事件詞的壓力分數都較高,並且其他 特徵值大多都有出現,所以有一定的影響程度,使得被判斷成憂鬱傾向; 但是依照三位專家判定的結果所出現的準則只有一位判定成有憂鬱傾向, 故以多數決的形式,所以被判斷成無憂鬱傾向。. 表 4.11 專家標記成無憂鬱傾向的錯誤例子 PostID:13118 之前為了考教師甄試,所以在大四那一年去考了研究所,辛辛苦苦考上 之後,去念了兩年卻感到非常挫折。我不懂論文要怎麼寫,也不知道要 怎麼找資料跟尋求幫助,加上我個性上很容易憂鬱,小時候也有很多陰 影,不知為什麼,碩二開始我開始出現憂鬱的症狀,讀不下書,也無法 理出頭緒,常常會想哭。. 碩三的時候我逃避了論文,先去代課半年,本以為可以兼顧,一邊賺工 作經驗一邊可以想論文計畫要怎麼寫,但發現不行,很慌,工作跟論文. 58 .
(70) . 都沒辦法兼顧,後來碩四又去另一間學校代課,然而卻壓力非常大,好 不容易勉強把論文計畫提出去,但計畫也提得不知所云,以至於我現在 寫論文很痛苦的原因但又停留在原點的理由之一。那時為了計畫,我的 工作表現也因為論文計畫受到嚴重影響,我覺得我變成一個學校裡的問 題老師,我真的很意外我怎麼會變成這樣?然後我也開始懷疑自己的教 學能力,覺得自己教得很差。雖然,之前有很多人都說覺得我很適合當 老師,但是工作之後我覺得我好怕教那些我教不出所以然的課文,然後 又跟學生起過幾次衝突讓我覺得自己沒有教書的人格。. 今年,碩五我選擇完全不代課不工作,專心在家寫論文,沒想到,才是. 惡夢 的開始。 可能因為長時間都窩在家裡吧,但是,努力去寫,卻不知道自己在寫什 麼,自知大概可能因為長時間都窩在家裡吧,但是,努力去寫,卻不知 道自己在寫什麼,自知大概 沒辦法畢業了,更慌,這件事情對我來講非常非常的挫折,尤其教學中 因為自己的慌 亂與不足,也引起了我會抗拒教學這件事,所以現在不寫論文又要轉去 考教甄,讓我 非常非常慌。我不知道我是不是還要繼續這條路,我現在真的覺得我好 像也沒那麼適 合教師這條路,尤其又這麼憂鬱,我怎麼去教學生要樂觀積極呢?我覺 59 .
(71) . 得自己很廢,什麼都做不好,完全在原點的感覺很討厭,真的很討厭。 已經將近三十歲的我,一事無成。. 這幾天我崩潰了,利用網路上的自我檢測,我覺得我確實傾向於重度憂 鬱症(睡不好、失眠、吃不下、嚴重焦慮與憂鬱、自我否定、對任何事都 失去興趣與動力等等),我該怎麼治療才會讓我的心好起來呢?我好得起 來嗎? PostID:13140 昨天早上情緒崩潰,打電話給好友,好友找我一起去他老公家。於是我 去了。天氣很好,心情雖然很低落,但是看看風景也就注意力不那麼集 中在自己身上。去到他老公家,他老公上班不在,只有朋友,以及他老 公的爸媽。我一進去就看到他爸,笑得很親切,也很好客,覺得很溫暖, 不知為啥,覺得朋友老公的爸爸笑得好可愛好有感染力。而且啊,他跟 孫女的互動很溫馨。看了心情很好。. 不過其實很難想像朋友老公的爸爸,以前曾經入獄十二年。年輕時是個 逞兇鬥狠的流氓,其實他的人生並不能算是成功,可是眼前草根性很重 的這位伯伯,讓人覺得現在的他活得好自在、好快樂。比我好太多了。 後來在客廳,剛好有機會跟他單獨聊了一些時候,不知為啥聊到過不去 的事與挫折,他講了一句話,講得真好: 「你覺得沒什麼,那就真的沒什 麼。」當下心情有好一些。應該要試著努力這麼想吧,我可以嗎?最近 60 .
(72) . 好想要這麼想,但是焦慮的念頭總是無時不刻入侵,讓我無法思考無法 讀書無法做任何事。. 昨天晚上朋友老公下班,朋友老公也跟我聊了不少,他常去捐血、做義 工,他說這樣很快樂,好羨慕他,我也想學習努力成就他人,那真的很 快樂吧,可是現在全然無法這麼做,因為連自己都顧不好了。但憂鬱症 的人是否也應該努力去做一些對他無法這麼做,因為連自己都顧不好 了。但憂鬱症的人是否也應該努力去做一些對他 人好的事呢?這樣能不能改善自己無價值的想法呢?. 真的不是很想吃藥,一定要靠吃藥才能讓心情比較穩定一點嗎??我很 怕吃藥之後 就無法停下來以及它的副作用,今天早上第一次去看身心科,先挑了離 家近的診所,不過量表我實在不太會填,幾乎都在上面勾上「嚴重影響」 , 於是早上的醫生判定我是不輕的憂鬱症。看完醫生回來,下午心情又不 好,於是決定去看了另一個醫生,重新定義了今天早上的醫生給的量表, 然後下午這個醫生跟我談比較久比較細心,他說我的症狀沒那麼嚴重, 只是憂鬱症的初期,因為我還會求助。所以又自費拿了比較輕微的藥。 但是我到底該不該吃?一定要吃才能讓心情比較穩定然後能思考嗎?吃 藥會不會讓精神狀況更渾渾噩噩呢??我真的很排斥吃藥,很恐懼憂鬱症的 藥...能不能靠自己??有沒有不吃藥的方法??到底要不要吃藥真的很兩. 61 .
(73) . 難……心情稍微穩定不會想到焦慮的事時(好比說現在正打字的我)就覺 得不需要吃藥吧??還好啊!但是當焦慮的思緒又重來的時候,又痛苦的覺 得吃藥好了....好想趕快恢復思考分析的心情,吃藥真的像醫生講的這麼好 用嗎....... 唉..... 4.3.3 實驗結果分析討論. 在 實 驗 結 果 中 , 我 們 所 提 出 的 壓 力 事 件 導 向 模 型. 在針對時間區間內文章的憂鬱傾. 向預測的效能上,比起其他評估準則所預測的效能還要來得好。另一方面, 研究中利用 HowNet 所擴展的壓力事件詞,在整體模型預設的效能亦有大 幅的增長,這也驗證了擴展的壓力事件詞的有效性。本研究的重點在於找 出網路使用者撰寫文章中的所有壓力事件詞,並搭配負面情緒、症狀與負 面行為詞來預測網路使用者的憂鬱傾向。 雖然. 的預測效能較好,但是經. 過實驗後,我們發現了有以下問題: . 詞典詞彙數量及品質 在所採用的詞典當中,壓力事件詞彙與負面情緒詞彙是四個詞典中比. 較完整的詞彙,而藉由抓取文章中的壓力事件詞,可以有效的了解網路使 62 .
數據
+4
Outline
相關文件