• 沒有找到結果。

最後在第三節資料探勘中,將會針對「情緒量詞」、「程度副詞」、「資料探勘」

與「文字探勘」的文獻探討。透過資料探勘技術,使用情緒量詞與程度副詞的各 種組合搜尋網際網路圖片,故將資料探勘、文字探勘與情緒量詞、程度副詞放在 同一節討論。

一、 情緒量詞

在 2013 年卓淑玲等人的研究建立了台灣地區華人情緒量詞資料庫,共有 218 個情緒描述詞,又稱之為情緒量詞。過程中收集相關研究提及的情緒量詞、中研 院中文詞知識庫、研究生情緒量詞表綜合版、邀請 120 位大學生自由聯想,以及 透過儒家、佛教與中醫對情緒之概念的基本情緒類型,延伸找出的相應之情緒詞 等方式。將大量且各種不同來源的情緒詞收集後進行交叉分類搭配研究小組再 確認、分類,接著依主觀頻率、情緒強度排序選取前 218 個詞為情緒量詞、395 個時會為情緒誘發詞。如下表為研究小組依情緒詞分類系統所做分類之結果:

表 5. 研究小組依情緒詞分類系統所做分類之結果

圖片來源:卓淑玲,2013

二、 程度副詞

在這篇 2015、2016 年羅瓊鵬的研究中討論了「程度」、「量級」的相關概念。

等級性(gradability)屬於自然語言中形容詞的本質屬性之一,一般來說等級性 的形容詞可以有比較形式,可以被其他的程度副詞修飾,可以構成相應的感嘆句 等。程度副詞最主要的語意貢獻就是對形容詞的程度進行操作(羅瓊鵬,2016)。 因為等級性形容詞的真值語意是有程度差異的,它們都可以受程度副詞的修飾。

對於“程度”有兩種理解角度,一種是認為“程度”是刻度( points) ,另一 種則是認為“程度”是區間( interval) 。和以往的語義理論不同,程度語義學把

“程度”作為語義要素引入了語義表達體系。在程度語義學中,“等級性”是用

“程度”來表述的。“程度”可以理解為刻度。就如對刻度的標記要依賴一定的 測量工具( 如尺子) 來進行,對程度的標記也需要一個抽象的測量工具。這個工 具就是“量級”。

如果形容詞的語義是引導一個量級的話,例如:「愉快」,引出關於“愉快程 度”的量級。 “ooo 愉快”表示愉快到一定的程度; “xxx 難過”表示難過到一 定的程度,以此類推,那麼,修飾形容詞的程度副詞的最主要的語義貢獻是對程 度進行操作: 副詞選取一定的程度,表示某個個體具有的相關程度超過一定的標 準。例如:很高、非常高、有點高。標準是高,但是加上程度就超過一定的標準。

本研究採用正負情緒量詞各六個(卓淑玲,2013)分別為:愉快、甜美、快 樂、幸福、甜蜜、平靜、浮躁、哀愁、憂鬱、苦澀、寂寞、不安,並與 9 個程度 副詞組合(含單詞),分別為:比較、好、有點、非常、很、相當、格外、稍微,

形成共 108 個組合,請參考下表 6 所示。在卓淑玲的 218 個情緒量詞研究中,

特別針對正向情緒的部分,沒有直接對照正負向情緒量詞,例如:「愉快-不愉快」、

「甜美-不甜美」、「快樂-不快樂」等,而是直接使用負向的其他情緒量詞,所以 在本研究中不列入討論範圍。

表 6. 正負情緒量詞 12 個與 9 個程度副詞(含單詞)組合

情緒量詞

程度副詞 愉快 甜美 快樂 幸福 甜蜜 平靜 浮躁 哀愁 憂鬱 苦澀 寂寞 不安

單詞 愉快 甜美 快樂 幸福 甜蜜 平靜 浮躁 哀愁 憂鬱 苦澀 寂寞 不安

比較 比較愉快 比較甜美 比較快樂 比較幸福 比較甜蜜 比較平靜 比較浮躁 比較哀愁 比較憂鬱 比較苦澀 比較寂寞 比較不安 好愉快 好甜美 好快樂 好幸福 好甜蜜 好平靜 好浮躁 好哀愁 好憂鬱 好苦澀 好寂寞 好不安

有點 有點愉快 有點甜美 有點快樂 有點幸福 有點甜蜜 有點平靜 有點浮躁 有點哀愁 有點憂鬱 有點苦澀 有點寂寞 有點不安 非常 非常愉快 非常甜美 非常快樂 非常幸福 非常甜蜜 非常平靜 非常浮躁 非常哀愁 非常憂鬱 非常苦澀 非常寂寞 非常不安 很愉快 很甜美 很快樂 很幸福 很甜蜜 很平靜 很浮躁 很哀愁 很憂鬱 很苦澀 很寂寞 很不安

相當 相當愉快 相當甜美 相當快樂 相當幸福 相當甜蜜 相當平靜 相當浮躁 相當哀愁 相當憂鬱 相當苦澀 相當寂寞 相當不安 格外 格外快樂 格外甜美 格外快樂 格外幸福 格外甜蜜 格外平靜 格外浮躁 格外哀愁 格外憂鬱 格外苦澀 格外寂寞 格外不安 稍微 稍微快樂 稍微甜美 稍微快樂 稍微幸福 稍微甜蜜 稍微平靜 稍微浮躁 稍微哀愁 稍微憂鬱 稍微苦澀 稍微寂寞 稍微不安

三、 資料探勘

Agrawal, R.等人在 1993 年的研究中道出了典型的資料探勘例子,以挖掘資 料庫為目標,設計機器學習技術與資料庫技術模型。在研究中提出在海量資訊的 資料庫挖掘通常會遇到的問題:分類、關聯和序列,並將這些問題複製到它們所 設計的模型中並提出方法解決(Agrawal, R., et al.,1993a)。

Agrawal, R.等人在 1993 年的研究中,試著將資料探勘實際應用到商場中,

在這個研究中提出了一個有效率的關聯規則,並實際應用在大量的客戶交易資 料庫中,研究結果表示其有效性(Agrawal, R., et al.,1993b)。

Cooley, R.等人在 1997 年的研究中,將資料探勘技術使用於網頁探勘,當時 這技術還沒有一個公認的詞彙來描述,此時他們試著從兩方面作資料探勘,第一 是從網頁中挖掘資料,第二是從使用者在瀏覽網頁的過程中分析使用者的操作。

Dongsup Kim 等人在 2003 年的研究中,透過自然語言處理(Natural language processing, NLP)方法被認為有助於提高文字探勘的效能,然而文獻中大量的註 釋造成自然語言處理效能降低。Dongsup Kim 等人提出了一個方法,即使在大量 註釋的文獻資料庫中,依然能夠有效的處理。

隨著資料探勘技術越來越成熟、廣為使用,另一方面對於圖像情緒的討論也 越來越受歡迎,很多的學者對於資料探勘、圖像情緒等議題進一步的延伸探討,

而領英(NaLi)等人在 2015 年的研究中,試著透過小樣本的自動學習方式,讓 電腦學習分辨圖片的情緒,透過圖片的各種特徵,在過去許多學者研究對於圖片 情緒研究的基礎之上,並進一步擴大到整個網際網路的圖片的分類。

文獻小結

根據以上文獻討論,在第一節中,可以看到學者們透過實驗討論色彩與情緒 間的關係,以及色彩心理的書籍中說明了色彩不知不覺中對我們人類帶來的影 響,進而將這些色彩帶給人類的影響應用在我們日常生活中所使用的物品、環境 設計等等,而這些書籍與研究也提供了本研究所要討論的色彩建議,例如:快樂 有哪些色彩組合建議,這些建議將會用來比對網路圖片色彩量化後的結果。

在文獻探討的第二節討論關於色彩量化,對於圖片色彩量化的方法有很多 種,中位切割法為本研究將網路圖片色彩量化的方法,,故在文獻探討中聚焦在 中位切割法的原理以及應用上的討論,以及其相關的研究。

最後第三節資料探勘,當中涵蓋了情緒量詞與程度副詞的相關文獻,因為本 研究將會透過情緒量詞與程度副詞的組合做資料探勘,是透過文字來資料探勘,

所以在這一節裡面也提到在本研究中會使用的情緒量詞、程度副詞,以及資料探 勘從過去尚未定義公認的專有名詞到最近幾年資料探勘的盛行等相關研究。

綜合以上的文獻探討,大致上可以瞭解本研究中所提及的各技術背景,以及 眾多學者研究的歷史軌跡,在這些基礎之上,接下來會介紹本研究的研究方法與 設計。

第參章 研究方法

本章主要依據前章所提之研究目的與動機及文獻探討,歸結出過去對於色 彩與情緒的研究,並提出相關辦法對於色彩與情緒關係在網際網路圖片中加以 觀察。本章分為五節,依序為:「研究架構」、「研究設計」、「研究工具」以及「預 期效益」。

相關文件