本研究將會採用五大人格特質的面向來為文本資料進行分類,在此概略介紹 五大人格特質的發展由來。人格特質(Personality Traits)在心理學領域中的發展已 經行之有年,心理學家們透過不同的構面方法加以區分人格特質的種類。至今,
已經發展出了成熟的方法將人格特質加以定義區分。人格特質已被廣泛的應用在 不同領域上,其中一項就是職場上的應用。人格特質的人格量表是最常被用來作 為是甄選人才的一個檢測的工具,因為已有研究證明了人格特質與工作績效確實 是有關聯性存在的[13]。
「人格」一詞的英文為「Personality」,1990 年 Hergenhahn 的著作一書(An Introduction To Theories Of Personality)中內文提到了「Personality」一詞最初起源 於拉丁文的「Persona」所被延伸出來的,「Persona」拉丁文一詞的意思指的是古 希臘戲劇演戲時候的演員所穿戴的臉譜面具,不同的演員扮演著劇本中不同的角 年 Pervin 的著作一書(Personality:Theory And Research)中認為人格是由一系列的 人格特質所組成的,也就是說,特質為人格的基本組成單位,一個人類長期、持 久所表現出的不同行為特點就稱為「特質」[15]。
1963 年的心理學家 Norman 對人格特徵進行因素分析(Factor Analysis)後,進 而產生了所謂最具代表性的五大人格特質模型(The Big Five Model)。心理學家們 凝聚一致的共識以此模型為基底進行了多層面不同的研究,進而發展出了用來衡
的相關形容特徵詞描述[16] [17],經整理後如下所示:
(一) 外向型 (Extraversion):熱情的、活躍的、冒險的、樂觀的、健談的、喜愛 社交的、大膽的、社交的、果斷的、精力旺盛的。
(二) 神經質型 (Emotional Stability / Neuroticism):多愁的、猜疑的、易怒的、嫉 妒的、易受刺激的、焦慮的、敵對的、壓抑的、脆弱的。
(三) 順從型 (Agreeableness):信任的、直率的、利他人的、樂於合作、仁慈的、
依從的、謙虛的、有同情心的。
(四) 謹慎型 (Conscientiousness):有條理的、有組織能力、有效率的、謹慎的、
盡責的、自律的、成就的。
擊類、動作、格鬥類、運動類、線上類遊戲之間的相關性呈負相關。屬神經質型 人格特質的人與動作射擊類、動作類、格鬥類、運動類遊戲之間的相關性呈正相 關。詳細分析圖表如圖 2-1 所示。
圖 2-1: 人格特質與遊戲偏好之相關係數分析圖表 (資料來源: [12])
2.3 五大人格特質相關的應用與研究
目前已經有許多的研究發展出了許多不同的人格特質的預測方法。Mairesse et al. [5]透過問卷的方式蒐集受測者真實五大人格特質的資料與手寫的文本資料,
並利用這些問卷、文本資料結合現成的字詞字典,透過統計的方法分析出了字典 中字詞類別與人格特質之間的相關係數。之後利用了 4 種預測方法,包括線性迴 歸(Linear Regression)、M5 模式樹(M5 Model Tree)、M5 迴歸樹(M5 Regression Tree)、支援向量機(Support Vector Machine Regression)等,針對文本資料來建立 人格特質分數的預測模型。 LIWC(Linguistic Inquiry and Word Count Dictionary)之相關係數字詞分類表中挑 選了 12 個類別字詞來建立一套人格特質文本辨識工具,然後來進行 Twitter 上文 章轉推的行為與五大人格特質的關聯分析以及預測模型的建立。
Golbeck et al. [9]透過蒐集了社群網路上的社交資訊與問卷來進行人格特質 的關聯分析,分析出了在社群網路上的文本資訊中,不同人格特質的人都常用哪 些類別的字詞與不常用哪些類別的字詞,除此之外,還結合了社會網絡的資訊來 進行混搭,透過社群網路上的朋友數(Number of Friends)、自我中心網絡密度 (Egocentric Network Density)、參與活動數(Activities)、喜愛的書籍數(Favorite Books)、是否為單身(Relationship Status)、姓氏長度(Last Name),將這些社群網 路的特徵資訊結合起來與人格特質進行關聯度分析。
Sarkar et al. [19]透過了 Youtube 的人格特質語意資料集(YouTube personality data)使用邏輯迴歸分析(Logistic regression)的方式來建立人格特質的預測模型。
Bachrach et al. [20]透過了 Facebook 社群網路上的社群特徵資訊與問卷來進 行人格特質的關聯度分析。社群特徵資訊有包含了朋友數(number of Facebook friends)、社團數(number of associations with groups)、按讚數(number of Facebook
"likes")、上傳的照片數(number of photos uploaded by user)、發文數(number of status updates by user)、在照片中被別人標記的次數與時間頻率(number of times others “tagged” user in photos)等資訊。
Nunes[21]將人格特質的問卷結合到了推薦系統上而變成基於人格特質的推 薦系統。透過人格特質問卷蒐集多位使用者的人格特質屬性及偏好,之後透過人 格特質的相似度,來將偏好決策推薦給使用者,舉例來說,有很多神經質的人都 買哈利波特這本書,那如果你測出來的人格特質也屬於神經質的話,那就會將哈 利波特這本書推薦給你。此研究還透過了人格特質特徵屬性的多面向分類結合蒐
集不同人格特質的理想總統候選人問卷來分析及根據人格特質來預測使用者在 總統選舉可能會投哪一位候選人為總統。
Roshchina & Cardiff [4]將人格特質文本探勘的方法與推薦系統進行結合,利 用 Mairesse et al. [5]提出的人格特質文本探勘方法之工具結合 KNN 法,建置針 對 TripAdvisor 評論基於人格特質的飯店推薦系統,產生了有別於一般推薦系統 的不同推薦方式。 的偏好輪廓(Preference Profile)是空的,所以推薦系統大多都伴隨著有冷啟始 (Cold Start)的問題,通常都是利用隨機進行推薦的方式來解決這項問題。
2.4.1 基於內容(Content-Based)推薦方法
透過商品的文字內容描述資訊與使用者歷史購買記錄、搜尋商品紀錄、個人 檔案等資訊,來分析尚未被使用者購買過商品彼此之間的關聯屬性及預測出使用 者的偏好,再將適合的商品推薦給使用者,主要是以資料內容為導向來進行推薦 [23]。
2.4.2 協同過濾式(Collaborative Filtering)推薦方法
透過不同使用者之間給予商品評價分數的回饋機制,來將相似使用者進行最 近鄰居法(Nearest Neighbor)的分群預測,最後再將使用者未購買過的商品依據結 果推薦給使用者。
第三章 研究方法