• 沒有找到結果。

資料來源與處理

第四章 實驗結果與評估

第一節 資料來源與處理

(一) 塗鴉牆資料庫

要開始進行實驗前必須先收集臉書使用者之塗鴉牆資料以供搜尋,而塗鴉牆 的擷取內容關係到本實驗的結果,所以首先必須明確定義本實驗要擷取的範圍。

本實驗設計的人數為十人,所以要取得的塗鴉牆資料來源就設定為此十人為主,

畢竟實驗對象想要得到的搜尋結果必定期望與自己相關。

以下舉某一實驗對象之塗鴉牆內容列表為例,這是他的某一篇訊息內容,詳細 資料格式如圖 4.1。資料格式主要為發佈訊息者與按“讚”的人,因此在訊息發佈者的 內容中可看到使用者 ID 與發佈該篇文章之編號、使用者帳號名稱、使用者 ID、訊 息內容(message)、發佈文章時間、回應訊息以及標註地點。在按“讚”的內容中包括 按“讚”的使用者 ID,如圖 4.2。

圖 4.1 一則貼文訊息與其內容

圖 4.2 按讚之資料內容

圖 4.3 為訊息之回應文章內容,在回應之內容中包括回應文章之使用者名稱、回 應文章之使用者 ID、回應文章之內容、回應文章之時間與回應文章之按讚數量。

圖 4.3 回應文章之資料內容

圖 4.4 為這篇文章的標註地點內容,包含地點的 ID、地點資訊與經緯度以及 地點名稱。

圖 4.4 標記地點之資料內容

透過圖 4.1、圖 4.2、圖 4.3 和圖 4.4 所示,本實驗便可得出影響社會搜尋結 果的幾項必要數值。在社會關係計算上,使用作者、按讚、回應和回應的讚來處 理,而在地理資訊裡則直接撈出本文章之 ID 與地點經緯度資料。

本研究透過所篩選之 10 位受測者之塗鴉牆中擷取出 2745 則訊息量作為本研 究的資料庫集,實驗中受測者直接輸入想要的關鍵字進行搜尋,系統將會由這資 料庫集中找出有符合關鍵字之文章,再將這些文章與其作者進行社會關係計算。

而其中有 183 則訊息有標註打卡地點,則先將這 183 個資料點使用第三章提到的 DBSCAN 進行叢聚分析後,再對社會搜尋之結果改變排序。

(二) DBSCAN 叢聚資料集

本次實驗總共得到 183 個 GPS 資料點,由於實驗對象大多數位於高雄的關係,

其中有 114 個點都位於高雄,下列以特別放大高雄的分佈情形來展示,如圖 4.5:

圖 4.5 高雄的打卡資料集

如上圖所示為高雄資料的分佈,然後用分析工具中的 DBSCAN 套件進行分 群,由於需要先設定半徑與數量的數值,本實驗再經過反覆設定後獲得一個最佳 的分群結果,如圖:

圖 4.6 高雄的打卡資料集(分群後)

由以上可觀察高雄地區可分為八個群聚,其中楠梓區高雄大學為本研究作者 在讀的學校,受測者有部分同為這裡的學生。其他有例如蓮池潭、義大與鹽埕等 觀光熱門區域,或是三多、巨蛋等人口聚集區域。另外有一個較零散的打卡地點 在分群完後屬於雜訊點,意即不屬於任何群聚。

相關文件