資料來源與處理

第四章實驗結果與評估

第一節資料來源與處理

(一) 塗鴉牆資料庫

要開始進行實驗前必須先收集臉書使用者之塗鴉牆資料以供搜尋，而塗鴉牆的擷取內容關係到本實驗的結果，所以首先必須明確定義本實驗要擷取的範圍。

本實驗設計的人數為十人，所以要取得的塗鴉牆資料來源就設定為此十人為主，

畢竟實驗對象想要得到的搜尋結果必定期望與自己相關。

以下舉某一實驗對象之塗鴉牆內容列表為例，這是他的某一篇訊息內容，詳細資料格式如圖 4.1。資料格式主要為發佈訊息者與按“讚”的人，因此在訊息發佈者的內容中可看到使用者 ID 與發佈該篇文章之編號、使用者帳號名稱、使用者 ID、訊息內容(message)、發佈文章時間、回應訊息以及標註地點。在按“讚”的內容中包括按“讚”的使用者 ID，如圖 4.2。

圖 4.1 一則貼文訊息與其內容

圖 4.2 按讚之資料內容

圖 4.3 為訊息之回應文章內容，在回應之內容中包括回應文章之使用者名稱、回應文章之使用者 ID、回應文章之內容、回應文章之時間與回應文章之按讚數量。

圖 4.3 回應文章之資料內容

圖 4.4 為這篇文章的標註地點內容，包含地點的 ID、地點資訊與經緯度以及地點名稱。

圖 4.4 標記地點之資料內容

透過圖 4.1、圖 4.2、圖 4.3 和圖 4.4 所示，本實驗便可得出影響社會搜尋結果的幾項必要數值。在社會關係計算上，使用作者、按讚、回應和回應的讚來處理，而在地理資訊裡則直接撈出本文章之 ID 與地點經緯度資料。

本研究透過所篩選之 10 位受測者之塗鴉牆中擷取出 2745 則訊息量作為本研究的資料庫集，實驗中受測者直接輸入想要的關鍵字進行搜尋，系統將會由這資料庫集中找出有符合關鍵字之文章，再將這些文章與其作者進行社會關係計算。

而其中有 183 則訊息有標註打卡地點，則先將這 183 個資料點使用第三章提到的 DBSCAN 進行叢聚分析後，再對社會搜尋之結果改變排序。

(二) DBSCAN 叢聚資料集

本次實驗總共得到 183 個 GPS 資料點，由於實驗對象大多數位於高雄的關係，

其中有 114 個點都位於高雄，下列以特別放大高雄的分佈情形來展示，如圖 4.5:

圖 4.5 高雄的打卡資料集

如上圖所示為高雄資料的分佈，然後用分析工具中的 DBSCAN 套件進行分群，由於需要先設定半徑與數量的數值，本實驗再經過反覆設定後獲得一個最佳的分群結果，如圖:

圖 4.6 高雄的打卡資料集(分群後)

由以上可觀察高雄地區可分為八個群聚，其中楠梓區高雄大學為本研究作者在讀的學校，受測者有部分同為這裡的學生。其他有例如蓮池潭、義大與鹽埕等觀光熱門區域，或是三多、巨蛋等人口聚集區域。另外有一個較零散的打卡地點在分群完後屬於雜訊點，意即不屬於任何群聚。

在文檔中睡眠困擾與記憶抱怨關係之研究 (頁 38-41)

第四章 實驗結果與評估

第一節 資料來源與處理

第四章實驗結果與評估

第一節資料來源與處理