• 沒有找到結果。

第三章 研究方法

第二節 研究範圍與資料抓取

(一)、研究對象及研究範圍

根據第二章的文獻探討,「音樂串流服務」隸屬於《文化創意產業發展法》

明定之十六項文化創意產業類別中的數位內容產業,而其又屬於數位內容產業當 中之數位音樂運用。本研究將「臺灣數位音樂串流服務業」定義為總公司位於臺 灣,且有提供音樂串流服務之公司,並以其主要經營音樂串流服務廠牌之 Facebook 粉絲專頁作為研究對象,根據以上定義,符合其標準的公司為:願境 網訊股份有限公司(KKBOX)、台灣酷樂時代股份有限公司(myMusic)、以及 全音樂股份有限公司(Omusic),而其分別對應的音樂串流 Facebook 粉絲專頁名 稱為:KKBOX、myMusic 線上音樂、和 Omusic,本研究將以此三個粉絲專頁 作為研究對象。

而本研究將以鉅量資料分析取徑進行研究探討,鉅量資料分析的核心在於分 析「全部的資料」或「盡量完整的資料」,即未經抽樣的資料選取過程,因此本 研究將分析自 KKBOX、myMusic 線上音樂、以及 Omusic Facebook 粉絲專頁成 立以來,至今之所有貼文,但礙於研究時程以及受研究之粉絲專頁仍持續經營的 關係,本研究之研究範圍為該音樂串流服務 Facebook 粉絲專頁創立至 2016 年 4 月 28 日之所有專頁貼文、貼文留言、訪客貼文,以及該粉絲專頁所提供之專頁 簡介等資訊,詳細的貼文資料抓取結果詳見本節第三部分之抓取結果概覽。

(二)、資料抓取

本研究使用 Facebook 應用程式 Netvizz v1.25 作為資料抓取的工具。Netvizz 係由阿姆斯特丹大學的媒體研究助理教授 Bernhard Rieder 以協助研究為目的,

進行建立及維護,並持續更新此應用程式(Rieder, 2013),其為一抓取 Facebook 平台中不同類型資料之爬蟲(Crawler)工具,包含五種抓取資料的方式,分別 為:group data、page data、page like network、search、以及 link stats,以下將分

57

別介紹之:

1. group data

group data 功能可抓取「公開社團」中的貼文相關資料,只要輸入所欲抓取 的社團 group_id 及進行相關設定即可,但非公開及隱藏的社團資料無法抓取。

而抓出的檔案格式包含 GDF 檔及 TAB 檔,GDF 檔可供 Gephi 等繪圖軟體 進行資料視覺化的繪製,探討每個用戶間之連結關係為何;TAB 檔則為經過整 理、架構明確之結構化資料,其包括社團貼文內容相關資訊、社團貼文留言內容、

以及社團每日統計資料。

從「社團貼文」中抓取到的欄位包括:type(貼文類型)、post_message(貼 文內容)、link(貼文連結)、post_published(貼文時間)、likes_count_fb(貼文按 讚數-含收回)、comments_count_fb(貼文留言數-含收回)、shares(貼文分享數)、

engagement(貼文之按讚數+留言數+分享數)、post_id(貼文者身分帳號)等項 目(見圖 7);而「社團貼文留言內容」可抓取的項目包含:post_id(貼文者身 分帳號)、post_text(貼文原文)、is_reply(留言是否獲得回覆,以 1、0 表示)、

comment_message(留言內容)、comment_published(留言時間)、

comment_like_count(留言按讚數)等項;「每日統計」的內容則包含每日之貼文 則數(posts)、總按讚數(likes)、總留言數(comments)、及總分享數(shares)。

圖 8:以 Netvizz 程式中之 group data 功能抓取到的社團貼文內容(範例)

資料來源:本研究整理

58

2. page data

page data 功能與 group data 功能相似,只是其資料抓取的對象由「公開社團」

變更為「粉絲專頁」,只要輸入所欲抓取之粉絲專頁 pageid 和相關設定即可進行 抓取,而此功能可進行兩種設定,分別為「是否要抓取貼文之留言內容」以及「是 否要抓取訪客的貼文內容」。本研究將透過此項功能,抓取所欲分析之粉絲專頁 貼文資料。

另外,Facebook 於 2016 年二月針對貼文內容,推出除了「讚(Like)」之外 的五種表情符號,分別為:「大心(Love)」、「哈(Haha)」、「哇(Wow)」、「嗚

(Sad)」以及「怒(Angry)」,用戶可以依據自己對貼文內容產生的情緒,給予 其不同之意見反饋。而 Netvizz 在 2016 年五月更新至 v1.3 版後,同樣能夠抓取 這些不同的意見點擊,然而本研究之研究範圍為粉絲專頁創立至 2016 年 4 月 28 日間的所有貼文內容,此時 Netvizz 尚未擁有抓取其他表情符號之功能,且其功 能實裝時間尚短,無法收集足夠的樣本進行分析,因此本研究之互動量測量仍以 按「讚(Like)」數為主。

圖 9:Netvizz 程式之 page data 功能抓取介面 資料來源:本研究整理

59

3. page like network

page like network 功能可以觀察出某 Facebook 粉絲專頁按過什麼其他的粉絲 專頁「讚(like)」,而這些被「讚」的專頁又按了哪些人的「讚」,此行為最多可 探索到第二層,在深度(depth)的地方填寫 2 即可,但若是要選擇探索兩層,

資料的抓取速度可能會變得較長。另外,此功能的抓取結果只會以 GDF 檔的方 式呈現,以視覺化的方式呈現專頁與專頁間之關係為何。

圖 10:Netvizz 程式之 page like network 功能抓取介面 資料來源:本研究整理

4. search

search 功能即為抓取透過 Facebook 平台中之搜尋引擎可以獲得之搜尋結果 相關資料,包含搜尋結果之名稱、簡介、連結等資訊。

此功能可選擇欲抓取之搜尋對象的類別為何,包括:粉絲專頁(page)、社 團(group)、地點(place)以及活動(event),輸入關鍵字後,即會顯示所有包 含此關鍵字之結果,但此搜尋只會列出前 1000 筆資料。而此功能之抓取結果只 會以結構化資料形式的 TAB 檔呈現。

60

圖 11:Netvizz 程式之 search 功能抓取介面 資料來源:本研究整理

5. link stats

link stats 功能可以搜索到某超連結(網址)在 Facebook 的分享次數為何,

藉以判斷 Facebook 與外部網站之互動關係,但由於 Facebook 的隱私權政策更動,

此功能只能抓到 2015 年 4 月 30 日以前之資料。

圖 12:Netvizz 程式之 link stats 功能抓取介面 資料來源:本研究整理

61

(三)、抓取結果概覽

根據以上對研究對象和研究範圍之定義,以及資料抓取方式的介紹,本研究 透過 Facebook 應用程式 Netvizz v1.25 的 page data 功能對 KKBOX、myMusic 線 上音樂、和 Omusic 三個粉絲專頁進行資料抓取,抓取範圍為該粉絲專頁第一則 貼文的日期至 2016 年 4 月 28 日之所有貼文內容,共計抓取 12,388 則專頁貼文、

215,309 則貼文留言,以及 4,232 則訪客貼文,詳細的抓取結果詳見表 16。

其中,myMusic 線上音樂的第一則貼文日期為三家廠商中最早,為 2012 年 1 月 1 日,而 KKBOX 則為最晚,為 2013 年 8 月 19 日,但貼文則數以 KKBOX 的 6,171 則為最多,其次為 myMusic 線上音樂之 4,259 則;另外,由於 myMusic 線上音樂並未開放訪客留言之權限,因此其訪客貼文則數為 0,而 Omusic 雖然 有開放其權限,但其訪客貼文則數也為 0,可以推測 Omusic 之 Facebook 粉絲專 頁可能會定期刪除訪客之留言,或是其與訪客之互動量本身即較為低落。

表 16:本研究之研究對象基本資料及研究範圍

粉絲專頁

第一則貼文日期

共計抓取 專頁貼文

則數

共計抓取 訪客貼文

則數

共計抓取 訪客留言數

粉絲專頁總讚數

(截至 2016.04.29)

KKBOX 2013 年 8 月 19 日 6,171 則 4,232 則 117,402 則 1,048,046 myMusic

線上音樂 2012 年 1 月 1 日 4,259 則 0 則 85,525 則 101,213 Omusic 2012 年 1 月 11 日 1,958 則 0 則 12,382 則 56,600

資料來源:本研究整理

62