4.3 演算法與使用者介面的詳細操作流程
4.3.2 粉絲團影響力成績
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
4.3.1 關鍵字搜尋
我們將維基百科的資料結合 Facebook 粉絲團資料集,並透過 Word2Vec 學習出模型。
當使用者使用關鍵字搜尋粉絲團時,透過此模型,我們將與此關鍵字在模型向量空間 中相似度較高的字詞進行推薦;若是關鍵字的組合,則是分別放入模型向量空間中並 將各別抽出高相似度字詞的相似度成績加總,最終推薦出相似度前 6 名的關鍵字。當 使用者點選我們所選推薦的關鍵字,也會載入搜索中使得關鍵字的組合有了變化,我 們所推薦的字詞也不盡相同,例子請見圖 16。
圖 16 關鍵字組合變化使得系統所推薦的關鍵字不盡相同
4.3.2 粉絲團影響力成績
透過包含關鍵字的粉絲團文章內容,並結合每則文章的按讚數、評論數、分享數依 1 倍、7 倍、14 倍的權重加總,並平均來當作粉絲團的影響力成績,了解粉絲團對於關 鍵字影響力的大小。我們將平均影響力前 10 名的粉絲團顯示在介面上(見圖 17),透 過若點選粉絲團名稱將會進入下一步的操作。我們將各關鍵字的前 10 名的粉絲團出現 次數進行統計 (見圖 18),並以文字雲的形式來顯示粉絲團的統計次數,透過文字雲大 小,讓使用者初步判斷自己所搜尋的關鍵字是否是相關連或是各自獨立。點選文字則 會進入下一步的操作,顯示與組合關鍵字有關的文章細節,並進一步了解關鍵字的組 合是否符合所行銷的商品。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
此介面是透過使用一個 Javascript 所編寫的圖表庫套件 Highcharts [30]。它是ㄧ套 免費的開源軟體,提供個人學習、個人網站以及非商業用途上使用,能夠在簡單便捷 的在網站中添加有互動性的圖表,並且支援所有的主流瀏覽器和行動裝置。在此介面 中我們所使用到 Highcharts 的圖表類型有極座標圖(Polar chart)以及文字雲(Word cloud)兩部分。
圖 17 與關鍵字相關前 10 名粉絲團的極座標圖
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 18 各關鍵字前 10 名的粉絲團統計次數的文字雲圖 4.3.3 PageRank 網路圖
我們透過整個資料集內留言者的共同性做成類似 PageRank 的評分,顯示粉絲團間的 網路圖。透過點選節點可進一步觀看粉絲團的原始文章,介面如圖 19。透過前一步的 關鍵字搜索,我們可確認符合商品的關鍵字,透過這些關鍵字篩選出相關粉絲團。當 關鍵字愈多,所篩選出的粉絲團將越少。在介面中,因節點和節點間的連結十分多,
所以透過 edge filter(編號 1)的篩選,篩選出共同留言者較多的連結,使得使用者能 更加快速地瞭解粉絲團之間的關係。在 edge filter 的部分,初始值會以關鍵字篩選完後 關聯權重(共同留言者個數)的前 5%連結做為顯示,而使用者能輸入的數字最小值則 為此次篩選關聯權重的中位數,最大值則為此次篩選的最大關聯權重。網絡圖(編號 2),則是透過資料視覺化的方式將網絡圖作呈現,將符合使用者所搜尋的關鍵字以聯 集方式搜尋粉絲團,詳細的搜尋方法將在下方來做說明。當使用者將滑鼠移至網路圖 的關聯,將會顯示有多少個共同留言者(見圖 20);每個節點下方則顯示粉絲團名稱與 PageRank 值,節點大小也會因 PageRank 值而有所差異,範例見圖 20。編號 3 為資料 匯出,上方的藍色按鈕為使用者觀看過的粉絲團,透過點選來做取消,而下方的
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
「GET CSV」則下載上方未被刪除的粉絲團的每月的平均留言數、平均按讚數、平均 分享數、文章數。
在此頁面透過使用者所搜索的關鍵字,篩選出符合的粉絲團,透過網路圖的共同 留言者以及 PageRank 的大小讓使用者能探索到更多的粉絲團,也了解粉絲團和粉絲團 的關連。介面的部分我們透過基於 Javascript 所編寫的開源套件 Vis.js [31],此套件能 處理大量的動態數據,並與這些數據進行交互操作。本系統是透過該套件所提供的網 絡圖(Network)來進行顯示。PageRank 的數值運算部分我們則是使用 Networkx [32],它是用 Python 語言所開發的圖論與複雜網路建模的工具,內建常用的圖與複雜 的網路分析演算法,可以方便的進行複雜的網路資料分析、建模等工作。
圖 19 PageRank 網絡圖的系統介面圖
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 20 PageRank 網絡圖中邊上所顯示的共同使用著數量
節點篩選:假設我們的關鍵字集合為V = {𝑤1, 𝑤2, … … , 𝑤𝑁},使用者所搜尋的關鍵 字為 q = 𝑞1, 𝑞2, … … 𝑞𝑚且𝑞𝑖 ∈ 𝑉,粉絲團的集合為P={𝑝1, 𝑝2… … , 𝑝𝑘},各粉絲團的關鍵 字𝑝𝑖 = 𝑝𝑖1, 𝑝𝑖2, … … , 𝑝𝑖𝑚且𝑝𝑖𝑗 ∈ 𝑉,我們所篩選出粉絲團的集合為R(P)且 R(P)⊆ P。所 使用的方程是如下:
R(P)={p ∈ P | f(p, q) = 1}
f(p, q) { 1 當使用者所搜索的關鍵字都有出現在粉絲團的關鍵字中 0 使用者所搜索的關鍵字並非全部出現在粉絲團的關鍵字中 所以透過使用者所搜索的關鍵字越多、越精準,能篩選出的粉絲團越少,但也越能篩 選出符合使用者需求的粉絲團。
4.3.4 粉絲團與關鍵字相關的文章細節:
透過前一步驟我們所點選的粉絲團,進一步的探索與關鍵字相關連的文章內容。
介面如圖 21,透過時間軸顯示篩選過後的平均留言數、平均按讚數、平均分享數、文 章數(編號 1),透過點選時間軸上的時間,能進一步的限縮資料集至點選的時間內,
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
如點選月份則資料統計將限縮至點選的月份,若再進一步點選則會篩選至當日的資 訊,並且下方所顯示實際文章內容以及各文章基本屬性(編號 8)也會跟著限縮至時間 內。透過下面的 download timeline data(編號 2)可下載時間軸上的統計資料。此部分 是透過改寫 Highcharts [30]圖表類型中的折線圖(Line chart)來做顯示;透過「Only Post」的按鈕能篩選出類別屬於貼文(post)的文章(編號 3)﹔透過前一部分所選定 的關鍵字可產出個別關鍵字的按鈕,來進行個別關鍵字的篩選(編號 4);在搜尋欄上
(編號 5)進行進一步的篩選,將產生出個別關鍵字的按鈕來進行個別關鍵字篩選(編 號 7),也可以透過「Reset」按扭來清除進一步篩選的關鍵字;顯示出此粉絲團的資 料量以及目前與關鍵字相關連的文章數量(編號 6),讓使用者了解相關關鍵字佔此粉 絲團文章的比例;顯示出實際文章內容以及各文章基本屬性(編號 8)。透過各文章左 上角 Facebook 的圖標,可導引使用者至原始 Facebook 的頁面,讓使用者能進一步的 觀察貼文內容。透過這個介面,使用者可進一步了解粉絲團與關鍵字的關係,也能了 解與商品相關的關鍵字有哪些。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 21 粉絲團與關鍵字相關文章細節的系統介面圖
4.4 操作實例
4.4.1 以壽司為例
1. 若我們想要行銷壽司,並認為需要用海苔做搭配,因此在搜尋欄位上打「壽司 海 苔」。
圖 22 在搜尋欄位上打「壽司 海苔」
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
2. 從系統所推薦的延伸關鍵字中點選「蓋飯」。
圖 23 點選系統所推薦的關鍵字「蓋飯」
3.分別點擊各關鍵字極座標影響力第一名的粉絲團。
圖 24 點擊各關鍵字極座標影響力第一名的粉絲團
4. 從粉絲團與關鍵字相關的文章細節,發現雖然 Amy の私人廚房在蓋飯的影響力很 高,但卻只有 1 篇有提到蓋飯;iCook 愛料理則是在提到壽司的篇數有 10 篇;MASA の料理 ABC 則提到海苔的只有 2 篇。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 25 從粉絲團與關鍵字相關的文章細節
5. 透過觀察 iCook 愛料理中文章的詳細細節,發現問文章中很常把「野餐」與壽司 做搭配,且在文章中也曾出現過「在家」的詞彙,因此我們點選「Only Post」,使得 我們所挑選出相關的文章都是 iCook 愛料理所發的貼文,而非貼文下方的留言;接著 在進階篩選的部分打上「野餐 在家」。
圖 26 點選 Only Post 並在進階篩選處打「野餐 在家」
6. 透過進階篩選,可以發現壽司很常在此粉絲團與野餐做搭配,而相對野餐的在 家,也可做為我們的行銷壽司的關鍵字。
圖 27 透過進接篩選了解其他與商品相關的關鍵字
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
7. 透過各關鍵字前 10 名的粉絲團統計次數的文字雲圖,及文字雲中文字的大小,因 此了解到我們所搜尋的關鍵字並非各自獨立,而是有相關連的。在粉絲團統計次數的 文字雲圖,除了 iCook 愛料理統計次數為 3 次外 Wow 愛美食、虎麗笑嗨嗨、葉怡蘭 Yilan 統計次數也到 2 次
圖 28 透過關鍵字前 10 名的粉絲團統計次數的文字雲圖了解搜尋關鍵字間的關係以及 尋找適合的粉絲團
8. 透過粉絲團與關鍵字相關的文章細節了解到 Wow 愛美食只發過 2 篇與蓋飯、壽 司、海苔有關的文章,另外兩個粉絲團則有超過 10 篇以上。
圖 29 關鍵字前 10 名的粉絲團統計次數的文字雲圖來了解粉絲團與綜合關鍵字的關係
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
9. 透過點選時間軸來限縮時間來了解為何數值會上升,是否有透過一些特殊的活動 來衝高數值。在觀察虎麗笑嗨嗨以及葉怡蘭 Yilan 粉絲團的詳細貼文後,了解到虎麗 笑嗨嗨有透過留言來贈送產品的經營方式。
圖 30 虎麗笑嗨嗨有透過留言來贈送產品的經營方式
10. 透過 PageRank 網路圖篩選出曾在粉絲團中提到蓋飯、壽司、海苔,發現到「跟 著尼力吃喝玩樂&親子生活」的 pageRank 的數值較高,以及與他有 35 位共同留言者 的「小布少爺 生活 親子 旅遊誌」,兩者都是在經營與親子生活相關的粉絲團。
圖 31 透過 PageRank 網絡圖來了解哪些粉絲團在宣傳食物的粉絲團中重要性較高,以 及了解哪些粉絲團可能有相近的特色
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
11. 最終我們透過系統的輔助找出適合宣傳「壽司」的關鍵字有海苔、蓋飯、野餐、
在家;適合做此商品宣傳的粉絲團有「葉怡蘭 Yilan」、「跟著尼力吃喝玩樂&親子生 活」,若我們是做日式料理的店家,則還會加入「虎麗笑嗨嗨」舉辦抽獎活動,來打 響知名度,而未加入 iCook 愛料理則是因為他適食譜平台大多為食譜,對於宣傳壽司
在家;適合做此商品宣傳的粉絲團有「葉怡蘭 Yilan」、「跟著尼力吃喝玩樂&親子生 活」,若我們是做日式料理的店家,則還會加入「虎麗笑嗨嗨」舉辦抽獎活動,來打 響知名度,而未加入 iCook 愛料理則是因為他適食譜平台大多為食譜,對於宣傳壽司