• 沒有找到結果。

Facebook社群人脈網絡與粉絲頁推薦之研究 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "Facebook社群人脈網絡與粉絲頁推薦之研究 - 政大學術集成"

Copied!
78
0
0

加載中.... (立即查看全文)

全文

‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. I. 國立政治大學資訊管理學系. 碩士學位論文. 指導教授:楊建民 博士. Facebook 社群人脈網絡與粉絲頁推薦之研究. The Study of Recommendation on Social. Connections and Fan Pages on Facebook. 研究生:曾子洋. 中華民國 102 年 7 月. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. II. 誌謝. 首先誠摯的感謝指導教授楊建民博士,老師悉心的教導讓我得以一窺資訊管. 理領域的深奧,不時的討論並指點我正確的方向,使我在這兩年中獲益匪淺。老. 師對學問的嚴謹與對人脈關係的重視更是我輩學習的典範。也感謝劉文卿、邱光. 輝與季延平老師給予的意見讓本研究更有品質。. 兩年的日子裡,研究室裡共同的生活點滴,學術上的討論、言不及義的閒扯、. 讓人又愛又怕的宵夜、熬夜睡研究室看論文的革命情感,偶爾還會因為睡太晚而. 遮遮掩掩閃進研究室……,感謝眾位學長姐、同學如陳楷、柏崴的共同砥礪(墮. 落?)、育賢的英文摘要修改和凱智的……,你/妳們的陪伴讓兩年的研究生活變. 得絢麗多彩、肥胖有餘。也感謝同研究室的偉志、珀豪、伯辰、智勝和弘業同學. 與我相輔相成,恭喜我們順利走過這兩年。函升、良杰學弟們當然也不能忘記,. 跟你們在研究室一起奮鬥及搞笑我銘感在心。. 另外亦得感謝春美學姐在打工閒聊之時,給予許多學術上的建議與協助;研. 究室助理悅岑姊在旁幫忙聯絡老師及處理業務,因為有妳們的幫忙,讓本來混亂. 複雜的課業與行政流程的問題明朗許多;桌球隊的隊員們特別是隊長高瑋讓我在. 學業之外多了個棲身之處,共同比賽的回憶長存我心。. 最後,謹以此文獻給我摯愛的雙親與家人。. . ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. III. 目錄. 第一章、緒論 ..................................................................................................................................................... 1. 第一節、研究背景與動機 ........................................................................................................................ 1. 第二節、研究目的 ....................................................................................................................................... 2. 第二章、文獻探討 ........................................................................................................................................... 3. 第一節、推薦系統 ....................................................................................................................................... 3. 2.1.1 何謂推薦系統 ................................................................................................................................. 3. 2.1.2 本研究推薦機制 ............................................................................................................................ 6. 第二節、社群網站 (Social Network) ................................................................................................... 7. 2.2.1 虛擬社群 (Virtual Community) ............................................................................................... 7. 2.2.2 社群網站-Facebook ................................................................................................................... 10. 第三節、本研究應用技術 ..................................................................................................................... 12. 2.3.1 Facebook 平台技術 ................................................................................................................... 12. 2.3.2 Facebook API ............................................................................................................................... 13. 2.3.3 Google AJAX Search API ....................................................................................................... 15. 第四節、Kmeans 分群演算法 .............................................................................................................. 16. 第三章、研究設計與方法 .......................................................................................................................... 19. 第一節、研究架構與流程 ..................................................................................................................... 19. 第二節、研究程序說明 .......................................................................................................................... 20. 3.2.1 蒐集資料 ....................................................................................................................................... 20. 3.2.2 資料整理 ....................................................................................................................................... 21. 3.2.3 現有使用者分群 ......................................................................................................................... 24. 3.2.4 產生推薦 ...................................................................................................................................... 25. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. IV. 第四章、實驗與研究結果分析 ................................................................................................................ 27. 第一節、實驗資料介紹 .......................................................................................................................... 27. 第二節、系統展示與實驗操作結果 .................................................................................................. 29. 4.2.1 系統展示 ...................................................................................................................................... 29. 4.2.2 實驗操作結果 ............................................................................................................................ 32. 第三節、結果分析 .................................................................................................................................... 35. 第五章、結論與未來研究方向 ................................................................................................................ 43. 第一節、結論與建議 ............................................................................................................................... 43. 第二節、未來研究方向 .......................................................................................................................... 43. 第六章、參考文獻 ........................................................................................................................................ 45. 附錄 ..................................................................................................................................................................... 49. 附錄一、SuperhiPage中華黃頁網路電話簿中分類 ................................................................. 49. 附錄二、完整分群結果表 ..................................................................................................................... 55. . ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. V. 圖目錄. 圖 1-1、台灣著名社群網站 2011 年 6 月回訪衡量 ............................................................. 1. 圖 2-1、本研究推薦機制說明圖 ................................................................................................ 6. 圖 2-2、social graph ...................................................................................................................... 14. 圖 3-1、本研究之研究架構與流程 ........................................................................................ 19. 圖 3-2、本研究設計的 Google AJAX Search API 程式搜尋「生活牙醫診所」結果. .................................................................................................................................................... 22. 圖 3-3、本研究設計的 Google AJAX Search API 程式擷取「生活牙醫診所」之類. 型資訊 ...................................................................................................................................... 23. 圖 3-4、本研究使用者分群之群組示意圖 .......................................................................... 24. 圖 3-5 本研究實驗組與對照組設計示意圖 ........................................................................ 26. 圖 4-1、授權視窗跳出示意圖 .................................................................................................. 30. 圖 4-2、阻擋視窗跳出示意圖 .................................................................................................. 30. 圖 4-3、使用者對系統評分範例 ............................................................................................. 31. 圖 4-4、本系統推薦人脈範例 .................................................................................................. 32. 圖 4-5、使用者 A 粉絲頁推薦結果 ....................................................................................... 37. 圖 4-6、使用者 A 人脈推薦結果 ............................................................................................ 37. 圖 4-7、使用者 B 粉絲頁推薦結果 ........................................................................................ 40. . . ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. VI. 表目錄. 表 2-1、以資料使用方式與消費者使用服務角度之推薦機制的對應結果 .............. 6. 表 3-1、經整理後 Facebook 的粉絲頁類型 ....................................................................... 21. 表 3-2、工作經歷存入資料庫後的資料格式 .................................................................... 23. 表 4-1、本研究實驗中使用者的教育程度 ......................................................................... 27. 表 4-2、本研究實驗中使用者的工作類型 ......................................................................... 27. 表 4-3、使用者喜好的粉絲頁類型分布 ............................................................................... 28. 表 4-4 各群分組後的主要屬性概述 ...................................................................................... 32. 表 4-5 本研究各屬性 ANOVA 變異數分析表 .................................................................... 34. 表 4-6 使用者 A 喜好的粉絲頁類型比例表 ....................................................................... 35. 表 4-7 使用者 A 與群集 4 和母體的平均類型喜好之主要前五差距 ....................... 36. 表 4-8 使用者 B 喜好的粉絲頁類型比例表 ....................................................................... 38. 表 4-9 使用者 B 與群集 3 和母體的平均類型喜好之主要前五差距 ....................... 39. 表 4-10 本研究實驗中使用者回饋的樣本 .......................................................................... 41. 表 4-11 本研究中實驗組與對照組之樣本數、平均和標準差 .................................... 42. . ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. VII. 摘要. Facebook 自從在台灣推出以來,已有超過一千三百萬的使用者帳號,是最. 熱門的社群網站,其中蘊含了龐大的使用者資料。從使用者學歷、工作經歷和喜. 歡的粉絲頁中可以一定程度上地判斷出使用者的背景與喜好,若能利用分析過的. 資訊將使用者分群,以供交友或導向到可能喜歡的粉絲頁,就能開發潛在客戶進. 而掌握商機。. 本研究旨在完成一個線上系統,透過 Facebook 上可供擷取個人的資料:學. 歷、工作經歷以及喜歡的粉絲頁等資訊,針對這些量化過的資訊,經 Kmeans 將. 使用者分群分類,藉以作為協同過濾式推薦。目前實驗結果將有效個人資料 4417. 筆進行分群,以使用者喜歡的粉絲頁比例(本研究整合成 48 種)加上工作經歷與. 學歷,最終分成 10 群,以作為交叉推薦之憑據和延伸研究。研究過程分實驗組. 與對照組,實驗組是本研究推薦的 10 筆粉絲頁,也就是使用者與所屬群集質心. 比例相差較多的粉絲頁類型;對照組則是選取使用者與母體中有較多比例差距的. 10 筆,以證明本研究的推薦模型有效。. 最後由使用者針對兩組推薦結果進行滿意度評分之比較,總共收回使用者回. 饋 68 筆,實驗組與對照組的平均推薦滿意度分數分別為 0.5743、0.4268,對兩. 者作信心水準為 95%的 t 檢定,結果為有充分證據支持實驗組大於對照組,可證. 明本研究對於推薦準確性的幫助,達成本研究目的。. 由此實驗可以確定在 Facebook 上以使用者屬性為基礎的粉絲頁與人脈推薦. 是有意義與價值的,也說明真實數據能應用在社群網站的研究。希冀本研究的結. 果能帶動其他社群網站研究朝使用真實數據去分析佐證,讓社群網站的研究結果. 能更貼近使用者的真實行為。. 關鍵字:社群網站、Facebook、Kmeans、粉絲頁、推薦. . ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. VIII. Abstract. Facebook is one of the most popular social websites in Taiwan, and it has over 13. million accounts with lots of user data. One can tell a user’s background and. preference by his education, work experience, and preferred fan pages. If we direct. the right user to the right fan pages by analyzing information and clustering users. through recommendation or personal connections, we will be able to reach potential. customers and to further business opportunities. . The goal of this study is to complete an online system to assume collaborative fan. page recommendation. Base on users’ education degree, work experience and. preferred fan pages, users’ background. Then use the Kmeans algorithm to cluster. quantified personal information to recommend fan pages and social relationships.. Currently, the result of the experiment shows 10 clusters, which contain 4417 users,. and we use it as a foundation of crossing recommendation. To prove the effect of this. study, we divide study into two groups, an experimental group and control group. The. former one represents recommended top 10 fan pages that include the fan page types. with highest difference of percentage between user’s attributes and cluster centroid;. the latter one represents top 10 fan pages that include the fan page types with highest. difference of percentage between users’ attributes and proportion respectively.. Finally, we use users score satisfaction for each group to compare. There are 68. pieces of feedback, and the average satisfaction scores of the experimental group and. the control group are 0.5743 and 0.4268, respectively. On both a confidence level of. 95% for t-test, the result shows there is more sufficient evidence to support the. satisfaction of experimental group than the control group. We can prove accuracy for. recommendation to achieve the goal in this study.. This experiment determines not only the fan page recommendation based on user. attributes on Facebook is meaningful and valuable, but also shows real data can be. used in social networking studies. We hope the results of this study can lead other. social networking studies to analyze with real users’ data in order to make future. study on social networking better reflect real users’ behavior.. Key words: social website, Facebook, fan page, Kmeans, recommendation. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 1. 第一章、緒論. 第一節、研究背景與動機. 由於網際網路的發展和手持裝置的普及,社群網站無時無刻都充斥在使. 用者身邊,仿佛一個虛擬化的社會。為了讓線上的大眾能快速瞭解自己的背. 景,許多使用者紛紛在社群網站上放置自身的個人資料,如性別、居住地、. 學歷還有工作經歷,都是使用者希望與社群大眾建立連結的媒介。. Facebook 自推出以來,一年內便成為全世界最大的社群網站,且從此. 盤踞在龍頭的地位,其註冊使用者帳戶在台灣已超過一千三百萬。Facebook. 中許多功能(如即時通、塗鴉牆和通知)所帶來的即時互動性(Dwyer, Hiltz, &. Passerini, 2007),免費使用更是讓使用者長時間使用它的主要原因。總的來. 說,具有交友、搜尋與娛樂等綜合功能的 Facebook 深深地影響了現代人的. 生活,Facebook 已成為許多人的生活中密切相連無法分開的社群網站了。. 圖 1-1、台灣著名社群網站 2011 年 6 月回訪衡量,資料來源:數位時代. 由上圖可得知台灣社群網站回訪率中,Facebook 是最高的,又因為. Facebook 的使用者是如此的密集,連結能力是如此的強大,許多原本不相. 關或關係變得非常薄弱的使用者間的連結,透過在 Facebook 登記的資料重. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 2. 新建立起來或強化。而隨著在 Facebook 上建立的連結越來越多,網路外部. 性的效果也就越來越明顯。. 上述的優點以及 Facebook 對使用者極致的吸引力,不論是實體抑或是. 虛擬商店,皆看上 Facebook 中粉絲頁的功能與眾多使用者所帶來的商機,. 並紛紛投入資源於其中,就是希望用最低廉的廣告費用獲取最多消費者的青. 睞。因此,若能將正確的使用者導引到正確的粉絲頁上,對這些在 Facebook. 上投入資源的商家和眾多希望在 Facebook 網站上逗留同時,也能獲得商品. 最新資訊的使用者來說,必定是一大助力。. 第二節、研究目的. 本研究致力於研發一套線上應用程式,藉由目前知名社群網站 Facebook. 所提供的 Facebook API 技術套件,去快速獲取當前使用者與其朋友的各類. 資料,如學歷、工作經歷和喜歡的粉絲頁類型等。學歷部分透過本研究整理. 分析後所建立的資料庫,而工作部分則經由從中華電信的工商黃頁擷取處理. 過的資料,建立成所需的資料庫比對類型,分類處理的項目包括工作的類型、. 學歷的等級、名稱和喜歡的粉絲頁類型比例等。. 最後將使用者利用 Kmeans 依喜好粉絲頁類型所占比例、工作經驗與學. 歷分群,針對同類的群集使用者,推薦分享粉絲頁或可能的同好者。. 茲將本研究目的敘述如下:. (一) 蒐集 Facebook 上的資料,建立推薦模型所需的資料庫。. (二) 發展一套適合作為 Facebook 使用者分類分群的機制。. (三) 推薦 Facebook 上使用者可能喜歡的粉絲頁並指出群集裡真實人脈網絡. 的連結。. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 3. 第二章、文獻探討. 本研究主要是在探討以社群網站 Facebook 所提供的平台技術建立應用程式,. 旨在將使用者分群分類進而作為人脈和粉絲頁推薦的跳板,固本章從本研究的推. 薦機制描述起,其次介紹建立起社群網站的基本概念,如虛擬社群和目前. Facebook 的商業模式,描述為何要在 Facebook 上推薦粉絲頁。. 接下來是平台技術,特別是本研究的重點Facebook API。其中Facebook Social. Graph 串起了整個 Facebook 的資料,讓各種資訊在 Facebook 裡連結貫通,形成. 交錯複雜的資訊網,讓本研究的資料能被快速且規律的被擷取下來。. 最後敘述在工作類型分類上第一次分類時所使用的 Google Search API,以及. 分群時所需的 Kmeans 分群演算法,也提到使用 Kmeans 遇到的問題以及本研究. 使用的解決方法。. 第一節、推薦系統. 2.1.1 何謂推薦系統. (張筱可,2012)建立推薦系統的目的就是為了從大量資訊中找出使. 用者最可能感興趣的部份,減少使用者主動搜尋的所耗費的機會成本,. 或者是增加使用者接觸可能感興趣商品的機會。推薦系統目前已廣泛運. 用在各種以行銷策略與電子商務為主的網站,利用有效的推薦機制來搜. 尋資訊,不但可以節省使用者的搜尋時間,在商業層面上,更能為企業. 帶來更多的顧客,提升顧客忠誠度,進而增加企業的收益。. 運用在電子商務的推薦系統,對於電子商務有三大助益(Schafer,. Konstan, & Riedi, 1999):. (一) 將瀏覽者變成購買者(Browsers into Buyers). http://www.airitilibrary.com/searchresult_1.aspx?Search=true&Condation=2%04%22%e5%bc%b5%e7%ad%b1%e5%8f%af%22%020. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 4. 使用者在網站上通常只是快速地瀏覽網頁內容,而不會主動購買商. 品,利用推薦系統可以達到適時地推薦使用者感興趣的產品及服務,引. 發使用者的購買慾望,使瀏覽者成為購買者。. (二) 交叉銷售(Cross-Sell). 透過推薦系統對使用者提供已購買商品以外的產品建議,來產生交. 叉銷售的效益,如果推薦的產品符合顧客需求,則平均的交易量就會被. 提昇。. (三) 提高忠誠度(Loyalty). 若能利用推薦系統提供使用者所需要的資訊,則會提高使用者再度. 到訪網站的機率,藉此可改善企業與消費者的關係,同時提高商品被購. 買率。. 本研究希望能運用上述(一)和(二)的優點,推薦系統將潛在的使用. 者,導向到可能喜歡的粉絲頁。. ReadWrite/Web 的專欄作者Alex Iksold 在2007年初發表的 The Art,. Science and Business of Recommendation Enginesn Engines 裡,相較於學. 術界以使用資料的方式 Alex Iksold 以消費者使用服務的觀察角度,將. 推薦系統分為四類:「個人化推薦」(Personalized Recommendation)、「社. 會化推薦」 (Social Recommendation ) 、「商品導向推薦」 (Item. Recommendation)以及綜合前述三種技術的「綜合推薦」(Combination. Recommendation)。這種分類方式,和學術界以使用資料使用方式分成. 三類:「內容導向推薦」(Content-Based Filtering)、「協同過濾式推薦」. (Collaborative Filtering)和「混和推薦」互相對應,下面分別對 Alex Iksold. 分成的四類推薦方式和學術界的三種模式作對應與介紹。. (一) 個人化推薦(Personalized Recommendation). http://www.readwriteweb.com/about_alex.php http://www.readwriteweb.com/archives/recommendation_engines.php http://www.readwriteweb.com/archives/recommendation_engines.php http://www.readwriteweb.com/archives/recommendation_engines.php http://www.readwriteweb.com/about_alex.php http://www.readwriteweb.com/about_alex.php http://www.readwriteweb.com/about_alex.php. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 5. 針對使用者過去在平台上留下的資訊和行為,例如:個人資料、瀏. 覽、購買、留言紀錄等去推斷使用者可能喜歡的商品。. 優點:容易推薦到使用者喜歡的新商品。. 缺點:推薦商品的類型可能過於狹隘。. (二) 社會化推薦(Social Recommendation ). 利用所有使用者過去在平台上留下的資訊和行為進行分群分類後,. 將類型相同或相近的其他使用者所喜歡的商品推薦給該使用者。. 優點:可以獲得類型較廣泛,且評價也不錯的熱門商品資訊。. 缺點:新推出商品無法馬上被記入推薦清單中,分類方式若不準確. 則可能推薦給使用者不感興趣的商品。. (三) 商品導向推薦(Item Recommendation). 此種推薦方式偏向從使用者已購買商品的屬性,例如:價錢、類型、. 外觀和名稱去推薦可能的商品給使用者。. 優點:與使用者有興趣之商品有絕對關係。. 缺點:若為長期使用商品,如電視、冰箱等家電,則推薦效果不彰。. (四) 綜合推薦(Combination Recommendation). 綜合以上三種推薦方式所制定的推薦機制. 下面整理的表格,是學術界針對資料使用方式分出的三類推薦機制. 與 Alex Iksold 針對消費者使用服務的觀察角度推薦機制的對應結果。. . http://www.readwriteweb.com/about_alex.php. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 6. 表 2-1、以資料使用方式與消費者使用服務角度之推薦機制的對應結果. 角度 資料使用方式 消費者使用服務. 對 內容導向(使用者) 個人化推薦. 應 協同過濾式 社會化推薦. 內容導向(商品) 商品導向推薦. 資料來源:本研究整理. 從上表可以看出,兩者分類方式其實只有商品導向推薦是以商品內. 容的角度去做推薦較為特別,其他分類只有名稱上的不同,我們可以說. 以消費者使用服務為角度的分類名稱比較直覺,但也提供了研究者新的. 觀點去探討推薦機制的其他可能性。. 2.1.2 本研究推薦機制. 本研究旨在利用現有的各種屬性資料將現有使用者分群,再以分群. 結果將新進使用者分類,之後針對使用者所屬群集做推薦,故偏向使用. 社會化推薦。社會化推薦有推薦新資訊的能力,可以發現內容上完全不. 相似的資訊,使用者對推薦資訊的內容可能是事先是預料不到的,可以發. 現使用者潛在的興趣偏好,下圖是本研究推薦機制說明圖。. 圖 2-1、本研究推薦機制說明圖,資料來源:本研究整理. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 7. 第二節、社群網站 (Social Network). 2.2.1 虛擬社群 (Virtual Community). 我們如果把現實社會看成是一個網絡,在社會網絡中,每一個人都. 代表一個節點,有著自己的屬性,外在像是身高、體重和學歷;內在如. 宗教信仰等,以及與其它節點的關係,而這些關係讓節點與節點間環環. 相扣,讓資訊可藉由連結流通傳遞。. 社會網絡分析研究領域中,最著名的理論之一為六度分隔(Six. Degrees of Separation)理論,又稱「小世界理論」。由美國著名社會心理. 學家米爾格倫(Stanley Milgram)在1960年透過連鎖信實驗證明這個理論,. 實驗中他隨意寄出一份信件,信件中指名收信者,並希望接到信件的實. 驗者在屬名或標註記錄之後,能夠將這份信件轉寄給可能會認識收信者. 的人,最後實驗的結果發現,一封信件平均被轉寄了六次後,便能寄至. 指名的收信者處(Kleinberg, 2000)。這種現象,雖然不是說明只要透過六. 個人,便能夠找到世界中任何一個人,但卻表示兩個素不相識的人,只. 要透過一定的連繫方式,便能夠產生連結,雖然與中間傳遞者的能力有. 關係,顯然,隨著聯繫方式和聯繫能力的不同,實現個人期望的機遇將. 產生明顯的區別。. 在現今Web2.0技術成熟後,社會網絡的想法被搬上了網際網路,社. 會網絡成為了虛擬社群。虛擬社群是Rheingold於1993年提出,其將虛擬. 社群定義為:藉由網際網路聚集了足夠的人數之後,參與討論或者是進. 行情感交流,在虛擬的網際網路世界中建立起人際關係的社會聚集體。. 而社群網站就是這些虛擬社群交流、溝通和聯絡感情的地方。. 由此可以看出,虛擬社群與傳統社群最大的差別在於媒介。因為社. 群網站的虛擬社群擁有社會網絡的特性,人與人連結的速度也僅在彈指. 間,且虛擬社群可以在社群網站上直接互動,在合理的規範下自由行動,. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 8. 彷彿另一個真實社會,人與人的連結像是輻射狀的延伸。Rheingold另外. 在2000年提出的想法印證了這點,他認為虛擬社群是一種新型的社會組. 織,並認為虛擬社群有以下四種特質:1.表達的自由;2.缺乏集中的控. 制;3.多對多的傳播;4.成員出於自願的行為。. 萬榮水、梁瑞文 (2007)認為,虛擬社群演化至今,若以功能作用上. 來區分,虛擬社群的類型共可為四種,整理敘述如下:. (一) 資訊傳播、經驗分享:提供一個平台作為資訊交流分享的地方,. 早期的網路論壇即是。. (二) 線上交友、凝聚情感:現代人因工作繁忙不易於交友或維繫情感,. 利用網路能夠跨越時空的特性,滿足人們情感與精神上的寄託。. (三) 消費興趣、產品及內容導向:在多元化的網路購物網中,吸引並. 分類出不同族群的消費習慣與興趣,針對消費個人化做產品推薦,. 進而達到留住並開發顧客的效果。 . (四) 強調即時互動社群連結:透過即時互動的特性,遊戲業者成功地集. 結廣大的遊戲愛好者組成團隊,在以任務性、競爭、冒險和刺激. 等特性為訴求的環境之中,壯大虛擬社群。. 另外,萬榮水、梁瑞文(2012)從徐淑如、林家琪(2010)的研究中也. 整理出使用者從這些虛擬社群的功能中獲得甚麼樣的知覺社群價值,在. 下面分項敘述之: . (一) 資訊價值:. 使用者在虛擬社群上能獲得尚未得知的資訊,或不同的見解看法。. 例如:我常經由朋友的分享,意外獲得有興趣的消息;在 Facebook 中. 經由資訊分享能夠累積更多的知識。. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 9. (二) 體驗價值:. 虛擬社群的使用者藉由在社群中發表言論以抒發情感,以及從其他. 使用者的互動中產生情緒,不論是喜怒哀樂,又或者藉由平台中提供的. 遊戲來獲得高興的情緒。例如:在 Facebook 分享資訊能夠讓我感到內. 心充實與滿足;愈多人對我發佈的資訊按讚或分享,我會感到愈有成就. 感。. (三) 社會價值:. 透過發表有用的資訊,讓虛擬社群中的其他人對使用者感到敬重,. 或者在社群上的行為舉止,同時塑造使用者在真實社會中的形象。例如:. 與朋友分享資訊能夠增進人際關係的提升;藉由分享資訊能夠達到形象. 的建立。. (四) 交易價值:. 利用虛擬社群的平台所提供的功能,使用者不僅僅能獲得商品資訊,. 也能與其他使用者分享心得,從中對商品或其他主題有更深入的了解,. 進而降低所花費的成本。例如:Facebook 能夠有效的幫我降低搜尋成. 本;Facebook 能夠讓我獲得完整的產品資訊,提高我的購買意願。. Burt(1997)也認為網路連結會帶動下列三種資訊利益 :可及性. (access),網路連結可以快速瞭解到組織中誰的資訊最具價值;時效性. (timing),可在最短時間內透過網路連結得到資訊;推薦性(referrals),. 網路讓能夠獲得的資訊更廣泛,並藉此獲得他人的喜好。本研究認為,. 不論這些虛擬社群的功能為何,又帶給使用者什麼樣的價值,他們都有. 一個最原始的訴求,那就是維持並增加使用者數量。一旦使用者數量增. 加,因網路外部性(Katz & Shapiro, 1985)而增加的價值將會體現到虛擬. 社群的經營者上,這也是這些經營者最初的目的。而如何經營虛擬社群. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 10. 的內容,提升內容帶給使用者的價值,進而吸引使用者加入,就是這些. 虛擬社群的經營者渴求的。. 2.2.2 社群網站-Facebook. 藉由網際網路的無遠弗屆、即時性與可用性,社會網路在網際網路. 上如魚得水,許多社群網站也應籲而生,在台灣較著名的有Facebook、. Pixnet、Yam天空部落格和Plurk等,甚至連影音網站Youtube都增加了社. 群功能,加入社群網站的行列,為的當然是社群網站那強大的連結力,. 以及聚集的龐大使用者所帶來的商機。. Facebook自2004年2月4日上線後,以學生族群做為最初用戶對象。. 經過2005年,由學生使用慢慢擴展到現在各不同職業及年齡層的使用者。. 自2009年在台灣推出以來,其成長速度一直冠於社群網路,根據Inside. Facebook 網站統計,全世界至今註冊會員人數已突破7億,在台灣已超. 過1000萬,且三分之二的會員每天至少登入一次,足以說明Facebook的. 魅力(Inside Facebook, 2011)。另外,Facebook上林林總總的粉絲頁所帶. 來的商機實在不容小覷,資料來源相較於其他社群網站之下也比較廣泛. 平均。固本研究選擇Facebook為蒐集資料來源的社群網站,並以Facebook. API為架設系統的技術之一。. Facebook會有如此驚人的使用者成長量不是沒有原因的,除了內建. 的朋友推薦機制,如從MSN(Microsoft Network)或Gmail(Google Mail). 上去關聯原先在其他平台上的友人,或是利用共同好友的數量去推薦可. 能認識的人等,都是Facebook讓虛擬社群快速壯大的方法。其中在許多. 的應用程式和小遊戲社交性的加持下,除了讓虛擬社群上使用者的互動. 機會增加,也讓原本素不相識的使用者建立起連結(Kreijns, Kirschner,. Jochems and Buuren, 2007)。在功能上不斷推陳出新,更別說功能類似. MSN的FB Messenger的線上聊天功能出現,動搖長年以來MSN所鞏固的. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 11. 地位,並讓後者於今年 (2013)4月從網際網路世界退出,由此可見. Facebook的影響力之深厚。. 有人的地方就會有商業行為,特別是當使用者多如Facebook這類的. 社群網站。許多商家嗅到了Facebook濃濃的商機,一是為了接觸到更多. 顧客,二是為了減少廣告所耗費的成本,紛紛在Facebook成立粉絲頁。. 另外,不只是商家,政治人物、偶像甚至不論是利益團體或非利益團體,. 也都希望利用粉絲頁增加自己的知名度,透過發表生活瑣事及活動資訊. 等言論拉近與使用者的距離。. 近年來,許多關於Facebook的消息都圍繞著Facebook是否能成為商. 業平台,因為Facebook的主要商業模式還是以往的廣告收入,雖然. Facebook可以利用使用者在平台上留下的痕跡去推論使用者可能喜歡. 的廣告,但相較於透過Google有目的性地去利用關鍵字廣告推薦商品,. 使用者在Facebook上有如「逛公園」一般的心態,讓Facebook廣告模式. 比較無法高效的產生利潤。儘管Facebook使用者瀏覽量是Google的2倍,. 廣告篇幅也多上不少,但前者的收益卻只有後者的十分之一,甚至有人. 估計,Google 搜索每次瀏覽量產生的營收是 Facebook的100到200倍,. 這兩項數據深刻體現了目前Facebook商業模式的效率不彰。. 但是根據票務網站EventBrite發現,在Facebook的資訊進行一次分. 享,就可帶進2.53美元的收入;另一個票務網站Ticketmaster則是算出每. 一位網友回饋購票資訊時,就可以帶來5.30美元的進帳。英國食品雜貨. 市場Tesco在Facebook上已賣出超過200萬歐元的商品;美國MBA學生創. 辦的線上購物網站Kembrel,黑色星期五在Facebook上的買氣多出20%,. 因為開設了Facebook商店,業績成長7~10%。而美國在地購物引擎服. 務開發公司Wishpond 的執行長 CEO Ali Tajsekanda則認為現在的使用. 者一旦使用了Facebook,就不會再去瀏覽其他網站,因而建立了. 「RetailConnect」方案,為零售商在Facebook快速地佈置商品清單,就. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 12. 是因為看中了商業交易平台在Facebook的成長可能性(Facebook也要開. 商業平台了要賣東西囉)。. 其實從上述的幾個例子可以看出,商家在Facebook上經營粉絲頁是. 能獲得成功的,關鍵就是讓Facebook如何把適合的使用者推薦到粉絲頁. 上,讓商家能將粉絲頁的各種知覺社群價值發揮到最高,特別是資訊和. 交易價值的部分。如此,Facebook自然而然能夠發展出新的商業模式,. 與線上零售商合作、收取交易傭金,開發線上商業交易平台的市場,擺. 脫不過就是帶動銷售的一項工具的標籤。. 第三節、本研究應用技術. 本節我們先介紹 Facebook 的平台技術,之後再探討表現其資料結構的. Facebook API,最後才介紹抓取工作經驗中公司資訊的 Google AJAX Search. API。. 2.3.1 Facebook 平台技術. 絕大部分的社群網站為 PHP 程式語言撰寫而成,Facebook 也不例外,. 且因為要能夠包含大量社群的使用者,傳統關聯式資料庫不論是在處理. 時間上,或是擴充能力上皆已經不敷使用。以 Facebook 為例,使用自家. 建立以 NoSQL 概念為主的 Cassandra 資料庫,解決了原本使用關聯式資. 料庫會遇到的問題。. NoSQL 有時也稱作 Not Only SQL 的簡寫,其名稱主要是為了與傳. 統使用 SQL 的關聯式資料庫有所區隔。而在效能上, NoSQL 資料庫克. 服了傳統關聯式資料庫在大量敏感性資料的低效率。且其數據存儲可以. 不需要固定的表格模式,也經常會避免使用 SQL 的 JOIN 操作,一般有. 水平可擴充性的特徵。雖然使用 NoSQL 的資料庫在資料同步上面比較. http://zh.wikipedia.org/wiki/%E8%BF%9E%E6%8E%A5_(SQL) http://zh.wikipedia.org/w/index.php?title=%E6%B0%B4%E5%B9%B3%E5%8F%AF%E6%89%A9%E5%B1%95%E6%80%A7&action=edit&redlink=1. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 13. 缺乏即時性(分散式資料庫),且在版本更新時也會有所延宕,但總的來. 說,有 NoSQL 資料庫的支援,Facebook 才能有今天如此大的規模。. 下面我們將要介紹本研究中非常重要的部分,也就是 Facebook 的資. 料結構,以及使用資料的方法:Facebook API。. 2.3.2 Facebook API. Facebook API 可以應用在多種環境下,包括網站(Website)、Facebook. 應用程式(Apps on Facebook.com)以及行動應用程式(Mobile Apps)。根據. 不同的平台,Facebook 也提供了不同的 SDK(Software Development Kit). 給開發者使用,包含了網站上使用的 JavaScript SDK、PHP & Python SDK,. 以及行動裝置上的 iOS SDK(iPhone & iPad)、Android SDK 等,可以說無. 論在哪個平台上皆可看到 Facebook API 的身影(Facebook API)。. 使用 Facebook API 並不困難,甚至有越來越簡易的趨勢。在過去一. 兩年間,由於將 Facebook API 用在網站上的使用人數大幅增加,Facebook. 也將常用到的一些服務包裝成套件供開發者直接套用(Facebook 稱之為. Social Plugin),其中包含最常見的「按讚」、「朋友的動態」、「留言系統」…. 等。若一般網站開發者需要使用這些功能,只要到 Facebook 開發者網頁. 填寫一些必要的資訊(appID、plugin 的寬度、回傳 url…等),Facebook. 便會自動替開發者產生相對應的 plugin 程式碼,接著開發者只需要將這. 些程式碼嵌入網頁中就大功告成了。 近一個月來,Facebook 甚至開放第. 三方嵌入程式碼SDK,裡面提供了一個官方的工具包以支援 Java (Swing),. Spring Social、Java(BlackBerry)、FLASH、.NET(C#)、Ruby 和 Node.js. 等 SDK 的開發,讓開發語言更有多樣性。. 但無論 Facebook 提供各種 API,追根究柢,其實大家想要使用. Facebook API 的目的終究是希望能夠擷取使用者以及與使用者相關的一. 些物件(朋友、網頁…等)之間的鏈結,也因此 Facebook 將這個概念濃. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 14. 縮成為一個核心概念,稱之為 Social Graph。而存取這些關係的 API,就. 稱之為 Graph API。依照 Facebook 在官方文件上對於 Graph API 的說明如. 下:Graph API 提供了可以一窺社群網路的方法,並提供物件本身的資訊. 以及物件間彼此的鏈結關係。這邊所提到的物件,其實在 Facebook 裡的. 定義是非常廣泛的,舉凡人(User)、照片(Photo)、事件(Event)、網頁(Page). 都可以是一個物件。而鏈結關係就是這些物件間彼此的關係,例如人跟. 人之間的關係(朋友/非朋友)、人跟照片的關係(人擁有某些照片、照片. 上的標籤屬於某些人等)、人跟事件與網頁的關係(讚)...等。因此其實. 也可以說,任何你需要 Facebook 提供的資訊,Graph API 幾乎都能滿足. 你的需求。. 圖 2-2、social graph,資料來源:Facebook Developer document. 而若上述的方式無法滿足開發者的需求,Facebook 更提供了一套類. 似 SQL 的查詢方式,稱為 FQL(Facebook FQL)。如同 SQL,FQL 的標. 準使用方式為:SELECT [fields] FROM [table] WHERE [conditions],. fields 為 id, name, pictures..等,table 為 user, album, comment…等,. conditions 則試開發者需求自行設定。. 然而,提供了如此多樣化的 API 以及豐富的資訊,不禁讓社會大眾. 開始關切隱私權的議題。若任何一個開發者都可以藉由輸入 ID 以及鏈. 結型態就可以拿到某個物件的關係圖,那麼用戶的隱私蕩然無存。因此. Facebook 也提供了授權(authorization)機制:任何可能擷取到關於隱私的. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 15. 資料時,在Graph API的請求中應該要附加一個存取鑰匙(access token)。. 如此一來若這些 app 想存取某些隱私資料時,必須經過 Facebook 的授. 權以及使用者的認可後才可開放存取。. Facebook 採用 OAuth2.0 認證方式,總共有三個步驟:使用者認證. (user authentication)、 app 授權( app authorization)、 app 認證 (app. authentication)。使用者認證:確保使用者即為使用者本人;app 授權:. 向使用者確認他們即將授權此 app 拿到這些隱私資料;app 認證:確保. 使用者授權的 app 就是目前這個 app。經過這三階段的認證後,app 即. 可從 Facebook 得取存取鑰匙(access key),而之後向 Graph API 索取資料. 時 , 只 需 要 將 access token 附 加 在 網 址 後 , 如 :. https://Graph.Facebook.com/me?access_token=ACCESS_TOKEN. 或許 Facebook 正在加速 Web2.0 技術的進化,因為現代網路資訊過. 於繁雜,許多使用者寧可從 Facebook 的塗鴉牆去窺探世界的一舉一動,. 或相信忠實朋友的推薦,去接觸新的商品。. 2.3.3 Google AJAX Search API. 在本研究中,由於需要用到的工作經驗資料在 Facebook 中並沒有. 被詳細分類,故另外使用 Google AJAX Search API 對工作經驗資料做自. 動分類,以作為參數。為尋求工作所在公司的完整性與分類的精確性,. 本研究利用 Google AJAX Search API 在中華電信「SuperhiPage 中華黃. 頁網路電話簿」網頁內容中找尋公司資訊,並擷取公司類型資訊。以下. 繼續介紹 Google AJAX Search API 使用方法和提供服務的方式。. Google AJAX Search API 是一種支援 JavaScript library 的 Web. Service,讓使用者可以把 Google Search 的功能搬上自己的應用程式,. 利用回傳 JSON 物件及原始碼的方式,來回應使用者的需求。Google. AJAX Search API 大多應用在新聞跑馬燈和私人網站的站內搜尋,讓使. https://graph.facebook.com/me?access_token=ACCESS_TOKEN. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 16. 用者可以利用 Google Search 的結果,更有效率地獲得網站內的資訊. (Google Web Search API)。. 就像使用其他的 Google API 一樣,要使用 Google AJAX Search API. 首先要申請一個 API key,並在 HTML 的<script>處的來源屬性 src 補上. http://www.google.com/jsapi?key=INSERT_YOUR_API,這樣就能使用. Google Search API 的功能。接下來繼續在 script 標籤內加入. google.load(api 類型,版本); 這裡的 api 類型我們使用 search,版本則選. 擇較穩定的版本 1。. Google Search 有許多種搜尋目標和模式,例如:網頁搜尋. (WebSearch)、圖片搜尋(ImageSearch)、部落格搜尋(BlogSearch)、影片. 搜尋(VideoSearch)、新聞搜尋(NewsSearch)、書籍搜尋(BookSearch)和專. 利搜尋(PatentSearch)等,Google Search 為支援使用者各種搜尋模式,在. 頁面中建立搜尋容器,並讓使用者自由選擇所需的搜尋模式放入搜尋容. 器中執行運作。本研究使用 Google Search 網頁搜尋的功能來針對. SuperhiPage 中華黃頁網路電話簿的公司資訊頁面,做類別資訊擷取,. 所以在搜尋關鍵字上必須用: 「關鍵字 site:SuperhiPage 中華黃頁網路. 電話簿網址」,以確保搜尋結果包含在網站內。. 第四節、Kmeans 分群演算法. Kmeans 分群演算法又稱 Kmeans Clustering,是 J. B. MacQueen 於 1967. 年所提出的分群演算法,運算前必須事前設定欲分群的群數,然後找尋下列. 公式的最大值,以達到分群的最佳化之目的,其中 k 是群組數,𝑢𝑖是群組𝑆𝑖內. 的平均值。. argmin∑ ∑ ‖𝑥𝑗 − 𝑢𝑖‖ 2. 𝑥𝑗𝜖𝑆𝑖 𝑘 𝑖=1 . http://www.google.com/jsapi?key=INSERT_YOUR_API. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 17. 其主要目的是為了當母體內有許多擁有屬性的個體,且不知該如何定義. 群集特徵屬性時,將群集依據屬性的相似程度分群。另外,Kmeans 也能夠. 透過不斷的輸入資料,藉此訓練群集質心的位置(這裡將群集的中心稱為質. 心),以求將新進個體分類時能夠更準確。此分群法大致上分為隨機指派質. 心、產生初始群集、產生新的質心和重新分配群集等幾個步驟,並一直重複. 步驟三和步驟四,直到所有個體不再改變群集為止。. Kmeans 演算法雖然想法單純且分群效果佳,但在執行仍有一些缺點,. 以下針對研究中遇到的問題,同時也是 Kmeans 分群演算法的缺點做概要說. 明。. (一) K 值的設定. 由於在 Kmeans 演算法中分群的數量 k 值是一開始就給定的,在無. 從得知分群結果的好壞的情況下,重複修改 k 值做演算法運算看來耗時. 又耗力,本研究最後得出 10 群為較有效率的結果。. (二) 初始質心的適合度. 一開始質心是以隨機分布的方式設定,若一開始分布範圍不理想,. 周圍有過多或過少的節點,將會造成後續分群不均的結果,特別是當個. 體不夠且分群的數量太多時,Kmeans 分群法容易發生有些群集未有個. 體存在,或是有些群集有太多的個體存在等問題。針對這個問題,許多. 學者相繼提出解決方案。. Al-Daoud and Roberts(1996)提出以網格分區計算,藉由節點的分布. 方式進行質心初始化來解決改善;Bradley 等學者(1998)則是先擷取多組. 小樣本進行模擬分群,然後以每一群的分群質心在母體中進行實驗,最. 後用失真值(質心跟群集內各節點的歐式距離)最少的分群質心作為初. 始質心。本研究則是以重新計算初始質心並合併群集來解決此問題。. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 18. (三) 運算的時間複雜度. 從上述的演算過程中,可以看出在質心與群集不斷調整時,所有個. 體皆須運算,故如果個體數量龐大,時間的消耗將會相當可觀。. 本研究中因使用者的喜歡粉絲頁的比例與學歷皆可以直覺地用級. 距表示,故使用歐式距離作為分群的主要依據,歐式距離即為歐幾里得. 距離,常被用在資料點與資料點間距離的計算,假設在 n 維的向量空間. 中有使用者 P 和 Q,其屬性資料的表示為 P=(𝑃1, 𝑃2, … , 𝑃𝑛 ) ,. Q=(𝑄1, 𝑄2, … , 𝑄𝑛),則歐幾里得距離的計算公式如下:. Distance =√∑ (𝑃𝑖 −𝑄𝑖)2 𝑛 𝑖=1 . (𝑃𝑖與𝑄𝑖皆為本研究量化後的數據). 工作經歷方面則根據中華電信「SuperhiPage 中華黃頁網路電話簿」. 將工作類型分成二個階層,若工作類型在階層越下方被歸為一組則距離. 越近,距離越近表示相似度越高,越有可能被歸到同一使用者族群。. . ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 19. 第三章、研究設計與方法. 第一節、研究架構與流程. 圖 3-1、本研究之研究架構與流程,資料來源:本研究整理. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 20. 本研究主要分成四個階段,一個階段接著下一個階段循序漸進,最初在. Facebook 上蒐集資料,接下來為了定義使用者屬性的資料分類,再利用使. 用者屬性分群分類,最後對使用者群組使用社會化推薦結果與商品導向推薦. 結果做比對,將實驗組的推薦結果與對照組的隨機挑選結果送給使用者,以. 取得使用者回饋,來證明本研究效度,下節將針對研究程序的四個階段概要. 說明。. 第二節、研究程序說明. 3.2.1 蒐集資料. 本研究為將 Facebook 中的使用者分群以進行推薦,故先蒐集準備. Facebook 使用者資料,蒐集方法為請使用者授權以取的使用者朋友的資. 料。另外,因 Facebook 上工作經驗的類型並未有清楚的描述,故決定從. 資料種類豐富請定義嚴謹的「SuperhiPage 中華黃頁網路電話簿」擷取工. 作類型資料,以便後續工作經驗資料的分類。以下將清楚說明蒐集資料的. 詳細內容。. 本研究自 Facebook 蒐集資料,主要是透過 Facebook API 中的. JavaScript SDK,使用者好友的個人資料,包括姓名、性別、生日、現居. 地、家鄉、宗教信仰、政治立場,以及學歷和工作經驗等資料,若被截取. 資料的使用者將個人資料項目的隱私權調整為不能被擷取,回傳的資料就. 會變成“unknown”。由於本研究在資料蒐集時,也應該尊重個人隱私,故. 使用者若有此類資料,該資料就不加入本研究中的分類計算。. 至於作為分辨公司行號種類的資料庫,則是使用 PHP 撰寫的網頁爬. 蟲擷取中華電信「SuperhiPage 中華黃頁網路電話簿」裡的公司名稱及類. 型資料,類型資料蒐集四層,如 SevenEleven 在網頁上的分類為生活消費. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 21. >百貨購物>百貨賣場>超商、購物中心,但考慮到分群時的群組數太多,. 群內母體太小,故分群時只使用前二類,以上例來解釋就是只使用生活消. 費>百貨購物這二個類型來做為分群的參數。. 3.2.2 資料整理. 本研究中主要使用喜歡的粉絲頁、學歷和工作經驗三種變數去分群使. 用者,為了能有效的定義這三種屬性,在分群前先將屬性分好類別,讓資. 料分佈不會太零散,利於為分出的群組定義標籤。. 使用者喜歡的粉絲頁將會擷取 Facebook 中的專頁分類資料,原本約. 有 202 種,但種類明顯有重複性問題,例如:跟 Music 有關的類型就有. Music、Musician/band、Music award、Musical instrument、Music chart、. Music video、Musical genre、Movies/music 和 Album 等類型資料,但很明. 顯 Music 包含了 Music/Movie 和 Album 等種類,這類型問題只能利用手. 動所有類別整理刪減為 Music,經手動後分類的類型資料有 48 種如下表. 所示: . 表 3-1、經整理後 Facebook 的粉絲頁類型. Music Tv Politic Automotive Business Transport. Movie Food Home Camera Publish Health. Sport Travel Computers Entertainment Arts Education. Pet App Shopping Services Places Religion. Law Teens Work Organization Website Media. Dancer Energy Celebrity Appliances Science Clothing. http://www.iyp.com.tw/shopping/ http://www.iyp.com.tw/shopping/department-store/ http://www.iyp.com.tw/shopping/. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 22. Society Farming Other Engineering Interest Animal. Language Community Profile Industrials Year Tools. 資料來源:本研究整理. 工作類型的分類則交由 Google AJAX Search API 對工作名稱在. SuperhiPage 中華黃頁網路電話簿進行搜尋,以找到的第一筆資料為分類. 依據,例如,若從 Facebook 蒐集來的公司名稱叫做「生活牙醫診所」,本. 研究設計的程式搜尋結果為下圖:. 圖 3-2、本研究設計的 Google AJAX Search API 程式搜尋「生活牙醫診所」結果,. 資料來源:本研究整理. 擷取該區塊中之 url 連結後,擷取該 url 的頁面資訊,該頁面資訊呈. 現如下圖:. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 23. 圖 3-3、本研究設計的 Google AJAX Search API 程式擷取「生活牙醫診所」之類. 型資訊,資料來源:本研究整理. 擷取到類型資訊經整理過後存入資料庫如下表。. 表 3-2、工作經歷存入資料庫後的資料格式. work_id type type1 type2 type3 name. 226823600753901 社會服務 醫療保健 西醫 牙科 生活牙醫診所. 資料來源:本研究整理. 但搜尋並非都有結果,若搜尋沒有結果,僅能依靠手動分類,所有分. 類的類型請參考附錄一。. 而學歷方面的辨識方法,就從使用者在 Facebook 所登記的學歷資料. 部分,去判斷該使用者的學歷到哪個階段。在本研究中,以使用者的心理. 成熟度為考量,故將使用者學歷分為三種,分別為「研究所以上」、「大學」. 和「高中以下」。. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 24. 3.2.3 現有使用者分群. 本研究利用上述的方法將學歷、粉絲頁和工作經驗分類之後,根據分. 類後的資料將使用者的屬性定義,並利用屬性分群分類。分類時工作經驗. 上使用前二層資料,並利用所在層次的不同,計算彼此的距離,例如:若. 作為比較的兩者之工作類型為資訊通信和金融工商都在類型工商服務之. 下,且都在第二層,所以兩者之間距離設於 0.5,又或者作為比較的兩者. 之工作類型為工業製品之下的電工器材與休閒文化下的育才學術,兩者在. 第一層就不同,所以距離設為 1;學歷則是分為研究所以上、大學、高中. 以下,分別為 1、0.5,0;喜歡的粉絲頁類型則取使用者喜歡的粉絲頁類. 型所佔的頻率,作為分類的依據。下圖是本研究利用 Kmeans 分群演算法. 處理過後的群組示意圖。. 圖 3-4、本研究使用者分群之群組示意圖,資料來源:本研究整理. . ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 25. 另外,由於學歷資料因為某些使用者個人隱私設定或使用者未填入的. 關係,導致本研究無法順利擷取,為研究限制之一。為不讓此類資料過度. 影響分群的結果與準確性,本研究量化中華民國一百零一年十五歲以上的. 平均人民教育水準 0.227(內政部內政統計年報 101 年),以替代學歷缺乏. 值。為驗證分群後各群間確實有所不同,本研究使用 ANOVA 變異數分析. 針對幾個最具代表性的屬性作判斷,以驗證用來作為推薦模型的每一群皆. 有其獨特性。. 3.2.4 產生推薦. 本研究產生推薦的方式,主要是比對分析使用者個人資訊以後,以. 使用者被歸入的群組做社會化推薦。本研究認為在同一個群集裡的使用. 者因興趣與背景較為相近,故興趣應該也會相近,所以整理出使用者喜. 好比例與群集質心差距較多的五個類型,並依照比例推薦給使用者,藉. 此找出潛在使用者可能喜歡的粉絲頁。 . 人脈上,因為分到同一個群組的使用者不論在背景上,還是外在的. 喜好興趣都非常相近,故將該群組尚未成為使用者朋友的其他使用者介. 紹給使用者,並將與其他被推薦的使用者之人脈關係列出,以獲得可能. 認識該位使用者的管道。. 為證明推薦粉絲頁的有效度,本研究設計了實驗組與對照組作為證. 明的方法。實驗組是本研究分群後推薦的結果,對照組則是依照本研究. 分群前使用者與母體相差的粉絲頁類型比例,將母體中最被喜歡的幾種. 粉絲頁類型照比例推薦其中的粉絲頁給使用者。最後讓使用者對兩個組. 別進行評價,並以統計的 t 檢定在顯著水準 0.05 的情況下,針對所有樣. 本作統計量的檢測,去驗證母體中實驗組的分數是否有大於對照組,同. 時也證明本研究的方法有效,下圖是本研究對照組與實驗組設計示意. 圖。. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 26. 圖 3-5、本研究實驗組與對照組設計示意圖,資料來源:本研究整理. . ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 27. 第四章、實驗與研究結果分析. 第一節、實驗資料介紹. 本研究從 Facebook 蒐集到個人資料 5944 筆,其中由於有許多使用者的. 資料無法擷取或未開放權限等因素,將資料整理成本研究所需的格式後有效. 資料為 4417 筆,最後利用整理過的資料用 Kmeans 分群,為使本研究使用. 資料更加明瞭,茲將實驗資料說明如下:. 一、實驗中使用者的教育程度:. 表 4-1、本研究實驗中使用者的教育程度. 教育程度 人數 所佔比例. 未及高中或沒有資料 647 14.6%. 高中 268 6.1%. 大學 2320 52.5%. 研究所 1182 26.8%. 資料來源:本研究整理. 教育資料以大學為最多,研究所次之,未及高中或沒有資料與高中. 學歷者分居第三和第四。. 二、實驗中使用者的工作經歷:. 表 4-2、本研究實驗中使用者的工作類型. 工作類型 人數 所佔比例 工作類型 人數 所佔比例. 電工器材 60 1.36% 家用電器 3 0.07%. 紡織工業 1 0.02% 食品餐飲 121 2.74%. 化學工業 9 0.20% 衣著配件 13 0.29%. 工業機械 26 0.59% 住屋居家 36 0.82%. 金屬工業 2 0.05% 百貨購物 32 0.72%. 農林漁牧 4 0.09% 育才學術 520 11.78%. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 28. 行車運輸 36 0.82% 樂在休閒 191 4.33%. 環境保護 2 0.05% 新聞文化 27 0.61%. 金融工商 232 5.25% 社會服務 131 2.97%. 事務文具 2 0.05% 醫療保健 76 1.72%. 廣告印刷 18 0.41% 生命禮儀 1 0.02%. 資訊通信 232 5.25% 公用事業 266 6.02%. 聲光影視 10 0.23% 無資料 2364 53.54%. 包裝服務 0 0.00% . 資料來源:本研究整理. 工作類型中無資料或資料無法解析者相當多,前五名的使用者職業. 為育才學術、公用事業、金融工商、資訊通訊和樂在休閒,其中育才學. 術與公用事業有這麼大的資料量大多數是因為學生使用者會將在學校. 打工的經驗放上 Facebook,而男性使用者則喜歡留下當過兵的資訊。. 三、實驗中使用者的粉絲頁喜好. 在全部 529940 筆使用者喜愛的粉絲中,類型大多以 Music,. Community 和 Organization 為主,分別為 59469,53391 和 40090 ,可看. 出使用者對於這些類型的粉絲頁特別喜歡或是這些類型的粉絲頁在總. 數上較多。. 表 4-3、使用者喜好的粉絲頁類型分布. 粉絲頁類型 數量 比例 粉絲頁類型 數量 比例. Music 59469 11.22% Place 1463 0.28%. Community 53391 10.07% Home 1294 0.24%. Organization 40090 7.57% Interest 1208 0.23%. Politic 34638 6.54% Camera 1171 0.22%. Website 32023 6.04% Appliances 1082 0.20%. Movie 31419 5.93% Other 1046 0.20%. Services 27980 5.28% Science 808 0.15%. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 29. Business 23453 4.43% Celebrity 780 0.15%. Publish 23082 4.36% Dancer 563 0.11%. Sport 20927 3.95% Pet 541 0.10%. Entertainment 20872 3.94% Transportation 495 0.09%. Media 19117 3.61% Energy 486 0.09%. Food 18184 3.43% Teens 393 0.07%. Education 16559 3.12% NULL 271 0.05%. Clothing 16453 3.10% Farming 265 0.05%. Tv 15987 3.02% Engineering 252 0.05%. App 15201 2.87% Tools 159 0.03%. Arts 10587 2.00% Law 147 0.03%. Travel 9609 1.81% Work 53 0.01%. Computers 8197 1.55% Profile 49 0.01%. Shopping 7967 1.50% Language 48 0.01%. Health 6101 1.15% Animal 44 0.01%. Religion 2345 0.44% Industrials 33 0.01%. Automotive 1883 0.36% Year 1 0.00%. Society 1754 0.33% . 資料來源:本研究整理. 第二節、系統展示與實驗操作結果. 4.2.1 系統展示. 本研究最後依據第三章中的研究流程為模型建立起推薦系統,使用系統. 之初,使用者必須授權 Facebook 上的資訊讓本系統分析研究,才能依據分. 群結果將使用者分類。. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 30. 進入系統之初,使用者若無授權,即會跳出授權視窗,若使用者拒絕授. 權則無法使用,下圖為未授權時的跳出的授權視窗。. 圖 4-1、授權視窗跳出示意圖,資料來源:本研究系統截取. 若尚未授權或是授權失敗,系統就會自動阻擋使用者繼續使用,直至使用者. 授權成功。. 圖 4-2、阻擋視窗跳出示意圖,資料來源:本研究系統截取. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 31. 授權通過,按下「推薦我粉絲頁」,系統就會產生推薦的粉絲頁與人脈結果。. 使用者必須針對粉絲頁的喜好選擇對推薦粉絲頁的印象分數,同時也對隨機產生. 的粉絲頁給予分數。. 圖 4-3、使用者對系統評分範例,資料來源:本研究系統截取. 另外,系統也會列出群集內的其他使用者,作為有相同背景或喜好的潛在好. 友推薦給使用者,除了給予 Facebook 連結之外,並將認識的管道列出。本研究. 為顧及隱私權的問題故未透漏太多個人資料,僅讓使用者自行至 Facebook 上依. 照被推薦者開放的權限觀看。. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 32. 圖 4-4、本系統推薦人脈範例,資料來源:本研究系統截取. 4.2.2 實驗操作結果. 系統所使用的模型是透過 Kmeans 分群演算法將使用者分成 10 群,依. 據各群集質心與使用者距離作計算,並將使用者歸入最近的質心所屬群集。. 各群集的內容經整理歸納後,皆有特殊的屬性,本研究在多次實驗後,選用. 群集質心標準差最大的第 16 次分群結果作為推薦依據,下表為的 16 次分群. 各群主要的屬性所占比重概述。附有各群最受關注粉絲頁的完整表格請看附. 錄二。. 表 4-4、各群分組後的主要屬性概述. 組別 主要喜好 主要學歷 主要職業. 0. Community(0.171),App(0.102),Website(0.076),Enter. tainment(0.072),Organization(0.06),Services(0.057),. Politic(0.052),Media(0.049),Business(0.048),Music(0. .041). 大學與研究. 所. 公用事業,. 資訊通信,. 金融工商. 1. Music(0.175),Organization(0.078),Community(0.074. ),Movie(0.065),Politic(0.063),Services(0.052),Websit. e(0.05),Business(0.045),Clothing(0.042),Publish(0.04. 大學與研究. 所. 金融工商,. 公用事業,. 食品餐飲. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 33. ). 2. Music(0.108),Community(0.106),Organization(0.076. ),Politic(0.073),Movie(0.059),Website(0.056),Service. s(0.052),Publish(0.046),Business(0.044),Sport(0.042). 大學與研究. 所. 育才學術,. 樂在休閒,. 新聞文化. 3. Music(0.117),Community(0.101),Organization(0.071. ),Movie(0.067),Politic(0.066),Website(0.061),Service. s(0.052),Publish(0.043),Entertainment(0.039),Busine. ss(0.039). 大學與研究. 所. 金融工商,. 公用事業. 4. Music(0.51),Movie(0.111),Sport(0.062),Tv(0.041),Pu. blish(0.031),Community(0.031),Politic(0.028),Entert. ainment (0.024),Organization(0.021),Food(0.016). 大學與研究. 所. 公用事業,. 育才學術,. 資訊通信. 5. Community(0.096),Organization(0.091),Music(0.08),. Website(0.073),Services(0.061),Politic(0.057),Movie. (0.055),Business(0.049),Sport(0.044),Publish(0.043). 大學與研究. 所. 資訊通信,. 公用事業,. 金融工商. 6. Community(0.112),Music(0.092),Organization(0.073. ),Politic(0.07),Website(0.058),Services(0.052),Publis. h(0.052),Movie(0.051),Business(0.047),Entertainmen. t(0.043). 高中與大學 公用事業,. 樂在休閒. 7. Sport(0.105),Music(0.104),Community(0.096),Movie. (0.091),Politic(0.082),Organization(0.058),Entertain. ment(0.048),Tv(0.041),Website(0.04),Publish(0.039). 大學與研究. 所. 公用事業,. 金融工商,. 資訊通信. 8. Organization(0.121),Community(0.099),Website(0.0. 73),Services(0.073),Business(0.058),Politic(0.053),M. usic(0.051),Food(0.049),Media(0.043),Publish(0.042. ). 大學與研究. 所. 金融工商,. 社會服務,. 資訊通信. 9. Music(0.167),Community(0.095),Movie(0.092),Politi. c(0.074),Organization(0.055),Tv(0.054),Publish(0.04. 7),Sport(0.045),Services(0.044),Business(0.044). 高中與大學. 育才學術,. 樂在休閒,. 食品餐飲. 資料來源:本研究整理. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 34. 為驗證第 16 次分群各群集間確實獨立,本研究使用 ANOVA 變異數分. 析,針對每一群的主要喜好在其他群的顯著性,來判斷各群是否真的獨立。. 表 4-5、本研究各屬性 ANOVA 變異數分析表. 屬性 F 顯著性 屬性 F 顯著性. degree 1487.167 0 Religion 6.946 0. work1 2082.651 0 Law 0.563 0.828. Music 143.706 0 Teens . .. Tv 11.629 0 Work 0.46 0.902. Politic 6.957 0 Organization 29.46 0. Sport 35.569 0 Website 15.566 0. Business 7.865 0 Media 7.14 0. Transportation 1.039 0.405 Engineering 0.381 0.945. Movie 25.695 0 Energy 1.716 0.08. Food 10.515 0 Celebrity 2.791 0.003. Home 2.111 0.025 Appliances 1.717 0.08. Animal 0.334 0.964 Science 3.383 0. Publish 6.943 0 Clothing 9.776 0. Health 3.576 0 Tools 4.42 0. Automotive 2.208 0.019 Society 1.34 0.21. Travel 6.199 0 Farming 0.869 0.553. Computers 9.197 0 Other 0.669 0.738. Entertainment 9.203 0 Dancer 2.357 0.012. Arts 3.561 0 Interest 3.144 0.001. Education 24.111 0 Camera . .. Pet . . Language 1.396 0.184. App 39.377 0 Year 0.459 0.903. Shopping 5.807 0 Profile 1.404 0.18. Services 11.51 0 Industrials 1.385 0.189. Place 2.106 0.026 Community 34.446 0. 資料來源:本研究整理. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 35. 從 ANOVA 變異數分析表中可看出,除了少部分數量較少的屬性外,. 絕大部分屬性的顯著性皆低於 0.05,表示此屬性在 95%的信心水準之下達到. 顯著水準,也就是在各群集間的分佈有顯著差異。F 值與顯著性無資料的部. 分則代表其屬性只出現在某一特定群集中,而 F 值越大代表在群集間此屬性. 的差異越大。由此可以說明各群集間皆有明顯的差異,沒有重複或極為類似. 的情況發生,分群效果是可以期待的。. 第三節、結果分析. 純以使用者喜愛的粉絲類別來看此分群結果,每一群的前五名並無太大. 差異,主要都是以數量最多的幾個類型為主,但若加入學歷與工作經驗,推. 薦的內容結果即有顯著差異。. 本研究在此以參與實驗使用者的操作結果以及其屬性提供兩個範例,去. 說明本研究在分群時的分群效果,與推薦的粉絲頁之間的關係。. (一) 使用者 A. 性別:男性. 學歷:研究所. 工作經驗:資訊通信. 喜愛的粉絲頁類型:如下表所示. 表 4-6、使用者 A 喜好的粉絲頁類型比例表. 類型 比例. Community 23.54%. Sport 17.33%. Services 12.43%. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 36. Business 10.71%. Food 6.22%. Entertainment 6.22%. Education 6.22%. Shopping 6.22%. Organization 6.22%. Arts 4.89%. 資料來源:本研究整理. 推薦結果:群集 4. 表 4-7、使用者 A 與群集 4 和母體的平均類型喜好之主要前五差距. 實驗組 對照組. type 比例 type 比例. Music 0.7 Music 0.4. Movie 0.1 Movie 0.2. Tv 0.1 Politic 0.2. Publish 0.1 Website 0.1. App 0.1. 資料來源:本研究整理. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 37. 圖 4-5、使用者 A 粉絲頁推薦結果,資料來源:本研究系統截取. 圖 4-6、使用者 A 人脈推薦結果,資料來源:本研究系統截取. 結果分析:. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 38. 從使用者 A 的資料可以看出,其特徵為一個喜愛 Community, Sport. 和 Service 且學歷為研究所以上從事資訊通信方面工作的男性,但母體. 中的主要屬性 Music 卻完全沒有。使用者 A 很順利地被分到有明顯資. 訊通信屬性,在各方面都符合到了被分配的群集的主要屬性。群集 4. 與使用者有最大差距的幾個類型為 Music, Movie 和 Tv 等,特別是此. 群集的 Music 屬性所佔比例相當高,且大部分為英文歌曲,與母體對照. 結果只有一個推薦重複且相差甚大,於是便推薦群集中這些類型裡最為. 熱門的粉絲頁給使用者 A。. 而推薦與對照的回饋結果分別為 0.825、0.325,也代表這群集相較. 於母體在某些特定類型的粉絲頁上真的有符合到使用者 A 的喜好。最. 後也推薦同群集的人讓使用者確切了解需要經過的人脈。. (二) 使用者 B. 性別:女性. 學歷:研究所. 工作經驗:金融工商. 喜愛的粉絲頁類型:如下表所示. 表 4-8、使用者 B 喜好的粉絲頁類型比例表. 類型 比例 類型 比例. Clothing 16.48% Movie 2.20%. Music 10.99% Shopping 2.20%. Food 8.79% Education 2.20%. Business 5.49% Media 1.10%. Politic 5.49% Health 1.10%. Community 5.49% Travel 1.10%. Movie 4.40% Organization 1.10%. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 39. Tv 4.40% Computers 1.10%. Services 4.40% Movie 1.10%. Website 4.40% Transportation 1.10%. Food 3.30% Arts 1.10%. Business 2.20% Organization 1.10%. Organization 2.20% . 資料來源:本研究整理. 推薦結果:群集 3. 表 4-9、使用者 B 與群集 3 和母體的平均類型喜好之主要前五差距. 實驗組 對照組. type 比例 type 比例. Community 0.3 Community 0.3. App 0.2 Sport 0.2. Publish 0.2 Music 0.2. Sport 0.2 Publish 0.2. Organization 0.1 App 0.1. 資料來源:本研究整理. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 40. 圖 4-7、使用者 B 粉絲頁推薦結果,資料來源:本研究系統截取. 結果分析:. 從使用者 B 的資料可以看出,其特徵為一個喜愛 Clothing, Music,. Food 且學歷為研究所並從事金融工商方面工作的女性。使用者 B 被分. 到了第 3 群,符合到了被分配的群集的主要工作經驗屬性。雖然不論與. 母體或是與群集 3 的其他使用者比較起來,使用者 B 較缺乏的都有. Community, Sport, Publish 和 App,類型比例十分相似。但推薦的結果. 卻也只有一個重複,實驗組與對照組推薦的回饋分別為 0.7 和 0.4,也. 代表這群集的主要喜愛的粉絲頁相較於未分群前的母體有較有符合到. 使用者 B 的喜好。. 本研究最後蒐集到 68 筆資料,抽樣使用蒐集到的使用者回饋 30 筆,其. 中作為推薦結果的實驗組部分平均為 0.5743,而作為隨機推薦的對照組則為. 0.4268;實驗組結果處在普通和可能會喜歡的級距中間,而對照組則在可能. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 41. 不喜歡和普通中間,實驗組比對照組明顯高了約半個級距左右。下表為本研. 究實驗中回收的 68 筆使用者回饋的樣本。. 表 4-10、本研究實驗中使用者回饋的樣本. 使用者 實驗組 對照組 使用者 實驗組 對照組. 1 0.825 0.325 35 0.55 0.5. 2 0.75 0.4 36 0.9 0. 3 0.6 0.6 37 0.6 0.125. 4 0.825 0.6 38 0.575 0. 5 1 0 39 0.45 0.55. 6 0.5 0.25 40 0.725 0.35. 7 0.525 0.625 41 0.5 0.2. 8 0.4 0.325 42 0.7 0.575. 9 0.725 0.4 43 0.625 0.4. 10 0.575 0.375 44 0.925 0.575. 11 0.325 0.5 45 0.875 0.425. 12 0.85 0.725 46 1 0.5. 13 0.7 0.4 47 0.175 0.225. 14 0.55 0.5 48 0.525 0.4. 15 1 1 49 0.4 0.325. 16 0.65 0.475 50 0.1 0.325. 17 0.65 0.55 51 0.85 0.75. 18 0.7 0.125 52 0.325 0.5. 19 0.6 0.375 53 0.2 0.5. 20 0.75 0.15 54 0.525 0.35. 21 0.1 0.15 55 0.625 0.475. 22 0.5 0.6 56 0.55 0.65. 23 0.625 0.575 57 0.125 0.6. 24 0.625 0.575 58 0.5 0.4. 25 0.725 0.4 59 0.4 0.4. 26 0.475 0.35 60 0.7 0.4. 27 0.7 0.4 61 0.55 0.5. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 42. 28 0.575 0.475 62 1 1. 29 0.45 0.2 63 0.7 0.575. 30 0 0.05 64 0.625 0.4. 31 0.6 0.375 65 0.325 0.575. 32 0.325 0.475 66 0.5 0.5. 33 0.1 0.15 67 0.625 0.5. 34 0.5 0.5 68 0.5 0.5. 平均 實驗組 0.5743 對照組 0.4268. 資料來源:本研究整理. 為確實證明實驗組分數大於對照組的分數,使用 t 檢定在顯著水準 0.05. 下,做相依母體統計量上的實驗並提出以下假設:. 實驗組與對照組的母體相差平均數。. . 1 . 𝑡 = �̅� − . 𝑆 √𝑛. 表 4-11、本研究中實驗組與對照組之樣本數、平均和標準差. 組別\參數 樣本數 平均 標準差. 實驗組 68 0.5743 0.2131. 對照組 68 0.4268 0.1866. 實驗組-對照組 (n)68 (�̅�)0.1474 (𝑆 )0.258. 資料來源:本研究整理. 經計算之後,𝑡 為 4.712,大於自由度為 67 時𝑡 的 1.67,故 reject 假. 設,最後得出有充分證據支持 ,證明本研究的粉絲頁推薦方式較分. 群前所推薦的粉絲頁來得有效且確實。 . ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 43. 第五章、結論與未來研究方向. 第一節、結論與建議. 本研究為有效推薦 Facebook 上的粉絲頁與人脈關係提出了一個推薦模型,. 並開發系統以進行實驗;蒐集來的資料換成可運用格式並建立成資料庫供實驗使. 用,在實驗取得使用者回饋後,確定本研究的推薦模型比起未分群之推薦結果有. 效,證實本研究使用 Kmeans 分群法作為建立推薦粉絲頁和人脈的模型,並使用. 學歷,工作經歷和喜歡的粉絲頁類型能讓使用者可以更快速地接觸到可能會喜歡. 的粉絲頁以及志同道合的夥伴。. 本研究最終回收的使用者回饋 68 筆,實驗組的平均喜好度為 0.5714,而對. 照組只有 0.4348,經 t 檢定測定後,有充分證據支持實驗組分數的平均大於對照. 組,表示本研究推薦結果優於未分群前的結果。. 另外,本研究使用 Facebook API 從 Facebook 上作資料蒐集方法也相當有效. 率,蒐集的資料種類也能夠表示出使用者的背景喜好,不但能推薦粉絲頁,也能. 應用在 App 市場中。希望未來這種以真實資料研究社群網站的模式,能更廣泛. 地被應用到需要大量資料佐證,或者是探討社群趨勢的研究,讓社群網站的研究. 不必再拘泥於問卷調查,能有嶄新的面貌。. 第二節、未來研究方向. 本研究在擷取、分析和量化個人資料上皆有著墨,且步驟繁雜,雖有許多文. 獻背書,但仍有部分以較為直覺的方式進行,故仍有改善空間,在此提供幾點建. 議可供未來研究加強改善,或者發展的研究方向。. ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 44. (一) 擷取資料、分析和量化資料. 本研究為分析使用者的工作經驗,從 SuperhiPage 中華黃頁網路電話簿. 中擷取工作類型的資料並進行分析,但使用者填寫的工作經驗大多無法直接. 用爬蟲程式在網路電話簿上查出類型,仍需要手動分類。其原因大概有兩種:. 一是資料有效性欠佳,二是語言使用問題(例如用英文或縮寫表示公司名稱)。. 若想徹底改善此問題,最好的辦法就是自己建立公司中英文辭庫,並輔以程. 式對照。. 量化資料方面,因為擷取資料的正確性和資料數量讓結果有點單調,如. 學歷只分成三個階級,工作經驗只用到第二階層,可以探討相關文獻把這方. 面分得更加細微,讓分群的結果更加精確。. (二) 分群方法. 本研究使用 Kmeans 分群演算法是因為其速度快、分群未知群集的能力. 以及較廣為被改進等特點,但若能一開始即歸納出各群可能屬性,使用其他. 分群演算法如: K-NN, Fuzzy Cmeans, EM Algorithm,也有可能產生煥然一. 新的結果。. (三) 資料使用方式. 本研究中將使用者資料在合理的範圍中運用在推薦上,當然資料的運用. 方式可以更加深入,例如針對擷取幾個成功粉絲頁的發文、留言與連結網址,. 或分享頁面的人脈網絡,去研究 Facebook 粉絲頁上的成功商業模式有何特. 徵,或是使用者的使用行為。. . ‧ 國. 立 政 治 大. 學 ‧. N a. t io na l Chengch i U. ni ve. rs i t. y. 45. 第六章、參考文獻. 中文文獻. [1] 2012 TOPCO 崇越論文大賞,社群網站使用動機及前置因素之研究 -以. Facebook 為例。. [2] 林斐清(2012),應用使用者之 Facebook 社會網絡關係建立協同過濾推薦系統,. 屏東科技大學資訊管理系所,碩士論文。. [3] 李瑞元、蕭丞彥(2012),Facebook 使用者的知覺社群價值之研究,實踐大學. 資訊科技與管理學系碩士班,碩士論文,p. 18-22。. [4] 范姜雅、李晏華、區國良(2012), Facebook 互動內容為基礎之主動式推薦. 系統,國立新竹教育大學數位學習科技研究所,2012 International Conference. on Digital Content. Tainan, Taiwan。. [5] 張筱可(2012),約略集為基礎的關聯法則於網路消費者推薦機制與改變行為. 之研究,淡江大學管理科學學系,碩士論文。. [6] 楊建

參考文獻

相關文件

、牧業生產人員」25,250元最低;屏東縣政府勞動暨青年發展處就業服務台所服務 之求職者平均希望待遇以「4 事務支援人員」、「5 服務及銷售工作人員」、「8 機

高雄市政府勞工局訓練就業中心、鳳山就業服務站、岡山就業服務站、潮州

本刊“99年第3季(7~9月)就業服務統計資訊"主要資料來源為「行政院勞

依據「志願服務法」 、「志願服務證及服務紀錄冊管理辦法」訂定

藝文及運動服務業、休閒服務業工作、製造業工作、批發業及其

依身障者個別需求及職能,109 年截至 6 月底止提供一般性就業服務計推介就業 9,956 人、支持性就業服務計推介就業 1,249 人及推動辦理身心障礙者職務再

機器人、餐飲服務、花藝、雲端運算、網路安全、3D 數位遊戲藝術、旅 館接待、行動應用開發、展示設計、數位建設

服務法第 16 條規定: 「公務員有隸屬關係者,無 論涉及職務與否,不得贈受財物。公務員於所辦事 件,不得收受任何餽贈。」第 18