• 沒有找到結果。

4. 模型介紹

4.4 推薦廣告模組

4.4.1 推薦廣告模組架構

廣告推薦模組是利用先前產生的使用者興趣關鍵字特徵檔,再擷取廣告關鍵 字,最後進行廣告和使用者興趣關鍵字特徵檔相似度比對,取得和目標使用者興 趣相似的廣告做為推薦 (圖 4.30)。

圖 4.30 廣告推薦模組架構

因為本模組是附加在其他模組之下,換言之使用者在使用朋友推薦或是粉絲 團推薦服務時,廣告會出現在畫面之上,為了避免使用者對廣告產生反感,因而

43

在此只推薦三則廣告給目標使用者。

而在擷取廣告關鍵字方面,由於一般文字廣告只會呈現標題、摘要以及網址,

這樣會造成只能擷取到少量的關鍵字,而無法和使用者興趣關鍵字特徵檔做配對 的情況。因此在取得廣告關鍵字之後,我們會先經過詞彙擴充的程序,擴充廣告 的關鍵字之後,再和使用者興趣關鍵字特徵檔做相似度計算。相似度計算在此模 組同樣也用 Jaccard 相似度,最後取得相似度最高的前三則廣告做為推薦。

4.4.2 廣告詞彙擴張

擴充廣告詞彙的方法,本研究利用了 Wikipedia 來做為詞彙擴張的來源。因 為 Wikipedia 擁有豐富的資源,『是一個全球性多語言百科全書協作計劃,同時 也是一部在網際網路上呈現的網路百科全書網站』。

詞彙擴張的步驟如圖 4.31 所示:

首先先將由 Yahoo 關鍵字 API 所得到的廣告關鍵字做為 seed,而後把每個 seed 傳送到 Wikipedia,進入 Wikipedia 的 entry page,利用 Yahoo 的關鍵字 API 取得此頁面的關鍵字,在此設定傳入參數 maxnum 等於 5,選擇此頁面在 Yahoo 關鍵字 API 計算中分數前五高的詞做為擴張的詞彙。

圖 4.31 利用 Wikipedia 從事詞彙擴張

44

4.4.3 產生廣告推薦

本研究利用正規化概念分析以及興趣演算法分析使用者的粉絲團清單,來取 得使用者的興趣關鍵字特徵檔,目標使用者的興趣關鍵字特徵檔和擴張後得到的 廣告特徵檔計算相似度(式 4.1),以及分數後(式 4.2),最後選取三個廣告推薦 給目標使用者。

45

Application Server Apache Tomcat 7.0.22 Database Server My SQL v5.5.17 開發語言工具 Server 端 JAVA 2.0、JSP2.0

Client 端 JavaScript 網頁開發工具 Adobe Dreamweaver CS5

正規化概念分析工具 FCA extension module for MS Excel 2007 based on NodeXL

關鍵字擷取工具 Yahoo 關鍵字 API

5.2 建置雛形系統資料集

為了實作出推薦系統的雛型架構,在本研究一共搜集了 70 位自願受詴者的 粉絲團清單(Like List),作為分析 Facebook 使用者興趣之資料集,這 70 位使用 者帄均每人定閱 44.56 個粉絲團。由於蒐集粉絲團清單牽涉到隱私的問題,故實 驗蒐集之資料都以匿名來保護。

在之後的雛型系統示範,都會以匿名使用者「Nancy」作為目標使用者,模 擬 Nancy 使用本系統的各種情境,包括使用推薦粉絲團系統、使用推薦朋友系統 之情況,而廣告推薦的結果則會依據 Nancy 的興趣關鍵字特徵檔進行推薦,附加

相關文件