• 沒有找到結果。

基於異質性資訊網路表示法學習之電子商務推薦系統 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "基於異質性資訊網路表示法學習之電子商務推薦系統 - 政大學術集成"

Copied!
40
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學資訊科學系 卄卥印卡卲却卭卥卮却 卯卦 千卯卭印卵却卥卲 卓卣卩卥卮卣卥 华卡却卩卯卮卡卬 千卨卥卮卧卣卨卩 单卮卩卶卥卲即卩却卹 碩士論文 卍卡即却卥卲匧即 協卨卥即卩即. 立. 政 治 大. ‧ 國. 學. ‧. 基於異質性資訊網路表示法學習之電子商務 推薦系統 卅匭卣卯卭卭卥卲卣卥 卒卥卣卯卭卭卥卮卤卡却卩卯卮 卓卹即却卥卭即 卂卡即卥卤 卯卮 午卥却卥卲卯卧卥卮卥卯卵即 卉卮卦卯卲卭卡却卩卯卮 华卥却卷卯卲卫 er. io. sit. y. Nat. n. a l 卅卭卢卥卤卤卩卮卧 i v n Ch U engchi. 研 究 生:張伯新 指導教授:蔡銘峰. 中華民國 一百零七 年 七 月 半卵卬卹 匲匰匱匸 DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(2) 匱匰匷. 碩 士 論 文. 立. 政 治 大. ‧. ‧ 國. 學. n. al. er. io. sit. y. Nat. 基 於 異 質 性 資 訊 網 路 表 示 法 學 習 之 電 子 商 務 推 薦 系 統. 政 治 大 學 資 訊 科 學 系. Ch. engchi. i n U. v. 張 伯 新. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(3) 基於異質性資訊網路表示法學習之電子商務推薦系統 卅匭卣卯卭卭卥卲卣卥 卒卥卣卯卭卭卥卮卤卡却卩卯卮 卓卹即却卥卭即 卂卡即卥卤 卯卮 午卥却卥卲卯卧卥卮卥卯卵即 卉卮卦卯卲卭卡却卩卯卮 华卥却卷卯卲卫 卅卭卢卥卤卤卩卮卧 研 究 生:張伯新 指導教授:蔡銘峰. 立. 卓却卵卤卥卮却:卂卯匭卓卩卮 博卨卡卮卧 十卤卶卩即卯卲:卍卩卮卧匭卆卥卮卧 協即卡卩. 國立政治大學 資訊科學 政 治系 碩士論文. 大. ‧ 國. 學 ‧. 十 協卨卥即卩即 即卵卢卭卩却却卥卤 却卯 卄卥印卡卲却卭卥卮却 卯卦 千卯卭印卵却卥卲 卓卣卩卥卮卣卥. Nat. n. er. io. sit. y. 华卡却卩卯卮卡卬 千卨卥卮卧卣卨卩 单卮卩卶卥卲即卩却卹 卩卮 印卡卲却卩卡卬 卦卵卬匜卬卬卭卥卮却 卯卦 却卨卥 卒卥危卵卩卲卥卭卥卮却即 a l 卦卯卲 却卨卥 卤卥卧卲卥卥 卯卦 i v. Ch. e卍卡即却卥卲 ngchi. Un. 卩卮. 千卯卭印卵却卥卲 卓卣卩卥卮卣卥. 中華民國 一百零七 年 七 月 半卵卬卹 匲匰匱匸. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(4) 致謝. 兩年過去,看著自己的論文完成,心中也感到踏實。想當初也算是 誤打誤撞進入政大研究所,從網路前端及繼續進修,我選擇了後者。 現在看起來,除了對於專業領域的更加認識,也或多或少的確信了自 己的定位。當然,這一路要感謝不少師長及親友。. 政 治 大 首先要先感謝我的指導老師匭蔡銘峰老師。幸虧有老師大一的計算 立 機程式設計課程,就開始奠定我後來的程式基礎。到後來的大三大 ‧. ‧ 國. 學. 四的 卅卸卣卨卡卮卧卥 南卯卲卬卤 專案,老師也一路陪伴著我們。研究所的這段求 學過程中,提供了我不少機會發揮。多虧老師引進,讓我有機會能 在 十印印卩卥卲 有難得長達一年半的產學實習,讓我學到不少實務上的經 驗。在碩論題目上,老師也給我很多空間自由發揮,做我自己有興趣 的題目,指導上自由也不失嚴謹。同時也跟上不少業界新訊,對我這 種偏 卅卮卧卩卮卥卥卲 取向的研究生受益良多。跟著老師學習,的確很幸福。. y. Nat. sit. n. al. er. io. 此外,也有許多老師也對我幫助甚多。王釧茹老師帶領 卓卥卡卮 、 卌卥卯 、 和我完成研討會論文。讓只有參與實驗的我,能夠有機會去見見世 面,看看天花板有多高。這著實刺激了我自己的競爭心,我也開始 比較去鑽研許多背後的原理。另外也要感謝劉昭麟老師,雖然現在不 是 卍卉升 實驗室的一份子,大學部的時候專題讓我接觸了自然語言處 理,也作為我現在的研究的基礎。當然,其他政大資科老師們的諄諄 教誨,也是我這一路學習的過程更加順利。. Ch. engchi. i n U. v. 我也感謝實驗室的夥伴們。不管是超 卣卡卲卲卹 的志明, 匴匰匲 守護者 俊翔和文毓,碩一的昇芳、裕勝、聖祐、中研院的 卒十 大家庭。當然 還有我的家人以及好朋友們,有你們力量的結合,才能讓我在研究 過程中,也增添不少青春歡樂。碩士生的旅程將告一段落,也將在人 生面臨更多的挑戰。希望之後能繼續踏穩腳步,發揮自身長才。卌卉卆卅 南卉卌卌 千午十华升卅! 張伯新 國立政治大學資訊科學系 半卵卬卹 匲匰匱匸. 匱. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(5) 基於異質性資訊網路表示法學習之電子商務推薦系統. 中文摘要 近年來由於龐大的資料量,電子商務的商品推薦變成一項具有挑戰 性的工作。因此,我們使用了異質性資訊網路表示法學習(午卥却卥卲卯卧卥卮卥卯卵即 卉卮卦卯卲卭卡却卩卯卮 华卥却卷卯卲卫 卅卭卢卥卤卤卩卮卧),能夠將網路上不同類型的節點及之 間的關係投影到低維度向量空間,以進行電子商務相關的產品推薦工 作。本論文提出了一個基於異質性資訊網路表示法學習的電子商務推 薦系統,能夠更有效地整合額外資訊(卍卥却卡 卉卮卦卯卲卭卡却卩卯卮)。首先,我 們萃取標題的詞彙並與商品鏈結,再加入使用者過去的歷史紀錄轉換 成異質性資訊網路。從這個網路中,我們可以使用各式各樣的網路表 示法學習方法訓練,並在同一個向量空間中學習使用者及商品的表示 式。除此之外,我們更將學習到的表示法當做特徵值,結合矩陣分解 (卍卡却卲卩卸 卆卡卣却卯卲卩卺卡却卩卯卮)及排序學習(卌卥卡卲卮卩卮卧 却卯 卒卡卮卫)的做法,來達 到有效地推薦商品的目的。在實際電商 十卭卡卺卯卮 的資料集中,此論文 的方法能使推薦的效果有所提升。另外,此方法也能夠有效改善電子 商務推薦系統所重視的覆蓋率(千卯卶卥卲卡卧卥)表現。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 匲. i n U. v. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(6) 卅匭卣卯卭卭卥卲卣卥 卒卥卣卯卭卭卥卮卤卡却卩卯卮 卓卹即却卥卭即 卂卡即卥卤 卯卮 午卥却卥卲卯卧卥卮卥卯卵即 卉卮卦卯卲卭卡却卩卯卮 华卥却卷卯卲卫 卅卭卢卥卤卤卩卮卧. Abstract 卉卮 卲卥卣卥卮却 卹卥卡卲即匬 卅匭卣卯卭卭卥卲卣卥 印卲卯卤卵卣却 卲卥卣卯卭卭卥卮卤卡却卩卯卮 卨卡即 卢卥卥卮 卡 卣卨卡卬匭 卬卥卮卧卩卮卧 却卡即卫 卤卵卥 却卯 卩却即 卤卡却卡 即印卡卲即卩却卹 卡卮卤 卶卯卬卵卭卥匮 午卥却卥卲卯卧卥卮卥卯卵即 卩卮卦卯卲卭卡却卩卯卮 卮卥却卷卯卲卫 卥卭卢卥卤卤卩卮卧 卥卮卣卯卤卥即 却卨卥 卮卯卤卥 卩卮卦卯卲卭卡却卩卯卮 卩卮却卯 卬卯卷匭卤卩卭卥卮即卩卯卮即 卶卥卣却卯卲 即印卡卣卥 卦卲卯卭 卤卩匛卥卲卥卮却 却卹印卥即 卯卦 卮卯卤卥即 卡卮卤 却卨卥卩卲 卣卯卲卲卥即印卯卮卤卩卮卧 卲卥卬卡却卩卯卮即匮 卉卮 却卨卩即 印卡印卥卲匬 卷卥 印卲卯印卯即卥 卡卮 卅匭卣卯卭卭卥卲卣卥 印卲卯卤卵卣却 卲卥卣卯卭卭卥卮卤卡却卩卯卮 卭卥却卨卯卤 卢卡即卥卤 卯卮 却卨卥 卨卥却卥卲卯卧卥卮卥卯卵即 卮卥却卷卯卲卫 卥卭卢卥卤卤卩卮卧匮 卆卩卲即却匬 卷卥 卩卮卣卯卲印卯卲卡却卥 卷卯卲卤即 卦卲卯卭 印卲卯卤卵卣却 却卩却卬卥 卡即 却卨卥 卡却却卲卩卢卵却卥即 卯卦 却卨卥 卩却卥卭匮 協卨卥卮匬 卷卥 却卲卡卮即卦卯卲卭 卷卯卲卤即匬 卡卮卤 卵即卥卲 卢卥卨卡卶卩卯卲 卩卮却卯 卨卥却卥卲卯卧卥卮卥卯卵即 卮卥却卷卯卲卫 卦卯卲 卅匭卣卯卭卭卥卲卣卥匮 卆卯卲 却卨卩即 卮卥却卷卯卲卫匬 卷卥 卵即卥 卶卡卲卩卯卵即 卮卥却卷卯卲卫 卥卭卢卥卤卤卩卮卧 卭卥却卨卯卤即 却卯 卬卥卡卲卮 卢卯却卨 卵即卥卲 卡卮卤 卩却卥卭 卲卥印匭 卲卥即卥卮却卡却卩卯卮即 卩卮 却卨卥 即卡卭卥 卬卡却卥卮却 即印卡卣卥匮 卍卯卲卥卯卶卥卲匬 卷卥 卩卮却卥卧卲卡却卥 却卨卥 卬卥卡卲卮卥卤 卥卭卢卥卤卤卩卮卧 卡即 却卨卥 卦卥卡却卵卲卥即 卩卮却卯 卍卡却卲卩卸 卆卡卣却卯卲卩卺卡却卩卯卮 卡卮卤 卌卥卡卲卮卩卮卧 却卯 卒卡卮卫匮 協卨卥 卥卸印卥卲卩卭卥卮却 卲卥即卵卬却即 即卨卯卷 却卨卡却 卷卥 卩卭印卲卯卶卥 却卨卥 卲卥卣卯卭卭卥卮卤卡却卩卯卮 危卵卡卬卩却卹 卯卮 十卭卡卺卯卮 卤卡却卡即卥却匮 十卬即卯匬 卷卥 卤卥卭卯卮即却卲卡却卥 卯卵卲 卭卯卤卥卬 卣卡卮 印卥卲卦卯卲卭 卢卥却却卥卲 卩卮 却卥卲卭即 卯卦 卣卯卶卥卲卡卧卥匬 却卨卥 卦卯卣卵即 卯卦 卅匭卣卯卭卭卥卲卣卥 卲卥卣卯卭卭卥卮卤卡却卩卯卮 即卹即却卥卭即匮. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 匳. i n U. v. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(7) 目錄 致謝. 1. 中文摘要. 2. Abstract 第一章 緒論 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 第二章 相關文獻探討 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匲匮匱 推薦系統 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匲匮匲 網路表示法學習 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 第三章 研究方法匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匳匮匱 問題定義 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匳匮匲 異質性資訊網路表示法學習 匮 匮 匮 匮 匮 匮 匮 匮 匳匮匲匮匱 建圖策略 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匳匮匲匮匲 卄卥卥印卷卡卬卫 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匳匮匲匮匳 卌卉华卅 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匳匮匲匮匴 午卐卅 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匳匮匲匮匵 卭卥却卡印卡却卨匲卶卥卣 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匳匮匳 推薦模型 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 第四章 實驗結果與討論 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匴匮匱 資料集 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匴匮匲 實驗設定 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匴匮匳 評估標準 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匴匮匴 實驗結果 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匴匮匴匮匱 準確率及召回率表現 匮 匮 匮 匮 匮 匮 匮 匮 匴匮匴匮匲 覆蓋率表現 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匴匮匴匮匳 建圖策略比較 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匴匮匴匮匴 案例分析匭網路表示法學習 匮 匮 匮 匮 匮 匴匮匴匮匵 案例分析匭推薦系統 匮 匮 匮 匮 匮 匮 匮 匮 匮 第五章 結論 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮. n. engchi. 匴. y. sit. er. io. Ch. ‧. Nat. al. 學. ‧ 國. 立. 3 匱 匴 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匴 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匵 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匷 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匷 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匸 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匸 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匹 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匱匰 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匱匱 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匱匲 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匱匳 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匱匵 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匱匵 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匱匶 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匱匸 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匱匸 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匱匸 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匲匰 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匲匲 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匲匲 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匲匵 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匲匷. 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 政 治 大 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮. i n U. v. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(8) 圖目錄 此論文的推薦系統架構圖 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮. 匲. 圖 匳匮匱 電子商務的異質性資訊網路 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 圖 匳匮匲 卌卉华卅的相似度關係 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 圖 匳匮匳 卍卥却卡匭印卡却卨 的序列生成例子 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮. 匸 匱匰 匱匲. 圖 匴匮匱. 匲匴. 政 治 大. 網路表示法的視覺化呈現 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮. 立. 學 ‧. ‧ 國 io. sit. y. Nat. n. al. er. 圖 匱匮匱. Ch. engchi. 匵. i n U. v. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(9) 表目錄 表 匲匮匱. 使用者 − 商品的評分數據範例 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮. 匴. 表 匴匮匱 表 匴匮匲 表 匴匮匳 表 匴匮匴 表 匴匮匵 表 匴匮匶 表 匴匮匷 表 匴匮匸. 十卭卡卺卯卮 資料集數據統計 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 却卯印匭匱匰 推薦結果(卍卯卶卩卥即匬 午卯卭卥匬 卅卬卥卣却卲卯卮卩卣即) 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 却卯印匭匱匰 推薦結果(千卥卬卬 卐卨卯卮卥即匬 千卬卯却卨卩卮卧匬 千卄即) 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 覆蓋率評估 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 有無文字建圖方式的推薦結果比較(卍卯卶卩卥即匬 午卯卭卥匬 卅卬卥卣却卲卯卮卩卣即) 匮 有無文字建圖方式的推薦結果比較(千卥卬卬 卐卨卯卮卥即匬 千卬卯却卨卩卮卧匬 千卄即) 網路表示法學習的案例分析 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 推薦系統的案例分析 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮 匮. 匱匵 匱匹 匱匹 匲匰 匲匱 匲匱 匲匳 匲匵. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 匶. i n U. v. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(10) 第一章 緒論 在網際網路時代,人們的購買行為已經開始轉變。漸漸地習慣透過網路上. 政 治 大 勃發展,商品資料及使用者紀錄被大量地產生。如何將使用者及商品有效地連 立 結,變成一項重要的研究議題。因此,推薦系統(卒卥卣卯卭卭卥卮卤卡却卩卯卮 卓卹即却卥卭)在目 琳琅滿目的物品資訊、方便的服務平台來購買商品。隨著電子商務平台的蓬. 學. ‧ 國. 前電子商務平台裡扮演著重要的角色。透過演算法或機器學習模型,幫助使用 者找到或發現有興趣的商品。推薦系統通常分為三種,協同過濾(千卯卬卬卡卢卯卲卡却卩卶卥. ‧. 卆卩卬却卥卲卩卮卧)卛匱卝 、基於內容推薦(千卯卮却卥卮却匭卂卡即卥卤 卒卥卣卯卭卭卥卮卤卡却卩卯卮)卛匲卝 與混合式推薦. y. Nat. (午卹卢卲卩卤 卒卥卣卯卭卭卥卮卤卡却卩卯卮)卛匳卝。協同過濾藉由用戶的歷史紀錄,像是評分、點 擊、購買等行為,再利用興趣類似的用戶群的喜好來推薦。基於內容推薦利用物. sit. 品的屬性,像是標題、類別、品牌等離散特徵推薦類似的物品。混合式推薦則是. al. er. io. 融合上述兩項方法,以達到更好的推薦效果。而隨著網路服務的快速成長,更多. n. 的物品資料及紀錄能被推薦系統所利用。雖然這些資料隱含著許多豐富的資訊, 但如何同時將龐大的資料及之間的關係儲存,並考慮計算複雜度的成本,是一個 相當具有挑戰性的任務。. Ch. engchi. i n U. v. 由於實作上的彈性及優異的效果,表示法學習(卅卭卢卥卤卤卩卮卧)卛匴卝 在人工智慧 的許多問題中被廣泛地使用。表示法學習的技術主要是將一個物件的屬性或鄰近 資訊壓縮成一個向量。例如像在自然語言處理領域中, 卷卯卲卤匲卶卥卣 卛匵卝 透過類神經 網路學習每個字詞的向量表示式。由於方便應用及具有延展性,已經在許多機器 學習任務裡廣泛地應用。而在電子商務裡,如何學習每個使用者、商品的表示法 應用在推薦上,仍是目前實務上的一大挑戰。 社群網路分析中,網路表示法學習(华卥却卷卯卲卫 卅卭卢卥卤卤卩卮卧)是目前新的研究 主題方向。我們可以把用戶及連接關係建成一張圖。基於這張圖,我們可以 運用類似於詞向量的想法,將網路節點投影到低維向量空間中。目前有許多基 於 卷卯卲卤匲卶卥卣 的網路表示式學習框架,像是 卄卥卥印南卡卬卫 卛匶卝、卌卉华卅 卛匷卝、卮卯卤卥匲卶卥卣 卛匸卝 等 方法,都被廣泛應用於資料探勘、資訊檢索的工作上。但是,大部份的網路表示 法學習框架,往往是應用在同質性網路,而無法有效地將不同類型的節點投影到 匱. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(11) 同一個空間。 異質性網路(午卥却卥卲卯卧卥卮卥卯卵即 卉卮卦卯卲卭卡却卩卯卮 华卥却卷卯卲卫)是一種包含了多種型態的 節點及鏈結的有向圖。在實務應用中,多數系統都具有多種型態的節點及關係交 互作用。像是社群媒體就有像是使用者、文章、標籤、地點等多種類型節點,以 及他們的複雜交互關係。像是使用者可以對一篇文章按讚、一篇文章有著多個標 籤等關係。而推薦系統也有使用者、商品、評論、品牌等類型節點可以利用。透 過異質性網路建模是相當自然的一件事情。且這些數據的多樣性可以為目前現有 的模型增添更多豐富的資訊。 然而在電子商務中,使用者的數量及商品的數量都是相當龐大的。實務上, 一位使用者往往只會與一個到數個的商品有互動紀錄,而造成資料的稀疏性 (卓印卡卲即卩却卹)。傳統的推薦模型如矩陣分解(卍卡却卲卩卸 卆卡卣却卯卲卩卺卡却卩卯卮),效果往往會 受到稀疏性的影響而降低。而許多現有的模型中,往往是根據均方根誤差(卒卯卯却. 政 治 大 卍卥卡卮 卓危卵卡卲卥 卅卲卲卯卲)做評分。這樣只往往考慮到推薦系統的準確性而忽略了實際 立 應用情境。在電子商務的推薦情境中,我們所關注的是使用者有興趣購買的商 ‧. ‧ 國. 學. 品,使用者也只會看前一兩頁的推薦商品去下單。所以如何讓使用者「看到」喜 歡的商品的機會增加,變成是在電子商務推薦系統中重要的課題。. Nat. y. Graph Construction. n. al. Network Embedding Learning. User Features . Ch. er. io. sit. I. Graph Construction. II. Feature Learning. Item Features. engchi. User Representation . i n U. v. User­Item Interaction. Item Representation . Prediction Score & Ranking . III. Recommendation model. WMRB Loss . 圖 匱匮匱区 此論文的推薦系統架構圖。主要分成三大階段,第一階段是將資料轉換成 異質性網路。第二階段則是學習異質性網路表示法。第三階段再透過第二階段學 出的使用者特徵值及商品特徵值,透過 卌卥卡卲卮卩卮卧 却卯 卒卡卮卫 的方式訓練矩陣分解模 型,進而達到推薦商品的目的。 此論文嘗試針對電子商務推薦系統制定一個泛用的建圖策略,將使用者、商 匲. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(12) 品、文字結合成異質性網路中。再透過網路表示法學習,將節點投影到同一個向 量空間。只不過學習出來的表示式,並沒有辦法被直接應用到推薦系統上。所以 我們更嘗試著將學習到的表示法結合矩陣分解(卍卡却卲卩卸 卆卡卣却卯卲卩卺卡却卩卯卮)以及排序學 習(卌卥卡卲卮卩卮卧 却卯 卒卡卮卫)作為我們推薦的模型。透過監督式的學習,我們可以將使 用者評分、點擊、購買的紀錄結合網路表示式,以達到混合式的 却卯印匭华 推薦(如 圖匱匮匱)。在電子商務平台 十卭卡卺卯卮 這個真實世界的資料集中,此方法皆能使推薦 的效果有所提升。另外,此方法在覆蓋率(千卯卶卥卲卡卧卥)的表現也明顯優於其他方 法,帶動整體商品的流通。我們認為這樣有助於電商平台的營業額提升。此研究 主要的貢獻整理如下: • 我們提出了一個針對商品推薦的建圖方法,再透過網路表示法學習訓練使用 者及商品的表示式,作為推薦系統的初始特徵值。. 治 政 • 我們提出了一個結合異質性網路表示法的推薦方法,融合了個人化推薦及基 大 立 於內容推薦的優點,以達到改善現行推薦系統的效果。 ‧ 國. 學. 之後的論文章節安排如下:第二章介紹相關的文獻研究。第三章提出此論文 的研究方法及模型。第四章敘述我們所使用的資料集、實驗設定、以及實驗結. ‧. 果。最後第五章是我們對此研究的結論。. n. er. io. sit. y. Nat. al. Ch. engchi. 匳. i n U. v. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(13) 第二章 相關文獻探討 推薦系統. 立. 學. ‧ 國. 2.1. 政 治 大. 許多方法結合使用者對於商品的評分,來增進推薦系統的準確性。基於矩陣 分解(卍卡却卲卩卸 卆卡卣却卯卲卩卺卡却卩卯卮)的協同過濾系統(千卯卬卬卡卢卯卲卡却卩卶卥 卆卩卬却卥卲卩卮卧) 卛匹卝 是目前. ‧. 業界最普遍使用的技術。目標是透過興趣相似的群體的喜好,來推薦使用者感興 趣的資訊或商品。而在電子商務中,可以根據使用者的行為來推薦他可能喜歡的. y. Nat. 商品。像是利用瀏覽、點擊、購買、評論的行為,來量化每個使用者對於不同資. sit. 訊的喜好強弱。矩陣分解是將一個矩陣分解成兩個或多個矩陣的乘積。假設我們. n. al. er. io. 有 m 個使用者、 n 個商品,在推薦系統中,我們常會把使用者對商品的評分數據 紀錄成下列形式:. Ch u1 u2 u3 u4. ei匲 n ig ci匴h ii 1. 2. 匵 匱. 匳 匵 匵. 3. 4. i n U. v. 匵 匴. 表 匲匮匱区 使用者 − 商品的評分數據範例 我們利用上述的資料,建構使用者 − 商品矩陣 Xm×n 。假設分解成兩個 矩陣 Pm×k 和 Qk×n ,我們要使矩陣 Pm×k 和 Qk×n 的乘積能夠接近原本的矩 陣 Xm×n 。. ˆ m×n Xm×n ≈ Pm×k × Qk×n = X. 匨匲匮匱匩. 矩陣分解能分解出使用者和商品的潛在因素(卌卡却卥卮却 卆卡卣却卯卲)。並透過學習出 來的潛在因素,去預測使用者對於沒有評分的商品的喜好程度。雖然說矩陣分解 匴. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(14) 的技術在很多應用獲得好的效果,但是當使用者只對極少的物品評分時,往往會 遇到資料過於稀疏的挑戰。而在真實世界中,這是一個經常會發生的問題。 近年來,網際網路的快速發展,平台上有許多使用者、物品的額外資訊 (卍卥却卡 卉卮卦卯卲卭卡却卩卯卮),研究者發現這些額外資訊對於個人化推薦有極大的幫助。 因此開始有研究開始結合這些資訊,來改進推薦系統的準確性。有一部份的研究 利用使用者對於商品的評論,來掌握使用者對於商品的偏好及習慣。像是 卌卩卮卧 等 人 與 卍卣十卵卬卥卹 等人利用主題模型(協卯印卩卣 卍卯卤卥卬卩卮卧)的技術,找出評論文字與 評分的關係並加以利用 卛匱匰匬 匱匱卝。為了利用文字語義資訊, 博卨卡卮卧 等人則是結 合 卷卯卲卤匲卶卥卣 和傳統矩陣分解的作法,以提升個人化推薦的效果 卛匱匲卝。 除了文字資訊之外,許多研究加入圖像資料來學習使用者的喜好。像 是 卍卣十卵卬卥卹 等人使用了圖像特徵值來加強協同過濾的準確性 卛匱匳卝 。 午卥 等人則是 針對 却卯印匭华 的推薦,建立了基於圖像的 卂卡卹卥即卩卡卮 卐卥卲即卯卮卡卬卩卺卥卤 卒卡卮卫卩卮卧(卂卐卒) 模. 政 治 大 型 卛匱匴卝 ,另外他們也針對了衣物穿搭的圖像特徵以及歷史紀錄學習使用者品味, 立 以加強在商品風格的推薦 卛匱匵卝 。. ‧ 國. 學. 近幾年的推薦問題研究,也有不少使用深度學習框架。像是 午卥 等人提出. ‧. 通用的神經網路模型,來代替內積對使用者 − 商品的互動建模 卛匱匶卝 。 博卨卥卮卧 等 人等人利用卷積神經網路(千卯卮卶卯卬卵却卩卯卮卡卬 华卥卵卲卡卬 华卥却卷卯卲卫),從使用者、商品的 評論中學習使用者、商品的表示法,再結合矩陣分解模型完成評分預測的任. Nat. sit. y. 務 卛匱匷卝 。 博卨卡卮卧 等人則是將文字、圖像、評分的資訊串接,經由多層神經網路學. er. io. 習使用者及物品的表示式以便後面的 却卯印匭华 的 印卡卩卲匭卷卩即卥 學習排序推薦 卛匱匸卝 。 卓卨卩 等 人則是使用了異質性資訊網路表示法當作特徵值,來加強評分預測任務的準確. al. n. v i n Ch 預測去做優化。而在電子商務的推薦情境中,使用者是否購買商品與使用者評分 engchi U 的高低並沒有直接的關係。而在有商品資訊的情況之下有一個通用的推薦策略,. 性 卛匱匹卝 。雖然這些方法利用額外資訊加入推薦系統,但許多方法往往是針對評分. 能帶給電商平台更多的收益,這也是此論文框架所想要達到的目的。. 2.2. 網路表示法學習. 在自然語言處理、文字探勘中,詞向量(南卯卲卤 卅卭卢卥卤卤卩卮卧)已經成為一種 常用的文本特徵值且得到廣泛的應用。在另一方面,網路表示法學習(华卥却卷卯卲卫 卅卭卢卥卤卤卩卮卧)希望透過網路結構的鏈結,得到網路節點的向量表示法,作為後續 任務的特徵值。 卐卥卲卯卺卺卩 等人學習了 卷卯卲卤匲卶卥卣 的精神,將網路結構透過隨機走 動的方法,轉換成類似自然語言句子的節點序列。再通過 即卫卩印匭卧卲卡卭 訓練得到每 個網路節點的向量表示法 卛匶卝 。 升卲卯卶卥卲 等人定義了另外一種基於深度優先搜尋 (卄卥印却卨匭匜卲即却 即卥卡卲卣卨)及廣度優先搜尋(卂卲卥卡卤却卨匭匜卲即却 即卥卡卲卣卨)的走動策略,以實現 更有彈性的框架彈性 卛匸卝 。此外, 協卡卮卧 等人則是提出了明確的目標函式去優化網 匵. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(15) 路表示法學習問題 卛匷卝 。另外,也有不少工作結合節點的資訊訓練網路表示法。 像是 卙卡卮卧 等人結合了 協卆匭卉卄卆 文字特徵值矩陣,以學到含有更多文字資訊的表示 式 卛匲匰卝 。 協卵 等人則是結合了節點 卬卡卢卥卬 資訊及支持向量機器的損失函式,使表示 法學習帶有具鑑別分類的特徵 卛匲匱卝 。 但是,絕大部分的網路表示法學習方法,往往是針對同質性網路。而在異質 性網路中,由於稀疏性及雜訊都比同質性網路高上許多,若直接套用上述等方法 訓練模型,往往無法達到很好的效果。因此開始有針對異質性網路表示法學習的 研究出現。 千卨卡卮卧 等人利用多層嵌入函式的架構,學習異質性網路中資料複雜的 交互關係 卛匲匲卝 。 卄卯卮卧 等人則是利用元路徑(卍卥却卡匭印卡却卨)的方式去決定每個節點 的 卣卯卮却卥卸却 ,再使用異質性 即卫卩印匭卧卲卡卭 模型訓練每個節點的表示式 卛匲匳卝 。此論文將 會利用 卛匲匳卝 的方法訓練異質性網路表示法。在第三章中,我們會再詳細地介紹如 何定義及實現。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 匶. i n U. v. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(16) 第三章 研究方法. 治 政 在此章節,我們將會詳細地介紹我們的方法。在 大匳匮匱 小節我們會先定義我們 立 所要解決的問題。 匳匮匲 小節介紹如何學習我們如何建構異質性網路及訓練網路表 ‧ 國. 問題定義. ‧. 3.1. 學. 示法。最後 匳匮匳 小節我們則是講述如何結合網路表示法,實作混合式推薦模型。. y. Nat. sit. 我們將系統化地闡述我們想要解決的問題。我們表示使用者集合為 U 、表示. io. 商品集合為 I 。在訓練資料中,紀錄著使用者 u 與商品 i 有正向互動(可能是瀏. n. al. er. 覽、點擊、購買等行為),每個使用者會有一至數對互動關係 (u, i) ∈ U × I 。在 這邊我們定義 S 為我們觀察到的所有使用者 − 商品集合。而我們的框架想要優化. Ch. engchi. 的是下列抽象的損失函式(卌卯即即 卆卵卮卣却卩卯卮):. L=. i n U. g(u, iu , i¯u ). X. v. 匨匳匮匱匩. (u,iu )∈S. 其中 g(·) 代表的是我們定義的排序損失函式(卒卡卮卫卩卮卧 卌卯即即 卆卵卮卣却卩卯卮)。 (u, iu ) 是 正向的使用者 − 商品互動(使用者 u 購買了商品 iu )。 (u, i¯u ) 為負向的使用 者 − 商品互動(使用者 u 沒有購買 i¯u )。我們希望訓練模型,使得正向的使用 者 − 商品互動的預測分數大於負向的使用者 − 商品互動的預測分數。而這邊需要 注意的是,在訓練模型的時候,我們只在意排序是否正確,而預測的分數將只會 是相對的大小。. 匷. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(17) 異質性資訊網路表示法學習. 3.2. 首先,我們先定義異質性資訊網路。異質性資訊網路(午卥却卥卲卯卧卥卮卥卯卵即 卉卮匭 卦卯卲卭卡却卩卯卮 华卥却卷卯卲卫)是一種具有多種節點型態的特殊資訊網路。一個異質性網 路可以表示成 G = {V, E, T } ,節點集合 V 、連結集合 E ,以及對應的型態集 合 T 。 T 代表了節點的型態集合,並且 |T | > 2。. Title. User. 立. 政 治 大. Category. Item. ‧ 國. 學. Brand. sit. y. ‧. Nat. 圖 匳匮匱区 電子商務的異質性資訊網路. al. er. io. 舉例來說,電子商務的購物行為可以表示成圖 匳匮匱 的網路。使用者(卵即卥卲)、. n. 商品(卩却卥卭)、標題(却卩却卬卥)、類別(卣卡却卥卧卯卲卹)、品牌(卢卲卡卮卤)為節點。而連結 代表的意義是購買(卵即卥卲匭卩却卥卭),抑或是商品屬性(卩却卥卭匭却卩却卬卥匬 卩却卥卭匭卣卡却卥卧卯卲卹匬 卩却卥卭匭. Ch. engchi. i n U. v. 卢卲卡卮卤)。在此小節中,我們的目標是讓每個商品節點 v 學習一個好的低維度表示 法 ev 。. 3.2.1. 建圖策略. 處理機器學習的問題的過程中,除了模型之外,訓練資料的品質好壞也會直 接影響我們預測任務的結果。訓練網路表示法學習的時候,我們的輸入就是一張 網路。而現實世界的資料往往不是以網路的方式儲存,我們需要進行透過演算法 將原本的資料轉換成網路。在此小節我們提供了一個泛用的策略,將使用者 − 商 品紀錄以及商品標題、商品後設資訊等資料轉換成異質性資訊網路。 首先,我們的輸入是使用者的歷史紀錄,並將每個使用者 − 商品互動關係 建邊。再來是將商品的標題斷詞,並經過一些前處理過濾辭彙。這邊可以依據情 境做客製化調整,我們建議將純數字、停用詞去除。前處理之後,再將每個商 匸. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(18) 品 − 辭彙關係建邊。另外,如果有其他可以利用的商品屬性,我們也可以利用類 似於商品標題的方式建邊。像是品牌、發行商、作者等,我們都認為是可以利用 的額外資訊。完整的演算法框架我們列於 十卬卧卯卲卩却卨卭 匱 。 Algorithm 1 建圖演算法 Input: 協卨卥 卵即卥卲即 即卥却 U 医 協卨卥 卩却卥卭即 即卥却 I医 協卨卥 卵即卥卲匭卩却卥卭 卨卩即却卯卲卹 印卡卩卲即 S医 協卨卥 即卥却 卯卦 卩却卥卭 却卩却卬卥即 T 医 協卨卥 即卥却 卯卦 卩却卥卭 卵即卥卦卵卬 卡却却卲卩卢卵却卥即 M 匨卢卲卡卮卤匬 印卵卢卬卩即卨卥卲匬 卥却卣匮匩医 Output: 協卨卥 卥卤卧卥卬卩即却 卯卦 卨卥却卥卲卯卧卥卮卥卯卵即 卩卮卦卯卲卭卡却卩卯卮 卮卥却卷卯卲卫匬 卤卥卮卯却卥卤 卢卹 E匮 for 卥卡卣卨 印卯即卩却卩卶卥 印卡卩卲 (u, iu ) ∈ S do 卡印印卥卮卤 (u, i) 卩卮却卯 E end for for 卥卡卣卨 卩却卥卭 i 卩卮 I do 卷卯卲卤即 W 匽 却卯卫卥卮卩卺卥 匨Ti 匩 印卲卥印卲卯卣卥即即卩卮卧 匨W匩 for 卥卡卣卨 卷卯卲卤 w 卩卮 W do 卡印印卥卮卤 (i, w) 卩卮却卯 E end for for 卥卡卣卨 卡却却卲卩卢卵却卥 m 卩卮 Mi do 卡印印卥卮卤 (i, m) 卩卮却卯 E end for end for return E. ‧. ‧ 國. 立. 政 治 大. 學. 匱区 匲区 匳区 匴区 匵区 匶区 匷区 匸区 匹区 匱匰区 匱匱区 匱匲区 匱匳区 匱匴区 匱匵区. y. Nat. sit. er. io. 在電子商務的資料中,商品會有像是標題、標籤、品牌等有用的離散特徵。 透過我們的建圖策略,對於後續的網路表示法學習來說,除了能學到使用者與商 品之間的鏈結關係之外,購買紀錄較少的商品也能透過文字的鄰居共享,拉近與. n. al. i n U. v. 相似商品的距離。我們認為能夠使推薦模型推薦新上架或較為冷門的商品的可能. Ch. engchi. 性上升,提高整體推薦系統的品質。. 生成 E 之後,我們等同得到異質性網路 G 。再來,我們挑選了四種網路表示 法學習方法訓練使用者及商品的表示法。分別為 卄卥卥印卷卡卬卫 、 卌卉华卅 、 午卐卅 、以 及 卭卥却卡印卡却卨匲卶卥卣 。學習到的表示式,我們將會當作 匳匮匳 小節中推薦模型的初始特 徵值。. 3.2.2. Deepwalk. 卄卥卥印卷卡卬卫 卛匶卝 學習了 卷卯卲卤匲卶卥卣 的精神,將網路結構透過隨機走動的方法,轉 換成類似自然語言句子的節點序列。我們再通過 即卫卩印匭卧卲卡卭 訓練得到每個網路節點 的向量表示法。我們給定網路 G ,我們將會針對生成的節點序列,優化以下機率 分佈:. 匹. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(19) X. arg max θ. X. 匨匳匮匲匩. log p(c|v; θ). v∈V c∈N (v). 且定義條件機率 p(c|v; θ) : y Oc ·Ov p(c|v; θ) = P Ou ·Ov u∈V y. 匨匳匮匳匩. 其 中 N (v) 是 節 點 v ∈ V 的 鄰 居 節 點 。 c 則 是 代 表 節 點 中 v 的 卣卯卮匭 却卥卸却 。 Ov 為 v 的向量表示法, Oc 是 卣卯卮却卥卸却 的向量表示法。雖然想法不難, 但學習出的表示法在分類、連結預測等問題有不錯的效果。也因為實作快速,也 在實務的工作上有許多應用。. 立. LINE. 學. ‧ 國. 3.2.3. 政 治 大. 卌卉华卅 卛匷卝 則是提出了明確的目標函式,優化網路表示法學習問題。一種為一. ‧. 階相似度(卆卩卲即却匭卯卲卤卥卲 卐卲卯卸卩卭卩却卹),就是當兩點直接連接,或連接的權重大的時 候,則兩個點愈相似。另一種為二階相似度(卓卥卣卯卮卤匭卯卲卤卥卲 卐卲卯卸卩卭卩却卹),當兩點. n. al. er. io. sit. y. Nat. 有很多共同鄰居的時候,則他們的相似度很高。我們以圖 匳匮匲 來做解釋:. C. Ch. engchi. i n U. G. v. H. D. A. B. I. E. J F. 圖 匳匮匲区 卌卉华卅的相似度關係 就一階相似度而言, 十 點和 卂 點是相似的( 十 和 卂 直接相連)。而就二階 相似度來說, 十 點則會跟 升 點比較相似(共享了 千 、 卄 、 卅 、 卆 點鄰居)。 匱匰. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(20) 在此論文中,我們使用 卌卉华卅 的二階相似度。每個節點扮演了兩個角色:節 點本身以及其他節點的 卣卯卮却卥卸却 針對每個有向邊 (vi , vc ) ,我們定義 vi ,他所擁有 的 卣卯卮却卥卸却 節點 vc 的條件機率為: exp(Ovc · Ovi ) vk ∈V exp(Ovk · Ovi ). 匨匳匮匴匩. X. 匨匳匮匵匩. p(vj |vi ) = P 並優化以下目標函式:. OLIN E = −. wi,j log p(vj |vi ). (i,j)∈P. 其中 P 代表我們抽樣到的邊集合, Ovi 為 vi 的向量表示法, Ovc 是 卣卯卮却卥卸却 節. 政 治 大. 點 vc 的 卣卯卮却卥卸却 向量表示法。 wi,j 則是代表邊的權重。. 立. ‧ 國. HPE. 學. 3.2.4. ‧. 午卐卅 卛匲匴卝 則是類似於上述兩項工作,但對於網路表示法學習有做些許的變. y. Nat. 化。不像 卄卥卥印卷卡卬卫 照著均勻分布隨機走動,為了學習使用者的偏好, 午卐卅 透過 有權重的隨機走動生成訓練對。拿圖 匳匮匲 當例子,在抽樣 十 點的正向對時,假. sit. 設我們抽到 卂 點當作 十 點的 卣卯卮却卥卸却 ,那我們也會同時抽樣 卂 點的正向對(像. er. io. 是 十 、 午 、 卉 、 半 點)當作 十 點的 卣卯卮却卥卸却 。代表著抽樣的時候除了直接連接的 節點之外,也能透過有權重的隨機走動,接收間接連接的節點 卣卯卮却卥卸却 。 午卐卅 根 據異質性網路抽樣更新節點表示式 Ovi ,並定義條件機率:. n. al. Ch. engchi. i n U. v.  1 if v ∈ Context(v ) j i P (vj |Ovi ) = 0. 匨匳匮匶匩. 類似於 卌卉华卅 , 午卐卅 優化以下目標函式: OHP E = −. X. wi,j log p(vj |Ovi ) + λ. X. |Ovi |2. 匨匳匮匷匩. (i,j)∈P. 其中 P 代表我們抽樣到的邊集合, wi,j 則是代表邊的權重。另外,有加入正 規化參數,以避免過適(协卶卥卲匜却却卩卮卧)的問題發生。. 匱匱. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(21) 3.2.5. metapath2vec. 另外,我們也挑選 卭卥却卡印卡却卨匲卶卥卣 卛匲匳卝 的方法來學習異質性網路表示法。由於 每個節點有其節點類別,因此我們可以依據不同的元路徑(卍卥却卡匭印卡却卨)去限制隨 機走動的序列。給定一個異質性網路,我們定義元路徑 ρ 為下式:. R. R. R`−1. R. 匨匳匮匸匩. 1 2 t ρ = A1 −→ A2 −→ . . . At −→ At+1 . . . −−−→ A`. ` 為 元 路 徑 的 長 度 , A = A1 , A2 , . . . , A` 為 此 元 路 徑 所 走 動 會 經 過 的 型 態, R = R1 , R2 , . . . , R`−1 代表在 A1 到 A` 節點型態之間的關係。給定元路徑 ρ 及 異質性網路 G ,我們根據下式機率分佈產生走動序列:. 立 |v , ρ) = 0 k. k+1. k. k+1 ). = At+1 匨匳匮匹匩. (vk+1 , vk ) ∈ E, φ(vk+1 ) 6= At+1 (vk+1 , vk ) ∈ /E. 學.    0. ‧ 國. P (vk+1. 政 治 大 (v , v ) ∈ E, φ(v.  1     |N (At+1 ,vk )|. ‧. 其中 vk 是在序列中第 k 個的節點, At 為 vk 的節點型態 , N (At+1 , v) 代表的 是 v 型態為 At+1 的鄰居個數。元路徑走動會根據事前定義好的路徑 ρ 重複產生序. sit. n. al. er. io. U1. y. Nat. 列,直到達到我們指定的長度參數,才停止走動。. I1. U2 I2. Ch Camera. Sony. UIU. engchi. i n U. v. U1. I1. U1. I1. I1. U1. U5. I4. U3. UIWIU U3 I3. Sony. I2. U2. Xperia IUI. U4. I4. I3. U4. I4. Nikon. U5. 圖 匳匮匳区 卍卥却卡匭印卡却卨 的序列生成例子 我們拿圖 匳匮匳 當作例子。給定 单卉单 的元路徑,從 U1 節點出發,我們可以 透過節點走動產生路徑:(1) U1 → I1 → U5 → I4 → U3 · · · ,(2) U1 → I3 → U4 → I4 → U5 。而當我們給定 单卉南卉单 ,同樣從 U1 節點出發,則可以產生路 徑:(3) U1 → I1 → WSony → I2 → U2 · · · ,(4) U1 → I3 → WSony → I2 → U3 · · · 。 匱匲. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(22) 從上面的例子可以看出,不同的元路徑所代表的物理意義不同,例如像是 单卉单 所 代表的意義是連結購買相同商品的使用者,而 单卉南卉单 則是連結購買有相同字詞商 品的使用者。 產生序列文本之後,我們透過異質性 即卫卩印匭卧卲卡卭 模型,學習有效的網路表示 法 O ∈ R|V |×d , d  |V | 。給定異質性網路 G = (V, E, T ) , |TV | > 1 ,以及節 點 v ,去優化以下機率分佈:. arg max θ. X X. X. 匨匳匮匱匰匩. log p(ct |v; θ). v∈V t∈TV ct ∈Nt (v). 且定義條件機率 p(ct |v; θ) :. 政 治 大 y p(c |v; θ) = 立 y Oct ·Ov. t. P. ut ∈Vt. 匨匳匮匱匱匩. Out ·Ov. ‧ 國. 學. Nt (v) 是節點 v 中型態為 t 的鄰居節點。 ct 則是代表節點中 v 型態為 t 的 卣卯卮匭. ‧. 却卥卸却 。 Ov 為 O 的第 v 列向量,也代表著節點 v 的表示式 fv 。一般的網路表示法 學習,如 卄卥卥印南卡卬卫 、 卮卯卤卥匲卶卥卣 ,所優化的多項機率分佈(卍卵卬却卩卮卯卭卩卡卬 卐卲卯卢卡卢卩卬卩却卹 卄卩即却卲卩卢卵却卩卯卮)是全部的節點去建構機率分佈。而在異質性 即卫卩印匭卧卲卡卭 中,每個型. sit. y. Nat. 態 t 的多項機率分佈是由所有型態為 t 的節點所建構。這樣可以確保在負向取樣. n. al. er. io. (卮卥卧卡却卩卶卥 即卡卭印卬卩卮卧)的時候,我們所抽取的節點為同樣型態的,並專注在相同型 態節點的資訊。. 3.3. 推薦模型. Ch. engchi. i n U. v. 透過 匳匮匲 所學習出的表示法,我們有使用者特徵值及物品特徵值,其集合 各別記為 FU 、 FI 。每個使用者 u 都有其特徵值 fu ∈ FU ,每個物品 i 也有其 特徵值 fi ∈ FI 。集合 S 為我們觀察到的使用者 − 商品正向互動矩陣。 W1 ∈ Rd×k 及 W2 ∈ Rd×k 各別為連結使用者特徵值、商品特徵值,所學習到的權重。 其中 d 為我們設定的網路表示法維度, k 是我們在矩陣分解中可以設定的隱含 表示法維度參數。我們利用線性組合的方式,得到使用者的隱含表示式(卌卡却卥卮却 卒卥印卲卥即卥卮却卡却卩卯卮):. ru = fu W1. 匨匳匮匱匲匩. 及商品的隱含表示式為: 匱匳. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(23) 匨匳匮匱匳匩. ri = fi W2. 在模型中,使用者 u 對於商品 i 的預測值 pˆiu ,我們定義為使用者表示法及商 品表示法的內積值。 bu 和 bi 是在預測時我們所加上的正規化參數(卒卥卧卵卬卡卲卩卺卡却卩卯卮 卂卩卡即):. 匨匳匮匱匴匩. pˆiu = ru · ri + bu + bi. 最後我們定義損失函式 g(·) 。 iu 代表與使用者有互動關係的商品。對每個使 用者我們將會隨機抽樣數個商品 i0 ∈ I 。在這邊我們使用 南卍卒卂 卛匲匵卝 的作法,並. 政 治 大. 使用梯度下降法(升卲卡卤卩卥卮却 卄卥即卣卥卮却)做 g(·) 最小化優化:. 立. g(ˆ p, u, i) = log(. 匨匳匮匱匵匩. ‧ 國. 學. |I| X |1 − (ˆ piu − pˆi0u )| + 1.0) |Z| i0 ∈Z. 由於在實務上,我們沒辦法在訓練的過程中一一計算每個負向對的分數,因. ‧. 此我們會使用負向採樣(华卥卧卡却卩卶卥 卓卡卭印卬卩卮卧)策略來優化我們的訓練過程。 Z 是. sit. y. Nat. 我 們 在 整 個 商 品 集 合 I 中 抽 樣 出 來 的 商 品 集 合 。 pˆiu 代 表 的 是 正 向 對 的 分 數, pˆi0u 則是代表了我們抽樣對的分數。 匨匳匮匱匵匩 式計算了整體商品集合的 即卣卯卲卥 卶卩卯卬卡却卩卯卮 。這代表了我們希望 (ˆ piu − pˆi0u ) 的值越接近 匱 越好,如此才能使 匨匳匮匱匵匩 式. n. al. er. io. 最小化。 匨匳匮匱匵匩 式可以在許多深度學習框架中,使用 卓升卄(卓却卯卣卨卡即却卩卣 升卲卡卤卩卥卮却. v. 卄卥即卣卥卮却) 的技術實現。最後,我們可以利用學習出的模型,預測使用者對於每 個商品的分數。我們再取前 卫 項分數排序最高的商品,產生個人化的商品推薦清 單。. Ch. engchi. 匱匴. i n U. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(24) 第四章 實驗結果與討論. 治 政 在此章節,我們將提供且分析我們框架的表現。在 大 匴匮匱 小節我們將敘述我們 立 匴匮匲 小節則是給定實驗所使用的參數及我們所比 使用的資料集及相關統計數據。 ‧ 國. ‧. 4.1. 學. 較的方法。 匴匮匳 小節介紹我們所使用的評估指標算法。最後, 匴匮匴 小節將會比較和 討論我們方法及其他方法的表現。. 資料集. sit. y. Nat. io. 我 們 使 用 十卭卡卺卯卮 評 論 資 料 集1來 實 驗 。 此 資 料 集 收 集 了 十卭卡卺卯卮 網 站. n. al. er. 從 匱匹匹匶 年五月至 匲匰匱匴 年六月約 匱匮匴匲 億則評論。其中包含了使用者對於商品. i n U. v. 的評論分數、文字,以及商品的後設資料(像是商品描述、分類、價格、品牌、 圖片等有用資訊)。我們挑選了其中六個商品類別, 卍卯卶卩卥即 、 午卯卭卥 、 卅卬卥卣却卲卯卮匭. Ch. engchi. 卩卣即 、 千卥卬卬 卐卨卯卮卥即 、 千卄即 、以及 千卬卯却卨卩卮卧 的資料集實驗。另外,我們選擇的是標 準的 匵匭卣卯卲卥 資料,這代表著在資料中,已經過濾掉出現低於 匵 次的使用者及物 品。表 匴匮匱 為資料集的統計數據。 資料集 |U | |I| |S| d(·) 稀疏度. 卍卯卶卩卥即 匱匲匳匹匶匰 匵匰匰匵匲 匱匶匹匷匵匳匳 匱匳匮匶匹 匰匮匰匲匷匳匥. 午卯卭卥 匶匶匵匱匹 匲匸匲匳匷 匵匵匱匶匸匲 匸匮匲匹 匰匮匰匲匹匳匥. 卅卬卥卣却卲卯卮卩卣即 匱匹匲匴匰匳 匶匳匰匰匱 匱匶匸匹匱匸匸 匸匮匷匸 匰匮匰匱匳匹匥. 千卥卬卬 卐卨卯卮卥即 匲匷匸匷匹 匱匰匴匲匹 匱匹匴匴匳匹 匶匮匹匷 匰匮匰匶匶匹匥. 千卄即 匷匵匲匵匸 匶匴匴匴匳 匱匰匹匷匵匹匲 匱匴匮匵匸 匰匮匰匲匲匶匥. 千卬卯却卨卩卮卧 匳匹匳匸匷 匲匳匰匳匳 匲匷匸匶匷匷 匷匮匰匶 匰匮匰匳匰匷匥. 表 匴匮匱区 十卭卡卺卯卮 資料集數據統計 其中 |S| 代表所有使用者 − 商品評論數量, d(·) 為使用者評論商品數目的平 均。稀疏度我們定義為. |S| |U |×|I|. ,及使用者 − 商品相鄰矩陣中非 匰 元素所佔的比. 1卨却却印区匯匯卪卭卣卡卵卬卥卹匮卵卣即卤匮卥卤卵匯卤卡却卡匯卡卭卡卺卯卮匯. 匱匵. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(25) 例。 我們的實驗希望盡可能的模擬真實世界的情況。所以在每個資料集中,我們 把每個使用者的評論依時間戳記(協卩卭卥即却卡卭印)排序。並把前 匸匰匥 的資料當作訓 練資料,後 匲匰匥 的資料當作測試資料。目的是想要透過使用者過往的歷史紀錄, 去預測使用者可能有興趣的商品。. 4.2. 實驗設定 我們挑選了幾項其他 即却卡却卥匭卯卦匭却卨卥匭卡卲却 方法與我們的方法2比較:. 政 治 大. • Matrix Factorization:透過分解評分矩陣成使用者因子矩陣及商品因子矩 陣,進而預測使用者對於未評分商品的喜好。為目前應用最廣泛的推薦模. 立. 型 卛匹卝 。. ‧ 國. 學. • BPR-MF: 卂卡卹卥即卩卡卮 卐卥卲即卯卮卡卬卩卺卥卤 卒卡卮卫卩卮卧 是目前在 却卯印匭华 推薦上被廣為使用 的方法,這邊我們使用 卂卐卒 損失函式訓練 卍卡却卲卩卸 卆卡卣却卯卲卩卺卡却卩卯卮 卛匲匶卝。. ‧. • WARP-MF: 南卥卩卧卨却卥卤 十印印卲卯卸卩卭卡却卥匭卒卡卮卫 卐卡卩卲卷卩即卥 最早被用在影像注釋(卉卭卡卧卥 十卮卮卯却卡却卩卯卮)的工作 卛匲匷卝 。他建立了一個有效取樣的作法,在大數據量級的. y. Nat. 隱含回饋(卉卭印卬卩卣卩却 卆卥卥卤卢卡卣卫)資料集上常被使用。這邊我們使用 南十卒卐 損. er. io. sit. 失函式訓練 卍卡却卲卩卸 卆卡卣却卯卲卩卺卡却卩卯卮 。. • BoW-MF:詞袋模型(卂卡卧匭卯卦匭南卯卲卤即 卭卯卤卥卬)是在自然語言處理領域中被廣 泛使用的表達模型。我們將標題辭彙出現的頻率當作訓練模型的特徵,建立. n. al. Ch. engchi. i n U. v. 一個稀疏的向量代表每個商品。這邊的詞袋向量我們會當作推薦模型中商品 的初始特徵值。. • JRL: 半卯卩卮却 卒卥印卲卥即卥卮却卡却卩卯卮 卌卥卡卲卮卩卮卧 提出了結合不同層表示法學習的方法, 結合評論文字、圖像特徵、評分資訊,訓練使用者及商品的表示法。再利用 這些表示法訓練 印卡卩卲匭卷卩即卥 卌卥卡卲卮卩卮卧 却卯 卒卡卮卫 模型,以達到推薦的目的 卛匱匸卝 。 我們使用作者提供的程式碼實驗3。 以下網路表示法學習方法將會結合我們的建圖方式訓練,所學習到的特徵值 當作後續推薦模型的初始值。 • Deepwalk*:為 卄卥卥印卷卡卬卫 加上我們所提出的建圖策略之作法。 卄卥卥印卷卡卬卫 利 用了隨機走動生成序列,並利用網路結構相似於文字的特性訓練網路表示 法。我們使用 卄卥卥印卷卡卬卫 所學習到的特徵值當作後續推薦模型的初始值 卛匶卝 。 2此論文程式碼可於 卧卩却卨卵卢 上取得 卨却却印即区匯匯卧卩却卨卵卢匮卣卯卭匯卌卯卮卓卩卬卥卮却匯却卨卥即卩即卟卣卯卤卥即 3卨却却印即区匯匯卧卩却卨卵卢匮卣卯卭匯卥卶卩即卯卮匯半卒卌. 匱匶. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(26) • LINE*:為 卌卉华卅 加上我們所提出的建圖策略之作法。我們使用二階相似度 的 卌卉华卅 訓練網路表示法,節點之間共享的鄰居節點越多則越相似。同時也 作為特徵值當作後續推薦模型的初始值 卛匷卝。 • HPE*:為 午卐卅 加上我們所提出的建圖策略之作法。 午卥却卥卲卯卧卥卮卥卯卵即 卐卲卥卦卥卲匭 卥卮卣卥 卅卭卢卥卤卤卩卮卧 可以將使用者的異質性的資訊結合,讓使用者在進行檢索時 能產生對應的推薦清單 卛匲匴卝。 • metapath2vec*:為 卭卥却卡印卡却卨匲卶卥卣 加上我們所提出的建圖策略之作法。 卭卥却卡匭 印卡却卨匲卶卥卣 提供了一個針對異質性網路的隨機走動策略,並透過異質性 即卫卩印匭 卧卲卡卭 學習表示法。 參考圖 匳匮匱 ,實驗時我們設定三種節點型態:使用者(单)、商品(卉)、 字詞(南)。字詞節點可能為商品標題所含辭彙及商品品牌(如果有的話)。. 政 治 大 再根據評論訓練資料及商品後設資料建立網路。建立完網路之後,我們使 立 用 印卲卯华卥却 卛匲匸卝 套件學習 卄卥卥印卷卡卬卫 、 卌卉华卅 、及 午卐卅 的網路表示法。訓練 卄卥卥印匭. ‧ 國. 學. 卷卡卬卫 時,我們給定窗口大小 卷卩卮卤卯卷 即卩卺卥 為 匵 ,並過濾掉 卭卩卮 卣卯卵卮却 小於 匵 的 節 點 , 每 個 節 點 作 為 起 點 的 次 數 卷卡卬卫 却卩卭卥即 為 匱匰 , 隨 機 走 動 的 長 度 卷卡卬卫. ‧. 卬卥卮卧却卨 為 匵匰 。 午卐卅 及 卌卉华卅 我們設定 即卡卭印卬卥 却卩卭卥即 為 匲 億次。. 而在 卭卥却卡印卡却卨匲卶卥卣 的實驗,我們設定元路徑 ρ 為 卻单卉单匬 单卉南卉单匬 卉单卉卽 生成. Nat. sit. y. 訓練文本。 卭卥却卡印卡却卨匲卶卥卣 也相同於 卄卥卥印卷卡卬卫 ,每個節點作為起點的次數 卷卡卬卫. n. al. er. io. 却卩卭卥即 為 匱匰 ,隨機走動的長度 卷卡卬卫 卬卥卮卧却卨 為 匵匰 。得到文本之後,我們再使 用 卭卥却卡印卡却卨匲卶卥卣 作者提供的程式碼訓練網路表示法4。其他參數我們則是使用套件. i n U. v. 預設值。最後,以上四種方法所訓練的 卥卭卢卥卤卤卩卮卧 大小我們都設定為 匱匰匰 。. Ch. engchi. 再來是給定推薦模型的參數。我們在 卅卬卥卣却卲卯卮卩卣即 的資料集設定使用者 卢卡却卣卨 大 小為 匵匰匰匰匰 ,以免記憶體用盡(协卵却 卯卦 卍卥卭卯卲卹)的問題。其餘匵個資料集則是設 定 卢卡却卣卨 大小為原本使用者的大小。初始的 卬卥卡卲卮卩卮卧 卲卡却卥 給定 匰匮匱 ,並在訓練的 過程中動態減少。對於每個使用者,負向取樣 卮卥卧卡却卩卶卥 即卡卭印卬卩卮卧 的次數我們設定 為 匲匰 。在 卍卆、卂卐卒匭卍卆、南十卒卐匭卍卆 及我們的方法中,我們設定 卬卡却卥卮却 卦卡卣却卯卲 的 長度 K 為 匱匵匰 ,模型訓練更新的次數 却卲卡卩卮 卥印卯卣卨 為 匱匵匰 。 卂卐卒匭卍卆 及 南十卒卐匭卍卆 我們使用 卌卩卧卨却卆卍 卛匲匹卝 實作5。 半卒卌 則是參考原作 者 參 數 設 定 , 並 只 使 用 却卥卸却 、 卲卡却卩卮卧 兩 層 卶卩卥卷 學 習 特 徵 。 另 外 , 我 們 也 使 用 印卲卯华卥却 卛匲匸卝 套件學習 半卒卌 的初始 卲卡却卩卮卧 特徵值。 4卨却却印即区匯匯卥卲卩卣卤卯卮卧卹卸匮卧卩却卨卵卢匮卩卯匯卭卥却卡印卡却卨匲卶卥卣匯卭匲卶匮卨却卭卬 5卨却却印即区匯匯卧卩却卨卵卢匮卣卯卭匯卬卹即却匯卬卩卧卨却卦卭. 匱匷. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(27) 評估標準. 4.3. 為了衡量我們方法與其他方法在真實電子商務網站的表現,我們使用下列兩 種評估標準來評估 却卯印匭华 推薦的表現。 • 精確率(卐卲卥卣卩即卩卯卮):成功推薦的商品在模型推薦清單的百分率。這邊我們 使用 卍卡卣卲卯匭卡卶卥卲卡卧卥 卐卲卥卣卩即卩卯卮 。 P. P recision =. u∈U. |Iu+ | N. 匨匴匮匱匩. |U |. • 召回率(卒卥卣卡卬卬):測試資料中使用者購買的商品被成功推薦的百分率。這. 政 治 大. 邊我們也使用 卍卡卣卲卯匭卡卶卥卲卡卧卥 卒卥卣卡卬卬 。. P. Recall =. |Iu+ | u∈U |Iu |. 匨匴匮匲匩. |U |. 學. ‧ 國. 立. • 覆蓋率(千卯卶卥卲卡卧卥):為可推薦商品佔所有商品的比例。 I0 |I|. ‧. Coverage =. Nat. sit. y. 匨匴匮匳匩. n. al. er. io. 其中 U 為使用者集合, I 為總商品集合。 Iu 為使用者 u 過去購買的商品集 合, Iu+ 為對於使用者 u 的成功推薦商品集合。 I 0 是代表著所有使用者的推薦清. i n U. v. 單中涵蓋的商品集合,也就是如果推薦系統沒有推薦過某商品,則該商品就不包 含在 I 0 中。. Ch. engchi. 在測試資料中,我們對每個使用者生成 N = 10 的 却卯印匭华 商品推薦清單。再利 用上述兩個評估標準評估各個方法的好壞。. 實驗結果. 4.4 4.4.1. 準確率及召回率表現. 表 匴匮匲 及表 匴匮匳 表列了各個方法的實驗結果,包含了 卐卲卥卣卩即卩卯卮區匱匰 以及 卒卥匭 卣卡卬卬區匱匰 。 首 先 卍卆 的 表 現 在 許 多 分 類 上 都 表 現 不 好 。 是 因 為 卍卆 原 本 的 目 標 是 讓 均 方 根 誤 差 (卒卯卯却 卍卥卡卮 卓危卵卡卲卥 卅卲卲卯卲匬 卒卍卓卅) 愈 小 愈 好 。 而 在 電 商 的 推薦上,更合理的場景是推薦商品的排序問題。所以在大部分的資料上,透 過 卂卐卒 或 南十卒卐 的損失函式訓練 卍卆 會讓整體的準確率提升不少。再來,由 匱匸. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(28) 卍卯卶卩卥即. 資料集. 卐卲卥卣卩即卩卯卮. 評估. 午卯卭卥. 卒卥卣卡卬卬 卐卲卥卣卩即卩卯卮. 卅卬卥卣却卲卯卮卩卣即 卒卥卣卡卬卬 卐卲卥卣卩即卩卯卮. 卒卥卣卡卬卬. 卍卆 卂卐卒匭卍卆 南十卒卐匭卍卆 卂卯南 半卒卌. 匰匮匱匶匵匥 匰匮匷匹匸匥 匰匮匷匴匹匥 匰匮匱匳匵匥 匰匮匹匶匴匥. 匰匮匸匱匸匥 匳匮匸匴匲匥 匳匮匵匷匱匥 匰匮匵匸匳匥 匵匮匳匴匳匥. 匰匮匰匷匷匥 匰匮匲匴匸匥 匰匮匱匹匹匥 匰匮匱匵匵匥 匰匮匲匹匶匥. 匰匮匴匰匲匥 匱匮匳匴匳匥 匱匮匰匲匶匥 匰匮匸匴匴匥 匲匮匲匲匲匥. 匰匮匲匰匷匥 匰匮匲匲匹匥 匰匮匲匵匱匥 匰匮匰匹匵匥 匰匮匴匰匷匥. 匰匮匹匶匳匥 匱匮匳匰匱匥 匱匮匳匰匷匥 匰匮匵匱匷匥 3.145%. 卄卥卥印卷卡卬卫匪 卌卉华卅匪 午卐卅匪 卭卥却卡印卡却卨匲卶卥卣匪. 匰匮匹匹匶匥 匰匮匳匴匱匥 1.147% 匰匮匹匴匱匥. 匴匮匶匹匹匥 匱匮匳匸匱匥 5.405% 匴匮匳匳匰匥. 匰匮匳匱匸匥 匰匮匱匷匱匥 0.418% 匰匮匳匷匵匥. 匱匮匷匳匰匥 匰匮匸匵匹匥 2.313% 匲匮匰匴匴匥. 匰匮匲匴匶匥 匰匮匱匴匸匥 0.433% 匰匮匳匷匳匥. 匱匮匳匸匱匥 匰匮匶匸匵匥 匲匮匳匹匲匥 匲匮匰匱匸匥. 立. 政 治 大. 表 匴匮匲区 却卯印匭匱匰 推薦結果(卍卯卶卩卥即匬 午卯卭卥匬 卅卬卥卣却卲卯卮卩卣即). ‧. ‧ 國. 學 er. io. sit. y. Nat. n. al. 資料集 評估. i Ch 千卥卬卬 卐卨卯卮卥即 千卬卯却卨卩卮卧 n e n卐卲卥卣卩即卩卯卮 gchi U 卐卲卥卣卩即卩卯卮 卒卥卣卡卬卬 卒卥卣卡卬卬. v. 千卄即. 卐卲卥卣卩即卩卯卮. 卒卥卣卡卬卬. 卍卆 卂卐卒匭卍卆 南十卒卐匭卍卆 卂卯南 半卒卌. 匰匮匴匳匰匥 匰匮匶匶匳匥 匰匮匷匴匴匥 匰匮匷匶匲匥 匰匮匸匲匵匥. 匲匮匶匰匶匥 匴匮匰匲匹匥 匴匮匵匱匲匥 匴匮匵匷匵匥 6.921%. 匰匮匰匹匳匥 匰匮匳匶匱匥 匰匮匲匴匴匥 匰匮匴匷匷匥 匰匮匳匸匷匥. 匰匮匵匵匹匥 匲匮匱匴匵匥 匱匮匴匱匷匥 匲匮匹匰匵匥 3.585%. 匰匮匱匴匴匥 匱匮匰匳匶匥 匰匮匸匱匱匥 匰匮匱匱匸匥 匰匮匷匷匴匥. 匰匮匵匷匷匥 匴匮匴匶匹匥 匳匮匱匵匱匥 匰匮匴匲匹匥 匳匮匷匰匱匥. 卄卥卥印卷卡卬卫匪 卌卉华卅匪 午卐卅匪 卭卥却卡印卡却卨匲卶卥卣匪. 匰匮匷匹匷匥 匰匮匶匸匲匥 1.039% 匰匮匹匶匸匥. 匴匮匸匵匳匥 匴匮匱匴匹匥 匶匮匴匹匴匥 匵匮匹匸匶匥. 匰匮匴匱匴匥 匰匮匱匸匶匥 0.509% 匰匮匴匱匲匥. 匲匮匴匸匳匥 匱匮匰匷匲匥 匳匮匰匹匹匥 匲匮匴匸匲匥. 匱匮匱匸匷匥 匰匮匲匴匴匥 1.316% 匱匮匱匳匸匥. 匵匮匱匱匳匥 匰匮匷匸匶匥 5.645% 匴匮匷匸匰匥. 表 匴匮匳区 却卯印匭匱匰 推薦結果(千卥卬卬 卐卨卯卮卥即匬 千卬卯却卨卩卮卧匬 千卄即). 匱匹. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(29) 於 半卒卌 及我們的方法加入了額外資訊訓練,所以表現可以再更進一步提升。然後 我們可以發現在大部分的分類中,我們的方法在 卐卲卥卣卩即卩卯卮 上的表現都明顯優於其 他方法。在推薦系統上,這是我們樂見的結果。比起召回率,精確率高的模型更 能符合真實世界使用者的期待。 另外,加入了文字資訊訓練網路表示法之後,跟原本單純用使用者 − 商品 互動所建立的模型比起來,所學習到的特徵值也提升了後續推薦系統的準確性。 這裡可以解釋不僅商品的後設資料,商品的評論文字也有助於提升推薦模型的表 現。這邊值得注意的是 卌卉华卅 的表現並不好,我們認為這是因為我們的網路在建 置的時候,並不是以二分圖(卂卩印卡卲却卩却卥 卧卲卡印卨)來設計,而我們所建的圖混雜著使 用者、商品、文字,使得在學習二階相似度時雜訊過多,而導致 卌卉华卅 的學習效 果不好。反而是基於隨機走動的網路表示法學習方法,皆有不錯的表現。. 覆蓋率表現. 立. 匰匮匶匴匲匥 匶匰匮匰匶匲匥 匵匹匮匹匸匰匥 匸匰匮匹匵匸匥 匸匮匶匶匹匥. 匱匲匮匴匳匰匥 匷匴匮匵匶匵匥 匶匱匮匵匵匷匥 匳匵匮匱匵匶匥 匱匮匸匷匹匥. 匰匮匰匶匹匥 匶匳匮匰匵匹匥 匵匰匮匱匸匱匥 匷匳匮匲匲匸匥 匹匮匹匷匱匥. 匳匵匮匶匰匸匥 匸匲匮匵匸匳匥 匸匴匮匰匱匶匥 匸匶匮匱匱匷匥 匱匴匮匴匴匵匥. 卄卥卥印卷卡卬卫匪 97.896% 匷匶匮匶匹匲匥 卌卉华卅匪 匰匮匲匳匳匥 匰匮匴匸匹匥 午卐卅匪 匷匱匮匱匵匱匥 90.736% 卭卥却卡印卡却卨匲卶卥卣匪 匶匲匮匲匳匱匥 匷匰匮匳匳匹匥. 93.571% 匰匮匱匷匱匥 匸匴匮匵匴匱匥 匴匰匮匶匷匱匥. 96.302% 匸匷匮匵匵匰匥 匹匵匮匹匳匴匥 匹匱匮匳匶匴匥. 匹匶匮匸匱匱匥 匷匰匮匸匰匲匥 匱匸匮匳匵匹匥 匱匮匰匲匰匥 96.985% 匶匷匮匵匹匱匥 匸匹匮匴匷匰匥 91.930%. n. Ch. engchi. 匲匷匮匵匱匲匥 匸匱匮匷匱匵匥 匶匸匮匰匹匷匥 匸匵匮匸匳匵匥 匹匱匮匷匷匳匥. sit. 千卄即 匲匹匮匰匳匷匥 匵匴匮匶匸匴匥 匵匹匮匶匲匰匥 匴匶匮匸匳匶匥 匱匲匮匰匲匳匥. er. io. al. 卅卬卥卣却卲卯卮卩卣即 千卥卬卬 卐卨卯卮卥即 千卬卯却卨卩卮卧. ‧. Nat. 卍卆 卂卐卒匭卍卆 南十卒卐匭卍卆 卂卯南 半卒卌. ‧ 國. 午卯卭卥. 學. 卍卯卶卩卥即. y. 4.4.2. 政 治 大. i n U. v. 表 匴匮匴区 覆蓋率評估 在表 匴匮匴 中我們列出了每個模型在覆蓋率的表現。覆蓋率在電商行業中格外 重要。不同於線下商店,電商網站擁有大量的商品,而其中活躍的商品可能只佔 其中的 匱匰匥 ,而其餘的 匹匰匥 的商品流通性都不高。因此帶動整體商品的銷售能 給電商更多的營收成長。 這邊可以發現使用此論文建圖策略的推薦模型,在每一類的覆蓋率表現皆有 很好的表現。在四個網路表示法學習方法裡,皆有方法能夠達到超過 匹匰匥 的覆蓋 率。與像是 半卒卌 的方法比較起來,我們的方法在學習商品與物品的表示法時,會 在相同空間學習到使用者與商品之間的交互關係,以及商品與文字的連接。我們 認為這樣是能夠表現更好的原因。. 匲匰. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(30) 卍卯卶卩卥即. 資料集. 卐卲卥卣卩即卩卯卮. 評估. 午卯卭卥. 卒卥卣卡卬卬 卐卲卥卣卩即卩卯卮. 卅卬卥卣却卲卯卮卩卣即 卒卥卣卡卬卬 卐卲卥卣卩即卩卯卮. 卒卥卣卡卬卬. 卄卥卥印卷卡卬卫匨卲卡却卩卮卧匩 卄卥卥印卷卡卬卫匨卲卡却卩卮卧匫卷卯卲卤即匩. 匰匮匹匱匱匥 匴匮匴匱匷匥 匰匮匹匹匶匥 匴匮匶匹匹匥. 匰匮匲匳匸匥 匱匮匳匰匳匥 匰匮匳匱匸匥 匱匮匷匳匰匥. 匰匮匲匲匵匥 匱匮匳匱匱匥 匰匮匲匴匶匥 匱匮匳匸匱匥. 卌卉华卅匨卲卡却卩卮卧匩 卌卉华卅匨卲卡却卩卮卧匫卷卯卲卤即匩. 匰匮匶匳匹匥 匲匮匹匱匶匥 匰匮匳匴匱匥 匱匮匳匸匱匥. 匰匮匱匴匲匥 匰匮匷匲匰匥 匰匮匱匷匱匥 匰匮匸匵匹匥. 匰匮匲匴匸匥 匱匮匳匴匰匥 匰匮匱匴匸匥 匰匮匶匸匵匥. 午卐卅匨卲卡却卩卮卧匩 午卐卅匨卲卡却卩卮卧匫卷卯卲卤即匩. 1.209% 5.719% 匱匮匱匴匷匥 匵匮匴匰匵匥. 匰匮匳匷匴匥 匲匮匰匱匰匥 0.418% 2.313%. 匰匮匴匳匲匥 匲匮匳匸匴匥 0.433% 2.392%. 卭卥却卡印卡却卨匲卶卥卣匨卲卡却卩卮卧匩 卭卥却卡印卡却卨匲卶卥卣匨卲卡却卩卮卧匫卷卯卲卤即匩. 匰匮匸匸匵匥 匴匮匰匷匱匥 匰匮匹匴匱匥 匴匮匳匳匰匥. 匰匮匲匵匷匥 匱匮匳匷匶匥 政 治匰匮匳匷匵匥大匲匮匰匴匴匥. 匰匮匳匵匷匥 匱匮匹匲匸匥 匰匮匳匷匳匥 匲匮匰匱匸匥. 立. 表 匴匮匵区 有無文字建圖方式的推薦結果比較(卍卯卶卩卥即匬 午卯卭卥匬 卅卬卥卣却卲卯卮卩卣即). ‧. ‧ 國. 學 er. io. sit. y. Nat. al. n. iv n U 千卬卯却卨卩卮卧. 資料集 評估. C千卥卬卬h卐卨卯卮卥即 engchi 卐卲卥卣卩即卩卯卮 卒卥卣卡卬卬 卐卲卥卣卩即卩卯卮. 千卄即. 卒卥卣卡卬卬 卐卲卥卣卩即卩卯卮. 卒卥卣卡卬卬. 卄卥卥印卷卡卬卫匨卲卡却卩卮卧匩 卄卥卥印卷卡卬卫匨卲卡却卩卮卧匫卷卯卲卤即匩. 匰匮匶匸匱匥 匴匮匲匸匷匥 匰匮匷匹匷匥 匴匮匸匵匳匥. 匰匮匲匹匰匥 匱匮匷匳匹匥 匰匮匴匱匴匥 匲匮匴匸匳匥. 匱匮匰匶匲匥 匴匮匵匴匷匥 匱匮匱匸匷匥 匵匮匱匱匳匥. 卌卉华卅匨卲卡却卩卮卧匩 卌卉华卅匨卲卡却卩卮卧匫卷卯卲卤即匩. 匰匮匴匸匵匥 匲匮匹匸匹匥 匰匮匶匸匲匥 匴匮匱匴匹匥. 匰匮匱匷匴匥 匰匮匹匹匶匥 匰匮匱匸匶匥 匱匮匰匷匲匥. 匰匮匸匴匰匥 匳匮匴匶匳匥 匰匮匲匴匴匥 匰匮匷匸匶匥. 午卐卅匨卲卡却卩卮卧匩 午卐卅匨卲卡却卩卮卧匫卷卯卲卤即匩. 匰匮匸匸匰匥 匵匮匴匸匲匥 1.039% 6.494%. 匰匮匳匷匹匥 匲匮匲匷匹匥 0.509% 3.099%. 匱匮匳匰匶匥 匵匮匶匰匶匥 1.316% 5.645%. 卭卥却卡印卡却卨匲卶卥卣匨卲卡却卩卮卧匩 卭卥却卡印卡却卨匲卶卥卣匨卲卡却卩卮卧匫卷卯卲卤即匩. 匰匮匶匶匶匥 匴匮匱匰匷匥 匰匮匹匶匸匥 匵匮匹匸匶匥. 匰匮匲匶匱匥 匱匮匵匶匸匥 匰匮匴匱匲匥 匲匮匴匸匲匥. 匰匮匹匴匳匥 匳匮匹匶匷匥 匱匮匱匳匸匥 匴匮匷匸匰匥. 表 匴匮匶区 有無文字建圖方式的推薦結果比較(千卥卬卬 卐卨卯卮卥即匬 千卬卯却卨卩卮卧匬 千卄即). 匲匱. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(31) 4.4.3. 建圖策略比較. 對網路表示法學習來說,不同的網路就代表不同的訓練資料,將會大大影 響我們的預測任務結果。透過第三章的 十卬卧卯卲卩却卨卭 匱 ,我們將文字加入異質性網 路。在此單元中,我們將比較有無文字的網路對於推薦系統效能的差異。在無文 字的圖中,我們只保留使用者匭商品的鏈結,而沒有執行 十卬卧卯卲卩却卨卭 匱 中第 匵 行到 第 匱匴 行的步驟。網路建置好之後,我們按照一樣的程序:訓練網路表示法,再將 表示法當作推薦模型的初始特徵值。 表 匴匮匵 和 匴匮匶 列出了我們實驗的結果。在 卄卥卥印卷卡卬卫 和 卭卥却卡印卡却卨匲卶卥卣 的結果可 以看出,加入文字都使推薦的效果有所提升。而在 卌卉华卅 中,在比較大的資料集 中,加入文字反而或多或少減低推薦的成果。這如同我們之前所提的,加入過多 異質性的節點當作 卣卯卮却卥卸却 ,由於沒有分享共同的鄰居,反而混亂表示法的學習過 程。. 立. 政 治 大. 這邊值得注意的是, 午卐卅 在 卍卯卶卩卥即 、 卅卬卥卣却卲卯卮卩卣即 、 千卄即 中,有無文字並. ‧ 國. 學. 沒有使效果明顯的提升,在 卍卯卶卩卥即 類中更是比沒有加文字的效果還要好。我們. ‧. 認為是因為資料的特性所造成。像是 千卄即 、 卍卯卶卩卥即 等資料,商品標題的文字 沒有那麼重要,反而像是導演、歌手、曲風、發行商等後設資料影響較大,而 在 十卭卡卺卯卮 資料集中沒有提供這些資訊。可能透過相同的方式連接這些屬性,才. y. Nat. 會使額外資訊的效果彰顯出來。這也告訴我們仍須根據不同的領域去客製化不同. 案 例 分析 -網 網路a表l 示法學 習. n. 4.4.4. er. io. sit. 的推薦模型,以達到最好的效果。. Ch. engchi. i n U. v. 除了好的推薦系統以外,我們也有另外一個主要目標,就是希望透過網路表 示法學習,解決電子商務中嚴重的稀疏性問題。所學到的表示法除了當作推薦系 統的初始值,也能夠在許多實務工作中發揮作用。像是訓練出的使用者表示法可 以用在使用者分析(单即卥卲 卐卲卯匜卬卩卮卧)的情境中。就商品的角度而言,我們希望的 方向有兩個:. • 常被一起購買的商品越相似越好。例如我們希望一個電腦的節點表示法,與 充電器、螢幕、滑鼠、鍵盤等商品相似。換句話說,我們希望能在商品的表 示式學到協同過濾的特徵。 • 擁有類似標題辭彙的商品越相似越好。舉例來說,我們希望 Sony Xperia XZ2 與 Sony Xperia XZ2 Case 、 Sony Xperia XZ2 Compact 等商品相似。加 入文字資訊之後,我們希望弭平像是尺寸、型號等「雜訊」,以達到更好的 推薦效果。 匲匲. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(32) 方法. 相似商品. 卄卥卥印卷卡卬卫. 午卐 千卨卲卯卭卥卢卯卯卫 匱匴 匨协卣卥卡卮 協卵卲危卵卯卩即卥匩 午卐 匱匵匮匶匢 卌卡印却卯印 匴升卂 匳匲匰升卂 卼 匲匰匰匰匭匲卤匱匹南卍 匱匲匭千卥卬卬 卌卡印却卯印 卂卡却却卥卲卹 卦卯卲 午卐 卐十卖卉卌卉协华 卄卖匷 华卥卷 卌卡印却卯印 卂卡却却卥卲卹 卦卯卲 午卐 卐卡卶卩卬卩卯卮 卤卭匴 午卐 卐卡卶卩卬卩卯卮 卄卍匱匭匴匳匱匰卮卲 匱匱匮匶匢 卌卡印却卯印 匨協匭卍卯卢卩卬卥 匴升匩. 政 治 大 卄卉升卉協協卒十卄卅 卌卓匱匰匴匭匱匵 卓卡卫卵卲卡 卄卥即卩卧卮卥卲 华卯却卥卢卯卯卫 卓卬卥卥卶卥 匱匵匬匴匢 卌卡印却卯印 立 午卡卮卮即匮升 午升匲匸匱卄卐卂 匲匸匢 南卩卤卥即卣卲卥卥卮 卌千卄 卍卯卮卩却卯卲. ‧ 國. ‧. 午卐 千卨卲卯卭卥卢卯卯卫 匱匴 匨协卣卥卡卮 協卵卲危卵卯卩即卥匩 午卐 匱匵匮匶匢 卌卡印却卯印 匴升卂 匳匲匰升卂 卼 匲匰匰匰匭匲卤匱匹南卍 卂卅卓協卅卋 卨印 卬卡印却卯印 卣卨卡卲卧卥卲 卵卮卩卶卥卲即卡卬 卡卤卡印却卥卲 十卣卥卲 十即印卩卲卥 卖匵匭匱匲匲卐匭匰匶匳匷 匱匱匮匶匭卉卮卣卨 協卯卵卣卨即卣卲卥卥卮 卌卡印却卯印 匨千卨卩卬卬 卓卩卬卶卥卲匩 協卯即卨卩卢卡 千卂匳匵匭十匳匱匲匰 匱匳匮匳匭卉卮卣卨 千卨卲卯卭卥卢卯卯卫. al. er. io. sit. y. Nat. 午卐卅. 卡卭卆卩卬卭 卐卲卥卭卩卵卭 午卄 千卬卥卡卲 匨卉卮卶卩即卩卢卬卥匩 卓卣卲卥卥卮 卐卲卯却卥卣却卯卲即 卦卯卲 十印印卬卥 卩卐卡卤 卓卡卭即卵卮卧 升卡卬卡卸卹 卄卥即卫却卯印 卄卯卣卫 匨卅卄卄匭卄匱卂匱卂卅升単十卒匩 卆卵卲卭卡卮 卍匭匸単匲 卍卥卲卩却 卓卥卲卩卥即 匸 协卵却卬卥却 卐卯卷卥卲 千卯卮卤卩却卩卯卮卥卲 卡卮卤 卓卵卲卧卥 卐卲卯却卥卣却卯卲. 學. 卌卉华卅. v. n. 午卐 千卨卲卯卭卥卢卯卯卫 匱匴 匨协卣卥卡卮 協卵卲危卵卯卩即卥匩 十卓单卓 南卩卲卥卬卥即即 卒卯卵却卥卲 匨卒協匭华匱匰卐匩 卭卥却卡印卡却卨匲卶卥卣 十卮卫卥卲 升卯卬卤卥卮 十千 十卤卡印却卥卲 匫 卐卯卷卥卲 卓卵印印卬卹 千卯卲卤 卦卯卲 卌卡印却卯印 午卐 卐卡卶卩卬卩卯卮 午卐 匱匵匮匶匢 卌卡印却卯印 匴升卂 匳匲匰升卂 卼 匲匰匰匰匭匲卤匱匹南卍 午卐 千卨卲卯卭卥卢卯卯卫 匱匱 匨南卨卩却卥匯卂卬卵卥匩. Ch. engchi. i n U. 表 匴匮匷区 網路表示法學習的案例分析。在不同的網路表示法學習方法下,我們對 於 HP 14-q070nr 14-Inch Chromebook (free T-Mobile 4G) 這項商品的表示法,與 其餘商品表示法進行餘弦相似度檢索。此表所列出的是每個方法中最高前五相似 的商品。. 匲匳. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

(33) 另外,也可以將商品表示法直接利用在 华卥卸却匭卩却卥卭即 推薦中,利用使用者的搜 尋問句檢索對應的物品。這樣的情境常常在音樂、影片推薦中常常使用。 我們隨機選擇了 HP 14-q070nr 14-Inch Chromebook (free T-Mobile 4G) 這項 商品,並於表 匴匮匷 列出相似商品。 卄卥卥印南卡卬卫 、 午卐卅 、 卭卥却卡印卡却卨匲卶卥卣 不約而同的 將 HP Chromebook 14 擺在第一位。這是符合我們預期想要的結果,成功地將分 享相同標題辭彙的商品在向量空間中盡可能的靠近。另外,也可以發現有部分商 品符合我們所要的協同過濾特性,像是 12-Cell Laptop Battery for HP PAVILION DV7 及 BESTEK hp laptop charger universal adapter 都某種程度抓到我們想要的 結果。. user item word. 立. user item word. 政 治 大. ‧. ‧ 國. 學 匨卢匩 卌卉华卅 user item word. n. al. er. io. sit. y. Nat. 匨卡匩 卄卥卥印卷卡卬卫. Ch. engchi. 匨卣匩 午卐卅. i n U. user item word. v. 匨卤匩 卭卥却卡印卡却卨匲卶卥卣. 圖 匴匮匱区 網路表示法的視覺化呈現 我們也透過 却匭卓华卅 卛匳匰卝 將網路表示法視覺化呈現,來比較不同網路表示法學 習方法的差異。在圖 匴匮匱 中,我們可以看出 卄卥卥印卷卡卬卫 及 午卐卅 的表示法分佈是混合 在一起的,這是因為每個節點型態都會分享到各種型態的 卣卯卮却卥卸却 。而 卌卉华卅 則是 商品一群,使用者及文字一群。會有這樣的現象則是因使用者及文字都是以商品 當作 卣卯卮却卥卸却 ,商品則會有使用者及文字的 卣卯卮却卥卸却 。 卭卥却卡印卡却卨匲卶卥卣 則是每個型態 節點各一群。也證明了透過異質性 即卫卩印匭卧卲卡卭 ,可以在享有多種型態 卣卯卮却卥卸却 節點 的情況下,把同型態的節點聚集在一起,並把不同型態的節點分開。 匲匴. DOI:10.6814/THE.NCCU.CS.002.2018.B02.

參考文獻

相關文件

越南供電系統及基礎設施尚待加強;越南供電主力在水力發電,在旱季期間

受雲林科技大學 王新衡教授邀請,共同策劃嘉大附小學生參加 518博物館日 結合舊屋力計畫,老屋活化藝術展之討論情形。...

你又睏得想睡,這時如果一睡,一天都會昏頭。所

南非國營電力公司 Eskom 燃煤發電廠日漸老化,去(2019)年 數次無預警採取限電措施,重創製造業、礦業及零售業,南 非總統 Cyril Ramaphosa

剛喜佛 南無護一切佛 南無離諸疑佛 南無寶炎眷屬佛 南無無憂佛 南無住持速

  南無日燈如來 南無火燈如來 南無虛空等智如來 南無婆娑迦羅燈如來 南無

[r]

[r]