• 沒有找到結果。

朝陽科技大學 資訊管理系

N/A
N/A
Protected

Academic year: 2022

Share "朝陽科技大學 資訊管理系"

Copied!
64
0
0

加載中.... (立即查看全文)

全文

(1)

朝陽科技大學 資訊管理系

碩士論文

具個人化特色的智慧型點歌系統

The Intelligent Song Requesting System with Personalized Characteristics

指導教授︰陳榮昌 博士 研 究 生︰黃若嘉(麗美)

中華民國 96 年 5 月 17 日

(2)

朝陽科技大學資訊管理系

Department of Information Management Chaoyang University of Technology

碩士論文

Thesis for Degree of Master

具個人化特色的智慧型點歌系統

The Intelligent Song Requesting System with Personalized Characteristics

指導教授︰陳榮昌博士

(Rong-Chung Chen)

研 究 生︰黃若嘉(麗美)

(Jo-Chia Huang)

中華民國 96 年 5 月 17 日

May 17, 2007

(3)

中文摘要

隨著電子商務的蓬勃發展,線上服務機制的功能愈來愈趨於多元化,

使用者可以透過網際網路隨時隨地點歌(Requesting Song)歡唱。目前網路線 上點歌系統大多利用新進歌曲點歌、或熱門點唱排行榜點歌等方式供使用 者點選,在眾多的資訊中,使用者必須主動挖掘其所要的資訊,例如,透 過歌曲編號、關鍵字搜尋等進行資訊的篩選。然而,上述等功能無法考慮 到個別使用者的興趣差異,無法有效的提供使用者個人化的推薦。

首先,我們提出利用協同過濾(Collaborative Filtering)推薦的方法,主 動進行個人化之推薦,依據每個使用者過去的點選紀錄以及使用者輪廓中 的 興 趣 差 異 , 搜 尋 出 每 個 使 用 者 的 同 好 , 以 同 好 名 單 進 行 推 薦 (Recommendation)。並且結合模糊推論(Fuzzy Inference)所建置的知識庫 (Knowledge Base),將不同的特徵類別以模糊法則的方式呈現出來,每一個 特徵類別會對應到一個模糊法則,因此,從過去的點歌紀錄中,當某一個 使用者在某些特徵類別上有特殊傾向時,該模糊法則就會被觸發而形成推 薦的依據。最後,我們透過隱性回饋的方式來加強知識庫媒合的精確度,

除了可以使系統更有效率外,並可以從經驗中學習,以提供不同興趣傾向 的使用者的適性化推薦系統(Adapted Recommendation System)。

關鍵字:點歌,協同過濾,模糊推論,知識庫,適性化推薦系統

(4)

ABSTRACT

Most of the requesting song system over the networks could only use the listing of new songs or the billboard of the hot requesting songs to speed up the requesting time. The users could only use the keywords or I.D. numbers of the songs to request their interested songs by their experiences. It will be more convenient for the users if these experiences can be accumulated in the requesting song system. Thus, we attempt to apply the method of information retrieval to find the trends of requesting song from their requesting records so as to provide the personalized recommendation.

In our research, the fuzzy inference rules are combined to establish the knowledge base. The various attributive classes are represented as fuzzy inference rules. So, the fuzzy rule will be triggered while the user had the inclination of the corresponding attributive class in his previous requesting records. Finally, the recommendation is accepted by user or not will be feedback to the system to enhance the accuracy of the recommendation. Thus, we offer an adapted recommendation system for the variety of trends of the users.

Keywords: Requesting Song, Information Retrieval, Knowledge Base, Fuzzy

Inference, Adaptation Recommendation System

(5)

致 謝

人的一生是一個豐富的學習之旅。踏出校園8 年後,深感本身學能 的不足以及對於知識的渴望,讓我重拾學生生涯。在這裡,學到的不僅 是做研究的方法,也學到做人處事的態度。

本論文得以順利完成,首先要感謝指導教授陳榮昌博士於研究過程 中的細心指導,除了給我課業上的幫助,平時生活上的經驗也會跟老師 請教,真的很感謝老師。感謝口試委員呂瑞麟老師以及李金鳳老師給予 的寶貴指導與建議,讓本論文得以更完整。

此外,感謝「超級點歌王」業者提供寶貴的原始資料供研究之用;

感謝李麗華導師不斷的給予鼓勵;感謝林至中老師、王淑卿老師、唐元 亮老師、梁錫卿老師、陳靖國老師、薛夙珍老師、羅卓雄老師在修課期 間精彩的上課內容,讓我收穫豐富。感謝班上同學冠華一路走來的支持 與督促,讓我的學習生涯不會孤獨;感謝翠婷夫妻的學習經驗分享;感 謝澄瑜學弟在口試當天全力的協助,讓我全心準備;感謝老公學弟給予 研究上的意見,懷念一起念書的日子,祝你明年順利畢業;最後感謝家 人全心的支持與鼓勵。在此謹以此論文獻給你們。

這三年中,經歷了人生中最重要的時刻,結婚、懷孕、生女,不僅 要兼顧家庭、學業還有工作,這一路走來將來必定讓我回味無窮。金鳳 老師在口試當天還不忘給我上了一課「蝴蝶蛹的啟示」,在我有了自己 的小孩的現在,聽起這個故事,也覺得更有感覺。

黃若嘉(麗美) 謹誌 中華民國 九十六 年 五 月

(6)

目 錄

中文摘要 ...I

ABSTRACT... II 致 謝 ...III 圖 目 錄 ... VI 表 目 錄 ...VIII

第一章、 緒論... 1

1.1 研究背景... 1

1.2 研究動機... 3

1.3 研究目的... 4

1.4 研究流程... 6

1.5 論文架構... 8

第二章、 文獻探討... 9

2.1 線上卡拉OK 系統... 9

2.2 推薦系統... 10

2.2.1 個人化服務 ...11

2.2.2 協同過濾推薦 ... 12

2.2.3 相似度衡量方法 ... 15

2.3 知識庫... 17

2.3.1 模糊推論... 17

2.3.2 規則庫... 17

2.4 滿意度評估方法... 18

2.4.1 隱性評比 ... 18

2.4.2 隱性回饋... 18

第三章 研究方法... 19

3.1 推薦流程... 19

3.2 協同過濾推薦... 21

3.2.1 同好名單產生及相似度計算... 22

3.2.2 由協同過濾形成之推薦... 25

3.3 知識庫推薦... 26

(7)

3.3.2 使用者資訊檔(User Information DB)... 32

3.3.3 隱性回饋... 34

3.3.4 隱性評比... 37

第四章 系統設計與系統建置... 38

4.1 系統架構說明... 38

4.2 系統流程... 39

4.3 系統畫面... 40

4.4 研究結果... 46

4.4.1 研究限制... 46

4.4.2 研究結果 ... 46

第五章 結論... 50

5.1 結論... 50

5.2 未來研究方向... 51

參考文獻 ... 52

(8)

圖 目 錄

圖 1. 推薦系統流程... 11

圖 2. 協同過濾推薦步驟(資料來源︰Breese 1998) ... 13

圖 3. 個人化知識庫推薦流程... 20

圖 4. 點歌清單... 20

圖 5. 協同過濾推薦運作流程圖... 21

圖 6. 規則 1 的隸屬函數... 27

圖 7. 規則 2 的隸屬函數... 28

圖 8. 規則 3 的隸屬函數... 28

圖 9. 規則 4 的隸屬函數... 29

圖 10. 規則 5 的隸屬函數... 29

圖 11. 知識庫推薦形成... 30

圖 12. 知識庫推薦系統流程... 33

圖 13. 回饋機制... 34

圖 14. 使用者接受推薦點選的回饋機制... 36

圖 15. 使用者登入流程... 39

圖 16. 使用者登入畫面... 40

圖 17. 使用者登入後畫面... 40

(9)

圖 18. 選擇「熱門點唱排行榜」... 41

圖 19. 使用者點歌後確認回饋畫面... 42

圖 20. 規則 3 尚未進行回饋的分數... 42

圖 21. 規則 3 進行回饋後的分數... 42

圖 22. 規則 3 進行 30 次點唱回饋後的分數... 43

圖 23. 使用者再次登入時形成的推薦畫面... 43

圖 24. 由知識庫推薦歌曲來點歌... 44

圖 25. 規則 4 尚未進行回饋的分數... 44

圖 26. 規則 4 進行回饋後的分數... 45

(10)

表 目 錄

表 1. 代表性會員的點歌次數表... 23

表 2. 代表性會員的點歌表... 23

表 3. 由同好票選出來的推薦清單... 25

表 4. 知識庫所建規則... 26

表 5. 使用者資訊檔中 M1的記錄... 31

表 6. 知識庫規則的可應用度... 31

表 7. 使用者資訊檔(User Information DB) ... 34

表 8. 尚未回饋前的使用者資訊檔中 M1 的記錄... 35

表 9. 透過使用者主動點選後M1在使用者資訊檔的記錄... 35

表 10. 透過知識庫推薦點歌後 M1在使用者資訊檔的記錄... 37

表 11. 協同過濾方法所遇到的問題與解決方式 ... 47

(11)

第一章、緒論

1.1 研究背景

隨著資訊科技的進步,數位化的科技早已融入我們的日常生活。這 一波數位化的浪潮,「家庭」將會帶給消費者新的生活樂趣與娛樂體驗。

在科技的運作與連結下,整合網路、通訊、影視娛樂的服務,「客廳」

不僅變成下一波家庭數位娛樂潮流的引爆點,更是未來家中娛樂的中 心。

1.1.1 家用卡拉 OK 的興盛

隨著資訊、電子技術的進步,數位家電(Information Appliance, IA)

的概念已經逐漸實現。數位家庭概念逐漸建構在消費者心目中,愈來愈 多的線上服務被提供。在家用卡拉OK 伴唱機蔚為風行的今天,愈來愈 多人喜歡在家裡點歌歡唱,購買家用伴唱機。日本Pansonic 公司預測,

台灣非營業場所KTV 的每年產值至少達 52 億台幣。

1.1.2 線上服務之線上點歌

創新的科技,讓生活數位化一蹴可幾。更多的線上服務將被提供。

目前使用者已經可以利用電腦連結網際網路進行線上點歌(Requesting Song)歡唱;數位家電以及寬頻的日益普及,使得使用者可以透過數位 電視(IP-TV)結合網路與影音(A/V),利用視頻點播的方式進行線上點 歌,這種線上影音卡拉OK 的服務,讓使用者可以隨時隨地進行線上歡 唱。

然而,新歌推陳出新,欲點唱新歌,必須透過人工手動方式將歌曲 加進硬碟裡,實為不方便。因此線上娛樂服務的出現將會直接取代家用

(12)

伴唱機。目前已經有網路業者,如超級點歌王以及iKala 等提供線上點 歌的服務,有朝一日,透過MOD 視頻點播的方式,隨心所欲的進行線 上點歌將不是夢想。

(13)

1.2 研究動機

有鑒於全球『數位家電』市場將有爆發性的成長,而且需求量愈來 愈大,數位電視(IP-TV)將是未來的趨勢。結合數位電視而衍生的線上 服務將愈來愈趨於多元化,尤其是線上卡拉OK 系統的發展。由於目前 已經有網際網路的業者,如「超級點歌王」、「愛卡拉」等提供線上點歌 歡唱的服務。這些卡拉OK 系統點歌的方式,在以往必須看歌譜利用號 碼點歌,形成不方便;以至目前的提供可以利用「新進歌曲點歌」、「排 行榜點歌」等方式進行推薦。更甚者,有些KTV 業者提供「我的歌譜」,

使用者可以在家上網進行選歌,到了 KTV 歡唱時即可叫出之前上網的 點歌記錄。

然而在大量的歌曲中,使用者要找到自己喜歡的歌曲要花上許多的 工夫,使用者必須利用關鍵字、歌曲編號等做條件搜尋,實為不便。雖 然目前的線上點歌系統也提供了「排行榜點歌」、「歌星點歌」、「新進歌 曲點歌」等推薦歌曲來加快使用者的找尋時間,但這些功能卻沒有考慮 到使用者的興趣差異,無法有效的提供使用者個人化的推薦。

因此我們將提供一個個人化的線上服務,每一位使用者除了可以利 用「排行榜點歌」、「歌星點歌」、「新進歌曲點歌」來進行點歌以外,還 有為每個使用者量身定做的推薦歌曲。利用知識庫的概念,除了可以結 合協同過濾的使用者名單做推薦外,尚可依使用者的過去的點歌記錄,

將其經驗值記錄下來,依其特殊喜好進行推薦。例如,興趣傾向穩定的 使用者適合用協同推薦、較沒有主見的使用者可能適合 TOP-N 熱門點 歌的推薦、對新歌曲接受度高的使用者可能較需要新進歌曲的點歌推 薦。

(14)

1.3 研究目的

線上系統的發展,除了可以讓使用者可以隨時隨地使用外,更可以 提供各種快速的查詢及經驗的累積。然而,目前已存在的線上點歌系統 (例如︰超級點歌王、iKala、…等線上服務業者),大多只能提供關鍵字 及歌曲編號等查詢,頂多再加上「新進歌曲點歌」、「排行榜點歌」等推 薦方式來加快使用者的找尋時間,但這些功能並沒有考慮到使用者個別 化的興趣差異,無法有效的提供使用者個人化的推薦。為了讓線上卡拉 OK 的推薦更有效率及更符合使用者所需,我們採用協同過濾的方法並 且利用使用者過去的經驗彙整成知識庫的方式來進行推薦。

因此,本研究試著使用協同過濾的方法來做線上點歌的第一步推 薦。利用同好的興趣進行個人化的推薦,假設某集群內的人在過去擁有 相似的興趣,其在未來應也會具相同的興趣跟喜好。我們根據使用者的 基本資料及過去的點歌紀錄找出該使用者的同好並記錄下來,當使用者 要進行點歌時,就可以依據這些同好最近的點歌紀錄來共同形成推薦。

然而,為了適應多樣性的使用者群,例如興趣傾向穩定的使用者適 合用協同推薦、較無主見的使用者可能適合 TOP-N 熱門點歌的推薦、

對新歌曲接受度高的使用者可能較需要新進歌曲的點歌推薦等。因此,

我們也探討如何利用專家系統的概念,將使用者過去的點歌經驗累積於 知識庫中,利用模糊推論(Fuzzy Inference)的方式,推導出適合使用者的 推 薦 方 式 , 並 為 使 用 者 作 有 效 的 個 人 化 推 薦 (Personalized Recommendation)。在本研究中,我們採用模糊理論的 If-Then Rules 建 構知識庫,並且依規則的隸屬程度值作為可應用度的參考依據,將點歌 的頻率納入模糊程度的輸入變數當中,提高推薦的準確度。

(15)

系統具有學習能力。使用者在每次選歌之後,系統會依其是否接受 推薦來形成隱性回饋,如此反覆不斷地學習,將經驗知識不斷累積,持 續修正系統參數,可以提供給興趣多變的使用者一個適性化的推薦。

這種結合協同過濾以及知識庫的推薦方式,將使推薦結果更接近使 用者所需,不管使用者是透過協同過濾的推薦點唱或者是透過知識庫的 推薦點唱,都可以減少使用者主動搜尋歌曲的時間,有效地找出演唱興 趣並推薦個人化的歌曲供點唱。

(16)

1.4 研究流程

本研究流程如下所示,首先確認研究主題與方向。並取得線上點歌 卡拉 OK 業者「超級點歌王」的信任,將資料給予研究之用。「超級點 歌王」是由清華大學教授成立於台灣新竹國立清華大學創新育成中心,

經營定位為以聲音辨識為主相關應用的軟體/韌體開發公司,鎖定線上 音樂市場、消費性電子玩具等二大全球商機市場,期許成為在全球華人 卡拉OK 互動娛樂市場,成為第一大軟體技術平台開發商/經營者。

我們利用取得的資料供研究的實驗,利用該資料實作出雛型系統,

除了驗證我們所提出來的概念可行,並且可以提供給「超級點歌王」一 個推薦的實例當作參考的依據。

我的研究流程,首先確認研究主題,再確認研究背景,接著做相關 文獻的探討,然後與相關業者蒐集資料,待確認研究架構後,針對所取 得的資料進行分析與處理,爾後進行雛型系統的建置,依據實際的建置 成果驗證我們提出來方案的可行性與未來研究方向。

1. 確認研究主題與方向 2. 設定研究背景與目的 3. 相關文獻探討與回顧 4. 資料收集

5. 建立研究架構 6. 資料前置處理 7. 雛型系統建置

(17)

8. 研究結論與未來研究

(18)

1.5 論文架構

本文章結構在第一章描述我的研究動機,根據目前線上點歌的現況 及目的做一陳述。在第二章將有用到的文獻做一整理,說明線上點歌及 推薦系統、協同過濾推薦、知識庫推薦、個人化系統相關的研究。第三 章則說明整個系統的推薦流程,首先說明如何應用協同過濾的方法產生 同好名單並進行推薦,接著說明利用模糊推論於智慧點歌系統之方法。

第四章為推薦系統實作,利用取得的資料進行系統雛型架設,最後並在 第五章提出結論與未來研究方向。

研究動機與目的

文獻蒐集與整理

研究架構建立

系統開發與實作

了解研究背景

確立研究動機與目的

卡拉OK 系統 推薦系統 知識庫

協同過濾推薦 知識庫推薦

使用ASP 開發系統 第一章

第二章

第三章

第四章

第五章 結論與未來研究 研究結果呈現與未來研

究方向

(19)

第二章、文獻探討

2.1 線上卡拉 OK 系統

線上點歌系統的發展,例如︰劉鎮華(1994)提出一個有別於傳統 KTV 系統的新架構,以影音詞三者分離的方式來減少所需的磁碟容 量,解決不同媒體播放的同步問題;林永財(2004)探討 KTV 電腦點歌 螢幕操作介面使用性;林婉琪(2005)應用 Phase Vocoder 實現卡拉 OK 伴 唱機音效以虛擬重低音合成,以數位訊號處理的技巧來實現諸音效;陳 孜彬(1998)以聲音查詢歌曲資料庫「以歌選歌」讓使用者用唱或哼一段 歌曲的旋律,而將這個歌曲從資料庫中選取出來;張道宇(2005)探討線 上卡拉OK 消費者再惠顧意願。這些不管是在硬體或軟體的研究都讓線 上點歌的發展日趨進步。

(20)

2.2 推薦系統

當人們在一個沒有足夠經驗或知識的情況下,卻必須做出一些決定 時,人們必須依靠他人的經驗或知識所做的推薦。推薦系統的概念也就 是因此而產生。推薦系統是協助使用者在大量的資訊中,挑選出滿足個 別使用者需求的資訊。Resnick 與 Varian 認為一般的資訊過濾系統 (Information Filtering System) 也 泛 稱 為 推 薦 系 統 (Recommendation System),並且解釋為何使用「推薦系統」這個名詞,理由如下:

1. 提出建議的人跟接受建議的人未必是完全相互合作,兩者之間可 能不知道對方的存在。

2. 「推薦」這個名詞除了表示過濾資料,主要的焦點是放在推薦使 用者會感到興趣的項目或主題,因此更能符合系統目標。

推薦系統的流程為蒐集使用者資訊,依據使用者的資訊進行資料篩 選而後進行推薦,最後使用者推薦結果評估並回饋給系統,當系統欲再 次做推薦時再重新蒐集使用者的資訊,形成一循環。

(21)

圖 1. 推薦系統流程

目前的推薦系統大多使用在線上購物的推薦(Kim, Jae Kyeong,2002

& Cho, Yoon Ho,2004 & 許靜芬,2001)或其他電子商務的應用,例如電子 市集商機撮合電子報之研究、網路教材的推薦、網路學習導覽推薦之研 究等(韓雙福,2003 & 陳正德,2004 & 簡士堯,2004)。其他利用推薦系統 提供顧客個人化的產品或服務,例如Amazon.com、CDNOW 等許多網 站,都在他們的網站上使用了推薦系統功能。在本研究中,我們將推薦 的方法應用到線上點歌系統,讓線上點歌能達到具有個人化特色的目 的。

2.2.1 個人化服務

「個人化服務」,顧名思義就是針對個別使用者提供專屬的服務,

既然網際網路具有一對一傳播的特性,且網頁的設計已可達到互動的效 果,因此網站上的線上服務必然可以提供一對一的個人化服務。

(22)

個人化推薦系統的首要步驟便是蒐集資訊,並利用得到的資訊來建 置個人化網站。這些資訊可直接由顧客輸入個人的興趣與喜好而得,例 如顧客在網站上常被要求對其所購買產品或使用過的服務作評比,由此 方式可反映顧客對於產品或服務的偏好,此為外顯的取得資訊。但由於 使用者進行評比的意願將影響到推薦之準確性,因此目前越來越多的推 薦系統使用「隱性蒐集資訊」的方式,將顧客的歷史交易紀錄與瀏覽網 站之行為加以分析,以省去顧客必須手動輸入個人喜好的不方便。

目前關於個人化推薦系統的相關研究,較注重於系統推薦速度及效 率的提昇。例如利用模糊擷取與相似度來建立個人化資訊服務的推薦架 構(戴偉勝,2000),或是結合類神經網路中的自適應共振理論(ART)衡 量技術(李麗華等,2001),以及反向於 Apriori 演算法之程序的快速反向 關聯法則(FBAR)演算法(蔡麗娟等,2001),多半是從演算法上的作方法 上的改良,較無針對更適時適性的推薦方式之研究。

2.2.2 協同過濾推薦

協同過濾法則是找出一群具有共同興趣的使用者形成社群,也就是 由某些相似特性成員的集合,透過分析社群成員共同的興趣與喜好,再 根據這些共同特性推薦相關的項目給同一社群中有需求之成員。協同過 濾不是去分析項目的內容,而是去分析使用者的相似程度。其假設為"

一群人在過去有相似的興趣,那麼在未來應該也會有相同的興趣跟喜 好"(Griffith, 2000 & Riordan, 2000)。

協同過濾是目前使用最成功的推薦系統技術之一,它可以解決內容 導向的一些問題,使用這個方式不需要分析項目,因為系統會根據與使

(23)

用者有相同興趣的社群成員曾購買之產品來做推薦;也就是說,它是依 據其他顧客的意見來為其目標顧客推薦產品,因此所推薦產品可能與使 用者從前的喜好大不相同,但是卻能挖掘出消費者的潛在需要,甚至是 將瀏覽者變為購買者。

而學者Sarwar 等人曾提出,協同過濾的推薦系統主要可分成三個子 任務,分別為資料輸入表示、社群的建立、以及產生推薦等三部份,以 下針對各部份詳加說明:

i. 輸入資料表示法:將消費者過去的購買行為及興趣利用一個 m×

n 的矩陣 R 來表示,也就是 Rm×n,亦即 n 個顧客層購買 m 項產 品的歷史交易資料,矩陣元素 rij則表示第i 個顧客購買第 j 個產 品。

ii. 相似社群的建立:此為協同過濾推薦系統中最重要的一個步 驟,可以計算出顧客間的相似程度,以作為將來推薦的依據。

iii. 產生推薦:從社群成員中衍生出對目標顧客的前 n 項推薦產品。

圖 2.協同過濾推薦步驟(資料來源︰Breese 1998)

(24)

然而,協同過濾推薦也存在以下問題︰

(1) 取得使用者資料困難

使用者常常只希望享受推薦的好處,而不願意多花時間去做評比,

因此會導致評比稀疏的問題。可以採用隱性評比來解決此問題。

(2) 評比稀疏(Ratings Sparsity)問題

當項目多而使用者評比少時,會造成使用者之間的相似度很低以致 難以分群。解決方案有獎勵評比、使用隱性評比蒐集資料及提高評比等 級改善評比的密度,如從評比網頁提升到評比網站。

(3)新的使用者難以獲得推薦(Cold-Start)

因為協同過濾需要夠的使用者資料才能將使用者分群,而新的使用 者缺乏足夠的評比以作為分群的依據,必須經過一段時間累積足夠的評 比才能將使用者分群。折衷的應對方案為推薦熱門項目給使用者。

(4)少數族群問題

如果使用者有特殊的喜好,與大部分人不相同時,會因為族群內的 成員少,能得到的推薦也因此而相對減少。

(5)使用者多重興趣問題(Multiple Interesting)

使用者通常不會只針對某一種類的項目有興趣,如果只將使用者分

(25)

(Fuzzy Clustering),讓使用者可以同時歸屬於不同族群,只是每個族群 的隸屬程度不同而已。

(6)使用者興趣轉移問題

使用者的喜好可能因時間而有所改變,一個解決的方法是定期計算 使用者的相似度,將他們重新分群。

(7)新的項目難以被推薦出去

因為協同過濾所推薦的項目都是使用者已經接觸過的,新的項目需 要有許多使用者評比過後才能被推薦出去。

(8)系統剛啟用時無法進行推薦(System Bootstrapping)

推薦系統剛該開始使用時,因為使用者評比資料不足,無法進行使 用者分群與推薦的動作。

2.2.3 相似度衡量方法

根據相似度衡量公式的調查發現,大多數的相似度衡量公式源自於 下列幾種運算基礎:

(一) 隸屬度和與差(difference and the sum of grades of membership)。

(二) 幾何距離模式(geometric distance model)。

( 三 ) 集 合 理 論 (Set-Theoretic Approach) 中 的 聯 集 與 交 集 運 算 (Operation of Union and Intersection)。

我們在協同過濾中使用集合理論,利用聯集與交集運算後的結果來

(26)

計算相似度。

(27)

2.3 知識庫

通常專家系統的設計核心可分為「知識」和「推理」兩部份。在專 家系統的知識庫上有一個推論引擎,會針對輸入的事實與知識庫中的知 識相比對,做出建議產的推理和決策,故最常用的推論動作是 if-then 方式,主要是將人類知識描述成一條一條的推論規則以供推論機制使 用,這些定義主要的目的在於利用這些定義來進行推論的動作。

2.3.1 模糊推論

模糊推論(Fuzzy Inference)是一種將輸入值經由一些規則 mapping 到對應輸出值的方法。模糊推論引擎是模糊系統的核心,它可以藉由近 似推論或模糊推論的進行,來模擬人類的思考決策模式,以達到解決問 題的目地。

2.3.2 規則庫

模糊規則從何而來呢?一般說來,有兩種取得模糊規則的方式:第 一種方式也是最直接的方式,就是由專家來提供所須的模糊規則;第二 種方式是先收集一些量測資料後,再經由特定的訓練演算法則來從量測 資料中萃取出模糊規則。假若模糊規則是由人類專家所給定的,則隸屬 函數就必須由人類專家一起給定。

(28)

2.4 滿意度評估方法

2.4.1 隱性評比

推薦系統取得使用者的評比資料的方法可分為顯性評比(Explicit Rating)與隱性評比(Implicit Rating)(Nichols,1997)。顯性評比即要求使用 者針對特定項目做評分的動作,隱性評比則是系統藉由紀錄與分析使用 者過去的行為,間接的統計出使用者對特定項目的喜好程度。

我們使用的評比方式為隱性評比;會員透過推薦歌曲列表點歌或透 過搜尋的方式進行點歌,每一次的點歌記錄都是我們系統的評比,不需 要另外再對會員要求評分,增加使用者的困擾。透過會員每次的點歌記 錄,對系統來講即是做了評比,可以得到精確的評比分數。

2.4.2 隱性回饋

當使用者在做評比的時候即是對系統做了回饋,我們的系統取得使 用者的回饋資料讓系統重新計算相似度、重新佈署參數,進而可以重新 獲得推薦,讓使用者的推薦更為準確,不會因為時間的改變以及興趣的 轉移而失去推薦的準確率,進而達到更適性化的推薦。

系統接收到使用者的點歌,即可以依設定的時間重新進行相似度的 計算,重新尋找興趣相似的同好名單,並且可以重新推薦歌曲,可以說 一舉數得。

(29)

第三章 研究方法

3.1 推薦流程

一般而言,推薦系統的推薦流程可分為三大步驟:1.蒐集使用者的 資料;2.根據使用者的資料進行分析以產生推薦;3.針對使用者對推薦 項目的喜好與否來進行適當的修正。

根據這些步驟,我們利用使用者的基本資料及過去的點唱記錄依相 似度計算後找出同好名單並記錄在使用者資訊檔案中,當使用者上線後 即可利用其同好們最近的點唱紀錄來共同進行歌曲的推薦,形成第一階 段的協同過濾推薦。接下來,當會員登入系統,透過歌曲點歌時,由專 家建立的知識庫便立即開始運作。我們從使用者的過去點唱記錄,找出 使用者的傾向。並結合使用者輪廓檔(Membership DB)與歷史點歌記錄 (Transaction DB),找出每個使用者的點歌興趣傾向,接著記錄在使用者 資訊檔(User Information DB)中。透過我們記錄的資料,每個使用者一 旦登入,藉由這些系統所記錄的資訊,從知識庫中比對每個使用者對於 每條規則的可應用度,找出超過門檻值的規則後,再依模糊理論中的隸 屬程度值,分別找出符合規則的歌曲,集合成推薦清單,即可依會員特 質進行智慧型的個人化推薦。

(30)

圖 3. 個人化知識庫推薦流程

因此,使用者的點歌清單中,除透過使用者的傳統被動式尋找方法 以外(如︰新進歌曲、歌星點歌…等),尚包含由協同過濾機制萃取出的 主動式推薦清單,以及知識庫推薦的歌曲。

圖 4. 點歌清單

(31)

3.2 協同過濾推薦

首先,我們利用協同過濾來產生第一階段的推薦。協同過濾使用的 推薦流程如下圖所示。其中,為了增加執行的效能,我們採用離線的方 式來更新每個使用者的同好名單,每隔一段時間(假設時間周期 C=1 天),我們會計算每個會員彼此的點歌或基本資料的相似度,並將最相 似的同好名單儲存於使用者資訊檔中。此部份將詳述於下一小節。我們 將每次的點歌皆視為一次回饋,資料回饋到點歌記錄檔,每當我們重新 計算相似度的時候,所讀取的點歌記錄檔將愈來愈精確。

圖 5. 協同過濾推薦運作流程圖

(32)

3.2.1 同好名單產生及相似度計算

同好名單主要是依據會員彼此的相似度來決定。因為會員的個數相 當的多,這些會員之中有許多是不具代表性或已經失去時效性的會員,

所以在找同好名單前,我們必須先將會員資料做前置處理,包括資料淨 化、資料整合、資料轉換以及資料縮減,最後得到較精簡且具代表性的 會員名單,這些通常是最近常有點唱紀錄的會員。因此,每個會員就可 以與這些代表性會員作相似度比較,並從中找出相似度較高的代表性會 員來加入其同好名單。對於已經有點歌記錄的會員,我們利用點唱過的 交易記錄來作為計算相似度的依據;對於尚無點歌記錄的會員,我們只 好利用使用者輪廓(例如有登入次數、年收入、出生年份等等)來作為計 算相似度的依據。

同好名單產生的方式詳述如下: 首先我們利用交易時間先進行排 序,找出最近m 個有點唱記錄的會員(以下稱為代表性會員)。以我們於

「超級點歌王」所取得的資料為例,尚未處理過的原始會員有16 萬名,

我們進行資料預處理後可以減少到近期有來點唱的 m 個代表性會員。

因為最近一個月所找到的代表性會員約在1 萬筆上下,因此,我們假設 m=10,000。

假設所有會員的集合M={ M1 , M2, …, Mn },我們就可以為每一個 會員 Mi,i=1,2,…,n,透過相似度計算找出相似度較高的同好們。為了 避免找到的資料過於發散,這些被選出的同好必須同時滿足下面兩個條 件:

1. 與會員 Mi的相似度大於門檻值θ的同好,以及 2. 該會員須為與會員 Mi相似度較高的r 人。

(33)

如此找出來的同好才能較具代表性,其中θ與 r 為系統訓練的參數。

表 1. 代表性會員的點歌次數表

序 會員\歌曲 歌曲 1 歌曲 2 歌曲3 歌曲4 歌曲5

1 會員M1 2 3 5 0 24

2 會員M2 11 0 3 3 5

3 會員M3 3 0 12 1 0

4 會員M4 14 0 0 33 15

5 會員M5 0 6 0 2 0

接下來,我們以表一為例(假設代表性會員數 m=5)來說明有點歌紀 錄的會員與代表性會員間相似度的計算方法。首先,為了簡單起見,我 們只考慮會員的點歌與否,暫時不考慮點歌的頻率。因此,我們只需用 代表性會員點歌與否的點歌表(即表二所示)。

表 2. 代表性會員的點歌表

序 會員\歌曲 歌曲 1 歌曲 2 歌曲3 歌曲4 歌曲5

1 會員M1 1 1 1 0 1

2 會員M2 1 0 1 1 1

3 會員M3 1 0 1 1 0

(34)

4 會員M4 1 0 0 1 1

5 會員M5 0 1 0 1 0

假設 Si為會員 Mi所有點過歌曲的集合,那麼我們就可以定義會員

Mi與會員 Mj的相似度為 Φ= i j

j i

S S

S S

。以表二為例,

„ 會員 M1與會員 M2的相似度 Φ12=

2 1

2 1

S S

S S

∩ = 5 3=0.6

„ 會員 M1與會員 M3的相似度 Φ13=

3 1

3 1

S S

S S

∩ = 5 3=0.6

„ 會員 M1與會員 M4的相似度 Φ14=

4 1

4 1

S S

S S

∩ = 5 2=0.4

„ 會員 M1與會員 M5的相似度 Φ15=

5 1

5 1

S S

S S

∩ = 5 1=0.2

假設門檻值 θ 為 0.5。因此會員 M1的同好名單為 M2及M3。 另外,對於尚無點歌記錄的會員,我們利用使用者輪廓來作為計算 相似度的依據,其計算方式與有點歌紀錄的會員類似,只是把表二的歌 曲改成用每一個不同的使用者輪廓細項(例如有登入次數、年收入、出 生年份等等)來取代,若某一細項類似則給 1 否則給 0。如此即能算出相 似度並求出其同好名單。

(35)

3.2.2 由協同過濾形成之推薦

我們的推薦清單是由同好票選出來的。我們以表三來說明,假設某 會員的同好有 M1、M2及M3在表三中當某一首歌最近有被Mi點唱過,

則相對應會員 Mi的值就會被設定為 1,否則設定為 0。因此,我們只要 將每一首歌所得到的票數統計於最後一列中,就可以依據這些票數的多 寡來決定那些歌曲該被推薦了! 在此例中,當會員 Mi登入系統,系統 從會員紀錄檔中得知其同好有 M1、M2及M3,於是由表三就可以得知 歌曲 1 以及歌曲 3 的票數較高,因此,歌曲 1 以及歌曲 3 就會被列入推 薦清單。

表 3. 由同好票選出來的推薦清單

序 會員\歌曲 歌曲 1 歌曲2 歌曲 3 歌曲4 歌曲 5

1 會員M1 1 1 1 0 1

2 會員M2 1 0 1 1 1

3 會員M3 1 0 1 1 0

合計

3

1

3

2 2

線上點歌的推薦不同於一般購物的推薦,使用者在不同的時間點對 於購物的需求因人而異,然而,對於線上點歌,使用者有可能每次上來 唱的都是相同的歌曲。所以,被點唱的次數也相當重要,目前協同過濾 的方法只針對歌曲是否有被點唱過來列入考量,接下來在知識庫中我們 將考慮歌曲被演唱過的頻率,使得每個會員對某一歌曲的興趣取向更為 明顯。

(36)

3.3 知識庫推薦

3.3.1 知識庫運作

專家系統的推論技術,通常劃分為規則式推論方式(Rule-Based Reasoning)案例式推論方式(Case-Based Reasoning)。規則庫中存放用於 推導事實之規則,案例庫中儲存以往案例領域的知識,並運用案例式的 推論方式,以作為整個專家系統的核心機制。最常使用的規則式推論動 作為 If-Then 之方式,其主要將人類知識描述為條列式的推論規則以供 推論機制使用。

我們提供歌曲點播的知識專家一個輸入知識的平台,透過提供的平 台可以運用專家輸入的知識進行知識庫的推薦。舉例而言,若某一個會 員的習慣通常為點選新進歌曲,於是當他下次登入系統時,我們便直接 推薦新進歌曲以供他參考。

當定義的規則愈多,也就是特徵類別的定義較豐富,將有可能使得 推薦的內容過於發散而無法達到正確的結果;當定義的規則過少,將無 法藉由規則中抓取適當比重值的參數,無法達到正確的推薦。我們藉由 分析資料庫所產生的經驗值來定義目前的規則,首先歸納彙整出表4 的 五條規則,來說明知識庫運行的過程。

表 4. 知識庫所建規則

Rule

隸屬函數

1 if

New_Song_is_prefer, then add New_Song to

recommend list.

圖4

2 if

New_song_billboard_is_prefer, then add New_song_billboard to recommend list.

圖5

(37)

3 if

Hot_To_Request_Tune_The_Billboard_is_prefer,

then add Hot_To_Request_Tune_The_Billboard to recommend list

圖6

4 if

Collaborative_Filtering_is_prefer, then add Collaborative_Filtering to recommend list.

圖7

5 if

A_Song_Is_Hot_To_Request_is_prefer, then add A_Song_Is_Hot_To_Request to recommend list.

圖8

假設目前有以上的5 條規則存在於我們的知識庫,我們在使用者資 訊檔中記錄會員對於這些規則的可應用程度,並透過比對後進行推薦,

每個使用者依其特性將給予不同的推薦。首先,必須確認使用者適合上 述哪條規則,並依其可以被應用(Apply)的程度,分別找出該規則(Rule) 的隸屬程度,再從該規則中,取出適當的歌曲比重,以形成我們的知識 庫推薦清單。我們將上述的規則利用隸屬函數(Membership Function)來 表示,如下所示︰

z 規則 1 的隸屬函數︰New_Song_is_ prefer。對於新歌較偏好。

圖 6. 規則 1 的隸屬函數

(38)

z 規則 2 的隸屬函數︰New_Song_Billboard_is_prefer。對於新歌排行 榜較偏好。

圖 7. 規則 2 的隸屬函數

z 規則 3 的隸屬函數︰Hot_To_Request_Tune_The_Billboard_is_

prefer。對於熱門點唱排行榜較偏好。

圖 8. 規則 3 的隸屬函數

(39)

z 規則 4 的隸屬函數︰Collaborative_Filtering_is_prefer。有同好傾向 較為明顯,也就是我們利用協同過濾找出來的歌曲。

圖 9. 規則 4 的隸屬函數

z 規則 5 的隸屬函數︰A_Song_Is_Hot_To_Request。對某首歌曲特別 偏好。

圖 10. 規則 5 的隸屬函數

我們利用模糊理論的方法分別為每個會員對應找出規則庫中的隸 屬程度值。找出通過門檻值的規則可應用度,並分別依該規則中的可應

(40)

用度找出推薦的歌曲曲目。不同的會員由於興趣不同,將得到不同的知 識庫推薦清單。舉例來說,會員 M1可能從規則 1、規則 2 分別找出五 首歌曲來推薦;對會員M2來講,可能從規則3、規則 4、規則 5 各找出 三首、四首、一首歌曲來推薦。下圖的推薦清單便由規則2 的三首歌,

以及規則1、規則 3 中各一首歌所組成。

圖 11. 知識庫推薦形成

那麼我們如何對會員 M1 形成最適當之推薦歌曲呢?藉由會員 M1

在參數檔中所紀錄對規則的分數,比對每個規則的隸屬函數,轉換成隸 屬程度值,再挑選超過門檻值的可應用度。依據超過門檻值的可應用 度,分別從該規則中抓取適當比例的歌曲數,形成推薦。

如果我們要找出會員 M1 對於每條規則的隸屬程度值,則我們可依 上列圖 4 到圖 8 中每條規則的點選率去找出隸屬函數相對應的 αi。那 麼 , 我 們 就 可 以 得 到 會 員 M1 對 各 條 規 則 的 可 應 用 度 α

=(α12 , …,αn )。每一個規則 Ri的可應用度 αi為0 到 1 之間的一個 隸屬程度值。假設有n 個規則,那麼規則 R = ( R1 , R2 , … , Rn)。因此 Ri [0,1],且 0≦i≦n。

(41)

表5. 使用者資訊檔中 M1的記錄

Member\Rule R1 R2 R3 R4 R5

M1 20 50 10 0 20

我們指定會員M1在規則Ri裡的隸屬程度為 αi。以表 5 會員 M1在 使用者資訊檔中所記錄的資料為例,對於每條規則的可應用度可以分別 算出,我們算出會員 M1 在規則 R1的可應用度為 α1=20%,在規則 R2 的可應用度為 α2=50%,在規則 R3的可應用度為 α3=10%,在規則 R4 的可應用度為 α4=0%,在規則 R5的可應用度為 α5=20%。因此,我們 可以得到如下的可應用度表。假設可應用度門檻值為20%,那麼未超過 門檻值的可應用度都將視為 0。因此,以表 5 的例子來說,R1及 R2及 R5會被執行到。

表 6. 知識庫規則的可應用度 Rule 可應用度

R1 0.2

R2 0.5

R3 0.1

R4 0

R5 0.2

(42)

n

j

那麼當知識庫要推薦s 首歌時,某一規則 Ri可推薦的歌有 ri = s * (αi / αj)

我們要利用知識庫找出對會員M1的推薦歌曲,假設s = 10,我們以 表 5 會員 M1在使用者資訊檔中所記錄的資料為例,R1及 R2及 R5會被 執行到。則對規則1 的推薦歌曲為︰r1 = 10 * 20 % / (20% + 50 % + 20%)

= 2 首;以及對規則 2 的推薦歌曲為︰r2 = 10 * 50 % / (20% + 50 % + 20%) = 6 首;以及對規則 5 的推薦歌曲為︰r5 = 10 * 20 % / (20% + 50 % + 20%) = 2 首。

3.3.2 使用者資訊檔(User Information DB)

由於部份知識具有難以格式化的特性,使得知識庫在知識表達上面 臨更多的困難。我們利用點選率來了解會員的興趣傾向,會員登入系統 進行線上點歌歡唱,藉由過去的歷史點歌記錄彙整來找出會員的喜好。

在會員基本資料(Membership DB)中,記錄使用者輪廓的資訊;在歷史 點歌資料(Transaction DB)中,記錄使用者過去的點歌交易資訊,這些都 是可以進行量化的資料,資料透過量化及轉換後將記錄於使用者資訊檔 (User Information DB)中。

(43)

圖 12. 知識庫推薦系統流程

因此,在使用者資訊檔中記錄轉換後的使用者的點歌歷史資訊,以 及使用者的點歌回饋資訊,與知識庫中的規則比對,待推薦時再依據規 則的可應用度進行規則的擷取。就像找出同好名單記錄在使用者資訊檔 中,再依同好的點歌興趣進行協同過濾的推薦;同樣地,將我們對知識 庫中的每條規則回饋評比的評分也記錄在使用者資訊檔中,當使用者一 登入我們便可進行比對,從中找出符合該會員的規則,並且根據規則裡 的歌曲進行推薦。

所以,在使用者資訊檔(User Information DB)中,包括了由協同過濾 推薦找出來的同好名單,以及對於知識庫中每條規則的評分資訊,如下 表7。藉由找出規則的可應用度之後,再找出該規則的歌曲,在這裡,

我們是找出符合該規則後的TOP-N 來取得符合的歌曲做推薦。

(44)

表 7. 使用者資訊檔(User Information DB)

會員 同好名單 R1 R2 R3 R4 R5 M1 M2, M16, M23, M85,

M91

20 50 10 0 20

M2 M1, M13, M19 10 80 0 10 0 M3 M15, M18, M20, M33 30 50 20 15 30

3.3.3 隱性回饋

我們透過使用者的點歌來做回饋與評比,持續不斷的修正系統參 數。使用者透過每次的點歌即為一次回饋。根據每一次的點歌回饋,不 管是使用者主動搜尋歌曲還是透過我們的推薦來點歌,將這些分數累積 到使用者資訊檔中。如此不斷地回饋資訊將可修正我們的參數愈趨正 確,而且對於興趣改變的使用者可以獲得正確的推薦,透過知識庫形成 的推薦將愈來愈精確。

在我們的系統中有二種回饋機制,以符合多變的使用者群的個性,

形成適性化的推薦。使用者點選回饋的方式有二種︰

(45)

1.回饋機制一︰使用者主動點選

透過使用者主動點歌,例如利用新進歌曲點歌後再選擇想要點唱的 新進歌曲。這種回饋對於符合的規則來講也是一種計分的回饋。我們必 須把此記錄也記錄到使用者資訊檔中。例如利用新進歌曲點歌,可以對 應 到 我 們 的 規 則 1, if New_song_is_prefer, then add new_song to recommend list,就可以把規則 1 增加一分,那麼使用者資訊檔內的資 料將從未尚回饋的表8 轉換成透過主動點選後的表 9。

表 8. 尚未回饋前的使用者資訊檔中 M1 的記錄 Member\Rule R1 R2 R3 R4 R5

M1

20

50 10 0 20

表 9. 透過使用者主動點選後M1在使用者資訊檔的記錄 Member\Rule R1 R2 R3 R4 R5

M1

21

50 10 0 20

2.回饋機制二︰使用者接受推薦點選

由專家系統所形成的知識庫推薦清單,包含了個人化的法則,每一 個使用者的推薦歌曲皆不一樣。我們必須判斷使用者點選了由哪一條法 則所篩選出來的歌曲進行回饋。每一次的點歌皆為一次回饋,若該首歌 被重複點唱,則被重複回饋,分數也將累積。

假設系統對某會員的推薦清單如下圖所示,一共有 10 首歌曲,符

(46)

合規則 1 中的歌曲有 3 首,符合規則 2 的歌曲有 2 首,符合規則 4 的 歌曲有5 首。

圖 14. 使用者接受推薦點選的回饋機制

以點唱 10 次來講,歌曲 11、22、42、45、47、48分別被點唱過一次 或數次,因此,我們將點選次數回饋到使用者資訊檔中。

舉例來說,在規則1 中,點唱過歌曲 11,表示透過規則1 推薦的有 三首,使用者點唱這三首中的一首歌曲11,並且唱了4 次。每點歌一次 即回饋一次,增加一分到規則1 裡,因此規則 1 一共增加了 4 分。

以規則2 來講,歌曲 22被點唱過 2 次,則每點歌一次即回饋一次,

增加一分到規則2 裡,因此規則 2 一共增加了 2 分。

以規則 4 來講,歌曲 42、45、47、48分別被點唱過 1 次,則每點歌 一次即回饋一次,因此規則4 一共增加了 4 分。

在使用者資訊檔中的記錄,將由表8 變成表 10。即,由 R1由20 分

(47)

增加 4 分為 24 分;R2由 50 分增加 2 分為 52 分;R3 不改變計分;R4 由0 分增加 4 分為 4 分;R5 不改變計分。新的使用者資訊檔如下表 10 所示。

表 10. 透過知識庫推薦點歌後 M1在使用者資訊檔的記錄 Member\Rule R1 R2 R3 R4 R5

M1

24 52 10 4

20

假設某首歌曲在 R1 以及 R2 的推薦清單中都有出現,則將同時對 R1以及 R2回饋計分。

3.3.4 隱性評比

當使用者點選的歌曲是透過我們的知識庫運作出來的推薦清單 時,對我們來說即是做了正確有給分的評比;當使用者點選的歌曲不在 我們推薦的清單內,則不予計分。意即,如果 10 次點歌中,有 6 次是 透過我們的推薦清單點歌,對我們來講即是有60%的正確率。

(48)

第四章 系統設計與系統建置

依據本研究所提出的個人化資訊推薦系統流程與架構,設計一套推 薦系統與網站雛形,以便對本研究所提出之理論基礎與架構作進一步驗 證與評估。

4.1 系統架構說明

我們利用ASP 來撰寫,資料庫依據「超級點歌王」業者所提供的資 料,再加上本研究所提出的個人化資訊推薦系統流程所需的資料表,利 用MDB 的資料庫來實作。

本系統以微軟 ASP 環境與 Microsoft Access 資料庫為開發工具,

Client 端以 IE 5.0 中文版以上瀏覽器為使用者介面,以 Windows 2000 為伺服端工作平台。並且搭配「超級點歌王」業者所提供的資料,再加 上本研究所提出的個人化資訊推薦系統流程所需的資料表。

本系統為 3-Tier 架構,各層說明如下:

1、Backend

後端作業平台為 Windows 2003 Server 中文版搭配 Microsoft Access 為 Database。

2、Middle Tier

以 Microsoft IIS 作為本系統的 Web Server。

(49)

以個人電腦上(Win 98/2000/XP)的 IE5.0 以上瀏覽器作為人機 操作介面。

4.2 系統流程

使用者登入後,系統隨即到使用者資訊檔(User Information DB)中利 用離線時間找出的同好名單,進行協同過濾推薦。並且依據每條規則所 記錄的分數找出該規則裡的歌曲,整合後形成專家系統的知識庫推薦。

圖 15. 使用者登入流程 使用者登入

協同過濾推薦

知識庫推薦 User

Information DB

(50)

4.3 系統畫面

1. 使用者登入的畫面

圖 16. 使用者登入畫面

2. 使用者登入後,隨即呈現利用知識庫所尋找出來該使用者的推薦 歌曲。以這個例子來講,是從規則2 及規則 4 中各取五首來推薦。

圖 17. 使用者登入後畫面

(51)

3. 當使用者進行點歌,即是回饋。使用者進行主動點選,選擇的是

「熱門點唱排行榜」。

圖 18. 選擇「熱門點唱排行榜」

4. 點選歌曲之後進行回饋。由於該首歌曲符合專家系統裡的規則 3,因此,點歌後即對使用者資訊檔(User Information DB)中的規 則 3 進行加分。

(52)

圖 19. 使用者點歌後確認回饋畫面

5. 使用者資料檔(User Information DB)裡該規則(規則 3)將因為點了 歌曲而進行加分,將由 15 分變更為 16 分。

圖 20. 規則 3 尚未進行回饋的分數

圖 21. 規則 3 進行回饋後的分數

6. 假設使用者點選了「熱門點唱排行榜」裡的歌曲進行歡唱,一共

(53)

如下圖 20。

圖 22. 規則 3 進行 30 次點唱回饋後的分數

7. 該使用者下次登入本系統進行歡唱時,利用知識庫對該使用者的 推薦歌曲將有異動。如下圖所示。

圖 23. 使用者再次登入時形成的推薦畫面

(54)

8. 另一種回饋方式是透過系統的知識庫推薦而形成。如果使用者接 受知識庫推薦點選,選擇的是「知識庫推薦」裡的一首歌。當使 用者選擇「小星星」,該首歌曲是由規則 4 所推薦。因此將計分 回饋到規則 4。

圖 24. 由知識庫推薦歌曲來點歌

9. 使用者資料檔(User Information DB)裡該規則將因為點了歌曲而 進行加分。規則 4 將由 53 分,變成 54 分。

圖 25. 規則 4 尚未進行回饋的分數

(55)

圖 26. 規則 4 進行回饋後的分數

(56)

4.4 研究結果

4.4.1 研究限制

本研究實際取得「超級點歌王」的資料來分析。在歌曲資料分類上 有一些限制︰該業者在歌曲分類中,「國語歌曲」這一類占了絕大多數 的曲目,約有百分之 80 以上。因此,若某會員每次都點選國語歌曲,

待下次的推薦要使用知識庫的推薦可能無法使用這種規則庫的推薦,這 種規則所推薦出來的歌曲可能會過於大眾化,意即歌曲資料庫中全部有 3000 首歌,那麼國語歌曲占了 2500 首,就算符合該規則的可應用度有 0.9 以上那麼,在 2500 首中要再推薦出該會員有興趣的歌曲,也是亂槍 打鳥,無法準確的提供推薦給該會員。因此本研究在此部份,用國語歌 曲以及台語歌曲來選歌的部分,並沒有利用專家系統的概念來實作。

4.4.2 研究結果

我們利用協同過濾以及知識庫的方式來進行線上點歌,這二種推薦 方式都使得線上點歌系統具有個人化的特色並提升使用者點歌的速 度。研究結果發現︰

1. 在協同過濾方法中,我們的推薦方式沒有語言的問題,不管是 中文歌曲、方言歌曲還是外文歌曲,皆可透過我們的研究方式 進行推薦點歌。

2. 透過同一個帳號進行歡唱的不管是一人還是多人,或者同一個 帳號是由某些人所共用,所有的點唱記錄都被保存下來,用該

(57)

記錄計算相似度尋找出的同好名單將隨著興趣的擴散移轉而產 生不同的推薦結果。

3. 對於以往傳統協同過濾的缺點,我們的研究一一克服,說明如 下表11︰

表11. 協同過濾方法所遇到的問題與解決方式

常見問題 問題說明 解決方式

(1) 取得使用 者資料困難

使用者只希望享受推薦 的好處,而不願意多花 時間去做評比,導致評 比稀疏的問題。

使用者每次點歌,都是一種 隱性評比的回饋。不管使用 者是否接受推薦清單的歌 曲,每次點歌皆可回饋修正 使用者的交易資料定時重 新找出同好名單。

(2) 評比稀疏 (Ratings

Sparsity)問題

當項目多而使用者評比 少時,會造成使用者之 間的相似度很低以致難 以分群。

使用者的評比即為使用者 點唱記錄,只要有點歌,即 有評比。每一次的點唱都視 為一次的隱性評比。

(3) 新 的 使 用 者難以獲得推 薦(Cold-Start)

新的使用者缺乏足夠的 評 比 以 作 為 分 群 的 依 據,必須經過一段時間 累積足夠的評比才能將 使用者分群。

新的使用者可以透過使用 者輪廓(User Profile),依照 年齡、登入次數等資料進行 相似度計算找出同好名單。

(58)

常見問題 問題說明 解決方式 (4) 少 數 族 群

問題

如果使用者有特殊的喜 好,與大部分人不相同 時,會因為族群內的成 員少,能得到的推薦也 因此而相對減少。

推薦清單除了包含協同過 濾 的 推 薦 歌 曲 , 尚 包 括 TOP-N、新進歌曲等。這一 類 的 使 用 者 可 以 推 薦 TOP-N 以及新進歌曲等。

(5) 使 用 者 多 重 興 趣 問 題 (Multiple Interesting)

使用者通常不會只針對 某 一 種 類 的 項 目 有 興 趣,如果只將使用者分 到某一族群,則只能得 到 單 一 種 類 項 目 的 推 薦。

由於歌曲分類會形成類別 極大化與極小化的問題。因 此,在本研究中,使用者依 相似度找出同好名單後的 推薦清單為不分類別的所 有歌曲推薦。使用者點選過 的興趣都將被記錄下來,沒 有多重興趣的問題產生。

(6) 使 用 者 興 趣轉移問題

使用者的喜好可能因時 間而有所改變。

使用者的相似度乃透過每 次的點歌評比,持續修正交 易檔,並重新計算相似度,

重新找出同好名單。只要會 員興趣改變馬上可以從同 好名單中反應出來。

(7) 新 的 項 目 難以被推薦出

新的項目需要有許多使 用者評比過後才能被推

推薦清單除了包含協同過 濾 的 推 薦 歌 曲 , 尚 包 括

(59)

常見問題 問題說明 解決方式

去 薦出去。 TOP-N、新進歌曲等。新的

歌曲透過歸類,可以在新進 歌曲類別推薦。

(8) 系 統 剛 啟 用時無法進行 推 薦 (System Bootstrapping)

因為使用者評比資料不 足,無法進行使用者分 群與推薦的動作。

本研究的資料利用「超級點 歌王」所提供的資料進行研 究,目前已有相當多的資 料。

(60)

第五章 結論

5.1 結論

本研究提出了二種線上點歌推薦的方法。

1. 本研究將協同過濾的方法應用於線上點歌上,使得線上點歌系 統具有個人化的特色並提升使用者點歌的速度。系統定期以離 線方式來更新每個會員的同好名單,使得同好群不會因為使用 者興趣改變而不具代表性。另外,透過每一次推薦清單的評比 回應,相關系統參數可以不斷的學習使系統越來越成熟,並且 能夠適應多變化的使用者群。當使用者在做評比的時候即是對 系統做了回饋,我們的系統取得使用者的回饋資料讓系統重新 計算相似度、重新佈署參數,進而可以重新獲得推薦,讓使用 者的推薦更為準確,不會因為時間的改變以及興趣的轉移而失 去推薦的準確率,進而達到更適性化的推薦。

2. 本研究利用模糊理論將使用者過去的點歌經驗融入知識庫中,

提供了一個線上點歌的推薦平台。我們對於每個會員分別找出 有特殊傾向的規則,並依此用來形成推薦的依據。透過點選歌 曲進行隱性回饋,依點選回饋的歌曲計算分數後,再次形成下 次的推薦清單。因此這個系統是可以適應興趣多變化的使用者 的適性化推薦系統。知識庫經過專家知識的輸入將可以持續不 斷的增加知識庫中的規則,形成更多元化、更豐富而且強而有 力的正確推薦。

(61)

5.2 未來研究方向 對於將來的研究︰

1. 我們將實際與專家學者、相關業者及使用者共同研究,找出一些可 行的法則以充實知識庫的模糊法則而成為真正具個人化特色的智 慧型點歌系統。

2. 基於時間、計算成本的考量,本研究對於歌星點歌推薦,並沒有使 用規則庫的應用來做計算,將來也許可以利用關聯規則等方式或是 加入協同過濾的機制來做計算,也可以出更符合使用者喜愛的歌星 點歌而形成更具有個人化服務平台。

3. 對於目前取得超級點歌王資料的歌曲分類,會形成極大化與極小 化,將來或許可以在這部份上進行深入研究,是否可以透過較細緻 的分類,進而使用 Item-based 的協同過濾方法來進行推薦。

4. 若本研究之研究成果順利被「超級點歌王」上線使用,那麼對於實 際上透過本研究成果所進行推薦的歌曲準確率以及所推薦之歌曲 是否都是會員有興趣的歌曲,將可利用問卷回收方式,做一實證研 究。

(62)

參考文獻

[1] 戴偉勝(2001),以知識庫為基礎的個人化資訊推薦系統之研究,碩士論 文,大葉大學資訊管理系。

[2] 韓雙福(2003),應用協同過濾機制於商機撮合電子報之研究–以食品業電 子市集為例,碩士論文,中原大學 資訊管理學系。

[3] 鍾政憲(2003),以代理人社群為基礎的主動式知識服務推薦系統之研 究,碩士論文,大葉大學資訊管理學系。

[4] 簡士堯(2004),以內容為基礎之網路學習導覽推薦之研究,碩士論文,

銘傳大學 資訊工程學系碩士班。

[5] 劉鎮華(1994),多媒體資料庫在點歌系統及 KTV 系統之應用,碩士論 文,國立中山大學資訊工程研究所。

[6] 劉先烜(2002),協同合作式社會網絡篩選:結合網頁結構探勘與協同合 作式篩選的個人化機制,碩士論文,國立台灣大學 資訊管理研究所,。

[7] 超級點歌王,www.supermbox.com.tw

[8] 陳榮昌、黃麗美(2006),應用協同過濾推薦方法於線上點歌系統,2006 台灣商管與資訊研討會,台北大學,台北。

[9] 陳榮昌、黃麗美(2007),應用協同過濾推薦方法於線上點歌系統, 2007 資訊科技國際研討會,朝陽科技大學,台中。

[10] 郭素蜜(2005),虛擬企業協同商務之知識分享控制機制之研究,碩士論 文,南華大學資訊管理學系。

[11] 郭時雄(2004),應用軟體代理人於一對一行銷之研究,碩士論文,國立 臺北大學企業管理學系。

[12] 陳孜彬(1998),以聲音查詢歌曲資料庫,碩士論文,國立清華大學資訊

(63)

工程學系。

[13] 陳正德(2004),以項目為基礎的協同過濾應用於網路教材瀏覽推薦之研 究,碩士論文,銘傳大學 資訊工程學系。

[14] 許靜芬(200),應用網際探勘於網頁及商品自動化推薦系統之研究, 碩 士論文,國立台灣科技大學 資訊管理系。

[15] 張道宇(2005),線上卡拉 OK 消費者再惠顧意願之研究─以 Kara24H 為 例,碩士論文,國立交通大學管理學院碩士在職專班資訊管理組。

[16] 范雅慧(2003),透過知識擷取與管理達成顧客關係管理之行銷策略應 用,碩士論文,朝陽科技大學資訊管理研究所。

[17] 林婉琪(2005),應用 phase vocoder 實現卡拉 OK 伴唱機音效以虛擬重低 音合成,碩士論文,國立交通大學機械工程系所。

[18] 林朝興,唐瑩荃(2006),以顧客價值分析與權重漸進探勘來進行協力式 音樂推薦, Journal of Information, Technology and Society 2006(1) pp.

1-26。

[19] 林永財(2004), KTV 電腦點歌螢幕操作介面使用性之研究,碩士論文,

大同大學工業設計研究所。

[20] 汪軒楷(2002),策略式資料探勘在個人化推薦上之研究,碩士論文,真 理大學管理科學研究所。

[21] 何佩琪(2006),張澤銘的 iKala,Intelligent times 12/2006,pp. 24-27。

[22] 向殿政男(199),Fuzzy 手法進階,中國生產力中心。

[23] 江培庄(1990),模糊集合論及其應用,中國生產力中心 Fuzzy 小組。

[24] 丁一賢(2002),運用網頁探勘為基礎的個人化技術於網路廣告之探討,

靜宜大學 資訊管理學系碩士論文。

[25] Fayyad , Gregory Piatetsky-Shapiro , Padhraic Smyth(1996) , “The KDD

(64)

Process for Extracting Useful Knowledge from Volumes of Data“,

COMMUNICATIONS OF THE ACM. Vol. 39, No. 11, pp. 27-34.

[26] Liu Jian-guo; Huang Zheng-hong; Wu Wei-ping(2003); “Web Mining for Electronic Business Application Parallel and Distributed Computing, Applications and Technologies”. PDCAT'2003. Proceedings of the Fourth

International Conference on 27-29 Aug. 2003, pp. 872 – 876.

[27] Ji-Hyun Lee and Wei-Kun Shiu(2004), “An adaptive website system to improve efficiency with web mining techniques”, Advanced Engineering

Informatics , Vol. 18, No. 3, July, pp. 129-142 .

[28] Cho, Yoon Ho; Kim, Jae Kyeong(2004), “Application of Web usage mining and product taxonomy to collaborative recommendations in e-commerce”,

Expert Systems with Applications , Vol.26, No. 2, February, pp. 233-246 .

[29] Kim, Jae Kyeong; Cho, Yoon Ho; Kim, Woo Ju; Kim, Je Ran; Suh, Ji

Hae(2002),”A personalized recommendation procedure for Internet shopping support” ,Electronic Commerce Research and Applications , Vol. 1, No. 3-4, Autumn - Winter, pp. 301-313 .

[30] Chen, S. M., M. S. Yeh and P. Y. Hsiao(1995), “A comparison of similarity measures of fuzzy values,” Fuzzy Sets and Systems, Vol.72, No.1, pp.79-89.

參考文獻

相關文件

Department of Computer Science and Information

Keyword: on-line testing, enhanced learning path, concept mapping, learning diagnosis, concept effect information, concept independence indexing, concept error

健行學校財團法人健行科技大學 清雲科技大學 台灣首府學校財團法人台灣首府大學 致遠管理學院 大華學校財團法人大華科技大學 大華技術學院 醒吾學校財團法人醒吾科技大學

隨著科技的進步,展覽場的導覽系統已從過去導遊、磁帶機或 CD 播放 器講解的時代轉換成行動導覽的時代。目前行動導覽方式大都以 RFID 或 QR

專業選修 至少應選修28學分(含模組選修10學分) 模組類別 社會照顧服務、兒少與家庭社會工作 自由學分

¾真實案例 2:美國政府商業部:透過 知識管理,運用資訊科技來開發專家 知識管理 運用資訊科技來開發專家

朝陽科技大學 資訊與通訊系. 107

Keywords: Mobile ad-hoc network, Cluster manager electing, Fuzzy inference rule, Workload sharing, Backup manager... 致謝 致謝