• 沒有找到結果。

應用協同過濾推薦方法於線上點歌系統

N/A
N/A
Protected

Academic year: 2022

Share "應用協同過濾推薦方法於線上點歌系統"

Copied!
10
0
0

加載中.... (立即查看全文)

全文

(1)

應用協同過濾推薦方法於線上點歌系統

陳榮昌

朝陽科技大學資訊管理系 rcchen@cyut.edu.tw

黃麗美

朝陽科技大學資訊管理研究所 s9354617@cyut.edu.tw

摘要

隨著電子商務的迅速發展,使用者可以透過網際網路在家點歌(Requesting song)歡唱,然而目前的線上點歌系統大多只提供新進歌曲和熱門點唱排行榜等 來輔助使用者進行點歌,使用者在這麼多的資訊中,必須主動挖掘想要的資訊,

透過歌曲編號或關鍵字搜尋等進行資訊的篩選。為了做更有效率的選取,本研究 結合個人化資訊的擷取(Information retrieval)以及協同過濾(Collaborative filtering)的方法,提供使用者個人化的推薦清單,使線上點歌更容易。

我們將使用者過去的點選紀錄彙整於使用者交易資訊檔中,並依據各使用者 過去的點選紀錄以及使用者輪廓(User profile)中的興趣差異來找出每一個使 用者的同好,然後以這些同好的點歌記錄使用協同過濾的方法來做線上點歌的推 薦。在本研究中,我們也克服了傳統協同過濾推薦方法中可能遇到的稀疏性

(Sparsity)、延展性(Scalability)和冷啟始(Cold Start)等缺點,因此能 使推薦內容更為精確。另外,透過使用者是否點選系統所推薦的歌曲,可以對系 統做一隱性的回饋來修正系統的參數,經過一段時間的學習,此系統將能更有效 率的做推薦以減少使用者尋找歌曲的時間。

關鍵字:線上點歌, 資訊的擷取, 協同過濾, 使用者輪廓

(2)

壹、簡介

隨著資訊科技的進步,數位化的科技早已融入我們的日常生活。數位家電愈 來愈普及,數位電視(IP-TV)將網路與影音(A/V)結合,透過視頻點播的方式來進 行線上點歌使得在家唱卡拉 OK 的夢想更容易實現。在這過程中,線上點歌系統 的發展扮演著重要的角色。例如劉鎮華(1994)以及林永財(2004)探討 KTV 電腦點 歌螢幕操作介面使用性以及實作出 KTV 點歌系統,以影、音、詞三者分離的方 式來減少所需的磁碟容量,並解決不同媒體播放的同步問題,這些都是重大的突 破。目前已經有線上點唱系統,例如超級點歌王、iKala…等,他們可以透過網 路來做線上點歌及歡唱,為喜歡歌唱的網路使用者帶來相當多的便利。

然而,在大量的歌曲中,使用者要找到自己喜歡的歌曲還要花上許多的工 夫,使用者必須利用關鍵字、歌曲編號等做條件搜尋。雖然目前的線上點歌系統 也提供了「排行榜點歌」、「歌星點歌」、「新進歌曲點歌」等推薦歌曲來加快使用 者的找尋時間,但這些功能卻沒有考慮到使用者的興趣差異,無法有效的提供使 用者個人化的推薦。

因此,本研究試著使用協同過濾的方法來做線上點歌的推薦,我們根據使用 者的基本資料及過去的點歌紀錄找出該使用者的同好並記錄下來,當使用者要進 行點歌時,就可以依據這些同好最近的點歌紀錄來共同形成推薦。最後,使用者 在每次選歌之後,系統會依其是否接受推薦來形成隱性評比,作為系統修正的參 考。這種推薦方式,將使推薦結果更接近使用者所需,因而減少使用者主動搜尋 歌曲的時間。

貳、研究方法 一、推薦流程

當人們在一個沒有足夠經驗或知識的情況下,卻必須做出一些決定時,人們 必須依靠他人的經驗或知識所做的推薦。推薦系統的概念也就是因此而產生。目 前的推薦系統大多使用在線上購物的推薦(Kim, Jae Kyeong,2002、Cho, Yoon Ho,2004、許靜芬,2001)或其他電子商務的應用,例如電子市集商機撮合電子報之 研究、網路教材的推薦、網路學習導覽推薦之研究等(韓雙福,2003、陳正德,2004、

簡士堯,2004)。在本研究中,我們將推薦的方法應用到線上點歌系統,讓線上點 歌能達到具有個人化特色的目的。

(3)

一般來講,推薦系統的推薦流程可分為三個步驟:1.蒐集使用者的資料;2.

根據使用者的資料進行分析來產生推薦;3.針對使用者對推薦項目的喜好與否來 做適當的修正。根據這些步驟,我們利用使用者的基本資料及過去的點唱記錄來 找出同好名單並記錄在使用者資訊檔案中,當使用者上線後即可利用其同好們最 近的點唱紀錄來共同進行歌曲的推薦。

圖一 推薦運作流程圖

主要的推薦流程如圖一所示。其中,為了增加執行的效能,我們採用離線的 方式來更新每個使用者的同好名單,每隔一段時間(假設時間周期 C=1 天),我們 會計算每個會員彼此的點歌或基本資料的相似度,並將最相似的同好名單儲存於 使用者資訊檔中。此部份將詳述於下一小節。我們將每次的點歌皆視為一次評 比,評比資料再回饋到點歌記錄檔,每當我們重新計算相似度的時候,所讀取的 點歌記錄檔將愈來愈精確。

二、同好名單的產生

同好名單主要是依據會員彼此的相似度來決定。因為會員的個數相當的多,

這些會員之中有許多是不具代表性或已經失去時效性的會員,所以在找同好名單 前,我們必須先將會員資料做前置處理,包括資料淨化、資料整合、資料轉換以

(4)

及資料縮減,最後得到較精簡且具代表性的會員名單,這些通常是最近常有點唱 紀錄的會員。因此,每個會員就可以與這些代表性會員作相似度比較,並從中找 出相似度較高的代表性會員來加入其同好名單。對於已經有點歌記錄的會員,我 們利用點唱過的交易記錄來作為計算相似度的依據;對於尚無點歌記錄的會員,

我們只好利用使用者輪廓(例如有登入次數、年收入、出生年份等等)來作為計算 相似度的依據。

詳述如下: 首先我們利用交易時間先進行排序,找出最近 m 個有點唱記錄的 會員(以下稱為代表性會員)。以我們於「超級點歌王」所取得的資料為例,尚未 處理過的原始會員有 16 萬名,我們進行資料預處理後可以減少到 m 個代表性會 員(假設 m=10000)。

假設所有會員的集合M={ M1 , M2, …, Mn },我們就可以為每一個會員Mi, i=1,2,…,n,透過相似度計算找出相似度較高的同好們。這些被選出的同好必須同 時滿足下面兩個條件:

1. 與會員Mi的相似度大於門檻值

θ

的同好。

2. 該會員須為與會員Mi相似度較高的r人。

如此找出來的同好才能較具代表性,其中

θ

與 r 為系統訓練的參數。

表一 代表性會員的點歌次數表

會員\歌曲 歌曲 1 歌曲 2 歌曲 3 歌曲 4 歌曲 5

1 會員M1 2 3 5 0 24

2 會員M2 11 0 3 3 5

3 會員M3 3 0 12 1 0

4 會員M4 14 0 0 33 15

5 會員M5 0 6 0 2 0

接下來,我們以表一為例(假設代表性會員數 m=5)來說明有點歌紀錄的會員 與代表性會員間相似度的計算方法。首先,為了簡單起見,我們只考慮會員的點 歌與否,暫時不考慮點歌的頻率。因此,我們只需用代表性會員的點歌表(即表 二所示)。

(5)

表二 代表性會員的點歌表

會員\歌曲 歌曲 1 歌曲 2 歌曲 3 歌曲 4 歌曲 5

1 會員M1 1 1 1 0 1

2 會員M2 1 0 1 1 1

3 會員M3 1 0 1 1 0

4 會員M4 1 0 0 1 1

5 會員M5 0 1 0 1 0

假設Si為會員Mi所有點過歌曲的集合,那麼我們就可以定義會員Mi與會員Mj 的相似度為Φij=

j i

j i

S S

S S

∩ 。以表二為例,

„ 會員M1與會員M2的相似度Φ12=

2 1

2 1

S S

S S

∩ =

5 3

=0.6

„ 會員M1與會員M3的相似度Φ13=

3 1

3 1

S S

S S

∩ =

5 3

=0.6

„ 會員M1與會員M4的相似度Φ14=

4 1

4 1

S S

S S

∩ =

5 2

=0.4

„ 會員M1與會員M5的相似度Φ15=

5 1

5 1

S S

S S

∩ =

5 1

=0.2

假設門檻值

θ

為 0.5。會員M1的同好名單為M2及M3

另外,對於尚無點歌記錄的會員,我們使用者輪廓來作為計算相似度的依 據,其計算方式與有點歌紀錄的會員類似,只是把表二的歌曲改成用每一個不同 的使用者輪廓細項(例如有登入次數、年收入、出生年份等等)來取代,若某一細 項類似則給 1 否則給 0。如此即能算出相似度並求出其同好名單。

(6)

三、形成推薦

我們的推薦清單是由同好票選出來的。我們以表三來說明,假設某會員的同 好有M1、M2及M3在表三中當某一首歌最近有被Mi點唱過,則相對應會員Mi的值 就會被設定為 1,否則設定為 0。因此,我們只要將每一首歌所得到的票數統計 於最後一列中,就可以依據這些票數的多寡來決定那些歌曲該被推薦了! 在此例 中,當會員Mi登入系統,系統從會員紀錄檔中得知其同好有M1、M2及M3,於是 由表三就可以得知歌曲 1 以及歌曲 3 的票數較高,因此,歌曲 1 以及歌曲 3 就會 被列入推薦清單。

表三 由同好票選出來的推薦清單

會員\歌曲 歌曲 1 歌曲 2 歌曲 3 歌曲 4 歌曲 5

1 會員M1 1 1 1 0 1

2 會員M2 1 0 1 1 1

3 會員M3 1 0 1 1 0

合計

3

1

3

2 2

線上點歌的推薦不同於一般購物的推薦,使用者在不同的時間點對於購物的 需求因人而異,然而,對於線上點歌,使用者有可能每次上來唱的都是相同的歌 曲。所以,被點唱的次數也相當重要,本研究目前只針對歌曲是否有被唱過來列 入考量,未來我們也將考慮歌曲被演唱過的頻率,使得每個會員對某一歌曲的興 趣取向更為明顯。

四、隱性評比

推薦系統取得使用者的評比資料的方法可分為顯性評比(Explicit Rating)與 隱性評比(Implicit Rating)[Nichols(1997)]。顯性評比即要求使用者針對特定項目 做評分的動作,隱性評比則是系統藉由紀錄與分析使用者過去的行為,間接的統 計出使用者對特定項目的喜好程度。

我們使用的評比方式為隱性評比;會員透過推薦歌曲列表點歌或透過搜尋的 方式進行點歌,每一次的點歌記錄都是我們系統的評比,不需要另外再對會員要 求評分,增加使用者的困擾。透過會員每次的點歌記錄,對系統來講即是做了評 比,可以得到精確的評比分數。系統接收到使用者的點歌,即可以依設定的時間 重新進行相似度的計算,重新尋找興趣相似的同好名單,並且可以重新推薦歌

(7)

曲,可以說一舉數得。

参、研究結果與討論

研究結果發現,我們的推薦方式沒有語言的問題,不管是中文歌曲、方言歌 曲還是外文歌曲,皆可透過我們的研究方式進行推薦點歌。另外,透過同一個帳 號進行歡唱的不管是一人還是多人,或者同一個帳號是由某些人所共用,所有的 點唱記錄都被保存下來,用該記錄計算相似度尋找出的同好名單將隨著興趣的擴 散移轉而產生不同的推薦結果。對於以往傳統協同過濾的缺點,我們的研究一一 克服,說明如下︰

表四 協同過濾方法所遇到的問題與解決方式

常見問題 問題說明 解決方式

(1) 取得使用者 資料困難

使用者只希望享受推薦的好 處,而不願意多花時間去做評 比,導致評比稀疏的問題。

使用者每次點歌,都是一種隱性評 比的回饋。不管使用者是否接受推 薦清單的歌曲,每次點歌皆可回饋 修正使用者的交易資料定時重新 找出同好名單。

(2) 評比稀疏 (Ratings Sparsity) 問題

當項目多而使用者評比少時,

會造成使用者之間的相似度很 低以致難以分群。

使用者的評比即為使用者點唱記 錄,只要有點歌,即有評比。每一 次的點唱都視為一次的隱性評比。

(3)新的使用者難 以獲得推薦 (Cold-Start)

而新的使用者缺乏足夠的評比 以作為分群的依據,必須經過 一段時間累積足夠的評比才能 將使用者分群。

新的使用者可以透過使用者輪廓 (User Profile),依照年齡、登入次 數等資料進行相似度計算找出同 好名單。

(4)少數族群問題 如果使用者有特殊的喜好,與 大部分人不相同時,會因為族 群內的成員少,能得到的推薦 也因此而相對減少。

推薦清單除了包含協同過濾的推 薦歌曲,尚包括 TOP-N、新進歌曲 等。這一類的使用者可以推薦 TOP-N 以及新進歌曲等。

(5)使用者多重興 趣問題(Multiple

使用者通常不會只針對某一種 類的項目有興趣,如果只將使

由於歌曲分類會形成類別極大化 與極小化的問題。因此,在本研究

(8)

常見問題 問題說明 解決方式 Interesting) 用者分到某一族群,則只能得

到單一種類項目的推薦。

中,使用者依相似度找出同好名單 後的推薦清單為不分類別的所有 歌曲推薦。沒有多重興趣的問題產 生。

(6)使用者興趣轉 移問題

使用者的喜好可能因時間而有 所改變。

使用者的相似度乃透過每次的點 歌評比,持續修正交易檔,並重新 計算相似度,重新找出同好名單。

只要會員興趣改變馬上可以從同 好名單中反應出來。

(7)新的項目難以 被推薦出去

新的項目需要有許多使用者評 比過後才能被推薦出去。

推薦清單除了包含協同過濾的推 薦歌曲,尚包括 TOP-N、新進歌曲 等。新的歌曲透過歸類,可以在新 進歌曲類別推薦。

(8)系統剛啟用時 無法進行推薦 (System Bootstrapping)

因為使用者評比資料不足,無 法進行使用者分群與推薦的動 作。

本研究的資料利用”超級點歌王”

所提供的資料進行研究,目前已有 相當多的資料。

肆、結論

本研究將協同過濾的方法應用於線上點歌上,使得線上點歌系統具有個人 化的特色並提升使用者點歌的速度。系統定期以離線方式來更新每個會員的同好 名單,使得同好群不會因為使用者興趣改變而不具代表性。另外,透過每一次推 薦清單的評比回應,相關系統參數可以不斷的學習使系統越來越成熟,並且能夠 適應多變化的使用者群。

未來的研究中,我們將把點歌的頻率也納入相似度的計算當中,以提高推薦 的準確度。另外,為了適應多樣性的使用者群,例如興趣傾向穩定的使用者適合

(9)

用協同推薦、較沒有主見的使用者可能適合 TOP-N 熱門點歌的推薦、對新歌曲 接受度高的使用者可能較需要新進歌曲的點歌推薦。我們將研究如何用專家系統 來整合各種推薦的方法以適應各種不同特性的使用者來達到最佳化的目的。

伍、參考文獻

Liu Jian-guo; Huang Zheng-hong; Wu Wei-ping; Web Mining for Electronic Business Application Parallel and Distributed Computing, Applications and

Technologies, 2003. PDCAT'2003. Proceedings of the Fourth International Conference on 27-29 Aug. 2003 Page(s):872 – 876.

Ji-Hyun Lee and Wei-Kun Shiu, An adaptive website system to improve efficiency with web mining techniques, Advanced Engineering Informatics , Volume 18, Issue 3, July 2004, Pages 129-142 .

Cho, Yoon Ho; Kim, Jae Kyeong, Application of Web usage mining and product taxonomy to collaborative recommendations in e-commerce , Expert Systems with Applications , Volume: 26, Issue: 2, February, 2004, pp. 233-246 . Kim, Jae Kyeong; Cho, Yoon Ho; Kim, Woo Ju; Kim, Je Ran; Suh, Ji Hae,A

personalized recommendation procedure for Internet shopping

support ,Electronic Commerce Research and Applications , Volume: 1, Issue:

3-4, Autumn - Winter, 2002, pp. 301-313 .

丁一賢,運用網頁探勘為基礎的個人化技術於網路廣告之探討,靜宜大學 資訊 管理學系碩士班,2002 年 6 月。

林永財,KTV 電腦點歌螢幕操作介面使用性之研究,大同大學 工業設計研究 所,2004 年 7 月。

劉鎮華,多媒體資料庫在點歌系統及 KTV 系統之應用,國立中山大學 資訊工程 研究所,1994 年。

許靜芬,應用網際探勘於網頁及商品自動化推薦系統之研究,國立台灣科技大學 資訊管理系,2001 年。

劉先烜,協同合作式社會網絡篩選:結合網頁結構探勘與協同合作式篩選的個人 化機制,國立台灣大學 資訊管理研究,2002 年。

韓雙福,應用協同過濾機制於商機撮合電子報之研究–以食品業電子市集為例,

(10)

中原大學 資訊管理學系,2003 年。

陳正德,以項目為基礎的協同過濾應用於網路教材瀏覽推薦之研究,銘傳大學 資 訊工程學系,2004 年。

簡士堯,以內容為基礎之網路學習導覽推薦之研究,銘傳大學 資訊工程學系碩 士班,2004 年。

超級點歌王,www.supermbox.com.tw

參考文獻

相關文件

Recommender systems form a specific type of in- formation filtering (IF) technique that attempts to present information items (movies, music, books, news, web pages) that are likely

The format string is like a constraint except that there could be place-holder strings like “%s” and “%d” for strings and integers respectively.. The format string F is like

In this class, we will learn Matlab and some algorithms which are the core of programming world. Zheng-Liang Lu 26

Conditional Analytic Feynman Integral over Product Space of Wiener Paths in Abstract Wiener Space. BY DONG HYUN

Chang, Sym- metric Mendelsohn triple systems and large sets of disjoint Mendelsohn triple systems, in Combinatorial de- signs and applications (Lecture Notes in Pure and

(b) reviewing the positioning of VPET in the higher education system in Hong Kong, exploring the merits of developing professional vocational qualifications at the degree

七、請各校踴躍推薦學生擔任評選委員(不限 1 名) ,推薦表及資格規定詳 如附件 3。請於線上填寫推薦表,並上傳核章後之掃描檔,於 110 年 1 月 29

06, 2003, 論文題目:線上網路教學之課程推薦機制研究,朝 陽科技大學資訊管理系碩士論文。Yung-Hsiang Chiu, 2003, “The study of Applying Neural Network and Data Mining Techniques to