• 沒有找到結果。

以模糊語意法協助音樂CD資訊推薦系統之設計

N/A
N/A
Protected

Academic year: 2021

Share "以模糊語意法協助音樂CD資訊推薦系統之設計"

Copied!
96
0
0

加載中.... (立即查看全文)

全文

(1)國立屏東商業技術學院 資訊管理系(所) 碩士論文 以模糊語意法協助音樂 CD 資訊推薦系統之設計 Design of Music CD Information Recommendation System Using the Fuzzy Linguistic Analysis. 指導教授:李來錫 博士 研 究 生:蔡子敬. 中 華 民 國 一 ○ ○ 年 六 月.

(2)  . 摘要 數位科技日新月異,帶動了音樂市場的蓬勃發展,音樂 CD 產品種類 琳瑯滿目,如何快速且有效推薦消費者感興趣的音樂 CD 產品是音樂推 薦系統(Music recommendation system)主要研究之課題。本研究以模糊 語意法進行音樂 CD 產品資訊推薦,其主要的做法是以買賣雙方對音樂 種類的認知進行模糊語意比對,以推薦適合買方偏好的音樂產品。研究 程序包括由賣方評鑑的音樂產品模糊語意知識庫的建立,再收集買方每 次的音樂採購偏好,接著推薦機制將買方所填答的產品偏好與音樂產品 知識庫進行模糊配對,進而將高配對係數的產品推薦給使用者。本研究 以一著名的網路音樂 CD 販售網站為例,先依照所收集的音樂 CD 進行屬 性建置成模糊語意知識庫,再開發出其音樂推薦系統的雛型,並進行系 統測試。研究結果顯示,使用模糊語意法進行產品推薦之動作,可提供 使用者在音樂產品推薦選擇上一個良好的方式。. 關鍵字:推薦系統、音樂推薦系統、模糊語意法。. I.

(3)  . Abstract Numbers of music CDs cause problems of selection. Therefore, it becomes a critical issue for developing an information recommendation system to recommend proper music CDs quickly and effectively. This study develops a procedure of information recommendation for music CDs using the fuzzy linguistic method. First, a knowledgebase of fuzzy linguistic data of music CDs is build by sellers. Buyers can fill a fuzzy linguistic questionnaire each time when they want select music CDs. Then the fuzzy preference will be calculated with the existed fuzzy data in the knowledgebase. This study collects music CD records from a famous a website of CD selling as an example. The collected CDs are first classified by the music attributes to build the knowledgebase. Then a prototype of the recommendation system is designed and tested. Results show that data with highly matched sample will be recommended on the prototype system.. Keywords: Recommendation system, music recommendation system, fuzzy linguistic method. II.

(4)  . 誌謝 光陰荏苒,時間的指針總是不停的在往前,而當自己發現終於可以 放慢腳步時,才知道這所謂研究所的生涯也即將在論文的付梓中劃上了 休止符。回首這兩年一路辛苦走過來的心路歷程,徹底的了解作為研究 生的酸甜苦辣,才知道原來這才是真正的磨練。從未想過這樣的自己也 能將這碩士讀完,一路走來的點點滴滴,需要感謝的人真的很多,心中 感激之情溢於言表。在此,願藉本論文一隅,來表達心中無限的感激。 首先,衷心感謝恩師 李來錫 老師 在論文研究及為人處事上的殷切 教悔,使學生受益匪淺。在研究的過程中,每當遭遇挫折及問題時,總 是費盡心思一點一滴的細心指導,從不吝給予學生許多寶貴的意見與指 點正確方向,對論文的品質與治學嚴謹的態度,使學生在學業及研究上 獲益良多,讓學生了解到真正的知識不在於多寡,而在於自己如何去學 習,並且解決問題;在為人處事上,更培養學生實事求是的做事態度, 使學生能按部就班地解決問題。而老師也時常關心學生的日常生活,並 且給予相當充裕的思考空間,讓學生能規劃安排時間,感激之情,筆墨 難以形容,僅此致上最誠摯的感激與謝忱。另在論文口試期間,承蒙 林 哲宏 教授以及 葉惠忠 教授百忙中對學生論文內容提供諸多寶貴的意 見及精闢的見解,仔細的點出論文中疏漏及不足之處,使本論文得以更 嚴謹及完善,在此致上學生萬分的感謝。 III.

(5)  . 此外,要感謝資管所的學長姐們及所有資研二班上的同窗好友在課 業及生活上的互相照顧與砥礪,讓這沒日沒夜的辛苦生活中增添了許多 歡笑與幸福甘甜,也陪我度過許多的低潮與困境,謝謝你們。還有感謝 學弟妹們在論文口試時的協助與幫忙,有了你們才能讓這口試順利成 功,謝謝你們。也感謝超厲害的阿如學姐、超猛的大牛學長、親愛的小 包、行銷所的學長姐們及大學的好麻吉們,因為有你們的陪伴才能有今 天的我,謝謝你們。 最後,要感謝我最親愛的媽媽與家人朋友們對我的支持、關懷與體 諒,讓我能無後顧之憂地完成學業。 因此,僅以本論文獻給我最愛的家人、朋友、老師、同學,願與他 們一起分享這份喜悅與榮耀。. 我想,這不是結束,而是另一個新的開始,我要永遠的堅持與努力。. 蔡子敬 謹誌 于 國立屏東商業技術學院資訊管理研究所 中華民國 一○○ 年 六 月. IV.

(6)  . 目錄 中文摘要 ..................................................................................................................... I 英文摘要 ....................................................................................................................II 誌謝 ............................................................................................................................ III 目錄 ............................................................................................................................. V 表索引 ...................................................................................................................... VII 圖索引 .................................................................................................................... VIII 第壹章 緒論 ............................................................................................................. 1 第一節 研究背景與動機 ............................................................................ 1 第二節 研究目的 .......................................................................................... 4 第三節 研究流程 .......................................................................................... 4 第貳章 文獻探討 .................................................................................................... 7 第一節 推薦系統 .......................................................................................... 7 第二節 音樂推薦系統 ..............................................................................23 第三節 模糊語意法 ...................................................................................34 第參章 研究方法 ..................................................................................................45 第一節 研究架構 ........................................................................................45 第二節 語意資訊收集 ..............................................................................46 (一) 模糊語意問卷設計 ..............................................................46 V.

(7)  . (二) 語意問卷資料收集 ..............................................................49 第三節 資訊推薦運算 ..............................................................................50 (一) 感受差距測量 .......................................................................50 (二) 離異度計算 ............................................................................52 第四節 產品資訊推薦 ..............................................................................53 第五節 範例分析 ........................................................................................54 第肆章 音樂推薦系統設計 ...............................................................................60 第一節 系統目的 ........................................................................................60 第二節 系統架構 ........................................................................................61 第三節 系統流程 ........................................................................................62 第四節 系統畫面展示 ..............................................................................64 第五節 系統實驗分析 ..............................................................................67 第伍章 結論 ...........................................................................................................74 第一節 研究結論 ........................................................................................74 第二節 未來研究方向 ..............................................................................76 參考文獻 ..................................................................................................................78. VI.

(8)  . 表索引 表 2-1. 推薦系統相關研究之比較 .................................................................21 表 2-2. 音樂推薦系統相關研究之比較 ........................................................27 表 2-3. 模糊語意區間量表 ...............................................................................38 表 3-1. 音樂 CD 特色屬性表 ...........................................................................47 表 3-2. 語意區間量表 ........................................................................................48 表 3-3. 離異度計算範例 ....................................................................................53 表 3-4. 使用者語意區間模糊數紀錄表範例 ..............................................55 表 3-5. 使用者(U1)及產品(P1)感受差距值計算範例表 ..............56 表 3-6. 使用者(U1)及產品(P1)離異度計算範例表 .......................57 表 3-7. 目標使用者(U1)及產品(Pn)離異度計算範例表 ..............58 表 3-8. 推薦個數範例表 ....................................................................................59 表 4-1. 音樂產品屬性偏好資訊 ......................................................................70 表 4-2. 使用者與系統推薦之音樂產品屬性資訊 .....................................73. VII.

(9)  . 圖索引 圖 1-1. 研究流程圖 ............................................................................................... 5 圖 2-1. amazon.com ..............................................................................................10 圖 2-2. ebay.com .................................................................................................... 11 圖 2-3. Pandora internet radio ............................................................................30 圖 2-4. iLike.com ..................................................................................................31 圖 2-5. Last.fm .......................................................................................................32 圖 2-6. CDNOW.com ...........................................................................................32 圖 2-7. KKBOX.com ............................................................................................33 圖 2-8. 三角形模糊數之隸屬函數 .................................................................36 圖 3-1. 研究架構圖 .............................................................................................45 圖 3-2. 音樂 CD 產品資訊範例 ......................................................................49 圖 4-1. 系統架構圖 .............................................................................................61 圖 4-2. 系統流程圖 .............................................................................................63 圖 4-3. 音樂 CD 推薦系統 - 說明面 ...........................................................64 圖 4-4. 音樂 CD 推薦系統 - 主頁面 ...........................................................65 圖 4-5. 音樂 CD 資訊推薦 - 結果頁 ...........................................................66 圖 4-6. 推薦系統實例操作演示 ......................................................................68 圖 4-7. 設定資訊推薦個數 ...............................................................................68 VIII.

(10)  . 圖 4-8. 資訊推薦結果 ........................................................................................69. IX.

(11)  . 第壹章. 緒論. 第一節 研究背景與動機 近年來音樂產品蓬勃發展,產品可供選擇的種類琳瑯滿目,而在選擇 大量增加之下,常導致消費者在找尋音樂及挑選所想要的音樂產品時, 需耗費相當多時間與精神在收集所要的資訊並處理掉雜訊,也相對不容 易做出購買決定,究其主要的原因就是來自於過多的資訊供給量,這也 就是所謂資訊超載(Information overload)現象。而此資訊超載現象使得 人們隨時隨地都處於一個資訊過多的環境,為解決資訊超載問題,許多 研究開始以資訊推薦技術進行資料的篩選與過濾,相關研究實證中也表 示資訊推薦系統可有效減少使用者個人在尋找喜好產品上所耗費的時 間,更可推薦出使用者有興趣的產品(Schafer, Konstan & Riedl, 1999; Berkovsky, Kuflik & Ricci, 2005) 。基於上述內容,本研究主要在尋找適當 的資訊推薦方法與程序,以解決音樂 CD 產品在挑選上所產生的資訊超 載問題。 資訊推薦系統研究大致可分為三種推薦方式機制,分別為內容導向式 推薦系統(Content-based recommendation system)、協同合作式推薦系統 (Collaborative recommendation system)及混合式推薦系統(Hybrid-based recommendation system)。內容導向式推薦系統其主要概念源自於資訊檢 索(Information retrieval)所延伸出來的技術,其方法是系統先收集使用. -1-.

(12)  . 者在過去使用資訊,如偏好、習慣等,在獲得使用者喜好後,進而推薦 使用者相似度高的資訊(Basu, Haym & Cohen, 1998) 。協同合作式推薦系 統則是利用相似組群(Group)的概念,透過一群具有相同興趣偏好的使 用者,計算分析出各使用者之間的相似度,藉此找出一群與自己偏好最 相似的最近鄰居(Nearest neighbors) ,再根據最近鄰居內的共同特性,推 薦高程度相近的項目資訊給使用者(Resnick et al., 1994) 。混合式推薦系 統依字面上解釋,也就是採用兩種或數種推薦機制。混合式推薦系統亦 可針對不同的問題,結合多種推薦系統及演算法來補足單一推薦系統無 法解決的問題。研究實證顯示,混合式推薦系統可保有內容導向式與協 同合作式推薦系統個別之優點,在推薦品質上也比單一推薦系統有較佳 的表現。 而資訊推薦系統若能提供給使用者準確率高且符合使用者所想要的 推薦結果,將可有效的解決資訊量龐大所產生的資訊超載問題,並可協 助使用者快速的獲得資訊及做出決定。推薦系統所推薦出的結果是否符 合與準確率是否良好將是由使用者本身來評比及判斷,為此,一個好的 推薦系統最主要的關鍵因素仍然是使用者的偏好。 目前音樂推薦系統(Music recommendation system)大都以擷取音樂 特徵值或屬性做為匹配、過濾、分類之依據。此方式在目前繁多音樂推 薦機制中佔有良好的推薦效果,但卻少有相關研究提及使用者偏好與音. -2-.

(13)  . 樂特徵屬性之間的關聯。而對於使用者來說,音樂可能不單只是一項商 品,也是另一種自我生活型態的表現與詮釋,所以音樂是相對主觀的, 但對於一般使用者而言,每項音樂特徵屬性的偏好及感受都不盡相同, 因此若能更貼近使用者,加入使用者偏好,將可改進現行音樂推薦的單 方向問題。故此,本研究進一步考慮以模糊語意法,先獲取消費者的購 買偏好,再進行音樂特性的比對,以增進音樂資訊推薦的品質。 模糊語意法(Fuzzy linguistic)為模糊理論相關研究之一,相關研究 指出,人類的思維想法、認知邏輯與行為皆存在著模糊不確定之特質, 如以傳統的二分法來進行決策思考及設計分析,較無法反映出事實的真 相。而模糊語意法在資料的收集上是以模糊語意問卷(Fuzzy linguistic scale)來進行,其主要是能真實完整地保留填答者對於語意措詞的感受, 以呈現內心真實想法與意見,而其優點為語意區間的模糊資料可用語意 性措詞來表示,可降低在填答模糊問卷時的困難度(李來錫、蔡耀德, 2006)。 然而,如上研究內容所述,人的內心皆存在著模糊不確定之特質,使 用者的偏好常會受到許多因素影響,如當下的環境背景、本身的喜好、 心情的變化等等,但是在目前許多推薦系統的研究當中,所著重的通常 只是使用者直接表達的資訊,如使用者操作檔案中的歷史紀錄等,常常 缺少及忽略掉不易收集和使用者沒有直接表達的部分。因此,本研究將. -3-.

(14)  . 對於使用者偏好做更加深入的研究及了解,嘗試以模糊語意法(Fuzzy linguistic analysis)去分析與考量使用者內心真實的感受,並且運用在音 樂 CD 資訊推薦上,期望藉由此方法提供給使用者一種更直接貼近內心 感受的個人化方式,來推薦出喜愛的音樂 CD 產品,並相對減少在資訊 搜尋上所耗費的時間。. 第二節 研究目的 綜合上述背景與動機,本研究導入了模糊語意法(Fuzzy linguistic analysis)藉此發展資訊推薦系統,並選擇音樂 CD 產品作為主要應用領 域,嘗試與探討是否可有效推薦出適合的產品、符合使用者對於音樂產 品的主觀性。其主要目的為以下幾點: (一) 提出以模糊語意法作為主要分析的資訊推薦機制,以推薦出更貼 近使用者內心實際感受的合適產品。 (二) 建構並設計出音樂 CD 產品資訊推薦機制之模式與系統。. 第三節 研究流程 以下將本研究之主要研究內容,根據章節順序分別敘述擬訂以下主要 之研究流程(如圖 1-1 所示) 。 首要步驟則經由研究背景與動機確定本研究之主題與目的,接續第二 步驟將依據研究動機與目的來彙整歸納相關文獻及相關研究技術,並進. -4-.

(15)  . 行討論,第三步驟則建構出一套資訊推薦機制,第四步驟為實作設計出 本研究所發展之資訊推薦系統,並進行研究實例分析探討,在最後步驟 則進行整個研究的結果討論與未來研究方向。. 確定研究主題. 第壹章. 文獻探討. 第貳章 推薦系統. 音樂推薦系統. 模糊語意法. 研究方法 語意資訊收集. 資訊推薦運算. 第參章. 產品資訊推薦. 系統實作. 第肆章. 結論與未來研究方向. 第伍章. 圖 1-1. 研究流程圖. -5-.

(16)  . 本研究論文共分為五個章節,各章節主要內容說明如下: (一) 第壹章 緒論 依序說明研究背景及研究動機之產生、主要研究目的、整個研究的 流程,以界定出適當的研究方向與主題。 (二) 第貳章 文獻探討 廣泛地閱讀相關學者之研究,針對研究中所提出的問題和可能解決 之方式進行統整歸納,並深入了解所探討文獻之定義與實質意涵,進行 相關主題討論,本研究之文獻探討則包含推薦系統、音樂推薦系統、模 糊語意法。 (三) 第參章 研究方法 詳細說明本研究所提出以模糊語意法作為主要分析的資訊推薦機制 之構想,其包括內部資料程序、演算機制與相關主要功能之介紹,並引 用個案來進行範例分析。 (四) 第肆章 音樂推薦系統設計 將針對本研究所提出之資訊推薦演算機制,建構出一套系統,並詳 細說明相關建置環境與系統流程、系統展示等,最後進行操作演示。 (五) 第伍章 結論 最後依據上述之研究提出研究結論,並同時對後續未來研究之發展 與方式進行建議。. -6-.

(17)  . 第貳章. 文獻探討. 本研究是以模糊語意法發展資訊推薦系統,並選擇音樂 CD 產品作 為應用領域,其主要為協助使用者快速且有效的推薦出合適產品。本章 節則將針對研究進行相關文獻之探討,文獻內容部分整理出三個小節, 第一節為介紹推薦系統之研究發展與相關技術應用;第二節為整理出音 樂推薦系統相關研究技術發展與實務應用;第三節則為說明模糊語意法 及其相關研究。. 第一節 推薦系統 推薦系統(Recommendation system)一般也泛稱為篩選系統(Filtering system),近年來已被廣泛的研究與應用,儼然已成為一門獨立的研究領 域(Resnick & Varian, 1997) 。推薦系統主要之基本意涵,則是依據使用 者偏好、興趣或需求,在資訊量眾多的可能選擇中,推薦給目標使用者 所需要的潛在資訊內容或商品項目,其所採用相關技術則分別透過數學 統計、資料探勘、資訊過濾與擷取等,來進行篩選資訊並提供服務,進 一步針對商品或項目以即時操作互動來給予個人化方式推薦(Sarwar, Konstan & Riedl, 2000;Burke, 2002;Rashid et al., 2002) 。而對於不同應 用層面及領域的推薦系統,其研究之主要定義將有不同的表達方式,但 對於本研究所構想之研究主題而言,一個較適切的定義則採用學者 Van Setten, Pokraev & Koolwaaij(2004)研究中所提出之「推薦系統是一種希 -7-.

(18)  . 望藉由確定使用者個人的興趣偏好,來協助使用者在眾多的相關資訊 中,快速且明確的找出需求資訊之操作系統」 。一般推薦系統主要進行流 程大致可分為三個步驟,第一步驟為蒐集使用者相關資料,並建立資料 檔;第二步驟則依據使用者的資料檔進行分析判斷來產生推薦動作;第 三步驟針對使用者對推薦項目結果評比並回饋給系統做適當的修正與調 整,此流程步驟進行方式為一般常見的推薦系統。 目前推薦系統運用於各個科學領域,在電子商務領域(Electronic commerce)更是一門專門的研究。然而資訊技術日漸成熟,網際網路無 遠弗屆,使得電子商務發展盛行並且充滿挑戰,對於企業商家跟消費者 而言,為了適應改變都必須產生新的經營及消費模式(Kim et al., 2005)。 而在電子商務的研究領域中,學者考慮到目前因科技快速發展,產 品不斷的推陳出新,而產品生命週期也將不停的在縮短,消費者及顧客 的興趣也會隨著時間變化推移而一直在改變,因此在最近幾年來有許多 相關研究漸漸開始將「時間(Time)」因素加入資訊推薦系統的運作中 (Huang & Huang, 2009),但這類新議題之研究,仍須考量的部分還很 多,尚未完全還需加強補足。 現今推薦系統依介面及應用來產生推薦的則有瀏覽搜尋 (Browsing)、排序搜尋之結果(Ordered search results)、類似產品項目 (Similar items) 、流行排行榜(Top-N) 、文字評論(Text comment)和平. -8-.

(19)  . 均評價(Average rating)、電子郵件(E-mail)等,依照推薦系統之需求 建置。 而推薦系統之機制則依照核心技術及設計方法分為四種,分別為: (一) 非個人化(Non-personalized) 此方式推薦的產品及資訊大多是以當時最熱門為主要推薦內容,如 排行榜等,此機制並不針對個別使用者偏好興趣去推薦,所以每位使用 者都會獲得相同的推薦,其推薦效果相當有限。 (二) 屬性導向(Attribute-based) 此方式也稱為「內容導向式推薦」 ,其內容所指的是以使用者對資訊 或產品的特定偏好或需求,來與系統進行配對的動作,推薦出符合使用 者的資訊及產品(Asim, Skander & Rajeev, 2000)。 (三) 項目相關性(Item-to-item correlation) 此類方式則利用產品或項目資訊之間的關聯規則,來產生推薦動 作。研究上常用資料探勘(Data mining)相關技術來從資料庫中找出兩 項目之關聯。 (四) 組群相關性(People-to-people correlation) 此類將具有相同興趣與偏好的使用者歸類為同一群,再依據群內使 用者的相同偏好,推薦給相同偏好的使用者,也就是所謂「協同合作式 推薦」(Schafer, Konstan & Riedl, 2000) 。. -9-.

(20)  . 根據上述研究技術之發展,推薦系統能為電子商務產生相當大的效 益,更能為企業帶來更多的利益,而已有不少企業已成功的使用推薦系 統於電子商務上,以下將舉例其中較著名之成功案例。. 1. amazon(亞馬遜網路平台) 為網際網路電子商務上的經營典範,擁有相當完整與大量的產品 項目與使用者交易紀錄資訊,並且自行發展出一套結合推薦演算法與 協同合作式的混合式推薦系統來進行產品之推薦,而其主要進行方式 則為系統根據使用者交易記錄、項目內容與滿意度評比,來預測使用 者對於各種項目產品的接受程度,並且進一步即時的依使用者所購買 過及評價過的項目產品,藉由分析及計算來推薦其他相似的產品項目 給使用者。. 圖 2-1. amazon.com(資料來源:http://www.amazon.com/). - 10 -.

(21)  . 2. ebay(商品購物網路平台) 為全球性的大型網路平台,包含了大量的商品及資訊在這被刊 登、販售及賣出,而推薦則分別採用協同合作式與內容導向式兩種推 薦方式,以買賣雙方之評比與信用度資料,經篩選後來推薦給其他買 家及使用者,另一方面也利用使用者過去的交易紀錄,來分析推測其 未來的購買行為,進而提供個人化的推薦服務。. 圖 2-2. ebay.com(資料來源:http://www.ebay.com/). 目前推薦系統研究當中,依推薦方式則主要分為內容導向式推薦系 統、協同合作式推薦系統及混合式推薦系統,以下將分別詳述其主要定 義、進行方法及優缺點與相關限制。 (一) 內容導向式推薦系統(Content-based recommendation system) 此推薦方式主要的概念來自於資訊篩選(Information filtering)和資. - 11 -.

(22)  . 訊擷取(Information retrieval)領域所衍生發展而來(Belkin & Croft, 1992;Baeza-Yates & Ribeiro-Neto, 1999)。 此方式進行之基礎則依據項目物件的屬性及內容來進行比對與判 斷,進而尋找出兩兩之間相似度高(Similarity)的項目物件,也可依據 使用者興趣、偏好或者過去曾接觸過的項目,來推薦給使用者相關的內 容與資訊。內容導向式推薦系統主要之優點則包括: 1. 依據個人興趣偏好推薦 可直接依據使用者個人興趣偏好來進行項目的篩選推薦,相較於 協同合作式推薦,對於項目受推薦之原因能夠給予合理的解釋。 2. 解決稀疏性問題及擴展性問題 以推薦精確度來評比,內容導向式較協同合作式來的精確,並且 可適當解決協同合作式推薦所面臨的稀疏性問題(Sparsity problem) 及擴展性問題(Scalability problem)。 而研究中將內容導向式推薦系統應用於實務上的分別有下列學者與 推薦系統。 1. NewsWeeder 網路新聞推薦系統 Lang(1995)研究中曾提出一套網路新聞推薦系統,此研究主要 推薦方式為依據系統所建置使用者資料輪廓檔(Profile)來推薦使用 者感興趣並尚未閱讀過的新聞文章。. - 12 -.

(23)  . 2. SmartPad 產品推薦系統 學者 Lawrence, Almasi, Kotlyar, Viveros & Duri(2001)所研究的 SmartPad 產品推薦系統,主要推薦依據為使用者對產品之偏好與產品 項目類別間的相似度,推薦出個人化產品清單給使用者。此系統也可 為所有的產品項目建立分類樹,使用者可透過此方式來找到屬於自己 的偏好產品。 雖然內容導向式推薦可為使用者個人推薦出適合的資訊及產品,也 已經實際應用並發展成數套研究系統,但相關研究中也指出其缺點限制 及改善空間(Shardanand & Maes, 1995;Adomavicius & Tuzhilin, 2005) , 其分別為: 1. 有限分析問題(Limited analysis problem) 此問題指出目前之技術仍無法處理特殊屬性之物件資料,僅能分 析單一內容屬性。 2. 過度特殊化問題(Over-specialization problem) 指出系統只能以過去使用者相似的項目進行推薦,無法適切的推 薦出尚未接觸過的項目。 3. 同義異名(Synonymy) 此問題則帶出目前現實生活中存在著許多相同的項目物件,但卻 有著不相同名稱的情況,內容導向式推薦系統無法辨識出相同性質但. - 13 -.

(24)  . 不同名稱的資訊或項目物件,產生同義異名的問題。 (二) 協同合作式推薦系統(Collaborative recommendation system) 其所謂的協同合作式推薦系統,強調的是人與人之間具有相同興趣 與偏好,也就是群體之間共同的想法及觀點,並藉由計算彼此間的相似 程度來找出與自己相同偏好的使用者,再推薦其資訊內容或產品項目給 目標使用者。 學者 Herlocker, Konstan, Borchers & Riedll(1999)在研究中則指出其 協同合作式推薦之主要優點有: 1. 可彌補內容導向式推薦限制 協同合作式推薦具有能力可推薦出超過使用者預期內的產品項 目,彌補內容導向式推薦之限制。 2. 群體經驗 可基於其他使用者的經驗及評比出品質較好的產品項目來做為 推薦。 3. 不需要分析內容項目之屬性 協同合作式推薦所推薦出的內容是依據與目標使用者具有相似 偏好之群體來做為推薦。 而在實務研究上,第一個採用協同合作式來產生推薦系統的為 Goldberg 等人(1992)所研究的 Tapestry 電子郵件分類系統,此系統主. - 14 -.

(25)  . 要為過濾電子郵件,之後並延伸至處理所有相關電子文件。此研究也指 出依據使用者群體來進行篩選會比電腦自動篩選有較高的準確率。以下 將介紹協同合作式推薦系統實務上之研究與應用。 1. GroupLens 新聞文章推薦系統 Konstan 等人(1997)發展此系統主要為幫助使用者在龐大的新 聞資料庫中找到感興趣的文章。GroupLens 使用開放式架構,主要讓 使用者在閱讀文章後,做出評分動作,並利用皮爾森相關係數(Pearson correlation coefficient)計算使用者之間相似程度。另一部分則是收集 資訊,並根據使用者之前的對新聞文章的評分,來計算並預測使用者 尚未閱讀過的文章評分,協助決定要不要閱讀該則新聞。 2. Siteseer 網頁推薦系統 系統則利用個人電子書籤(bookmark)方式來判別使用者興趣並 做為分群之依據,系統將個人與他人電子書籤比對計算,找出多數群 體使用者都喜愛的網站,進一步推薦相關內容資訊與網站給目標使用 者。研究中也指出,一般使用者會把此網站加入電子書籤,則表示此 網站是使用者所喜愛或者常瀏覽的,將其電子書籤視為一種隱性評比 則是可信賴的方式(Rucker & Polanco, 1997) 。 3. PHOAKS 網站資訊推薦系統 此系統則是由學者 Terveen 等人(1997)所提出之以隱性回饋方. - 15 -.

(26)  . 式來預測其使用者偏好,主要推薦 NetNews 文章內較為優良的網頁 位址 URL (Uniform / Universal Resource Locator)並且分析所張貼的 資訊內容。 協同合作式推薦為目前最廣泛應用之推薦系統技術,其主要不同於 內容導向式推薦系統,不單單只是依照項目來判斷,協同合作式推薦系 統則根據使用者群體中其他使用者對於項目或產品的評價做為推薦依 據,如同現實生活中常會詢問周遭友人對某個項目或產品的資訊或建議 後,才決定是否要購買。 雖然協同合作式推薦系統研究已經相當成熟完整,但 Nichols(1997) 與 Middleton 等人(2004)的研究中也指出仍具有其問題與相關限制需要 改善,分別為: 1. 稀疏性問題(Sparsity problem) 指的是系統常利用評比來做為推薦依據,但一般使用者只願意接 受推薦卻不願意進行評比的動作,使用者若評比過少資料,則造成資 料矩陣過於發散與稀疏,系統便無法推薦出合適的產品給使用者,造 成推薦品質不佳等結果。 2. 擴展性問題(Scalability problem) 一般協同合作式推薦系統多以最近鄰居演算法來計算相似度,但 其演算法的複雜度將直接影響到電腦運算,而且當資料量與使用者日. - 16 -.

(27)  . 益增多時,系統負擔變大相對會造成系統擴展性的問題,影響系統的 推薦成效。 3. 冷啟始問題(Cold-start problem) 指的是系統沒有足夠的項目資訊以及新進使用者尚未有任何評 比資料來做為分群的依據,無法將使用者分類到一個群組內,故無法 作推薦之動作,此問題又可分為新系統冷啟始問題(New system cold-start problem ) 與 新 使 用 者 冷 啟 始 問 題 ( New user cold-start problem)。 新系統冷啟始問題是指系統缺乏使用者對項目的評比資訊,因此 無法進行分析,相對的無法準確做出推薦動作。 新使用者冷啟始問題指的是系統進行推薦之前提必須有使用者 資料,因此當新加入的使用者,並無任何評比資料,系統當然無法找 出新使用者之相似鄰居,相對也就無法做出推薦動作;而即使立刻讓 新使用者做評比動作,所產生的推薦結果也未必是良好的,因系統評 比需要累積一定數量,推薦才有其意義。 (三) 混合式推薦系統(Hybrid-based recommendation system) 混合式推薦系統的產生則是因為內容導向式與協同合作式推薦系統 都具有特定限制及改善空間,故有研究學者主張可運用這兩種推薦系統 技術之優點來發展混合式推薦系統,期望能夠互補其缺失,進而取得較. - 17 -.

(28)  . 佳的推薦結果。 而 Adomavicius & Tuzhilin(2005)在研究中則指出混合式推薦系統 可分為四個種類來進行其推薦方式,分別為: 1. 結合個別系統推薦之結果 分別採用內容導向式推薦與協同合作式推薦,產生個別的推薦結 果後,將兩種不同的推薦結果合併推薦給目標使用者。也可依據推薦 的分數等級或者評比分數,進一步挑選出最合適的推薦資訊給目標使 用者。 2. 將內容導向式推薦之主要特性加入至協同合作式推薦 此方式則基於協同合作式推薦,並且建立起每位使用者內容導向 式推薦的個人輪廓檔,將個人輪廓檔做為輔助來計算使用者之間相似 度。 3. 將協同合作式推薦之主要特性加入至內容導向式推薦 採用群體使用者之間所建立出共同偏好的輪廓檔,來作為推薦基 礎依據,可改善單一內容導向式推薦的推薦效能。 4. 建立起單一的聯合推薦 將兩種推薦方法主要特性建立起單一規則的推薦方式。 混合式推薦系統其優點主要為透過結合內容導向式與協同合作式此 兩種推薦方式,來補足單一系統所產生的限制及缺失,更可透過結合不. - 18 -.

(29)  . 同數學演算法機制來產生混合式推薦,進而提升運算效率及推薦的精確 度,解決其相關問題。以下將針對混合式推薦系統在實務上之應用研究 依序介紹。 1. Feb 網頁資訊推薦系統 Balabanovic & Shoham(1997)在研究中提出 Feb 推薦系統,此 系統為一個結合內容導向式與協同合作式推薦技術的混合式推薦系 統,其採用推薦依據則為使用者對於收到的推薦資訊主題內容給予評 比,再使用協同合作式技術推薦文章給讀者。 2. INFOS 新聞文章推薦系統 此研究則以使用者的主動回饋為基礎來建立其閱讀興趣偏好,並 藉此來預測新文章是否符合使用者的興趣偏好。系統進行的程序方式 為使用者閱讀及瀏覽文章,系統會主動建議使用者進行評比動作,而 當使用者點選繼續閱讀下一篇文章時,所產生的新文章將依據評比結 果來重新推薦,此方式結合了相關推薦技術,是一種典型混合式推薦 系統(Mock & Vemuri, 1997)。 3. Personal Tango 網頁新聞推薦系統 學者 Claypool 等人(1999)在研究中提出 Personal Tango 推薦系 統,此系統分別將內容導向式與協同合作式推薦技術分別獨立出來, 進而以相似度來做為權重相乘,透過此方式進行計算,依預測與實際. - 19 -.

(30)  . 評分來調整相關權重與計算誤差,產生推薦結果給使用者。 4. ProfBuilder 網站推薦系統 Wasfi(1999)則在研究中提出 ProfBuilder 推薦系統,分別產生 內容導向式與協同合作式兩組推薦清單,而在協同合作式推薦為比對 使用者與群體之間相同瀏覽之網頁來推薦網站資訊,內容導向式部分 則依照使用者瀏覽的網站內容與偏好興趣,來推薦給使用者相似程度 高的網站資訊。 5. Amazon.com 網站 亞馬遜網路平台為目前推薦系統應用在電子商務上的經營典 範,獨立自行研發演算法與協同合作式的混合式推薦系統,系統為了 克服擴充性問題,採用在使用者離線(Off-line)時先行產生相似的 產品項目表,當使用者在線上(On-line)後則即時的依使用者購買及 評價過的項目產品,來推薦其他相似的產品項目。亞馬遜網路平台龐 大且完整的資料庫是成功的關鍵因素,系統可根據使用者交易記錄、 項目內容與滿意度評比,進而預測使用者對於各種項目產品的接受程 度(Linden et al., 2003) 。 而最近幾年相關研究當中,也有學者開始嘗試以新的觀念角度去設 計構思推薦系統,主要採用賣方(廠商、銷售者)所提供之資訊或角度 來設計推薦系統,希望藉由嶄新的推薦方式來提供給消費者不一樣且有. - 20 -.

(31)  . 別於一般傳統的商品推薦(Chen et al., 2008) 。 經由上述文獻探討所整理出的推薦系統研究之內容,本研究在將此 十個分別由不同學者所發展出的推薦系統相關研究內容及資訊統整歸納 如下表 2-1 所示。. 表 2-1. 推薦系統相關研究之比較 作者(年代). 系統名稱. 推薦方式. 推薦依據 系統所建置的. Lang(1995). NewsWeeder. 內容導向式. 使用者資料輪廓檔 (Profile) 使用者對文章的評分 並且利用皮爾森相關係數. Konstan et al. GroupLens. 協同合作式. (Pearson correlation. (1997) coefficient)來計算使用者 之間相似程度 利用個人電子書籤 (bookmark)方式來判別 Rucker & Polanco Siteseer. 協同合作式. 使用者興趣及分群並且與. (1997) 他人電子書籤進行比對 計算 分析文章內較為優良 的網頁位址 URL. Terveen et al. PHOAKS. 協同合作式. (1997). (Uniform / Universal Resource Locator) - 21 -.

(32)  . 表 2-1. 推薦系統相關研究之比較(續) 作者(年代). 系統名稱. 推薦方式. 推薦依據 分析使用者對於收到. Balabanovic & 混合式. Feb. 資訊主題內容給予的. Shoham(1997) 評比分數 依使用者的主動回饋來建 立閱讀興趣偏好並. Mock & Vemuri 混合式. INFOS (1997). 藉此預測新文章是否 符合使用者 以相似度來做為權重計算 並依預測與實際評分來. Claypool et al. 混合式. Personal Tango (1999). 調整相關權重與 計算誤差 比對使用者與鄰近群體間 相同瀏覽之網頁資訊並依. Wasfi(1999). 混合式. ProfBuilder. 照使用者瀏覽的 網站內容與偏好興趣 使用者對產品之偏好 Lawrence et al. SmartPad. 內容導向式. 與產品項目類別間的. (2001) 相似度 透過使用者購買及評價過 Linden et al. 混合式. Amazon.com. 的產品來分析計算. (2003) 產生其他相似的產品項目. 推薦系統目前雖已被廣泛地應用在各種研究領域當中,並且能有效 - 22 -.

(33)  . 解決資訊超載問題,但現今資訊推薦機制繁多,而最重要的關鍵因素仍 然是使用者喜好。故本研究針對上述學者研究綜合整理,希望能回歸使 用者本身,加強考量使用者偏好程度分析,以提升推薦系統的品質與準 確性。. 第二節 音樂推薦系統 音樂推薦系統(Music recommendation system)的發展,目前多採用 音樂特徵擷取來分類及管理音樂,紀錄使用者輸入的關鍵詞,接著與音 樂歌曲內容進行匹配分析,再推薦給使用者符合的音樂歌曲(Steffen & Sander, 2005) 。而音樂內容所指的屬性特徵有曲風、音調及樂器等多種, 也有研究是依據音樂的音高(Pitch) 、和弦(Chord) 、旋律(Melody)及 音質(Timbre)與音量(Loudness)屬性等來做為音樂特徵分類參考,一 般加入愈多屬性特徵值所產生的推薦結果也較精確(Chen & Chen, 2001;Tzanetakis & Cook, 2002;Kuo & Shan, 2002) 。 而在音樂內容屬性的相關研究中,有學者結合了協同合作式與內容導 向式推薦系統的特性發展出一套混合式音樂推薦系統,來協助使用者從 大量的音樂產品資訊中找出想要的產品。其研究主要做法為先利用協同 合作式的推薦機制,在使用者進入系統選購音樂產品時,系統會根據目 標使用者過去的交易記錄中,挑選出與音樂產品有相關的產品記錄,並 且分析音樂內容屬性和計算音樂產品與排序推薦次數,最後以推薦 - 23 -.

(34)  . TOP-N 的產品清單來做為提供使用者購買參考,而若使用者不接受協同 合作式所推薦出的產品,則可以在利用內容導向式推薦機制,由使用者 輸入其偏好的產品內容屬性來進一步篩選協同合作式所推薦出的音樂產 品(李來錫、黃文益,2008)。 此外,音樂推薦系統相關研究當中,也曾有學者提出主要藉由歌詞特 徵來作為分析依據,並藉此方式找到相同喜好的使用者組群(Daniel & Sally, 2007)。而也有學者則藉由取得每個使用者輪廓檔中之個人興趣喜 好後,再結合電子 RSS 的資訊新聞快報,擷取出使用者內相關的偏好資 訊,例如喜愛的歌手與歌曲名稱、音樂類型等,做為系統主要之過濾機 制,藉此方式可由電子資訊新聞(RSS)適時取得較新的音樂歌曲或歌手 相關資訊來做為未來推薦清單(Oscar et al., 2005) 。North, Hargreaves & Hargreaves(2004)研究中則是嘗試研究音樂在日常生活中所扮演的角 色,並分析與音樂相關的情境狀態,研究主要之結果顯示使用者會依照 不同原因來選擇不同的音樂類型。 在音樂推薦系統領域,許多學者在研究中相繼發現許多問題,也提出 其相關解決方法與機制,來增加音樂推薦的準確率與效率。下列將針對 音樂推薦系統相關之研究分別介紹與說明。 (一) MusicFX 音樂推薦系統 其主要目的為提供並撥放一個群體內所喜好之音樂,研究則指出在. - 24 -.

(35)  . 工作環境當中,不同時間區段內會有不同的人在一起工作,此系統可依 據在同一時間區段中工作的人,所提出的音樂喜好來選擇撥放的音樂種 類,而每個人都可對音樂的喜好程度做加總,總分最高即為最受喜愛的 音樂。系統也為了避免總分較低的音樂都不被撥放,採用了相關的參數 設定,可讓系統不只是撥放總分高的音樂(McCarthy & Anagnost, 1998)。 (二) Firefly 音樂推薦系統 此 系 統 則 具 有 自 動 化 協 同 合 作 式 篩 選 ( Automated collaborative filtering)機制,依據產品評比分數將相同偏好之使用者做分群動作,在 將同一群組中其他使用者所購買過的紀錄做為推薦基礎。而系統特殊的 地方不是依據產品及項目來進行推薦,而是採用「口碑」特殊的方式來 推薦給使用者(Maes, 1999) 。 (三) Smart Radio 音樂推薦系統 該系統主要提供了網路平台讓使用者管理及建立個人化的音樂播放 清單,此系統結合協同合作式與內容導向式推薦技術來產生推薦並與其 他使用者分享,主要以記錄使用者的音樂偏好及對聽過音樂所給的評 比,首先利用協同合作式推薦技術篩選出使用者可能偏好的音樂,進而 篩選掉不符合之音樂,依照推薦內容的優先順序呈現。另一個方式則是 使用者可自行決定對新音樂的接受程度,程度愈高代表希望收到推薦新 音樂的程度愈高。此外,系統也會計算使用者不偏好的歌曲,在推薦音. - 25 -.

(36)  . 樂 時 完 全 排 除 讓 推 薦 結 果 更 加 精 準 ( Hayes, Cunningham, Clerkin & Grimaldi, 2002)。 (四) Context-Aware 音樂推薦系統 學者 Guan, Li, Lee & Lee(2006)則提出此音樂推薦系統,主要運用 音樂特徵分析將音樂先進行分類,再計算音樂內特徵的平均數及標準 差,藉此分類代表不同心情的音樂,再藉由考量分析使用者偏好與使用 者心情狀態,並透過自動偵測使用者心情讓系統推薦出符合的音樂。自 動偵測方面則使用時間地點、天氣及是否有其他人等來做為評估標準。 (五) Ticketyboo 音樂推薦系統 Ticketyboo 系統則透過與網頁系統結合,可在使用者聆聽歌曲音樂 時,連結到歌手的表演相關資訊,系統會收集使用者的音樂偏好以及使 用者日曆上的情境資訊,並根據偏好及使用者的空閒時間來推薦音樂會 給使用者。研究中主要之應用包含三個元件,感應裝置、情境結構及推 薦系統。感應裝置偵測情境資料,包含使用者的音樂偏好、時間日曆, 並且分析使用者所在地與相關空閒時間及歌手音樂會相關資訊,所偵測 到的資料都透過情境結構整理成完整有用的資訊,進一步產生個人化的 建議推薦給使用者(Coyle et al., 2006) 。 (六) CA-MRS 音樂推薦系統 CA-MRS 為一套以觀察使用者情境的音樂推薦系統,可藉由所設立. - 26 -.

(37)  . 的感應裝置及網路中所收集的資訊,動態的分析使用者的音樂偏好,研 究中利用模糊貝氏網路(Fuzzy bayesian network)將所收集之資訊整理成 情境後,分析考量使用者在不同情境下的偏好,隨即主動推薦出音樂, 而此系統主要所觀察收集的情境資訊為氣候、聲音、季節等外在的環境 與狀態(Park, Yoo & Cho, 2006) 。 (七) Emotion-Based 音樂推薦系統 此系統則利用分析電影配樂中音樂特徵與情緒的關聯程度,透過此 方式推薦情緒音樂給使用者。主要之進行包含音樂特徵擷取、情緒偵測 及關聯探勘,為了辨別音樂裡的情緒,研究中指出每首音樂都包含情緒、 和音、節奏、與速度四項特徵屬性,系統採用混合媒介圖(Mixed media graph)來處理音樂情緒與特徵之間的關聯程度,依照此方式就推薦符合 使用者需求的情緒音樂(Shan, Kuo, Chiang & Lee, 2009) 。 經由上述學者們所提出的音樂推薦系統之研究,本研究在將此七個 音樂推薦系統相關研究內容及主要目的歸納整理如表 2-2 所示。. 表 2-2. 音樂推薦系統相關研究之比較 作者(年代). 系統名稱. 主要目的. 推薦依據. 提供並撥放一個. 經由同一時間工作的人來. 群體內所喜好之. 提出喜好之音樂並對喜好. 音樂. 程度做分析計算加總. McCarthy & MusicFX Anagnost(1998). - 27 -.

(38)  . 表 2-2. 音樂推薦系統相關研究之比較(續) 作者(年代). Maes(1999). 系統名稱. 主要目的. 推薦依據. 透過自動化協同合. 透過相同偏好之使用者. 作式篩選制來. 分群來推薦出群組中. 推薦出音樂產品給. 其他使用者所購買過. 使用者. 之紀錄. 提供網路平台. 利用協同合作式篩選出. 讓使用者管理及. 可能偏好之音樂並由使. 建立個人化. 用者自行決定對新音樂. 的音樂播放清單. 的接受程度. Firefly. Hayes et al. Smart Radio (2002). 藉由音樂特徵分析將音 透過自動偵測讓 樂進行分類並分析考量. Guan, Li, Lee & Context-Aware. 系統推薦出符合的 使用者偏好與使用者的. Lee(2006) 音樂. 心情狀態 藉由感應裝置偵測使用 透過與網頁系統結. 者的情境資料及分析使. 合來推薦出適合的. 用者與歌手音樂相關資. 音樂會時間及資訊. 訊並透過情境結構來. Coyle et al. Ticketyboo (2006) 整理資訊內容 藉由感應裝置及模糊貝 透過觀察使用者. 氏網路(Fuzzy bayesian. 情境來推薦出. network)中所收集的. 音樂. 資訊來動態分析使用者. Park, Yoo & Cho CA-MRS (2006) 的音樂偏好. - 28 -.

(39)  . 表 2-2. 音樂推薦系統相關研究之比較(續) 作者(年代). 系統名稱. 主要目的. 推薦依據. 利用分析電影配樂 藉由音樂特徵擷取與情 中音樂特徵與情緒. Shan, Kuo,. 緒偵測及關聯探勘產生 Chiang & Lee. 的關聯程度來. Emotion-Based. 混合媒介圖(Mixed (2009). 推薦情緒音樂給 media graph) 使用者. 音樂推薦系統根據目前研究技術發展,已有許多機制實際應用於網 際網路服務當中,也有不少網路服務自行研發相關推薦機制,其主要目 的都是為了推薦給使用者良好的音樂商品,而透過現今網路服務可漸漸 發現推薦系統的使用已經是不可或缺。以下將列舉相關國內外主要已應 用於網際網路中的音樂推薦系統。 1. Pandora Radio(線上音樂網路平台) Pandora Radio 致力於音樂推薦機制的研究,將音樂做最全方位的 分析,為典型的內容導向式音樂推薦系統,此推薦系統則藉由歌曲本 身所擷取出的音樂特徵值來做為主要內容判斷依據,讓使用者自行選 擇喜好的音樂類型,內容包括歌手與專輯名稱、節奏、配樂、歌詞內 容等,將具有相似特徵的音樂,依序推薦給目標使用者並且產生專屬 的音樂播放清單。. - 29 -.

(40)  . 圖 2-3. Pandora internet radio(資料來源:http://www.pandora.com/). 2. iLike(線上音樂網路平台) iLike 則屬於線上協同合作式音樂推薦系統,網路平台主要提供 免費音樂試聽及購買下載。 iLike 則把「發現新的音樂」視為最主要 之功能,使用者可自行在歌手相關資料庫中選擇自己喜愛或有興趣的 歌手,通過使用者的選擇,音樂推薦系統能主動幫助使用者找出有相 關聯喜好及興趣的其他使用者,進而實現具有相同喜好興趣的音樂社 群(Social network service)。 而當使用者擁有專屬於自己的音樂社群之後, iLike 就能幫助使 用者在線上收聽音樂時,尋找到最新的音樂,並且於好友們之間分享 彼此收聽的音樂內容。. - 30 -.

(41)  . 圖 2-4. iLike.com(資料來源:http://www.ilike.com/). 3. Last.fm(線上音樂網路平台) Last.fm 則與 iLike 採用相同推薦方式,都屬於線上協同合作式音樂 推薦系統。兩個網路平台主要推薦方式之差異在於所使用的分群方式, 在 Last.fm 不需透過使用者本身主動建立自己的喜好與興趣,如要求輸 入喜好歌手名稱與歌曲等等相關資訊。 而主要透過使用者本身自己所點播過的音樂,系統將主動依照所點 播過的音樂資訊內容來計算出使用者彼此之間的相似程度,藉由此方式 就可找出具有相同喜好興趣的群別以作出推薦動作。 Last.fm 採用此方 式的優點則是可以避免某些使用者不願意提供輸入資料,造成音樂推薦 系統沒有使用者的偏好或興趣來產生推薦。. - 31 -.

(42)  . 圖 2-5. Last.fm(資料來源:http://www.last.fm/). 4. CDNOW(線上音樂產品平台) CDNOW 所提供的音樂商品完整豐富且多樣齊全,其採用內容導向 式音樂推薦,主要可藉由使用者所查詢商品資訊,來推薦相關音樂資訊, 並且還提供使用者本身自行建立喜好評分來產生推薦,給予回饋資訊。. 圖 2-6. CDNOW.com(資料來源:http://www.cdnow.com/). - 32 -.

(43)  . 5. KKBOX(線上音樂網路平台) KKBOX 為國內所發展的音樂網際網路服務,此服務更有自行開發 的音樂瀏覽器軟體,為國內首創合法串流模式的線上音樂服務。其採用 的推薦機制為內容導向式音樂推薦。推薦依據則是使用者可自行選擇喜 好的風格、歌手來進行推薦,更可透過建立歌單之方式,如最新流行、 懷舊老歌、心碎療傷等,來推薦出音樂。. 圖 2-7. KKBOX.com(資料來源:http://tw.kkbox.com/). 現今音樂推薦系統多以簡單的音樂特徵擷取、評比分數加總、情緒 及情境狀態作為考量分析的因素,較少將其他因素列入,雖可滿足大部 分使用者之喜好,但在個人化的音樂推薦仍有其他重要性的因素需加入 考量。故本研究進一步將模糊語意法加入至個人化的音樂推薦機制中,. - 33 -.

(44)  . 以期望能更深入分析使用者本身偏好,進而推薦給使用者更適合之音樂 資訊。. 第三節 模糊語意法 學者 Zadeh(1965)發展並提出模糊理論(Fuzzy theory)的研究, 主要以期望模仿人的行為思考方式,接受模糊不明確現象的事實,進而 處理及解決複雜無法精確化所產生的問題,在依據模糊不清楚的訊息, 採用近似推理(Approximation reasoning)的方式獲得較準確之結果。研 究中也指出,人對項目的感受其滿意度強弱都因個體的主觀認知而有所 不同。因此,在面對如此複雜或難以定義的感受情境中,可運用模糊語 意法來加以處理問題(Zadeh, 1975) 。故本研究採用模糊理論研究領域中 的模糊語意法(Fuzzy linguistic analysis)來協助求取各尺度項目的區間 值,而本研究將在此小節,依序針對下列模糊數(Fuzzy number)及語意 措詞(Linguistic terms)來作相關一系列的介紹及探討。 (一) 模糊數(Fuzzy number) 在傳統的統計方法中,一般性的抽樣調查往往只能得到單一的數值 資料或明確的等距尺度,所得到的結果答案似乎無法貼切個體內心真實 的表達與想法。因此,可透過採用模糊數來求解結果,可更貼近人類內 心的思維判斷。. - 34 -.

(45)  . 而其模糊數研究中,在表明一個不明確的數值時,則主要利用隸屬 函數(Membership function)來表示(Chen & Hung, 2006)。 根據學者 Dubois & Prade(1980)研究中對模糊數所做之定義,為模 糊集合數 à 在實數 R 中,其隸屬函數為 μà (x):R → [ 0,1 ],並且至 少須符合下列三項特性:. 1. μà (x):是指定義域 R 至 [ 0,1 ] 空間上的連續映射。 2. μà (x):為一凸性(Convex)的模糊子集合(Mapping) 。 3. μà (x):為一模糊子集的正規化(Normalization)即存在一個數 x0 使得μà (x0) = 1。. 若滿足上述條件的數值皆可稱為模糊數。而在一般隸屬函數的研究 應用上,三角形模糊數(Triangular fuzzy number)具有簡單而且計算快 速之優點(Gungor et al., 2009;Celik et al., 2009)。因此,本研究將三角 形模糊數應用在衡量問卷的語意區間尺度上。 隸屬函數主要數學式之定義為:. (x - L)/(M - L) , L  x  M  μà (x) = (R - x)/(R - M) , M  x  R 0 , otherwise . - 35 -.

(46)  . 其三角形模糊數之隸屬函數圖形表示如圖 2-8: μà (x). 1. x. 0 L. M. R. 圖 2-8. 三角形模糊數之隸屬函數. 而主要決定了三角形模糊數(Triangular fuzzy number)的左端點 (L) ,中心點(M) ,右端點(R) ,就可決定三角形模糊數,並且可表示 為μà (x) =(L , M , R)。 而根據 Zadeh(1965)所訂定的三角模糊數特性以及其擴張原則,三 角模糊數μà 1 (x) =(L1 , M1 , R1)及μà 2 (x) =(L2 , M2 , R2)相關代數運算 如下內容表示:. 1. 模糊數之可加性(Addition) (L1 , M1 , R1)+(L2 , M2 , R2)=(L1+ L2 , M1+M2 , R1+R2) 2. 模糊數之可乘性(Multiplication) (L1 , M1 , R1)×(L2 , M2 , R2)=(L1 L2 , M1M2 , R1R2) - 36 -.

(47)  . 3. 模糊數之可減性(Subtraction) (L1 , M1 , R1)-(L2 , M2 , R2)=(L1- L2 , M1-M2 , R1-R2) 4. 模糊數之可除性(Division) (L1 , M1 , R1)÷(L2 , M2 , R2)=(L1∕ L2 , M1∕M2 , R1∕R2). (二) 語意措詞(Linguistic terms) 模糊語意法中的語意措詞(Linguistic term)所指的是在問卷量表中 的反應選項字詞,給予使用者或受訪者填答,量表的高低則是表示個人 內心感受程度,如傳統五點量表為「非常不滿意」、「不滿意」、「稍微滿 意」、「滿意」和「非常滿意」這五種詞組,讓使用者及受訪者本身可自 行選擇認為合適的語意來描述個人對此項目的實際感受,並對所選擇之 語意措詞填入區間模糊數以表示個人的感受強度。 而模糊語意(Fuzzy linguistic)則是以語意措詞為基礎,並且透過區 間模糊數更深入地去衡量填答者感受的高低程度。本研究為了更明確地 表示出語意措詞及模糊數之間的關係,以表 2-2 的模糊語意區間量表作為 範例並且加以說明。 1. 語意措詞(Linguistic terms)指的是在李克特尺度(Likert scale) 量化方式所設計的問項中,用以衡量填答者感受認知程度的五種 尺度指標,即為語意措詞。在本範例中,「非常不同意」、「不同. - 37 -.

(48)  . 意」 、 「普通」 、 「同意」及「非常同意」這五種詞組,便稱為語意 措詞。 2. 模糊數(Fuzzy number)則以表示填答者的實際感受程度。針對 每個量表中的語意措詞,額外加上讓填答者填入的三個以模糊數 組成的區間值。在本範例中,填答者針對「同意」的選項分別填 入 0.6、0.7 及 0.8 三個模糊數,用以表示該問項中,個人對該語 意措詞的內心實際感受值。. 表 2-3. 模糊語意區間量表 感受程度: 1. 非常不同意. 2. 不同意. 語意區間:. … … … … … … 0.6 0.7 0.8. …. …. …. 3. 普 通. 4. 同 意. 5. 非常同意 …. …. …. 模糊語意法已被實際應用許多研究領域當中,如分析調查、教育研 究及決策實務等。在本研究當中則依序整理了相關學者之研究,如下列 內容所示。 (一) 問卷調查研究方面 在社會科學問卷調查中,人的思維跟內心想法是最常想被瞭解的, 但過去科學家習慣以簡馭繁,用簡單的邏輯去處理紊亂多變的世界,因 此產生了像二元邏輯這種簡易的分析方式,進而對所討論的議題給予單 一的選擇,但是這種方式卻完全忽略了人本身在思考邏輯與對事物的認. - 38 -.

(49)  . 知上,所具有的模糊特性。而相關研究則指出在分析及解決此問題時, 利用模糊統計分析與隸屬度函數會是一種較為適當的測量方法,而模糊 邏輯的誕生,讓人的思維得以更合理且完善地表達出來,故發展適當的 分析方法是刻不容緩(孫慶珉,2007)。 在國內學者的研究中,徐村和、朱國明、詹惠君(2001)曾發展模 糊語意量尺的程序,並且有效解決了傳統等距量化產生的誤差。在其研 究中可發現到,受訪者在不同認知型態下,會產生不同的語意轉換值, 此現象也進一步提到人具有模糊不確定性及思維邏輯的複雜性。 而在改良問卷方面,楊明慧(2002)在研究中則以模糊邏輯的思維 來改良傳統之李克特量表,並允許受訪者在數個選項中填寫隸屬度,接 著在計算模糊計分值。其研究主要利用模糊語意問卷來進行資料蒐集, 嘗試以模楜理論相關研究中所提出之模糊集群分析來設計演算法,求出 各語意的群落中心值來進行參數化,進而找出較為貼近受試者心理潛在 特質的語意模糊數及隸屬度函數。 另外,也有研究主要探討量表的傳統計分和模糊語意計分之特性, 研究則以驗證實證資料和資料模擬兩方面,在有無解模糊化和模糊隸屬 度加權的情形下,分析比較了傳統計分和模糊語意計分之信度與效度的 差異。而實證資料與資料模擬分析當中,係以三角模糊數來表示語意模 糊數,顯示出模糊語意計分比傳統計分的信效度為佳。研究最後則根據. - 39 -.

(50)  . 實證和模擬分析所獲得一致性結果,顯示模糊語意計分有其應用與發展 之處(林原宏,2003) 。此外,學者顏乾明(2003)的研究中也針對模糊 語意量表與傳統李克特量表之信度來進行更深入的模擬比較分析。研究 主要以 MATLAB 程式語言將模擬試驗組合予以程式化,再分別進行比較 模糊語意量表計分與傳統李克特式量表計分,在各因子組合下的信度差 異。其研究結果顯示在任何因子組合之下,以模糊語意計分所得之信度 值,比以傳統李克特式量表計分所得之信度值來的高。 相關研究發展中,學者以模糊語意來做為評估各構面準則之方法, 然後在將表示各評估結果之模糊數與其對應重要性權數整合成代表總評 估結果之模糊數,並利用模糊數積分值轉換成語意措詞表示總評估結 果,以此語意措詞表示的總評估結果可表達出實際的內心感受與知覺程 度(劉天賜、康博智,2003) 。也有學者在研究模式中,將語意評估以模 糊數取代明確值,進一步的說明透過此方式能更加瞭解人的內心實際需 求(Lin et al., 2004) 。另外,也有學者以模糊語意為主要設計基礎來發展 資訊系統滿意度之衡量方法,並且透過此方法建構出一種用模糊語意衡 量的主觀評估模式。而研究中也提到使用者在系統滿意水準評估的過程 中,會因其個人主觀因素與認知差異導致對系統滿意水準會有不同的評 價,所以使用者對系統的滿意水準之評價是主觀的。研究也說明了在評 估系統滿意水準時應將人的主觀性與事物的模糊性納入考量,才顯得恰. - 40 -.

(51)  . 當。而以模糊數來表示用戶的滿意水準則更合乎人類主觀評估的思考方 式(陳慶文、吳一聲、劉天賜,2006)。 此外,在調查研究方面,學者研究中則指出一般大部分品質調查皆 使用李克特尺度(Likert scale)來代表顧客所表達的事前期望與實際感受 語意措詞(Linguistic term) ,再進行品質之評量。研究中也指出事前期望 與實際感受是屬於人類心理認知部份,其具有模糊、主觀且不確定的特 性。而研究結果顯示,採用模糊語意計分之問卷在信度、建構效度與品 質期望排序符合度上皆高於採用李克特尺度計分之問卷(鄧維兆、裴文, 2007)。 (二) 教育領域研究方面 在國外相關研究中,Yamashita(1997)則認為個體在決定決策時對 其本身動機內容並未清楚了解,受環境與生長背景影響甚大,故發展一 套 針 對 高 中 畢 業 生 升 學 與 就 業 輔 導 的 生 涯 決 策 模 式 ( Career decision-making model)量表,其根據模糊語意方式並加入模糊推理(Fuzzy reasoning)來進行其研究。 國內更有學者在研究中採用模糊語意方式將語意變數轉換成模糊 數,透過模糊運算後求解模糊化,資料收集則以學校品質管理課程為例。 其研究結果表示以模糊數來計算問卷調查中的語意差別數,與傳統問卷 表相較之下,可減少傳統明確數值的主觀性(王元仁, 2000)。而鄭景俗. - 41 -.

(52)  . 等人(2004)的研究也建立了一種主要以百分比填答不同於一般問卷的 模糊語意量表,來進行教育專家及高中職校長的專家問卷,其更能符合 填答者內心狀態。並且提出模糊語意運算法來整合模糊語意量表的問 項,進而建立教師評鑑模式。 (三) 管理決策研究方面 在管理決策方面,考量到決策問題具有時效性,提供決策的資料及 專家的主觀判斷亦隱含不確定性及模糊性,同時決策過程中所考慮的評 估準則之間可能也有相互衝突的情形。而大部份的準則決策方法所使用 的評估資料都是明確值,並不適合實際的決策環境。因此,應同時考量 到量化與質化的評估準則,讓專家以語意區間之方式,提供專家表達決 策方案評估準則的意見,以充分表達專家主觀判斷的建議,降低評估過 程中的不確定性及模糊性,進而提出模糊語意決策分析模式(洪偉展, 2009)。 學者林凌仲、徐村和(2008)也提出在實際的決策環境下,決策者 會根據個人的語意偏好來表達他們的評估結果。因此,如果對於不同決 策者的語意偏好影響未加以考慮,很有可能會造成評估結果與實際決策 過程的落差。研究中為了有效降低決策的語意認知偏誤,進而發展出模 糊語意偏好模式,來讓決策者在評估過程,所產生的模糊認知能獲得有 效的詮釋。. - 42 -.

(53)  . 而學者 Herrera & Herrera-Viedma(2000)在研究中則提出語意訊息 (Linguistic information)下的語意決策分析(Linguistic decision analysis) 步驟,其研究指出模糊語意可解決其決策相關問題。此外,Carlsson & Fuller(2000)也在研究中提出建議使用模糊推理方法(Fuzzy reasoning method)來確立決策變數(Decision variable)和目標函數(Objective function)的關係,可用此方法找出模糊多目標語意(Fuzzy multiobjective linguistic)問題的最佳解。 而在相關決策行為的研究,有學者則將此方法應用在住宅消費決策 行為當中,並使用模糊語意法探討隸屬度反應受測者對不同指標的決策 特性。研究結果則指出不同居住地區之居民,面對錯綜複雜的住宅消費 選擇行為時,購買房屋考量因素的重視程度因人而異,同時透過模糊語 意法的應用來進行分析及決策行為的衡量,是為良好的方式(連經宇、 陳彥仲,1999) 。在往後的研究當中,學者更提出不同於過去住宅選擇之 相關研究,嘗試以結合不連續選擇理論與改良後的模糊語意法來進行系 統化推論。其主要依據模糊語意(Fuzzy Linguistic Scale)結合巢式 Logit 模式來建立新的理論模式。實證模式分析發現研究所建立的家戶住宅類 型選擇個體行為分析模式,無論在模式的配適能力、預測成功率與概似 比統計量檢定等相關統計與經濟指標的意義上,使用模糊語意的巢式 Logit 選擇模式皆較傳統巢式 Logit 選擇模式具有較佳的整體解釋能力. - 43 -.

(54)  . 與較能準確預測選擇決策變數的能力。研究結果也指出,受訪者內心實 際的尺度並非與李克特的等距尺度相等,而由受訪者所填寫之分數卻是 較為可靠的,因這些分數是受訪者心裡本身的直接量測。而在傳統不連 續選擇理論中的 Logit 模式加入模糊語意後,將可以解決傳統住宅消費 選擇中具模糊性與不確定性的問題,並可作為協助具質化資料與量化分 析方法整合的重要參考(連經宇、陳彥仲,2005) 。 另一方面,陳振東、林靜珊(2008)的研究中也提出決策評估常涉 及許多質化與量化的項目,在對每項準則與指標進行評估時,常由於評 估人員的主觀判斷,以及評估指標質化的特性,使得判斷與評估的過程 存在相當程度的模糊性。而其研究為了有效降低績效評估過程的模糊 性,及提高評估結果的合理性,以語意變數為基礎,提出了一種模糊語 意評估之模式。藉由語意變數可使考評者依照本身對被考評者的實際了 解程度,選擇最適合的語意變數進行評估,如此可以避免以明確的評估 分數造成不易考評的困擾。 依據模糊語意法相關研究文獻可得知,模糊語意法已應用與各研究 領域當中,其主要具有可測量問題之真實性及相關實際應用上的彈性, 而以此方法所設計的問卷量表也比傳統李克特量表的信度值高。故本研 究將結合模糊語意法與傳統李克特五點量表,不僅能保有傳統量化方法 之便利性及明確性,更具備模糊語意法可測得實際感受之真實性。. - 44 -.

(55)  . 第參章. 研究方法. 本研究以模糊語意法進行音樂 CD 資訊推薦,其主要的研究程序則 是以買賣雙方彼此對於音樂種類的認知進行模糊語意比對,以推薦出適 合買方偏好的音樂產品。在本章節當中將針對研究方法做完整詳細說 明,其內容包括內部相關功能與程序,並且引用個案來進行範例分析。. 第一節 研究架構 本章節研究方法主要架構可分為三個階段,分別為(一)語意資訊 收集,在本階段進行認知模糊語意資料庫的建置,另一部分則針對使用 者購買的模糊偏好(二)資訊推薦運算,此步驟則是將使用者所填答的 模糊語意資料做感受差距運算與離異度的計算(三)產品資訊推薦,最 後則藉由離異度大小來判斷是否進行推薦,更可自行設定推薦個數進而 篩選掉偏好程度較低之項目。 研究架構之整理如圖 3-1 所示,相關步驟詳細說明如下。.     (一)語意資訊收集   模糊語意問卷設計     語意問卷資料收集  . (二)資訊推薦運算 (三)產品資訊推薦 感受差距測量 模糊偏好推薦 離異度計算. 圖 3-1. 研究架構圖 - 45 -.

(56)  . 第二節 語意資訊收集 (一) 模糊語意問卷設計 問卷量表設計係參考李來錫、黃文益(2008)研究中所提出之音樂 CD 特色屬性,如表 3-1 內容所示,經由音樂 CD 產品資訊分析並擷取出 音樂旋律之關鍵詞,其內容包括輕快、抒情、浪漫、溫柔、悲傷、清晰、 即興、現場、熱情與其他十種,但為了符合本研究之音樂 CD 特色屬性, 將「夢幻」此關鍵詞加入並取代掉「其他」關鍵詞,透過關鍵詞加入可 讓本研究更臻完善。 而此十種關鍵詞屬性是從同義關鍵詞中挑選一個代表關鍵詞,以關 鍵詞「輕快」為例,其同義詞共有十一個,分別為輕鬆、舒暢、快樂、 欣喜、喜悅、愉悅、激揚、輕巧、歡悅、飽滿與舒服,因此取輕快為代 表關鍵詞,其餘皆依此類推。 模糊語意題項設計部份主要針對音樂 CD 產品特色屬性之量表,並 於每一問題選項下加入語意區間量表,如表 3-2 所示。語意區間量表設計 則在每題問項之五點量表下加入三個格位的區間分數,區間分數則為一 模糊數,介於 0 到 1 之間,第一格分數代表填答者對於該題項最低感受 程度,第二格為填答者對該題項的平均感受程度,第三格則為填答者最 高的感受程度。 舉一例子,若有一位使用者在「非常同意」選項下的區間量表分數. - 46 -.

(57)  . 填寫為(0.7,0.8,0.9) ,則表示該使用者對於該「非常同意」選項的感受程 度有 0.7 到 0.9 之間,而感受程度中間值是 0.8,因此對於此題項的語意 上,該填答使用者的感受是相對較強的。. 表 3-1. 音樂 CD 特色屬性表 關鍵詞. 同義詞. 輕快. 輕鬆、舒暢、快樂、欣喜、喜悅、愉悅、激揚、輕巧、歡悅、飽滿、舒服. 抒情. 忘情、抒懷. 浪漫. 舒適、情意綿綿. 溫柔. 柔和、柔順、柔美、低聲、輕聲、低沉、寧靜、靜謐、圓潤、溫暖、溫潤、 悠揚、甜美、溫馨、柔情、動聽、豐潤、甜蜜、沉吟、溫潤、溫和. 悲傷. 淒涼、悲苦、悲戚、鬱悶、潺潺、銷魂、憂鬱、陰沉、淒美. 清晰. 明亮、清爽、清楚、清澈、乾淨、清新、純淨. 即興. 自由發揮、隨興. 現場. 當場. 熱情. 狂熱、狂野. 夢幻. 夢境、幻想. - 47 -.

(58)  . 表 3-2. 語意區間量表 1. 您本次想要購買的音樂產品 CD 要「輕快」的嗎? 感受程度:. 1. 非常不同意. 2. 不同意. 3. 普 通. 4. 同 意. 5. 非常同意. 4. 同 意. 5. 非常同意. 4. 同 意. 5. 非常同意. 4. 同 意. 5. 非常同意. 4. 同 意. 5. 非常同意. 4. 同 意. 5. 非常同意. 4. 同 意. 5. 非常同意. 4. 同 意. 5. 非常同意. 4. 同 意. 5. 非常同意. 4. 同 意. 5. 非常同意. 語意區間: 2. 您本次想要購買的音樂產品 CD 要「抒情」的嗎? 感受程度:. 1. 非常不同意. 2. 不同意. 3. 普 通. 語意區間: 3. 您本次想要購買的音樂產品 CD 要「浪漫」的嗎? 感受程度:. 1. 非常不同意. 2. 不同意. 3. 普 通. 語意區間: 4. 您本次想要購買的音樂產品 CD 要「溫柔」的嗎? 感受程度:. 1. 非常不同意. 2. 不同意. 3. 普 通. 語意區間: 5. 您本次想要購買的音樂產品 CD 要「悲傷」的嗎? 感受程度:. 1. 非常不同意. 2. 不同意. 3. 普 通. 語意區間: 6. 您本次想要購買的音樂產品 CD 要「清晰」的嗎? 感受程度:. 1. 非常不同意. 2. 不同意. 3. 普 通. 語意區間: 7. 您本次想要購買的音樂產品 CD 要「即興」的嗎? 感受程度:. 1. 非常不同意. 2. 不同意. 3. 普 通. 語意區間: 8. 您本次想要購買的音樂產品 CD 要「熱情」的嗎? 感受程度:. 1. 非常不同意. 2. 不同意. 3. 普 通. 語意區間: 9. 您本次想要購買的音樂產品 CD 要「現場」的嗎? 感受程度:. 1. 非常不同意. 2. 不同意. 3. 普 通. 語意區間: 10. 您本次想要購買的音樂產品 CD 要「夢幻」的嗎? 感受程度:. 1. 非常不同意. 2. 不同意. 語意區間: - 48 -. 3. 普 通.

數據

圖 4-8. 資訊推薦結果  .......................................................................................
表 2-1. 推薦系統相關研究之比較(續)  作者(年代)  系統名稱  推薦方式  推薦依據  Balabanovic &  Shoham(1997)  Feb  混合式  分析使用者對於收到 資訊主題內容給予的  評比分數
表 2-2. 音樂推薦系統相關研究之比較(續)  作者(年代)  系統名稱  主要目的  推薦依據  Maes(1999)  Firefly  透過自動化協同合作式篩選制來  推薦出音樂產品給 使用者  透過相同偏好之使用者 分群來推薦出群組中 其他使用者所購買過 之紀錄  Hayes et al
表 2-2. 音樂推薦系統相關研究之比較(續)
+7

參考文獻

相關文件

(1999), "Mining Association Rules with Multiple Minimum Supports," Proceedings of ACMSIGKDD International Conference on Knowledge Discovery and Data Mining, San Diego,

Lange, “An Object-Oriented Design Method for Hypermedia Information Systems”, Proceedings of the Twenty-seventh annual Hawaii International Conference on System Sciences, 1994,

Muraoka, “A Real-time Beat Tracking System for Audio Signals,” in Proceedings of International Computer Music Conference, pp. Goto, “A Predominant-F0 Estimation Method for

[16] Goto, M., Muraoka, Y., “A real-time beat tracking system for audio signals,” In Proceedings of the International Computer Music Conference, Computer Music.. and Muraoka, Y.,

Lin, “Automatic Music Genre Classification Based on Modulation Spectral Analysis of Spectral and Cepstral Features”, IEEE Trans.. on

Godsill, “Detection of abrupt spectral changes using support vector machines: an application to audio signal segmentation,” Proceedings of the IEEE International Conference

Shih and W.-C.Wang “A 3D Model Retrieval Approach based on The Principal Plane Descriptor” , Proceedings of The 10 Second International Conference on Innovative

[16] Goto, M., “A Robust Predominant-F0 Estimation Method for Real-time Detection of Melody and Bass Lines in CD Recordings,” Proceedings of the 2000 IEEE International Conference