以案例式推理進行相機產品挑選推薦系統設計
全文
(2)
(3)
(4) 摘要 隨著網際網路的迅速發展,雖然帶來資料蒐集的便利性,但也同時 造成資訊超載的情況。因此專家學者們紛紛提出不同的因應之道,希望 藉此能有效解決資訊超載的現象,其中研擬資訊推薦機制即是解決方法 之一。使用者在種類繁多的相機產品挑選上,也同樣面臨相同的問題, 如何快速並有效協助推薦出使用者所需之相機產品,即是本研究主要探 討的議題。本研究透過案例式推理進行相機產品之推薦,利用案例相似 度的比對分析,從過去累積的資料案例中找出最相似的產品案例,對使 用者進行推薦的程序並提供二手交易之價格。如此一來,不但能達到快 速以及節省時間的目的也能提供多元的資訊以供使用者參考。最後,本 研究以模擬使用者情境方式,進行推理的步驟,列舉出相似度最高之前 十筆案例向使用者進行推薦。研究結果顯示,資訊推薦機制搭配案例式 推理法的輔助可達成節省時間並增加效率。. 關鍵詞:資訊超載、資訊推薦、相似度計算、案例式推理. I.
(5) Abstract Internet has been developed rapidly and it brings high convenience for information collection. However, it causes a serious problem of information overloading. To solve the problem researchers have proposed different methods. Information recommendation system is one of those popular methods. The information overloading problem also occurs in camera selection. This study aims to solve the selection problem to recommend proper camera using case-based reasoning. This research find out the most similar case from the case-based reasoning and information in the past by similarity analysis, which giving the helpful process and second-handed price. As a result, this way not only saves time, but also provides users with much related information for their reference. Finally, this research simulates the situation of users so as to reason step by step and lists the top ten of similar cases to users. The result shows that Information Recommendation System could save time and increase work efficiency with case-based reasoning.. Keywords: information overload, information recommended, similarity analysis, case-based reasoning. II.
(6) 誌謝 光陰似箭,轉眼又到鳳凰花開時節,對我而言也終於熬到求學生涯 的最後一站。回首一路走來的點點滴滴,無論是求學過程中貴人的相助 或是同儕間的相互砥礪,這些過程與經歷都讓我的求學生涯激盪許多火 花也更加多采多姿,內心無不心存感激。 在屏商讀研究所的這段時間,最要感謝的是我的指導教授 李來錫 老師,老師不僅在撰寫論文時給予許多寶貴意見,在寫作遭遇瓶頸時, 更適時給予鼓勵,使我能夠更加精進,除此之外,老師也給予充裕的時 間與空間,讓學生我能夠安排及規畫自己的時間,學生在此致上最高的 敬意及謝意。在論文口試時,承蒙 林哲宏 教授 以及 葉惠忠 教授 在 百忙之中撥空對學生撰寫論文提供寶貴的意見,兩位教授精闢的見解使 我的論文能更加盡善盡美。 此外,我也要特別感謝大學的導師 許瓊文 老師,資管所的同窗好 友于竣,國中同學鄭傑、建中,高中同學建智,大學同學凱擇、汎翊、 泊汝,還有好友明汎,謝謝你們在我低潮時給我打氣與鼓勵,也陪伴我 渡過許許多多歡笑或是難過的時候,我真心的想對你們說,有你們真好, 謝謝你們。 最後,我要感謝始終在我身旁陪伴我成長與茁壯的爺爺及媽媽,謝 III.
(7) 謝你們在我最需要你們的時候沒有離開我,你們對我的支持及關心讓我 沒齒難忘,也讓我沒後顧之憂的完成碩士學位,謝謝你們。 人生走過的時間,走不過的是回憶,謝謝求學路上所經歷的任何困 難與挫折,讓我能夠有勇氣及膽識迎向充滿挑戰的未來。. 莫忘初衷 共勉之. 董松青 謹誌 于 國立屏東商業技術學院 資訊管理研究所 中華民國 101 年 6 月. IV.
(8) 目錄 摘要 .................................................................................................................... I Abstract ............................................................................................................ II 誌謝 ................................................................................................................. III 目錄 .................................................................................................................. V 表索引 ........................................................................................................... VII 圖索引 .......................................................................................................... VIII 1、. 緒論 ......................................................................................................... 1 1.1 研究背景與動機 .................................................................................. 1 1.2 研究目的 .............................................................................................. 4 1.3 研究架構 .............................................................................................. 4. 2、. 文獻探討................................................................................................. 8 2.1 資訊推薦 ............................................................................................. 8 2.2 案例式推理 ....................................................................................... 25 2.3 消費者(使用者)採購行為 ................................................................. 33. 3、. 研究方法............................................................................................... 37 3.1 研究流程 ............................................................................................ 37 3.2 資料蒐集 ............................................................................................ 38 3.3 案例式推理 ........................................................................................ 53 V.
(9) 4、. 資訊推薦系統設計雛形....................................................................... 61 4.1 系統目的 ............................................................................................ 61 4.2 系統架構 ............................................................................................ 62 4.3 系統流程 ............................................................................................ 63 4.4 系統畫面展示 .................................................................................... 65. 5、. 結論與建議........................................................................................... 75 5.1 研究結論 ............................................................................................ 75 5.2 建議 ................................................................................................... 77. 參考文獻 ......................................................................................................... 78. VI.
(10) 表索引 表 2-1 資訊推薦系統相關領域之比較 ........................................................ 20 表 3-1 案例項目之內容................................................................................. 45 表 3-2 各廠牌對焦馬達對應表 .................................................................... 51 表 3-3 最高相似度之前十筆案例內容 ......................................................... 60 表 4-1 資訊系統推薦結果 ............................................................................ 71. VII.
(11) 圖索引 圖 1-1 研究架構............................................................................................... 6 圖 3-2 數位視野論壇討論區 11 種討論群組 .............................................. 40 圖 3-3 數位視野論壇 二手專區 .................................................................. 40 圖 3-4 數位視野論壇二手專區抽樣資料 .................................................... 41 圖 3-5 案例階層架構圖................................................................................. 45 圖 3-6 鏡頭比較............................................................................................. 53 圖 3-8 屬性相似度之比較 ............................................................................ 57 圖 4-1 系統架構圖......................................................................................... 62 圖 4-2 系統操作流程圖................................................................................. 65 圖 4-3 案例式推理 - 登入介面 ................................................................... 66 圖 4-4 案例式推理 - 選擇功能介面 ........................................................... 67 圖 4-5 案例式推理 - 更改案例介面 ........................................................... 67 圖 4-6 案例式推理 - 新增案例介面 ........................................................... 68 圖 4-7 案例式推理 - 成功新增案例於案例資料庫 ................................... 68 圖 4-8 案例式推理 - 刪除案例介面 ........................................................... 69 圖 4-9 案例式推理 - 使用者輸入介面 ....................................................... 70 圖 4-10 案例式推理 - 計算結果 ................................................................. 70 VIII.
(12) 圖 4-11 案例式推理 – 價格篩選機制......................................................... 72 圖 4-12 案例式推理 – 詢價結果 ................................................................ 73. IX.
(13) 1、. 緒論. 1.1 研究背景與動機 近年來隨著網際網路普及化,網路已成為許多人生活中的一部分, 間接造成愈來愈多人習慣於利用網路蒐集所需之資訊,然而過多的資訊 也導致使用者蒐集資料時容易產生資訊超載 (information overload)現象。 在相機產品的挑選上也面臨相同的狀況,無論是舊有的產品或是新上市 的產品,在規格或功能上,往往容易令使用者產生混淆,因此使用者在 挑選種類眾多的相機產品時,經常須耗費冗長的時間與精神在蒐集相關 資訊上,也相對不易做出適切之決定。因此,如何幫助使用者節省時間 在搜尋所需資訊上的議題逐漸受到重視。在處理資訊超載的問題上,許 多相關研究指出透過資訊推薦機制的協助不但可以有效減少搜尋時間與 成本,並且使其增加效率,更進一步能提供使用者推薦出適合的產品 ( Schoefegger, Seitlinger, and Ley, 2010 ; Hung, 2005 )。基於此原則,本研 究以相機產品的挑選推薦為議題,探討適當的推薦方法以協助使用者進 行挑選。 目前資訊推薦系統從技術以及類型上來劃分,主要可分成三種型式, 分 別 為 內 容 過 濾 式 ( content-based filtering, CBF ) 、 協 同 過 濾 式 ( collaborative filtering, CF )、混合過濾式( hybrid-based filtering )。內容過 1.
(14) 濾式 又可稱為認知過 濾 ( cognitive filtering ), 構想源自於 資訊擷 取 ( information retrieval, IR ),此法為蒐集使用者過去的相關資料,如喜好、 購買紀錄等,系統會依此為推薦依據,提供使用者與其偏好最為相似的 推薦 ( Belkin and Croft , 1992 )。協同過濾式是透過將某個使用者的使用 歷程與其他使用者做比較,進而找出與其相似偏好的最近鄰居( nearest neighbor ),以便從最近鄰居中找出關聯性,提供系統推薦出最相近之項 目給使用者( Adomavicius and Tuzhilin , 2003 )。混合過濾式依其字面上字 義可得知為兩種或兩種以上的推薦系統混合而成,混合式可結合多種推 薦方式或演算法來彌補內容過濾式或協同過濾式不足之處。Liu and Shih ( 2005 )同樣認為混合式不但可加入不同的演算法或推薦機制,且能夠保 存內容式與過濾式的優點,依使用者需求做出調整,是一種具備高度靈 活性的推薦系統形式。 資訊推薦系統無論何種型式,核心宗旨不外乎為能提供使用者準確 率高且符合需求之推薦,如此一來不但能克服大量資訊所產生的資訊超 載問題,更能使得使用者毋須耗費心力於比較或蒐集資訊上,最後達到 協助使用者快速獲得資訊並作出正確的判斷。由此可知,推薦系統的推 薦結果優劣為評斷推薦系統品質的最重要的因素,換言之,如何使推薦 系統推薦出準確率高又符合使用者需求為本研究之重要課題,也正是本 研究欲探討的問題。 2.
(15) 從上述整理可得知,推薦系統最主要關鍵因素為如何得知使用者的 偏好以利進行推薦的程序。本研究將推薦系統應用於使用者在相機產品 挑選的議題上,由於相機產品種類繁多,使用者在購買時除了必須注意 機身或鏡頭的搭配外,有些甚至光從鏡頭的挑選就琳瑯滿目五花八門, 因此這些產品的挑選皆需要透過專業知識的諮詢,才能購買適合的相機 或鏡頭。然而,有些相機產品的規格差異不大,即便有專業人員的解說, 仍常須耗費冗長時間才能比較差異,本研究即以此問題為著眼點,若能 幫助使用者快速的先進行相似產品的篩選,便可將搜尋的比較範圍縮小, 以此節省索引的時間。在欲解決此一問題時,首先可觀察到相機或鏡頭 雖然產品繁多,但其所組成的相關元件是固定的,如光圈、焦段、畫素 等,每個產品各有不同的元件規格,而每一個產品可視為一個獨立的案 例( case ),如此逐步蒐集每個個案的規格資料,將其儲存成案例,建立 成案例資料庫。當使用者搜尋資料時,便能從案例庫中找到相似之案例, 並加以利用,這整個流程即符合案例式推理( case-based reasoning, CBR ) 的過程。案例式推理是一種知往鑑來的推理法,它最大的特色在於能利 用過去解決問題的經驗對照現今所面臨的問題,從中尋找其來龍去脈, 進而能夠找出解決問題的方法。Kaedi and Ghasem-Aghaee ( 2011 )認為案 例式推理可憑藉將知識或經驗以儲存成案例的方式,並同時應用相似度 的計算,提供多元化所衍生問題的解決辦法。 3.
(16) 1.2 研究目的 整合上述的研究背景與動機,欲改善資訊超載所帶的麻煩,可以透 過資訊推薦的方式獲得有效的解決。Haubl and Trifts ( 2000 )同樣認為資 推薦系統可以幫助使用者克服網際網路的資訊過載,並有效地提供切合 使用者需要的資訊。故此,本研究進一步考慮以案例式推理法,從蒐集 資料著手,依序進行分析使用者偏好以利案例推理的推導。本研究希望 針對使用的偏好做更深入的研究與了解,並嘗試利用案例式推理去分析 使用者的需求,將其應用於相機產品的推薦上,藉此幫助使用者解決鏡 頭或機身挑選的問題,期盼此方法能提供使用者更精確的推薦出所需之 相機產品,並相對的減少在資訊搜尋時間與成本。因此,本研究的目的 為以下幾點: 1. 提出以案例式推理法做為資訊推薦系統之篩選機制,以協助使用者在 二手拍賣市場找出較適切之相機相關產品,達到省時且便捷之目的。. 2. 設計一套輔以案例式推理法之資訊推薦系統雛形,提供使用者輸入相 關數據進行查詢,系統將找出最符合之案例,提供使用者做為挑選時 參考之依據。. 1.3 研究架構 研究架構將說明研究之主要研究內容,將其歸納為下列五個步驟, 4.
(17) 並根據章節依序說明如下圖 1-1 所示。 第一步驟為確認研究主題,探討目前研究方向現況及問題,並研擬 研究背景與動機。第二步驟將依據研究動機背景與動機做相關文獻的彙 整,蒐集整理先前各學者們所提出的觀點、研究方法等,並針對研究主 題相關之文獻詳加說明。第三步驟為蒐集案例資料、建立案例資料庫, 並著手設計案例式推理的篩選推薦機制。第四步驟為實作設計推薦系統, 並將本研究所提及的案例式推理法加入作為輔助篩選之機制。最後一個 步驟為整個研究之總結與建議,提供未來欲從事相關領域研究之參考。. 5.
(18) 確 認 研 究 主 題. 第一章. 文 獻 探 討 第二章 資訊推薦. 案例式推理. 消費者(使用者) 採購行為. 研 究 方 法 蒐 集 案 例 資 料. 篩 選 案 例 項 目. 第三章. 建立案例資料與賦予權重. 案 例 式 推 理. 系 統 實 作. 第四章. 結論與建議. 第五章. 圖 1-1 研究架構 本研究論文架構共分為五個章節,各章節主要內容概要說明如下。 第一章:簡述網際網路迅速發展後所產生的影響,依序說明研究背景與 6.
(19) 動機產生原由、研究目的以及整個研究架構。此部分之詳細說 明整理於第一章緒論。 第二章:廣泛蒐集近年來相關領域的研究文獻,針對研究中所提出的問 題和可能解決之方法進行統整與歸納,以便於深入了解其文獻 意涵、有效解決問題之方法與應用領域。本研究之文獻探討內 容包含資訊推薦、案例式推理兩部份、消費者(使用者)採購行 為。此部分之詳細說明整理於第二章文獻探討。 第三章:針對本研究推薦系統的設計方式詳加說明。本推薦系統採用案 例式推理法作為篩選過濾之機制,其程序包含蒐集案例資料、 篩選案例項目、建立案例資料與賦予權重,最後則是以使用者 情境模擬方式來進行範例分析。此部分之詳細說明整理於第三 章研究方法。 第四章:此章節將針對本研究所提出的案例式推理演算機制建構推薦系 統雛形,並詳加說明相關系統環境與系統操作流程、展示此系 統等,最後則是進行實際操作演示。此部分之詳細說明整理於 第四章資訊推薦系統設計雛形 第五章:最後依據本研究提出研究結論,以及針對未來後續研究者提出 建議與研究限制,提供未來欲從事相關研究領域時之研究者參 考。此部分之詳細說明整理於第五章結論與建議。 7.
(20) 2、 文獻探討 本章節將目前各學者所提出之相關論點加以彙整。本研究利用案例 式推理法作為資訊推薦系統的篩選機制,運用案例屬性相似度之計算, 將其運用於相機產品的推薦上,達到有效的尋找出最相似之案例以進行 推薦。因此,本研究將針對相關文獻進行探討,文獻內容分為三小節, 第一節為介紹資訊推薦之發展過程與其類型;第二節為案例式推理的說 明與應用之相關領域;第三節為消費者(使用者)採購行為之探討。依序說 明如下。. 2.1 資訊推薦 隨著網際網路的蓬勃發展,各式各樣的論壇及網站如雨後春筍般誕 生,不但使得使用者擁有豐富多元的管道來獲取資訊,也帶來資訊蒐集 的便利。雖然網際網路替使用者帶來便利檢索資訊的管道,但也同步產 生資訊超載的現象。為了有效解決此一問題,學者們提出許多不同的因 應之道,然而「資訊推薦」就是其中的解決方法之一,資訊推薦概念就 在此情況下孕育而生。其他學者也呼應資訊推薦能有效解決資訊超載所 帶來的問題,如Senecal and Nantel ( 2004 )認為當使用者接受過多網路外 部資訊時,常常使得使用者不知如何下決定,此時資訊推薦系統就扮演 重要的指引角色。資訊推薦的概念是由資訊檢索與預測理論相互結合, 8.
(21) 可用來幫助使用者面對蒐集大量資料時,篩選以及過濾的一項機制。 Rashid, Karypis, and Riedl ( 2008 ) 認為資訊推薦系統是可以在複雜的資 訊環境下幫助使用者做出決策,且系統可依據對使用者或項目的瞭解程 度不同而產生不同推薦給使用者。資訊推薦最大的特色在於,可以透過 使用者的偏好、興趣、行為或需求,在資訊眾多的可選擇區域範圍內, 推薦給使用者所需的資訊、服務或產品,藉由資訊推薦的輔助,使用者 不但能得到屬於個人化的資訊服務,更可以減少搜尋資訊成本,增加效 率。然而對於不同領域所應用的資訊推薦,其研究之核心定義也將有所 不同,但對於本研究所構想的研究主題而言,一個較為適切的定義是採 用學者 Yager ( 2003 )研究中所提出之「資訊推薦即是從大量訊息中,提 供使用者所需之資訊。可將資訊推薦視為一物件之集合,D={d1,…,dn}, D為整個資料庫之內容,di為資料庫中某筆資訊,而資訊推薦主要的功用 為將可能符合使用者需求或興趣的di推薦給使用者」。簡言之,即是從大 量資訊裡,藉由資訊推薦系統的協助,找出使用者可能感興趣資訊,進 而推薦之。 資訊推薦廣泛使用於各領域上,尤其以應用於電子商務領域最為活 躍。面對變化莫測的環境及無遠弗屆的網際網路,不論是業者或消費者 都必須即時做出適當的調整和反應。電子商務領域最須克服的難題就是 產品生命週期短,因此資訊推薦系統如何幫助業者在極短時間內創造出 9.
(22) 最大的商機,正是考驗資訊推薦系統是否良好的準則。Schafer, Konstan, and Riedl ( 2000 )認為資訊推薦系統在電子商務上佔有舉足輕重的角色, 原因在於系統透過記錄使用者對於偏好產品的知識,引導使用者做出更 有效的購買決策,除此之外電子商務領域的資訊推薦系統還擁有三種特 性(1)將瀏覽者轉變成購買者( browsers into buyers )、(2)增加交叉銷售的機 會( cross-sell )、(3)建立顧客忠誠度( loyalty )( Schafer et al., 2000)。黃如慧 ( 2004 )指出電子商務處在瞬息萬變的環境之中,一套優良的資訊推薦系 統能替使用者找出目標客群,協助制訂行銷策略,進而達到最佳效益。 合適的資訊推薦系統不但能替企業帶來正面的效益更能夠帶來收益的增 加,而已有不少成功資訊推薦系統的應用,如世界最大的網路書店 -Amazon(亞馬遜)、全球最大的拍賣市集ebay等,都是知名的成功案例。 將目前的資訊推薦系統從技術以及類型上來劃分,主要可分成三種 型式,分別為內容過濾式、協同過濾式、混合過濾式,以下將分別詳述 其定義、限制及其應用。. 2.1.1 內容過濾式 ( content-based filtering, CBF ) 內容過濾式主要是透過資料分析找出使用者喜好與項目內容之間的 關係,進一步判斷那些資料可能為使用者所需之內容。此方法使用前必 須先建立使用者輪廓( profiling information ),而使用者輪廓是由一些關鍵 字詞或者是相關文件所組成,方便於系統篩選出符合關鍵字詞或關鍵語 10.
(23) 意之資料,以供為使用者進行推薦。為了能夠提高準確率,內容過濾式 將每個物件的屬性視為不同,系統則利用各自的屬性差異來表示彼此相 似的程度。內容過濾式將使用者的歷程記錄做為推薦之基礎,由於每個 人的喜好不盡相同,各有各的特性,因此系統能推薦屬於每個人個別之 偏好,此一特性將使得內容過濾式的推薦系統更具有個人化之特色。除 此之外內容過濾式也存在許多的條件限制。以下則為內容過濾式的優缺 點整理( Shardanand and Maes, 1995;Cheung, Tsui, and Liu, 2004; Adomavicius and Tuzhilin, 2005 )。 1. 優點 (1) 依據使用者興趣、偏好或是過去曾經使用過的紀錄來進行項目的 篩選推薦程序,相較於協同合作式的推薦方式,對於項目推薦結 果的解釋能力較為合情合理,結果也較能讓人接受。 (2) 不但能同時解決協同合作式所面臨的稀疏性( sparsity problem )與 擴展性( scalability problem )的問題,而且推薦之正確率也較協同合 作式來的高。 2. 缺點 (1) 內容過濾式為內容導向的推薦機制,內容必須是能被機器判讀或 是經由人工方式分析來建立其屬性,其他如聲音、影像、圖片等 多媒體資訊內容即無法透過系統做自動化分析及推薦的動作。換 11.
(24) 言之,難以靠機器判讀的內容,便需要更複雜的處理程序。 (2) 內容過濾式憑藉著使用者過去的歷史偏好與目標項目找出其關聯 性,利用此關聯性對使用者進行推薦,在此同時可能也容易忽略 可能存在的潛在偏好,造成過度特定化的現象。 (3) 內容過濾式無法篩選相同項目間的品質、風格及觀點。若以文章 為例,當系統面對兩篇題目相同,內容品質不一的文章,內容過 濾式法便無法分辨其優劣,造成推薦效果不佳的情況。 (4) 項目內容的特徵(feature)選取,將攸關推薦品質的優劣。. 內容過濾式類型的資訊推薦系統廣泛應用於各領域之中,若以內容 過濾式資訊推薦應用於實務上來探討,像是以內容過濾式為篩選機制的 推薦系統,如Chen, Hu, Kuo, and Liang ( 2010 )將內容過濾式推薦應用於 行動電話的選購上,建立一套Personalized recommendation系統,此系統 以網頁形式呈現,應用層次處理法結合行動電話的比較與評價給予顧客 推薦。Lee, Hu, Cheng, and Hsieh ( 2012 )從Amazon.com蒐集資料,並使用 成本敏感的正範例學習法(cost-sensitive learning-based positive example leaning,COLPEL)輔助內容過濾式了解消費者沒有興趣的商品可能為何, 如此一來將可避免推薦出消費者不感興趣之產品。從上述文獻顯示出一 種現象,此現象為內容過濾式型態的資訊推薦系統,為增加其推薦效果, 12.
(25) 尚須結合一種演算法來做為過濾或篩選的機制,如此一來才能使得系統 推薦品質提高,因此也意味著如要使用該類型之資訊推薦系統,有其必 要再利用合適的演算法進行輔助的動作。也有學者利用內容過濾式來探 討某一現象發生之關鍵因素可能為何,如Blanco-Fernandez, Lopez-Nores, Gil-Solla, Ramos-Cabrer, and Pazos-Arias ( 2011 )曾使用內容過濾式的推 薦來探討擴散激發理論的協同效應。Li et al. ( 2012 )利用內容過濾式推薦 來探討線上社群團體構成的關鍵因子為何,進而提出改善的方針。從上 述文獻可得知內容式過濾不但能提供使用者推薦解決問題的辦法更能夠 替使用者找出問題可能的癥結點。其他內容過濾式的應用,如Kim, Kim, and Cho ( 2008 )認為P2P ( peer-to-peer ) 的網路環境下提供多元的多媒體 資訊,複雜且容易造成資訊超載的現象,為了提供使用者正確的訊息, 必須設計一套以使用者為導向的內容式推薦系統,以便能夠兼顧品質以 及效率。Mooney and Roy(2000)設計一套以推薦書籍為核心的內容推 薦系統,它利用使用者資訊與所選書本之間的關聯為推測基礎,希望它 能準確預測使用者的喜好,並將其可能喜歡的書本依照興趣依序排列。. 2.1.2 協同過濾式 協同過濾式推薦是目前較為廣泛的推薦技術,此方法是依據使用者 之間對項目的偏好程度來進行相似度的分群,例如具有共同興趣、背景 或經驗的使用者,形成所謂社群(community)的概念,進而分析社群成 13.
(26) 員的偏好,利用群體的觀點來產生最相似偏好鄰居的推薦項目給特定族 群的使用者。此方法與內容過濾式推薦最大的不同點在於不需分析使用 者偏好的項目內容,只需找出具有一定相似程度偏好的使用者即可進行 分析、推薦。簡言之,協同過濾式主要概念,為相同偏好的群體成員對 於同樣一件事物容易產生高度的認同感,因此經由行為模式相似的使用 者間找出其共同的關聯性,並透過計算彼此間的關聯程度,即有極大機 會提供興趣相似的使用者感興趣的資訊。Sarwar, Karypis, Konstan, and Riedl (2000)指出協同過濾式的運作程序分為三個步驟:(1)輸入資料表式 ( representation of input data )、(2)建立使用鄰居( neighborhood formation )、 (3)推薦資訊的產生 ( recommendation generation ) 。協同過濾式必須歸納 出與使用者最為相似的使用者,進而產生最近鄰居,才能進行後續推薦 的程序。 協同過濾式不需分析項目內容,系統根據與使用者有著共同志趣的 社群成員購買過的產品或瀏覽過的資訊做為推薦的參考依據。雖然協同 過濾式能夠發掘潛在的需求,但協同過濾式的推薦也有諸多限制。以下 為協同過濾式優缺點的整理( Balabanovic and Shoham, 1997;Herlocker, Konstan, Borchers, and Riedl, 1999;Sarwar et al., 2000;Middleton, Shadbolt, and De-Roure, 2004;Yang, Wang, and You, 2004;Adomavicius and Tuzhilin, 2005)。 14.
(27) 1. 優點 (1) 彌補內容過濾式推薦的限制:有別於內容過濾式的侷限,協同過 濾式推薦可發掘使用者可能存在的潛在需求,推薦超出預期內的 產品項目。 (2) 群體經驗:可藉由群體( group )的概念,利用其他使用者的經驗、 使用紀錄或曾經評價過的項目,對於評價較高的項目對使用者進 行推薦。 (3) 無須分析內容項目的屬性:不必像內容過濾式耗費時間分析項目 的屬性,協同過濾式的推薦方式是依據與目標使用者具有相同偏 好之群體來進行推薦的程序。 2. 缺點 (1) 稀疏性問題 ( sparsity problem ):通常使用者所接觸的商品往往只 是該廠商眾多商品的其中一項,如果使用者瀏覽或涉及的品項過 少,則會造成使用者資料矩陣過於發散或稀疏,系統在進行推薦 時,便無法找出合適的項目推薦給使用者,造成推薦品質之成效 不如預期。例如電子商務界的龍頭Amazon網路書店,其商品之品 項成千上萬,大多數的消費者無法瀏覽所有商品或逐一進行評比 等步驟,當使用者購買同一商品或相似產品過少時,推薦系統將 難以找出偏好相似使用者之資料來協助推薦或篩選項目。 15.
(28) (2) 擴充性問題 ( scalability problem ):絕大多數的協同過濾式推薦系 統採用最近鄰居演算法來計算相似度,該演算法的計算複雜度將 直接影響電腦的運算能力,通常與項目數量多寡成等比平方,因 此當資料量或使用者人數日益增加時,將會對系統造成龐大的負 擔,進而影響系統推薦的成效,此一現象稱為擴充性問題。 (3) 同義問題 ( synonymy problem ):亦即一字多義的問題,同樣的一 個字詞,不同的排列組合會產生不同的解釋效果。如項目的標題 不同,但其內容卻是相同的狀況之下,系統將無法有效的判斷出 差異,容易造成錯誤的推薦。換言之,如果文章名稱雷同,內容 卻大相徑庭,系統則會判斷兩者是相似的,如此一來將大幅降低 系統的推薦品質。 (4) 首次評估問題 ( first-rater problem ):又可稱為new item problem。 當有新品項上市時,使用者未能即時得知訊息,因此尚未對該新 品做出購買、瀏覽或進一步評比的動作,在此時間上所產生的空 窗期,稱為首次評估問題。 (5) 冷啟始問題 ( cold-start problem ):又可稱為new user problem。推 薦系統欲進行推薦的程序,必須要有使用者的相關資料作為推薦 的根據。如果該使用者為初次使用,他與其他使用者並無任何交 集,系統即無法找出該使用者的最相近鄰居,也就因此無法做出 16.
(29) 推薦;即便立即讓初次使用者進行評比的動作,它所產生的推薦 結果也未必是有用的。協同過濾式推薦系統著重使用者評比的數 量,因為累積一定的數量,推薦的結果才有其意義。 協同過濾式推薦為目前較受歡迎且成功的推薦系統型態,並同時被 許多學者採納應用於各領域中。以下為協同過濾式推薦系統的應用整理。 學者將其應用於資料探勘領域,如 Lai and Liu( 2009 )曾建立一套協同推 薦的機制,藉此縮短資料採礦的流程,以便於能夠快速的協助使用者篩 選過濾出所需的檔案。藉由協同過濾式的輔助,使得原本冗長繁複的資 料探勘程序得以縮減並同時增加效率,這對於未來資料探勘的發展將是 一大突破。而協同過濾式的推薦應用於電子商務領域之中,如 Cho and Kim ( 2004 ) 將協同過濾式的方法應用於電子商務中,結合資料探勘技術 對產品進行分類的動作。Lee, Kim, and Cho ( 2003 ) 建立一套適用於網際 網路環境的協同式推薦系統,目的在於自動推薦出高品質及符合興趣的 訊息給使用者。協同過濾式有效的分類及提高推薦品質,不但能協助提 升效率節省成本,更能進一步增加其獲利,創造出雙贏的結果,協同過 濾式推薦系統在此過程中扮演舉足輕重的角色。協同過式也能協助發掘 使用者的潛在需求,如 Liu, Lai, and Chiu ( 2011 )曾結合序列排序法,並 以協同推薦的方式整合過去的文獻,預測使用者的需求予以推薦。Shih and Liu ( 2008 )針對顧客的經濟價值與顧客需求,希望透過協同過濾法的 17.
(30) 輔助,找出最佳的產品推薦效果。發掘潛在使用者的需求,對於業者而 言是相當重要的行銷手法,這不僅僅意謂可增加額外的獲利更能夠減少 庫存的壓力,對於企業永續經營的長久之計都是有所助益的,如此一來 更加突顯發掘潛在需求的重要性。其他領域方面的應用,如 Kwon, Cho, and Park ( 2009 ) 利用協同式的推薦方法來探討最近鄰居選擇的多元維 度信任模型。. 2.1.3 混合過濾式 內容過濾式的優點在於推薦之準確度比協同式高且能同時解決稀少 性與擴充性的問題,但仍存許多缺點,而協同過濾式雖然彌補內容式的 缺失,也仍待克服稀少性與擴充性的問題。然而兩種推薦方式卻共同存 在同義詞問題,系統無法判別同義詞之關聯,將使得潛在需求無法被發 掘。有鑒於此,專家學者希望擷取兩者的優點,有效的搭配不同的推薦 方式才能使得推薦效果提高,藉由截長補短達到互補的效果,在此情況 下混合式推薦法因此孕育而生。混合式的優點:(1)結合內容過濾式與協 同式的特性,可彌補單一方式的缺點(2)能加入不同演算法,藉此提升推 薦系統的品質與效率。混合式的推薦系統主要可以分為四大類型 ( Adomavicius and Tuzhilin, 2005 ):(1)同時結合內容過濾式與協同過濾式 的推薦型態(2)以協同過濾式為主架構加入內容過濾式特色輔助(3)以內容 過濾式為主架構加入協同過濾的特色輔助(4)建造單一聯合推薦模型的形 18.
(31) 式。目前電子商務領域以Amazon.com 自行開發的協同過濾的混合式系統 最為人所稱道,它不但結合Item-to-Item的演算法,也同時克服擴充性問 題。Amazon從後端資料庫,分析顧客的消費行為下手,如交易紀錄、顧 客對產品的滿意程度等,抽絲剝繭消費者可能對於哪些類型產品感興趣, 將此預測結果提供給系統做出相對應的行銷安排。有效的配合使用多種 推薦方式才能使推薦的效果提高,有許多學者已經在做這方面的研究, 如將混合式用來協助分析與判斷上,Wang and Wang ( 2005 )也利用混合 式系統分析鋼鐵業設備故障的原因,減低設備在運轉時發生故障的機率, 藉此讓生產線達到無縫接軌的目標。Albadvi and Shahbazi ( 2009 ) 將混合 式系統應用於分析產品屬性該如何劃分上,它藉由追蹤顧客的購買行為 及曾經購買的歷史紀錄,用來輔助發掘顧客無限的或未知的慾望,將其 結果提供線上零售商店業者,幫助業者增加營收。 在網際網路與行動3G產品相關的應用上,如Liu and Liou ( 2011 )在 3G ( third generation )行動裝置萌芽初期,從電視、目錄、網站等管道了 解消費者對於3G行動裝置的看法,最後利用混合式的研究方法分析消費 者未來對於3G 行動裝置可能的消費行為。 Campos, Fernandez-Luna, Huete, and Rueda-Morales ( 2010 )結合內容過濾與協同過濾特性的混合式 推薦系統,將其應用於貝氏網路( bayesian networks )的環境底下,用以探 討電影鏡頭( movie-Lens )與網際網路電影資料庫( IMDB data )彼此的關 19.
(32) 聯。 也有學者將混合式過濾法應用於開發系統或軟體設計上,如Linden, Smith, and York ( 2003 )曾推薦 Amazon.com的混合式推薦系統,該系統 於運用顧客與書籍之間的關聯,從顧客對於書籍的滿意度、購買人數、 交易紀錄等資料找出關聯性,用此關聯來預測顧客下次購買的商品。 Jadhav and Sonar ( 2011 )應用混合式的知識概念,將擁有時效性的軟體產 品設計一套評價與選擇的制度。 經由上述文獻探討所彙整出各種推薦系統研究之定義與應用領域, 下表2-1將列舉近年來各學者所發展或研究之推薦系統的研究資料統整與 歸納。 表2-1 資訊推薦系統相關領域之比較 學者(年代). 系統名稱. 推薦類型. 推薦方法. Lang ( 1995 ). NewsWeeder. 內容過濾式. 依照使用者資料輪廓檔 (profile) 來 推 薦 使 用 者 尚未閱讀過並可能感興 趣之文章。. Krulwich and. InfoFinder. 內容過濾式. 透過訊息資料集(sets of. Burkey ( 1996) messages)或是其他線上 文件,預測使用者的喜 20.
(33) 好類別。. Lawrence,. SmartPad. 內容過濾式. Almasi,. 將每位使用者對產品偏 好與產品項目間的相似. Kotlyar, Viveros, and. 度做為個人化之推薦清. Duri ( 2001 ). 單。. 周寬怡( 2003 ). InfoScope. 內容過濾式. 加入觀察使用者的行 為,如閱讀所花費之時 間、存取哪些文章等, 以作為推論使用者喜好 的依據。. Chen et al.. Personalized. ( 2010 ). recommendation. 內容過濾式. 應用層次處理法結合使 用者對於行動電話評價 給予顧客推薦。. Resnick,. GroupLens. 協同過濾式. Iacovou,. 根據使用者過去對文章 評分的歷史紀錄,來預. Suchak, Bergstrom, and. 測使用者尚未閱讀過的. Riedl ( 1994 ). 文章之評分,藉此減少. 21.
(34) 失敗的推薦。 Rucker. Siteseer. 協同過濾式. and. 系統利用使用者加入之 電子書籤( bookmark )判. Polanco 別喜好,進而進行分. ( 1997 ). 類,以對同一群體之使 用者進行相關資訊的推 薦。 Sarwar et al.,. MovieLens. 協同過濾式. ( 2000 ). 藉由使用者欣賞過的電 影評分分數資料來建立 使用者資料輪廓檔 (profile) 。. Perugini,. PHOAKS. 協同過濾式. Concalves, and. 藉由文章裡URL的推薦 量多寡,判別是否為優. Fox ( 2004 ) 良URL。 Mock. INFOS. 混合式. and. 系統要求使用者閱讀文 章後給予的回饋評比,. Vemuri 依此根據作為推薦之準. ( 1997 ). 則。 Balabanovic. Feb. 混合式 22. 使用者填寫網頁的評比.
(35) and. 通知,資料將回傳給選. Shoham. 擇代理人(server)更新資. ( 1997 ) 料,接著再傳送給蒐集 代理人(client)同步更新 資料,分析該類型網頁 之同好為何 Wasfi (1998). ProfBuilder. 混合式. 結合內容式與協同式的 混合推薦系統,內容式 依照使用者的瀏覽網站 偏好,產生一組與使用 者喜好程度高的網站推 薦清單,協同過濾式則 是比對使用者與群體間 共同之瀏覽網站產出另 外一組清單提供給使用 者,藉由兩組不同的清 單達到互補的效果。. Claypool. Personal Tango. 混合式. and. 以相似度做為權重計算 之標準,利用此權重預. Gokhale 23.
(36) ( 1999 ). 測與實際評分結果之誤 差。. Linden et al.,. Amazon.com. 混合式. ( 2003 ). 透過使用者曾購買商品 的紀錄,分析使用者未 來可能購買的產品項 目。. 從上述資訊推薦的文獻整理可得知三種不同類型的資訊推薦特色及 其優缺點,也能讓本研究後續在選擇資訊推薦方式時,能適時彌補其短 處,並把長處發揮到極致。經過上述文獻的回顧,並重新審視及評估本 研究的資訊推薦方式。使用者依照個人需求按圖索驥輸入欲比對資料, 系統會根據使用者填入之數值依序進行項目內容的屬性分析,最後將最 為相似之屬性內容結果提供給使用者做為參考。依照上述所描繪之過程, 與內容過濾式的資訊推薦運作流程相同,兩者皆是比對使用者與項目內 容間之關聯性進而提出推薦,因此本研究採用的資訊推薦方式屬於內容 過濾式,然而從上述文獻回顧得知,為了能夠有效提升推薦品質及增加 效率,尚須找尋一套演算法作為篩選的輔助。本研究的資訊推薦需要蒐 集大量資訊,經由比對資訊的相似程度,以提供使用者最為相似之資料。 反觀案例式推理法也同為蒐集資料、比對資料、計算相似度等流程。此 24.
(37) 比對流程與案例式推理法的推導過程相同,兩者皆為從大量資料中比對 以便找到相似程度最高之資料用以進行推薦的程序,因此本研究資訊推 薦的篩選機制嘗試使用案例式推理做為輔助之演算法,以下章節將針對 案例式推理進行文獻之回顧。. 2.2 案例式推理 案例式推理( case-based reasoning, CBR )是近年來人工智慧( artificial intelligence, AI ) 領 域 中 被 重 視 的 技 術 之 一 。 案 例 式 推 理 最 早 是 以 Schank( 1982 )所提出的動態記憶( dynamic Memory )為其發展基礎。案例 式推理主要概念為擷取( retrieve )資料庫中最相似的案例,再利用( reuse ) 過去儲存於資料庫中過去曾經解決之案例,將此舊案例做為推理之基礎, 然而,隨著案例的修正( revise )與解決並套用於新問題上,藉此將案例保 留( retain )並形成新的案例( Watson, 1999 )。此外,隨著資料庫案例的增 加,並藉由參考過去的案例經驗,將有助於解決各種不同的問題,透過 案例的不斷累積將可使得此資料庫成為日趨茁壯的知識庫。 案例式推理有兩個主要的核心宗旨:一為相同的問題會不斷發生, 若能將解決方法有條理的歸納並加以整理,將有助於迅速解決問題;二 為相似的問題,其解決之道也極為類似,只要略加修改,將能迎刃而解。 案例式推理不但能提出解決問題的方法,最重要的貢獻為將解決問題的 方式儲存下來。企業經常面臨人才的流動或離職,導致員工的知識無法 25.
(38) 有效保留或是傳承,如此一來將造成企業成本提高以及許多連串的問題, 相同的情況也出現在政府機關上,為了有效解決此問題,Boury-Brisset and Tourigny( 2000 )在研究中提到,地方政府常面臨人員的調動或退休,將 使得原本推行的政策有所延宕,如能夠運用人工智慧的案例式推理法, 將過往執行政策及方式擷取並儲存,將能使得接續承辦人員更加得心應 手,亦能達到無縫接軌的目標。因此,運用案例式推理整合,有助於提 高組織管理的績效。. 2.2.1 案例式推理定義 目前專家學者們對於案例式推理的定義大略相同,如 Castro, Navarro, Sánchez, and Zurita ( 2011 )認為案例式推理是藉由相似經驗去推理未來 可能的發展情況,它是一種能夠解決問題且獲得學習的推理方式。Liu, Chen, and Hsu ( 2008 )也同樣認為案例式推理是一種解決問題的典型技術, 它使用先前的案例作為索引,提供解決新的、看不見以及各式各樣不同 問題的方法。而 Chang, Liu, and Lai ( 2008 )指出案例式推理為人工智慧領 域中,最具改善執行效率的技術之一。Ahn and Kim ( 2009 )則認為案例式 推理之所以容易使用,是因為無需複雜的規則,只需要提供過去類似的 經驗,就能找出最佳的解決方法。Ting et al. ( 2010 )指出案例式推理是由 案例來輔助規則,並可結合跨領域的系統,如搭配 GPS 系統,藉此達到 更多元化的解決方法。Xiong( 2011 )認為案例式推理基本的假設為相似的 26.
(39) 問題會有相似的解決方法,因此透過案例式推理的推導可用來解決相似 卻不同議題上。Li and Ho ( 2009 )認為利用案例式推理的特色並結合電腦 計算能力,可以用來評估複雜的金融交易議題,藉此降低風險,進而達 到靈活及務實的操作。 統整上述學者對於案例式推理的定義及觀點,可以得知案例式推理 主要是根據以往的知識經驗,從中尋找相似案例以進行推理的程序,推 理之結果可用來預測或解決未來所發生的問題。簡言之,案例式推理是 一種鑑古知今的方法,運用前人的智慧,對照比對現況,提出各種不同 的因應解決之道。. 2.2.2 案例式推理的運作流程 過去的人工智慧領域,大多使用專家系統( rule-based expert system ) 輔助使用者解決問題。但礙於專家系統有諸多限制,如難以萃取專家知 識、只能應用在單獨或特定的領域中、專家知識有所落差等。為了避免 上述問題重複發生,Watson ( 1999 )提出利用案例( case )取代規則( rule ) 的案例式推理法,藉由案例擷取、案例再利用、案例修正、案例保留(簡 稱4R)的循環,使得案例式推理系統更加擴大且準確。以下為4R個別介 紹。 1. 案例擷取( retrieve ):從案例庫中經過比對的程序,搜尋相似之案例, 取回與目前狀況最相似的案例,以供使用者新案例的解決方案。 27.
(40) 2. 案例再利用( reuse ) :過去曾解決問題所使用的資料會回存於案例庫 中,案例的再使用即是嘗試從案例庫中,尋找過去相似問題的解決方 式,用以提供使用者作為新案例的解決之道,隨著案例數目的增加, 可以讓解決問題的方法更加多元。 3. 案例修正( revise ) :由於新舊案例之間並非完全相同,對於新案例問 題的解答方式並不一定合適,因此為了符合使用者的需求,必須根據 新案例之問題重新檢視並定義,修正過去案例的解決方法,以提供符 合使用者實際之解決方法。 4. 案例保留( retain ) :案例保留即是將新問題、修正後的解決方式以及 結果儲存進案例庫中,將它成為案例庫中的案例,用來提供往後推理 使用,隨著案例庫中案例的增加,進一步能增加解決問題的能力及更 佳的決策基礎。. 2.2.3 案例式推理的優缺點 整理各學者對於案例式推理優缺點如下。( Barletta , 1991 ; Fritz , 1993 ; Copeland, Koller, and Murrin, 1994 ; Mehdi and Owrang , 1998 ; 楊 振興,2002 ) 1. 優點: (1) 增加處理事情效率:經由過去成功的案例,有效解決所面臨的新 問題,透過經驗的累積及學習,不但可以有效提升解決問題的品 28.
(41) 質,更可以增進處理事情的能力,克服人類記憶思考的限制。 (2) 突破過往的窠臼:案例式推理不需複雜的規則定義,建構以人類 思考邏輯為基礎,推理過程富有彈性,客觀且準確。 (3) 減少知識萃取的困難度:案例式推理僅需儲存舊有的案例及解決 的方法,不必從專家知識萃取規則。案例相較於規則容易取得, 能有效降低知識擷取的門檻。 (4) 案例庫容易被接受與理解:推理結果為案例形式,使用者容易接 受與了解,推理結果為多個建議案例,提供多元的選擇。系統會 根據新問題與案例的相似度,輸出適用且正確的案例以供使用者 參考。 (5) 案例庫累積知識的能力:隨著案例陸續加入案例庫,不斷的累積 知識,將使得案例庫的覆蓋庫逐漸提高,間接提高系統的學習能 力。新增之案例不需增加規則,也不必複雜的判讀,無形中更可 增加案例庫的擴充能力。 (6) 有效整合新舊知識:無論是新舊案例,每一個案例都是獨立儲存 於案例庫中,案例的讀取或寫入,都不會影響現有的案例庫資料, 此一特性將使得案例庫容易維護。 (7) 多元的案例存取機制:案例式推理有別於專家系統只記憶成功經 驗,案例庫能夠記錄所有成功與失敗的案例經驗,促進知識的累 29.
(42) 積。 2. 缺點 (1) 有鑑於案例庫資料的不斷增加,需要擴充記憶體的容量及增強計 算能力。 (2) 如案例庫資料過於龐大時,案例進行比對需耗費冗長的時間,使 得執行效率降低。 (3) 有別於專家系統的規則化,案例的判讀過程依賴過去的經驗或舊 案例,因此經驗與案例的品質將攸關推理的品質。 (4) 案例比對時,需要具有代表性與分配均勻的案例,以提升輸出結 果的準確度。 (5) 案例的改編需透過人工方式來進行修正,因此耗費許多人力與時 間。 (6) 由於輸出結果的解決方式較為制式,因此不易說明其推理結果。. 2.2.4 案例式推理的實務應用 許多學者將案例式推理應用於實務上,如Chang et al. ( 2008 )將案例 式推理應用於印刷電路板的產業,用來預測未來的銷售趨勢,藉此可以 針對行銷策略進行調整。Tseng, Chang, and Chang ( 2005 )則利用案例式推 理來推測關鍵多數的客制化產品型態,用來協助研發部門研發新產品, 以利企業提供差異化之產品。 30.
(43) 應用於天然災害的防治上,如龔旭陽等人( 2004 )將降雨量與土石流 災害因子結合案例式推理系統,用來加強災情的分析及預測,建立準確 又客觀的土石流預警機制。許家成與蔡博文( 2007 )有鑑於颱風路徑多樣 的變化以及複雜的程序,希望經由案例式推理結合地理資訊系統,將其 應用颱風路徑的預測上,透過颱風路徑知識庫快速推導出颱風可能行進 的路徑,協助相關人員預先警示颱風可能帶來的災害。林峰田與李佳昀 ( 2000 )蒐集歷年來的地震防救災相關研究報告,將每一個研究報告做為 一個案例,建置一套地震防救災文獻案例式查詢系統,希望透過此套系 統評估未來都市救災的可行性。 應用在產品開發的層面,如楊逸仁等人( 2010 )建構案例式推理系統, 應用模具設計概念並推行至射出模具產業上,如此一來將可有效減少產 品開發的週期,達成真正有效且快速開發符合顧客需求的產品。何正得 與朱科銘( 2007 )將案例式推理應用於新產品的開發上,透過案例式推理 系統取得最接近目標產品的歷史設計,進而縮短新產品開發時間,達到 產品快速開發的目的。 應用於醫療照護相關領域,如張偉斌等人( 2006 )以乳癌病患資料為 基礎,根據病理症狀之嚴重程度給予不同分數,再藉由案例式推理機制 計算由使用者輸入案例與存放案例庫中既有案例的相似性,由既有之案 例推衍現今病患之狀況,將有利醫療人員及早做出正確的醫療診斷。苑 31.
(44) 守慈等人( 2008 )將案例式推理應用於老人居家照護上,利用案例式推理 推導出老人的生活習慣,針對老人的情緒狀態找出起伏的因素,將可以 進一步解決老人生活上所遭遇的難題,藉此達成提升老人生活品質。 其他方面的應用,如Tsai and Chiu ( 2007 ) 運用案例式推理於印刷電 路板的製程上,透過案例推導出正確的製程參數,降低冗長的生產流程 時間,提高生產效率。Li and Sun( 2008 )以案例式推理搭配財務報表的方 式,用來預測風險的高低並將其排序,提供使用者判斷的根據。Yang and Wang ( 2008 )將案例式推理結合遺傳演算法應用於資料探勘上,兩種方法 的配合,不但可以縮短14%的計算時間還能維持90%的準確率,將可一併 達到省時又兼顧品質的目的。 從上述文獻可得知,案例式推理能廣泛應用在各行各業中,只要善 加利用其特性,即能得到有效的協助。案例式推理在其應用過程中,皆 是扮演一個輔助的角色,藉由蒐集大量的資料,進而從中尋找使用者所 需之資訊,以便達成所設定之目標。然而,從相關文獻發現過去研究者 較少採用虛擬社群資料當成案例式推理的運作模式。本研究嘗試藉由蒐 集虛擬社群成員在論壇討論之內容,以案例式推理方式來推導其脈絡, 並希望能協助使用者快速且便利的搜尋到相符合之產品。 此外,從上述可得知,案例式推理是以案例為基礎,用以對照現今 所面臨之問題,從中找到最相似解決的方法。本研究將以攝影虛擬社群 32.
(45) 的買賣中心資料當成我們參考的案例,藉由分析不同使用者的搭配方式 並計算其相似度,進一步地對使用者進行推薦。為了使得本推薦系統之 設計更貼近使用者,因此後續將對消費者(使用者)採購行為進行探討。. 2.3 消費者(使用者)採購行為 為了有效提升資訊推薦系統之推薦品質,本研究試圖從使用者的角 度來解析其採購行為之心態或想法,進而了解使用者採購決策之過程, 如此一來不但能幫助資訊推薦系統之開發及設計,也能使得本資訊推薦 系統之推薦結果更貼近使用者或消費者的偏好。 Schiffman and Kanuk( 1991 )認為消費者採購行為是消費者為了滿足 需求,對有關產品、服務的尋求,因而產生後續購買、使用、評價和處 置等行為。學者Engel, Kollat, and Blackwell (1982)認為消費者的採購或購 買 行 為 是 透 過 一 連 串 的 決 策 過 程 來 完 成 , 因 此 他 提 出 EKB (Engel-Kollat-Blackwell model)消費者行為模型,來說明消費者一連串的 決策歷程與其可能影響之因素。在EKB 模型中,Engel et al.( 1982 )將消 費者購買決策共分為五個階段,依序說明如下: 1. 需求確認( need recognition ):當消費者的理想狀態與現實狀態有差距 時,就會產生相對應之需求,產生之需求可能是由於外部或內部刺激 所引起。需求可能來自於消費者本身,例如生理需求,亦或是來自於 外在的刺激,如大眾傳播的廣告,廣告刺激消費者的注意,進而誘發 33.
(46) 消費者需求之動機 2. 資訊搜尋(search):當消費者在需求確認後,便會開始著手尋求解決 問題的相關動作,此行為稱之為資訊搜尋。資訊搜尋可以分為兩種: 內部搜尋與外部搜尋。內部搜尋是消費者從個人先前的經驗或知識進 行搜尋,當內部搜尋無法找到解決問題之方法,消費者則會轉向外部 搜尋。外部搜尋亦有兩種方式,分別是非行銷來源與行銷人員所提供 之資訊。而在外部搜尋階段,應特別注意消費者資訊超載的問題。資 訊超載是指消費者接收太多資訊,以致一時之間無法處理資訊。此時 若能適當幫助消費者做資訊的篩選,就可以有效解決消費者資訊超載 的問題。 3. 方案評估( alternative evaluation ):當消費者搜尋足夠之資訊,即會開 始針對可選擇之方案進行評估,進而做出購買或採購之決策。簡言之, 即是對可行方案進行可行性的分析。使用者評估之準則可能會隨購買 動機或外界環境影響而有所不同,如參考群體不同,情境之差異與涉 入程度不同等因素。然而在選擇方案時,消費者通常會採取一些措施 來減少選擇方案時之困難度,如減少選擇方案數目等。倘若能適當減 少非消費者偏好之項目,降低評估時的困難度,減少資訊超載的情況, 將有助於消費者從選擇方案中找出符合需求之方案。 4. 購買( purchase ):當消費者評估各種可能選擇方案的優劣後,消費者 34.
(47) 就依據評估之結果進行採購或購買行為。此時如果消費者對某一產品 或品牌印象較佳時,他購買該產品或品牌的機率也將隨之增加,但消 費者可能還會受到一些不可預期的因素導致不同的購買或採購結 果。 5. 購買結果( outcomes ):是指消費者購買或採購後的一連串作為,消費 者會產生滿意或不滿意的情形。當消費者預想狀態與實際狀態相符時, 將會使得消費者產生滿足感,並將此結果轉換成經驗,此次經驗將影 響往後購買之決策;反之則為不滿意,此時消費會對自己的決策感到 懷疑,產生所謂購後失調的情況,進而去尋求新的資訊或情報來減少 失調的情形,亦或是在下次購買或採購時嘗試另外一種選擇方案。 雖然在文獻回顧中較少發現針對相機產品採購行為進行深入探討之 研究,但透過探討多數消費者的採購行為,有助於了解消費者的心態或 想法。從上述文獻可得知消費者或使用者在引發購買動機後,便會開始 著手進行蒐集相關資訊,但礙於搜尋資訊時容易因大量資訊產生資訊超 載的情況,這與本研究中消費者面對琳瑯滿目的相機產品之研究背景相 同,皆須尋找一種機制來過濾篩選大量的資訊,此時資訊推薦系統即扮 演重要的角色。可將消費者購買決策之方案評估視為資訊推薦系統的推 薦結果,使用者從資訊推薦結果中挑選自己適合之偏好內容,進而產生 後續的購買行為,如使用者滿意藉由推薦結果產生的購買行為,將提高 35.
(48) 消費者對於資訊推薦系統的滿意度,這也意味著資訊推薦系統能夠推薦 出符合消費者偏好之產品;反之,則為不滿意推薦之結果,以致於對資 訊推薦系統產生不信任感。Kalakota and Whinston ( 1996 )認為採購者在面 對不熟悉或購買價值高的採買決策時,會希望能在獲得完整的資訊前提 下,做出合理且理智的選擇。而Resnick( 1997 )也指出在資訊氾濫的環境 中,面臨如何有效提供使用者所需資訊之窘境,而推薦系統正是可以透 過一對一的引導,提供符合使用者需要的個人化解決方案。從上述文獻 可得知,資訊推薦系統擁有能依照採購者個人需求對其提供個人化推薦 之特性,因此系統如何推薦出符合採購者需求之相機相關產品,將是本 系統設計開發之核心議題。. 36.
(49) 3、 研究方法 本研究以案例式推理法進行相機產品資訊推薦,其主要的核心概念 為使用者透過此套資訊推薦系統的協助,能夠快速從案例庫中尋找出與 本身需求契合度最高之相機產品。為了能夠精準且有效的做出推薦,本 研究採用案例式推理法作為推薦系統的篩選機制,運用相似度的比對法 則,判斷出最為相似之案例,提供給使用者做為參考。然而,欲進行案 例式推理必須有前置的作業程序,如案例的蒐集、案例庫的建立等,在 本章節將針對研究方法做完整的說明,最後則是以模擬使用者角度來進 行案例式推理整個比對與推薦之流程。. 3.1 研究流程 本文的研究流程主要分為兩個階段,第一階段為資料蒐集,由於案 例式推理必須仰賴舊案例的輔助,因此必須先蒐集相關案例資訊,將其 建立成案例庫形式,以便於未來的推薦程序。此階段包含蒐集案例資料、 篩選案例項目、建立資料案例與賦予權重。第二階段則為案例式推理, 主要為新舊案例相似度比對,進而能從案例資料庫篩選相似度最高之案 例以進行推薦。研究流程之整理如圖 3-1 所示。. 37.
(50) 一、資料蒐集. 二、案例式推理. 蒐集案例資料 相似度分析 篩選案例項目 模擬情境 建立資料案例與賦予權重. 圖 3-1 研究流程圖. 3.2 資料蒐集 3.2.1 蒐集案例資料 本研究以知名虛擬社群攝影討論論壇數位視野( DCView )、攝影家手 札來進行資料的蒐集。在國內眾多的攝影論壇中,分別以數位視 野 ( DCView )、攝影家手札兩大論壇較具代表性。其中,攝影家手札的總瀏 覽人數已高達 1 億 5 千多萬人,攝影器材買賣中心討論之文章累積超過 6180. 則 ( 資 料 來 源 : 2012. 年. 攝 影 家 手 札 論 壇. http://www.photosharp.com.tw )。數位視野的註冊會員人數則多達 75 萬人, 二手交易中心討論之文章也累積超過 2000 則( 資料來源:2012 年 數位 視野論壇 http://www.dcview.com/ )。由上述數據可顯示兩個論壇在攝影 同好中占有舉足輕重的地位,足以作為攝影領域的代表性論壇。不論是 38.
(51) 社群規模或是各種攝影相關的資訊量,都是台灣攝影虛擬社群領域中首 屈一指的地位。因此,數位視野( DCView )及攝影家手札的攝影器材買賣 論壇相當適合作為本研究資料蒐集之樣本案例。 本研究各別從數位視野、攝影家手札的攝影器材買賣論壇中蒐集資 料,依照討論文章總數之比例 6:2 ( 攝影家手札:數位視野 )分別擷取 375 筆及 125 筆,合計 500 筆,此資料將作為本研究中資料庫的案例。資 料中如有同一帳號買家或賣家重複張貼相同資訊,本研究將它視為同一 筆,倘若有不同買家或賣家刊登相同之商品則不在此限。本研究採用分 層抽樣,再依照兩個論壇資料比例採取便利抽樣法,直到蒐集數量達到 預先設定之數量。資料蒐集時間於民國 101 年 3 月 10 日至民國 100 年 3 月 30 日,為期 20 天,其抽樣過程特舉範例一來詳加說明,其解說如下。 範例ㄧ:虛擬社群論壇-數位視野 → 討論區 → 二手專區 步驟一: 「數位視野」論壇將討論區分為「作品發表區」、「達人部落」、「相 機專區」…、 「二手專區」等 11 個討論群組,本研究針對買賣交易有關 之「二手專區」討論群組來抽取資料。如圖 3-2 所示。. 39.
(52) 圖 3-2 數位視野論壇討論區 11 種討論群組 資料來源( http://www.dcview.com/ ) 步驟二: 進入「二手專區」的討論區後,即可看到該討論區之文章版面,如 圖 3-3 所示,每一篇討論文章均有標題、刊登人等資訊。. 圖 3-3 數位視野論壇 二手專區 資料來源(http://www.dcview.com/) 40.
(53) 步驟三: 從「二手專區」群組所顯示之頁面依序點選文章,逐步抽取每篇文 章資料,討論區之文章排序方式依發表時間早晚為標準,新刊登之文章 置頂顯示,但如遭遇資料不完全、資訊提供不完整等狀況,則放棄該筆 資料,依此類推。扣除資料不全及非相機內容之文章,直到抽取筆數達 預期目標 500 筆為止,攝影家手札及數位視野分別抽取 375 筆及 125 筆。 如圖 3-4 所示。然而,另一論壇攝影家手札之資料抽樣方式也與數位視野 相同。. 圖 3-4 數位視野論壇二手專區抽樣資料 資料來源(http://www.dcview.com/) 經由上述抽樣的步驟後,即可以清楚了解本研究如何從論壇上抽取 資料,透過此模式將依序完成資料的蒐集程序,除此之外也能初步對於 資料內容有基本的認識,這對於下一節篩選案例項目將有顯著的幫助。. 41.
(54) 3.2.2 篩選案例項目 在完成資料的蒐集後,首先必須確定相機各項重要的組成元件,以 做為案例的項目。相機種類可分為三種(1)一般消費型相機( digital camera, DC ) (2)類單眼相機( electronic viewfinder interchangeable lens, EVIL ) (3) 單眼相機( digital single lens reflex, DSLR ),因此本研究將相機類型做為父 階層,其他重要的組成元件包括機身廠牌、有效畫素、光學變焦能力、 感光度範圍、鏡頭廠牌、鏡頭光圈大小、鏡頭焦段以及對焦馬達,分述 如下:機身廠牌主要將不同廠牌的相機分門別類,有 Canon、Nikon、SONY 等各大廠牌項目;有效畫素是表示相機解析度的能力,畫素與成像品質 呈正比。光學變焦倍數越大,能拍攝的景物就越遠,市面上之相機大多 具有 3 倍以上的光學變焦能力;感光度則是相機對於光線靈敏程度的表 現,攝影時如使用較高的感光度,照片的成像品質則較差(顆粒越粗),反 之,感光度低相片品質則較佳。鏡頭廠牌項目將鏡頭依照不同廠牌劃分, 如 Sigma、Tokina 等。使用者在攝影時,為彌補場地光線不足所帶來的困 擾,往往需要大光圈鏡頭的協助,但多數鏡頭依其功能的差異在不同焦 段時所支援的光圈略有不同,因此將此項目分為最短以及最長焦段所能 支援的最大光圈值,然而為何只探討最大光圈而不探討最小光圈,最主 要是因為以目前技術仍無法克服提高 ISO 所產生的雜訊問題,因此顧及 製造技術與彌補成像效果考量等因素只討論最大光圈。鏡頭焦段長短是 42.
(55) 鏡頭所能拍攝遠近之距離,如碰到定焦鏡頭案例,最短及最長焦段皆為 一致。對焦馬達則是泛指鏡頭是否擁有對焦馬達,擁有對焦馬達之鏡頭 在攝影時對焦速度較為迅速,成像效果也較佳。此外,攝影家手札總編 輯張正杰( 2009 )也建議攝影同好挑選相機鏡頭時,必須注意的項目為光 圈大小、焦段長短、對焦馬達系統等。. 3.2.3 建立資料案例與賦予權重 經由篩選案例項目步驟後,本研究再依據攝影家手札總編輯張正杰 等人之建議挑選出九個案例項目,其中相機類別較能將相機相關產品做 出明確之區別,因此本研究將相機類別指定為父階層,接著將進一步將 案例項目賦予權重,權重是用來表示案例項目之重要程度。由案例項目 組成案例階層的形式,接著便可將從論壇擷取的資料逐一以案例方式建 立成案例資料庫,此資料庫將用來做為後續案例式推理之案例比對來源, 下圖 3-5 為案例階層架構圖。 以案例階層架構為概念,子階層僅需考量父階層為項目之節點,故 可減少搜尋所需的時間與空間。案例的建立除了必須先確定各項目的階 層關係外,同時也必須計算各階層的權重值,本研究中假設父階層權重 的重要性大於子階層權重,因此權重的計算方式為父階層與所屬之子階 層的個數之總和值,藉由權重數值的大小可得知該項目的重要性。由於 父階層是由許多子階層組成,所以父階層如果發生變動將會連帶影響到 43.
(56) 子階層,因此權重數值將攸關後續所進行案例式推理的相似度計算之結 果( Tseng et al., 2005 )。由篩選程序挑選出來的九個案例項目,每個權重 初始值之權重為 1,然而感光度範圍、鏡頭光圈、鏡頭焦段分別衍生出兩 個子階層,加上本身項目的權重 1,因此這三個案例項目變更為權重為 3, 父階層相機類別則為全部子階層加總權重之總和,最後所形成的案例階 層之總權重為父階層加上所有子階層之權重值。例如,圖 3-5 中相機類別 的屬性權重值為 15,代表父階層與所屬的 14 個子階層的屬性個數總和, 最後之總權重則為 29。如上述所敘,鏡頭光圈、鏡頭焦段及感光度範圍 階段屬性權重值皆為 3。由於鏡頭的廣角端(最近端)與望遠端(最遠端)可 支援光圈略有不同,因此權重的計算必須包括焦段最短及最長之最大光 圈數值。 同樣的,非定焦的鏡頭在焦段呈現上也有所不同,因此權重計算同 樣必須包括最長及最短焦段,若鏡頭為定焦鏡頭時,最長焦段及最短焦 段皆一致,並不會影響資料的正確性。此外,感光度範圍則是依機身不 同而有所差異,感光度最小多為 100,最大可達 6400 以上,感光度範圍 越大,相機處理影像的程序越複雜,也代表機身功能越強。從上述可得 知越上層的屬性對於相似度的判斷影響程度越大。相關案例項目之權重 整理如下圖 3-5 所示。. 44.
(57) 相機類別 (權重15) 機身廠牌 (權重1). 有效畫素 (權重1). 光學變焦 (權重1) 最小感光度 (權重1). 感光度範圍 (權重3) 最大感光度 (權重1). 鏡頭廠牌 (權重1). 鏡頭光圈 (權重3). 焦段最短之最大光圈 (權重1) 焦段最長之最大光圈 (權重1). 對焦馬達 (權重1) 最短焦段 (權重1). 鏡頭焦段 (權重3) 最長焦段 (權重1). 圖 3-5 案例階層架構圖 從上圖 3-5 階層架構圖可以得知各階層之案例項目及其權重值,接續 將介紹各案例項目內容如何設計與安排。如下表 3-1 所式。 表3-1 案例項目之內容 案例項目名稱 (權重值) 相機類別 (15). 項目內容 (數字代表在資料庫之代號) 0-N/A(無)、1-一般消費型相機、2-類單眼相機、 3-單眼相機. 45.
(58) 機身廠牌 (1). 0- N/A(無)、1-Canon、2-Nikon、3-Sony、 4-Olympus、5-Fujifilm、6-Panasonic、 7-Samsung 、 8-Casio 、 9-Pentax 、 10-Leica 、 11-Ricoh、12-Other (其他). 有效畫素 (單位:萬) (1). 3-1800~2100、4-2100 以上. 光學變焦 (1) 感光度. 0-N/A( 無 ) 、 1-1200 以 下 、 2-1200~1799 、. 0-N/A(無)、1-2 倍、2-3 倍、 3-4 倍、4- 5~12 倍、5-13~24 倍、 6-25 倍以上. 最低. (3). 0-N/A(無)、1-50、2-51~99、3-100、 4-101~199、 5 - 200. 最高. 0-N/A(無)、1-1600 以下、2-1600、3-3200、 4-6400、5-8000、6-8000 以上. 鏡頭廠牌 (1). 0-N/A(無)、1-Canon、2-Nikon、3- Sony、 4-Olympus、5- Fujifilm、6-Panasonic、 7-Samsung 、 8-Casio 、 9-Pentax 、 10-Leica 、 11-Ricoh、12-SIGMA、13-TAMROM、 14- Tokina、15 - Other (其他). 鏡頭 光圈. 廣角端(最短) 由於為一數值,因此讓 User 自行填入 最大光圈. (單位:F ) 46.
(59) (3). 望遠端(最遠) 由於為一數值,因此讓 User 自行填入 最大光圈. 對焦馬達 (1). (單位:F ) 0-N/A(無)、1-Yes、2-No. 鏡頭焦段 廣角端(最短) 由於為一數值,因此讓 User 自行填入 (3). 望遠端(最長) 由於為一數值,因此讓 User 自行填入. 項目內容的設計宗旨即為幫助使用者輸入資料後能夠進行初步的篩 選動作,以便快速進行比對的程序,此外項目內容的選項資料經過不斷 的沙盤推演,通盤的考量之下依照不同類型相機特性所設計。接下來將 逐一詳加說明案例項目內容安排想法及其巧思。 1. 相機類別:本研究將該項目內容分為 0-N/A(無) 、1-一般消費型相機、 2-類單眼相機、3-單眼相機四種類型。這是目前攝影領域中主流對於 相機類別的分類方式,三種不同的類別各自有其特色,如將不相同類 別的相機放在一起做比較,將有失公允也無從比較起,因此本研究把 最重要的父階層將其作出有效的劃分,在推理的第一步就能清楚釐清 各種不同類別之相機。 2. 機身廠牌:本研究將該項目內容分為 0-N/A(無)、1-Canon、2-Nikon、 3-Sony、4-Olympus、5-Fujifilm、6- Panasonic、7-Samsung、8-Casio、 9-Pentax、10-Leica、11- Ricoh、12- Other (其他)十三種類型。本研究 47.
(60) 將目前台灣市面上容易購買取得的相機品牌納入其中,其餘少數其他 國外品牌或客製化相機將其歸類在 12- Other (其他)中。這樣的分類方 式可以讓使用者針對喜愛品牌進行初步篩選的動作,但由於權重為 1, 因此並不會有只搜尋特定品牌相機的情況,相似度的大小還是要依整 體填入之值做為最後相似度高低的結果。 3. 有效畫素(單位:萬):本研究將該項目內容分為 0-N/A(無)、1-1200 以下、2-1200~1799、3-1800~2100、4-2101 以上五種類型。有效畫素 將攸關相機成像的品質,也是判別一台相機優劣的重要參考依據。相 機的製作技術日新月異不斷推陳出新,每個時期所推出的相機在規格 上略有差異,考量使用者不同的需求,因此設計不同選項以便於篩選 出適當的產品。選項 1 的 1200 萬畫素是針對較為早期的相機所設計, 選項 2 的 1200~1799 萬畫素大多為近期一般型消費型相機、初階的類 單眼、初階的單眼相機的規格,選項 3 的 1800~2100 萬畫素則多為中 高階的類單眼、中高階的單眼相機之規格。最後選項 4 的 2101 萬畫 素以上則是多為全幅的單眼相機之規格,藉由不同畫素的選項亦可初 步歸納出不同的相機類別。 4. 光學變焦:本研究將該項目內容分為 0-N/A(無)、1-2 倍、2-3 倍、3-4 倍、4- 5~12 倍、5-13~24 倍、6-25 倍以上七種類型。光學變焦的能力 取決於相機鏡頭之焦距,光學變焦倍數越大,能拍攝的景物就越遠。 48.
(61) 然而,另一種變焦數位變焦,則是透過相機韌體程式的演算及光學系 統的配合,可以將被攝體再做局部放大,以插補的方式模擬出光學變 焦的效果,但往往會損耗掉影像的品質,在一般的拍攝狀況下,都不 建議使用「數位變焦」的功能,因此本研究不把數位變焦能力納入考 量。此外,由於單眼相機可以依照不同需求更換鏡頭,隨著鏡頭的不 同光學變焦能力也會改變,因此本研究光學變焦能力是針對一般消費 型相機所設計。選項的不同則是為了利於篩選出此特性之相機。 5. 感光度:在此項目內容分為最低感光度與最高感光度,最低感光度分 為 0-N/A(無)、1-50、2-51~99、3-100、4-101~199、5-200 六種類型; 最高感光度分為 0-null (無)、1-1600 以下、2-1600、3-3200、4-6400、 5-8000、6-8000 以上七種類型。大多數相機的最低感光度通常為 100~199 之間,其他感光度選項,如 ISO 50 為高階的單眼相機具有之 特殊規格;ISO 200 則為 Nikon 的單眼相機有別於其他單眼之規格。 最高感光度則是透過不同數值判別相機可能的分類,最高感光度 3200 以下大多為早期的一般消費型相機,感光度 3200~6400 的選項可能為 類單眼或初階之單眼相機,感光度 6400 以上可能為中高階的單眼相 機。藉由設計特殊規格之選項,不但能掌握不同相機感光度支援之差 異且將有助於案例篩選的精準度。 6. 鏡頭廠牌:本研究將該項目內容分為 0-N/A(無)、1-Canon、2-Nikon、 49.
數據
相關文件
stating clearly the important learning concepts to strengthen the coverage of knowledge, so as to build a solid knowledge base for students; reorganising and
"Extensions to the k-Means Algorithm for Clustering Large Data Sets with Categorical Values," Data Mining and Knowledge Discovery, Vol. “Density-Based Clustering in
Learning to write, reading to learn: Genre, knowledge and pedagogy in the Sydney school. Sheffield,
Through training in coaching, and integrating the foundation knowledge and skills to design and implement an exercise and fitness training activity, this course not only
Introduction to the following free CPS Apps/Platforms and illustration will be given to how to adopt them in carrying out classroom activities and collaborative learning.
Wi-Fi Supported Network Environment and Cloud-based Technology to Enhance Collaborative Learning.. Centre for Learning Sciences and Technologies (CLST) The Chinese University of
Incorporating effective learning and teaching strategies to cater for students’ diverse learning needs and styles?. Integrating textbook materials with e-learning and authentic
The pre-primary institution is able to design learning activities around themes to facilitate children’s acquisition of knowledge and skills from different learning strands and