• 沒有找到結果。

多維度推薦系統:應用至行事曆助理

N/A
N/A
Protected

Academic year: 2021

Share "多維度推薦系統:應用至行事曆助理"

Copied!
30
0
0

加載中.... (立即查看全文)

全文

(1)

多維度推薦系統:應用至行事曆助理

楊亨利 張文祥 國立政治大學資訊管理學系 廣達電腦公司 摘要 隨著資訊科技的發展,帶來資訊產生資訊爆炸的現象。推薦系統提供了一個良好 的解決方法,推薦系統透過分群與推薦的技術來達到減少資訊量與推估使用者潛在興 趣的目的。目前推薦系統多半應用在單一維度的推薦,本研究則探討多維度推薦的應 用,並以個人行事曆之助理軟體為例。助理軟體管理個人日常生活中的大小事務,成 為最貼近個人的工具。而在個人行事曆的安排上,可以發現牽涉到有人、事、時、地、 物五個維度。因此我們以五維度做基礎,透過合作推薦(Collaborative Recommen-der)的方式以達到個人潛在興趣的多維度(Multi-Dimensions)推薦,這將更能貼近 使用者的需求,提供意想不到的資訊組合。

Multi-Dimension Recommender: The Application to

Calendar Arrangement Assistant

Heng-Li Yang Wen-Hsiang Chang

Department of Management Information System, National Cheng-Chi University Quanta Computer Inc.

Abstract

With the development of information technology, information overload has become a common phenomenon. Recommender systems could help relieve the information overload and provide users the most suitable or interesting products. Currently recommender sys-tems only consider one dimension. This study would expand to multi-dimensions and choose the application of the calendar arrangement assistant software, which is a tool to manage all kinds of affairs in personal daily life. It could be found that five dimensions in-cluding people, thing, when, location and things, are involved in such arrangements. This study adopts cooperative recommendation approach to suggest multi-dimension

(2)

recom-mendations, which would be more close to user's demands and provide more useful infor-mation mix.

Key Words: Recommender System, Multi-Dimension Recommendation, Assistant Software, Calendar Arrangement

1. 導論

電腦網路與通訊科技的發展,使得我們資訊的來源除了口耳相傳、報紙雜誌、電 視廣播媒體外又多了網際網路這個極有威力的資訊傳播管道。透過網際網路快速、24 小時運作的特性,不管是在資訊的擷取、商品的購買或是資訊的交換上,都比以往沒 有網際網路的時候更加的便利。資訊的來源從不足轉變為資訊超載(Information Over-load)。但是資訊的過量衍生了許多的問題,人們必須花費不少的時間在過濾資訊上, 對 於 資 訊 的 處 理,陷 入 了 緊 張、對 工 作 滿 意 度 降 低、以 及 生 理 上 的 不 適(Lewis, 1996),因此在今日這資訊社會,幫助使用者快速的找出有用的資訊有其需要。另一 方面,Hoffman 等人(1996)研究網路行銷的特性發現,網路的屬性與客戶經驗創造 了新顧客需求,關鍵在賣方是否能替顧客找出需要的資訊或產品,帶動買方的購買慾 望,以滿足個人化的需求。透過推薦(Recommendation)這種人類行為的概念,許多 技術相繼的被提出,用來解決資訊過載與個人化資訊的需求,尤其是在電子商務的個 人化與客戶導向的需求上被應用的頗多,例如 Amazon.com、CDNOW、eBay、Movi-eFinder.com。 目前推薦系統大多應用在單一產品或是資訊的推薦。但是,在真實世界中有許多 情況下需要分析多維度的資訊,例如新聞網站中每個顧客可能在某個日期登入網站, 觀看某些的新聞;這便是一個二維度的例子。在推薦的方式上亦應有多維度推薦的必 要性。例如,我們可能不只需要電腦系統推薦電影,還需要推薦我們那個時點去看該 部電影比較妥當。例如,若能推薦使用者在午夜的時間去觀看「七夜怪談」,那麼電 腦系統或許更有人性化且更符合個人化,能進一步的提供更完整且有趣的推薦。 本研究在此背景下,思考如何進行多維度的推薦,選擇以助理軟體中的行事曆排 定為核心,提出一個多維度的推薦系統。希望能讓使用者獲得更完整的推薦,使得行 程更有趣且更有說服力。選擇行事曆排程的原因有二,首先是行事曆排程為一般時常 使用的功能,因此在推薦方面較能切合日常生活的需求。另外,行程的排定通常會牽 涉到人、事、時、地、物五個維度,以此作為多維度推薦的研究可以貼近本研究的目 的。同時,也希望藉由人、事、時、地、物五個維度的行程推薦,提高推薦的實用性 與接受度,使其更能切合個人化的行程安排。

(3)

2. 文獻探討

2.1 個人化 網站商家必須要抓緊各別使用者的特性,提供獨特的服務才能夠抓住顧客的心, 進而增加獲利。個人化指系統能夠觀察與判斷使用者的獨特需求而快速的反應。Ad-omavicius 與 Tuzhilin(2001a)提出建立個人化有以下的幾個步驟,包括收集顧客資 料、建立顧客 Profile、相似度比對、傳遞與呈現個人化資訊、測量顧客回應,由上而 下進行且最後顧客回應又可回饋到各個步驟。 Allen 等人(1998)提出幾種網站個人化資訊獲得方法: 線上註冊:透過線上註 冊工具,要求使用者輸入個人資料,網站便可藉此類資料提供個人化服務。 顧客資 料庫:所有顧客的相關資料(如電話、地址、職級、查詢記錄、線上交易、興趣等) 都儲存在資料庫中,以此作為資訊個人化之基礎。 Cookies:Cookies 是以文字檔型 態儲存於使用者電腦中的資訊,透過這些資訊網站業者可以提供個人化的網頁服務。 不過 Cookies 的運作,是以連結網站的電腦 IP 和密碼辨認使用者身份。 顧客回饋資 訊:透過使用者對系統進行回饋(如收集顧客滿意度調查、線上意見表、線上問卷等) 可以收集使用者的喜好,與使用者互動以更加了解使用者或修正系統對使用者 Profile 的認知。 互動追蹤:當使用者與網站互動時,互動由網路伺服器記錄下來,並進行 資訊的個人化程序,使用者再次造訪時,網站便可根據使用者追蹤資訊,從而提供個 人化服務。本研究在個人化作法是採用顧客資料庫與顧客回饋資訊。 2.2 推薦系統 2.2.1 推薦系統回顧 推薦系統有許多應用(如徐明哲,1993;曾靖茹,2003;陳柏翰,2005;陳復 , 2005;陳鴻新,2005; Schafer et al., 2001)。Schafer 等人(1999)指出推薦系統透過紀 錄使用者對產品的偏好知識來引導使用者,這些知識可能是專家知識或是從消費者行 為中挖掘出來的知識。McDonald(2003)認為推薦系統所應用的推薦方式可以分為內 容過濾、協同式過濾與連結導向: 內容過濾:藉由分析使用者的特性,建立其 Profile,測量內容或商品與使用者 Profile 的相似度,最後推薦具有高相似度的內容或商品給使用者。這方式最大 的挑戰是辨識物品或資訊的特性,與建立符合使用者特性的 Profile。Profile 是 指與使用者意見相關或是企圖強調使用者的某些特性。Hanani 等人(2001)認 為所有資訊過濾的系統都需要描繪出使用者,並且將其需求以 Profile 的形式表 現。內容過濾推薦分析的技術包含貝氏機率法則與基因演算法等。

(4)

協同式過濾:會考慮其他使用者的偏好,先辨識與使用者相似的同群體(Nearest Neighbors),藉由同群體的使用者曾經購買或觀看過的資訊之評分高低來進行 推薦。 連結導向系統:此乃以圖論演算法(Graph-Theoretic Algorithm)找尋最多人參 照的連結。 內容導向的推薦系統需要將欲推薦給使用者的資訊或物品分類。經過文章關鍵字 或物品屬性以達到分類的目的。而系統也擁有描述使用者興趣的 Profile,將 Profile 中 的興趣項目與分類的資訊或物品做比對(Match),相似度高者就是使用者可能感興 趣的資訊或物品。應用此作法的設計的系統有 SIFT、InfoScope 與 TREO。 協同式推薦首先由 Goldberg 等人(1992)提出,應用於電子郵件分類系統 TAP-ESTRY 上,該系統的主要目的是在過濾電子郵件,後來延伸到所有的電子文件。使用 者可以透過查詢語法建立查詢,經由不同的查詢過濾出自己有興趣的郵件。此系統仍 然需要使用者自己建立查詢語法,而非系統主動進行推薦。1994 年 Resnick 等人發展 GroupLens 的協同式過濾系統,系統中最先採用 Neighborhood-based 的演算法,以 Pearson 相關係數計算每個使用者的相似度,以尋找適合的群組,然後對使用者可能感 興趣的新聞進行推薦,此時系統已經可以主動進行推薦。而後的系統 Ringo(Sharda-nand and Maes, 1995)與 Bellcore Video Recommender(Hill et al., 1995)可提供使用者 排序過的商品清單,使得此技術變成推薦系統發展至今的核心之一。推薦系統發展的 更成熟,並廣泛的應用在各式各樣的商業系統上。 協同式推薦的步驟包含: 建構一個使用者的 Profile:通常包括使用者對資訊或 物品的評價,透過評價的等級來加以評分而取得的資料。 比較使用者與系統中其他 使用者的 Profile,並計算相適度。 建構最鄰近的群組:找出 N 個最相近使用者的群 組來當作推薦的基礎。 使用最鄰近的群組去進行推薦:加權最鄰近群組的 Profile 來 對於新的物件的評價做預測以推薦給使用者。 使用兩種或兩種以上推薦方法的系統稱為混合式的推薦系統。推薦系統的方法並 不是互斥的,可以交互運用內容推薦與合作推薦的方法。內容推薦的優點在於準確度 比協同式推薦高且解決稀少性(Sparsity)與擴充性(Scalability)的問題,因為它使用 的是 Item-Based 的方法,但是仍有許多缺點。協同式推薦則彌補了內容式推薦的缺點, 但是卻造成了精確度的降低,而且也有稀少性與擴充性的問題。稀少性就是協同式推 薦無法在使用者剛使用系統或是尚未有人對該物品進行評價時提供推薦。擴充性就是 在使用者與產品持續擴充下系統效率的問題。另外兩者都有同義詞的問題,系統無法 判定相同同義詞的關係將會造成系統無法找出潛在的需求,這部分可能要透過本體論 (Ontology)的建置才能解決。因此有效的配合使用多種推薦方式才能使推薦的效果 提高,有一些論文已經在做這方面的研究,例如徐明哲(1993)、莊士民(2003)。

(5)

因此,混合式的推薦系統可以截長補短彌補各種推薦技術的缺點,這種推薦系統 的研究主要分為兩大類。第一類主要是將兩種以上推薦方法的結果混合在一起。例如 ProfBuilder(Wasfi, 1999)與 Personal Tango(Claypool and Gokhale, 1999)。第二類則 是將兩種以上的推薦方法整合在一起產生一組推薦結果,如 Fab(Balabanovic and Sho-ham, 1997)與 RAAP(Delgado et al., 1998)。

2.2.2 多維度推薦系統 根據 Schafer 等人(1999)對 Amazon.com、CDNOW、eBay 等網站推薦系統的整 理,表 1 列出現有的推薦系統的比較。由表中可以明顯的看出過去系統多是單維度的 推薦。但是,現實世界中使用者往往需要多維度的推薦。例如,在行程安排上,使用 者除了需要推薦到什麼地方外,可能還需要推薦什麼時候去、跟什麼人去、帶什麼重 要物品等資訊。或是,推薦使用者購買產品時除了推薦使用者購買什麼產品之外,還 要推薦到哪裡買品質比較好,何時去買比較便宜等資訊。因此,可以想見多維度推薦 有其必要性。另外,現有的推薦系統多為產品或資訊的單一層次的推薦。使用者在接 受推薦時有時候需要比較粗略的資訊,有時卻又希望能得到更詳細的資訊。例如,推 薦使用者到墨西哥餐廳用餐時,使用者可能想要更詳細的墨西哥餐廳資訊,推薦系統 應該能更有智慧的提供往下一層的資訊。 表 1 現有推薦系統比較 企業/應用軟體 推薦介面 推薦技術 尋找推薦方法 維度 Amazon.com 推薦系統包含: Eyes E-mail 屬性基礎 關鍵字 單維度 Customer Comment 平均評價 文字評價 聚合式評價 輸入:文字、評價 組織的瀏覽 單維度 CDNOW 推薦系統包含:

MY CDNOW Top N 列表 People-to-People Correlation

輸入:評價 組織的瀏覽 單維度 Album Advisor 相似物件 Top N 列表 Item-to-Item Correlation 輸入:購買資料 組織瀏覽 關建字 單維度 EBay 推薦系統包含: Feedback Profile 平均評價 文字評價 聚合式評價 輸入:文字、評價 組織瀏覽 單維度 資料來源:修改自 Schafer 等人(1999) 多維度的觀念,在資料發掘方面已有相關研究(如余忠慶,2002;莊美娟, 2002)。而在推薦系統方面,近年來也已被重視(如:Adomavicius and Tuzhilin, 2001b, 2001c; Adomavicius et al., 2005; Adomavicius and Tuzhilin, 2005; 翁 頌 舜 與 陳 文 典,

(6)

2006)。甚至也有人提出推薦系統是有多維度之視覺表示(Igo et al., 2002)。不過, 他們是把額外的維度視為一種情境(Context),如推薦電影當多加了時間因素這一維 度為何?當多加了地點因素這一維度又為何?也就是維度是外加的。而本研究之焦點 是推薦行程,行程本身就是多維度的。也就是多維概念內含入推薦項目(Item)之特 性中,這是與過去研究不同的。另外,他們重視的是如資料倉儲中的向上(Roll-up) 為聚集(Aggregate)概念,如由一堆各式各樣喜劇電影得知使用者對於喜劇電影平均 偏好如何,而本研究重視的是向下挖掘(Drill-down),如前述由一般墨西哥餐廳資 訊,提供往下一層各式各樣的墨西哥餐廳資訊。 2.3 個人化助理軟體 介面助理(Interface Agent)是一種智慧型、半自動化的系統,它能幫助使用者處 理一種或數種的電腦軟體應用。傳統上被視為一種助理軟體,它們觀察有關於使用者 的行為、習慣、喜好等知識,藉以幫助使用者完成某些任務(Kozierok and Maes, 1993; Middleton, 2001),並且藉由使用者回饋來加以學習修正使其更有智慧。成功的介面 助理並不會阻礙使用者的工作,而會完成使用者交付的個人化的工作。人與 Agent 合 作的模式通常包括溝通、監督事件與建置工作等。 個人化的助理軟體是一種介面助理,被應用在相當多的領域。例如工作的管理、 資訊跟郵件的組織、日曆排程等等。我們可以想像未來的助理軟體將有如個人秘書一 般,透過網路它可以幫你處理帳單、排定行程、自動下載資訊、購買產品等處理日常 生活的事務。顯而易見的,個人化助理軟體的成功與否在於它是否能夠有充足的使用 者個人化知識,提供使用者客制化的服務。 我們要如何才能夠提供客制化的服務?有四種方式可以進行。最簡單的方式就是 透過使用者輸入的資料,透過使用者輸入的資料,系統可以學習使用者的設定來提供 個人化的環境。但是這並不是相當好的方式,因為使用者並不一定願意去花費時間在 訓練軟體上面,就算使用者願意訓練也不見得願意一直更新這些知識。第二種就是軟 體自動經由使用者使用的過程中進行學習或模仿,將使用者的習慣,經驗轉換成規則 來進行個人化的服務。第三種是系統透過使用者利用一些基礎的樣本來訓練或程式化。 最後一種是系統向其他有經驗的代理系統詢問以獲得一些建議來幫助使用者。 過去行程排定的軟體多為讓使用者自行依照需求去排定行程,但是使用者發現時 常需要排定一再重複的行程,且在排定行程方面並沒有額外的資訊來輔助其排定出較 以往不同或是更好的行程。因此,有學者開始在排程訂定的過程中提供建議,透過以 往使用者排定的資料經由學習來加以建議,例如建議使用者排定會議時間的長短等 (Mitchell et al., 1994),或是經由學習來進行代理系統之間的排程溝通(Jennings and Jackson, 1995)。但並未發現有學者針對使用者排定行程時提供額外的資訊方面進行

(7)

研究。經由推薦系統的概念,本研究冀望引進推薦系統的作法來提供使用者豐富資訊 使行程排定軟體更有智慧。 2.4 文獻小結 有關個人化方面,本研究將提供一種個人化的網站系統,自動的提供顧客的個人 化服務。對於資訊的收集同時採用透過使用者明顯表達而建置的顯性(Explicit)模式 與經由系統收集、觀察使用者的行為,來推論使用者可能的喜好之隱性(Implicit)方 式(Good et al., 1999)。透過個人化的步驟,使用線上註冊與顧客資料庫來收集資訊, 然後建立顧客的輪廓,計算相似度,呈現差異化服務,最後測試顧客反應收集顧客回 饋資料,以此循環步驟達到個人化的目的。 過去的推薦系統文獻多著墨在推薦的精確度、Profile 的建構、混合方式的使用與 推薦系統缺點的改進等,本研究則透過推薦系統中的協同式推薦方法與內容式推薦方 法的部分概念,並將推薦系統中計算相似度的方法加以修改以適用在多維度的推薦上。 有關多維度的分群與推薦是研究的重點。 而過去助理軟體應用在行事曆的發展是以機器學習等方式,透過演算法來達到排 程的自動化,例如使用者間行程時間的敲定、會議時間的長短等自動化排程,在自動 提供新資訊的提供上較缺乏。本研究是著眼在除了能提供資訊外,還希望能藉由推薦 概念的引入,利用同一群使用者的喜好來達到更好的推薦效果。因此,本研究將推薦 系統應用在行事曆排程上,以提供更有智慧的助理軟體功能。行程安排有兩方面考量: 一方面有個人的不同生活需求與偏好習慣考量;另一方面若要打破習慣,也有屬同一 族群可供參考的品味與經驗考量。故本研究對前者擷取了內容推薦的觀念,而對後者 則採用協同推薦的作法。

3. 系統架構

本研究所建議之推薦系統主要目的是協助商務人士排定行事曆。透過推薦系統的 機制,我們可以在網站上提供商務人士排定行事曆的建議,最特別的是能夠展現以人、 事、時、地、物五個維度進行分群與推薦的能力,整個架構圖如圖 1。系統將包含 4 個主要模組:Profile 建構模組、分群模組、排程安排模組、推薦模組。而在資料方面, 概念樹資料庫是核心。以下將先介紹概念樹資料庫之後,再介紹各模組。 3.1 概念樹資料庫 本系統架構有人、事、時、地、物五個維度。我們採用 Han 等人(1992)之概念

(8)

樹觀念,將各維度概念分別以一棵樹狀圖來表示,以提供控制一般化過程必備的背景 資料,如圖 2 至圖 6。各個維度由根節點起,由上往下作細部分類,直到不需細分的 樹葉節點為止。由於分類細緻程度將會影響到資訊的品質與系統的負荷,所以在建立 分類樹的時候必須小心的把相關的分類考慮進來。但是,系統不可能將所有的分類都 考量進去,可能會疏忽某些節點或是因為時間的遞移而需要新增加某些節點。因此系 統必須可動態的由管理者加入必要的節點來擴充所包含的概念,不過屆時將面臨舊資 料歸類的問題。此概念樹除了提供分群時選取分群標準外,更可提供推薦時使用,使 系統除了一開始的層次推薦外,還可以進一步的往下一層推薦。 我們對事件分類樹(如圖 2)的建構是以商務人士的使用為主,但是範圍還是太 廣泛,因此進一步縮小到商務人士會議的安排上。事件樹節點代號的編碼方式以"E"開 頭表示事件,第一層節點為"E"加上字母 A~Z 組成,依序編號為 EA、EB、EC。第二 層節點則為第一層節點編號加上字母 A~Z 組成。以下分類樹的編號規則類似。事件

(9)

樹總共有三層,除了正式會議外,家庭餐會也在事件分類樹的範圍內,使得整個樹包 括公司會議和家庭聚會。對於事件樹,系統是以樹葉節點為分群的依據,推薦時也以 葉節點為基礎。 圖 2 事件的分類樹 配合事件樹的分類,人物樹(如圖 3)的人物分類也列出事件中可能出現的人物。 家人部分細分為父親、母親、兄、弟、姐、妹各樹葉。在人物的選擇方面,系統可以 讓使用者以「多值」方式選擇多位人物。因此,可以結合多個節點成為複合的屬性。 例如,將父親與母親結合成父母。人物樹中也是以樹葉節點為分群與推薦的依據,推 薦時系統只會推薦主要的參與者,但使用者可以進一步要求系統推薦參與的其他人物。 圖 3 人物的分類樹 時間樹(如圖 4)的節點表示的是時間的區間,使用者使用系統時選擇的是時間 區間,並選擇區間中的精確時間。該時間表示的是起始時間,就是這一個行程的發生 起始時間。時間樹也是以樹葉節點為分群與推薦的基礎。

(10)

圖 4 時間(開始時間)的分類樹 地點樹(如圖 5)共五層,是以第三層的節點為分群與推薦的依據。系統會依據 群體中計算最多安排次數的方式,對使用者往下一層推薦特定的地點。例如使用者甲 經系統推薦其安排之地點應為「餐廳」,甲可以要求系統往下推薦,以提供更為精細 的餐廳。系統此可能發現「中式餐廳」為相關群組中最常去的餐廳類型,並將之推薦 給甲。因為地點樹有五層,所以系統也會在提醒使用者可以繼續往下層推薦。使用者 若繼續往下,可能會得到「四川餐廳」這個樹葉節點。此外,使用者在選擇地點時會 因為其 Profile 設定而只推薦其居住縣市的餐廳,以維持合理性。 圖 5 地點的分類樹 物品樹(如圖 6)中我們將以樹葉節點為分群的依據,推薦時也是樹葉節點為推 薦的基礎。

(11)

圖 6 主要物品的分類樹

經由上述的步驟,對事件、人物、時間、地點、物品五棵樹的第三層進行編碼,得 到多維度的行程(Eij,Pij,Tij,Lij,Iij),其 i=A~Z, j=A~Z。其資料架構示意圖如圖 7。

圖 7 資料架構圖

五個維度的樹建立之後,就可以轉化成資料庫的方式儲存。而對於使用者之排程 歷史資料將儲存各個樹的第三層節點,另外,雖地點概念樹的各層資訊可只儲存最下

(12)

層的樹葉節點,其上層資訊可以從葉節點來推導。但是因為分群時是以第三層為依據, 而往下推薦時又必須紀錄最底層的樹葉節點。故將地點樹第三層、葉節點兩者之排程 歷史資料都分別以欄位記錄下來可以增加分群時計算的速度。而在目前雛形系統設計 下,只有地點樹可進行向下推薦的功能,但是若未來修改雛形,將可容許其他四個維 度也可向下推薦。 3.2 系統模組介紹 整個系統包含 Profile 建構模組、分群模組、行事曆模組、推薦模組,各介紹如 下。 3.2.1 Profile 建構模組 使用者的 profile 建構模組負責維護使用者的基本背景資料以作為會員登入與分群 時篩選使用。使用者的背景資料包含身分證字號、姓名、居住縣市、性別與職級,另 外還有帳號與密碼供使用者登入使用。職級的重點在區分其為高階管理者、中階管理 者、基層管理者、非管理者,以意涵不同層級的會議安排。 3.2.2 分群模組 系統分群有兩種方式,一種是目標分群,一種是使用者實際資料分群。當使用者 剛開始使用此網站時,會面臨沒有實際排程資料可以分群或是實際排程資料不足以分 群,此時系統可以允許使用者設定第二層節點(父節點)的組合目標比例來進行分群。 其分群的方式與利用實際排程資料分群一樣;只是進行父節點波形比對時是利用使用 者設定的目標比例來分群,並且沒有進行子節點的比對,直接以父節點的比對結果與 相似度當作推薦計算的基礎。目標比例在使用者排定資料時也會成為消極的限制條件, 每顆樹選擇一個節點當作做限制條件,當系統發現該節點的比例小於使用者設定的目 標時將會提醒使用者朝目標前進,推薦時也會依照目標比例優先推薦。為了避免使用 者剛開始比例不穩定的情況,因此系統將在使用一段時間後再使用此標準來提醒使用 者。 依實際資料分群方式,如圖 8。這是以每個使用者為中心出發找出各自的群組。 每個使用者都有一個屬於他的群體。分群時,系統將會透過使用者的職級將同一群職 級者篩選出來。這個篩選動作是假設相同職級的使用者在安排商務人士行事曆上比較 有相近的考量,因此參考其他相同職級的使用者安排的行程將會比較有參考價值。而 是否需要針對其居住縣市進一步過濾篩選,則由使用者自行決定。若選擇居住地篩選 動作,會縮小使用者可以參考的群體。若不選擇,則在推薦時,若需要推薦到地點樹 之樹葉的具體地點時,也會詢問使用者,是否要包含與使用者居住地不同之地點。

(13)

圖 8 分群模組 基本資料的篩選完後,將進行使用量的篩選。由於各使用者使用系統的時間長短 不一,使用頻率也不相同。所以,安排的行程數量將有頗大的差距,若是將兩個使用 量差距大,雖即使行程安排模式相似的使用者列為同一群,仍可能造成某些偏差。故 建議先對所有使用者計算其安排過的行程數除以全部資料庫中的行程總數,得到其使 用比率,可分為高、中、低三使用量群。 依使用量分完大群後,接下來,將對每一大群中之使用者找出其行程安排模式相 似的參考使用者。由於有五個維度,每個維度的節點可能很多,其組合起來的行程安 排形式數目將十分可觀。必須採用較簡化的演算法來計算其相似度。在此,我們建議 採用波形比較的方式。先以一個維度為例來說明,假設只有一個維度:事件,同時假 設其事件樹的第二層只有四個節點:EA、EB、EC、ED。以節點命名字母大小排列, 並計算出各使用者於各事件安排過的總次數及各事件所分配比率。使用者甲、乙的行 程資料如表 2。 表 2 使用者甲、乙在四類事件的安排次數 使用者 事件 EA EB EC ED 甲 次數 35 48 16 30 比率 0.2713 0.3721 0.1240 0.2326 乙 次數 24 46 18 29 比率 0.2051 0.3932 0.1538 0.2479 我們可以想像若以比率為縱軸、事件類別為橫軸,上述使用者甲、乙的行程資料 將可分別繪成一個長條圖,將長條圖之各長條中點連起來,即成兩條曲線圖。我們波 形比較法的目標是希望兩條曲線圖波動類似。透過使用者自身相鄰中後面的事件類別 比率減前面的事件類別比率可得一波幅數值。如果數值為正則為正波、負則為負波。 如果數值超過自訂的波幅門檻則為平波,否則為陡坡。自訂的波幅門檻為事件類別數 量的倒數乘以系統設定的波動參數。以此例,若系統設定的波動參數為 2/5,事件類 別總共有四種,因此波幅門檻為(1/4)*(2/5)=0.1,故波幅在 0.1 之間的都可以視 為平波。系統設定的波動參數表示若資料不呈平均分配,那麼可以容許的波動為多少? 此數字或許一開始並不容易訂,但是可以經由經驗法則加以調整至適當的數字。假設 正陡坡的符號為"/"、正平波的符號為"+"、負陡坡的符號為"\"、負平坡的符號為"-"。

(14)

依上述的原則,使用者甲與使用者乙的波形如表 3。表 3 中的各欄代表每一段的波形, 計數兩個使用者相同變動的波段數目,就得到兩個使用者相似度。在此例中,使用者 甲與使用者乙的相似度為 2/3。 一般使用 Cosine 來計算相似度,將使用者評分看作為 N 項目空間上的向量,如 果使用者對項目沒有進行評分,則將使用者對該項目的評分設為 0。計算使用者間的 相似性通過向量間的餘弦夾角度量,向量的計算中用到乘法相加與平方相加;計算上 如果維度變多,項目變大則負擔也會愈重。本研究使用上述的波形比對方式應用在多 維度的比對上。希望透過簡單的加減(計算比率時需要用到除法)來計算相似度以減 低計算的負擔來因應多維度的需求。尤其是多維度的推薦中稀疏性會比單維度更嚴重, 會有許多項目是零值的情況,波形比對可以利用技巧地略過大部分零值比對,使其計 算更快速,使用者安排的行程組合相似時就可以非常快速的得到相似度。本研究所用 方法雖然可以減輕傳統協同過濾中相似度計算的負擔,也降低了相似度計算的敏感度, 但是作為初步過濾分群用應是足夠。 另外,由於多維度的節點組合繁多,因此可先以第二層的節點組合來進行波形比 對以減少群組中的人數。若兩使用者第二層的波形不符合那麼第三層的波形也一定不 符合。這樣可以節省很多的計算負擔。比對完第二層節點的波形後,如果相似度超過 設定的門檻值則兩個使用者為同一個群組,再進一步的比對第三層節點的波形。父節 點的數目比較少,初步篩選可減輕計算的負荷。如果比對父節點時就沒超過門檻值, 就可以省去比對子節點。此乃因為父節點是由子節點組成的,比對時依照比例比對, 若父節點就沒超過門檻,子節點也不會超過門檻。 3.2.3 排程安排模組 排程安排模組為直接與使用者接觸的介面,可讓使用者透過 Web 進行日常的行事 曆排程。若使用者五個維度的資訊都自己安排,則不需任何系統推薦。安排行程時必 須透過表單選取五棵概念樹的樹葉節點,一步一步的選定事件、人物、時間、地點、 物品五個資訊,系統再將這些資訊儲存在原始資料表中。除了透過表單選擇節點外, 使用者也可以輸入詳細的資訊以便顯示在整個行程安排上。不過選擇時,會受限於系 統已建置的概念樹節點,若使用者所要安排的並不在所列出的節點中,則只能選擇「其 他」類別。日後再由管理者視需求或是使用者的反應而定期檢討加入新節點。 表 3 使用者甲、乙在四類事件的安排波形

使用者 EB-EA EC-EB ED-EC

甲 正陡坡(/) 負陡坡(\) 正陡坡(/) 乙 正陡坡(/) 負陡坡(\) 正平波(+)

(15)

使用者在安排行程時,如果使用者有設定目標比例模式,則當使用者安排的行事 曆比例不符合目標時,系統會通知使用者告知其目前的行程安排不符合其設定的比例, 並列出違反比例的是哪些節點違反,使用者可以繼續排定行程不理會系統或是更改行 程符合自己之前所設定的目標比例。 當使用者想安排某些已知部分資訊的行程,如想安排跟總經理開會的行程,但希 望系統推薦適當的開會地點、時間與攜帶的重要物品時,這將啟動推薦模組來進行推 薦。 3.2.4 推薦模組 推薦模組有兩種模式,分為「多維度群組推薦」與「個人高分評價沿用」。前者 是用合作推薦的方式,後者是用內容推薦的方式。 不論何種模式,都需要我們先歸納出幾種合理的推薦組合以供使用者使用。此一 動作是為了避免一些不合理的推薦需求。例如,使用者只提供「物品」這個維度的資 訊(如「報告」)而希望系統推薦他其他四個維度的資訊(與何人在何時何地從事何 事),這並不是合理的推薦需求。以下為建議的幾種合理的組合:「時間、地點、物品 組合」的推薦(使用者輸入人物、事件,由系統推薦時間、地點、物品)、「時間、 物品組合」、「地點、物品組合」、「人物、時間、物品組合」、「人物、地點、物 品組合」、「人物、物品組合」、「事件、人物、物品組合」等。 多維度群組推薦的步驟如下: 使用者選擇推薦組合,如「時間、地點、物品組合」。 使用者依照所選擇的組合輸入已知維度的節點:上述的組合需要輸入已知的人 物、事件,如跟父母舉行家庭會議。 使用者告知推薦順序,如推薦順序為(地點→時間→物品)。 系統依照使者在分群資料庫中的群組,將與使用者屬於同一群的其他使用者的 排程資料與評分抓出,以便進行統計計算。 根據使用者輸入的排程組合篩選出資料,再依照使用者設定的維度推薦序,依 序進行推薦,在最後一個維度推薦時加入評分的微調。 推薦演算法將會依照推薦順序依序執行適當的運算,如果不是最後一個維度的推 薦則套用下列公式: Rn, k|BASE= m NBSSim(n, m)*R(m, k BASE) m NBSSim(n, m) Rn, K|BASE表示使用者 n 在既有維度的條件下加上另外一個維度為第 K 類別的期望 比例 R(m, k|BASE)表示同群組之其他使用者 m 在既有維度的條件下加上另外一個

(16)

維度為第 k 類別的實際比例 NBS 表示群體中的所有其他成員 Sim(n. m)表示使用者 n 與其他使用者 m 的相似度 依據使用者 n 選擇的推薦組合下加入第一個推薦順序的維度,系統擷取與使用者 n 同一群的所有使用者在該維度下的比例。例如對「時間、地點、物品組合」,推薦 順序為(地點→時間→物品)時,則找出與使用者 n 屬於同一群之其他使用者,假設 為 m,在人物、事件固定下,地點為某類別 k 的比例,這就是公式中的 R(m, k| BASE)。以此使用者 n、m 的相似度加權,最後除以相似度的全部累加,就可以 得到在事件、人物固定下、地點為 k 節點,使用者 n 的期望比例,這就是公式中 的 Rn., K|BASE。若此一比例與實際比率差距越大,則地點 k 節點越會被推薦。 舉例說明之,假設使用者 N 想要與代號為 PAA「上司」安排代號為 EAA 的「常 務會議」事件的行程。並且推薦順序是(地點-->時間-->物品)。假設地點只有兩個節 點 LAA 為「研討室」、LAB 為「會議室」。M、P、Q、R 與使用者 N 為同一群組, 相似度分別為 0.9338、0.7、0.8、0.4。而 M、P、Q、R 分別在 Ln為 LAA、LAB 與 PAA 安排 EAA 事件的比例如表 4。

表 4 M,P,Q,R 在地點 Ln為 LAA、LAB 與 PAA 安排 EAA 事件的比例

R(M, Ln|EAA, PAA) R(P, Ln|EAA, PAA) R(Q, Ln|EAA, PAA) R(R, Ln|EAA, PAA)

LAA 0.8 0.6 0.23 0.15 LAB 0.2 0.4 0.77 0.85 代入公式計算結果如下: RN, LAA|EAA,PAA =(0.9338)*(0.8)+(0.7)*(0.6)+(0.8)*(0.23)+(0.4)*(0.15)(0.9338)+(0.7)+(0.8)+(0.4) =0.497 RN, LAB|EAA,PAA =(0.9338)*(0.2)+(0.7)*(0.4)+(0.8)*(0.77)+(0.4)*(0.85)(0.9338)+(0.7)+(0.8)+(0.4) =0.502

如果使用者 N 在 LAA、LAB 與 PAA 安排 EAA 事件的實際發生過的比例分別是 0.45、0.55,則 LAA 未達期望,LAB 則已超過期望,會推薦 LAA 研討室。

此例找到地點節點後,加入推薦順序的第二個順序:時間維度,假設我們得到代 號為 TAA「整天」這個推薦的節點,最後,加入第三個順序:物品維度。此時我們必 須以評分來微調比例。因為使用者評分是針對整個行程做評分,前面的幾次推薦都只

(17)

有擷取幾個維度,並不適用全部五個維度的評分。但是,當最後一個維度推薦時,系 統就可以將五個維度的評分資料納入以調整出更適當的推薦結果。 在此我們先說明評分的制度是怎麼運作的。使用者安排新的行程後可以對自己安 排好的行程進行評分,評分的範圍是-5~5 分,不包含 0 分。分數越高表示喜好程度 越高。不包含 0 分的原因是要使得評分的結果都能對於推薦產生影響,並且避免零值 的計算問題。除了安排新行程可以評分外,當系統推薦使用者行程時,使用者也可以 進行評分。評分的時間點可以是立即評分也可以之後在評分,系統也並不強制使用者 必須要評分。 系統將評分列入計算時會遇到使用者對同一個節點組合可能不只評過一次分數或 可能並未對該節點組合評分。若是前一種狀況,系統將會把所有評分取平均來代表該 節點組合的分數。若是後一種狀況,系統則會將其排除在參考評分之外。 我們在推薦最後一個維度的節點時,所使用的公式與前不同而為下列: Rn. K|BASE=

m NBSSim(n, m)* R(m, k BASE) * 1+rank(j,(k, base)) m NBSSim(n, m) 其中 rank(m,(k, base))乃將評分除以 5,以轉換成在-1 至+1 之間的範圍內 的數值。 假設物品節點只有兩個節點代號為 IAA 之「會議報告」、代號為 IAB 之「財務 報告」。此時已安排的定義 BASE 為 EAA、PAA、LAA、TAA,而 M、P、Q、R 分 別在 In為 IAA、IAB 安排 BASE 的比例與評分,如表 5、6。 表 5 M,P,Q, R 在物品 In為 IAA、IAB 安排 BASE 的比例

R(M, In|BASE) R(P, In|BASE) R(Q, In|BASE) R(R, In|BASE)

IAA 0.8 0.6 0.23 0.15

IAB 0.2 0.4 0.77 0.85

表 6 M,P,Q, R 在物品 In為 IAA、IAB 安排 BASE 的評分

R(M, In|base) R(P, In|BASE) R(Q, In|BASE) R(R, In|BASE)

IAA 5 -3 4 -2

IAB 4 4 3 -1

代入公式計算結果如下: RN,IAA|BASE

(18)

RN,IAB|BASE =(0.9338)*(0.2)* 9/5 + (0.7)*(0.4)*(9/5) + (0.8)*(0.77)*(8/5) + (0.4)*(0.85)*(4/5)(0.9338)+(0.7)+(0.8)+(0.4) 算出來的 RN,IAA|BASE值為 0.716,RN,IAB|BASE為 0.74,如果使用者 N 的實際節點組 合<E:EAA,P:PAA,L:LAA,T:TAA,I:IAA> 及<E:EAA,P:PAA,L:LAA,T:TAA,I:IAB> 比 例 分 別是 0.55、0.45,則 IAB「財務報告」的差距將會比 IAA「會議報告」的差距大,表 示有更多增加的空間,所以物品將會推薦 IAB「財務報告」。 此外,為了尊重使用者當事人的偏好,系統還會自動篩選掉當事人曾給平均分數-5 分的行程,以避免推薦到其極不喜歡的行程。同時,當系統在進行推薦時,也會計算 出所推薦行程之當事人過去評分平均數供其參考。而如果當事人有設定目標比例模式, 則系統將會計算哪一個父節點組合(第二層節點組合)的比例是與目標比例設定相差 最大的,則將會只代入該節點組合下的節點來運算以求達成目標比例的設定。 而若推薦結果包含地點樹中的餐廳節點,則使用者可以進行向下推薦的功能。餐 廳節點的下一層為餐廳的類型,因此系統將計算該推薦哪一類的餐廳類型。推薦的方 式為計算同一群組中安排該種節點組合中最多次的餐廳類型,例如是中式餐廳,則將 推薦中式餐廳給使用者。由於中式餐廳並不是地點樹的樹葉節點,同樣地,若使用者 需要往下推薦特定的餐廳,可以同樣的方式向系統要求推薦。如果有多個特定餐廳次 數相同,則將最高的幾種都列出讓使用者選擇。另外,由於我們分群前已經依照使用 者居住的縣市做過 Profile 篩選,故地點的推薦應能合理的推薦相同縣市的餐廳。 再者,由於目前雛形之人物樹的結構是可以多值屬性的。使用者在安排人物這個 維度時可以選擇多個節點結合為複合屬性來儲存。但是為了分群與推薦的可行性使用 者必須選取其中一個屬性作為主要屬性,這個主要屬性將為分群的依據。推薦時也是 以這個屬性作為推薦的依據。如果使用者在推薦結果出來後,希望系統平行推薦其他 可以參與的人物時,也可類似地,列出出現次數最多的其他參與人物組合。 除了「多維度群組推薦」外,另一種推薦模式為「個人高分評價沿用」,此為內 容推薦的一種,將使用者本身的行程資料篩選所有的高分(5 分)行程,並以次數最 多者,依照使用者給定的推薦順序次序推薦。例如,若使用者選擇「時間、地點、物 品組合」,並且選擇人物節點為 PAA「上司」、EAA「常務會議」,推薦順序為(地 點→時間→物品)。則系統會抓出所有此使用者過去有 PAA「上司」、EAA「常務會 議」排程資料評分為 5 分的行程,先依地點篩選,假設得到 LAB「會議室」重複次數 最多。再看『PAA「上司」、EAA「常務會議」、LAB「會議室」』中的時間安排, 得到 TAC「下午」重複次數最多。最後再看『PAA「上司」、EAA「常務會議」、 LAB「會議室」、TAC「下午」』中的物品安排,得到 IAA「簡報」重複次數最多。 因此最後推薦給使用者為『地點 LAB「會議室」、時間 TAC「下午」、物品 IAA「簡

(19)

報」』。高分評價沿用也跟多維度群組推薦一樣可向下推薦與人物樹參與者推薦。同 樣的在群組中找尋符合節點組合,然後統計次數最多的來進行推薦。 3.3 系統架構特色 本研究利用推薦最適當的行程資訊,推薦技術使用合作式的推薦方法,利用行程 安排比例與評分評價,尋找推薦方法方面是利用使用者安排的行程比例來尋找。另外 與其他系統最大的不同特點如下: 在推薦的技術上引進了概念樹的觀念。由於引進概念樹的觀念,系統可以基於 原本的推薦層次往下一層推薦,並且清楚的把人、事、時、地、物化為清晰的 節點。另外,有些使用者只需要知道粗略的建議就可以進行安排,例如只需要 知道餐廳,就可以排定自己喜歡的餐廳。但是,有些使用者卻不然,他們希望 系統能進一步推薦給他們哪一種餐廳,甚至是哪個餐廳。這樣做是可讓使用者 依據自己的需求程度來接受資訊。 在推薦的維度上採用多維度的設計。不同於過去單維度的推薦,本系統希望能 以人、事、時、地、物五個維度來進行推薦。而不在是以往的只推薦產品或是 推薦新聞的方式。同時也與文獻上將多維度視為情境的外加不同,而是在推薦 的行程本身就是多維度。此種推薦將可有更豐富的資訊,也比較符合現實生活 中多重決策的問題。例如,在安排行程時,還會牽涉到跟誰去、去哪裡、什麼 時候去、帶什麼東西等決策。此時若資訊系統可以在決策上做推薦,將可以使 得系統更有智慧,也更貼近個人化。 推薦時添加了概念樹往下推薦與平行推薦的作法,往下推薦可更有彈性地,配 合概念樹可以推薦給使用者喜歡的資訊精細程度,同層平行推薦可以推薦給使 用者一整個群體參與者,使得推薦可以更加多元,並符合現實情況。 本研究使用波形比對來計算相似度與以往計算相似度的方式不同,波形比對是 從鄰近演算法的概念來的。但鄰近演算法採用兩兩比對,然後計算距離。採用 波形比對則有以下好處: 波形比對後直接以相同的波形除以總比對次數來代表相似度,而傳統之鄰近 演算法必須先計算出距離,再將距離的倒數視為相似度,最後還要指定一個 常數來當作相似度的調整值,經過多次轉換的運算才能得到可以使用的相似 度。 波形比對只要利用加減的運算不需要像鄰近演算法一樣利用平方來消除正負 的問題。平方會有放大的效果,常使得差距大的兩使用者經過平方後差距更 被擴大,波形的比對不會有放大的效果。 由於波形比對在計算上會比較快速,因此比較適合大量的資料比對,尤其適

(20)

合在多維度資料中各個維度節點的排列組合下將會使得比對次數倍增,利用 波形比對甚至可以精細的調整門檻值,使得在比對中直接可提早將不可能成 為同一群組的使用者之運算省略。

4. 系統雛形

本研究以 JSP 語言來建構此一推薦網站,管理者與一般使用者角色的相關功能如 圖 9、10 所示。 圖 9 本系統提供給管理者可用的功能 圖 10 本系統提供給一般使用者可用的功能

(21)

管理者功能選擇部份可以選擇建立分群參數與建立新餐廳資料。建立新餐廳資料 乃因應使用者需求而新增。目前系統雛形只做到此部分地點的新增,若未來修改雛形, 將可容許其他四個維度也可建立新資料。而選擇建立分群參數,乃因分群需要比對波 形,而波形是陡波或是平波則端視其是否超過系統設定的波度。因此管理者要進行分 群時必須要指定波形,概念樹第二層與第三層都有波形比對,因此需要分別指定此兩 層的波度參數。此外,兩使用者是否同一群還要看各類安排事件的波形相似度是否超 過門檻值,因此也必須指定此二者的門檻值。 若為一般使用者,註冊帳號後,功能選擇部份則有新增行程、顯示行事曆、選擇 推薦組合、修改個人資料等選項。顯示行事曆是將使用者過去排定過的資料顯示出來, 使用者可以選擇性的進行評分功能。選擇推薦組合是選擇要使用的推薦組合,也就是 選擇既定的維度,然後輸入既定維度的資料,再選擇推薦的方式是個人高分推薦或是 群組推薦,最後輸入推薦順序進行推薦演算法得出推薦結果,推薦結果可以再繼續進 行向下層或是同層平行推薦。 4.1 系統雛形展示 登入後將進入主畫面(如圖 11),顯示排過的行程,也就是行事曆頁面。每頁顯 示十筆資料,最右邊有評分的功能,可以讓使用者進行評分,使用者可以隨意選擇對 圖 11 一般使用者主畫面

(22)

其過去沒評分的行程評分或修改評分,評分是由-5~5 分,分數越高表示滿意度越 高。左邊則是功能鍵,包括行事曆、新增行程、推薦行程、修改個人資料、設定目標 與登出。 新增行程功能是容許使用者可以自行新增新的行程,完全不靠系統推薦自行安排 行程。因此使用者必須輸入五個維度的資料,包括事件、人物、時間、地點、物品, 其利用選單的方式選擇五顆樹的節點,並且選擇性的填上詳細的資訊供備忘錄之用。 對於人物樹,首先系統會要求你選擇與行程相關的主要、次要人物,如圖 12、13。 圖 12 對於行程中參與人物的選擇畫面(一) 圖 13 對於行程中參與人物的選擇畫面(二) 如果沒有參與的人物則直接按下一步進入時間樹選擇,如圖 14,時間樹除了節點 的選擇外還有年、月、日、時、分的選擇。年、月、日可以選擇現今,或直接指定特 定的年、月、日,「時」則會依據使用者選擇的節點變化,自動列出可以選擇的時段,

(23)

「分」則以每十分鐘為單位列出選單。

(24)

圖 14 對於行程中時間的選擇畫面 依序輸入五個維度的資訊後就會將資料寫入到行程資料庫中,並且呈現在行事曆 的畫面上。使用者可以針對這個目前安排的行程進行評分或是不評分。 使用者在剛使用時無法進行實際資料的分群,因此如圖 15,使用者可以設定目標 來讓系統根據設定的目標來分群,畫面中分為事件樹、人物樹、時間樹、地點樹與物品 樹,依序列出其第二層節點來讓使用者輸入比例,並且選擇某一個節點為限制條件。系 統將會把節點組合比例輸入資料庫中。使用者可以設定是否啟動目標比例分群,當設定 目標分群時系統將會依據目標比例分群,否則系統將會依據實際行事曆排程資料分群。 當使用者輸入的資料比例不符合其設定的目標比例時,系統將會通知使用者並且 指出是違反哪一個規則,如圖 16。

(25)

圖 16 使用者所欲安排於行程違反自己所設定目標比例 使用者在需要系統推薦時就可以使用推薦行程的功能,首先使用者必須選擇需要 的推薦組合,也就是需要推薦的維度,選擇完推薦組合之後,使用者要指定其他既定 維度的資訊。接下來,系統會要求使用者選擇推薦的方式,使用者可以選擇參考群組 成員的群組推薦或是參考本身歷史資料的個人高分評價沿用。如果選擇群組推薦則下 一步必須選擇推薦的順序,如圖 17。 圖 17 使用者在群組推薦中選擇推薦的順序 指定完推薦的順序後系統將開始運算,當推薦的結果中地點樹有可以向下推薦的 可能時,系統會提醒使用者地點是否要向下推薦,否則將直接顯示目前的推薦結果。 當選擇不要向下推薦時,系統就會直接顯示目前推薦的結果,推薦的維度會以藍色的 字標示出來,而既定維度是以黑色的字表示。並有評分表提醒使用者針對這次的推薦 給予一個滿意度的評分,使用者也現在可以不評分,日後在歷史行事曆中再給評分。 如果使用者選擇的是想要系統向下推薦,則系統將會依演算法群找群組中最常去的餐 廳類型推薦給使用者。除此之外,如果選擇平行推薦,則系統將會針對人物樹進行平 行推薦的演算,計算出與經銷商可能參與的人物,以此來彌補參與人數可能不只一種 的缺點,並且也可以使得人物樹的設計不需要採用複合式的節點。例如使用者點選了 平行推薦的按鈕後,系統可能將會推薦參與的人物除了主要的經銷商外,為客戶與供 應商。 4.2 對系統雛形之意見回饋 由於多維度的推薦需要大量的使用者才會顯現效果,因此真正的系統驗證有點困 難。礙於時間、經費,同時本研究主要目的在提出一個系統架構,而非實證,故只有 採取小規模試用,以兩百位模擬的使用者資料,透過 4 位台灣北部中階白領工作者來

(26)

實際體驗此雛形系統的推薦,再深入訪談,請其提供回饋意見,整理如下。 系統的實用性:行事曆安排有其需求性,只是若單獨以行事曆排程網站存在, 很難吸引使用者願意將其私人資料輸入,並視為日常生活中的行事曆安排入口。 但是,若能與其他助理軟體整合,提供不只行事曆安排,還包括記事、記帳、 新聞、旅遊資訊提供等多功能,則將會加強使用意願。另外平時生活中我們使 用的網站不乏與人、事、時、地、物的需求相關,如美食網站、社交討論、旅 遊網站等,若能將一般使用者經常前往的餐廳地點、社交型態、旅遊地點等資 訊收集起來,以供本系統使用,將能提高系統的實用性。 對於協同推薦與高分推薦的比較:協同推薦比較收到青睞。原因是使用者在行 事安排上會需要推薦時,通常是對平常比較少安排的行程組合或是經常性的行 程組合冀望能求新求變時,此時參考別人的意見的系統推薦就變得非常重要。 至於個人高分推薦,較適用於平時對於例行性事務想要參考過去美好經驗時使 用,希望能夠安排不具意外且能平順的行程時使用,一般人若還記憶所及,會 比較少求助於系統。 對於所需參考的資料量問題:系統要能使用協同推薦的前提是能夠找到其歸屬 的群組,所以即使數量也不多,但若剛好與某些人安排的行程組合相似,即可 找到群組。當然,若資料量多時,分群也就會更仔細,推薦也會更準確。此外, 本研究容許目標分群,透過此方法新的使用者也可以在完全沒有過去行程資料 的情形下進行協同推薦。至於內容推薦,只需要推薦的行程組合過去有安排過 即可。

5. 結論與建議

5.1 研究結論與貢獻 推薦系統以往多使用在物品或是單一資訊的推薦上,許多文獻著眼在推薦的精確 度上做了很多的貢獻,本研究希望進一步的將其擴展到多維度的推薦上,使得推薦更 全面性、多元且有趣。利用多維度的資訊進行分群與推薦。對於如何將多維的資料進 行編碼、比對、分群與推薦均有助於後續的研究參考。且將其應用在以往沒有考慮過 的行事曆排程上面。 過去行事曆排程文獻多是著重於行事曆安排與助理軟體間的互動,強調如何達成 自動化的行程安排,注重的是時間這個維度。多以助理軟體透過智慧型的專家系統處 理來進行建議,機器學習使用者的個人特質與習慣,提供給使用者常用或是滿意的建 議。在提供使用者額外資訊的研究方向或有透過 Web Services 主動遞送資訊給使用者,

(27)

但是也多侷限在單一維度的資訊。本研究希望能透過同一群組的概念提供給使用者排 定行事曆時的建議,參考別人的行程,來安排意想不到的組合資訊,這樣除了可以安 排更好的行程外,也進一步的豐富日常生活。並且提供多個維度的資訊給使用者。透 過推薦系統的幫忙可以使得行事曆排程軟體更有智慧,能夠主動的提供使用者可能需 要的資訊,而不再只是排定事項或是溝通協調磋商時間而已。排定行程時推薦的資訊 也比以往排程軟體只提供會議時間長短的資訊更加多元豐富。 對廠商而言,透過使用者日常生活的排程,業者經由資料的分析可以清楚地了解 該使用者日常生活的重心、關心的事務、喜歡的地點、常接觸的人、時間的分配等。 在進行推薦的時候可以更進一步的結合推薦產品、遞送資訊來達到行銷的目的,更能 夠在確切的時間點推薦客戶可能需要的產品,使得推薦的準確度提高,推薦的時間點 得宜。幫助考慮到多個面向,在使用者需要的時候能夠提供他完整的服務。 5.2 研究限制 本研究的研究限制有以下幾點: 使用者需有互利的觀念,願意經常地的使用此系統,在保護自己隱私下,提供 資訊供大家分享,這樣才能在互利的環境下累積足夠資訊,使系統發揮作用。 或許可能是用的情境是整合入安排商展等系統中。 系統在進行多維度資訊的提供時只能提供目前已有節點的組合資訊,無法提供 未知的資訊,例如以地點樹來說就無法推薦系統所不知道的地點。而因為牽涉 到語意的問題,就算讓使用者自行建構,目前也無法將使用者輸入的新資訊直 接建構在樹狀結構中。 由於多維度的組合情形使得系統演算法負擔比較重,因此當樹的結構越大,節 點越多則演算的效率也會跟著降低。演算的效率進一步改進,乃為後續研究方 向。另外,當樹的結構越龐大之後,使用者能歸於同一個群組的機率就越小。 本研究目前以單一值作為分群的假設,當使用者安排人、事、時、地、物時必 須只能安排一個值,也就是只能有一個節點入選,以主要值的概念來處理分群, 在推薦時也是以主要值來推薦。雖然目前人物樹可以選擇多值,透過平行挖掘 的方式來彌補這一個缺點。但是若要真正容許各維度都是多值,得如何解決多 值所造成的多種排列組合的問題,此乃為後續研究方向。

參考文獻

余忠慶(2002),《多維度序列樣式挖掘之研究》,碩士論文,國立中央大學資訊管

(28)

理研究所。

徐明哲(1993),《圖書館個人化館藏推薦系統》,碩士論文,國立交通大學資訊科 學研究所。

翁頌舜、陳文典(2006),"整合情境資訊之多維度推薦環境",刊於《電子商務與數 位生活研討會》,光碟片。

莊 士 民(2003),《Combining Context-Based and Collaborative Article Recommenda-tion in Literature Digital Libraries》,碩士論文,國立中山大學資訊管理研究所。 莊美娟(2002),《Mining the Inter-Transactional Association Rules of Multi-Dimension

Interval Patterns》,碩士論文,國立台灣大學資訊管理研究所。 陳柏翰(2005),《個人化線上求職推薦系統之研究》,碩士論文,中國文化大學資 訊管理研究所。 陳復 (2005),《台灣商務型網站使用推薦系統現況之研究》,碩士論文,中國文 化大學資訊管理研究所。 陳鴻新(2005),《建構一個案例商議模式的推薦系統-以 IC 測試業服務內容推薦為 例》,碩士論文,華梵大學資訊管理研究所。

曾 靖 茹(2003),《Cluster-Based Collaborative Filtering Recommendation Approach》, 碩士論文,國立中山大學資訊管理研究所。

Adomavicius, G., and Tuzhilin, A. (2001a), "Using data mining methods to build customer profiles," Computer, 34(2), 74-82.

Adomavicius, G., and Tuzhilin, A. (2001b), "Multidimensional recommender systems: A data warehousing approach," Lecture Notes in Computer Science, 2232, 180-184. Adomavicius, G., and Tuzhilin, A. (2001c), "Extending recommender systems: A

multidi-mensional approach," in Proceedings of the International Joint Conference on Artificial

Intelligence (IJCAI-01), Workshop on Intelligent Techniques for Web Personalization.

Adomavicius, G., and Tuzhilin, A. (2005), "Toward the next generation of recommender sys-tems: A survey of the state-of-the-art and possible extensions," IEEE Transactions on

Knowledge and Data Engineering, 17(9), 734-749.

Adomavicius, G., Sankaranarayanan, R. Sen, S. and Tuzhilin, A. (2005), "Incorporating con-textual information in recommender systems using a multidimensional approach," ACM

Transactions on Information Systems, 23(1), 103-145.

Allen, C., Kania, D. and Yaeckel, B. (1998), Internet world guide to one-to-one web

market-ing, New York: John Wiley & Sons.

Balabanovic, M. and Shoham, Y. (1997), "Fab: Content-based, collaborative recommenda-tion," Communications of the ACM, 40(3), 66-72.

(29)

Claypool, M. and Gokhale, A. (1999), "Combining content-based and collaborative filters in an online newspaper," in Proceedings of the ACM SIGIR'99 Workshop on

Recommen-der System: Algorithms and Evaluation.

Delgado, J., Ishii, N. and Ura, T. (1998), "Content-based collaborative information filtering: Actively learning to classify and recommend documents," in Proceedings of the Second

International Workshop on Cooperative Information Agents (CIA'98), 206-215.

Goldberg, D., Nichols, D. Oki, B.M. and Terry, D. (1992), "Using collaborative filtering to weave an information tapestry," Communications of the ACM, 35(12), 61-70.

Good, N., Schafer, J., Konstan, J., Borchers, A., Sarwar, B., Herlocker, J. and Riedl, J. (1999)"Combining collaborative filtering with personal agents for better recommenda-tions," in Proceedings of the Sixteenth National Conference on Artificial Intelligence, 439-446.

Han, J., Cai, Y. and Cercone, N. (1992), "Knowledge discovery in databases: An attribute-oriented approach," in Proceeding of the 18th VLDB Conference, 547-559.

Hanani, U., Shapira, B. and Shoval P. (2001), "Information filtering: Overview of issues, re-search and systems," User Modeling and User-Adapted Interaction, 11(3), 59-203. Hill, W., Stead, L., Rosentein, M. and Furnas, G.W. (1995), "Recommending and evaluating

choices in a virtual community of use," in Proceedings of ACM CHI'95 Conference on

Human Factors in Computing Systems, 194-201.

Hoffman, D.L., Kalsbeek, W.D. and Novak, T.P. (1996), "Internet and web use in the United States: Baselines for Commercial Development," Communication of ACM, 39(12), 36-46.

Igo Jr., F. J., Brand, M. Wittenburg, K., Wong, D. and Azuma, S. (2002), "Multidimensional visualization for collaborative filtering recommender systems," Technical Report TR20002-39, Mitsubishi Electric Research Laboratories.

Jennings, N. R. and Jackson, A.J. (1995), "Agent based meeting scheduling: A design and implementation," IEE Electronics Letters Journal, 31(5), 350-352.

Kozierok, R. and Maes, P. (1993), "A learning interface agent for scheduling meetings," in

Proceedings of the International Workshop on Intelligent User Interfaces, 81-93.

Lewis, D. (1996), Dying for Information: An investigation of the effects of information

over-load in the UK and world-wide, London: Reuters.

McDonald, D.W. (2003), "Ubiquitous recommendation system," Computer, 36(10), 111-112. Middleton, S.E. (2001), "Interface agents: A review of the field," Technical Report Number:

(30)

Mitchell, T., Caruana, R. McDermott, J. and Zabowski, D. (1994), "Experience with a learning personal assistant," Communications of the ACM, 37(7), 80-91.

Resnick, P., Iacovou, N., Suchak, M., Bergstrom, P., and Riedl, J. (1994), "GroupLens: an open architecture for collaborative filtering of netnews," in Proceedings of ACM

Con-ference on Computer Supported Cooperative Work, 175-186.

Schafer, J.B., Konstan, J.A. and Riedl, J. (1999), "Recommender systems in E-commerce," in ACM Conference on Electronic Commerce (EC-99), 158-166

Schafer, J.B., Konstan, J.A. and Riedl, J. (2001), "E-Commerence recommendation applica-tion," Journal of Data Mining and Knowledge Discovery, 5(1-2), 115-152.

Shardanand, U. and Maes, P. (1995), "Social information filtering: Algorithms for automat-ing: Word of mouth," in Proceedings of ACM CHI'95 Conference on Human Factors in

Computing Systems, 210-217.

Wasfi, A.M.A. (1999), "Collecting user access patterns for building user profiles and collab-orative filtering," in International Conference on Intelligent User Interfaces, 57-64.

數據

圖 1 行程安排多維度推薦的概念架構圖
圖 4 時間(開始時間)的分類樹 地點樹(如圖 5)共五層,是以第三層的節點為分群與推薦的依據。系統會依據 群體中計算最多安排次數的方式,對使用者往下一層推薦特定的地點。例如使用者甲 經系統推薦其安排之地點應為「餐廳」,甲可以要求系統往下推薦,以提供更為精細 的餐廳。系統此可能發現「中式餐廳」為相關群組中最常去的餐廳類型,並將之推薦 給甲。因為地點樹有五層,所以系統也會在提醒使用者可以繼續往下層推薦。使用者 若繼續往下,可能會得到「四川餐廳」這個樹葉節點。此外,使用者在選擇地點時會 因為其 Profile
圖 7 資料架構圖
圖 8 分群模組 基本資料的篩選完後,將進行使用量的篩選。由於各使用者使用系統的時間長短 不一,使用頻率也不相同。所以,安排的行程數量將有頗大的差距,若是將兩個使用 量差距大,雖即使行程安排模式相似的使用者列為同一群,仍可能造成某些偏差。故 建議先對所有使用者計算其安排過的行程數除以全部資料庫中的行程總數,得到其使 用比率,可分為高、中、低三使用量群。 依使用量分完大群後,接下來,將對每一大群中之使用者找出其行程安排模式相 似的參考使用者。由於有五個維度,每個維度的節點可能很多,其組合起來的行程安 排形式數
+6

參考文獻

相關文件

1.本公司申請輸入經濟部未公告准許輸入之大陸地區原物料零組件,詳如附件明細表,請 惠予核

能熟悉電腦概念,包括作業 系統、應用軟體和檔案輸出 入硬體設備的安裝、操作和 維護。2.

在數位系統中,若有一個以上通道的數位信號需要輸往單一的接收端,數位系統通常會使用到一種可提供選擇資料的裝置,透過選擇線上的編碼可以決定輸入端

- 絕對數值為零

1.推(自)薦表紙本1份及推(自)薦資料電子檔,電子檔格式包括 word 檔(或 odt 檔)及 pdf

下列哪一種記憶體屬於非揮發性記憶體, 不會因電源關閉而使其中的資料消 失, 但是可以透過電壓的方式重複抹除資料, 可用於基本輸入/ 輸出系統 (Basic Input / Output System,BIOS)

●報名資料填寫完畢後,於首頁可點選欲列印之報名表,即可進入列印檢視頁面,請利用瀏覽器列

操作流程: 系統選單-&gt;財產管理系統-&gt;點選報廢申請單-&gt;填寫報廢申請單資料(主 單、明細)-&gt;點選確認