• 沒有找到結果。

文獻[8]中的權重給定公式

第六章 結論與未來研究方向

方程式 1 文獻[8]中的權重給定公式

(within if

within (

1. 一開始 k 的表示式是一個具有九個屬性的向量,其中每個屬性的值都為零。

k = (0, 0, 0, 0, 0, 0, 0, 0, 0)

2. k 屬於 A.2 這個分類,所以 k 在 A.2 分類上的權重設為 1。

k = (0, 1, 0, 0, 0, 0, 0, 0, 0)

3. k 所在的分類 A.2 有一條關聯規則為 A.2 ⇒ C.2,所以 k 在 C.2 分類上的權重也 設為 1。

k = (0, 1, 0, 0, 0, 0, 0, 1, 0)

4. A.1 和 A.3 跟 k 都屬於 A 這個第一層分類之下,所以 k 在 A.1 和 A.3 這兩個分類 上的權重都為 0.5。

k = (0.5, 1, 0.5, 0, 0, 0, 0, 1, 0)

5. 又 k 所在的第一層分類 A 有一條關聯規則為 A ⇒ B,所以 k 在第一層分類 B 之 下的分類 B.1、B.2 和 B.3 這三個分類上的權重都可設為 0.25。

k = (0.5, 1, 0.5, 0.25, 0.25, 0.25, 0, 1, 0)

所以最後商品 k 的向量表示式為 (0.5, 1, 0.5, 0.25, 0.25, 0.25, 0, 1, 0),代表商品 k 的 屬性。將商品的表示式找出來之後,可據以建立顧客的表示式,最簡單的方式就是依照 顧客的購買記錄統計顧客消費過的商品,依照這些商品的表示式來建出顧客的興趣向量 表示式。之後可以利用這個模型,透過顧客和商品分別的表示式,來推測顧客對商品可 能的興趣程度。

第五節 圖書推薦系統

圖書館中事實上已經有許多推薦系統以各種形式存在,帶給讀者許多的便利性。以 下我們將以國立交通大學浩然圖書館為例,來舉出幾種目前圖書館中存在的推薦系統。

2.5.1 關鍵字搜尋

關鍵字查詢是一般圖書館使用率最高的功能,通常使用者利用這個功能來找尋圖書 館中需要的館藏。圖 3 是浩然圖書館館藏查詢系統的使用者介面,其中提供有書刊名、

標題、作者、出版商等多達 11 種欄位來供使用者填入關鍵字來查詢。查詢的結果會呈 現出所有含有使用者輸入關鍵字的館藏,這些回傳的資料就相當於是查詢系統給予使用 者的推薦館藏,如圖 4 為以書刊名關鍵字“圖書館”的查詢結果。

但是關鍵字查詢通常只是單純的字串比對,若使用相同的關鍵字查詢,找出來的資 料都是一樣的。而且萬一使用不恰當的關鍵字搜尋,往往找到的資料不是過多就是過 少,無法達到讀者預期的需要。

圖 3 交通大學浩然圖書館館藏查詢使用者介面

圖 4 交通大學浩然圖書館館藏查詢結果呈現介面

2.5.2 主題式人工推薦

當圖書館中某類館藏資料多到一定的程度,並且有專家的協助,有時候會把這類的 館藏以主題分類陳列。如圖 5 是浩然圖書館中一個以科幻圖書為主題的主題式推薦,在 這個例子中,主要的推薦是左方已經分門別類過的館藏,對科幻圖書有興趣的人可以很 方便地找到各種分類的科幻圖書。而圖 6 是點選左邊的“時光旅行”項目後出現的推薦清 單。圖 5 右方的查詢事實上仍是關鍵字查詢,只是在這裡的查詢會把搜尋類別侷限在科 幻圖書上。

主題式人工推薦最大的好處就是呈現出來的推薦準確度相當高,加上已經有經過專 家的分類,讀者可以很容易取得符合自己興趣的館藏,但缺點是需要人工長期維護以保 持更新。

圖 5 科幻圖書館藏的主題推薦

圖 6 科幻圖書館藏中的分類推薦 -以“時空旅行”分類為例

2.5.3 館藏間的關連性

資料探勘的技術已經普遍應用在各領域,主要用來找尋大量資料中的規則性和關聯 性。現在這種技術也逐漸引入圖書館中,在[28], [29]這兩篇論文中就提出以資料探勘的 方法來找出館藏間的關聯性,找出哪些館藏經常會被讀者一起借閱。然後當讀者在查詢 館藏或者瀏覽自己的借閱記錄時,可以查看還有哪些館藏是常常一起被借閱的,藉此來 提高館藏的利用率。如圖 7 是以“資料庫”為書刊名關鍵字查詢館藏資料回傳的結果,圖 8 為某人的借閱歷史查詢結果。其中按下圖 7 中最右邊的“推薦”欄位或圖 8 中最右邊的

“感想”欄位,就可以看到該本書的關聯館藏,得知有哪些館藏常常跟那本書一起被借 閱,如圖 9 為“溫馨廚房咖啡屋”這本書的相關館藏資料。

圖 7 個人化智慧型 館藏查詢結果-以“資料庫 ”為書刊名關鍵字查詢

圖 8 個人借閱歷史查詢介面

圖 9 推薦相關館藏畫面

2.5.4 個人化的智慧型查詢

在[30]中提到,圖書館面對與日俱增的數位或紙本資源,傳統的搜尋引擎已無法滿 足讀者的需求。因此[30]這篇論文將個人化資訊服務技術應用在圖書館上,建立一套個 人化數位圖書資訊環境-PIE@NCTU。

其中 PIE@NCTU 中最重要的改變是將館藏查詢系統採用個人化的智慧型查詢系統 (Intelligent Personal Search Engine) 以契合使用者的需求。這套具個人化的館藏查詢系統 會收集使用者搜尋時所用的關鍵字來判斷使用者的興趣,並且依此產生一些系統關鍵字 來代表使用者的興趣。另外使用者也可以自己增加關鍵字來告知系統自己的興趣所在,

或者自己選定有興趣的館藏類別。當使用者查詢館藏資料時,系統會利用系統判斷關鍵 字、使用者自訂關鍵字和使用者自選類別這三種資訊,來判斷使用者最需要的館藏,把 查詢結果先加以過濾和排序後再呈現給使用者。

另外一個重要的功能是新書通告 (New Arrival Notice),當圖書館有新進館藏時,系 統可以根據使用者之前留下的個人興趣來判斷哪些新進館藏是使用者可能會感興趣 的,並將這些新進館藏的消息通知使用者。

圖 10 為目前交通大學浩然圖書館的個人化智慧型查詢系統介面,查詢結果呈現方 式如圖 7 所示,其中上方的“二個燈”和“一個燈”表示和讀者興趣的符合度,燈數愈高代 表愈契合讀者興趣,最高為五個燈。

圖 10 個人化智慧型查詢系統介面

以上這幾種圖書館所提供的推薦服務,都能提供給讀者搜尋資料上莫大的幫助。尤 其在現在許多圖書館都朝向電子圖書館 (e-Library) 或數位圖書館 (Digital Library) 的 方向前進,提供給讀者即時且便捷的服務是圖書館的首務。所以必須運用科技進步帶來 的新技術和新方法,藉以提升圖書館服務的品質並增加服務的項目,使圖書館跟上時代 逐漸成長進化。

第三章 圖書館館藏推薦

本論文圖書館個人化館藏推薦系統中所採用的推薦方法,是結合協力式過濾和內容 導向過濾這兩大方法。本章分別介紹這兩種方法如何應用在系統上,並說明如何結合這 兩個方法。

第一節 協力式過濾的推薦方法

在進行協力式過濾時,我們首先用關聯規則探勘找出使用者間的關係,希望藉以找 出具有相同興趣的使用者群。然後在具有相同興趣的使用者之間,推薦給彼此曾經借閱 過的館藏。

我們將每一本書當作一筆交易 (Transaction) ,而其中的項目 (Item) 為借過這本書 的人,例如現在有 A, B, C 三本書,和 1, 2, 3, 4, 5 這五個讀者。從這五個讀者的借閱歷 史檔中,可以建立一個交易集 (Transaction Set) ,其中每筆交易表示每本書曾被哪些讀 者借閱過。如表 1 中的第一筆資料代表 A 這本書曾被讀者 1, 2, 4, 5 這四個人借閱過,

第二筆資料代表 B 這本書曾被讀者 1, 3, 5 這三個人借閱過,其他筆資料以此類推。

書 借閱讀者群 A 1, 2, 4, 5 B 1, 3, 5 C 2, 4, 5

表 1 以一本書為一筆交易的交易集

假設最小支持度 (Minimum Support) 為 2,則從表 1 的交易集經過關聯規則探勘 後,可以得到一些項目集 (Itemset),若項目集的支持度高於預設的最小支持度,即可稱 為頻繁項目集。這些出現在同一個頻繁項目集中的讀者群,就是我們想找出來的相同興

趣讀者群。如表 2 所示,在表 1 的例子中可以得到 3 個頻繁項目集,或稱為三個讀者 群,其中每一群裡的讀者彼此間具有相同興趣。

群編號 頻繁讀者群 支持度 S001 1, 5 2 S002 2, 4 2 S003 3, 5 2

表 2 代表具有相同興趣讀者群的頻繁項目集

雖然用一般關聯規則探勘可以找出相同興趣讀者群,可是在圖書館的環境下卻遇到 兩個問題。第一個問題是在圖書館中,借閱同一本書的讀者在比例上不多,而利用一般 關聯規則探勘所找出來的相同興趣讀者群都是要曾借閱過多本相同書的讀者,這造成能 找出來的相同興趣讀者群不夠多,只佔全部讀者群中的一小部分。這種結果會嚴重影響 到後來的推薦,因為協力式過濾推薦需要從跟讀者有相同興趣讀者群中,找出其他讀者 常借閱的書來當推薦,萬一找不到跟讀者有相同興趣的讀者群,就無法? 讀者找出適合 的推薦。第二個問題是圖書館中大多數讀者借閱館藏的數量並不多,在[29]中曾指出在 交通大學浩然圖書館中約有 1/2 的讀者其借閱數少於 10 本,這使得在關聯規則探勘時必 須採用非常小的最小支持度,才能找出足夠的頻繁項目集。但是當最小支持度設太低時 便需要耗費大量的時間進行探勘,而且也常因此找出不恰當的頻繁項目集。

對於第一個問題,改善的方法是放鬆讀者屬於同一筆交易的限制。之前是以一本書 為一筆交易,所以讀者必須借閱過相同的書才會屬於同一個交易中,現在我們改以一個 類別為一筆交易,只要讀者曾借閱過這個類別中的任一本書就屬於同一筆交易中,亦 即,將原來的交易集中,屬於同一類書的交易聚集起來,形成一個以一個類別為一筆交 易的交易集。因為在圖書館中,如果某本館藏被借閱走了,則其他讀者就無法借閱了,

這時候通常讀者還是會借閱相同類別中其他相關的館藏。所以在圖書館這種環境下,要 判斷讀者是否跟其他讀者有相同興趣,只依讀者間有沒有借閱過相同的館藏來判斷兩人

是否興趣相同,在現實上太過嚴苛了,要是依照彼此之間是否借閱過相同類別的館藏來 判斷會顯得合理許多。基於上述理由,我們改變原本以一本書為一筆交易的形式,改成 以一個類別為一筆交易,只要借過同一個類別下任一本書的讀者,都視為興趣類似,而

是否興趣相同,在現實上太過嚴苛了,要是依照彼此之間是否借閱過相同類別的館藏來 判斷會顯得合理許多。基於上述理由,我們改變原本以一本書為一筆交易的形式,改成 以一個類別為一筆交易,只要借過同一個類別下任一本書的讀者,都視為興趣類似,而