• 沒有找到結果。

個人化與群體化電子圖書館服務之分析與設計

N/A
N/A
Protected

Academic year: 2021

Share "個人化與群體化電子圖書館服務之分析與設計"

Copied!
12
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會補助專題研究計畫成果報告

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

※ ※

個人化與群體化電子圖書館服務之分析與設計

※※※※※※※※※※※※※※※※※※※※※※*※※※※※※※※※※※※※※

計畫類別:■個別型計畫 □整合型計畫

計畫編號:

90-2213-E-009-083-執行期間: 2001 年 8 月 1 日至 2002 年 7 月 31 日

計畫主持人:楊維邦

執行單位:國立交通大學資訊科學系

本成果報告包括以下應繳交之附件:

□ 赴國外出差或研習心得報告一份

□ 赴大陸地區出差或研習心得報告一份

出席國際學術會議心得報告及發表之論文各一份

□ 國際合作研究計畫國外研究報告書一份

(2)

個人化與群體化電子圖書館服務之分析與設計

計畫編號:NSC 89-2218-E-009-009

執行期限:89 年 8 月 1 日至 90 年 7 月 31 日

主持人:楊維邦 交通大學資訊科學系

計畫參與人員:柯皓仁 交通大學圖書館

計畫參與人員:楊雅雯 交通大學資訊科學系

計畫參與人員:吳安琪 交通大學資訊科學系

計畫參與人員:戴玉旻 交通大學資訊科學系

計畫參與人員:陳莉君 交通大學資訊科學系

計畫參與人員:嚴文亨 交通大學圖書館

摘要

近年來,電子圖書館已成為圖書館界努力追尋 的目標。電子圖書館的主要元素有三:電子化館 藏、電子化作業和電子化服務。由於個人化和社群 化將是未來圖書館電子化服務的發展趨勢,因此在 本研究計畫中我們將探討以資訊擷取(Information Retrieval)和資料探勘(Data Mining)的技術來達成 個人化、社群化圖書館電子服務的目標。本計畫的 主要工作項目有三: 1. 研究動態追蹤讀者興趣的相關理論,並將其應 用在個人化電子服務。個人化電子服務必須根 據讀者的需求提供其必要的資訊,因此如何了 解讀者的興趣並追蹤其興趣的更迭乃是一個 非常重要的議題。本計畫將提出個人興趣關連 圖(Key-Phrase Relationship Graph, KRG)的概 念來動態追蹤讀者興趣。 2. 探討資料探勘相關理論,發展適用於社群化電 子圖書館的資料探勘演算法。擁有共同興趣的 讀者通常會借閱類似的書籍,反之亦然。本計 畫擬由交大圖書館讀者借閱與預約歷史記錄 中發掘具有共同興趣的讀者群組,了解其借閱 的共通特性及順序,並根據資料探勘的結果達 成社群化電子圖書館服務。 3. 根據以上的理論實作一套交通大學個人化數 位圖書資訊環境系統雛形(PIE@NCTU)。 關鍵詞:電子圖書館,電子化服務,資訊擷取,讀 者興趣追蹤,資料探勘,相關規則探勘, 個人化,社群,個人資訊環境

Abstract

In recent years, libraries around the world have set the goal to move toward “electronic library”. Electronic collection, electronic operation, and electronic service are the three dimensions of electronic library. Because the tendency of electronic service is to facilitate personalization and grouping users into communities for sharing common interests and knowledge, in this project we will attempt to develop such kind of electronic service by using the techniques of information retrieval.

In this project, we will focus on three research topics:

1. Study how to dynamically track user interests, and apply the research achievement to personalized electronic service. Because a well-designed personalized electronic-service system has to provide services to a user according to his/her specific interests, it is essential for the system to know users interests and track the evolution of user interests. In this project, we will propose the idea of Key-Phrase Relationship Graph (KRG) to dynamically track the interests of users.

2. Study the data mining technique, and apply data mining to the electronic service that enable the formation of user communities. We believe users having common interests will borrow similar materials from library, and vice versa. Data mining is suitable for mining patterns for user communities. In this project, we will attempt to discover user communities with common reading interests by mining the

(3)

NCTU Library patron’s borrowing and reserving history log.

3. Implement a prototype system, called

Personalized Information System at NCTU

(PIE@NCTU), to prove the feasibility of the research achievements.

1. 緣由與目的

近年來,電腦與網路科技的蓬勃發展,帶動了 電子商務 (Electronic Commerce)的熱潮。電子商務 的經營者皆期望經由網際網路接觸更廣大的客 戶,更無遠弗屆地深入所有消費族群。然而,若想 在眾多電子商務經營者中脫穎而出,其關鍵就在於 是否能了解客戶的需求,提供每位客戶量身訂作之 個人化服務,亦即採用客戶關係管理 (Customer Relationship Management – CRM)的理念,並利用電 腦系統紀錄並分析客戶的需求,從而建立一對一之 個人化服務,以期增加客戶的滿意度與忠誠度,並 確保在激烈商業競爭的環境裡獲利[1][2]。 儘管圖書館並非以營利為目的之商業機構,然 而圖書館的最終目的,乃在於使讀者有效地利用圖 書館的資料,協助讀者獲取資訊、運用資訊,從而 產生知識。因為每位讀者都有其特別的資訊需求, 圖書館的服務應該把每位讀者視為不同的個體,儘 量去滿足每一讀者個別的資訊需求。從這個觀點來 看,若能採用 CRM 的理念並推動個人化服務,相 信必能提昇圖書館對讀者的服務。 與個人化相對的概念是群體化。有時知識的產 生不能光靠單一個體,而是得藉由具有相同興趣、 專長的個體組成社群(Community),彼此激發靈感 與分享心得,方能促成知識的產生。表面上看來, 個人化和群體化似乎是互斥的,但實際上對圖書館 的服務而言,卻是一體兩面。 由於圖書館自動化系統(以下簡稱自動化系統) 中儲存了圖書館館員專業知識的成果(編目資料) 與讀者背景資料,且記錄了館藏的流通狀況及流通 歷史,因此當圖書館界欲實施 CRM 理念並推動個 人化和群體化服務之時,若能以自動化系統為基 礎,將可收事半功倍之效。觀察現有圖書館自動化 系統所提供的功能,大多侷限於圖書館本身作業的 自動化,極少部分的功能是著眼於讀者服務,遑論 個人化與群體化服務。以讀者最常接觸的線上公用 目錄 (Online Public Access Catalog, OPAC,或稱館 藏查詢系統)而言,除館藏查詢之外,僅具備基本 的個人化服務,如館藏續借、館藏預約、借閱狀況 查詢、讀者基本資料查詢與修改等。至於群體化服 務更是付之闕如。

本 研 究 計 畫 的 目 標 在 於 運 用 資 訊 擷 取 (Information Retrieval)和資料探勘(Data Mining)的 技術達成個人化和社群化的電子圖書館服務。我們 將進行相關的理論研究並實作系統: 在理論研究方面:針對個人化電子圖書館服 務,我們將進行研究動態追蹤讀者興趣(Tracking User Interests)的相關演算法;在社群化電子圖書館 服務方面,我們首先採取將採取 Apriori[3] [4]、GSP [5]、H-Mine[6]等現有資料探勘的演算法,將之應 用在社群化電子圖書館服務上,希望能夠找出讀者 的特性以提升圖書館的業績,進而改良 GSP 與 H-Mine 演算法,使其更能適用於社群化電子圖書 館服務。 在系統實作方面:實作兼具個人化和社群化能 力 的 PIE@NCTU 系 統 (Personalized Information Environment at NCTU),以驗證所發展之理論與演 算法的可行性。

2. 文獻探討

本節針對個人化以及群體化服務的相關文獻 加以探討。

2.1. 個人化服務

目前 許多網際網 路服務都提供 了個人化 服 務,如我的 Yahoo!奇摩(http://tw.mykimo.yahoo.com) 等 ﹔ 與 圖 書 館 相 關 的 個 人 化 服 務 則 有 MyLibrary[7]、MyLirary@NCState[8]等。 French 與 Viles 二位學者在 1999 年提出個人 化服務環境的架構[9]。概括來說,個人化服務環 境應該要具備以下條件: (1) 個人化的使用者界 面 (Customizable User Interface) ,讓使用者依自 己 的 喜 好 組 織 使 用 環 境 ; (2) 有 效 的 檢 索 (Effective Search),能提高檢索結果的正確性,引 導使用者尋找資料,提高查全率 (Recall) ; (3) 確 保使用者的隱私權 (Privacy) 。我們認為現階段的 個人化服務系統應該具備以下條件:

2.1.1 個人化使用界面

個人化使用界面讓使用者依據個人的喜好來 規劃其使用界面,前述幾種個人化服務均具備讓使 用者設定個人化使用界面的功能。

2.1.2 個人資料紀錄 (User Profile)

個人化服務的每位使用者都有其個人的資料 記錄,儲存背景、興趣、學科專長、檢索歷史等資 料,做為個人化服務的主要依據,其中尤以個人興 趣紀錄最為重要。個人興趣紀錄的主要來源有二: (1) 由讀者人工填寫,(2)由系統自動推導產生。 若個人興趣記錄是由人工填寫產生的,則此類 系統均提供一個興趣關鍵字詞的輸入界面,讓使用 者 能 自 行 設 定 感 興 趣 的 關 鍵 字 。 像 MyLibrary@NCState 即是根據讀者自行設定的關 鍵字詞提供資訊選粹服務。這種作法雖然很直覺 (因為是由使用者輸入興趣資料) ,但是使用者往 往 會 選 擇 過 於 普 遍 的 字 詞 來 描 述 自 己 的 興 趣

(4)

[10],導致對於興趣的描述不夠精確。再者我們亦 不能期望使用者都是勤勞、有足夠耐心,且總是能 正確輸入關鍵字詞的。 至於自動產生個人興趣紀錄的系統,通常是根 據使用者的使用歷程或特定行為來推導興趣,常見 的方法有:(1) 將使用者瀏覽過的網頁中所含的關 鍵字詞記錄下來當成使用者的興趣[10]﹔(2) 利用 電子郵件通信紀錄來抽取關鍵字詞當成使用者興 趣[10]﹔(3) 以交易行為推導興趣 (例如 Amazon 會以顧客買過的書之關鍵字為興趣)。

2.1.3 資訊選粹服務

有了個人興趣記錄之後,便可提供資訊選粹 (Selective Dissemination of Information, SDI) 服 務。資訊選粹利用資訊過濾 (Information Filtering) 技術分析出個別使用者感興趣的新進資訊。資訊過 濾 技 術 可 分 為 內 容 式 資 訊 過 濾 (Content-based Information Filtering) 以 及 協 力 式 資 訊 過 濾 (Collaborative Information Filtering) 二種[11]。內容 式資訊過濾主要是以資訊內容作為過濾的依據並 加以分析比較,使用者在興趣檔中只要紀錄感興趣 的關鍵字詞,系統便會將新進資訊和興趣檔做比對 達 成 資 訊 過 濾 。 諸 如 LA Times Custom News Services (http://www.latimes.com/) 、 MyLibrary @NCState 均採用內容式資訊過濾來提供資訊選粹 服務。 協力式資訊過濾不直接分析資訊內容,而是找 出與使用者背景、知識、興趣接近的同好或社群, 再針對使用者的查詢主題,從這些同好或社群成員 感興趣的資訊中,分析並選取最可能相關的資訊提 供參考[12]。因為協力式資訊過濾較內容式資訊過 濾複雜許多,因此實際採用協力式資訊過濾的系統 較少。

2.1.4 個人化檢索

所謂 個人化檢索 是指能依個別 使用者的 背 景、興趣或需求,幫助使用者尋找資訊。個人化檢 索的可能應用有:(1) 提供適合使用者的背景、年 齡等因素的資訊, 例如同樣是檢索”網路多媒體” 這個主題,提供給小學生和提供給資訊系所博士生 的資訊就應該要加以區別[12]﹔(2) 將檢索結果根 據使用者的個人興趣加以排序(Ranking),把使用者 感興趣的檢索結果排列在較明顯的位置。 根據個人興趣紀錄提供資訊選粹服務的系統 頗多,然而將其應用在個人化檢索上卻很少見,這 對建置個人化資訊環境是一個很大的遺憾。有鑑於 此,我們在本計畫中提出一個利用個人興趣紀錄及 資訊過濾技術達成檢索個人化的方法。

2.2. 資料探勘與群體化服務

資料探勘(Data Mining)[13]也叫做資料庫探勘 (Database Mining)或資料庫知識發掘(Knowledge Discovery in Database)。簡單地說,資料探勘是從 儲 存 於 資 料 庫 (Database) 、 資 料 倉 儲 (Data Warehouse) 或 其 他 資 訊 儲 存 器 (Information Repository)的大量資料中,發掘出具有價值的知識 之過程。資料探勘在近年來廣泛地運用在各種領域 或行業,例如行銷、財務、銀行、製造、通訊、保 險等,用以發掘潛在客戶、管理異常狀況、管理客 戶關係、或作為企業決策的參考。例如超級市場能 將資料探勘運用於發掘顧客的消費模式,並利用所 發掘的消費模式研擬促銷或貨物排架策略,以提昇 超級市場的業績。 資 料 探 勘 主 要 功 能 有 分 類 規 則 歸 納 (Classification)、推估分析(Estimation)、預測分析 (Prediction) 、 相 關 規 則 探 勘 (Association Rules Mining)、同質分群(Clustering) 等五種。在本計畫 中,我們將資料探勘中的相關規則探勘應用以及循 序規則探勘(Sequential Pattern Mining)在圖書館的 群體化服務,以自動化系統中的書目、館藏、借閱 與預約歷史記錄為來源資料,探索讀者的社群特 性。本計畫擬探索的讀者社群關係包含館藏借閱的 共同性及順序性。發掘出讀者社群關係後,我們期 望能運用這些社群關係來吸引讀者到館借閱、提昇 館藏借閱率、提昇讀者忠誠度、促進館藏流通率。 以下我們簡單介紹相關規則探勘的基本概念。 相關規則探勘最常應用在商店交易記錄資料 庫,用以分析並發掘顧客的交易模式,並根據發掘 出來的交易模式採取適當的行銷策略,以提昇商品 的銷售率。例如:20%買牙刷的顧客也會買牙膏、 毛巾、和香皂就是一個典型的相關規則。相關規則 探勘的正規敘述([3])如下:

令 I={i1,i2,…,im} 是由交易項目(Item)組成的

集合,由一個或一個以上的項目所組成的集合稱為 項 目 集 (Itemset) 。 令 資 料 庫 D 是 由 一 群 交 易 (Transaction) T 所組成的集合,每個 T 為一項目 集,代表交易記錄,T ⊆ I ,每個交易記錄有其唯 一的識別碼,稱為 TID。如果 X ⊆ I 且 X ⊆ T,則 稱 T 包含(Contain) X。以商店的應用來看,每一種 商品就是一個交易項目,一個顧客在某次來訪時中 所購買的商品所成的集合即為一交易。 一個相關規則 (Association Rule) 表示成 X ⇒ Y,其中 X ⊆ I ,Y ⊆ I,X ∩ Y = ∅ 。若 D 中 包含 X 的交易裡有 c%也同時包含了 Y,我們就說 規則 X⇒Y 的確信值 (Confidence) 為 c%;如果 D 中包含 X∪Y 的交易記錄有 s%,我們就說規則 X⇒Y 的支持度 (Support) 為 s%。相關規則探勘定 義為:給定交易記錄資料庫 D,在當中找出所有確 信值和支持度大於最小確信值跟最小支持度的規 則。

(5)

Agrawal 等人[3][4]將相關規則探勘分為二個 子問題: 1. 子問題 1:找到所有支持度大於最小支持度的 項目集。為了探勘方便起見,有時把某一項目 集 的 支 持 度 定 義 為 包 含 此 項 目 集 的 交 易 個 數,而不是原來的交易百分率。支持度大於最 小 支 持 度 的 項 目 集 稱 為 大 項 目 集 (Large Itemset)。 2. 子問題 2:用子問題 1 中所找到的大項目集來 產生所期望的規則。此步驟的演算法非常直 接,即:對於任一大項目集 L,找出其所有非 空子集合。對於每個非空子集合 a,如果規則 a⇒(L-a)的確信值(也就是 support(L)/support(a)) 大於最小確信值,則此規則即符合所求。 表 1 為一個交易資料庫範例。在此交易資料 庫中共包含四筆交易,其交易紀錄識別碼分別為 100、200、300、400。此交易資料庫中共有五種交 易的項目(或商品):牙刷、牙膏、毛巾、手錶、香 皂,為方便電腦運算起見,我們將這五種商品依序 賦予 1、2、3、4、5 的代碼。假設最小支持度為 2, 則只要出現在交易資料庫二次或以上的項目集便 為大項目集,因此如表 2 所示,本範例中的大項 目集包含{1}、{2}、{3}、{5}、{1, 2}、{2, 3}、{2, 5}、{3, 5}、{2, 3, 5}﹔本範例中可能出現的相關規 則列於表 3,以{2, 5}⇒{3}此一相關規則來看,其 確信值為 67%,這代表有 67%買 2 和 5 的客人也 會時買 3(在 200, 300, 400 這三筆交易中都有 2 和 5,但是只有 200 和 300 這兩筆交易有 3),而同時 購買 2, 3, 5 的交易有二次(即 200 和 300 這兩筆交 易)。 若設定之最小確信值為 100%(在實際狀況下 不可能如此設定),則探勘得到的相關規則有: {1}⇒{3}、{2}⇒{5}、{5}⇒{2}、{2, 3}⇒{5}、{3, 5}⇒{2}等五個規則,分別代表{牙刷}⇒{毛巾}、 {牙膏 }⇒{香皂}、{香皂}⇒{牙膏}、{牙膏, 毛 巾}⇒{香皂}、{毛巾, 香皂}⇒{牙膏}。 表 1 交易資料庫範例 資料庫 D 交易紀錄識別碼(TID) 項目集(Itemset) 100 1 3 4 200 2 3 5 300 1 2 3 5 400 2 5 表 2 大項目集(最小支持度為 2) 大項目集 支持度 {1} 2 {2} 3 {3} 3 {5} 3 {1, 3} 2 {2, 3} 2 {2, 5} 3 {3, 5} 2 {2, 3, 5} 2 表 3 相關規則 相關規則 確信值 {1}⇒{3} 100% {3}⇒{1} 67% {2}⇒{3} 67% {3}⇒{2} 67% {2}⇒{5} 100% {5}⇒{2} 100% {3}⇒{5} 67% {5}⇒{3} 67% {2}⇒{3, 5} 67% {3}⇒{2, 5} 67% {5}⇒{2, 3} 67% {2, 3}⇒{5} 100% {2, 5}⇒{3} 67% {3,5}⇒{2} 100% 從相關規則探勘延伸出各式各樣的問題,其解 決方法和基本的問題息息相關,且可應用在更多領 域。以下簡述目前的相關研究[14]: 1. 有些研究考慮到顧客多次交易的狀況,同一 位顧客會有先後時間關係的交易記錄。此類 研究的目的是想要在這些交易記錄中找出 顧客最常買的商品序列(Sequence),此序列 是由項目集所組成,而每一個項目集內的項 目是不考慮個數且沒有順序關係的。此種相 關規則探勘又稱為循序規則探勘(Sequential Pattern Mining)。 2. 支持度和確信值是用來控制產生規則多寡 的兩個限制,除了這二個限制外,有些研究 還定義更多的限制,繼而利用這些限制的特 性來加速探勘。 3. 在實際的應用環境中,資料庫內的交易記錄 筆數會隨著時間而增加或減少,而資料探勘 要耗費龐大的計算時間,若是每次資料庫一 更新就重新探勘將會浪費很多的時間,相對 地若只探勘資料庫更新的部份便可節省很 多時間,因此有些研究希望只探勘資料庫增 加或減少的部份就能得到所有的規則,此即 漸進更新(Incremental Update)問題。 4. 有些研究除了考慮交易記錄之間的順序關 係外,也探討交易記錄之項目集內的項目順 序關係。 5. 有些研究將交易記錄中每一個交易項目的 個數考慮進去,或者將交易項目分類,以分 類來當相關規則的項目。

(6)

3. 動態學習使用者興趣

個人化服務的關鍵技術在於如何準確得知使 用者的興趣。在圖書館自動化系統(如線上公用目 錄)中,使用者的資訊需求經常是透過檢索來滿足 的,因此,我們認為使用者的興趣或資訊需求能夠 從其曾經用過的檢索策略來解讀。基於此一概念, 在本論文中,我們考慮個別使用者曾經在檢索策略 中用過的關鍵字詞的頻率、各關鍵字詞間的相關 性,以及時間對興趣的影響,來動態學習其興趣。 本節先提出一個動態學習使用者興趣的演算 法,並透過一個範例來說明演算法;接著說明如何 根據此演算法實作資訊選粹服務和個人化檢索。

3.1. 個人興趣關連圖

若要 提出一個能 有效偵測使用 者興趣的 方 法,首先必須對”興趣”的特性有所了解。我們認為 每個人的興趣通常會維持一段時間,且隨著歲月流 逝而有所改變,因此,偵測使用者興趣的演算法必 須要能隨著時間修正使用者的興趣 (興趣加強或 減弱)。如前所述,本計畫假設使用者的興趣可由 其曾使用過的檢索策略來解讀,在綜合考量時間因 素和檢索行為的情形下,我們針對每位使用者曾用 過的檢索策略,建立個人興趣關連圖 (Personal Keyphrase-Relationship Graph,簡稱 PKRG)。個人 興趣關連圖的主要用途在於計算單一使用者曾用 過的各關鍵字詞的權重,以及該使用者認為各關鍵 字詞間的關連性,從而推演使用者的興趣。

3.1.1 個人興趣關連圖的建立

對於每一位使用者,我們會為其建立專用的個 人興趣關連圖(PKRG)。PKRG 為一有向圖(Directed Graph),圖 1 為 PKRG 的範例。如圖 1 (a)所示, PKRG 中的每一個端點 (Vertex) Vi 代表使用者曾 在檢索策略中用過的關鍵字詞;每一條邊線 (Edge) Eij 表示使用者曾用過以該邊線兩端點 (ViVj) 代表之關鍵字詞做 “且 (AND) ” 運算所產生的檢 索策略 (例如:‘詩 AND 古典’)。 我們為 PKRG 中的每個端點和邊線都賦予權 重(Weight):端點 Vi的權重代表使用者對關鍵字詞 Vi感興趣的程度,邊線 Eij的權重則代表使用者對’ Vi AND Vj’此檢索策略感興趣的程度,同時也代表 使用者認為 Vi 和 Vj這兩個關鍵字詞的關連性。當 系統發覺一位使用者執行了新的檢索策略’x AND y’時,系統會自動在該使用者的 PKRG 中產生二條 邊線:Exy 和 Eyx。我們假設在一檢索策略中,使 用者對第一個關鍵字詞會比第二個關鍵字詞有興 趣,所以 Exy的權重會高於 Eyx的權重。 ba ab

e

e

>

A B ab

e

ba

e

(a) (b) 詩 詞 古 典 數 位 圖 書 館 關 鍵 字 詞 關 鍵 字 詞 間 的 權 重 圖 1 個人興趣關連圖 (Personal Keyphrase-Relationship Graph, PKRG)

3.1.2 權重計算 (Weight)

PKRG 中 的每個 端點和 邊線 都具有 一個權 重:端點的權重代表使用者對相對應的關鍵字詞感 興趣的程度﹔邊線的權重則代表使用者對相對應 的檢索策略感興趣的程度,同時也代表相對應的二 關鍵字詞的關連性。計算權重時需考量三個因素: (1)單一關鍵字詞出現在檢索策略中的次數,(2)單 一檢索策略曾使用的次數,以及(3)時間對使用者 興趣的影響。我們假設時間對使用者興趣的影響可 依固定時間劃分成若干區段,在此假設下,我們採 用下列步驟來計算 PKRG 中每一個端點(代表關鍵 字詞)和邊線(代表檢索策略)的權重。 計算個人關鍵字詞的權重 計算單一時間區段內曾使用過的關鍵字詞之 權重﹔ 計算各個時間區段內時間對興趣的影響係 數﹔ 結合各個時間區段內求得的個人關鍵字詞權 重,以及時間對興趣的影響係數,求得整體的 關鍵字詞權重。 計算個人檢索策略的權重 計算單一時間區段內曾使用過的檢索策略之 權重﹔ 計算各個時間區段內時間對興趣的影響係 數﹔ 結合各個時間區段內求得的個人檢索策略權 重,以及時間對興趣的影響係數,求得整體的 檢索策略權重。 接下來我們將詳細介紹計算個人關鍵字詞和 檢索策略權重的方法。

(7)

3.1.2.1 單一時間區段內關鍵字詞的權重計算 我們將單一時間區段內某關鍵字詞的使用頻 率加以正規化之後所得的值,作為單一時間區段內 該關鍵字詞的權重。計算公式如下:

= = k n j jk ik ik TF TF W 1 Wik: 第 k 個 時 間 區 段 中 , 關 鍵 字 詞 i 的 權 重 。 T Fik: 第 k 個 時 間 區 段 中 , 關 鍵 字 詞 i 的 使 用 頻 率 。 nk: 第 k 個 時 間 區 段 中 , 用 過 的 關 鍵 字 詞 總 數 。 3.1.2.2 單一時間區段內的檢索策略權重計算 我們依據關鍵字詞和檢索策略的頻率來計算 單一時間區段內檢索策略的權重。公式如下: jk ik ijk m j jk jk m j jk ik m j jk ijk ijk TF TF EF EF TF EF TF EF EF Sim k k k * * 1 1 1 = =

= = = Simi j k:在 第 k 個 時 間 區 段 中, ‘ i AND j ’ 這 個 檢 索 策 略 的 權 重 。 T Fi k: 在 第 k 個 時 間 區 段 中 , 檢 索 策 略 中 含 有 關 鍵 字 詞 i 的 正 規 化 頻 率 。 T Fj k: 在 第 k 個 時 間 區 段 中 , 檢 索 策 略 中 含 有 關 鍵 字 詞 j 的 正 規 化 頻 率 。 EFi j k: 在 第 k 個 時 間 區 段 中 , 檢 索 策 略 中 含 有 ‘i AND j ’ 這 個 檢 索 策 略 的 正 規 化 頻 率 。 mk: 在 第 k 個 時 間 區 段 中 , 用 過 的 檢 索 策 略 總 數 。 3.1.2.3 時間對興趣的影響係數 儘管使用者通常會隨著時間的流逝改變其興 趣,但我們假設使用者的興趣在某一段固定時間內 都不會有所改變,且越久之前的興趣紀錄對使用者 而言越不重要。為了表現時間流逝對興趣的影響, 我們將使用者用過的檢索策略依固定時間間隔劃 分成若干區段,每一時間區段對使用者整體興趣的 影響呈半衰期 (Half-Life) 遞減。假設將時間劃分 成 n 個區段,則在第 k 區段中(k 值越大時間越遠), 時間對使用者整體興趣的影響率為:

n

k

1

where

1

2

2

=

nnk k

Hl

Hlk:第 k 時 間 區 段 的 半 衰 期 時 間 係 數 。 例如當 n=5 時,五個時間區段的半衰期時間 係數為(Hl1, Hl2, Hl3, Hl4, Hl5) = (16/31, 8/31, 4/31, 2/31, 1/31)。 3.1.2.4 個人關鍵字詞權重計算 在將使用者檢索歷程劃分成若干時間區段、個 別計算單一時間區段內關鍵字詞的權重後,我們可 將之合併計算,求得整體的個人關鍵字詞權重。計 算公式如下:

(

)

=

=

n k k ik i

W

Hl

W

1

*

Wi: 關 鍵 字 詞 i 的 權 重 。 Wi k:第 k 個 時 間 區 段 中,關 鍵 字 詞 i 的 權 重 。 Hlk: 第 k 時 段 中 時 間 對 興 趣 的 影 響 係 數 。 n: 劃 分 的 時 間 區 段 數 目 。 3.1.2.5 個人檢索策略權重計算 在將使用者檢索歷程劃分成若干時間區段、個 別計算單一時間區段內檢索策略的權重後,我們可 將之合併計算,求得整體的個人檢索策略權重。計 算公式如下:

(

)

= = n k k ijk ij Sim Hl W 1 * Wi j: ‘ i AND j ’ 這 個 檢 索 策 略 的 權 重 。 Simi j k:在 第 k 個 時 間 區 間 中, ‘ i AND j ’ 這 個 檢 索 策 略 的 權 重 。 Hlk: 第 k 時 區 中 時 間 對 興 趣 的 影 響 係 數 。 n: 劃 分 的 時 間 區 段 數 目 。

3.2. PKRG 與資訊選粹服務、個人化檢索的關

運用 PKRG 計算出每個關鍵字詞以及檢索策 略的權重之後,可用以推演出使用者的興趣並應用 在資訊選粹服務與個人化檢索。運用 PKRG 進行 資訊選粹服務的方法如下: 1. 透過 PKRG 計算出使用者用過的關鍵字詞的 權重﹔ 2. 將關鍵字詞依照權重排列,挑出權重最大的前 幾個關鍵字詞,當作該使用者的興趣,並存入 個人興趣紀錄中﹔ 3. 比對新進資訊所含關鍵字詞是否和使用者興 趣記錄檔中的興趣關鍵字詞相符。若相符,則 視該資訊為使用者有興趣的新進資訊。

(8)

本計畫中所實現的個人化檢索,乃指系統能考 慮各關鍵字詞間的相關性,將檢索結果依使用者興 趣重新排列。在概念上,我們認為經常共同出現的 關鍵字詞對使用者而言代表這些關鍵字詞的關連 性很強,因此當使用者使用某一檢索策略搜尋資料 時,若檢索結果中含有和該檢索策略經常共同出現 的關鍵字詞,便會是使用者比較有興趣的。例如: 若使用者常使用 ‘古典 AND 詩詞’ 這個檢索策 略,代表使用者認為古典和詩詞間的關連性很強, 因此當使用者用詩詞來尋找資料時,我們便認為包 含古典這個關鍵字詞的檢索結果會是使用者較有 興趣的。運用 PKRG 進行個人化檢索的方法如下: 1. 透過 PKRG 計算出使用者用過的檢索策略的 權重,此權重亦代表關鍵字詞間的關連性,並 將檢索策略權重資訊存入個人興趣紀錄中﹔ 2. 當使用者輸入一檢索策略時,根據個人興趣記 錄中的檢索策略權重資訊篩選出和當次檢索 策略最有關的前幾個關鍵字詞﹔ 3. 比對檢索結果和篩選出的關鍵字詞,含有愈多 關鍵字詞的檢索結果代表使用者愈有興趣。

4. 資料探勘與群體化服務

我們將資料探勘技術中的相關規則探勘與循 序規則探勘應用在圖書館,期能發掘出讀者借閱館 藏之社群性,以作為實施群體化服務的依據,我們 欲探索的讀者社群關係包含: 1. 館藏借閱的共同性:興趣相同的讀者們往往 會借閱類似的館藏,若我們能發掘出館藏借 閱的共同性,當有某位讀者借閱某館藏時, 我們便可推薦給他借過此館藏的讀者亦曾 借閱的其他館藏。 2. 館藏借閱的順序性:對於某些館藏,讀者可 能會依據一定的順序來閱讀(例如先借入門 的再借進階的),若我們發現許多讀者都按照 一定的順序來閱讀某些館藏,那麼當有某位 讀者借閱這些館藏中的某一本時,我們便可 建議他按照順序來閱讀相關書籍。

4.1. 前置作業

在在此步驟採取的動作如下: 1. 確定資料來源:資料來源為圖書館自動化系統 中的書目檔、館藏檔、讀者檔、及交易歷史檔。 2. 資料選取: 確 定 所 要 分 析 紀 錄 的 時 間 範 圍 : 交 易 歷 史 檔 中 通 常 包 含 許 多 年 份 的 歷 史 紀 錄 , 因 此 首 先 必 須 確 定 要 分 析 的 時 間 範 圍 。 本 研 究 的 時 間 範 圍 是 從 1 9 9 8 年 1 月 1 日 至 2 0 0 0 年 8 月 3 1 日 。 確 定 所 要 分 析 紀 錄 的 類 別 : 交 易 歷 史 檔 中 通 常 包 含 許 多 類 型 的 交 易 紀 錄 , 例 如 借 閱 、 歸 還 、 預 約 、 聲 明 歸 還 … 等 , 由 於 本 計 畫 所 要 探 討 的 是 館 藏 借 閱 的 共 同 性 和 順 序 性 , 因 此 只 需 要 用 到 交 易 歷 史 檔 中 的 借 閱 和 預 約 歷 史 紀 錄 。 經過本步驟的處理,我們在交易歷史檔中 選取了 1998 年 1 月 1 日至 2000 年 8 月 31 日間有關借閱及預約的交易歷史資料,共 有 487,786 筆。 3. 資料的前置處理及轉換:針對發掘館藏借閱共 同性和順序性的資料處理需求,進行必要的資 料前置處理及轉換。 館 藏 借 閱 的 共 同 性 : 採 用 相 關 規 則 探 勘 發 掘 館 藏 借 閱 的 共 同 性 。 我 們 將 每 一 筆 書 目 資 料 視 為 一 個 項 目 ( I t e m ), 以 書 目 號 作 為 項 目 代 碼 , 而 每 位 讀 者 在 一 段 時 間 內 ( 如 一 學 期 或 一 學 年 ) 所 借 閱 或 預 約 的 書 目 所 成 之 集 合 即 為 一 筆 交 易 ( Tr a n s a c t i o n ),資 料 庫 D 便 是 由 所 有 交 易 組 成 的 集 合 。 舉 例 來 說 , 若 圖 書 館 中 有 二 位 讀 者 A 及 B , A 在 一 段 時 間 內 借 了 “ 1 3 4 3 ” 及 “ 2 5 3 ” 這 二 本 書 , B 在 一 段 時 間 內 借 了 “ 3 4 2 3 ”、“ 3 4 6 3 6 ” 及 “ 9 6 8 9 ” 三 本 書 , 資 料 庫 D 中 就 會 有 {1 34 3 , 2 5 3 } 和 { 3 4 2 3 , 3 4 6 3 6 , 9 6 8 9 } 二 筆 交 易 。 館 藏 借 閱 的 順 序 性 : 採 用 循 序 規 則 探 勘 發 掘 館 藏 借 閱 的 順 序 性 。 我 們 先 將 讀 者 借 閱 或 預 約 的 交 易 歷 史 紀 錄 依 時 間 排 序 , 並 將 每 一 筆 書 目 資 料 視 為 一 個 項 目 , 以 書 目 號 作 為 項 目 代 碼 , 讀 者 同 時 間 借 閱 或 預 約 的 書 目 所 成 之 集 合 即 為 項 目 集 , 同 一 位 讀 者 所 借 閱 或 預 約 的 項 目 集 依 時 間 排 序 而 成 的 序 列 即 為 讀 者 的 交 易 序 列 。 例 如 : 圖 書 館 中 有 一 位 讀 者 A 在 1 0 月 1 日 借 了 “ 3 4 2 5 ”,在 1 0 月 1 5 日 又 借 了 “ 9 8 2 3 ” 及 “ 4 8 7 5 ” , 則 其 交 易 序 列 即 為 { ( 3 4 2 5 ) ( 9 8 2 3 , 4 8 7 5 ) } 。

4.2. 探勘成果及討論

在經過前置處理之後,我們進行相關規則 [16][17]以及循序規則的探勘[16]。相關規則探勘主 要採用 Aprori[4]與 H-Mine[6],循序規則探勘則是 採用 GSP[5]。除此之外,我們還改良 H-Mine 演算 法,提出 H-Mine(Gen-MMS)[17]演算法,針對書籍

(9)

類別進行探勘,並可在書籍類別的不同階層,設定 不同的支持度(Support)。 我們將 1998 年 1 月 1 日至 2000 年 8 月 31 日 間的借閱及預約歷史資料納入探勘,每位讀者在這 一段時間內借閱和預約過的館藏都視為同一筆交 易;然後,我們將只含一本書的交易刪除(因為不 可能探勘出共同性和順序性),以減少交易記錄的 筆數。經過這些處理後,探勘的資料包括 11,398 筆交易,且最長的交易有 542 個項目。由於讀者借 閱館藏的期限大多為一個月,因此,若假設館藏只 有一本,且讀者一借就是一個月,則二年半內最多 只有 30 位讀者可借閱,因此我們將最小支持度設 為 0.21%(即 23 人,約是二年內可借閱的讀者人 數),並針對書籍館藏探勘,分析出讀者借閱館藏 的共同性,部分成果如表 4。書籍借閱順序性的部 分成果則如表 5。 表 4 館藏借閱的共同性 (部分成果) 書 名 借閱人數 精通 Borland C++ Builder:視覺化 C/C++程式設 計.基礎篇 Borland C++ Builder 視窗程式設計經典 52 MPEG video:compression standard

Digital video:an introduction to MPEG-2 51 CMOS circuit design, layout, and simulation

Low-power cmos wireless communications:a wideband CDMA system design

42 MATLAB 入門引導

PC MATLAB 入門與實例應用 38

親蜜心事

是誰拿走了那一雙雪靴 37

CDMA systems engineering handbook CDMA techniques for third generation mobile systems 36 FreeBSD 抓得住 INTERNET:伺服器架設與管 理 FreeBSD 網路應用 34 精通 Borland C++ Builder:視覺化 C/C++程式設 計.基礎篇 Borland C++ Builder 完全征服手冊 33 JPEG still image data compression standard

Win 32 多緒程式設計:執行緒完全手冊 =Multithreading Applications in Win 32

30 仙河飲馬

淨土之春 30

RF power amplifiers for wireless communications

Microwave circuit design using linear and nonlinear techniques

28

Win 32 多緒程式設計:執行緒完全手冊 =Multithreading Applications in Win 32 PC 影像處理技術.(一),圖檔壓縮篇 28 FreeBSD 抓得住 INTERNET:伺服器架設與管 理 抓住你的 PhotoImpact 4.2 中文版 28 線性代數 通訊系統 27

Numerical Recipes in C:The Art of Scientific Computing An introduction to wavelets 24 Visual C++ 6.0 程式開發手冊 Visual C++ 6.0 程式設計指南,應用程式架構篇 24 麵包樹上的女人 賣海豚的女孩 24 Delphi 4.0 徹底研究 煞死你的網頁設計絕招 24 表 5 館藏借閱的順序性(部分成果) 書 名 借閱人 數 MATLAB 入門引導 PC MATLAB 入門與實例應用 37

Wideband CDMA for third generation mobile communications

CDMA systems engineering handbook

32 CDMA systems engineering handbook

CDMA techniques for third generation mobile systems 29 仙河飲馬 淨土之春 29 在分析出館藏借閱的共同性和順序性之後,我 們可以將分析的結果供個人化檢索與推薦時使 用。舉例而言,當使用者經由個人化檢索檢索到麵 包樹上的女人這本書時,在使用者檢視這本書的詳 細資料時,系統可以將賣海豚的女孩推薦給這位使 用者(在二年半的時間裡有 24 位讀者看過麵包樹上 的女人與賣海豚的女孩這二本書)﹔類似的,若使 用者檢索到 PC MATLAB 入門與實例應用這本書 時,我們可以建議他先閱讀 MATLAB入門引導(在 二年半的時間裡有 37 位讀者是依照 MATLAB入門 引導 PC MATLAB入門與實例應用的順序來閱讀 這二本書)。 在此必須特別指出,並非資料探勘的所有結果 都是有價值的﹔例如我們在探索館藏借閱的順序 性時就發掘出以下的順序性:名流劍客沒羽箭第一 部 名流劍客沒羽箭第二部 名流劍客沒羽 箭第三部 名流劍客沒羽箭第四部 名流劍 客沒羽箭第五部。很明顯地,這是一個無用的循序 規則。

5. PIE@NCTU 系統實作

根據前述系統架構,並輔以動態偵測讀者興趣 的演算法[15]、以及資料探勘實施社群化服務的技 術[16][17],我們實作了一套適用於圖書館之個人 化圖書資訊系統:PIE@NCTU。PIE@NCTU 的發 展目的為: 提供一個 User-friendly、Web-based 的界面 以便於讀者使用圖書館的圖書資源﹔ 能針對使用者需求給予個別的使用環境﹔ 具有社群化功能,促進讀者間的知識分 享﹔ 動態偵測讀者興趣,協助讀者尋找圖書館 館藏﹔ 提供資訊選粹服務,根據讀者興趣,定期 通知讀者有興趣的新進資訊﹔ 提供跨平台書籤功能,方便讀者利用館藏

(10)

資源﹔ 提供讀者與圖書館互動的園地,促進讀者 與圖書館的交流,並協助讀者解決利用館 藏資源時遭遇到的困難。 從使用者的觀點來看,PIE@NCTU 是一個提 供個人化和群體化服務的 WWW 網站。使用者可 透過任何 WWW 瀏覽器進入。經由連接圖書館自 動化系統的讀者資料檔,各館的讀者都能夠使用 PIE@NCTU 所提供的各項服務。讀者以其在所屬 圖書館自動化系統中既有的帳號、密碼成功登入系 統 後 , 便 能 享 用 PIE@NCTU 的 所 有 服 務 。 PIE@NCTU 的服務可分為共同使用環境、個人化 使 用 者 界 面 、 管 理 者 界 面 等 三 部 分 。 圖 2 PIE@NCTU 首頁(http://pie.e-lib.nctu.edu.tw/pie)。 圖 2. PIE@NCTU 首頁 PIE@NCTU 所提供的個人化服務有: (1) 個 人化環境設定, (2) 個人化搜尋引擎, (3) 個人 書籤, (4) 資訊粹選服務, (5) 我要問問題,(6) 個 人通告。由於我要問問題和個人通告與系統架構中 的個人參考諮詢、個人資訊中心功能相近,不再贅 述,以下僅針對前四項服務詳加說明。 個人化環境設定 PIE@NCTU 提供三項個人化環境設定的功 能:個人化桌面、個人服務設定、個人興趣設 定。 個人化桌面設定讓使用者根據其需要組織桌 面環境。設計上是將整個桌面環境依不同功能 劃分成數大類,各類別中含有子集合,然後提 供選單讓使用者點選希望出現在其桌面上的 項目與功能。個人化桌面提供的服務類別包 括:圖書館服務、圖書館導覽、館藏查詢、資 料庫查詢、新書通告、借閱狀況、檢索界面、 系統公告、圖書館連結等。圖 2 右方畫面為系 統預設的桌面環境,但在某使用者根據其需求 設定之後的個人化桌面如圖 3。 個人服務設定讓讀者選擇希望收到的資訊選 粹服務,包含個人新書目錄、藝文活動通告、 圖書館公告。 至於個人興趣設定,顧名思義就是讓使用者設 定其個人的興趣。儘管在 PIE@NCTU 中我們 已經應用動態偵測興趣演算法來判斷讀者個 人興趣,但是系統自動判斷出來的興趣可能沒 有辦法完全符合使用者的興趣,為了輔助系統 的不足,PIE@NCTU 提供讀者手動設定環境 的功能﹔此外,使用者也可以設定感到興趣的 書目類別。 圖 3 個人化桌面 系統判斷的使用者 檢索策略關連 使用者自訂關鍵字 使用者自選類別 檢索結果

•••

第五級 第四級 第0級 線上公用目錄 (OPAC) 圖 4 個人化搜尋引擎示意圖 個人化搜尋引擎 PIE@NCTU 提供二種個人化搜尋引擎服務: 個人館藏查詢、個人新進館藏查詢。圖 4 為 PIE@NCTU 如何達成個人化搜尋引擎的示意 圖。當使用者輸入一檢索策略時,系統首先會 根據此檢索策略修正讀者個人興趣,然後將此 檢索策略傳遞給線上公用目錄(OPAC)搜尋館 藏 , 當 線 上 公 用 目 錄 將 檢 索 結 果 回 傳 給 PIE@NCTU 後,PIE@NCTU 根據系統判斷的 使用者檢索策略關聯、使用者自訂興趣關鍵字 詞、使用者自選興趣類別等三個條件,將檢索 結果分成六個等級加以排序。愈符合上述三個 條件的檢索結果等級越高,亦即系統認為該檢

(11)

索結果對使用者較有用,在結果呈現時,會將 其排列在較明顯的位置。系統將檢索結果分成 零至五共六個等級,其中皆不符合為第零等 級,剩餘五個等級依檢索結果符合上述三個條 件的程度排列。圖 5 為某使用者檢索事件這個 關鍵字詞的結果,列出的六筆資料為等級三的 結果。 圖 5 以「事件」為檢索策略進行個人化檢索的結 果(等級三) 個人書籤 PIE@NCTU 提供跨平台的書籤功能:「個人書 籤」,可讓使用者紀錄有興趣書目的超連接、 及使用者的註解。圖 6 為個人書籤的範例。 資訊選粹服務 PIE@NCTU 所提供的資訊選粹服務可定期比 對新進資訊和使用者當時的興趣。資訊選粹服 務的內容有個人新書通報、個人藝文活動通 報,個人圖書館公告等,未來將繼續發展其他 的個人資訊選粹服務。PIE@NCTU 係根據系 統判斷的使用者興趣關鍵字詞、使用者自訂興 趣關鍵字詞、使用者自選興趣類別,來作為資 訊選粹服務的依據,由於做法與個人化檢索類 似,在此不加贅述。 圖 6 個人書籤 除了前述個人化功能外,我們亦將資料探勘的 成果與 PIE@NCTU 整合。我們所使用的資料探勘 技 術 為 相 關 規 則 探 勘 (Association Rule Mining) [16][17],當使用者在查閱某一館藏的詳細資料 時,PIE@NCTU 會顯示與該館藏經常被同一讀者 借閱的其他館藏。範例如圖 7。 圖 7 整合資料探勘與 PIE@NCTUrary

6. 結論與未來發展

在資訊爆炸與網路科技的時代,圖書館在校園 中所扮演的角色必須重新定位。圖書館除了提供使 用者快速、精確、完整的查詢之外,還要能累積前 人的智慧、綜合讀者的知識、提升校園閱讀文化, 而建置一整合個人化與群體化的圖書館讀者服 務,正是達到此一目標的必要之途。 本計畫提出一套兼具個人化與群體化服務的 圖書資訊環境系統:PIE@NCTU。在未來,為了 增加圖書館館藏資源的附加價值、增進讀者學習興 趣,彼此激勵學習興趣、提升圖書館與讀者互動、 讓讀者能充分利用圖書館的資源,我們將持續設計 以下功能。 1. 投票系統:藉由讀者投票讓圖書館更加瞭解讀 者的意見。 2. 討論區:討論區讓讀者針對各主題發表意見與 分享別人的看法﹔圖書館亦能經由討論區瞭 解讀者的意見及看法,作為業務參考的依據。 3. 知識分享與網路讀書會:網路讀書會讓讀者針 對特定書目/主題發表意見、獲得其他讀者的看 法﹔也可以透過資料探勘的成果將讀者組成 社群,讓彼此分享社群成員的學習心得、搜尋 策略...等,藉此促進知識分享,激發更多靈感。 4. 協力式資訊過濾:在本計畫中我們係以個人興 趣來做資訊過濾,未來可加入群組興趣實現協 力式資訊過濾。

(12)

5. 在資料探勘中考量讀者分類:目前我們是將圖 書館的所有讀者視為一個大社群,從中了解成 員在館藏借閱的共同性與順序性。然而,讀者 背景與學科領域可能會影響到其借閱行為,因 此若能先將讀者分群(如根據系所、學院、性 別、年級等分群),再針對每一群讀者探索其 借閱的共同性和循序型,相信資料探勘的結果 更能切合讀者的需求。

7. 參考文獻

[1] 蔣以仁,「一對一個人化服務機制」,電腦與通 訊,95 期,(民國 90 年 3 月),頁 88-93。 [2] 張進群,陳建良,「客戶關係管理」,機械工業 雜誌,89 年 12 月號,頁 165-176。

[3] R. Agrawal, T. Imieliski, and A. Swami. “Mining Association Rules between Sets of Items in Large Databases”. Proceedings of the 1993 ACM SIGMOD Conference, pp.207-126.

[4] Agrawal, R., & Srikant R. (1994) Fast algorithms for mining association rules. In Proceedings of the International Conference on Very Large Data Bases (VLDB'94) (pp. 487 - 499), Santiago, Chile: VLDB Endowment.

[5] R. Srikant and R. Agrawal. “Mining Sequential Patterns: Generalizations and performance improvements”. IBM Research Division Almaden

Research Center, 1995.

[6] Pei, J., Han, J., Lu, H., Nishio, S., Tang, S., & Yang, D. (2001). H-Mine: hyper-structure mining of frequent patterns in large databases. In Proceedings of International Conference on Data Mining (ICDM'01) (pp. 441 – 448), San Jose, CA: IEEE.

[7] S. Cohen, J. Fereira, A. Horne, B. Kibbee, H. Mistlebauer, and A. Smith, “PIE@NCTUrary: Personalized Electronic Services in the Cornell University Library”, D-Lib Magazine, April 2000.

[8] K. Morgan and T. Reade, “Pioneering Portals: PIE@NCTUrary@NCState,” Information Technology and Libraries, 19 (4): 191-198, 2000. [9] J. C. French and C. L. Viles, “Personalized

Information Environments: An Architecture for Customizable Access to Distributed Digital Libraries”, D-Lib Magazine, June 1999.

[10] I. B. Crabtree and S. J. Soltysiak, “Identifying and tracking changing interests”, International Journal on Digital Libraries, 2: 38-53, 1998. [11] 卜小蝶,「網路資訊過濾技術與個人化資訊服 務」,21 世紀資訊科學與技術國際研討會,台 北市:世界新聞傳播學院圖書資訊學系,(民 國 85 年 11 月 7-9 日),頁 339-350。 [12] 卜小蝶,「提供個人化服務的線上公用目錄檢 索系統初探」,中國圖書館學會會報,59 期,(民 國 86 年 12 月),頁 127-133。

[13] P. Cabena, P. Hadjinian, R. Stadler, J. Verhees, and A. Zanasi. “Discovering Data Mining: From Concept to Implementation”. Prentice Hall, Upper Saddle River, NJ, 1998.

[14] 林高煌,「一個有效率的大參考序列探勘方法 及 其在全球資訊網上的應用」,國立交通大學 資訊科學系碩士論文,(民國 89 年 6 月)。 [15] 楊 雅 雯 ,「 個 人 化 數 位 圖 書 資 訊 環 境 - 以 PIE@NCTU 為例」,國立交通大學資訊科學系 碩士論文,(民國 90 年 6 月)。 [16] 吳安琪,「利用資料探勘的技術及統計的方法 增強圖書館的經營與服務」,國立交通大學資 訊科學系碩士論文,(民國 90 年 6 月)。 [17] 戴玉旻,「圖書館借閱記錄探勘系統」,國立交 通大學資訊科學系碩士論文,(民國 91 年 6 月)。

參考文獻

相關文件

HP(COMPAQ)伺服器為主,作業系統多為 Windows,僅有少數為 Linux,多 數主機均已置於 VMware 虛擬化平台上,應用軟體架構大部分為 Web-Base(網 路架構示意圖如

一、訓練目標:充分了解在自動化 機械領域中應用 Arduino 控制,進 而能自行分析、設計與裝配各種控

整體網站之規劃與設計設,包括網站企畫,網頁版面美工設計,網頁版面

(二)使用 PHP 語言、MySQL 資料庫與 Apache 伺服軟體開發互

3.丙級:包括應用作業系統、安裝軟體與使用電腦週邊設 備、設定繪圖環境、控制圖形螢幕、輸出圖形與 管理圖面等基本工作及繪製單件立體圖、立體剖

了解電腦網路的原理,學習使用 個人網誌及簡易的網頁設計,具 備電子商務的觀念、網路安全以 及網路犯罪與相關法規.

整體網站之規劃與設計設,包括網站企畫,網頁版面美工設計,網頁版面

機器人、餐飲服務、花藝、雲端運算、網路安全、3D 數位遊戲藝術、旅 館接待、行動應用開發、展示設計、數位建設