第四章 分析結果
第一節 探索讀者社群關係
讀者的社群關係通常分為二種:
1. 館藏借閱的共同性:利用 Apriori 的方法在圖書館交通大學圖書館書 目、館藏、交易歷史資料中探勘,以找出讀者館藏借閱的共同性。
首先,我們針對國立交通大學圖書館 1999 年 1 月至 12 月的交易歷 史資料做探勘,並假設每位讀者在這一年中所借閱過的館藏為一筆交 易,則交易歷史資料中的借閱資料的交易筆數共 10,773 筆。我們將最 小支持度設為 0.15%,結果顯示讀者最常一起借閱館藏的情形如表 4 - 1 - 1。由表 4 - 1 - 1我們發現二個情形:
u 1999 年讀者最常一起借閱的館藏為“紅色警戒(上)”及“紅色警 戒(下)”,我們探討其原因可能為:在 1999 年時,“紅色警戒”
這個遊戲很熱門,所以帶動起欣賞這部影片的熱潮。
u 借閱某二部影片的人數比借閱某幾本書籍的人數來得多,探討其原 因可能為:影片的數量比書籍少,而且影片通常都有分(上)、(下)
二集,因此我們認為影片和書籍屬於不同類型的館藏,應該將其分 開做探勘。
書 名 借閱人數 紅色警戒 (下)=Thin Red Line
紅色警戒 (上)=Thin Red Line 59 Borland C++使用手冊
Applied numerical analysis 31 The Godfather [ videorecording]=教父
The Godfather Part 2 [ videorecording]=教父第二集 28 The Empire Strikes Back [ videorecording]=帝國大反擊
Return of the Jedi [ videorecording]=絕地大反攻 27 Star Wars [ videorecording]=星際大戰
The Empire Strikes Back [ videorecording]=帝國大反擊 26 Star Wars [ videorecording]=星際大戰
Return of the Jedi [ videorecording]=絕地大反攻 23 空中英語教室 [書].1998-7
王牌對王牌 [DVD]=The Negotiator 18 這一夜,誰來說相聲 (上) [錄影資料]
這一夜,誰來說相聲 (下) [錄影資料] 17 仙河飲馬
淨土之春 16
哈啦瑪莉=There's something about Mary
怪醫杜立德=Dr. Dolittle 16
表 4 - 1 - 1:1999 年讀者最常一起借閱的館藏
在這次探勘的過程中我們遭遇到一些問題:1999 年借閱資料的交 易筆數共 10,773 筆,若將最小支持度設超過 0.2%,則無法探索出讀者 借閱館藏的共同性;反之,如果將最小支持度設小於 0.15%,則面臨記 憶體不足的問題。為了解決這樣的問題,我們提出了二個方法減少交易 筆數並讓交易資料更為有效:(一)將交易的時間由原本的一年拉長為 19998 年 1 月 1 日至 2000 年 8 月 31 日,也就是每位讀者所借閱過的館 藏都視為同一筆交易;(二)若讀者只借過一本館藏,則不會探勘出同時 借閱其他館藏,所以我們可將此讀者的交易記錄刪除,以減少交易記錄 的筆數。
最後,我們還發現圖書館和商店最大的不同點是:在商店中同樣的 物品會有好幾個,但在圖書館中同樣的館藏往往只有一本或少數幾本複 本,若有讀者將館藏借走,則其他的讀者便不能同時借閱,因此我們假 設讀者預約館藏即表示有興趣借閱,並將預約書資料加入交易記錄中。
在加入預約書資料,將資料量增加為 1998 年 1 月至 2000 年 8 月的 資料並將只借過一本館藏的交易去掉後,我們的圖書交易共有 11,398 筆,且最長的交易有 542 個項目。由於圖書館讀者借閱館藏的期限大多 為一個月,因此,若假設館藏只有一本,且讀者一借就是一個月,則二 年半內最多只有 30 位讀者可借閱,因此我們將最小支持度(minsup)設 為 0.21%(即 23 人,約是二年內可借閱的讀者人數),並針對書籍部份的 館藏做探勘,分析出讀者借閱館藏的共同性如表 4 - 1 - 2(a)及表 4 - 1 - 2(b)。
書 名 借閱人數 精通 Borland C++ Builder:視覺化 C/C++程式設計.基礎篇
Borland C++ Builder 視窗程式設計經典 52 MPEG video:compression standard
Digital video:an introduction to MPEG-2 51 CMOS circuit design, layout, and simulation
Low-power cmos wireless communications:a wideband CDMA system design
42 MATLAB 入門引導
PC MATLAB 入門與實例應用 38
親蜜心事
是誰拿走了那一雙雪靴 37
XILINX FPGA/CPLD 數位邏輯設計實習
XILINX FPGA 數位邏輯設計 36
CDMA systems engineering handbook
CDMA techniques for third generation mobile systems / 36 CDMA techniques for third generation mobile systems /
Spread spectrum CDMA systems for wireless communications 35 表 4 - 1 - 2(a):讀者最常一起借閱的二本書(一)
書 名 借閱人數 Wideband CDMA for third generation mobile communications
CDMA systems engineering handbook 34 FreeBSD 抓得住 INTERNET:伺服器架設與管理
FreeBSD 網路應用 34
精通 Borland C++ Builder:視覺化 C/C++程式設計.基礎篇
Borland C++ Builder 完全征服手冊 33
JPEG still image data compression standard
Win 32 多緒程式設計:執行緒完全手冊=Multithreading Applications in Win 32
30 OpenGL reference manual:the official reference document to
OpenGL, version 1.1
OpenGL programming guide:the official reference guide for OpenGL, release 1.1
29
RF power amplifiers for wireless communications /
Microwave circuit design using linear and nonlinear techniques 28 CMOS circuit design, layout, and simulation
Low-Power CMOS Design 26
CDMA techniques for third generation mobile systems / Smart antennas for wireless communications : IS-95 and third generation CDMA applications /
26 Win 32 多緒程式設計:執行緒完全手冊=Multithreading
Applications in Win 32 神經網路入門與圖樣辨識
25 Numerical Recipes in C:The Art of Scientific Computing
An introduction to wavelets 24 CMOS circuit design, layout, and simulation
The design of CMOS radio-frequency integrated circuits 24 CMOS circuit design, layout, and simulation
Phase-locked loops for wireless communications:digital and analog implementation
2. 館藏借閱的順序:在第三章第二節中,我們說明了如何改進 GSP 的方 法,在圖書館交通大學圖書館書目、館藏、交易歷史資料中探勘,以找 出讀者借閱館藏的順序性。
我們取得交通大學圖書館 1998 年 1 月至 2000 年 8 月的交易歷史資 料,加入預約書資料並將只借過一本館藏的交易去掉後,我們的圖書交 易共有 11,398 筆,且最長的交易有 542 個項目。我們假設最小支持度 (minsup)為 0.21%,針對書籍部份的館藏做探勘,分析出讀者借閱館藏 的順序性如表 4 - 1 - 3。
書 名 借閱人數 MATLAB 入門引導
PC MATLAB 入門與實例應用
37 Wideband CDMA for third generation mobile communications
CDMA systems engineering handbook
32 CDMA systems engineering handbook
CDMA techniques for third generation mobile systems /
29 表 4 - 1 - 3:讀者最常依序借閱的二本書