研究流程

第三章研究方法

3.2 研究流程

3.2.1 建立分群模組建立分群模組建立分群模組建立分群模組

在進行系統實作前，本研究事先建立一個分群模組，此模組將成為系統進行群組分配的依據。在使用者填寫完個人資料後，每個登入系統的使用者都將根據此模組來分配至合適的群集。其分群模組建立流程如下所示。

1. 使用者樣本收集

藉由圖書館租借書系統的使用者個人資料，進行分群樣本數的收集，其對象將以育達技術學院的使用者為主，收集過後的樣本會經過前處理，

包含資料清理、資料轉換，再經由適當的統計工具進行分析，以作為資料探勘之依據。

第一階段建立分群模組

使用者樣本收集

使用者分群

資料樣本前處理

建立分群推薦模組

第二階段系統設計及實作

設計系統架構與推薦方法

系統操作滿意度評估

準確度評估系統實作

使用者群組分配

圖書資訊推薦

滿意度評估

2. 使用者分群

我們在此會透過使用者的基本資料來做分群條件，而本研究主要是透過育達技術學院的圖書館資料來做分析，因此分群的主要條件，會受到資料的原有欄位影響，在此我們會使用者樣本的院別去做分析。以使用者所就讀的院別，去做為群聚使用者的主要條件，便可以得知使用者所屬的同範圍群組的人的興趣偏好，在進一步去做推薦。

3.2.2 系統設計及實作系統設計及實作系統設計及實作 系統設計及實作

本研究架構上分為使用者端與伺服器端兩部份，如圖3-2 所示。使用者端包含所有在行動裝置 (如行動電話、PDA、筆記型電腦等) 所使用之介面的開發，讀者透過行動裝置的瀏覽器連至本研究所開發之系統，而系統開發主要針對以下這幾個操作步驟開發行動裝置之介面。

一、使用者第一次進入系統將先建立個人的資料。

二、登入系統後即可經由行動裝置的拍照功能拍攝書籍之ISBN 條碼，將 ISBN 轉換為文字後，透過書籍查詢模組傳送至伺服器端進行館藏查詢，伺服端則回傳書籍之相關資訊。

三、查詢到此書後便可以透過書籍預約模組進行書籍預約；若館藏中查無此書時，則回傳是否推薦圖書館購買之資訊。在使用者端包含了辨識ISBN 條碼、書籍查詢、相關書籍推薦、書籍預約與介購幾個部份。

四、系統將會藉由使用者所輸入的資料透過使用者分群模組將使用者做分群，並由分群做出的資料探勘所獲得的關聯規則，藉由書籍類別推薦模組將相關之書籍類別與書籍推薦給讀者。

在伺服器端的部份則是一台包含SQL Server 與IIS 的伺服器。資料庫中存放著使用者資料、分群資料、圖書館歷史借閱資料的關聯規則、書籍詳細資料、書籍介購資料、書籍預約資料、各項代碼檔等。讀者隨時隨地可以使用攜帶方便的行動裝置連結至此平台進行書籍查詢，行動裝置將經由無線網路或行動通訊系統與伺服器的IIS 進行通訊，透過相關的技術與應用程式來存取資料庫中的資料，並將書籍資訊與個人化的推薦資訊回傳至使用者的行動裝置中，經由推薦的方式協助讀者在眾多的書籍中尋找到更多相關的書籍，提供讀者一個更多方位的服務平台。

圖 3-2：系統架構圖

3.2.3 群組推薦模組群組推薦模組群組推薦模組群組推薦模組 3.2.3.1 分群分群分群推薦分群推薦推薦推薦

群組推薦模組主要是將特性相似的使用者分配至同一個群組之內，再從群組中其他顧客的相關使用經驗中，找出合適的圖書資訊來推薦給目標顧客。使用者在設定好個人資料之後，系統會跟據使用者所設定的群組推薦模組，然後搜尋他們所租借過的圖書資訊，這些成員曾經租借過的圖書資訊將被拿來用以產生一份圖書推薦清單並呈現給目標使用者，例如目前在同一個群組中有 3 名顧客，分別為顧客甲、顧客乙、顧客丙，顧客乙曾經租過書籍類別 A，顧客丙曾經租過書籍類別 B，因此在推薦清單中，系統將會推薦書籍類別 A 以及書籍類別 B 的資訊給顧客甲。

因為群組推薦模組必須事先將使用者分配到合適的群組之中，才能繼續後續的推薦流程，在 3.2 節中，本研究事先收集分群樣本並建立一個分群模組。因此在後續的系統實作中，使用者在輸入個人資料後，系統透過分群模組便可以將使用者分配到合適的群組之中，將偏好相似的使用者分配至同一個群組之中。

3.2.3.2 推薦方法推薦方法推薦方法 推薦方法

系統會先透過關聯規則探勘，去得到的關聯規則的推薦項目，而其項目集就是我們所需要的具有相同興趣的讀者群。而要對讀者產生的推薦清單，主要包含三個步驟：第一步是先從之前找出的讀者的同好群中找出項目集，第二步把所有同好曾借閱過的館藏整理出來，第三步再把這些館藏依照借閱率高低排列，最後再把借閱率高的書推薦給讀者。

此部分的推薦方法會使用協同過濾的機制來做推薦，綜合而言，本論文提出的協力式過濾推薦係先用群組分析後找出跟讀者有相同興趣或背景的同好，再利用這些同好來幫讀者過濾圖書館的館藏，找出適合讀者的館藏。

3.2.3.3 準確度評估準確度評估準確度評估 準確度評估

本研究依上一節採礦內容檢視器中之關聯規則進行處理，取出所有的規則後，以分類矩陣評估關聯規則的正確率。經由訓練資料所建立的關聯規則，我們可以對測試資料進行分析。利用分類矩陣透過精確率 (Precision) 、回應率 (Recall) 、F-measure 的評估方式，來評估關聯規則的正確性 (Nahm and Mooney, 2000) 。

精確率是指全部的資料中有多少筆資料被正確預測的比例；回應率是指所有被預測的資料中有多少筆資料是真正被預測的比例。本研究期望能建構出同時具有高精確率與高回應率的分類器，但建構出來的分類器需要在精確率與回應率兩者之間做取捨，因為當其中一個值較高時，另一個的值則隨之下降。因此，藉由 F-measure 來做衡量，其值介於0 與1 之間，可以同時考量精確率與回應率，本研究採用精確率、回應率與F-measure 來進行評估。

在文檔中中華大學碩士論文 (頁 38-41)

第三章 研究方法

3.2 研究流程

第三章研究方法