• 沒有找到結果。

運用主題地圖與資料探勘建置複合式電子服務平台

N/A
N/A
Protected

Academic year: 2021

Share "運用主題地圖與資料探勘建置複合式電子服務平台"

Copied!
82
0
0

加載中.... (立即查看全文)

全文

(1)國立交通大學 資訊管理研究所 碩. 士. 論. 文. 運用主題地圖與資料探勘建置 複合式電子服務平台. Applying Topic Maps and Data Mining to Deploy Composite E-service Platform. 研 究 生: 李 嘉 源 指導教授: 劉 敦 仁 博士 中華民國九十三年六月.

(2) 運用主題地圖與資料探勘建置 複合式電子服務平台. Applying Topic Maps and Data Mining to Deploy Composite E-service Platform. 研 究 生: 李 嘉 源 指導教授: 劉 敦 仁. Student: Advisor:. Jia-Yuan Lee Duen-Ren Liu. 國立交通大學 資訊管理研究所 碩士論文. A Thesis Submitted to Institute of Information Management College of Management National Chiao Tung University in Partial Fulfillment of the Requirements for the Degree of Master of Business Administration in Information Management June 2004 Hsinchu, Taiwan, the Republic of China. 中華民國九十三年六月.

(3) 運用主題地圖與資料探勘建置 複合式電子服務平台 研究生:李嘉源. 指導教授:劉敦仁 博士. 國立交通大學資訊管理研究所. 摘要 整合網路上眾多的單一電子服務,提供給使用者完整的複合式電子服務,不 僅可以滿足客戶一次購足(One-Stop Shopping)的需求,更可以為企業帶來更大的 商機。各種電子服務可能來自不同的電子服務提供者,各電子服務提供者所使用 的系統平台也不盡相同,因此,如何管理與提供複合式電子服務流程之相關資訊 資源是值得研究的議題。 本研究實作一個以知識地圖為導覽基礎的複合式電子服務平台,融入知識地 圖概念來展現複合式電子服務流程,並以資料探勘的方法發掘複合式電子服務與 使用者記錄檔中的隱含知識,透過主題地圖(Topic Maps)標準傳達結構化與關 聯性的知識資源。平台後端利用 Web Services 整合多家電子服務提供者,達到跨 組織的協同商務運作。同時設計出 Web 介面的主題地圖導覽系統以提供有效的 複合式電子服務流程之瀏覽與推薦。本研究用模擬的案例示範展示複合式電子服 務流程的導覽與服務的推薦,以驗證系統的有效性。. i.

(4) Applying Topic Maps and Data Mining to Deploy Composite E-service Platform Student:Jia-Yuan Lee. Advisor:Dr. Duen-Ren Liu. Institute of Information Management National Chiao-Tung University. Abstract Providing users with composite e-services can fulfill user’s demand for one-stop shopping. Composite e-services are complex processes that require the cooperation among cross-organizational e-service providers. It also can bring greater business opportunity to enterprises. Thus, providing effective knowledge supports for managing composite e-services is an issue worth studying. The contribution of this research is implementing a composite e-service platform enhanced with knowledge maps for managing composite e-services. Data mining approach is applied to extract knowledge patterns from the attributes and usage records of composite e-services. Based on the mining result, Topic Maps are employed to construct the knowledge map. Moreover, this work utilizes web services to integrate different e-service providers’ system to achieve the ultimately goal of collaborative commerce. This work demonstrates the operations of composite e-Service navigator as well as the services of recommendation by a simulated scenario to examine the effectiveness of the proposed platform.. ii.

(5) 誌謝 猶記得前年才剛退伍,帶著興奮的心情踏入交大,轉眼間兩年就過去了。 我想最要感謝的就是指導教授劉敦仁老師,劉老師認真研究與實事求是的 精神,是學生良好的典範,在指導研究上,給予學生極大的自由空間,讓我得以 在一個安心的環境下,完成系統與論文。同時也感謝口試委員陳恭老師、王朝煌 老師、羅濟群老師在口試期間給予我許多意見和指導,讓論文得以更加完善。感 謝政龍學長、籌尹學姊給予我許多研究方法上的指導;志坤學長給予我論文寫作 上的指導;怡瑾學姊於英文投稿翻譯上給予我許多協助,並總是在我困難的時候 適時伸出援手。也感謝美玉、孟蓉、雅月、純和諸位學長姊,給予我課業和生活 上的許多幫助。春鋒、昆學、錦慧、Rita、秋皓、乃文,陪我一起奮鬥論文的伙 伴們,恭喜大家都順利畢業。另外韋孝、桄瑋、秋雯、明立、柏村諸位學弟妹, 為我們 Lab 注入許多活力和歡笑。還有不會忘記北大門外的土地公,感謝祂保佑 我兩年來一路平安順利。 最後更要感謝我親愛的爸媽,給予我精神與物質上最大的支持,這學位的 榮耀應該歸給你們。也要感謝淑鈴陪我走過最難熬的階段,妳的關心與付出是讓 我前進的最大動力。還有老妹偉莉,感謝妳對我一向的支持和祝福。 從交大畢業並非結束,感謝這裡帶給我的一切,我會懷著感恩的心邁向未 來迎接新的挑戰。. iii.

(6) 目錄 中文摘要.........................................................................................................................i 英文摘要........................................................................................................................ii 誌謝.............................................................................................................................. iii 目錄...............................................................................................................................iv 表目錄...........................................................................................................................vi 圖目錄..........................................................................................................................vii 第一章、緒論................................................................................................................1 1.1 研究動機..........................................................................................................1 1.2 研究目的.........................................................................................................2 1.3 論文架構.........................................................................................................3 第二章、文獻探討........................................................................................................4 2.1 複合式電子服務(Composite E-Services).................................................4 2.2 WEB Services ..................................................................................................4 2.2.1 SOA(Service Oriented Architecture)...............................................5 2.2.2 SOAP(Simple Object Access Protocol)...........................................6 2.2.3 WSDL(Web Service Description Language)...................................7 2.2.4 UDDI(Universal Description, Discovery and Integration)..............7 2.3 資料探勘(Data Mining) ............................................................................8 2.3.1 分群法(Clustering).........................................................................8 2.3.2 關聯規則(Association Rule) ..........................................................8 2.4 知識地圖(Knowledge Map)......................................................................9 2.5 主題地圖(Topic Maps)............................................................................10 第三章、複合式電子服務平台概觀..........................................................................13 3.1 知識地圖建置系統.......................................................................................14 3.2 個人化推薦系統...........................................................................................16 3.3 結合個人化推薦的知識地圖導覽系統.......................................................17 第四章、知識地圖建置系統......................................................................................18 4.1 系統架構圖....................................................................................................18 4.2 Service Plan Collecting & Building Module .................................................19 4.2.1 模組功能說明....................................................................................19 iv.

(7) 4.2.2 跨組織的複合式電子服務運作機制................................................21 4.3 複合式電子服務知識地圖樣版...................................................................22 4.3.1 複合式電子服務的meta information................................................23 4.3.2 Topic Maps Template的定義..............................................................26 4.4 Data Mining Module......................................................................................30 4.4.1 模組功能說明....................................................................................31 4.4.2 Data Mining for Composite e-services ...............................................31 4.4.2.1 Clustering Composite e-services..............................................32 4.4.2.2 Mining associations among services attributes........................35 4.4.3 Data Mining for Usage Record ...........................................................36 4.5 Topic Maps Generator Module ......................................................................37 4.5.1 模組功能說明....................................................................................37 4.5.2 Topic Management..............................................................................38 4.5.3 Association Management ....................................................................40 4.6 User Navigator Interface Module ..................................................................43 4.6.1 模組功能說明....................................................................................43 4.6.2 主題地圖內容導覽............................................................................44 第五章、系統建置與實作..........................................................................................47 5.1 開發工具與平台...........................................................................................47 5.2 系統實作架構...............................................................................................48 5.3 實作內容說明...............................................................................................49 5.3.1 電子服務提供者部署Web Services..................................................49 5.3.3 管理者藉由UDDI搜尋取得所有服務資訊......................................53 5.3.4 對複合式電子服務進行分群............................................................55 5.3.5 對每一群進行關聯規則分析............................................................57 5.3.6 對使用者記錄檔進行關聯分析........................................................58 5.3.7 主題地圖導覽系統與模擬情境說明.................................................59 第六章、結論與未來工作..........................................................................................67 6.1 研究結論.......................................................................................................67 6.2 未來研究建議...............................................................................................68 參考文獻......................................................................................................................69. v.

(8) 表目錄 表 2.1:XTM 範例 ............................................................................................12 表 4.1:單一電子服務的meta information .......................................................24 表 4.2:複合式電子服務之meta information ...................................................25 表 4.3:XTM For Composite e-services的template定義 ..................................27 表 4.4:XTM for Topic Types定義 ....................................................................29 表 4.5:XTM for Occurrence Types定義 ..........................................................29 表 4.6:XTM for Association Types定義 ..........................................................30 表 4.7:XTM for Role定義................................................................................30 表 4.8:描述每個單一選課服務的 6 個屬性...................................................33 表 4.9:單一選課服務M_N1 的屬性向量表示法 ...........................................33 表 4.10:複合式選課服務CS_1 的屬性向量表示法 .......................................34 表 4.11:分群結果中ClusterA的代表群中心...................................................34 表 4.12:Location屬性值:Taipei之XTM表示法............................................38 表 4.13:Instructors的屬性值:Nancy之XTM表示法 ....................................39 表 4.14:單一選課服務之XTM表示法 ............................................................39 表 4.15:複合式選課服務之XTM表示法 ........................................................39 表 4.16:MCSD底下包含Programming with C#..............................................40 表 4.17:Nancy屬性值的關聯 ..........................................................................42 表 4.18:Programming with C#選課服務的常用推薦 .....................................42 表 5.1:開發工具與平台...................................................................................47 表 5.2:顯示分群結果各群的代表群中心.......................................................57 表 5.3:計算相關服務推薦的預儲程序...........................................................59. vi.

(9) 圖目錄 圖 2.1:服務導向架構.........................................................................................5 圖 2.2:符合SOA的複合式電子服務平台架構 .................................................6 圖 2.3:SOAP訊息架構.......................................................................................7 圖 2.4:Topic map template ............................................................................... 11 圖 3.1:複合式電子服務平台概觀...................................................................14 圖 3.2 知識地圖建置系統模組運作流程圖.....................................................15 圖 3.3 個人化推薦系統模組運作流程圖.........................................................16 圖 4.1:知識地圖建置系統...............................................................................18 圖 4.2:Service Plan Collecting & Building Module流程架構圖.....................19 圖 4.3:各電子服務提供者註冊相同性質的服務到UDDI上.........................20 圖 4.4:複合式電子服務知識地圖建置與運作機制.......................................22 圖 4.5:meta information的運用流程 ...............................................................23 圖 4.6:複合式電子服務:「MCSD Training Course」流程...........................25 圖 4.7:Data Mining Module流程架構圖 .........................................................31 圖 4.8:Data Mining for Composite e-services分析流程..................................32 圖 4.9:Mining associations among services attributes分析流程 .....................35 圖 4.10:Data Mining for Usage Record 分析流程 .........................................37 圖 4.11:Topic Maps Generator Module流程架構圖........................................37 圖 4.12:MCSD複合式選課服務流程XTM表示法.........................................41 圖 4.13:User Navigator Interface Module流程架構圖....................................43 圖 5.1:系統實作架構圖...................................................................................48 圖 5.2:電子服務提供者 Provider A(Mitac) ..............................................49 圖 5.3:在 Provider A(Mitac)上進行選課服務 ..........................................50 圖 5.4:Provider C所部署的Web Services之存取點所在................................51 圖 5.5:Provider A的Web Services之WSDL文件 ............................................52 圖 5.6:將服務資訊註冊到UDDI Server中 .....................................................52 圖 5.7:透過Web介面搜尋所需服務名稱........................................................54 圖 5.8:自UDDI中搜尋取得服務資訊並繫結資料.........................................54. vii.

(10) 圖 5.9:轉換後的複合式電子服務屬性向量表示法.......................................55 圖 5.10:Weka讀入選課服務的向量表示資料................................................56 圖 5.11:Weka的K-means分群結果(K=3) ..................................................56 圖 5.12:單一選課服務關聯規則分析結果.....................................................57 圖 5.13:服務使用記錄資料表.........................................................................58 圖 5.14:主題地圖導覽系統~開始畫面.........................................................60 圖 5.15:主題地圖中,Taipei主題節點 ...........................................................61 圖 5.16:單一選課服務主題節點.....................................................................62 圖 5.17:選課服務之相關推薦.........................................................................62 圖 5.18:選課服務的執行.................................................................................63 圖 5.19:沒有提供Vacation的時段...................................................................64 圖 5.20:在Vacation下,找到其他相同名稱的選課服務...............................64 圖 5.21:進行選課服務,有Vacation的時段可供選擇...................................65 圖 5.22:使用者Amy完成複合式選課服務 .....................................................65 圖 5.23:導覽系統中複合式電子服務流程的表示法.....................................66. viii.

(11) 第一章、緒論 1.1 研究動機 網際網路提供了一個企業與顧客之間服務的傳遞平台,企業將服務提供在 網路上,形成了一種新的商業模式。Hewlett-Packard 公司[15]將此種可以透過網 路來尋找新的營收與創造新的效益之企業資產稱為電子服務(e-services)。目前企 業紛紛進行電子化以提升本身競爭力,將本身的服務轉化為電子服務或更為複雜 的複合式電子服務(composite e-services) 。因為單一的電子服務往往不能滿足顧 客的服務需求,一項完整的服務通常需要多個電子服務才能完成,此即稱為複合 式電子服務。 電子化企業之發展趨勢使得企業電子化經營從單純的內部運作轉移至與各 電子化服務提供者之間的協同商務整合。複合式電子服務是由各個不同的電子服 務提供者(e-service provider)所提供的之單一電子服務(basic service)組合而 成,在協同商務環境中,進行跨組織的複合式電子服務時所產生的流程複雜度遠 比單一企業個體來的高,其資訊資源涵蓋參與複合式電子服務流程之相關電子服 務提供者,如何產生管理、搜尋與存取複合式電子服務流程之資訊與資源將影響 企業電子化經營的彈性及成效。客戶或企業伙伴在複雜的協同商務環境下進行複 合式電子服務流程時,需要獲得電子服務的相關知識,才能靈活、有效地選擇服 務提供者及複合式電子服務流程。因此,如何管理與提供複合式電子服務流程之 相關資訊資源是一項重要的研究議題。 在知識管理中所提出的知識地圖概念可以用來整合企業知識,並透過知識 地圖架構,協助企業資訊資源之搜尋與管理,使企業快速地分享與提供企業之相 關知識,並有效的管理與導覽企業知識。目前知識地圖相關的研究著重於對企業 個體內部探討,包括如何將企業資訊以結構化表示、並進行關聯性分析等,以提 供知識導覽及搜尋的應用等[16]。對於跨企業的複合式電子服務,我們之前的研 1.

(12) 究[21]曾針對這樣的環境提出複合式電子服務平台架構與概念,但尚未有較佳的 實作系統產生。先前的研究論文[37]也曾提出運用知識地圖來展現複合式電子服 務,但尚未使用資料探勘方式找尋複合式電子服務屬性間與內容間的關聯來協助 建置知識地圖。 因此,本研究欲針對跨企業的環境,整合之前的研究規劃出一個以知識地 圖導覽為基礎的複合式電子服務平台,並以模擬案例來實作系統,融入知識地圖 概念來展現複合式電子服務流程,並以資料探勘的方法發掘出複合式電子服務與 使用者記錄檔中的隱含知識,再透過地圖導覽方式傳達結構化與關聯性的知識資 源。客戶或企業伙伴在運用知識地圖的指引、推薦來進行複合式電子服務流程 時,便能夠有效地存取所需資源及知識,並靈活地選擇服務提供者與複合式電子 服務流程。. 1.2 研究目的 根據上述的研究動機,在本研究中主要欲達到下列三項目的: 1. 取得跨組織的電子服務相關資訊資源,建置實作出複合式電子服務整合平 台。本研究使用 Web Services 標準來整合各電子服務提供者所提供的電子服 務與複合式電子服務,透過 Web Services 來達成電子服務提供者間的協同商 務運作。 2. 利用資料探勘(Data Mining)技術發掘找出複合式電子服務流程的有用知識, 包括複合式電子服務的分群與電子服務屬性的關聯,另外也針對顧客的服務 使用記錄,利用關聯規則挖掘出電子服務間的關聯,以做為建構複合式電子 服務知識地圖之依據。 3. 將上述發掘出的知識規則,利用 Topic Maps 標準建構出複合式電子服務屬性 與內容的知識地圖,並開發 Web 介面的地圖導覽與搜尋系統來展現 Topic. 2.

(13) Maps 內容,使電子服務使用者在導覽知識地圖時,系統會提供相關的電子服 務內容與複合式電子服務流程的推薦。同時以模擬案例來實作說明整體運作 流程,用以驗證系統的有效性。. 1.3 論文架構 本篇論文共分為六章,第一章為「緒論」 ,對研究動機、背景、目的以及論 文整體架構作一簡單的說明。第二章為「文獻探討」 ,介紹與本研究相關的主題。 第三章為「複合式電子服務平台概觀」 ,整合先前的研究,提出完整的平台架構, 包含知識地圖建置系統和個人化推薦系統。本篇論文主要針對前者來做探討,於 下兩章中詳述其架構與實作內容。第四章為「知識地圖建置系統」,詳述如何運 用 Web Services 技術、Data Mining 方法與 Topic Maps 標準來建置跨組織的複合 式電子服務平台。第五章為「系統建置與開發」,說明系統實作的方式與流程、 開發工具與平台、與建置出的知識導覽系統功能。第六章為「結論與未來工作」, 為總結本研究的研究成果,並針對未來可能的研究方向加以說明。. 3.

(14) 第二章、文獻探討 本研究欲在網際網路的環境中,建置一個複合式的電子服務仲介平台,讓使 用者可以輕易地一次取得所需要之電子服務。本章針對相關研究主題進行探討:. 2.1 複合式電子服務(Composite E-Services) 單一的電子服務傳遞為企業和客戶所帶來的附加價值有限,因此 Casati 等 人[4][5][6]提出定義、分析與執行複合式電子服務之架構,探討如何動態組合產 生複合式電子服務,並發展出 CSDL(Composite Service Description Language)以 描述複合電子服務,CSDL 是一種有向性的圖形化表示方法,以節點(nodes)代表 一個單一的電子服務,而箭頭(Arcs)則代表每個電子服務之間的關係,再輔以特 殊的節點用以表示複合式電子服務的執行狀態或控制流程。 Casati 等人另外也提出 eFlow 平台[7],應用於發展與管理此種複合式電子 服務,此平台方便於服務提供者從基本的電子服務中再定義出複合的電子服務, 並提供服務監控、分析與修改的機制。. 2.2 WEB Services Web Services 是一個具開放性、分散式的軟體環境,並且與平台和實作無關, 使用者可使用任何一種的程式語言開發工具和作業系統來描述與建立 Web Services[35]。因此,對企業而言,將可以很容易地運用 Web Services 來整合企業 內部的應用程式,或與合作夥伴間的系統。Papazoglou 等學者[25]便提出使用 Web Services 企 業 整 合 企 業 的 商 業 流 程 , 使 企 業 從 原 有 的 以 元 件 為 基 礎 (component-based)轉換為以 Web Services 為基礎來提供服務,如此一來,因 Web Services 使整合的過程更為容易,企業模式將變的更有彈性。 Web Services 主要包含三項以 XML(eXtensible Markup Language)為基礎的開 放標準:SOAP(Simple Object Access Protocol)[34]、WSDL(Web Services 4.

(15) Description Language ) [36] 與 UDDI ( Universal Description 、 Discovery and Integration)[32]。 2.2.1 SOA(Service Oriented Architecture) Web Services 從其操作的角度來看,W3C 提出了服務導向架構(SOA, Service Oriented Architecture) ,圖 2.1 說明 SOA 中主要的角色和與不同的操作關係。. 服務仲介者. 發行 (WSDL). 探索 (UDDI). 服務需求者. 服務提供者 繫結 (SOAP). 圖 2.1:服務導向架構. SOA 包含三個角色: 服務提供者(service provider):將服務資訊製作成標準格式檔案,並發佈到服 務仲介者。 服務需求者(service requester):向服務仲介者搜尋所需求的服務,再向該服務 的服務提供者要求服務的繫結(bind)。 服務仲介者(service broker):負責接受服務題供者的服務發佈(publish),維 護服務資訊,並處理來自服務使用者的搜尋(find)要求。 圖 2.2 顯示了整體複合式電子服務的系統架構圖,在服務導向架構下的三個 角色分別為:. 5.

(16) Service Provider: E-Services Providers Service Request: Composite E-Services Platform Service Broker:UDDI Registry 此處 SOA 下的服務需求者是複合式電子服務平台,而非使用者本身,使用 者是透過平台來完成交易。. 服務仲介者. 發行 (WSDL). 探索 (UDDI). Composite EService Platform. UDDI Server. 服務需求者. 服務提供者 繫結 (SOAP). E-Service Providers. 使用者. 圖 2.2:符合SOA的複合式電子服務平台架構 2.2.2 SOAP(Simple Object Access Protocol) SOAP[34]是以 XML 為基礎的傳輸通訊協定,使企業在分散式環境中,能達 成以文字為格式資料交換的目的。其發展與概念是來自 XML-RPC,且達成異質 系統間通訊的目的,可以繫結在 HTTP、SMTP、TCP 或 UDP 等多種傳輸協定上, 因此其使用彈性也更高。圖 2.3 為 SOAP 的訊息架構,就像信件中包含了信封 (Header)與信件內容(Body)。. 6.

(17) 圖 2.3:SOAP 訊息架構. 2.2.3 WSDL(Web Service Description Language) W3C 在「服務導向架構」的規範中,網路服務的「描述」包含了相關的協 議(Agreement)、服務間的關聯(Relationships)、個別網路服務細節。WSDL 即以 XML 為基礎來達成這樣的規範。 WSDL [36]為 Web Services 內容的描述與定義文件。服務使用者可以藉由 WSDL 得知該服務的請求與回應訊息、介面定義、繫結方式等,便可以遵循該 WSDL 的規範,向服務提供者要求該項 web service。 2.2.4 UDDI(Universal Description, Discovery and Integration) UDDI[32]是 Web Services 環境中的仲介平台,服務提供者可以向 UDDI 註 冊,發佈企業與其所提供的服務的資訊。服務使用者需要某項服務時,便可從 UDDI 搜尋到所需要的資訊。UDDI 簡單來說就是一個集中式的廣告服務,讓服 務提供者能夠宣傳其所提供的服務之內容,讓服務使用者能快速找到其所需要的 服務。 7.

(18) 2.3 資料探勘(Data Mining) 資料探勘(data mining)主要在研究如何從大量的資料中,分析出隱藏的有用 資訊,以提供決策者作為參考指標,常見的研究有關聯規則(association rules)、 分類法(classification)、分群法(clustering)…等,本章節就本研究有運用到的分群 法和關聯規則來做探討。 2.3.1 分群法(Clustering) 分群法(clustering)是常被使用的資料探勘方法之一,分群是把有形或抽象的 物件歸類到類似物件的類別的過程。將類似物件集合成同群,不同群物件的集合 不相似。分群與分類最大不同在於分群不預先知道類別標籤,而把資料歸類成新 類別[14]。它可透過數學方法來尋找空間物件的相似性,而分析最終目的是將資 料進行分類的工作。K-means[22]是要將資料分成 K 個子集,它其步驟為:由使 用者設定要找多少個群組,假設要找 K 個群組在資料庫中以亂數找出 K 個點來 當作起始群中心,重新分配資料算出各群新的群中心,驗證這 K 個點是否為最 後之群中心,如果是則完成,如果否則繼續尋找,直到都符合為止。 2.3.2 關聯規則(Association Rule) 關聯規則(association rules)可以從大量的資料中探勘出資料之間的關聯性, 舉例來說,在顧客交易分析資料當中,我們發現許多顧客會同時購買 A 產品與 B 產品,因此從顧客的購物籃當中,我們可以發現哪些產品經常被一起購買,我們 就把這些探勘出的關聯性,可以用來作為行銷的策略計劃。 Agrawal等人提出關聯規則演算法[1],其中I={i1,i2,…,im}為一群項目(item)的 集合,D則為一群交易(transaction)所組成,每筆交易T則是由一群項目所組成, 其中T ⊆ I,則我們可以把關聯規則用以下的形式表示:. X →Y. where X ⊂ I , Y ⊂ I , X ∩ Y = φ. 假設在 D 中有 c %的交易存在 X→Y 的關聯規則,我們就說 X→Y 的可信度. (confidence)為 c;若在 D 中有 s %的交易包含 X 與 Y,則我們稱 X→Y 的支持度 8.

(19) (support)為 s,其計算如下列公式所示。 Support ( X → Y ) = P( X ∪ Y ) = ( X ∪ Y )出現的次數 / 全部的交易次數 Confidence( X → Y ) = P(Y X ) = Support ( X ∪ Y ) / Support ( X ) 用於探勘關聯規則的 Apriori 演算法主要可以分成以下兩個執行步驟:. 1.發現頻繁項目集合,即找到支持度大於事先訂定的最小支持度的項目集合。 2.從頻繁項目集合中產生關聯規則。. 2.4 知識地圖(Knowledge Map) 在日趨競爭的知識經濟時代下,知識的運用是這一世紀的競爭武器,知識管 理儼然成為決定企業發展的關鍵因素[8][13]。而「知識地圖」在知識管理中扮演 相當重要的角色,透過知識地圖可以整合企業知識,用來協助尋找和管理知識來 源,使企業可以快速地分享完整的知識,並描繪一個具體化的知識架構,有助於 管理與導覽企業的外顯知識[12],因此可以在知識的獲得、保留、傳遞與應用上 發揮相當大的作用。 知識地圖大致上需包含知識的儲存位置、類別、真正的含意、用途、用法, 相關的資源,與該知識擁有者和其聯絡方式。因此透過知識地圖,企業可以瞭解 其知識的分佈,與企業內部各項能力與知識的優劣,並著手進行調整與改善工 作,因此在知識管理上,是一個知識整理、分類的極佳工具。Martin 並且認為知 識地圖是一個以經驗為基礎所建立的概念性工具,可以用來幫助企業組織知識管 理上的創新[9]。Newbern 與 Danserau 所認為的知識地圖,則在強調探索組織內 知識,和其分佈情形,並藉以找出潛在優勢與知識 [24] 。知識探勘 (knowledge. mining)是要從成堆的研究資料中,找出那些被埋藏知識的脈絡,William 等人便 利用知識探勘的方法,設計一套建構知識地圖的方式,並運用在 R&D/Technology 的管理上[3]。. 9.

(20) 2.5 主題地圖(Topic Maps) Topic Maps 為 ISO 制訂的標準(ISO/IEC 13250)[18], 是一套用來組織資訊 的方法,使用這個方法可以提供資訊最佳的導航、描述組織知識的結構與其它資 源間的關聯,並提供一個具彈性、可擴充成長的組織知識分享平台[10]。Topic. Maps 的架構乃以 T (Topic),A(Association),O(Occurrence)為基本概念[10],藉 由 XML 結構化的資料模式,將知識表達為有意義的關聯[10],並可將相關流程 知識以圖形方式呈現[17]。T.A.O.之定義如下:. T:Topic(主題),指的就是存在Topic Maps中的任何元素,可以是一個人、 企業組織、地方、實體,甚至一個概念[28]。在複合式電子服務中,一個服務提 供者(service provider),和其提供的服務(service)都是一種topic。. A:Association(關聯),即topic與topic之間的關係。透過association,可以展 示與導覽具某些關係的topic,因此對資訊量龐大的企業或組織,便是在知識表達 的一個強而有力的工具[28]。. O:Occurrence(參考),一個topic可以某些方式連結至一個,或一個以上與topic 在某些部分相關的資訊資源,這些資源即為該 topic 的 occurrence 。該 topic 的. occurrence可以是描述該topic的文件、圖畫或影片,因其通常不在topic maps文件 之內,因此能保有該文件獨立性[28]。. Topic maps 可用來幫助企業進行知識組織,建立一個讓員工能輕易存取、分 享與創造知識的環境[28],並在 groupware 中,幫助整合或從大量的組織記憶中 搜尋相關的知識或資訊[29]。 主題地圖樣板(Topic map template)是一組 topic types 的集合,描述主題地 圖中抽象化的主題類別,包含 Topic types、Occurrence types、Association types 等等[26]。如圖 2.4 所示,圖形上半部為 Topic map template,可視為 class;而圖 行下半部為真正實例的主題地圖,該圖上所示的各個 topics 、 occurrences 與. associations 即為樣板中 types 的實例(instance)。 10.

(21) 圖 2.4:Topic map template [26]. XTM (XML for Topic Maps) [31]是由Topic Maps.Org所制定,該組織是致力 於發展主題地圖與XML的獨立組織。XTM規格文件使用XML的資料模式與文法 來描述主題地圖,例如,定義topic中將包含name,resources和relationship等屬於. topic的特性。下表為用XTM來表示莎士比亞的部份作品的範例。由此範例可以 11.

(22) 顯示莎翁的兩部作品Hamlet 與 Tempest ( baseNameString),文件格式為 plan-text (instanceOf)與該文件的存取位置(resourceRef)。 <topic id="hamlet"> <instanceOf><topicRef xlink:href="#play"/></instanceOf> <baseName> <baseNameString>Hamlet, Prince of Denmark</baseNameString> </baseName> <occurrence> <instanceOf><topicRef xlink:href="#plain-text-format"/></instanceOf> <resourceRef xlink:href="ftp://www.gutenberg.org/pub/gutenberg/etext97/1ws2610.txt"/> </occurrence> </topic>. <topic id="tempest"> <instanceOf><topicRef xlink:href="#play"/></instanceOf> <baseName> <baseNameString>The Tempest</baseNameString> </baseName> <occurrence> <instanceOf><topicRef xlink:href="#plain-text-format"/></instanceOf> <resourceRef xlink:href="ftp://www.gutenberg.org/pub/gutenberg/etext97/1ws4110.txt"/> </occurrence> </topic>. 表 2.1:XTM 範例[31]. 12.

(23) 第三章、複合式電子服務平台概觀 本章參考我們先前的研究[21],設計與實作一個整合 Web Services、Topic. Maps 和個人化推薦的複合式電子服務平台,圖 3.1 顯示了完整的系統架構,整 體可以分為兩個部分:知識地圖建置系統(Knowledge Map Building System)、個 人化推薦系統(Personalized Recommendation System)。 管理者可以透過 Web Services 的技術,整合分散在各電子服務提供者間的 電子服務與複合式電子服務,並透過資料探勘的技術,發掘出複合式電子服務中 的有用資訊,進而將這些資訊建置到以 Topic Maps 建置的知識地圖中。使用者 透過知識地圖具有親和力的資訊導覽與呈現方式,可以直觀地經由屬性關聯的引 導,找尋到所需的複合式電子服務;此外也從使用者服務使用記錄中,找尋電子 服務的關聯與個人化的偏好資訊,也將這些資訊建置到知識地圖上,使得使用者 在導覽過程中,也會出現一般化與個人化的推薦,提供使用者選取的參考。 本篇研究主要探究前者:「知識地圖建置系統」,將於後面兩個章節詳述這 部分的運作流程與系統實作。在本章的以下各節,將先對完整系統的各主要模組 進行說明。. 13.

(24) Knowledge Map Building System Bind E-Services Provider. Bind. Register. Services Collecting & Building Module. UDDI Register. Find. Data Mining Module. User Navigator Interface Module. Topic Map Generator Module. Navigate Usage Record. User. User Feedback Module. Middleware Module. User Preference Module. Flow Mining Module. Recommendation Module. Personalized Recommendation System. 圖 3.1:複合式電子服務平台概觀. 3.1 知識地圖建置系統 知識地圖建置系統主要功能是收集來自不同電子服務提供者所提供的電子 服務資訊,再經由資料探勘技術分析,將所得到的資訊建置到知識地圖中,最後 藉由導覽系統將知識地圖呈現出,以方便使用者操作使用。如圖 3.2 所示,底下 簡介各模組的運作功能,細節部分將於第四章中討論。. 14.

(25) Bind. 1. E-Services Provider. Bind. Register. Services Collecting & Building Module. UDDI Register. Find. 2 Data Mining Module. 4. User Navigator Interface Module. 3 Topic Map Generator Module. Navigate Usage Record. User. 圖 3.2 知識地圖建置系統模組運作流程圖. 依據圖 3.2 中的編號,知識地圖建置系統主要包含下列功能模組: 模組 1. Service Plan Collecting & Building Module 各電子服務提供者將其提供的服務部署為 Web Services,註冊到 UDDI 中。 管理者由 UDDI 中搜尋得知電子服務的所在位置(Access Point)與服務描述資 訊(WSDL 檔),與各電子服務提供者取得繫結,取得各服務提供者所提供的電 子服務和複合式電子服務。 模組 2. Data Mining Module 由單一式電子服務和複合式電子服務中擷取出有用的屬性(metadata),利用 資料探勘方法將複合式電子服務作分群,並在各群中針對電子服務與複合式電子 服務屬性間做關聯規則分析,找出屬性間的關聯。 模組 3. Topic Maps Generator Module 依據 XTM 的標準,定義複合式電子服務的流程與屬性在 Topic Maps 中的 表示法。再由上一模組 Mining 的結果,將電子服務及其屬性的關連建置到 XTM 檔案中。 15.

(26) 模組 4. User Navigator Interface Module 設計一個具導覽與搜尋功能的視覺化使用者介面,將前一模組中建置的. XTM 資訊展現出來。當使用者完成了複合式電子服務流程,其包含的各單一電 子服務便會呼叫遠端其對應的服務提供者之 Web Services 程式,與電子服務提供 者取得繫結(binding),完成跨組織的協同商務運作。. 3.2 個人化推薦系統 個人化推薦系統的功能主要是針對來自導覽系統的使用者記錄檔作分析, 結合資料探勘與合作式推薦的方法,進行複合式電子服務平台上流程與個人化的 推薦。如圖 3.3 所示,底下簡介各模組的運作功能。. Knowledge Maps Building System. 1 User Feedback Module. Usage Record. User. 2. 3 User Preference Module. Flow Mining Module. 4 Recommendation Module. 圖 3.3 個人化推薦系統模組運作流程圖. 依據圖 3.3 中的編號,個人化推薦系統主要包含下列功能模組: 模組 1. User Feedback Module. 16.

(27) 使用者在使用完電子服務後,在此模組給予評分回饋,透過評分我們可以 得知使用者對電子服務提供者所提供的電子服務的喜好。 模組 2. User Preference Module 根據上述的評分回饋,利用 Pearson 相關係數的計算,找出使用者的同好群 組,並預測使用者對未使用過電子服務屬性的喜好(分數)。 模組 3. Flow Mining Module 根據使用者同好群組的使用記錄,利用關聯規則找出同好群組中最常執行 的流程順序與屬性,將兩者分數加總計算出流程定義的總和分數,用以推薦給使 用者最合適的複合式電子服務流程。 模組 4. Recommendation Module 結合上述 2 和 3 模組,找出 Top N 的單一電子服務(模組 2)與複合式電子 服務流程(模組 3)推薦給使用者。. 3.3 結合個人化推薦的知識地圖導覽系統 兩個系統最後藉由 Middleware Module 來做連結整合(如圖 3.1 所示)。. Middleware Module 中主要根據使用者在導覽系統中瀏覽到的電子服務或複合式 電子服務的分群類別,傳回相對應於該使用者、該群的複合式電子服務推薦結 果,使個人化的推薦結果可以整合到導覽系統。使用者在使用知識地圖導覽系統 過程中,除了可以得到一般化的地圖推薦指引,也能得到專屬於個人的複合式電 子服務流程推薦,可以提供給使用者參考,並協助使用者快速尋找到需求。. 17.

(28) 第四章、知識地圖建置系統 本章就知識地圖建置系統的各部分功能來做說明,此系統主要結合了 Web. Services、Data Mining 與 Topic Maps 的技術和標準來完成知識地圖導覽系統,底 下就依序介紹各模組元件組成與功能,並詳述其運作流程。. 4.1 系統架構圖 圖 4.1 為依據本研究的運作需求,所設計的系統架構模型。以下各節將分別 剖析各模組的運作流程,並說明模組與模組間的互動。. Service Plan Collecting & Building Module Bind. Data Mining Module. E-Services Provider. Collect. Register. Design. Services Database. Extract. Meta Information. Plan Designer UDDI Register. Find. Clustering Mining. Bind. User Navigator Interface Module. Topic Maps Generator Module Topic Management. Topic Query Service Choosing. XTM DTD Grammar. Topic Navigator. Association Rule Mining. XTM Pool. Association Management. Knowledge Pattern. Navigate Association Rule Mining. User Usage Record. 圖 4.1:知識地圖建置系統. 18. Feedback.

(29) 4.2 Service Plan Collecting & Building Module 4.2.1 模組功能說明 在 Service Plan Collecting & Building Module 中,管理者負責到 UDDI Registry 中尋找取得電子服務提供者所提供的電子服務資訊,此模組的運作流程說明如下. (對應圖 4.2 的編號):. Bind. 1. 3 E-Services Provider. Collect. Register. Design. 3 2. UDDI Registry. Plan Designer. Services Database. 4. Find. 圖 4.2:Service Plan Collecting & Building Module 流程架構圖. 1. 部署與描述電子服務: 電子服務提供者將其所提供的電子服務部署成 Web Services ,此 Web. Services 應包含三大功能: (1) 能顯示該電子服務提供者所提供的電子服務與複合式電子服務 (2) 能接受來自遠端系統的服務使用要求 (3) 能接受來自遠端系統的服務使用記錄查詢 同時提供描述其 Web Services 的 WSDL 文件,說明此 Web Services 提供哪 些服務和功能。. 2. 註冊電子服務: 電子服務提供者將網路服務的存取點與描述資訊登錄註冊到 UDDI Registry 19.

(30) 中,需註冊的資訊包括:服務提供者的資訊;所提供的服務名稱、存取點(Access ;與所繫結的商業技術規格(tModel, technical Model),通常是 WSDL 文件 Point) 的所在路徑。在協同商務的環境下,我們可以協議電子服務提供者將所提供同性 質的複合式電子服務以相同的名稱註冊到 UDDI 上,之後藉由搜尋特定服務名 稱,便可找出所有提供此服務的廠商資訊與服務資源所在。圖 4.3 以電腦課程選 課服務為例,有三家電子服務提供者皆註冊名稱為 ComputerCourseSelection 這個. Web Services(內含前一點所述的三大功能) ,透過關鍵字搜尋便可以得到所有相 同名稱的服務資訊與資源所在位置。. 圖 4.3:各電子服務提供者註冊相同性質的服務到 UDDI 上. 3. 尋找電子服務: 複合式電子服務平台管理者可透過 UDDI Registry 找到其所需的 Web. Services,並取得這些服務的鍊結資訊,通常為 WSDL 文件所在位置。 4. 整合與設計複合式電子服務:. 20.

(31) 複合式電子服務平台管理者根據於 UDDI 中搜尋到的鏈結資訊(WSDL 文 件位置) ,向每個電子服務提供者繫結其部署出的 Web Services,透過此 Web. Services 提供的功能將其所提供的電子服務與複合式電子服務儲存到複合式電子 服務平台的資料庫中,管理者並可由此設計出跨電子服務提供者的複合式電子服 務流程組合。 4.2.2 跨組織的複合式電子服務運作機制. Service Plan Collecting & Building Module 主要目的就是要獲取分散在各電 子服務提供者中的單一電子服務與複合式電子服務的資訊。管理者統整這些資 訊,也可以加入自訂的跨組織複合式電子服務流程。由這些蒐集與自訂的電子服 務中可以擷取出重要的屬性資訊,以便下一模組(Data Mining Module)進行資 料探勘分析。 在我們複合式電子服務知識地圖建置系統中,預設的電子服務包括以下三 種: 1. 各電子服務提供者所提供的單一電子服務。 2. 各電子服務提供者所提供的複合式電子服務,此複合式電子服務流程都是由 同一家電子服務提供者所提供。。 3. 管理者自訂的複合式電子服務,此複合式電子服務流程可以由多家不同的電 子服務提供者所提供,並不限於同一家電子服務提供者。 因此複合式電子服務流程的運作需要橫跨多家電子服務提供者,此即是一 種分散式運算技術的運用。我們透過 Web Services 的標準,來達成不同電子服務 提供者間的應用系統整合。圖 4.4 顯示了我們知識地圖建置系統的分散式運作機 制,圖中編號 1 到編號 4 的流程就是前述 Service Plan Collecting & Building. Module 所運作的功能,即與 4.2.1 節中圖 4.2 的編號 1 到編號 4 互相對應。. 21.

(32) 圖 4.4:複合式電子服務知識地圖建置與運作機制. 圖 4.4 中編號 5 即將收集與自訂的電子服務資訊儲存到平台的資料庫中,以 便後續進行資料探勘分析與主題地圖建置。編號 6 和 7 顯示使用者在導覽知識地 圖進行複合式電子服務流程時,流程中執行的各項電子服務,都會繫結回原服務 提供者,同樣是透過 Web Services 運作,以 HTTP+SOAP 方式進行傳輸呼叫。. 4.3 複合式電子服務知識地圖樣版 由前一節的 Service Plan Collecting & Building Module 我們蒐集了分散於不 同電子服務提供者的單一電子服務與複合式電子服務,歸納這些服務的特性,萃 取出這些電子服務的屬性資訊(meta information),如圖 4.5 所示,利用這些屬 性資訊我們可以設計出知識地圖的屬性樣版(knowledge map template),同時可 以透過這些屬性資訊進行資料探勘。本節先探討知識地圖屬性樣版的建立,資料 探勘的部分於下一節中介紹。. 22.

(33) Services Database. Extract. Meta Information. Topic Maps Template Data Mining Module Topic Maps Generator Module. 圖 4.5:meta information 的運用流程. 4.3.1 複合式電子服務的 meta information. Meta information 為一種描述資料的資料,有助於識別、描述資料的共通屬 性。我們從根據電子服務的特性可以擷取出代表此電子服務的 meta information, 以電腦課程選課服務為例,線上選擇某一課程時,需要決定該門課的上課地點、 時段、授課講師…等選擇,我們將進行某一課程的這些選擇動作,視為一個單一 電子服務。每個單一電子服務的重要屬性包括:服務提供者(Provider) 、課程種 類( Category )、課程難易度( Difficulty )、上課地點( Location )、上課時段 (TimePeriod) 、授課講師(Instructor) 、上課時數(Hours) 、費用(Cost) 。以電 子服務提供者 Mitac 所提供的「Programming with C#」這個單一選課電子服務為 例,其 meta information 如表 4.1 所示。當使用者使用這項服務時,需決定上課 的地點、時段與授課講師,做好這些選擇即完成這一項單一電子服務的使用。. 23.

(34) 服務名稱 Programming with C#. 屬性 Provider. Mitac. Category. Programming. Difficulty. Basic. Location. Taipei、Hsinchu. TimePeriod. Afternoon、Evening. Instructor. John、Mike. Hours. 24. Cost. 10000. 表 4.1:單一電子服務的 meta information 複合式電子服務流程是由多個單一電子服務所組成,因此複合式電子服務 的 meta information,即為這些單一電子服務屬性的加總集合。以「MCSD Training. Course 」 這 個 複 合 式 電 子 服 務 為 例 , MCSD ( Microsoft Certified Solution Developers)是微軟認證的電腦技能證照,欲取得此認證需通過 VB 或 C#程式語 言、SQL Server 資料庫…等相關科目的考試,MCSD Training 的課程就是要訓練 使用者具備參與這項考試的知識,因此內容包含一系列的課程。使用者欲參加這 一系列課程,需完成各課程的選課服務,這些單一選課服務的流程組合起來,就 是一個複合式電子服務流程。這些流程具有順序性,通常依實際狀況(如:課程 應由簡單到進階)或使用者個人需求和喜好而會有不同的流程組合。 圖 4.6 顯示「MCSD Training Course」的複合式電子服務流程,圖中節點的 號碼代表單一選課服務的代號。而「MCSD Training Course」的屬性即為這些單 一選課服務屬性的加總,如表 4.2 所示。複合式電子服務非數值資料的屬性為單 一電子服務的值之集合,服務流程中 Or 或 And 分支的兩條服務流程屬性都包含 在內,因為流程的選擇最終是由使用者決定,在尚未決定前,此複合式電子服務 具備該兩條流程屬性的加總集合。如表 4.2 中 MCSD 的 provider 屬性為. 24.

(35) {Mitac,Ucom},兩條 Or 服務流程屬性都要算入 MCSD 的屬性集合加總。而複合 式電子服務數值的屬性為數值的加總,遇有 Or 分支時,則取分支總和較大的值 代表該複合式電子服務的屬性值。見表 4.2 中全部時間與全部花費的計算。. 19 21. 23 Or. Or 20. 25. 8. 9. 24. 圖 4.6:複合式電子服務: 「MCSD Training Course」流程. 服務代號. Provider. Category. …….. Hours. Cost. 21. Mitac. Programming. …….. 24. 12000. 19. Mitac. Programming. …….. 24. 10000. 23. Mitac. Programming. …….. 28. 15000. 20. Ucom. Programming. …….. 24. 10000. 24. Ucom. Programming. …….. 24. 15000. 25. Mitac. Programming. …….. 28. 15000. 8. Mitac. Database. …….. 24. 10000. 9. Mitac. Database. …….. 24. 11000. { Mitac,Ucom }. { Programming, Database }. …….. 152. 73000. MCSD. 全部時間=24+Max{(24+28),(24+24)}+28+24+24=152 全部花費=12000+Max{(10000+15000),(10000+15000)}+15000+10000+11000=73000. 表 4.2:複合式電子服務之 meta information. 25.

(36) 4.3.2 Topic Maps Template 的定義 建立 knowledge map template 是將複合式電子服務的知識模式化的首要條 件,在本研究我們以 Topic Maps 的標準,做為知識地圖屬性樣版的中心結構, 採用 Topic Maps 中的 topic types、association types、occurrences 這些概念來設計 出一組適用的定義,使其能適切表達單一電子服務、複合式電子服務、流程資訊、 電子服務的屬性、電子服務提供者等知識的 knowledge map template。在複合式 電子服務中,一個服務提供者(service provider)及其提供的服務(service)與服務 的屬性(attribute)和流程(sequence)都是一種 topic。 上一節中我們談到由電子服務特徵中擷取出 meta information,針對一般性 的電子服務大致可以定義出底下幾個一般化的屬性: Provider:描述 Service 的提供者,通常為公司或組織名稱。 Category:描述 Service 的類別,如:SQL Server 與 Oracle 的選課服務都屬於 「Database」這個類別。 Location:描述服務的地點,如:課程的開課地點。 Cost:服務的費用,如:該課程的上課費用 Rating:服務的等級,通常由使用者回饋提供,如:對於該課程評價或滿意度。 ExtAttribute:針對特定服務所訂定的延伸屬性,提供屬性定義的擴充。如:針 對電腦課程選課服務,有講師(Instructor) 、課程難易度(Difficulty) 、上課時段 (TimePeriod)等特有的屬性,皆可定義在此延伸屬性中。 因此我們依照複合式電子服務的特性與 XTM 文件的標準,可以將 Topic. Maps template 定義如表 4.3 所示,其中包含 Topic types、Occurrence Types、 Association types 及其中的 Role。. 26.

(37) 類型. 名稱. 說明. (id name). Topic Types. CS. Composite service. BS. Basic service. Provider. Service 的供應商屬性. Category. Service 的種類屬性. Location. Service 的位置屬性. Cost. Service 的費用屬性. Rating. Service 的等級屬性. ExtAttribute. 提供自訂的 Service 延伸屬性. And-Split. Composite service 中的 And 描述. Or-Split. Composite service 中的 Or 描述. Start. Composite service 的流程起點. Stop. Composite service 的流程終點. Relevance. 屬性的關聯或服務的推薦. Occurrence Types AccessPoint. Association Types. Role. 服務存取點. Description. 服務相關資源描述. Sequence. Composite services 中的 Sequence 描述. Contain. Composite services 中所包含的 Basic Service. StartPoint. 描述在 Sequence 中的 role,為起始點. EndPoint. 描述在 Sequence 中的 role,為終止點. Parent. 描述在 Contain 中的 role,代表上層的 role,如:. composite services 相對於 basic service 的 role Children. 描述在 Contain 中的 role,代表下層的 role,如: basic service 在 composite services 中的 role. 表 4.3:XTM For Composite e-services 的 template 定義. 上述的 template 定義,在 XTM 文件中分別如下列各表(表 4.4 到表 4.7)所示。. 27.

(38) Basic Services(BS) <topic id="BS"> <baseName> <baseNameString>Basic Service</baseNameString> </baseName> </topic>. Composite Services(CS) <topic id="CS"> <baseName> <baseNameString>Composite Services</baseNameString> </baseName> </topic>. Category <topic id="Category"> <baseName> <baseNameString>Category</baseNameString> </baseName> </topic>. Location <topic id="Location"> <baseName> <baseNameString>Location</baseNameString> </baseName> </topic>. Cost <topic id="Cost"> <baseName> <baseNameString>Cost</baseNameString> </baseName> </topic>. Rating <topic id="Rating"> <baseName> <baseNameString>Rating</baseNameString> </baseName> </topic>. ExtAttribute <topic id="ExtAttribute"> <baseName> <baseNameString> ExtAttribute </baseNameString> </baseName> </topic>. And-Split <topic id="And-Split"> <baseName> <baseNameString>And-Split</baseNameString> </baseName> </topic>. Or-Split. 28.

(39) <topic id="Or-Split"> <baseName> <baseNameString>Or-Split</baseNameString> </baseName> </topic>. Start <topic id="Start"> <baseName> <baseNameString>Start</baseNameString> </baseName> </topic>. Stop <topic id="Stop"> <baseName> <baseNameString>Stop</baseNameString> </baseName> </topic>. 表 4.4:XTM for Topic Types 定義. Relevance <topic id="Relevance"> <baseName> <baseNameString>Relevance</baseNameString> </baseName> </topic>. AccessPoint <topic id="AccessPoint"> <baseName> <baseNameString>AccessPoint</baseNameString> </baseName> </topic>. Description <topic id="Description"> <baseName> <baseNameString>Description</baseNameString> </baseName> </topic>. 表 4.5:XTM for Occurrence Types 定義. Sequence <topic id="Sequence"> <baseName> <baseNameString>Sequence</baseNameString> </baseName> </topic>. Contain 29.

(40) <topic id="Contain"> <baseName> <baseNameString>Contain</baseNameString> </baseName> </topic>. 表 4.6:XTM for Association Types 定義. StartPoint <topic id="StartPoint"> <baseName> <baseNameString>StartPoint</baseNameString> </baseName> </topic>. EndPoint <topic id="EndPoint"> <baseName> <baseNameString>EndPoint</baseNameString> </baseName> </topic>. Parent <topic id="Parent"> <baseName> <baseNameString>Parent</baseNameString> </baseName> </topic>. Children <topic id="Children"> <baseName> <baseNameString>Children</baseNameString> </baseName> </topic>. 表 4.7:XTM for Role 定義. 4.4 Data Mining Module 由 4.3.2 節中所擷取出複合式電子服務的 meta information,我們進一步利用 資料探勘的方法,先將大量的電子服務分成若干群組,將相似的複合式電子服務 分在同一群中,可篩選與簡化大量資料以便進行分割處理。之後在每一群找出屬 性的關聯與服務的推薦,以做為建置到 Topic Maps 中的依據,即先前定義的. Relevance(Occurrence Type),細節部分將於 4.5.3 節中描述。. 30.

(41) 4.4.1 模組功能說明 本模組的分析可以分成兩類,如圖 4.7 所示,圖中編號 1 代表 Data Mining for. Composite e-services,是依據 Services Database 中的資料來進行服務的分群與每 一群中服務屬性的關聯分析。圖中編號 2 代表 Data Mining for Usage Record,是 依據使用者使用記錄檔,找出相關聯的服務推薦。. 1.Data Mining for Composite e -services 1. Services Database. Extract. Meta Information. Clustering Mining. Feedback. Association Rule Mining. Knowledge Pattern. Usage Record. 2 2. Data Mining for Usage Record 圖 4.7:Data Mining Module 流程架構圖. 4.4.2 Data Mining for Composite e-services 針對在 Service Plan Collecting & Building Module 所蒐集建置出的 Services. Database,進行資料探勘的分析,如圖 4.8 所示,先對資料進行分群,之後在每 一群中找尋屬性間的關聯。. 31.

(42) 圖 4.8:Data Mining for Composite e-services 分析流程. 4.4.2.1 Clustering Composite e-services 由於複合式電子服務是由多個單一電子服務(basic e-service)所組成,根 據前面 4.3.1 節的定義,複合式電子服務擁有其包含的單一電子服務屬性集合, 以電腦課程選課服務的模擬案例來說,我們假設每一個單一電子服務至少會隸屬 於一個的複合式電子服務,因此此處僅對複合式電子服務來進行分群,單一電子 服務則會跟隨複合式電子服務歸屬到該分群結果。 底下以電腦課程選課服務的模擬案例來說明分群的步驟: 1.轉換為 Vector model: 前面 4.3.1 節中我們擷取出每個單一選課服務的 meta information,共有 6 個 屬性,分析這些屬性值,可整理成如表 4.8。. 32.

(43) Provider. Category. Location. Mitac. P1. Network_OS C1. Taipei. L1. Ucom. P2. Database_M C2. Hsinchu. L2. PCSchool. P3. Taichung. L3. Office. C3. Programming C4 Kaohsiung L4. TimePeriod. Instructor. Difficulty. Morning. T1. John. I1. Basic. Afternoon. T2. David. I2 Advanced D2. Evening. T3. Mike. I3. Vacation. T4. Nancy. I4. Jessie. I5. Expert. D1. D3. 表 4.8:描述每個單一選課服務的 6 個屬性 因此每個選課服務屬性便可用位元向量模式(bit vector model)來表示,表. 4.9 代表 M_N1 這個單一選課服務的屬性值向量模式,其 Provider 的屬性值為 「Mitac」,根據表 4.8 代號為 P1,所以其 P1 值為 1,P2、P3 值皆為 0,其餘向 量值依同理產生。. 表 4.9:單一選課服務 M_N1 的屬性向量表示法 複合式電子服務的屬性為其包含的所有單一電子服務屬性的集合,若以向 量模式來表示,則為所有單一電子服務的位元向量值,做 Or 運算而得,表示只 要所包含的單一電子服務具有某屬性值(位元向量值為 1),則複合式電子服務 便有該屬性值。表 4.10 顯示 CS_1 這個複合式選課服務的屬性向量表示法。. 33.

(44) 表 4.10:複合式選課服務 CS_1 的屬性向量表示法 2.計算複合式電子服務間的距離: 複合式電子服務間的距離(差異),以兩個 Vector 間的 Euclidean distance 來表 示,底下公式代表第 i 與第 k 個 Vector 間的距離。 1/ 2. t. d (i, k ) = [∑ (Vij − Vkj ) ] 2. j =1. 3.進行分群: 本研究用 K-Means 來進行分群,先決定要分的群數 K,以第 2 點中所定義 的距離來做為 K-Means 分群的計算依據。分群實作的部分,將於第五章中說明。 4.決定代表群中心屬性: 分群結果中每一群的代表群中心屬性的位元向量值(0 或 1),取決於該屬性 值在群中的出現頻率,以出現頻率較高者來代表群中心。我們設定門檻值. (threshold)為 0.5,大於等於門檻值群中心值為 1,反之為 0。表 4.11 表示分群的 結果中 Cluster A 的代表群中心,其擁有 P1、C2、D1、D2、L1…等屬性特徵。. 表 4.11:分群結果中 ClusterA 的代表群中心. 34.

(45) 4.4.2.2 Mining associations among services attributes 在每一個分群結果中,利用 Apriori 演算法,找出服務屬性間的關聯,此處 分別對單一電子服務與複合式電子服務分別進行 Apriori 演算法,如圖 4.9 所示。. Basic e-services. Composite e-services. Association Rule Mining. Association Rule Mining. Association among services attributes. 圖 4.9:Mining associations among services attributes 分析流程. 1.單一電子服務屬性關聯分析結果: 可以找出如下的關聯種類:. Location 例如:Taipei. Instructor 例如: Mike. Instructor 例如:Mike. Provider. TimePeriod Vacation,表示台北的課程經常開在假日。 Location Hsinchu,表示 Mike 講師經常在新竹開課。 Provider Ucom,表示 Mike 經常在 Ucom 這家服務提供者開課。 Difficulty. 35.

(46) 例如:PCSchool. Basic,表示 PCSchool 通常開入門(Basic)的電. 腦訓練課程。. Instructor. Category. 例如:Nancy. Database_M,表示 Nancy 經常開資料庫管理的課程。. 2.複合式電子服務屬性關聯分析結果: 由於複合式電子服務是由多個單一電子服務所組成,因此對其做關聯規則 分析,可以找出在單一電子服務中所沒有發掘到的規則,如下列所示:. Category. Category. 例如:Network_OS. Database_M,表示網路作業系統與資料庫管理. 的選課服務通常會被安排在預設的複合式選課服務組合中。. Provider. Provider. 例如:Ucom. Mitac,表示 Ucom 與 Mitac 提供的選課服務,通常會. 被安排在預設的複合式選課服務組合中。 前一點由單一電子服務所發掘到的規則,只能找到不同服務屬性間屬性值 的關聯。根據複合式電子服務屬性關聯分析,可以更進一步瞭解到同一服務屬性 內不同屬性值的關聯。 4.4.3 Data Mining for Usage Record 從使用者記錄檔中,針對使用者每次的複合式電子服務使用流程,找出的 單一與複合式電子服務同時出現頻率最高的前幾名(Top N) ,以便在 Topic Maps 中使用者導覽到該電子服務或複合式電子服務時,可以對使用者推薦常被同時使 用的相關電子服務與複合式電子服務,如圖 4.10 所示。. 36.

(47) 圖 4.10:Data Mining for Usage Record 分析流程. 4.5 Topic Maps Generator Module 4.5.1 模組功能說明 本模組是要建置出完整的複合式電子服務 Topic Maps,儲存在 XTM 檔中, 依照先前分群的結果,每一群為一個獨立的 XTM 檔。每一群中的單一電子服務、 複合式電子服務之屬性與內容,都要建成 topic,這些 topics 都會隸屬到 Topic Maps. template 的某類 type 中。此外複合式電子服務的流程、包含的單一電子服務、資 料探勘後的屬性關聯與服務推薦,也要建置到 association 與 occurrence 中。基本 上可以分為 Topic 維護與 Association 維護兩方面,如圖 4.11 所示。. Meta Information. Data Mining Module. Topic Management XTM DTD Grammar. XTM Pool. Association Management. Knowledge Pattern. 圖 4.11:Topic Maps Generator Module 流程架構圖 37.

(48) 4.5.2 Topic Management 每個單一電子服務名稱、複合式電子服務名稱、服務的屬性等在 Topic Maps 中都是真實主題(real topic),因此都會隸屬於某個抽象的 topic type,本身即為 該 topic type 的一個 instance。以電腦課程選課服務模擬案例來說,選課服務的. Location 屬性值可能為 Taipei、Hsinchu…等值。在 Topic Maps 表示法中,Taipei 為一個 real topic,屬於 Location 這個 topic type 的一個 instance,表 4.12 表示在. XTM 中,Taipei 這個 topic 的表示法。 <topic id="Location"> <baseName> <baseNameString>Location</baseNameString> </baseName> </topic> <topic id=“608"> <instanceOf><topicRef xlink:href="#Location"/></instanceOf> <baseName> <baseNameString>Taipei</baseNameString> </baseName> <variant> <parameters> <topicRef xlink:href="http://www.topicmaps.org/xtm/1.0/#psi-display"/> </parameters> <variantName> <resourceData>L1</resourceData> </variantName> </variant> </topic>. 表 4.12:Location 屬性值:Taipei 之 XTM 表示法 在 4.3.2 節中有定義 ExtAttribute 這個提供屬性擴充的 topic type,電腦課程 選課服務具有課程難易度(Difficulty)、授課講師(Instructor)…等屬性,這些 屬性並沒有定義在預先制訂的一般電子服務的 topic types 中,因此我們可以藉由. ExtAttribute,將這些屬性定義成 ExtAttribute 的 instance,成為擴充的 topic type, 表 4.13 顯示 Nancy 這個 Instructor 屬性值在 XTM 中的表示法。 在複合式電子服務架構下,單一電子服務屬於 BS 這個 topic type,複合式 電子服務屬於 CS 這個 topic type,表 4.14 表示了「Programming with C#」這個 單一選課服務的 XTM 表示法,表 4.15 表示了「MCSD」這個複合式選課服務的. XTM 表示法。 38.

(49) <topic id="ExtAttribute"> <baseName> <baseNameString>ExtAttribute</baseNameString> </baseName> </topic> <topic id="Instructor"> <instanceOf><topicRef xlink:href="#ExtAttribute"/></instanceOf> <baseName> <baseNameString>Instructor</baseNameString> </baseName> </topic> <topic id=“622"> <instanceOf><topicRef xlink:href="#Instructor"/></instanceOf> <baseName> <baseNameString>Nancy</baseNameString> </baseName> <variant> <parameters> <topicRef xlink:href="http://www.topicmaps.org/xtm/1.0/#psi-display"/> </parameters> <variantName> <resourceData>I4</resourceData> </variantName> </variant> </topic>. 表 4.13:Instructors 的屬性值:Nancy 之 XTM 表示法 <topic id="BS"> <baseName> <baseNameString>Basic Service</baseNameString> </baseName> </topic> <topic id=“19"> <instanceOf><topicRef xlink:href="#BS"/></instanceOf> <baseName> <baseNameString>Programming with C#</baseNameString> </baseName> <variant> <parameters> <topicRef xlink:href="http://www.topicmaps.org/xtm/1.0/#psi-display"/> </parameters> <variantName> <resourceData>M_P1</resourceData> </variantName> </variant> </topic>. 表 4.14:單一選課服務「Programming with C#」之 XTM 表示法 <topic id="CS"> <baseName> <baseNameString>Composite Services</baseNameString> </baseName> </topic> <topic id=“1002"> <instanceOf><topicRef xlink:href="#CS"/></instanceOf> <baseName> <baseNameString>MCSD (Composite Services)</baseNameString> </baseName> <variant> <variantName> <resourceData>M_MCSD</resourceData> </variantName> </variant> </topic>. 表 4.15:複合式選課服務「MCSD」之 XTM 表示法 39.

(50) 4.5.3 Association Management 在 Topic Maps 中,除了每個 topic 的建立外,最重要的就是 topic 之間的關 聯(Association)與事件(Occurrence) 。在複合式電子服務架構下,這些關聯與 事件可分為以下幾類: 1. 屬性與電子服務的包含關係: 一個屬性值會包含有一到多個單一或複合式電子服務,例如:Taipei 這個屬 性值底下包含有「MCSD」這個複合式選課服務。而一個複合式電子服務會包含 多個單一電子服務,例如: 「MCSD」這個複合式選課服務下,包含有「Programming. with C#」這個單一選課服務。在 XTM 表示法中將這類的包含關係利用 Contain 這個 association type 來表示,其中 Parent 角色(Role)代表上層的屬性或複合式 電子服務,Children 角色代表下層的單一或複合式電子服務。表 4.16 表示複合式 電子服務「MCSD」 (topic id=1001)底下包含「Programming with C#」 (topic id=19) 這個單一電子服務。 <topic id="Contain"> <baseName> <baseNameString>Contain</baseNameString> </baseName> </topic> <association id=“MCSD_C1"> <instanceOf><topicRef xlink:href="#Contain"/></instanceOf> <member> <roleSpec><topicRef xlink:href="#Parent"/></roleSpec> <topicRef xlink:href="#1001"/></member> <member> <roleSpec><topicRef xlink:href="#Children"/></roleSpec> <topicRef xlink:href="#19 "/></member> </association>. 表 4.16:MCSD 底下包含 Programming with C# 2. 複合式電子服務的流程 複合式電子服務包含多個單一電子服務的執行流程,流程具有順序性,在. XTM 中用 Sequence 這個 association type 來表示流程順序關係,其中 StartPoint 代表順序在前的單一服務,EndPoint 代表順序在後的單一服務。圖 4.12 表示. 40.

(51) MCSD 複合式電子服務流程的框線部分之 XTM 表示法。. 圖 4.12:MCSD 複合式選課服務流程 XTM 表示法. 3. 屬性的關聯與服務的推薦 在 4.4 節中用資料探勘得到的結果可分為兩類:一類是屬性的關聯;另一類 是常用服務的推薦。這些關聯資訊在 XTM 中可以用 Relevance 這個 occurrence. type 來表示。例如:根據找出的關聯規則,與 Nancy 屬性值有關聯的其他屬性值 有 Taipei、Ucom、Database_M 三個屬性值,三者的 topic id 分別為 608、602、. 605,在 XTM 中表示法如表 4.17 所示。若是服務的推薦,例如:根據 Mining 的 結果,針對 Programming with C#這個選課服務,會推薦 topic id 為 9、23、25 的 選課服務,如表 4.18 所示。. 41.

(52) <topic id=“622"> <instanceOf><topicRef xlink:href="#Instructor"/></instanceOf> <baseName> <baseNameString>Nancy</baseNameString> </baseName> <variant> <parameters> <topicRef xlink:href="http://www.topicmaps.org/xtm/1.0/#psi-display"/> </parameters> <variantName> <resourceData>I4</resourceData> </variantName> </variant> <occurrence> <instanceOf><topicRef xlink:href=”#Relevance”/></instanceOf> <resourceRef xlink:href=”#608”/> </occurrence> <occurrence> <instanceOf><topicRef xlink:href=”#Relevance”/></instanceOf> <resourceRef xlink:href=”#602”/> </occurrence> <occurrence> <instanceOf><topicRef xlink:href=”#Relevance”/></instanceOf> <resourceRef xlink:href=”#605”/> </occurrence> </topic>. 表 4.17:Nancy 屬性值的關聯 <topic id=“19"> <instanceOf><topicRef xlink:href="#BS"/></instanceOf> <baseName> <baseNameString>Programming with C#</baseNameString> </baseName> <variant> <parameters> <topicRef xlink:href="http://www.topicmaps.org/xtm/1.0/#psi-display"/> </parameters> <variantName> <resourceData>M_P1</resourceData> </variantName> </variant> <occurrence> <instanceOf><topicRef xlink:href=”#Relevance”/></instanceOf> <resourceRef xlink:href=”#9”/> </occurrence> <occurrence> <instanceOf><topicRef xlink:href=”#Relevance”/></instanceOf> <resourceRef xlink:href=”#23”/> </occurrence> <occurrence> <instanceOf><topicRef xlink:href=”#Relevance”/></instanceOf> <resourceRef xlink:href=”#25”/> </occurrence> </topic>. 表 4.18:Programming with C#選課服務的常用推薦. 42.

數據

圖 2.3:SOAP 訊息架構
圖 2.4:Topic map template [26]
圖 3.3  個人化推薦系統模組運作流程圖
圖 4.1:知識地圖建置系統
+7

參考文獻

相關文件

回應電子平台問題 自主探索 考察點額外講解 支援學生.

利用 Microsoft Access 資料庫管理軟體,在 PC Windows 作業系 統環境下,將給與的紙本或電子檔(如 excel

‧ 「種籽」計畫名稱及編號 : 善用社區資源促進 常識科的探究式學習 (KP0107). ‧

微陣列玻片資料庫 (The Microarray Database,以下簡稱 TMD) 為本研究嘗 試建置的一套提供存取、分析微陣列玻片 (Microarray)

當 Bundle 啟動後會將自身所提供的服務註冊到 Service Registry 中,如圖 2-12,Service Registry 會對部署在 OSGi Framework 的 Bundles 發送新加入 Bundle 的 Service

資料探勘 ( Data Mining )

由於資料探勘 Apriori 演算法具有探勘資訊關聯性之特性,因此文具申請資 訊分析系統將所有文具申請之歷史資訊載入系統,利用

I-STD 是在資料以漸進式增加的前提下進行資料探勘,在醫院的門診診斷紀 錄中,雖然每個月門診數量不盡相同但基本上仍有一固定總門診數量範疇,因此 由圖