• 沒有找到結果。

購系統為例)

N/A
N/A
Protected

Academic year: 2022

Share "購系統為例) "

Copied!
91
0
0

加載中.... (立即查看全文)

全文

(1)

中 華 大 學 碩 士 論 文

題目:運用自適應共振理論網路與資料探勘技術 於 Web 應用系統介面最佳化模組之應用(網路請

購系統為例)

Applying Adaptive Resonance Theory and Data Mining Techniques to Optimal User Interface Model on Web Application System(Take Internet

Purchase System as the Example)

系 所 別:資訊管理學系碩士班 學號姓名:M09110021 張崇正 指導教授:邱登裕 博士

中華民國九十三年六月

(2)
(3)
(4)
(5)

中文摘要

網際網路於近幾年來蓬勃發展,電腦應用系統也漸漸朝向網際網路發展。

而 Web 化之應用系統是以多人且素質不一的操作者於遠端經由網際網路使用。

為了滿足多人且素質不一的使用者操作,使用者介面的規劃就成了系統成敗之關 鍵因素。

許多文獻及研究都針對使用者介面於入口網站或其他週邊設備作探討,很 少有文獻針對不同性質之應用系統作探討。然而手機或其他週邊設備強調個人使 用上的習慣,並非應用系統之複雜操作之簡化,所以此項議題是值得特別研究的 方向。

本研究結合了類神經網路與資料探勘技術並針對 Web 化應用程式使用者介 面的研究領域,提出一個以操作者為導向的操作介面導入機制,此操作介面導入 機制以 ART 網路演算法產生操作者社群,並使用 Apriori 演算法為技術,探勘 出操作者社群應之操作流程的操作介面導入法則,再將流程中可簡化之程序略 過,產生適當的操作介面導入機制,讓網路應用系統操作者能夠更順暢的操作系 統。並實際導入「會計網路請購系統」收集導入後之操作資訊,以分析其成效。

關鍵字:人機介面、類神經網路、自適應共振理論網路、資料探勘、介面最佳化。

(6)

Abstract

The Internet developed vigorously last few years. Computer application system also gradually faces the Internet development. The application system of Web is used by the multi-users and operatored through remote use of the Internet . In order to satisfy the multi-users,user interface became key factors of system success or failure.

This research combines neural network and data mining technology.

We use ART network to produce the operator group,and use Apriori algorithm to draw operation rule for author society group. We simplify the operation flow and skip uncessary procedure.

S o u s e r s c a n o p e r a t e t h e s y s t e m e f f i c i e n t l y . E v e n t u a l l y , w e a p p l y o u r m e t h o d s t o a n a c c o u n t i n g p u r c h a se a p p l i c a t i o n s y s t e m a n d a n a l y z e t h e r e s u l t s .

Keywords: Neural Network,Adaptive Resonance Theory ART,Data Mining

(7)

誌謝

回顧這兩年研究所的日子,是非常的刻骨銘心。首先要感謝指導教授邱登裕 老師長期以來細心指導及諸多方面的體諒,使我能夠在繁忙工作餘暇順利完成研 究所的學業,在此謹致上最深的謝意,希望未來有機會能夠再度成為邱老師的學 生。也要感謝一起同甘共苦的實驗室同學佩欣和金慶,感謝你們在這兩年來的幫 忙,也讓這段學習能留下很美好的回憶。

對於兩年研究所的生涯,還要特別感謝跟我同為同學的老婆,一起跟我度過 這段生活,也給我添加了一個可愛的小麻煩(小彤)。讓我在這段期間的日子過的 非常充實且快樂。沒有您們的幫助與支持,研究所的學業無法順利完成。另外還 要感謝我的父母和我的岳父母。在此願與您們共同分享研究所學業的完成和本文 之成就與喜悅。

還有一群可愛的朋友:小兒、Q尾、黑皮、大皮、呆臉、小Q、橘鼻、章魚頭、

青蛙頭、壞蛋牛,感謝你們在精神上的支持和鼓勵。

(8)

目錄

中文摘要………..i

Abstract………ii

誌謝……….iv

目錄……….v

圖目錄……….vii

表目錄………viii

第一章 緒論………...1

第一節 研究背景………1

第二節 研究動機………2

第三節 研究目的………5

第四節 研究流程架構………7

第五節 論文概述………7

第二章 文獻探討………9

第一節 人機介面………9

第二節 資料探勘(Data Mining)及關聯式法則演算法………..15

第三節 類神經網路及自適應共振理論網路………..18

第三章 研究架構與方法……….26

第一節 Web 應用系統介面最佳化概念……….…26

第二節 操作者分群網路模組概念……….28

第三節 介面最佳化資料探勘模組概念……….33

第四節 線上(On-Line)操作介面導入模組概念………37

第四章 實驗設計與實例應用……….40

第一節 網路請購系統建置……….40

第二節 網路請購系統介面最佳化模組建置……….41

第三節 最佳化介面導入機制建置……….57

第四節 實驗結果分析……….57

第五章 結論與未來建議……….61

(9)

第一節 研究結論……….61

第二節 未來研究建議……….62

參考文獻……….63

附錄 A 流程最佳化分析系統功能說明………..68

(10)

圖目錄

圖一、研究流程架構………7

圖二、人機介面設計歷程………..12

圖三、使用性組成概念模式………..14

圖四、ART 網路架構圖………..25

圖五、Web 應用系統之介面最佳化機制架構………..26

圖六、介面最佳化分析系統架構圖………...27

圖七、ART 操作者分群架構圖………..28

圖八、資料探勘模組其進行步驟………34

圖九、Apriori 演算法找出 Web 系統操作介面關聯法則之處理程序……….35

圖十、線上操作介面導入處理程序………37

圖十一、網路請購系統流程架構圖………...42

圖十二、APR_ART 分群之介面………47

圖十四、單一操作介面資料探勘分析………..50

圖十五、兩項操作介面資料探勘分析………..52

圖十六、三項操作介面資料探勘分析………..54

圖十七、四項操作介面資料探勘分析………..56

圖十八、時間/接受與不接受介面流程安排之比率……….58

(11)

表目錄

表一、會計網路服務系統使用者特性區分………5

表二、人機介面定義………..11

表三、ISO 9241 使用性標準………..13

表四、操作者分群網路變數定義表………..30

表五、分析範例簡化流程………..39

表六、可簡化之請購流程編號表………..43

表七、可簡化之查詢流程編號表………..44

表八、操作流程資料表架構………..45

表九、ART 分群資料表架構……….46

表十、APR_ART 警戒值 0.5 分群結果………48

表十一、分群的結果合理性分析………..48

表十二、單項操作介面探勘結果………..51

表十三、二項操作介面探勘結果………..53

表十四、三項操作介面探勘結果………..54

表十五、四項操作介面探勘結果………..56

表十六、時間/接受與不接受介面流程安排比率……….58

(12)

第一章、緒論

第一節 研究背景

由於全球資訊網(WWW,World Wide Web)的出現,使得資訊管理及應用系 統也漸漸Web化。對於系統的管理者來說,如果能夠將繁瑣的資料輸入的動作交 給龐大的網路使用者,是一件非常完美的事。但是為了達到這個目的並不容易,

因為並非所有的應用系統都能將工作交給網路的使用者。網路使用者只需要利用 一個全球資訊網瀏覽器(Browser)例如:Netscape,Internet Explorer 之類的軟體,

便可以在任何有網路之地方作資訊之管理。結合這些重要的優點,Web化應用 系統已成為最受矚目的網路服務種類。但是在這種美好的遠景下,似乎也存在著 一些極需要改善的問題。例如:親和力的介面設計不易等。

以使用者的角度來看,當使用者在使用Web應用程式之複雜性,或對於功能 標示不明確,而產生一種茫然感;而每一個功能或子功能,常因一些不明確的閃 爍圖文框、指示性圖示或不慣用的語系造成操作不當,造成時間的浪費及作業之 錯誤。再者,每一個設計師所設計出的Web應用系統使用者介面並不一致,使得 使用者在Web應用系統使用上需要再學習與再認知。若由設計者的角度出發,

在介面設計的時候並沒有足夠的設計資訊與設計原則來輔助介面設計師設計。

以致降低了網路的便利性。造成這些現象的主因,則是過去的基礎理論研究領域 還來不及銜接上新時代的新工具,導致有許多研究不足的部分,由於缺乏基礎理

(13)

論的基礎,Web應用系統程式設計師在設計Web應用系統時並沒有一些參考準則 可以參考,在大多數Web應用實驗設計者設計Web應用系統時,僅能以個人主觀 意識,或仿效他人作品來做考量。

第二節 研究動機

電腦科技演變至今WWW為基礎之應用系統發展程度,已凌駕其他單機作業 之應用系統之上。所以,設計者面對未來的轉變,必須研究如何以最佳使用效率 為前題設計WWW應用系統以達最佳使用效率。國內、外相關於Web化應用系統 的研究早不勝枚舉,然而,Web化應用系統於資料架構、環境架構、人機介面、

系統技術、使用策略、應用效果等各個層面無論在深度或是廣度都有許多的特色 功能尚待研發,許多的問題尚待解決。開發Web化應用系統是容易的,但是,

Web化應用系統為因應廣大的操作者使用,若是使用者介面設計不良將會嚴重影 響使用者使用之意願,甚至由於功能的設計方式過於複雜和而導致使用上之障 礙。所以Web化應用系統的成敗重要關鍵就是在於它的操作介面設計是否適當及 友善。因此Web化的應用系統操作介面設計是非常重要的。然而,從介面的角度 來看,要達成人性因素與系統的適當整合,必須在系統發展上顧慮到以Web應用 系統使用者為中心的介面『使用性』問題,這樣系統才能真正的簡學易用,也才 能被大家真正接受使用。

現今的介面研究領域雖然有其它共通相關法則得以引用,但多半缺乏組織與 整理,散佈四處,無法成為具體的設計原則,以致於設計者無法掌握問題的根源

(14)

來解決問題;此外在有關網頁的相關研究上,常看到的是提昇網路傳輸率與更新 軟體的科技層面上,較少有在協助設計者與使用者間作溝通橋樑的介面研究。這 是現階段研究較為不足的地方,也就是本論文研究之重點。

目前Web化應用系統介面設計大部份沿用一般Web設計的一些原則與指 標,相較於傳統應用系統之特性不同如下:

1. 一般Web系統:設計上將使用者設定為非經常操作者,所以使用者介面 設計上之重點在於流程之導引、避免複雜之作業、防呆功能等,而以一 步一步完成交易[王俊人,1995]。

2. 傳統應用系統:設計上將使用者設定為經常操作者,所以使用者介面設

計之重點在於版面之配置、方便快速等,而迅速完成交易[王俊人,1995]。

針對以上兩種系統特性之不同,若是需要開發一套複雜運算及龐大資訊之系 統於網頁上讓非經常操作者使用,但又必須具備快速方便之功能,系統分析師如 何在系統上線前將使用者介面調整為非常人性化,對於系統分析師來說是非常重 大的挑戰。

一般單機之應用系統開發導入之成效較Web化多人操作之應用系統開發導 入來的容易,一般從事電腦開發之電腦公司於接開發軟體之專案時,希望能以少 人操作之單機應用系統開發為主,因為越少人使用及操作越能夠避免從人的使用 而衍生的問題,進而影響成本及獲利。但隨著電腦科技的進步與網際網路的蓬勃 發展,Web化應用系統已經是軟體開發的必然趨勢,系統的使用者都希望能夠讓

(15)

資料來源經由其他管道進入系統,系統的使用者只要於管理系統作彙整即可簡單 完成作業,減少資料輸入的時間。

對於多人使用之系統,最重要的是功能性簡單及親和的使用者介面,然而要 達到這個目的,其考量的變數很多,必須視各系統之屬性而設計。

會計網路請購系統是一個典型的Web化應用系統,其最主要的功能是將會 計系統中最重要的預算控制部分移到網路上,讓系所助理及計畫主持人經由網頁 進行經費的報銷及各種經費申請單據之列印,並提供經費管理人及計畫主持人自 行管理經費之功能,可以說是個人化的小型會計系統。

對於會計網路請購系統之使用者介面設計考量,必須符合會計網路請購人之 屬性,會計網路服務系統使用者特性區分如表一所示。

(16)

表一:會計網路服務系統使用者特性區分 序 使用者特性 使用者類型 介面設計之考量

1. 很少使用者 計畫主持人 不常使用故對系統不熟 悉,應以循序漸進之方 式,以步驟引導的方式設 計。

2. 一般使用者 行 政 單 位 人 員 、 研 究 生、工讀生。

較少使用故對系統雖有 一定的了解但又不是非 常熟悉,故須以適當的引 導方式設計。

3. 較常使用者 系所助理、計畫助理。 因為較常使用故對系統 非常的了解,故須以快速 完成為設計之方向。

基於以上之區分,會計網路請購系統要符合不同性質之使用者使用,必須於 使用者介面上之親和力滿足各種類型使用者,就像系統有智慧一樣。

本研究之主要動機為以使用者分群及操作介面關聯之方式提供程式設計師 另一種介面流程簡化的新思維,並以會計網路請購系統為例開發並實驗其成效,

以模組之方式開發能夠快速讓其他Web應用系統導入。

第三節 研究目的

本研究的目的是建立一套以使用者分群及操作介面關聯之獨立於Web應用 系統之外的一個分析系統,並以模組之方式開發,以便於其他Web應用系統之引 用導入。

(17)

本研究在技術層面上,運用類神經網路技術之自適應共振理論網路及資料資 料探勘技術之 Apriori 演算法,將 Web 應用系統之使用者依其使用者權限屬性作 分群,再將各分群之操作介面流程紀錄作介面關聯探勘,並將各流程可簡化之部 分挑出,以簡化操作之步驟。在研究中將實際以會計網路請購系統作為個案實 驗,用以驗證本研究所提出之技術與研究架構,是否真可有效建構出親和性使用 者操作介面為觀點之 Web 應用系統。本研究之研究目的與內容如列示如下:

一、將使用者介面以使用者權限屬性分群為導入之基礎,以類神經網路之自適應 共振理論網路技術分群,以提供程式設計師新的個人化介面設計理念。

二、將各分群之習慣之操作介面作介面關聯探勘,以資料探勘技術之 Apriori 演 算法為探勘方法,以提供程式設計師於使用者介面設計時之操作介面關聯依 據。

三、以獨立於應用系統外之分析系統,並以模組之方式開發以期能讓各種 Web 應用系統導入使用。

四、以實際開發系統及導入證實例驗證系統可行性及效能。

五、分析系統不足之處及未來發展。

(18)

第四節 研究流程架構

圖一:研究流程架構

第五節 論文概述

本論文計分五章來撰寫,各章內容如下

第一章 緒論

說明本研究之背景、動機和目的,並描述本研究之流程架構。

第二章 相關理論和文獻探討

1.研究動機、範圍與目的。

2.相關理論和文獻探討。

3.自適應共振理論與 Apriori 演算法 於網路請購系統最佳化流程模組上

之應用規劃。

4.將最佳化流程模組導入網路請購系 統。

5.蒐集回饋之資料分析此方法改進與 簡化使用者操作程序上之成效。

6.結論與建議。

(19)

介紹相關之操作者介面理論,整理中外對於操作者介面之相關研究和 文獻,並整理本研究所用到之相關方法,包括各式類神經網路和其改良方法。

第三章 研究架構與方法

介紹本論文之研究架構和方法,並對架構之每一部分詳細說明與解釋。

第四章 實驗設計與實例應用

對於本研究之系統進行系統分析與開發,實際開發應用系統及分析系 統,導入本研究所提之方法,並蒐集分析資料以驗證其改進成效。

第五章 結論與未來建議

對本研究做一總結和未來建議,以及未來可研究之方向等。

(20)

第二章、文獻探討

第一節 人機介面

人機介面設計為分析和設計使用者與電腦資訊系統之間溝通介面的技術,在 人因工程中非常重要,因為人機介面設計的好壞直接影響電腦資訊系統使用性的 優劣[李青蓉、魏丕信、施郁芬、邱昭彰,1995]。值得一提的是人機介面研究會 隨著工具以及科技的進步而有所不同;[李青蓉、魏丕信、施郁芬、邱昭彰,1995]

如近幾年所盛行的網路多媒體,即為人機介面開拓了另一方面的新氣象,因此必 須因應新工具的產生而重新探討使用者介面的變革與新的訴求。

(一)『人機介面』的定義與範圍

近代最重要的發明就是電腦,它影響了現今人類生活的許多層面。而人類與 電腦的『人機介面』之所以特別重要,在於人類與電腦之間,可以藉由人機介面 立 即 互 動 交 換 訊 息,如 同 人 與 電 腦 在 交 談 一 般。人 與 電 腦 的 互 動( Human

Computer Interactive ,HCI),其實是一種雙向的交流,由人類下指令給電腦,

而電腦則回應許多不同形式的訊息給人類,如此反覆溝通,如果互動順暢,人類 才可以有效便利的使用電腦來做各種事情,以達成工作目標。由此看來,人機介 面的重要性直接攸關人類是否能正常有效的使用電腦來工作[賴榮裕,1983]。

從『人機介面』所牽涉到的學科領域來看,其涵蓋的相關學科領域很廣,包 括電腦科學、認知心理學、人體工學及人因工程、工程學、設計學、人類學、社

(21)

會 學、哲 學、教 育、藝 術 及 人 工 智 慧 等 [賴榮裕,1983]。其中又以電腦科 學(Computer science)、認知心理學(Cognitive Psychology)、人體工學

(Ergonomics)及人因工程(Human factors)為主。

一般而言,『人機介面』所涵蓋的範圍包括資訊輸入的裝置、資訊輸入的過 程、資訊輸入的方法、系統反應的時間、資訊輸出的裝置、資訊輸出的過程、資 訊輸出的呈現方式等[李青蓉、魏丕信、施郁芬、邱昭彰,1995]。由於人機介面 所涵蓋的範圍不同,因此在定義上眾說紛紜。本研究將人機介面的定義整理如下 表二。

表二:人機介面定義

定義 出處

人機介面是關於設計安全、有效率、

簡易、能令人愉快使用,並且功能完 善的系統。

[Preece, 1998]

人機介面是指使用者可看到的軟體及 可透過它與電腦互動的部份。

[Weinschenk,et al. 1997]

支援人與電腦雙方的通訊 [Newman,et al. 1995]

人機介面是使用者與電腦機器之間資 訊交互往來的一個介面通路與環境。

唯有透過這個介面產生人機之間的溝 通,使用者才能真正有效地與電腦產 生互動,進而使用電腦完成工作。

[李青蓉等,1988]

(22)

範圍包括資訊的輸入裝置、資訊輸出 的展示裝置;文件手冊等輔助材料、

資訊處理的方式、電腦螢幕上資訊呈 現的內容與型態、人機互動的方式、

系統反應的時間、色彩、文字、圖像 符號和影像的顯示及語音等等。

綜合這些定義與範圍,『人機介面』可說是使用者與電腦溝通的管道,唯有 這個管道通暢無阻,使用者運用電腦才能發揮最佳的工作績效。

(二)『人機介面』之設計及主張

設計者在設計介面時,必需要依不同的需求加以考量,提供適當的設計,才 能夠滿足不同使用者的需求。然而,許多軟體開發人員卻認為『人機介面』只是 軟體工程的一部份,軟體的開發往往以功能的研發為主,常常忽略『使用性』的 訴求,以致許多軟體因為難學難用而被大家所捨棄。因此唯有以使用者為中心的 人機介面設計方法(User-Centred Design )與軟體功能開發結合,才能設計出適 當良好的人機介面,進而發揮軟體的功效[洪瑞隆,1993]。在人機介面的設計歷 程上,可以用圖二來表示:

(23)

圖二:人機介面設計歷程

[出處:李青蓉、魏丕信、施郁芬、邱昭彰,1995]

(三)使用性之指標與品質模式

在國際標準組織(International Organization for Standard)的定義下,於產 品導向方面,ISO最近訂定軟體工程標準ISO TC169/sc4/wg5(Erognomics of

Human System Interaction)中ISO 9241是屬於『使用性』方面的標準,如表三。

由於本研究探討的為電腦介面之使用性。

先前認知與經驗等

使用者

人機介面 設計者

(24)

表三:ISO 9241 使用性標準 次序 標題

11 使用性設計原則 12 資訊呈現

13 使用者導引 14 功能表對話方式 15 命令式對話方式 16 直接操作對話 17 格式導向對話

(出處:Dzida,1995http://www.lboro.ac.uk/eusc/Usability Standards.htm)

第一項和第二項為開發導向標準,另外第三到第九項為硬體方面的設計標 準,軟體開發僅就第10項至第17項標準說明。

1. 第10項『對話原則』:這部份所指的是人與資訊系統之間的對話方式。

必須設計與工作性質合適的對話方式、容易學習的對話方式、個人化的對話 方式、符合使用者期望的對話方式、可以被使用者掌控的對話方式和容錯的 對話方式。

2. 第11項『使用性設計原則』:使用性設計原則表示使用者可以有效率、

有效能且滿意的完成自己的工作的設計原則。

3. 第12項『資訊呈現』:螢幕資訊的呈現方式,包含視窗的配置、圖形/符

(25)

號的使用等讓使用者覺得與系統能夠透明無礙的溝通並具有親和性及美感。

4. 第13項『使用者導引』:導引使用者避免出錯,可以在介面上設計所見 即所得、適當的回饋、目前狀態資訊、錯誤管理以及線上輔助。

5. 第14項『功能表對話方式』:此部分包括選單、瀏覽、選擇三個部份,

利用功能表對話方式,可以讓使用者減少記憶的負擔。

6. 第15項『命令式對話方式』:系統最初設計的下指令方式,使用者必須 熟知指令才能有效控制系統,不適合初學者。

7. 第16項『直接操作對話』:詳見前一節,優點是簡學易用。

8. 第17項『格式導向對話』:通常用於會計方面的試算表類,利用表格呈 現方式與使用者對話。

『使用性組成概念模式』圖三。

圖三:使用性組成概念模式

其中工作需求、使用者特性、使用環境屬於『使用背景』;符合發展良好系

(26)

統中必要有的要素: 使用者、活動、環境[張吉元,1985]。工作結果意指

ISO9241-11的『效能』,工作效率則意指ISO9241-11『效率』,使用者輸出則可 以間接知道『使用者滿意度』。圖中的意思是主張先分析使用需求與相關背景,

因為這些分析結果可以提供相關於『使用性』的資訊,然後再由這些資訊佐以產 品特性,考量人機互動方式去設計系統,以達到系統之效率、效能及使用者滿意 度的最佳要求。

第二節 資料探勘(Data Mining)及關聯式法則演算法

(一)資料探勘的定義及目的

資料探勘(Data Mining)是一種從資料庫、資料倉儲或是大量的資訊儲存 媒 體 中 萃 取 出 有 意 義 的 的 相 關 樣 式 ( R e l a t i o n a l P a t t e r n ) 、 關 聯

(Associations)、改變(Changes)等的技術。McFadden 等則認為資料探勘具 有解釋性(Explanatory)、驗證性(Confirmatory) 及探索性(Exploratory)等 特性,此三種特性的敘述如下[黃智育,2002]:

1. 解釋性(Explanatory):用來解釋一些可觀察到的事件或狀況。例如:

為何蕃茄汁近半年銷售量成長五成以上?

2. 驗證性(Confirmatory):用來驗證提出的假說。例如:通常已婚的人會 比未婚的人更喜歡購買意外險。

3. 探索性(Exploratory):用來分析資料以找出新的或從未發現的關係。

例如:什麼樣的消費模式通常隱含著信用卡的詐騙行為?

(27)

另外,則說明了資料探勘的三個目的:

1. 從龐大儲存的資料中處理資訊。

2. 發展更好的方法以處理資料和支援未來的決策分析,尤其是不明確,需 要複雜計算和重要特定領域知識等情況下的資料蒐集。

3. 在不適合以人工方式尋找資料的情況下,建立資料搜尋模式:例如在電 力供應系統的問題中,通常資料量是非常巨大的,即使是該領域的專家,亦 不容易建立模型和掌控,因此,如何自動從這種資料來形成高階具有意義的 結構,便非常的重要。

(二)資料探勘的步驟

一般資料探勘的處理過程中包括如下的步驟:[蘇育霆,2001]

步驟1 : 資料選取﹙Data Selection﹚:

選擇資料蒐集目標及資料挖掘程序,確認被挖掘的資料,然後選擇適當的輸 入屬性和輸出資訊,以呈現工作結果。

步驟2 : 資料轉換﹙Data Transformation﹚:

以所需的方式來組織資料,轉換資料成另一種型態(如從文字符轉成數值),

且定義新的屬性,減少資料維度,移去雜訊﹙Noise﹚、特異數值﹙Outliers﹚

等資料,決定處理遺失資料的策略並進行資料一般化。

步驟3 : 資料探勘(Data Mining):

資料經過轉換後,操作者可以藉著事先預定好的步驟,並藉由一種或多種的

(28)

技術,來萃取出資料中隱含的重要訊息及模式。

步驟4 : 結果解釋和確認﹙Result Interpretation and Validation﹚:

資料經由萃取,並經由統計或其他技術來確認其結果,且所萃取資訊描述範 圍可以擴展到資料庫中未曾察覺或包含的資料。

步驟5 : 知識的合併﹙Incorporation of the Discovered Knowledge﹚:

包含將結果呈現給決策者,用以查核及解決先前認定和挖掘得 來知識的潛在分歧,並嘗試實際應用挖掘所得的新模式。

(三)關聯式法則(Association Rule)

挖掘關聯式法則為資料探勘中相當重要的一個議題,一般交易資料庫中都儲 存著數量龐大的交易資料,而每一筆交易記錄也都記載著相關的項目(Item),包 含操作者相關資料及交易的項目或時間等;而資料探勘的技術便可從這些大量的 資料中,挖掘出各個項目之間的關聯法則。例如: 80%的學生選修“資料庫管理”

同時也會選修“資料探勘”。資料庫中紀錄通常以<TID , Item>的型式儲存(TID 為每一筆紀錄的唯一的識別碼,Item 為紀錄中的項目)。而關聯式法則定義的形 式如下[Chung,Y.,and Kusiak,A.,1991]:

X=>Y [Support,Confidence],其中X和Y分別代表某些項目的集合,

且X⊂ I,Y ⊂ I (I 表示所有的元素或項目),及X ∩ Y=∅。 法則包含兩個評量指標:

1. 支持度(Support Level) s%:代表資料項目集合在資料庫中所佔有的比

(29)

例,即Probability(X∪Y),即為s%筆數的資料包含X∪ Y。

2. 信賴度(Confidence Level) c%:代表被實驗的因子在主要因子中所佔有 的條件比例程度,即Probability(Y|X),即為包含X 的比數中有c%的資料 包含X 也包含Y。

挖掘關聯式法則的程序通常分成二步驟:

步驟1 : 找出大項目集合(Large Itemsets):即支持度大於所設定的最低支持度

(Minimum Support Level)的候選項目集合(Candidate Itemsets)。

步驟2 : 產生關聯式法則:假設找出的大項目集合為{X,Y},其中可能產生 的法則是X=>Y,依此我們可以計算當X發生時,也發生Y的信賴度,若是到 達設定的最低支持度(Minimum Confidence Level),則此法則就成立。

Apriori演算法是Agrawal和Srikant首先於1994提出Apriori演算法,引 起相當廣泛的討論,之後許多演算法都是根據此方法加以改進,因此Apriori 可謂產生大項目集合最具代表性的方法之一。Apriori演算法最主要的概念,

就是從候選項目集合中藉著掃描一次資料庫,找出大於或等於操作者所定義 之最小支持度之集合,稱之為大項目集合;再以大項目集合(Large k Itemsets) 結合成候選項目集合(Candidate k+1 Itemsets),如此重複的運算直到無法找 到大項目集合為止。

第三節 類神經網路及自適應共振理論網路

(一)類神經網路簡介

(30)

類神經網路(Neural Network)是由生物學得到的靈感所開創的一種模仿生 物神經網路的資訊處理系統又稱為人工神經網路。由於人類腦部是由數十億的腦 神經細胞以複雜的方式彼此相連而成的,且人類比電腦更有處理自然資訊的計算 架構,電腦缺乏自然界高等動物賴以生存與適應環境的要素,因此科學家希望發 展出一套結合人腦與電腦的系統,類神經網路的發展正是以電腦來模擬人腦的產 物,並能解決許多之問題,例如:分類、預測、辨識樣本、過濾雜訊等。更精確 的定義為:類神經網路是一種計算系統,包括軟體與硬體,它使用大量簡單的相 連人工神經元來模仿生物神經網路的能力。人工神經元是生物神經元的簡單模擬 模式,它從外界環境或者其他人工神經元取得資訊,透過大量簡單的運算,最後 輸出其結果到外界環境或者其他人工神經元[葉怡成,2001]。

(二)類神經網路基本架構

一個類神經網路包含許多相互連結的人工神經元(Neuron)所組成,人工神經 元又稱處理單元(Processing Element),每一層的神經元形成一個層次,彼此之間 的訊號傳遞皆以權重(Weight)相互連結類神經網路總體運作模式可分為兩種:

學習過程和回想過程兩種。在學習過程中類神經網路的每一個輸入資料以向量方 式在類神經網路中稱為訓練向量,學習的過程乃是要從這些輸入向量及應該獲得 的輸出值中,調整網路鏈結權重值,網路之所以能夠學習,便是使用這些輸入向 量及調整權重值訓練類神經網路,一旦達到穩定狀態,便是網路學習完畢。而不 同的網路模式其學習過程亦不同,在類神經網路的學習過程中,基本上可分成以

(31)

下三種學習方式[葉怡成,2001]:

1. 監督式學習(Supervised Learning):

監督式學習是指從問題領域中取得訓練範例,此訓練範例(Pattern)中包含輸 入向量與目標輸出向量,從中學習輸入向量與目標輸出向量內在對應規 則,並不斷的修改網路加權值,直到收斂為止,此類型的網路學習因有標準 答案,因此能判斷輸出是正確或不正確。監督式學習的網路較具代表性的理 論 主 要 有 倒 傳 遞 網 路 (Back Propagation Network)、 機 率 神 經 網 路 (Probabilistic Neural Network) 與反傳遞網路(CounterPropagation)。

2. 非監督式學習(Unsupervised Learning):

非監督式學習是指從問題領域中取得訓練範例,此訓練範例僅包含輸入向量 但無目標輸出向量,透過已知的輸入資料從中學習訓練範例的內在集群規 則,藉以推論新的輸入與哪些訓練範例屬於同一集群的預測或聚類。非監督 式 學 習 的 網 路 較 具 代 表 性 的 理 論 主 要 有 自 組 織 映 射 圖 (Self-Organizing

Map,SOM) 與自適應共振理論(Adaptive Resonance Theory,ART),其中自 適應共振理論網路具有快速學習之特性,適合線上即時分群之應用,因此本 研究以自適應共振理論作為線上網路請購操作者分群之方法。

3. 聯想式學習(Associate Learning):

聯想式學習是指從問題領域中取得只有狀態變數值的訓練範例,並從中學習 範例的內在記憶規則,以應用在只有不完整的狀態變數值,而須推論其完整

(32)

狀態變數值的新應用案例。聯想式學習的網路較具代表性的理論主要有:霍 普 非 爾 網 路 ( Hopfield Neural Network, HNN) 與 雙 向 聯 想 記 憶 網 路 (Bi-Directional Associative Memory,BAM)。

(三)自適應共振理論網路(Adaptive Resonance Theory,ART)

人類的大腦會記憶著一些已知的事物,當記憶新的事物時,以前所記憶的事 物又須保留,則可能發生新舊事物矛盾的現象。因此一個好的記憶系統必須具有 兩個特性[葉怡成,2001]:

1. 穩定性(Stability):當新的事物輸入時,舊的應適當的保留。

2. 可塑性(Plasticity):當新的事物與舊的事物產生衝突矛盾時,能快速適 應學習。

ART 自適應共振理論網路(以下簡稱ART 網路)是一種無監督式學習網路 模式,其模式建立的研究早在1960年代已經開始。美國波士頓大學神經網路研 究中心主任Grossberg 多年研究人類認知行為後,於1976年提出ART 網路以實 現具有上述特色的記憶系統,而其提出的模式後來由Carprnter加以發揚光大,

ART 網路的特點有下列三項:

1. 具穩定性與可塑性:

ART網路具有穩定性,當不相干的資訊輸入系統時,系統中會比照現有的資 訊,若已有類似的資訊則不會因此而有所改變,另一方面ART網路具有可塑 性,當輸入資訊與現有資訊相似或密切相關時,系統可以迅速的進行學習並

(33)

納入記憶,具有線上學習能力,即能邊作邊學習。

2. 屬非監督式學習網路:

非監督式學習是直接從問題中取得訓練範例,並從中學習內在群組分析規 則,以應用於新的案例,因此ART的學習方式,並不需要外在的目標函數來 幫助學習,網路本身就有能力對輸入的資訊進行學習與取捨。

3. 具快速學習能力:

一般監督式學習網路,因易受輸入、輸出及隱藏層數目多寡而影響學習速率 間的學習能力,也就是說監督式學習網路,必須提供足夠的訓練範例給網路 進行學習,由學習中不斷調整輸入、輸出以及隱藏層間的權重值,以應用於 未來輸入向量分析之用。而ART的學習則是藉由外來輸入(通常以0,1的 二元向量表示)出現後立即學習並做聚類分析,這種學習方式除了可以直接 在線上學習外,更可以達到快速學習的目的。

由於穩定性與可塑性其本質在ART網路中屬於相斥的,為求資料之穩定性,

且不因可塑性造成大幅度變動,所以ART網路採用警戒值測試(Vigilance Test)進行仲裁,使可塑性與穩定性達成協調。其運作方式如下:

1. 穩定性主導修正舊有資訊並容納新資訊:

如果新的資訊特性與記憶中「某一個」舊的資訊的特性夠相似(表示通過警 戒值),則只修改系統中舊資訊的部分記憶,使其能同時滿足新舊資訊的特 性,如此可滿足穩定性的要求。

(34)

2. 可塑性產生新的記憶資訊:

如果新的資訊與記憶中「所有的」舊資訊的特性均不夠相似(表示不通過警 戒值),則系統快速學習此新資訊並建立全新的記憶,如此可滿足可塑性的 要求。

(四)自適應共振理論網路架構[葉怡成,2001]

以下將對ART 網路基本架構詳加敘述,ART的網路架構如圖四所示,其架 構可歸納為下列幾部分:

1. 輸入層:

用以表現網路的輸入變數,即訓練範例中的輸入向量或稱特徵向量,其處理 節點數目依屬性而定,但輸入變數必須是轉化為{0,1}的二元值。

2. 輸出層:

用以表現ART網路之分群結果,每一個輸出處理節點分別代表系統能認知的 群組,每一個群組中有一個維度與輸入向量一致的範本向量,作為該群組事 物的資訊代表,其輸出處理節點數在學習過程之初只有一組聚類,隨著輸入 全新事物而學習的進展會逐漸增加,當所有訓練範例輸入後,最後會穩定在 一定的數目。

3. 網路鏈結:

ART網路的每一個輸入節點與輸出節點間均有二條網路鏈結,每個鏈結皆有 權重值,一條是由輸入節點往輸出節點的鏈結,其權重值b W 的值為[0,1]

(35)

連續值,用來計算範例的輸入向量對一輸出層節點的匹配值之用,匹配值的 高輸出節點將會優先被用來作「警戒值測試」,另一條則是由輸出處理節點 往輸入處理節點的逆向鏈結,其權重值t W 的值為[0,1],用來計算輸出處 理節點對輸入向量的相似值,並判定一個輸出節點是否通過「警戒值測 試」。當警戒值設定愈高,則輸出處理單元愈不易通過「警戒值測試」,而 需產生新的輸出處理單元,故輸出處理單元愈多,網路模式的「可塑性」較 高;相反的,如果警戒值愈低,輸出處理單元較容易通過「警戒值測試」,

而不需產生新的輸出處理單元,故輸出處理單元較少,網路模式的「穩定性」

較高,因此警戒值高低將控制ART網路輸出單元的數目。

如前面所提ART網路具備穩定性與可塑性,但兩者本質相斥,為求資料的 穩定性,不因可塑性造成大幅度變動,ART網路採用警戒值達成兩者的平衡。由 於本研究在進行流程導入前需先將網路請購操作者依其網路請購操作者屬性資 料分群,而ART網路具有穩定性與可塑性並且可以快速學習快,因此採用ART 網路來進行網路請購操作者之分群。圖四是ART網路架構圖。

(36)

圖四

圖四:ART 網路架構圖

輸入層

X

in 輸出層

Y

ou

Y1 Y2 Yq

X1 X2 Xq

(37)

第三章 研究架構與方法

第一節 Web 應用系統介面最佳化概念

(一)Web 應用系統介面最佳化架構

基於上述研究目的與文獻回顧探討,本研究的目的主要以簡化 Web 應用系 統操作者操作為目的,提供介面最佳化分析系統。此介面最佳化分析系統將 Web 應用系統操作者之操作紀錄作分析並儲存於介面最佳化知識庫,以作為流程導 入之依據。待操作者進入 Web 應用系統時,給予系統操作之流程導入程序,

以簡化操作者操作程序。其 Web 應用系統之介面最佳化機制架構如圖五。

圖五:Web 應用系統之介面最佳化機制架構

(二)介面最佳化分析系統架構

介面最佳化分析系統之架構主要分為「介面最佳化之類神經網路分群模組」

及「介面最佳化之資料探勘模組」,其兩個模組共同運作程序為:

Web 應 用系統

Web 應用系 統流程最 佳化分析 系統

系統操作者

操作程序紀錄

最佳化流程導入

流程最佳 化知識庫

流程最佳化分析系統

(38)

1. 紀錄 Web 應用系統操作者之操作步驟。

2. 結合操作者權限屬性之資訊作分析。

3. 利用類神經網路之自適應共振理論網路作使用者權限之分群。

4. 結合資料探勘之 Apriori 演算法探勘出各程序間之關聯法則並紀錄於介 面最佳化知識庫中。

5. 待 Web 應用系統操作者登入系統時作為介面最佳化導入之依據。

其兩個模組共同運作架構如圖六。

圖六:介面最佳化分析系統架構圖 介面最佳化之類神經網路分群模組

介面最佳化之類神經網路分群模組之運作模式是將本研究預先彙 集的網路請購操作者操作權限資料進行資料轉換,進行 Web 應用系統 操 作 者 相 似 分 群 。 操 作 者 分 群 模 組 是 採 用 自 適 應 共 振 理 論 網 路

操作流程資料庫

流程最佳化知 識庫 流程最佳化之資料探勘模組

(以 Apriori 演算法探勘其關 聯法則)

流程最佳化之類神經網路分群 模組(使用者權限分群)

操作程序紀錄

最佳化流程導入

(39)

(ART)建構而成,以下將介紹本研究如何應用自適應共振理論網路

(ART)來進行操作者社群聚類分群。

第二節 操作者分群網路模組概念

操作者分群採自適應共振理論網路(ART)來進行操作者社群聚類分群動 作,此網路的架構如圖七,可分為三部份詳述如下:

圖七:ART 操作者分群架構圖

1. 輸入層(Xin):

由於自適應共振理論網路(ART)輸入處理節點只能為{0,1}的二元值,因 此先將蒐集到的操作者個人權限資料制定出會影響使用Web應用系統的屬 性,並將這些屬性的資料經由正規化轉換為{0,1}二元值的型態,最後轉化 為輸入向量,用[X1

X

2

X

in]來表示之,其中Xin∈{0,1}。

2. 輸出層(You):

輸入層

X

in 輸出層

Y

ou

Y1 Y2 Yq

X1 X2 操作者屬性輸入 Xq

操作者社群聚類結果

(40)

用以表現操作者輸出之分群結果,其處理單元數目在操作過程最初只會有一 個聚類,隨著自適應共振理論網路(ART)操作的進展會逐漸增加群聚節點。

3. 網路鏈結(Lb、Lt):

網路的每一個輸入層單元與輸出層單元間均有二條網路鏈結,用來建構操作 者社群網路,將前述操作權限屬性向量[X1

X

2

.X

in]輸入於自適應共振理 論網路(ART),並藉由不同的警戒值(θ )高低,觀察聚類的結果,選出 較佳的聚類社群。此網路鏈結包括:

(1) 由下而上的加權值Lb:用來計算範例的輸入向量對一輸出層單元的

「匹配值」。

(2) 上而下的加權值Lt:用來判定一個輸出單元是否通過「警戒值測 試」。

操作者分群是以自適應共振理論網路(ART)的演算法為主軸,表四為 操作者分群所採用的所有變數,而其演算法之步驟詳述如下。

(41)

表四、操作者分群網路變數定義表

變數 定義

in 輸入向量節點個數。

ou 操作者聚類群組數,1≦ou≦m。

In 操作者基本資料屬性。

θ 警戒值0.0≦θ ≦1.0。

Lb 正向鍊結權重,Lb∈{0,1}。

Lt 逆向鏈結權重,L∈{0,1}。

X[i] 輸入向量,X[i] ∈{0,1},且1≦i≦in Y[j] 輸出向量,X[j] ∈{0,1},且1≦j≦ou

Net[j] 輸入向量X與第j個輸出節點之匹配值,1≦j≦in j* 最大匹配值之輸出節點,1≦j≦ou

V*j 輸入向量X與輸出節點j相似值,1≦j≦ou Inum 已使用之輸出節點,初始值Inum=0。

步驟1 : 設定n個操作者基本資料屬性X1,X2,… ,Xn,並根據操作屬 性設計相對應的處理單元In=[X1

X

2

X

in],其中in∈[1,2,… ,

m],X

in∈{0,1}。

步驟2 : 令網路產生ou個輸出分類結果,但一開始的輸出單元僅只有1

(42)

個,所以初始值ou=1。

步驟3 : 設定加權矩陣L 為初始值。

Lt[i][j]=1,Lb[i][j]= 1

1 in+ ,其中為輸入之處理單元數,1≦i≦in。

步驟4 : 輸入一個訓練範例的輸入向量X[i]。

步驟5 : 計算其各類之匹配值net[j] 。 net[j]=

1 in

i= Lb[i][j]˙X[i]。

步驟6 : 找出匹配值最大之輸出層處理單元net[j*] 。

net[j*]=maxj net[j]。

步驟7 : 計算相似值Vj*

令║x║=

in

i

X[i],

令║

L

tj*˙X║=

in

i

X[i][j]˙X[i],

V

*j= * t

j

X

X

L

步驟8 : 測試警戒值θ 。

如果

V

*j<θ (警戒值),表示不夠相似,則進行步驟9,否則進行 步驟10,表示夠相似,只須修正加權值即可。

步驟9 : 測試是否還有其他之輸出層單元與之類似。

如果Inum< in,則嘗試下一個具最大匹配值最大之輸出層處理單

(43)

元,設定Inum = Inum + 1, net[

j

*]=0 。

否則表示已無輸出層處理單元可供測試相似值,

(1)產生輸出新類別:

設定ou = ou + 1,設定新加權值:

Lt[i][ou]=X[i],

Lb[i][ou]=

1

[ ] 0.5 [ ]

in

i

X i X i

=

+

(2)設定輸出層單元輸出值:

如果j=j*,則Y[j]=1,否則Y[j]=0。

(3)重複回到步驟4 (輸入新向量X)。

步驟10 : 修正加權值。

(1)Lt[i][j*]=Lt[j*]˙X[i],

Lb[i][j*]=

*

* 1

[ ][ ] [ ] 0.5 [ ][ ]

t

in t

i

i X i

i

L j

L j

=

+

(2)設定輸出層單元輸出值:

如果j=

j

*,則 Y[j]=1,否則Y[j]=0。

(3) 若在此一學習循環內未產生新類別,且正好完成一學習循環,則 輸出分群結果並終止執行;否則回到步驟4 輸入新向量X。

由於ART 網路具有快速學習及快速聚類的特性,因此當ART網路預先 依Web應用系統操作者權限屬性聚類並建構好Web應用系統操作者分

(44)

群網路時,則可對任何一位線上Web應用系統操作者依Web應用系統操 作者屬性即時的指定其所屬類別。

第三節 介面最佳化之資料探勘模組概念

如何從Web應用系統作者分群中找出適合該操作者之介面最佳化是本研究 的另外一項研究議題,資料探勘中的關聯式法則在本研究是用來尋找網路請購操 作者分群與流程之間的關係,及網路請購操作者在進入系統操作的過程中調整各 步驟的關聯性,因此將這兩個技術合併使用,可以簡單的掌握Web應用系統操作 者的操作特性,並將適當的介面最佳化導入給Web應用系統操作者。

介面最佳化之資料探勘模組是利用 Apriori 演算法探勘出操作者操作介面之 關聯式法則,而後以法則的型態儲存於介面最佳化知識庫中。當有 Web 應用系 統操作者欲進入系統時,Web 應用系統操作者類神經網路聚類分群模組便會自 動依所載入的操作者權限資料選擇適當的操作者分群,並從介面最佳化知識庫中 尋找出該分群較為常用之流程模組導入給該 Web 應用系統操作者使用,以達到 操作介面最佳化目的。

介面最佳化之資料探勘模組將操作介面紀錄的資料整理與蒐集,轉變成陣列 字串之方式存放於介面最佳化知識庫中來進行資訊的獲取。因此能快速且有效的 即時從資料庫中取得導入給系統操作者流程陣列,資料探勘模組其進行步驟說明 如下圖八。

步驟1:訂定Web應用系統各流程基本操作模式。

(45)

步驟2:整合與查核流程資料(Integration and Checking)。

步驟3:去除錯誤或不一致的資料(Data Cleaning)。

步驟4:計算各流程之使用率(支持度)。

步驟5:探勘各流程之關聯性法則。

步驟6:解釋與使用資料(Interpretation and Use)

圖八:資料探勘模組其進行步驟

其關聯式法則的產生可以藉由兩個參數來決定:支持度(Support)及信賴度

(Confidence);支持度定義物項在資料庫中所出現的比例,而信賴度定義此關 聯式法則可信的程度。一般而言,關聯式法則的支持度及信賴度皆必須分別大於

1.訂定 Web 應用系統各流程基本操作模式

2.整合與查核流程資料

(Integration and Checking)

3.去除錯誤或不一致的資料

(Data Cleaning)

4.計算各流程之使用率(支持度)

(Support)

5.探勘各流程之關聯性法則

(Association rule)

6.解釋與使用資料

(Interpretation and Use)

(46)

使用者訂定的最小限制,才能判定其為有意義的關聯式法則。

找出Web系統操作介面關聯法則有以下二個步驟:

(1) 首先必須找出足夠大的項目集合(Large Itemsets),即此集合之 交易(Transaction)要能夠滿足其支持度(Support)大於最小支持度

(Minimum Support)的條件。

(2)再使用第一步驟所產生的Large Itemsets 來產生關聯式法則。

Apriori 演算法找出 Web系統操作介面關聯法則之處理程序如圖 八,其處理步驟說明如圖九所示。

操作者權限代碼 操作介面字串陣列

000111 ●A●C●D 001000 ●B●C●E 001100 ●A●B●C●E 001110 ●B●E

流程 支持度 {A} 2 {B} 3 {C} 3 {D} 1 {E} 3

流程 支持度 {AB} 1 {AC} 2 {AD} 1 {AE} 1 {BC} 2 {BD} 0 {BE} 3 {CD} 1 {CE} 2 {DE} 0

流程 支持度 {ABC} 0 {ABD} 0 {ABE} 1 {BCD} 0 {BDE} 0 {CDE} 0 {BCE} 1

(47)

圖九:Apriori 演算法找出Web系統操作介面關聯法則之處理程序 1.定義最小支持度及最小信賴度。

2. Apriori演算法使用了候選項目集合(Candidate Itemset)的 觀 念 , 若 候 選 項 目 集 合 的 支 持 度 大 於 或 等 於 最 小 支 持 度

(Minimum Support),則該候選項目集合為高頻項目集合

(Large Itemset)。

3. 首 先 由 資 料 庫 讀 入 所 有 的 交 易 , 得 出 候 選 1 項 目 集 合

(Candidate 1-Itemset)的支持度,再找出高頻單項目集合

(Large 1-Itemset),並利用這些高頻單項目集合的結合,產 生候選2 項目集合(Candidate 2-itemset)。

4.再掃描資料庫,得出候選2項目集合的支持度,以後再找出 高頻2項目集合,並利用這些高頻2項目集合的結合,產生候 選3項目集合。

5.重覆掃描資料庫,與最小支持度比較,產生高頻項目集合,

再結合產生下一級候選項目集合,直到不再結合產生出新的候 選項目集合為止。

由上述資料探勘模組探勘出的操作介面關聯導入法則,將儲存於關聯式 法則知識庫中,這些法則型態包括:

1. 每種操作者權限中最常使用單一操作介面導入法則。

(48)

2. 每種操作者權限中最常使用兩項操作介面導入法則。

2. 每種操作者權限中最常使用三項操作介面導入法則。

3. 每種操作者權限中最常使用四項操作介面導入法則。

4. 每種操作者權限中最常使用五項操作介面導入法則。

第四節 線上(On-Line)操作介面導入模組概念

Web應用系統之介面最佳化機制導入處理程序,本研究將介面最佳化資料探 勘模組所產生的操作介面關聯性法則儲存於關聯式法則知識庫中,並將操作者相 似度聚類分群資料紀錄於介面最佳化之類神經網路分群模組中。圖十說明了線上 操作介面導入處理程序,其步驟敘述如下:

圖十:線上操作介面導入處理程序

步驟1 : 當操作者進入Web應用系統時將其個人屬性等資料載操作者分 Web 應用系統操

作者進入系統

載入操作者權限 進入流程最佳化

系統

Web 應用 系統資

料庫

流程最佳化系統 回覆最佳化流程 字串供使用者操

作系統依據

關聯式 法則知 識庫

(49)

群模組中。

步驟2 : 操作者分群模組會根據輸入的資料自動將此操作者依其輸入 的資料分類至適當的操作者社群。

步驟3 : 由給定之操作者社群至關聯式法則知識庫中找尋相對應的操 作介面導入法則,法則中將各項組合之「最常使用/操作者社群操作介 面」導入適當的操作介面給操作者。

步驟4:收集操作資訊,並將接受導入及不接受導入之狀態紀錄以作為 操作效能提昇之依據。

實例說明:

假設一個會計網路請購操作者其操作權限屬性為100100,經由ART分群機制將此 操作者分群為000000。當此操作者進入網路請購系統後最佳化介面機制將依照 該分群使用者資料探勘後之最多項目組合開始搜尋符合該分群之操作介面導 入。假設導入之介面字串為AAAA11與AAAA22時,操作簡化之介面如表五所 示。

(50)

表五、分析範例簡化流程

序號 介面字串 介面流程 簡化流程

1 AAAA11 請購 新增請購 選擇類別 編輯後存入 受款人編輯提示

將受款人編輯提 示 是

簡化而直接進入 受款人編輯。

2 AAAA22 請購 新增請購 選擇類別 編輯後存入 直接印表 否

將直接印表 否 簡化而直接進入 購案管理

(51)

第四章 實驗設計與實例應用

為了驗證所提出機制之可行性與實用性,以會計網路請購系統操作者介面最 佳化進行實例應用。實例應用共分為「會計網路請購系統建置」、「網路請購系 統介面最佳化模組建置」、「網路請購系統介面最佳化導入」四部分,詳細之應 用步驟依本論文第三章所提之方法分別敘述如下。

第一節 網路請購系統建置

(一) 網路請購系統建置系統分析

網路請購系統全名為「非營業基金會計網路請購系統」,是某軟體公司針對 全國非營業基金會計體制之單位開發的一套網路請購/預算控制系統,目前已是 完整之套裝軟體,且已經有49家國立大學正在使用,使用之人數已超過10,000 人,是一個Web化的應用系統,依照其特性系統分析之考量分述如下:

(1)Web化介面:

為了達到多人操作及分散校區仍可作業之目的,將操作之介面以Web 之技術開發。

(2)操作之介面規則化:

由於其功能項目繁多,故於介面之配置以規則化分類,以強化使用性之 指標:讓使用者容易學習和讓使用者容易使用和讓使用者減少抗拒,加 強使用動機。

(52)

(3)複雜之運算但簡單之操作:

針對複雜運算之Web化操作介面設計,將其運算置於背景中處理,以簡 化操作之步驟。

第二節 網路請購系統介面最佳化模組之建置

(一)網路請購系統介面最佳化模組之規劃

網路請購系統介面最佳化模組之組成主要為四大部分組成,分述如下:

(1)介面操作偵測及資料收集機制建置規劃。

(2)操作者類神經網路分群機制建置規劃。

(3)介面操作資料探勘機制建置規劃。

(4)最佳化介面導入機制建置規劃。

(二)介面操作偵測及資料收集機制建置規劃

針對網路請購系統介面最佳化模組之目的(簡化操作程序)為方向做分析,

分述如下:

(53)

(1)將網路請購之各功能流程以規則化之編號展開,如圖十一

圖十一:網路請購系統流程架構圖

(2)分析各程序,將流程以編號表達,以作為紀錄流程之依據,以避免不 必要之流程資訊充斥其中。

A

B

A

B

A

B

C

D

A

A

1

是 1

否 2

2

是 1

否 2

3

是 1

否 2 全部購案 1

未結購案 2

已結購案 3 未審購案 4

不分頁模式 5 印表 1

EXCEL2

印表 1

印表 1

印表 1 EXCEL2

EXCEL2

EXCEL2 條件搜尋 1

非條件搜尋 2

(54)

表六:可簡化之請購流程編號表

序號 流程編號 流程之功能 簡化流程 1 AAAA11 請購 新增請購 選擇類

別 編輯後存入 受款人 編輯提示 是

簡化受款人編輯提示 是而直接進入受款人編 輯。

2 AAAA12 請購 新增請購 選擇類 別 編輯後存入 受款人 編輯提示 否

簡化受款人編輯提示 否 而 直 接 進 入 下 一 步 驟。

3 AAAA21 請購 新增請購 選擇類 別 編輯後存入 直接印 表 是

簡化直接印表 是而直 接印表。

4 AAAA22 請購 新增請購 選擇類 別 編輯後存入 直接印 表 否

簡化直接印表 否而進 入下一步驟。

5 AAAA31 請購 新增請購 選擇類 別 編輯後存入 繼續新 增 是

簡化繼續新增 是而進 入新增請購介面。

6 AAAA32 請購 新增請購 選擇類 別 編輯後存入 繼續新 增 否

簡化繼續新增 否而進 入下一步驟。

7 AB1 請購 購案管理 全部購 案

簡化購案管理而進入全 部購案。

8 AB2 請購 購案管理 未結購 案

簡化購案管理而進入全 部購案。

(55)

9 AB3 請購 購案管理 已結購 案

簡化已結購案而進入已 結購案。

10 AB4 請購 購案管理 未審購 案

簡化未審購案而進入未 審購案。

11 AB5 請購 購案管理 不分頁 模式

簡化未審購案而進入不 分頁模式。

表七:可簡化之查詢流程編號表

序號 流程編號 流程之功能 簡化流程 1 BA1 查詢 計畫清單 印表 簡化印表而進入印表。

2 BA2 查 詢 計 畫 清 單 轉 出 EXCEL

簡化轉出EXCEL而進入 轉出EXCEL。

3 BB1 查詢 用途明細 印表 簡化印表而進入印表。

4 BB2 查 詢 用 途 明 細 轉 出 EXCEL

簡化轉出EXCEL而進入 轉出EXCEL。

5 BC1 查詢 收支明細 印表 簡化轉出EXCEL而進入 轉出EXCEL。

6 BC2 查 詢 收 支 明 細 轉 出 EXCEL

簡化轉出EXCEL而進入 轉出EXCEL。

7 BD11 查詢 請購明細 條件搜尋 列印

簡化列印而進入列印。

8 BD12 查詢 請購明細 條件搜尋 轉出EXCEL

簡化轉出EXCEL而進入 轉出EXCEL。

9 BD21 查詢 請購明細 非條件搜 簡化非條件搜尋 列印

(56)

尋 列印 而進入列印。

10 BD22 查詢 請購明細 非條件搜 尋 轉出EXCEL

簡化非條件搜尋 轉出 EXCEL 而 進 入 轉 出 EXCEL。

將Web應用程式之操作者資料收集存於資料庫。針對網路請購系統流程資訊 之收集,本系統於使用者登入帳號/密碼後系統立即紀錄該使用者之資訊,

並於作業程序中若執行到表六或表七中之項目,立即將此紀錄存入,以作為 介面最佳化資料探勘用。

操作流程資料表架構規劃如表八所示:

表八:操作流程資料表架構 使用者代碼 分群代碼 進 入 系 統 之

唯一代碼

流程編號

本實驗將以某一國立大學網路請購系統使用者操作紀錄作為實驗資料共計

7875筆。

(三)操作者類神經網路分群機制建置規劃

針對網路請購使用者之屬性不同而設定權限不同,代表負責之工作不同。

由於ART輸入處理節點只能為{0,1}的二元值,因此本研究根據所得到的操作者 個人資料依操作者的屬性篩選出其中影響操作介面的屬性,而將其屬性分類為

(1)部門請購權限(2)部門查詢權限(3)計畫請購權限(4)計畫查詢權限

(5)下屬單位查詢權限(6)全校單位查詢權限,其各權限所負責之工作分述

(57)

如下:

(1)部門請購權限:0為不可請購。1為可請購,通常為系所小助理。

(2)部門查詢權限:0為不可查詢,通常為系所小助理。1為可查詢通常為 系所大助理。

(3)計畫請購權限:0為不可請購。1為可請購,通常為計畫助理。

(4)計畫查詢權限:0為不可查詢,通常為計畫助理。1為可查詢,通常為 計畫主持人(老師)。

(5)下屬單位查詢權限:0為不可查詢。1為可查詢通常為學院助理。

(6)全校單位查詢權限:0為不可查詢。1為可查詢通常為校長秘書。

本研究選取的3項影響屬性共計6 個輸入節點,透過ART 網路進行操作者社 群聚類。ART分群資料表架構規劃如表九所示:

表九:ART分群資料表架構 使用者

代碼

部門 請購

部門 查詢

計畫 請購

計畫 查詢

下屬單 位查詢

全校單位 查詢

分群代碼

本實驗將以某一國立大學之網路請購使用者權限作為實驗資料共計615筆。

由於從資料庫擷取的資料,可能存有雜訊或格式不相容的問題,因此必須做適當 的 前 置 處 理 , 包 括 資 料 的 清 理 ( Cleaning) 、 合 併 ( Integration) 、 轉 換

(Transformation)等,將資料整理成一適合分析的次資料集(Subset)後,再放

(58)

入所選擇的演算法進行分析。

本實驗所使用之ART操作者分群模組為自行開發之APR_ART分析系統,專 為網路請購系統而設計,其程式按照ART演算法設計。

當操作者基本資料轉換完成,將615筆操作者屬性範例資料輸入ART 網 路,並輸入不同的警戒值由0.0到1.0作測試,每0.1為一個警戒值單位進行操作 者社群聚類分析,由於警戒值愈高,則產生的操作者社群愈多,反之則愈少,本 研究以警戒值為0.5所產生的操作者分群結果作為探勘「操作者社群操作介面」

關聯法則之操作者社群,以APR_ART分群之介面如圖十二。

圖十二:APR_ART分群之介面

其分群結果詳細其操作者特質如表十所示,可發現每一群中的操作者特徵屬 性相近的操作者能夠顯著的歸為同一群組。

(59)

表十:APR_ART警戒值0.5分群結果

序號 分群結果

1 000000

2 010001

3 100100

4 110100

5 111101 分析分群的結果具有合理性如表十一所示。

表十一:分群的結果合理性分析

分群代碼 相似度分群 合理性分析 000000 000000

100000 001000

000000 無任何權限。

100000 部門預算請購權限。

001000 計劃請購權限。

此三者為最小權限之操作者應為系所工 讀生或計劃主持人之研究生。

010001 010001 000011

010001 部門查詢及全校查詢權限。

000011 下屬查詢及全校查詢權限。

其兩者皆為下屬查詢之權限人員,固為 同一分群(此分群為學院以上單位之秘 書)

100100 100100 100100 部門請購權限及計劃請購權限 此分群為請購人員權限,應為系所小助

參考文獻

相關文件

最佳解裡面如果沒有greedy choice的話, 則想辦法 把最佳解裡面的一些東西和greedy choice互換. 結 果發現這個新解跟greedy choice一樣好

• 在線 (online):程式/演算法 必須對前一個詢問或操作做出

• 在線 (online):程式/演算法 必須對前一個詢問或操作做出

• 下面介紹三種使用greedy algorithm產生minimum cost spanning

有些行為是法律容許的,卻是有違道德原則的。前面〈令人費解的法例〉的工

資料探勘 ( Data Mining )

由於資料探勘 Apriori 演算法具有探勘資訊關聯性之特性,因此文具申請資 訊分析系統將所有文具申請之歷史資訊載入系統,利用

我們提出利用讀取器與讀取器間的距離為參數來優化利用分層移除讀取器之方法的最佳 化技術 Distance Based Optimization for Eliminating Redundant Readers (DBO) ,此方法完全