• 沒有找到結果。

中華大學 碩士論文

N/A
N/A
Protected

Academic year: 2022

Share "中華大學 碩士論文"

Copied!
164
0
0

加載中.... (立即查看全文)

全文

(1)

中 華 大 學 碩 士 論 文

工程顧問公司知識社群績效與滿意度 資料探勘之研究

Mining of the Performance and Satisfaction Survey Data from the Communities of Practice in an A/E

Consulting Firm

系 所 別:營建管理研究所碩士班 學號姓名:M09616015 林 詩 婷 指導教授:余 文 德 博 士

中華民國 九十八 年 八 月

(2)

誌 謝

沒想到我也可以寫誌謝了。首先感謝我的指導教授余文德博士,

承蒙余老師諄諄教誨與耐心指導,使我在研究所兩年生涯當中學習到 從未接觸過的知識管理領域,使我增廣見聞受益良多。在此誠摯感謝 敬愛的余老師。

感謝王維志教授、曾仁杰教授與鄭道明教授於校外審時細心給予 學生諸多的建議與指導。感謝楊智斌教授與曾秋蓉教授於研究案上細 心指導與協助。還有感謝王明德教授,感謝您總是教導我做事方法與 態度;另外感謝台灣世曦工程顧問公司的劉沈榮協理、吳誠魁副理、

陳冠霖、張佩倫工程師於百忙當中抽空接受訪談與研究案上的協助。

特別感謝佩倫學姐、智瑋學長、誌銘學長、珮娟助理、Alice 助理在兩 年研究所當中給予諸多幫助及鼓勵。因為有大家的協助,讓我可以順 利的完成艱辛的論文研究,當初從什麼都不懂到順利將論文完成,過 程真的很辛苦,還好有你們再次感謝大家的協助與指導。

在兩年研究所的日子以來,感謝學長宣合、祥宇、偉志、阿德、

力威、小安、奇政、阿中、小董、鞠、學姐曉君,以及感謝同學昀青、

伊君、大種、阿強、珮漪、凱陽,學弟/妹相甫、紹偉、瑤瑤、詞詞、

大雄、蘇祺、長鴻、珈竹、阿 may,還好有你們的陪伴,總是帶來歡 笑、八卦、零食…等。感謝研究團隊智瑋學長在程式及論文上拔刀相 助,還有Pon Pon、Loka 在研究案夥伴們同心協力的配合。

最後我要感謝我最愛的家人們、淑譁、焌榜,你們總是給我鼓勵 與支持,讓我有繼續完成研究所課業動力,焌榜總是陪伴著我給予我 莫大的安慰與鼓勵,真的很感謝一路上支持我的人,請您們與我分享 這樣的成果,我很想大聲說:「有您們真好。」

林詩婷謹誌於新竹中華大學 2009/07

(3)

摘 要

關鍵詞:知識管理、知識社群、滿意度、資料探勘、改善策略

數位知識時代已來臨,如何提升企業間競爭力與有效管理知識社群 成員成為企業經營管理之重要課題。建立知識社群(Community of Practice, COP)可透過知識平台互相交流,分享各專業領域不同的新知 是企業組織應用知識管理最常見的方法。知識社群經過企業知識管理 平台討論過後產生出大量知識案例,若眾多案例如無法有效規劃及利 用,使得龐大知識案例無法產生對於企業之具體效益。知識社群績效 之衡量是有效管理知識社群的關鍵,然而過去有關知識社群之研究並 未建立有效知識社群績效衡量之方法。本研究以過去研究「知識加值 評估模式(Knowledge Value-Adding Model, KVAM 模式)」所產出之知識 案例與「知識管理系統(KMS)」之滿意度資料作為研究資料,運用資料 探勘技術探討出知識案例其中之潛藏相關知識規則,透過分類、分群 等方法可分出其中之特性及型態,提出具體知識社群管理及提升績效 之改善策略,進而提供該個案工程顧問公司高階主管決策上之依據,

以利提升該公司於全球市場上之競爭優勢。

(4)

Abstract

Keyword: Knowledge Management (KM), Community of Practice (COP),

User’s Satisfaction, Data Mining (DM)

Knowledge community of practice (CoP) is a popular approach for knowledge management (KM) implementation in construction organizations including contractors and A/E firms. In order to evaluate and improve the performance of the knowledge CoPs, quantification methods for performance measurement were proposed in previous researches.

Profound implications may be inferred from the performance data recorded from daily knowledge management activities and the user’s satisfaction evaluation by questionnaire surveys. Such implications provide valuable strategies for administration schemes and system modifications. To achieve such goals, the performance improvement patterns and rules should be identified. In this paper MS SQL Server® was adopted to performed Data Ming (DM) tasks that dig out the abovementioned patterns and rules from the CoP performance the user’s satisfaction survey data. Several DM techniques (Decision trees, Clusters, and Association Rules) were employed to mine the rules and patterns existing in the historic data recorded in the past three years from the CoPs of a leading A/E consulting firm in Taiwan. Performance improvement strategies are then inferred and planned based on the rules and patterns discovered. Finally, the proposed strategies are confirmed by the managers of KM and provide an effective direction to improve the competitiveness of the firm. The proposed method does not only fit for the case A/E firm, it is also applicable to other construction organizations in planning their KM improvement strategies.

(5)

目 錄

第一章 緒論 ... 1

1.1 研究動機 ... 1

1.2 研究課題 ... 2

1.3 研究目的 ... 3

1.4 研究範圍 ... 3

1.5 研究方法 ... 4

1.6 研究流程 ... 6

第二章 文獻回顧 ... 7

2.1 知識與知識管理 ... 7

2.1.1 知識之定義 ... 7

2.1.2 知識之分類 ... 8

2.1.3 知識價值 ... 9

2.1.4 知識管理之定義 ... 11

2.2 工程顧問業之知識管理 ... 12

2.2.1 工程顧問業之知識管理目的 ... 12

2.2.2 知識社群 ... 13

2.3 績效評估 ... 14

2.3.1 績效評估之定義 ... 15

2.3.2 知識管理績效衡量之架構 ... 15

2.3.3 績效評估之重要性 ... 16

2.3.4 知識管理績效評估方法 ... 18

2.4 資料探勘(DATA MINING,DM) ... 20

(6)

2.4.1 資料探勘之應用與功能 ... 20

2.4.2 資料探勘之定義 ... 22

2.4.3 資料探勘之步驟 ... 23

2.4.4 資料庫知識發掘 ... 24

2.4.5MS-SQL Server 2005®之資料探勘技術介紹 ... 25

第三章 資料探勘技術介紹 ... 28

3.1 資料探勘 ... 28

3.1.1 資料探勘步驟 ... 28

3.1.2 資料探勘流程規劃 ... 29

3.2 決策樹 ... 31

3.2.1 決策樹目的 ... 31

3.2.2 決策樹分類規則與原理 ... 32

3.2.3 決策樹流程與方法 ... 34

3.3 群集演算法 ... 37

3.3.1 群集演算法目的 ... 37

3.3.2 群集演算法原理 ... 38

3.3.3 群集演算法流程與方法 ... 39

3.4 關聯規則 ... 41

3.4.1 關聯規則目的 ... 41

3.4.2 關聯規則原理 ... 42

3.4.3 關聯規則流程與方法 ... 43

3.5 類神經網路 ... 47

3.5.1 類神經網路目的 ... 47

3.5.2 類神經網路原理 ... 47

3.5.3 類神經網路流程與方法 ... 49

(7)

3.6 貝氏機率分類 ... 51

3.6.1 貝氏機率分類目的 ... 51

3.6.2 貝氏機率分類原理 ... 52

3.6.3 貝氏機率分類流程與方法 ... 53

3.7 資料探勘技術比較 ... 55

第四章 知識社群績效資料之探勘 ... 57

4.1 個案工程顧問公司背景說明 ... 57

4.2 知識加值評估系統概述 ... 63

4.3 資料探勘於知識社群績效資料 ... 64

4.3.1 資料探勘技術選定 ... 64

4.3.2 資料處理 ... 64

4.4 決策樹 ... 67

4.5 群集演算法 ... 72

4.6 關聯規則 ... 74

4.7 類神經網路 ... 79

4.8 貝氏機率分類 ... 83

4.9 知識社群績效資料探勘結果彙整 ... 86

第五章 知識社群滿意度調查資料之探勘 ... 91

5.1 知識社群滿意度問卷設計規劃 ... 91

5.2 資料探勘於知識社群滿意度問卷資料 ... 92

5.2.1 資料探勘技術選定 ... 92

5.2.2 資料處理 ... 92

5.3 決策樹 ... 96

5.4 關聯規則 ... 112

5.5 知識社群滿意度資料探勘結果彙整 ... 123

(8)

第六章 探勘成果討論及策略建立 ... 131

6.1 探勘成果討論 ... 131

6.2 探勘成果之策略建立 ... 135

6.3 焦點群組驗證 ... 136

6.4 小結 ... 138

第七章 結論 ... 139

7.1 結論 ... 139

7.2 後續研究 ... 140

參考文獻 ... 142

附錄一 社群績效規則編號對照表 ... 148

(9)

表 目 錄

表2.1 知識的分類與內涵 ... 8

表2.2 知識管理績效衡量構面 ... 16

表2.3 資料探勘定義 ... 23

表3.1 交易型態資料表 ... 44

表3.2 交易型態案例資料表 ... 44

表3.3 資料探勘技術比較表 ... 56

表4.1 知識社群背景 ... 59

表4.2 資料屬性表 ... 65

表4.3 社群知識案例數量表 ... 66

表4.4 決策樹輸入值 ... 67

表4.5 群集演算法輸入值 ... 73

表4.6 關聯規則輸入值 ... 75

表4.7 關聯規則表 ... 76

表4.8 類神經網路輸入值 ... 80

表4.9 類神經網路模型一介紹 ... 80

表4.10 類神經網路模型二介紹 ... 81

表4.11 貝氏機率分類輸入值 ... 83

表4.12 探勘結果彙整表 ... 87

表5.1 社群滿意度問卷資料屬性表 ... 93

表5.2 知識管理系統滿意度問卷資料屬性表 ... 93

表5.3 知識社群滿意度問卷數 ... 94

表5.4 決策樹社群滿意度輸入值 ... 96

(10)

表5.6 社群滿意度問卷關聯規則表 ... 113

表5.7 知識管理系統滿意度問卷關聯規則表 ... 115

表5.8 知識社群滿意度資料探勘總彙整表 ... 124

表6.1 九個社群滿意度排名 ... 134

表6.2 九個社群績效排名 ... 134

(11)

圖 目 錄

圖1.1 研究流程 ... 6

圖2.1 知識管理的核心流程 ... 12

圖2.2 知識社群之架構圖 ... 14

圖2.3 資料探勘過程 ... 24

圖2.4 知識發掘過程 ... 25

圖3.1 分類模型 ... 33

圖3.2 決策樹探勘流程 ... 35

圖3.3 決策樹樹狀圖 ... 36

圖3.4 群集分析採礦流程 ... 40

圖3.5 群集特性介面 ... 41

圖3.6 關聯規則探勘流程 ... 45

圖3.7 關聯規則檢視器介面 ... 46

圖3.8 神經元架構 ... 48

圖3.9 類神經網路之三層式架構圖 ... 49

圖3.10 類神經網路探勘流程 ... 50

圖3.11 類神經網路檢視圖 ... 51

圖3.12 條件機率 ... 53

圖3.13 貝氏機率分類流程 ... 54

圖3.14 貝氏機率分類屬性特性圖 ... 55

圖4.1 本案例工程顧問公司組織架構圖 ... 58

圖4.2 本案例工程顧問公司知識社群介面 ... 63

圖4.3 決策樹探勘模型一 ... 68

圖4.4 決策樹探勘模型二 ... 69

圖4.5 決策樹探勘模型三 ... 70

(12)

圖4.6 群集圖表 ... 73

圖4.7 群集設定檔 ... 74

圖4.8 關聯規則圖 ... 77

圖4.9 關聯規則相依性網路圖 ... 77

圖4.10 類神經網路檢視器介面一 ... 81

圖4.11 類神經網路檢視器介面二 ... 82

圖4.12 貝氏機率分類相依性網路圖 ... 84

圖4.13 貝氏機率分類屬性特性介面一 ... 84

圖4.14 貝氏機率分類屬性特性介面二 ... 85

圖5.1 社群滿意度決策樹探勘模型一 ... 97

圖5.2 社群滿意度決策樹探勘模型二 ... 98

圖5.3 社群滿意度決策樹探勘模型三 ... 98

圖5.4 社群滿意度決策樹探勘模型四 ... 99

圖5.5 社群滿意度決策樹探勘模型五 ... 99

圖5.6 知識管理系統滿意度決策樹探勘模型一 ... 100

圖5.7 知識管理系統滿意度決策樹探勘模型二 ... 101

圖5.8 知識管理系統滿意度決策樹探勘模型三 ... 101

圖5.9 知識管理系統滿意度決策樹探勘模型四 ... 102

圖5.10 知識管理系統滿意度決策樹探勘模型五 ... 103

圖5.11 知識管理系統滿意度決策樹探勘模型六 ... 103

圖5.12 知識管理系統滿意度決策樹探勘模型七 ... 104

圖5.13 社群滿意度決策樹探勘模型六 ... 104

圖5.14 社群滿意度決策樹探勘模型七 ... 105

圖5.15 社群滿意度決策樹探勘模型八 ... 105

圖5.16 社群滿意度問卷關聯規則圖 ... 114

(13)

圖5.17 社群滿意度問卷關聯規則相依性網路圖 ... 114 圖5.18 知識管理系統滿意度問卷關聯規則圖 ... 116 圖5.19 知識管理系統滿意度問卷關聯規則相依性網路圖 ... 116

(14)

第一章ġ 緒論

工程顧問公司之知識社群為知識集合區,企業組織在市場競爭激 烈之下,員工是賦予知識的來源,利用企業間知識平台員工透過討論 可將知識再利用,而不再把知識埋沒在企業當中,提升企業的知識管 理經驗及競爭力。

1.1 研究動機

數位知識時代已來臨,國際化企業經營已成為新潮流,如何提升 企業間競爭力與有效管理知識社群成員,知識也是提升企業競爭優勢 來源之一。知識經由個人的應用及創新可產生更多新知識及經驗。經 由這些創新過程發現新知識賦予無限價值,有效的知識管理可讓新進 同仁快速瞭解公司營運狀況,不必從零開始,提升服務效率及品質。

企業組織中員工的知識潛力是隱藏無限的價值,員工經由學習及 同仁間討論可獲得知識新的構想,知識經應用過後皆屬於企業組織的 知識資產,以累積豐富知識管理經驗。國內營建產業建立知識社群來 提升知識管理效益,本研究回顧知識管理績效評估相關文獻;張佩倫[1]

提出一套分析傳統解決問題之流程與「緊急求救系統(SOS)」之解決問 題流程,計算 SOS 個案之人時、時間及成本效益,並提出改善策略及 評估知識管理系統的實質效益,以工程顧問公司知識管理系統之實際 案例,以量化效益分析之方式;謝侑霖[2]應用問卷調查系統及量化效 益分析之方式蒐集「案例工程顧問公司」知識管理系統之SOS 績效量 化之資料,針對知識管理所產生之效益資料進行探勘,經由資料探勘 技術挖掘出該「案例工程顧問公司」知識管理系統之SOS 效益資料中 之潛藏之知識規則,用來提升知識管理系統產生之效益;姚宣合[3]建

(15)

立之「知識管理活動績效量化評估模式(KVAM 模式)」,建立「知識社 群之知識加值績效量化評估系統(KVAS 系統)」來量化分析個案工程顧 問公司之一般知識社群績效。利用知識社群(Community of Practice, COP)之知識加值績效量化評估系統(KVAS)進行分析所獲得之知識案 例,以及知識社群使用知識管理系統之滿意度調查資料利用資料探勘 技術分析,獲得相關資料之潛藏規則,提供社群管理者作為知識社群 之績效管理及改善策略之參考。

本研究將以個案工程公司之知識社群的知識案例及滿意度調查作 為研究資料,利用知識管理活動KVAM 與知識管理系統之 SOS 之知識 案例效益資料中之潛藏之知識規則,本研究運用資料探勘技術從中探 討出CoPs 之知識案例相關規則,透過分類等方法可分出其中之特性及 型態,企業組織當中員工的工作經驗及知識的累積都屬於企業隱形的 知識資產,透過企業內之 CoPs 在參與知識活動之間的互動及討論,產 出之知識價值都屬於企業資產,員工在CoPs 當中透過參與知識活動之 績效評估可使企業之隱形知識外顯化,建立知識社群活動績效之行為 規則,使得知識社群參與知識管理活動更活躍,以及透過潛藏的知識 規則可提出具體知識社群管理改善策略。

1.2 研究課題

由上述之研究動機,本研究利用工程顧問公司之知識社群(CoPs) 於知識活動參與過程中,如何歸納知識社群對工程顧問公司之效益,

文獻中關於知識社群效益量化方法也相當缺乏,由此本研究提出以下 三點課題:

一、ġ知識社群於知識管理活動之資料探勘,雖已有學者進行研究,卻 只對於緊急求救系統之效益評估作為研究資料,因此本研究將對

(16)

理系統使用之滿意度調查資料進行深入探討。

二、ġ經由知識社群參與知識管理活動過程之知識案例與知識社群使 用知識管理系統之滿意度調查資料,由龐大資料量當中尋找知識 社群管理行為與管理參數間之態樣(Pattern)與關聯性為何?

三、ġ知識管理行為與知識管理活動間亦反應出管理策略之資訊,如何 應用其龐大資訊經策略規劃後,可提出更具效益之管理改善新策 略。

1.3 研究目的

透過文獻回顧,已尋求可用之知識管理評估模式,本研究將針對 研究課題逐步進行探討:

一、ġ應用MS-SQL Server 2005®中之資料探勘技術,其中工具包括決 策樹、群集演算、類神經網路、關聯規則、貝氏機率分類之五大 工具,找尋知識社群於知識管理活動過程之態樣(Pattern) 與法則 (Rule)歸納。

二、ġ應用資料探勘技術可得到其中之態樣(Pattern)與法則(Rule),可提 出針對工程顧問公司之知識社群改善績效管理之新策略,以利該 公司修正現有制度,並由專家驗證後修正策略提供未來有知識管 理系統之公司其應用與參考依據。

1.4 研究範圍

本研究以個案分析之分式進行,因時間及人力限制下,未能與其 他工程顧問公司之知識社群(CoPs)同時進行研究;本研究擬訂之範圍以

(17)

「個案工程顧問公司」之一般知識社群(CoPs)作為研究對象,利用個案 工程顧問公司之「知識加值績效量化評估系統(KVAS)」及知識社群使 用「知識管理系統(KMS)」之滿意度調查資料,透過知識社群參與知識 管理活動之過程,以資料探勘技術方式,提出對於知識社群改善及管 理之新策略應用。

1.5 研究方法

本研究利用次級資料分析法、個案研究法、資料探勘、專家訪談 作為研究方法,分別說明如下:

一、ġ次級資料分析法

蒐集與本研究相關之文獻,包含國內外工程顧問公司執行知 識管理之現況、國內外知識管理之定義、知識管理系統績效評估 及資料探勘技術之相關文獻等。

二、ġ個案研究法

個案研究法是一種質化的描述性研究,個案研究在個人的或 是小群組的合資參與者看來是一種強烈的特性方法。個案研究是 一種參與者與群體只有在特殊的背景上的描繪性之推論研究[4]。

本研究利用個案研究之方法,針對本個案工程顧問公司之知識加 值績效量化評估系統(KVAS)及知識社群使用「知識管理系統 (KMS)」之滿意度調查資料,透過知識社群參與知識管理活動之過 程,找尋其中之法則以提出知識社群改善管理策略。

(18)

三、ġ資料探勘

將個案工程顧問公司之知識加值績效量化評估系統(KVAS)與 緊急求救系統(SOS)之知識案例,應用 MS-SQL Server 2005®資料 庫軟體進行資料探勘分析,嘗試透過資料探勘之決策樹分析、群 集演算法、關聯規則等功能,針對知識社群參與知識管理活動過 程,探勘出其中之態樣及法則,可提供管理者管理知識社群之依 據,進而提升改善策略。

四、ġ專家訪談

本研究與個案工程顧問公司進行專家訪談,以獲得該公司適 合之改善管理策略及績效管理與本研究資料探勘後所提出之改善 管理策略進行探討及建議。

(19)

1.6 研究流程

本研究章節架構與研究流程圖,如圖1.1 所示。

圖1.1 研究流程

(20)

第二章ġ 文獻回顧

本研究旨在建立工程顧問公司合適之知識社群管理策略改善,透 過社群參與知識活動間之隱藏的知識規則,提出有效管理知識社群改 善方法。進而瞭解國內外知識與知識管理相關文獻,蒐集國內外資料 探勘分析與績效評估、知識管理系統效益量化評估等。冀望經由知識 社群參與知識管理活動過程之管理行為與管理參數間之關聯性。

2.1 知識與知識管理

所有事業的成功,均是因為能替顧客提供最高的價值;所以,知識 管理提高企業的價值[5]。勤業管理顧問公司[6]認為知識管理的「知識」

二字,廣義地包括了「資料」、「資訊」、「知識」和「智慧」這四項概 念,總稱為「知的資產」;因此,談到知識管理,必須先將這四項概念 加以整理區分,以釐清目的與效果再對這四項概念作管理。

2.1.1 知識之定義

知識是一種靈活的資源,能為企業帶來豐厚的利潤及協助員工成 長茁壯[7]。管理大師彼得·杜拉克(Peter Drucker)所宣稱「知識」是最具 有影響力的資源。不論個人或企業的知識與經驗都有不可限量的價 值,知識多一人知道,就多一分發揮的潛力與空間,若知識能再透過 團隊分享與再組織,則對企業的競爭力與資產的增加都是非常可觀的 [8]。Harris[9]認為知識是資訊、文化脈絡以及經驗的組合。其中,文化 脈絡為人們看待事情時的觀念,會受到社會價值、宗教信仰、天性以 及性別等影響;經驗則是個人從前所獲得的知識;而資訊則是在資料 經過儲存、分析以及解釋後所產生的,因此資訊具有實質內容與目標。

(21)

2.1.2 知識之分類

Polanyi[10]首先提出內隱性知識,並將知識分為內隱性知識與外顯 性知識兩類。而Nonaka & Takeuchi[11]分別對於內隱與外顯知識歸納 出,內隱知識為比較複雜,無法用文字描述之經驗式知識,不容易文 件化、與標準化之獨特性知識,而外顯知識為可文件化、標準化、系 統化之知識,故顯性知識可以自知識庫中直接複製與進行獨立之學 習。過去學者依據各種不同的分類方式將知識分為許多種類,表 2.1 整理各種知識分類方法及其內涵:

表2.1 知識的分類與內涵

年代 提出者 知識的分類與內涵

1967 Polanyi 依知識的內隱性與外顯性分類:

1.外顯知識(explicit knowledge) 2.內隱知識(tacil knowledge) 1994 Hedlund

1995 Nonaka and Takeuchi 1990 李仁芳

依知識的專屬性分類:

1.系統性知識 2.非系統性知識 1991 Badaracco

依知識的可移動性分類:

1.可移動的知識 2.嵌入組織的知識

1994 Garrity and Siplor

依決策支援角度分為四類:

1.特定領域的知識 2.公司的知識 3.導引性知識 4.整體知識

1995 Leonard-Barton

依組織核心能耐分類:

1.實體系統 2.管理系統

3.員工的技能與知識 4.價值與規範

資料來源:[10],本研究重新繪製成表

(22)

表2.1 知識的分類與內涵(續)

年代 提出者 知識的分類與內涵

1996 Howells

依知識轉移過程階段分類:

1.瞭解缺乏的知識 2.知道他人知識的知識 3.行為表現的知識 4.工作導向的知識

1996 Quinn

依專業智慧在組織運作的重要性分類:

1.實證知識 2.高級技能 3.系統認知

4.自我創造的激勵

1996 吳思華

依策略資源的角度分類:

1.獨特性 2.專屬性 3.模糊性

1997 Stewart

依智慧資本分類:

1.人力資本 2.結構資本 3.顧客資本

資料來源:[10],本研究重新繪製成表

2.1.3 知識價值

知識是價值創造的關鍵[6]。不論個人或企業的知識與經驗都有不 可限量的價值,知識多一人知道,就多一分發揮的潛力與空間,若知 識能再透過團隊分享與再組織,則對企業的競爭力與資產的增加都是 非常可觀的[8]。知識需要分享才能產生真正的價值,但不知道知識分 享的優點,或沒收到知識分享帶來的利益會造成個人不願意分享。因 此,當知識的分享以成為共識時,知識與價值的關係將愈顯重要。勤 業管理顧問公司(Arthur Andersen, 於 2000 後改名為 Accenture)導出 一套知識管理中最重要的元素架構,其知識管理架構請參閱式2.1 所示 [6]。

(2.1)

(23)

KM:Knowledge Management, 知識管理 P:People, 人

K:Knowledge, 知識 S:Share, 分享

+:Technology, 資訊科技

由式 2.1 中知識管理最大的效果在於 S(分享指數)之多寡,透過 資訊技術的應用,傳統上只能分享給少數人的知識,可以利用此知識 槓桿作用而發揮極大的分享效果。知識經由資訊科技的加總輔助後,

再經由人與人的分享,可將知識無限的擴大。

知識管理以「知識」為武器,其可擴大企業的核心職能[5]。以提 升知識之價值,陳永隆顧問研究室提出「知識價值驅動程式」,公式如 式2.2 所示,提醒企業檢視企業產生知識價值的幾個關鍵因素[13]:

(2.2)

Kvalue :知識的價值

C:Core Competence, 過去累積的核心能力 A:Action, 現在的行動能力

L:Learning, 未來趨勢的學習能力

Kio:吸收知識與分享知識的能力(Kinput+Koutput)

因此,如何同時將式 2.2 中之核心能力、行動能力、學習能力、吸 收與分享知識的能力等數值提昇,是企業能否具體提昇知識價值的重 要關鍵[3]。

(24)

2.1.4 知識管理之定義

所謂知識管理(Knowledge Management),是指能將原本存在於企 業內所有成員或隱藏制度、資料庫文件、歷史資料中的知識,完整擷 取整理並儲存成為企業的智慧資產,提供給所有的人取用並分享給需 要的人;是一種有系統的累積並分享知識,同時有目的的運用知識,

並能不斷持續強化所累積的知識,促使個人以至於整個企業均能因知 識的普及而進步,達到更高的效益[14]。工程顧問公司的知識多半累積 在工程師腦海中,或只是文件紀錄的原始資料、資訊,未轉化成知識。

公司經常紀錄之工時、成本資料,實是輔助知識管理的有利資產。因 此,如何有效地利用此等資產,輔以工程師經驗等隱性知識,找出運 用於工程與經營的顯性知識,對顧問工作經驗傳承相當重要[15]。

Marquardt [16]以學習型組織觀點探討知識管理。其認為「知識管 理」係指知識的取得及產生的管理,包括知識取得、建立、儲存、轉 換和應用四個構面。

一、ġ知識取得:指從內部及外部組織收集現有的資料及資訊。

二、ġ知識產生:指透過問題解決及洞察力在組織內部產生新的知識。

三、ġ知識儲存:輸入及保存組織有價值的知識,使組織成員在任何時 間及任何地方容易取得。

四、ġ移轉及使用:包括機械的、電子的及各個組織成員間資訊及知識 的移動,有意地及無意地遍及整個組織的知識應用及使用。

知識管理中,不僅牽涉到知識的擷取、儲存,還包括了知識的運 用與分享,因為知識被分享後才能創造出更高的價值[17]。企業員工利 用網際網路(Internet)、企業內部的區域網路(Intranet)和企業與企業間的 網路(Extranet),讓知識廣泛而多元地進入企業,成為企業知識管理的

(25)

核心源頭,如圖2.1 所示[13]。

 

  圖 2.1 知識管理的核心流程[13]

2.2 工程顧問業之知識管理

2.2.1 工程顧問業之知識管理目的

工程顧問業為使公司提昇競爭力,順應廣大的市場變遷而積極推 動知識管理系統,工程顧問業資料量相當大也須有系統性歸類文件,

知識累積與分享而創造知識經濟效益的關鍵因素為「時間」,就如同微 軟總裁比爾蓋茲先生所指稱,未來國際企業主要的競爭為「速度」[18];

企業必須將個人的知識化為組織的無形資料,並且能有系統、有效率 的加以儲存,進一步成為公司的規章制度,如此才能發揮知識管理的 功效。然而這些資料的累積,以往只靠人工的方式來管理,無法做到 盡善盡美。現今可運用資訊科技,將這些知識加以有系統的保存,並 且能夠容易的讀取,在這些資料中創造新的知識[19]。由以上得知工程

(26)

顧問業之所以推動知識管理目的為使公司業績成長,可使企業更永續 經營及帶來更大的優勢。

2.2.2 知識社群

知識社群的建立是有效的替代辦法。所謂知識社群,是指員工自 動自發(或半自動自發)而組成知識分享團體,凝聚的力量是人與人 之間的交情與信任,或是共同的興趣,而不在正式任務與職責。成員 可自行決定參與社群活動與否,因成員加入的理由是樂於分享經驗與 知識,相互教導與學習,並從中得肯定與尊重[20];經由社群成員共同 參與某個主題的討論,分享、交流彼此擁有的知識,社群成員可能來 自不同的組織、專長各異。此外,社群成員可藉由各種資訊科技參與 社群、與其它成員交流,像電子郵件、群組軟體、電子化學習系統等,

系統可提供相關檔案與排名,以建立參與者的信任[21]。

Dr. Jim Botkin[22]說:「沒有知識社群的知識管理系統,就像沒有 人操作的個人電腦」。由此可知。知識社群是知識管理平台的靈魂,扮 演著知識創新、知識分享的重要功能,若缺乏完善的規劃與經營,再 好的知識管理平台,也只能達到「文件管理」的層次[23]。

知識社群是激發員工內隱知識最有效的方式,完整的知識社群,

應同時包括「實體的知識社群」與「虛擬的知識社群」。知識社群之架 構圖,可由圖2.2 所示[13]。實體的知識社群可藉由公司的員工專長調 查、讀書會、定期講座、知識評鑑等活動設計,找出跨部門但具相同 知識領域或專業背景者。虛擬的知識社群,則透過網路社群互動平台,

提供相同知識背景或知識專業者一個互動的空間,讓個人的內隱知識 得以自由發揮[13]。

(27)

圖2.2 知識社群之架構圖[13]

2.3 績效評估

績效評估(Performance Evaluation)是一種管理控制的一項重要的 技術,是一門相當專業且有用的學科,基於績效評估的重要性,國內 相關組織歷年來,均已逐漸用來作為判別執行成效的工具,並且依據 此分析結果作為決策上的重要依據[24];藉由績效評估制度之建立,能 在事前或活動進行中,對於行動者之決策與行為產生影響或導引作 用,使其個人努力目標能與組織目標趨於一致,此即所謂「目標一致 化」(Goal Congruence)作用[25]。

績效的評估可能會隨著企業組織的特性、目的、對象及時機而有 所不同。而在進行組織績效評估時,效能與效率兩者同等重要,因為 若只重視效率而不重視效能,則往往無法達成目標;相反的若只重效 能而不重效率的話,則必然會導致濫用資源的情況;所以只有在效率 及效能兩相配合之下,才能真正發揮企業之資源效益,而做到最有效 運用[26]。

(28)

2.3.1 績效評估之定義

績效管理的目的不單是要提高知識的量與增加利用知識的頻率,

並且要明確的找出何種知識對擴大企業價值有貢獻,並確實配合企業 策略[5],許多學者認為績效(Performance)是指對於企業組織目標達成 程度的一種評估,甚至有學者主張績效和目標為同義詞。而對整個企 業組織而言,目標的存在有下列幾種意義[27](Drucker,1998):

一、ġ目標提供企業組織內個人及群體的努力方向。

二、ġ目標影響到企業組織規劃及活動方式。

三、ġ目標可提供評估及控制功能。

績效表示企業組織活動結果的整體概念,包含效能(Effectiveness) 與效率(Efficiency)兩個層次的意義。效能是指企業組織目標的達成度,

而效率則是以產出(Output)與投入(Input)的比率來評估,提高效率是以 相同(或較少)的投入,以得到較多(或相同)的產出。亦可從另一個角度 來看,所謂效能是指做對的事(Do the Right Thing),而效率則是把事情 做好(Do the Thing Right)[27]。企業當中績效屬於公司的評比工具,績 效評估作用將可顯現出組織在一段期間內所進行工作之效能,可替管 理者瞭解企業經營之成效。

2.3.2 知識管理績效衡量之架構

企業組織公司員工於從事其工作過程當中,可經由互相討論及分 享工作等經驗,結合員工本身賦予的知識,可創造出更高價值之知識,

而這過程都可由績效評估所得而知。文獻回顧中學者龔奕如提出一套 知識管理績效衡量之架構,其評估構面分為四個部份,分別是:知識 流程、資訊工具、制度/文化、學習/成長,如表2.2 所示[28]。

(29)

表2.2 知識管理績效衡量構面

構面 知識流程 資訊工具 制度/文化 學習/成長

衡量

標的 知識價值鍊 IT 使用平台的建置 流程

人 ( 組 織 的 行 為)

知識創造 階段

衡量 基礎

知識盤點、知識 儲 存 、 知 識 創 造、知識分享移 轉、知識運用

知識的取得、知識的 提煉、知識的儲存與 更新、知識的呈現、

知識的傳遞

意 識 期 、 推 行 期、加深期、內 化期

知識取得、資訊 擴 散 、 資 訊 詮 釋、組織記憶 資料來源:[28],本研究重新繪製成表

MAKE (Most Admired Knowledge Enterprise)為評估實施知識管理 之指標,以下列八項指標來衡量:第一項是整體知識計劃的品質;第 二項是高層對知識管理的支持度;第三項是對技術革新的貢獻度;第 四項是知識資產的極大化;第五項是知識共享活動的效果;第六項是 持續性學習文化的滲透度;第七項是提高顧客價值與貢獻度;第八項 是提高股東權益報酬的貢獻度[5]。

2.3.3 績效評估之重要性

績效評估乃是針對評估單位對所需求的目標項目加以量測,藉以 彰顯該項目當時情況的水準,其評估的方法,則因測量的目的、對象、

時間、性質等的不同而有所差異[29]。誠如心理學家桑代克之名言指 出:「凡是存在的東西,都可以評估」,故對於企業之實務運作而言,

僅了解何謂績效並不具有任何實質意義,而須針對「如何評估績效」

及「如何運用適當之績效指標」等問題來加以探討,才具實用價值。

至於績效評估之重要性,可有以下幾點來加以說明[28]:

一、ġ據以評估過去的經營成果

經營績效是管理者運用企業資源達成經營目標的具體表現;

(30)

績效的良寙不僅攸關企業能否生存,更可能影響企業未來的發 展,因此,當企業活動結束後,應就各種活動結果的記錄,評估 計算方式及指標,進而執行分析與評估,以收「鑑往」的效果。

二、ġ供作預測未來發展的基礎

通常企業均訂有長期發展計畫,故可以過去的經營績效為起 點,考慮各種可能的變數,逐步發展修正企業未來的經營方向及 計畫,據而編製各種「預計財務報表」,以規劃未來的發展結果。

三、ġ作為管理控制的工具

當各種行動付諸實施之後,企業內外環境難免有所變化,已 不如規劃時所預期之情況,故企業必須採取修正行動,以期能達 成預期目標,此即是所謂的「控制」。控制的程序包括建立績效標 準、評估實際績效與採取改正行動;不論績效的標準是數量、時 間、品質或成本,均應將實際績效與之比較,同時形成回饋,以 確保預期目標的達成。

四、ġ作為是否繼續經營的決策參考

評估經營績效之良窳,可提供管理階層決定是否繼續經營的 參考。倘若某一活動甚至整個企業之經營績效未能達到預期標 準,則可考慮是否放棄或繼續經營。

由上述可得知,企業管理當中績效評估也應用於經營之指標,可 預測企業未來方向,也可由績效中指出企業內未發現之問題,提出更 具體的改善策略及管理機制。

(31)

2.3.4 知識管理績效評估方法

工程顧問公司若無法有效評估其績效為何,將無法確立公司之經 營指標,也難以預測公司之運作情形。學者吳嘉文回顧了相關知識管 理的評估方法,整理並可歸納為整體評估與個別評估兩大類,其說明 如下[26]:

一、整體評估

(一)托賓q

Tobin J提出托賓q值法(Tobin’s q)。托賓q(Tobin q)這項比值是指 資產的市場價值與重置成本之比。此比值的推演主要是用來預測在 經濟因素之外的企業投資決策,當q值小於1時,代表資產價值小於 重置成本,則公司就不要再多投資此項資產。若將此比值使用在知 識管理的評估之中,則主要是可藉由此比值對於報酬遞減率的反 應,如托賓q大於1時,企業本身能從該項資產中得到的報酬就相當 高,即q值越高表示該企業擁有越多的智慧資本[26]。

(二)市價與帳面價值的差額

Stewart T. A.指出,過去計算一家公司的價值往往是以每一股股 票之價值乘以目前擁有的股票總數而獲得市場價值。所以計算一家 公司智慧資本存量的方式,可表示為市面價值(每股價值×現有股數)

減去帳面價值,而所得出的差額為該公司的智慧資本。此種計算方 法基本上是假設市價減去帳面價值所剩的部份,即為無形資產。另 一方面,市價除以帳面價值比的算法具有速度快且簡單等優點,但 是股票市場變化萬千,甚至有可能市價低於帳面價值的情況發生 [26]。所以,此方法不見得適用於各種評估之條件。

 

(32)

(三)智慧資本附加價值

Sena J.A.等學者提出,智慧資本附加價值的方法係先計算組織的 附加價值,其次將此計算值與組織資源、人力資本、結構資本做一 個連結。在智慧資本附加價值的計算過程中,所有可能用到的數據 皆來自於資產負債表,因此相當能夠符合公司實際的支出現況[26]。

(四)知識附加價值法

李書政學者指出,知識附加價值乃指具有共同知識單位的價格 及成本所形成的比率,這些構成比率的知識價格與成本可由營運現 金流量來加以推導[30]。

二、個別評估

(一)平衡計分卡(Balanced ScoreCard, BSC)

平衡計分卡的衡量代表一種工具,它是兼顧領先指標與落後指 標的一種量度工具[31]。

(二)無形資產監控

Sveiby K. E.提出無形資產監控之方法,監控系統主要目的在於 找出組織內部的無形資產,以及監控其績效的重要性;內容包括外 部結構、內部結構以及員工能力等,是在資產負債表中無形的部份 [32]。

(三)歐洲品質管理模式

Dilip Bhatt提出歐洲品質管理模式與智慧資本雖然沒有明顯的 關聯性存在,但是評估項目卻隱含了人力資本、關係資本以及結構 資本的要素。歐洲品質管理模式的主要缺點包括忽略公司內部促進

(33)

者與結果彼此互相回饋的現象、權重過於主觀,以及分數本身無法 顯示不同資本間相互影響的關係[32]。

(四)智慧資本評估

Bornemann M.學者提出智慧資本評估的方法,它是具多面向、

整合性、動態及可維持等特性,所以一個全面性的知識管理評估指 標,需能夠滿足所有型態與規模的企業標竿的要求。智慧資本評估 模式提供了一個具體的指標與數學架構[26]。

根據李祥豪學者之研究中指出,作業基礎成本法(ABC)、經濟附加 價值(Economic Value Added, EVA)以及知識附加價值(Knowledge Value Added, KVA)基本上都是屬於偏向財務層面的指標,其中 ABC 與 KVA 主要是針對作業流程,引入知識以及其他隱性成本的修正性財務評估 模型,而 EVA 則是從結構面來對組織的隱性資產作評估。這幾種評估 如果應用在知識管理的評估,首先必須要將知識管理進行的流程或者 進行知識管理前後的組織資產獨立出來,再正確的計算其財務價值。

不過如果要正確的應用這些方式,首先必須要對組織內部的各項財務 資訊作相當精確而全盤的瞭解[33]。

2.4 資料探勘(Data Mining, DM)

隨這現代企業競爭力提升,資料電子化及網路通訊普遍,企業在 長期經營之下所累積的資料量相當驚人,若無法透過有效的歸類及整 理,難以歸納出重點及其應用價值。

2.4.1 資料探勘之應用與功能

隨著網際網路的發達與資料庫技術的成熟,人們取得資料變得非

(34)

常容易,在加上許多網際網路的應用,其實就是個自動化的資料收集 工具,資料量之大已經逼近爆炸的程度[34]。國內多位學者利用資料探 勘技術作為研究工具,學者陳生祥[35]使用資料探勘的決策樹方法和類 神經網路分析企業財務危機預警模式。學者藍中賢[36]利用資料探勘技 術中的模糊理論與貝氏分類法,應用於健保醫療費用審查作業。Berry and Linoff[37]等學者將資料探勘的功能分為六大類:分別為分類、推 估、預測、關聯法則、群集化以及序列樣態,以下將這些功能的意義 及可使用的技巧概述如下:

一、分類(Classification)

分類就是分析資料的所有特質,再將其指派至一個現有的群 集中。例如在地區的分析上,建築技術規則會劃分不一樣的耐震 係數,藉由分類可以對不同地區建築物給予不同的結構設計。常 使 用 的 技 巧 有 決 策 樹(Decision Tree) 或 類 神 經 網 路 (Neural Network)等。

二、推估(Estimation)

推估善於處理連續性的數值,憑著一些輸入資料,可以用來 推估一些未知的連續性變數。例如按照營造廠承接之案子大小或 多寡來推估營造廠規模之大小。相關的使用技術包括統計方法上 之相關分析、迴歸分析及類神經網路方法等。

三、預測(Prediction)

預測是去推估未來的數值以及趨勢,歷史資料可以用來建立 模型以檢視近來觀察值的資料。例如由過去建築物之工程成本來 預測未來類似建築物之工程成本。使用的相關技術包括迴歸分 析、時間序列分析(Time Series Analysis)、類神經網路及案例庫推

(35)

理(Case-Based Reasoning)等。

四、關聯法則(Association rule)

關聯法則主要描述在龐大資料庫中某些資料項目間彼此之關 聯性,其形式為 X→Y,其中 X 及 Y 分別表示資料庫中不同之項 目組。例如,可以從資料中找出結構行為與建物高度之關聯。如 果為磚構造,建築物高度約為 15~16 公尺;若建築物為鋼筋混凝 土,建築物高度可達為 30 公尺以上,證明磚構造無法蓋高層建物。

五、群集化(Clustering)

群集化就是將一群異質的群體區隔為同質性較高的群體或是 子群。它與分類不同的是,群集化沒有依靠事先明確定義的類別 來進行分類,資料是根據自身的相近性來群聚在一起的。

六、序列型樣(Sequential Pattern)

序列型樣技術的重點是考慮時間的因素,利用此方法分析不 同時間點上各事件的關聯性。序列型樣主要分為順序性型樣與週 期性型樣兩種,順序性型樣乃考慮事件發生之時間先後關係,而 週期性型樣乃考慮時間區段的變化,分析時間區段內所發生的事 情,是否其他相同時間區段內也會發生。這兩種方法雖不同,但 對使用者而言,隨著時間的多樣變化,找出有用的規則已日形重 要。

2.4.2 資料探勘之定義

對於資料探勘許多學者對此名稱提出相關定義,本研究由文獻回 顧中歸納及整理成如表2.3 所示。

(36)

表2.3 資料探勘定義

年代 提出者 資料探勘定義

1991 Frawley 認為資料探勘就是指從資料庫中挖掘出潛在、明 確、而且非常有用的資訊。

1995 Grupe and Owrang 資料探勘乃是現存資料中剖析出事實及發現專家 們尚未知曉的新關係。

1996 Fayyad

知識發掘(Knowledge Discovery)為從大量資料中 選取合適的資料,進行資料處理、轉換等工作,

在進行資料探勘與結果評估的一系列過程,也就 是說資料探勘技術只是知識發掘過程中的一個步 驟。

1997 Berry and Linoff 資料探勘就是為了要發現有意義的樣型或法則,

而以自動或半自動的方式對資料進行分析。

1997 Cabena

資料探勘是將先前所未知得隱藏資訊,從大型資 料庫中有效地抽出以提供給高階主管做為決策的 參考。

1999 Chung and Gray

資料探勘主要是從資料或資料庫中,運用相關的 分析技術發掘出新的、未知的樣式或規則,並且 透過資料探勘的應用,發掘出超越歸納範圍外的 資料間關係型態。

2001 Han and Kamber 從龐大的資料中,挖掘(Extracting) 或探(mining) 出知識。

2001 Shaw 資料探勘是尋找和分析資料的一個過程,主要的 目的是找出隱含在裡面有用的資訊。

2002 陳麗君 資料探勘就是從龐大的資料庫中尋找有價值的隱 藏事件,並加以分析。

資料來源:[38,39,40,37,41,42,43,44],本研究整理繪製成表

2.4.3 資料探勘之步驟

現代網際網路資訊快速發達,經由網路搜尋已成為現代人蒐集資 料的工具之一,資料日新月異所產生大量的資料,若經資料探勘技術 處理,將可有效整理及歸納資料。我們可將「資料探勘」視為一種「資 料轉化」的過程,是由沒有組織的數字與文字集結的資料(data set),轉 化 為 資 訊(information),再轉為知識(knowledge),最後才產生決策 (decision) [45]。如圖 2.3 所示。

(37)

圖2.3 資料探勘過程[45]

依據分析方式與產生的知識型態來決定資料探勘的方法,而資料 探 勘 是 用 來 發 掘 資 料 中 隱 藏 的 資 訊 , 乃 知 識 發 掘(Knowledge Discovery),資料發掘應用許多分析方法,從資料中尋找有用的特徵以 及其關聯性以支援決策及預測[46]。資料探勘包含以下步驟[47]:

一、ġ確定目標:在資料探勘中卻是不可缺少的一部份,必須明確地定 義出問題所在及質疑的地方。

二、ġ預備資料:此一步驟是資料探勘過程中最花時間的一個步驟,約 佔整個資料探勘的過程的60%時間。

三、ġ資料選取:從所有的資訊中選擇所需要的資料。

四、ġ資料的前置處理:確保所選取資料的品質,使分析更容易進行。

五、ġ資料轉換:根據不同的資料探勘演算法,將資料轉換成演算法所 適合的模式。

六、ġ資料探勘:選擇適當的資料探勘演算法來探勘上一個步驟所轉換 出來的資料。

七、ġ分析結果:評估步驟三所探勘出來的資料。

八、將步驟四所分析出來的資料加到企業化的組織或資訊系統裡。

2.4.4 資料庫知識發掘

資料庫知識發掘的整個過程目的在從大型資料集合(Data Sets)中 找出隱含的、未知的與具有潛在價值的資訊[48];Brachman [49]認為知 識發掘所有活動及過程,是為了從資料中找到有用的樣式,其中包括

(38)

運用資料探勘的演算法,以及對於知識的再次處理,並找到解決問題 的關鍵原因。下圖為知識發掘過程[34]如圖 2.4 所示。

圖2.4 知識發掘過程[34]

資料庫知識發掘過程中,可將隱藏資料發掘出來更容易被應用,

企業中相當多豐富的資料在其中也可發掘出更有益處的資料,也可從 資料中發掘其關聯性,創造出更有價值的資料。

2.4.5MS-SQL Server 2005

®之資料探勘技術介紹

微軟的資料探勘功能主要以 SQL Server 的 Analysis Services 為技 術的核心,並提供豐富、多樣的演算法與使用者選擇,包括決策樹、

群集演算、類神經網路、關聯規則、時序群集、時間序列、貝氏機率 分類、羅吉斯迴歸、線性迴歸等九種演算法,並可透過內建於SQL Server 中的資料探勘工具,大大提升並拓展資料探勘應用的廣度。

目前微軟公司所開發之採礦工具 MS-SQL Server 2005®中之資料 探勘技術,以下為九種方法之介紹[50]:

(39)

一、ġ決策樹演算法(Decision Trees)

本演算法為一種分類演算法,適用於預測模型之建構,此演算 法同時支援類別屬性和連續屬性的預測。

二、ġ群集演算法 (Clustering)

本演算法為使用反覆技巧,將資料集的記錄分成包含類似性質 的群集。

三、ġ關聯規則演算法(Association)

本演算法為建立規則來描述哪些項目最可能同時出現在資料 中,規則可基於資料中的其他項目,來預測某項目出現與否。

四、ġ時序群集演算法 (Sequence Clustering)

本演算法為時序分析和群集的組合,它識別時序中類似排序的 事件的群集。群集可基於已知性質,來預期時序中的事件的可能排 序。

五、ġ時間序列演算法 (Time Series)

使用線性迴歸決策樹方式來分析時間相關資料,例如每月銷售 資料或每年利潤,它發現的模式可用來預測未來時間步驟的值。

六、ġ類神經網路演算法(Neural Net)

本演算法為使用漸層方法,將多層網路的參數最佳化,以預測 多個屬性,它可用於分隔屬性的分類以及連續屬性的迴歸。

(40)

七、ġ貝氏機率分類演算法(Naïve Bayes)

本演算法為一個可快速建立的分類演算法,很適合預測模型。

此演算法僅支援分隔 (Discrete) 或分隔式 (Discretized)屬性,如果 有提供可預測屬性,它會視所有輸入屬性為獨立屬性。

八、ġ線性迴歸演算法(Linear Regression)

本演算法為一種迴歸演算法,很適合迴歸模型。此演算法為 Microsoft 決策樹演算法的特定組態,經由停用分割取得 (整個迴歸 公式是在單一根節點中建立)。此演算法支援連續屬性的預測。

九、ġ羅吉斯迴歸演算法(Logistic Regression)

本演算法為一種迴歸演算法,很適合迴歸模型。此演算法為 Microsoft 類神經網路演算法的特定組態,經由刪除隱藏層取得。

此演算法同時支援分隔和連續屬性的預測。

(41)

第三章ġ 資料探勘技術介紹

本章將依據第二章文獻回顧中之「資料探勘」亦稱為「資料採礦」, 分析資料探勘技術其分別針對「決策樹」、「群集演算法」、「類神經網 路」、「關聯規則」、「貝氏機率分類」等五種演算法作回顧。包含各演 算法其目的、原理及方法,並探討五大方法其適用性,為本章之重點。

3.1 資料探勘

資料探勘是用來將資料中隱藏的資訊挖掘出來,所以資料探勘其 實是所謂的知識發現(Knowledge discovery)的一部份,它使用了許多統 計分析與模型化的方法,到資料中尋找有用的樣式及關聯性,這些發 現知識的過程對資料探勘的應用成功與否有決定性的影響[34]。資料探 勘是指在大量資料當中尋找隱藏知識或資訊,其中發掘之規則或相關 性都可能出乎意料,由探勘出有效知識規則亦可提供企業主管於決策 時之參考依據。

3.1.1 資料探勘步驟

資料採礦的過程會隨不同專業領域的應用,而有所變化,而每一 種資料採礦技術也會有各自的特性以及使用步驟,針對不同問題需求 所發展出的資料採礦過程也會有差異化的存在,如資料的完整程度、

專業人員支援的程度等都會對建立資料採礦過程有所影響;也因此造成 資料採礦在各不同領域間連用規劃整個流程上產生差異性,即使是同 一產業,也會因為不同分析技術結合不同涉入程度的專業知識,而產 生明顯的差異性,因此對於資料採礦過程的系統化、標準化就顯得格 外重要,如此一來不僅可以較容易跨領域應用,也可以結合不同的專

(42)

業知識,發揮資料採礦的真正精神。資料採礦完整的進行步驟如下[51]:

1. 理解資料與進行的工作

2. 獲取相關知識與技術(Acquisition)

3. 整合與查核資料(Integration and Checking) 4. 去除錯誤或不一致的資料(Data Cleaning)

5. 發展模式與假設(Mode\ and Hypothesis Development) 6. 實際資料採礦工作

7. 測試與檢核所採礦的資料(Testing and Verfication) 8. 解釋與使用資料(Interpretation and Use)

由上述步驟可看出,資料採礦牽涉了大量的準備工作與規劃過 程,事實上許多專家皆認為整套資料採礦的進行有 80%的時間精力是 花費在資料前置作業階段,其中包含資料的淨化與格式轉換甚或表格 的連結,由此可知資料探勘只是資料採礦過程中的一個步驟而已,在 進行此步驟前還有許多工作需要先完成。

3.1.2 資料探勘流程規劃

本研究針對資料採礦建模的標準 CRISP-DM,作為本研究探勘流 程規劃之準則,CRISP-DM 是 Cross-Industry Standard Process for Data Mining 的 簡 稱 , 中 文 翻 譯 為 「 資 料 採 礦 交 又 行 業 標 準 過 程 」,

CRISP-DM 是由歐洲委員會與幾家在資料採礦應用上有經驗的公司共 同籌劃組織的一個特別小組所提出,CRISP-DM 模型強調完整的資料 採礦過程,不能只針對在資料整理、資料呈現、資料分析以及建構模 式上,仍需要對企業的需求問題進行了解,以及後期對模式的評價與 模式的延伸應用都是一個完整的資料採礦過程不可或缺的要素[51]。本 研究探勘流程規劃,分別說明如下:

(43)

一、定義商業問題(Business Understanding)

此階段,本研究所設定問題為知識管理系統中所產生大量知 識案例背後所隱藏規則,若資料探勘技術適用此問題,將可使大 量知識案例轉換成有用之管理策略。

二、資料理解(Data Understanding)

此部分本研究所用資料為知識管理系統所產生之知識案例,

知識案例當中包含社群編號、案例編號、部門名稱、知識提供、

知識應用、知識加值、工技碼、日期之屬性,瞭解各個屬性之分 類,將大量資料建立成資料庫再進行資料分析。

三、資料預處理(Data Preparation)

本研究針對知識案例當中各項屬性作整合及去除雜質資料之 步驟,將各屬性差異性較大或資料不完全之部分作刪除,資料庫 當中大量資料有可能反映雜亂(Noise)、異常情況及資料不完全。

對於分析結果精確度亦可能相當差,所以資料處理將是不可或缺 之步驟。

四、建立模型(Modeling)

本研究選擇「決策樹」、「群集演算」、「類神經網路」、「關聯 規則」、「時序群集」、「時間序列」、「貝氏機率分類」、「羅吉斯迴 歸」及「線性迴歸」作為資料探勘之模式。資料探勘可依據不同 方法類型作分類、預測、推估、群集、關聯性等作分析,但每種 技術對資料有限制或要求,將於資料處理時做好轉換之動作。

(44)

五、評價和解釋(Evaluation)

透過不同分析技術所產生之探勘結果,無法每項規則都可應 用,針對有效規則需對於問題作解釋,本研究對於有效規則提出 案例工程顧問公司管理知識社群有效之策略應用。

六、實施(Do)

本研究提出改善管理知識社群之策略,可提供案例工程顧問 公司之高階主管做為參考,以及應用策略後之成效為何。皆需實 際執行才可得知成效。

3.2 決策樹

3.2.1 決策樹目的

決策樹分析應用層面較為廣泛,其主要功能是藉由已知分類的事 例來建構一樹狀結構,所產生之決策樹具有規則亦可稱為法則樹,與 類神經網路不同。規則可以用文字或數字來表達,所建立之決策樹模 型亦能利用來作預測[51]。所謂的決策樹是指一個樹狀結構,樹的中間 節點(Non-leaf nodes)代表著。代表測試的條件,樹的分支(Branches)代 表條件測試的結果,而樹的葉節點(Leaf nodes)則代表分類後所得到的 分類標記,也就是代表分類的結果。而決策樹的產生包含兩個步驟:

1.建立樹狀結構。

2.修剪樹狀結構。

一開始將所有的訓練樣本放在跟節點的位置,接著在根據所選擇 的測試條件將訓練樣本分成不同的子集合,若是分在某集合內的訓練 樣本全部都屬於同一個分類標記,便產生一個葉節點來代表這群樣本 的分類標記,結束分類動作,否則便重複選取測試條件,直到所有樣 本都可以分成屬於同一分類標記得子集合為止此時樹狀結構及建立

(45)

完。當樹狀結構建立完成後,接下來要針對所產生的決策樹進行修剪 的動作,也就是將樹狀結構當中代表雜訊或是特例的分支減掉,以避 免所產生的決策樹過渡遷就特定的資料樣本[34]。

3.2.2 決策樹分類規則與原理

當決策樹產生之後,可自決策樹採掘出分類規則,來呈現探勘所 得到的分類知識,方便在專家系統或是決策支援系統當中應用此探勘 的結果。在一株決策樹當中,從根節點到葉節點的每一條路徑,便代 表一條分類規則。以圖3.1 的本研究決策樹為例,從根節點到最左邊的 葉節點,中間所經過的分支為:知識案例為建築類以及分數小於50 分,

最後走道的葉節點為”否”,因此得到規則為:

IF 〝知識案例=建築類〞and〝分數<50〞Then 年終績效值高=否

將分類規則全部採掘出來之後,即可將分類輸出到以規則庫為基 礎的專家系統進行推理,依此分類規則將新近的資料做分類。決策樹 的修剪方法有兩種:一種是預先修剪(Prepruning),一種是事後修剪。

所謂的預先修剪指的是在發展決策樹的分支過程中進行品質量測以抑 制不當的分支發展。假若某一個節點在往下分支就會造成品質量測值 降到某一個臨界直以下,此節點即應停止分支,以避免產生過度遷就 的現象。事後修剪法則是先讓決策樹自由發展,待決策樹建立完成之 後,再將不必要或多餘的分支修剪掉,並將修剪掉的節點合併到較接 近的節點中[34]。

(46)

圖3.1 分類模型

分類法當中最有名,也是最古老的方法就是以決策樹為基礎的分 類法。因此分類數節點選擇ID3。

ID3(Itereative Dichotomiser 3),用雪南(Shannon)1949 於年所提出 的資訊理論作為選擇測試屬性的依據。資訊理論的基本概念如下:假 設 一 個 事 件 共 有 n 種 結 果 , 這 n 種 結 果 發 生 的 機 率 分 別 為 P(v1),...,P(vn),這些機率都是已知,則定義這個是件發生後所得到的資 訊量為[52]:

(3.1)

上式同時也代表以二進位方式來表達這項事件所獲得的資訊時所 需的平均位元數。

資訊獲利為假設分類標記只有 P(Positive instance,正例)和 N

(negative instance,反例)兩種;A 代表某一個屬性;X 代表屬性測試前 的樣本集合;X1,…,XV 代表屬性測試後的樣本子集合;p 代表 X 中正例 的個數,n 代表反例的個數;pi 代表 Xi 中正例的個數;ni 代表 Xi 中反例

, … , P P log P

(47)

的個數;則定義根據屬性 A 的值將 X 分為 X1,…,XV 所得到的資訊獲利 為:

,其中 (3.2)

當p,n 皆不為 0 (3.3)

,當 p 或 n 任一為 0 (3.4)

(3.5)

ID3 是使用資訊報酬(Information Gaind)作為分岔準則,但發現應 用在實際案例上,資訊報酬會偏好選擇選項數較多的變數作為分岔變 數,因此使用該分岔準則所建立出來的決策樹規則數目偏多,較容易 造成過度學習的效應。為了修正這項系統偏誤,昆蘭重新定義出「增 益比值(Gain Ratio)」的計算公式來取代原有的分岔準則,但無論是那 個版本,最根本的內容還是透過所謂的亂度(Entropy)的概念做為決策 樹的分岔準則。增益比值式如下[52]:

(3.6)

從公式來看,增益比例等於母節點與子節點的亂度差除以分岔程 度的修正量(Split Gains)。

3.2.3 決策樹流程與方法

本小節將說明資料探勘中之決策樹技術探勘的流程及方法,此小 E(A) p n

p n I p , n   Gain A I p, n E A  

I p, n p

p nlog p p n

n

p nlog p p n 

I p, n 0 

Gain ratio Entropy Entropy )/Split Gains 

(48)

節內容將針對探勘的步驟、參數的設定以及結果呈現的解釋等。

一、探勘步驟

經資料準備及資料清理後,將所處理後之資料表匯入MS-SQL Server 2005®後,並依據決策樹探勘之步驟如圖3.2 所示,進行決 策樹之探勘。

圖3.2 決策樹探勘流程

   

(49)

二、參數設定

決策樹分析是利用統計學中之機率理論原理,將樣本空間中 之資料進行分類(Classification)。經過資料屬性之選取,SQL 可自 動產生決策樹。決策樹之每一個節點為屬性值之判斷點,而分叉 後之樹枝(Branch)則發展成為另一個決策樹,並同步發展,至所有 資料皆可明確判斷區分為止。

三、探勘結果呈現的解釋

經過MS-SQL Server 2005®處理資料探勘之模型,結果如圖3.3 所示,依據探勘模型所顯示圖形可發現影響知識加值最重要的第 一層因數是知識提供,本研究將依據此種解釋方法,針對所呈現 之探勘成果作解釋。

圖 3.3 決策樹樹狀圖

(50)

3.3 群集演算法

3.3.1 群集演算法目的

從人類歷史看來,從觀察、歸納,一直到產生規則預測,正是人 類文明累積的必經流程,因此在資料採礦的技術當中,除了各位所熟 知的預測演算法之外,同時也必須能夠協助從大量的資料之中,根據 案例的相似性,從繁雜資料中歸納出有意義的群落[53]。群集演算法的 分群,以本研究為例,則根據知識案例之間的屬性資料或相關模式的

「相似性」,歸納出主要的知識案例之間的規則,而落在同一群的知識 案例只是相似性較高,並不具有預測的功能。

以下簡單歸類與整理出群集分析在資料探勘中扮演的角色,包含 以下四點[34]:

一、ġ資料精簡

將原本大量的資料加以分群成數個群集,並從每一個群集中挑 選具有代表性的資料記錄來進行後續的處理。

二、ġ推斷假設的產生

利用群集分析推斷出所關注資料中可能存在的某些特性或現 象。

三、ġ推斷假設的驗證

群集分析也可以對推斷假設作有效性的驗證。

四、ġ歸屬預測

分群結果應用於未知分類之資料記錄,預測資料所歸屬的群 集。

(51)

3.3.2 群集演算法原理

應用的目的通常決定分群法的使用。但分割式分群法只能找出類 圓形(spherical shape)和群集大小相似的群集,對於影像辨識(image recognition)應用領域而言,因需要找自然形狀(natural luster)的群集,即 肉眼可判斷出來的群集,分割式分群法就不適合;應挑選能產生任意形 狀(arbitrary shape)和任意大小(arbitrary size)的分群法,例如:運用新型改 良 過 的 階 層 式 分 群 法(hierarchical method) 或 以 密 集 度 導 向 分 群 法 (density-based method)較佳[34]。

一、ġ分割式分群法 (Partitional method)

分割式分群法在運作上試圖要將資料點歸屬到數個互不交集 的群集中,讓每一群集中的資料點與該群集之群集中心(clustering center)相似程度高於與其它群集中心,以符合所訂定之目標準則。

一般來講,假設資料集合中有n個資料點,目標準則在制訂上即是 企圖將n個資料點分配k個互不交集的群中,企圖使得每個資料距 離它所屬的群集中心的距離偏移值為最小;以最常使用的平方差公 式(square-error)為例,目標準則之距離總偏移值(total deviation)E可 以為:

(3.7)

其中,x 表示一資料點,ui 表示 Si 群集的群集中心。

二、ġ階層式分群(Hierarchical Method)

階層式分群法是一種將所要處理之資料集合的資料點,利用 聚合或分裂的方式,將彼此相以度高的較小群集合併成較大的群 集,或者將較大的群集進行分離 ,最後可以利用樹狀結構圖

E ∑ ∑ S x u 2 

(52)

(dendrogram)來表示群集間彼此關係之分群法。階層式分群法的結 果將會是一棵樹結構圖(dendrogram),它顯示出每個群集間彼此的 關係,而在相同層次(level)的群集間彼此是互相沒有交集的。

三、ġ密集度導向分群法(Density-based method)

這種類型的關鍵想法是將鄰近的資料根據資料點密集的程度 將之分成數個群集。主要的原因在於這些群集中的資料點彼此都 很緊密、密度很高,而與其他群集資料點間都很疏離、密度很低。

因此,密集度導向的分群法即利用這樣的特性,將資料集合中較 密集的資料視為一個群集,而那些密度低的資料則被視為雜訊。

運用密集度的方法不但可用來濾除偏移值或雜訊,且可對任意形 狀之群集進行分群。

3.3.3 群集演算法流程與方法

本小節將說明資料探勘中之群集分析技術探勘的流程及方法,此 小節內容將針對探勘的步驟、參數的設定以及結果呈現的解釋等。

一、ġ探勘步驟

經資料準備及資料清理後,將所處理後之資料表匯入MS-SQL Server 2005®後,並依據群集分析探勘之步驟如圖3.4所示,進行群 集分析之探勘。

(53)

圖 3.4 群集分析採礦流程

二、ġ參數設定

群集分析是一種「非監督式」之分類方法,分析者不必事先 指定鑑別之屬性值,而是提供資料中可供鑑別之所有可能屬性。

SQL Sever將自助選擇最具鑑別度之屬性,並區分出不同群集。本 研究調整演算法「支援」參數,也就是最小案例數,生成的群集 內含之案例數低於此門檻,則該群集會被刪除。

(54)

三、ġ探勘結果呈現的解釋

經過MS-SQL Server 2005®處理資料探勘之模型,結果如圖3.5 所示,依據探勘模型所顯示群集特性去作討論其資料特徵,本研 究將依據此種解釋方法,針對所呈現之探勘成果作解釋。

圖 3.5 群集特性介面

3.4 關聯規則

3.4.1 關聯規則目的

資料關聯分析是探討資料項目間的關係,找出在某一事件或是資 料中會出現的項目,也叫做關聯法則探勘。關聯規則法的優點是在於 其試圖找出多條關聯規則,而且每一條規則都可以得到一個相對應的 結論。缺點是需要花費較多時間找出多條規則,而且產生出的規則不 能夠像標準模型,好比是決策樹或是類神經網路,那樣可以用於預測 [34]。

參考文獻

相關文件

(1999), &#34;Mining Association Rules with Multiple Minimum Supports,&#34; Proceedings of ACMSIGKDD International Conference on Knowledge Discovery and Data Mining, San Diego,

But the network security, the perceive risk of online insures behaviors, the cognitive of e-life insurance products, allow them to maintain reservation about the online

“ Consumer choice behavior in online and traditional supermarkets: the effects of brand name, price, and other search attributes”, International Journal of Research in Marketing,

目前 RFID 技術已列為 21 世紀十大重要技術及各大企業熱門產業投資項 目。零售業龍頭美國沃爾瑪(Wal-Mart)百貨公司在部分的零售點,已應用無線

(03)施工架倒塌 (05)吊車傾倒 (06)開挖崩塌 (07)感電(25KV) (08)電車線設施故障 (09)號誌故障 (10)道碴污染 (11)軌道沉陷 (12)軌道偏移 (13)人員侵入淨空

This study represents the concept of balanced scorecard (BSC) with four perspectives (financial, customer, internal business processes, and learning and growth) to build the

To improve the operating performance, the companies should pay attention to critical success factors of “support and participation of employees”, “employee training and

The object of this research is the middle and small business loan customers of a commercial bank’s branches located in HsinChu and MiaoLio, first we adopt both the financial