• 沒有找到結果。

資料探勘於知識社群績效資料

在文檔中 中華大學 碩士論文 (頁 77-80)

第四章 知識社群績效資料之探勘

4.3 資料探勘於知識社群績效資料

本研究以知識加值績效量化評估系統為例,透過知識加值績效量 化評估系統所產生知識案例。目前知識管理系統當中已有 4892 個案 例,知識案例不斷的累積之下,如不將知識案例有效規劃與探勘,大 量知識案例將被埋沒。皆下來第4.3 章節將主要說明探勘分析成果,本 研究利用MS-SQL2005®資料庫軟體中之技術分別針對「決策樹」、「群 集演算法」、「類神經網路」、「關聯規則」、「貝氏機率分類」五種演算 法進行探勘技術分析及探勘結果彙整。

4.3.1 資料探勘技術選定

本研究以知識案例為樣本,因大量知識案例當中原有 4892 的案 例,經處理過後為 4850 個案例,故本研究採用 MS-SQL2005®資料庫 軟體中之技術分別針對「決策樹」、「群集演算法」、「類神經網路」、「關 聯規則」、「貝氏機率分類」五種演算法,依據各演算法之原理應用於 本研究樣本知識案例進行探勘其規則與態樣。

4.3.2 資料處理

本研究透過資料準備及資料清理將探勘資料重新作整理,以及將 知識案例重新以順序編號。

一、資料準備

本節主要整理案例取用個案工程顧問公司之知識加值績效量

化評估系統所產生知識案例,此知識案例旨在透過工作問題解決 與經驗分享所留下之案例,以及根據知識案例所提供與應用給予 等級及評分。

(一)ġ資料格式:excel 檔。

(二)ġ資料屬性:採用資料屬性共有8 個屬性進行探勘,如表 4.2 所示。

表4.2 資料屬性表

編號 屬性名稱 內容

1 社群編號 (ForumID)

社群名稱編號:

鋼構園地(1R)、鐵公機(16)、監造的藝術(1Y)、大地工程 (1P)、$精算師(1T)、棟樑(1J)、橋梁探索(1S)、水土環境 資源社群(1C)、鐵路地下話工程(11)

2 案例編號

(Index) KC 案例共 4892 個(有效案例為 4850 個)

3 部門名稱 (DeptCode)

回應部門名稱:

林口監造計畫、台中試驗室、高試營建室、大園監造、中 辦處、捷運部、營管部、大新監造、地理資訊部、授信專 案、新高監造、中和工務所、大鵬灣監造、高試環工室、

六工監造、資訊系統部、民參部、運土部、中科監造、金 工所、水環部、材料試驗部、高鐵機電環品、西濱快速、

建築部、台北試驗室、機械部、智慧運輸部、電機部、高 鐵土建工管、鐵道部、新竹試驗室、高辦處、管理部、第 一結構部、業研部、高捷計管、第二結構部、東工處、港 灣部、地工部

4 知識提供

(Kshare) 知識提供等級:低度相關、資料、資訊、知識、智慧 5 知識應用

(Kapply) 知識應用等級:無關、取得、使用、學習、貢獻 6 知識加值

(Kva) 知識案例經過評分加值之數值 7 工技碼

(TechCode) 知識案例所屬工程技術編碼 8 時間

(Time)

知識產出時間以季為單位:第一季、第二季、第三季、

第四季

二、資料清理

本研究因資料量相當大,屬性質內容範圍過大,此舉可能造 成大量雜訊(Noise),而雜訊容易使探勘結果不正確亦可能會造成 誤導探勘的結果分析。資料不一致(Data inconsistency)情況於本 研究資料當中雖有此情況,屬性質當中缺少一項或兩項以上資 料,對於最後探勘成果將造成影響,因資料內容不一致所佔比例 不高,故本研究選擇直接忽略法,避免資料不一致或遺失的情況 不致影響探勘結果。本研究針對九個社群取樣知識案例數如表4.3 所示。

表4.3 社群知識案例數量表

取 樣 數

有 效 取 樣 數

取 樣 數

有 效 取 樣 數

取 樣 數

有 效 取 樣 數

鐵公機(16) 755 726 0 0 755 726

水土環境資源社群(1C) 809 809 1067 1064 1876 1873

棟樑(1J) 77 77 34 30 111 107

精算師(1T) 125 125 57 52 182 177

大地工程(1P) 367 367 0 0 367 367

橋梁探索(1S) 224 224 111 111 335 335

鋼構園地(1R) 348 348 0 0 348 348

監造的藝術(1Y) 674 674 0 0 674 674

鐵路地下話工程(11) 118 118 126 125 244 243 合計 3497 3468 1395 1382 4892 4850

2006年 2007年 合計

年度 取樣數

社群名稱

在文檔中 中華大學 碩士論文 (頁 77-80)