國立臺灣大學工學院土木工程學系 博士論文
Department of Civil Engineering College of Engineering
National Taiwan University Doctoral Dissertation
知識地圖在營建業的導入策略與應用
The Implementation Strategy and Application of Knowledge Map for Construction Industry
李孟學
Meng-Hsueh Lee
指導教授 曾惠斌 博士
Advisor: Hui-Ping Tserng, Ph.D.
中華民國 98 年 10 月 October, 2009
國立臺灣大學土木工程系博士論文 知識地圖在營建業的導入策略與應用 李孟學 撰
980 10
誌謝
求學的過程,如果只有一個人,肯定會非常艱辛。因為老天爺給的福報,讓 我的求學過程,擁有許多同伴,為漫長的歷程增添許多快樂的回憶。
非常感謝指導教授曾惠斌老師九年來的支持與鼓勵,言行舉止、理性與感性 的傳承,成為學生最好的榜樣。感謝口試委員彭雲宏副校長、曾仁杰總務長、陳 維東老師、楊亦東老師於論文口試辛勤指導。感謝校內指導委員謝尚賢老師、荷 世平老師於論文研究中的引導。感謝營管組的教授張陸滿老師、郭斯傑老師平日 的諄諄教誨。感謝業界多位先進與前輩的協助,使知識地圖的理論架構能夠不斷 接受挑戰與成長。感謝家族裡不斷提供經驗分享的祐正學長、金龍學長、清祥學 長、文廣學長、家祝學長;還在為博士學位奮鬥的慈悲喜捨敏朝學長、工程專家 兼鐵馬達人徐大哥、研究靈感不斷的新好男人建邦、校園專家明達、空間專家立 文、繽紛亮麗紫萍、分析達人五爵、數學高手崇熙、忠厚老實的奇成、長跑好手 昌憲、音樂神童恩霓等人。最重要的是感謝陪伴在身旁的家人,貼心的韻翔、乖 巧的孟娟、每天盼望我順利畢業的爸爸、每週辛苦準備愛心水果的媽媽,家人的 關心與疼愛一直是求學中強壯的依靠。
求學的過程,如果有許多同伴,肯定會非常快樂。
1. 摘要
營建產業中充滿了眾多非結構化的文件,這些文件累積了許多隱性的工程經 驗與專業知識,要如何將隱性的經驗與知識轉換成顯性,成為營建產業知識管理 很重要的課題。知識地圖是知識管理領域應用資訊技術的一個重要工具,能夠表 示出知識與知識之間的關連,將隱性知識轉換為顯性知識,並提升知識交換與再 利用。然而,知識地圖的建立需要有完整的分類架構,訂分類架構卻需要有大量 的人力耗費,如何節省人力耗費,並在不同的條件中建構知識地圖,成為研究研 究動機。本研究的主要目的,在提出知識地圖的導入策略與應用情境,協助使用 者面對不同來源的工程文件,能自動取得延伸的關鍵詞彙與分類的資料文件。本 研究提出一套完整的知識地圖導入模式,這一個模式有四個重要的流程,包含需 求分析、分類建立、地圖展現、分享應用。配合導入模式,本研究發展不同條件 下的導入策略,除了探討導入過程會遇到的問題之外,更實際以營建產業、政府 機關、學界單位共六個案例進行情境分析,藉此協助解決營建產業所遇到的資訊 繁雜、經驗不容易傳承等問題,並達到促進潛在知識的交換與再利用。
關鍵詞:營建業、知識地圖、知識管理
Abstract
The construction industry consists of many unstructured documents, which accumulate a large volume of tacit knowledge. In the general domain, a Knowledge Map can illustrate connections of knowledge and transfer tacit knowledge to explicit knowledge, but this is unsuitable on specific domain such as construction industry. This research generalized existing mapping rules to be applied to general and specific domain; and presented a novel and practical model for implementing knowledge map.
This model comprised of four procedures, including identifying problems, establishing the classification structure, deciding the display model, and sharing knowledge map.
Furthermore, this research establishes four strategies of Knowledge Map for different senarios. Finally, this research validated the implementation of knowledge map model in six real case studies.
Keyword:Constuction Industry, Knowledge Map, Knowledge Management.
目錄
口試委員會審定書... i
誌謝 ... ii
摘要 ...iii
Abstract... iv
第一章 前言 ... 1
1.1. 研究動機與目的...1
1.2. 研究範圍與問題界定...4
1.3. 研究架構...6
1.4. 研究限制...8
1.5. 小結...9
第二章 文獻回顧... 10
2.1. 知識地圖...11
2.2. 營建產業知識地圖架構雛形...12
2.2.1. 需求分析階段...13
2.2.2. 開始導入階段...14
2.2.3. 成熟應用階段...17
2.2.4. 對內分享與創造階段...18
2.2.5. 對外動態更新與回饋階段...19
2.3. 文件相關性分析...20
2.3.1. 斷詞處理...21
2.3.2. 詞彙關聯性...22
2.3.3. 文件自動分類...22
2.4. 資訊形象化...23
2.5. 小結...25
第三章 營建知識地圖導入模式... 26
3.1. 需求分析...27
3.2. 分類建立...29
3.2.1. 步驟1 蒐集文件資料...32
3.2.2. 步驟2 斷詞、訂定關鍵字...33
3.2.3. 步驟3 詞頻計算...34
3.2.4. 步驟4 詞頻矩陣計算...35
3.2.5. 步驟5 權重轉換...35
3.2.6. 步驟6 奇異值分解...37
3.2.7. 步驟7 資料分群...39
3.2.8. 步驟8 專家審查...43
3.3. 地圖展現...43
3.4. 分享應用...47
3.4.1. 單一組織分享...47
3.4.2. 跨組織分享...48
3.5. 案例情境設計...50
3.6. 小結...52
第四章 營建知識地圖導入策略... 54
4.1.1. 導入情境一...55
4.1.2. 導入情境二...57
4.1.3. 導入情境三...58
4.2. 知識地圖導入策略...59
4.2.1. 策略一:沒有任何要素...60
4.2.2. 策略二:擁有其中任一項建立要素...60
4.2.3. 策略三:擁有其中任兩項建立要素...63
4.2.4. 策略四:擁有三項建立要素...64
4.3. 知識地圖導入策略與應用案例之探討...66
第五章 學術研究應用案例... 70
5.1. 學術研究知識地圖...71
5.1.1. 資料查詢現況...71
5.1.2. 案例資料說明...73
5.1.3. 知識地圖建立程序...74
5.1.4. 關鍵字知識地圖...79
5.1.5. 論文知識地圖...82
5.2. 網路搜尋知識地圖...85
5.2.1. 資料查詢現況...85
5.2.2. 案例資料說明...86
5.2.3. 關鍵字知識地圖...88
5.3. 小結...93
第六章 營建產業應用案例... 94
6.1. 工程技術文件知識地圖...95
6.1.1. 資料使用現況...95
6.1.2. 案例資料說明...96
6.1.3. 文件標題知識地圖...98
6.1.4. 關鍵字知識地圖...99
6.1.5. 標題與關鍵字整合之知識地圖...102
6.2. 工程專利文件知識地圖...104
6.2.1. 專利檢索現況...104
6.2.2. 案例資料說明...105
6.2.3. 專利知識地圖...106
6.2.4. 專利關鍵字知識地圖...107
6.2.5. 專利功效知識地圖...108
6.3. 小結...110
第七章 政府機關應用案例... 112
7.1. 工程案例名稱知識地圖...113
7.1.1. 案例查詢現況... 113
7.1.2. 案例資料說明... 114
7.1.3. 案例知識地圖-九種類型 ... 115
7.1.4. 案例知識地圖-位置 ... 117
7.1.5. 案例知識地圖-詞頻 ...121
7.1.6. 案例知識地圖-名稱 ...123
7.2. 工程專家知識地圖...125
7.2.1. 專家查詢現況...125
7.2.2. 案例資料說明...127
7.2.3. 專家建議知識地圖-專責單位 ...127
7.2.4. 專家建議知識地圖-詞頻 A ...130
7.2.5. 專家建議知識地圖-詞頻 B...132
7.3. 小結...135
第八章 結論與建議... 137
8.1. 結論...137
8.2. 後續研究建議...138
8.3. 對營建工程實務的貢獻...139
8.4. 對學術研究的貢獻...139
參考文獻 ... 140 附件 章節 4.3 應用案例與訪談對象彙整表
附件 章節 5.1 學術研究知識地圖
附件 章節 5.2 網路搜尋知識地圖
附件 章節 6.1 工程技術文件知識地圖
附件 章節 6.2 工程專利知識地圖
附件 章節 7.1 工程案例知識地圖
附件 章節 7.2 工程專家知識地圖
圖目錄
圖1-1 搜尋引擎使用與關鍵字的關聯圖 ...3
圖1-2 通識領域與專業領域於資料來源與資料多寡之差別示意圖 ...3
圖1-3 界定問題與研究方法之步驟 ...6
圖1-4 研究架構圖 ...7
圖2-1 營建署提供的標準知識分類範本 ...14
圖2-2 企業組織修正後分類架構示意圖 ...15
圖2-3 適合企業組織需要的動態知識地圖 ...15
圖2-4 適合企業組織需要的動態知識地圖(續) ...16
圖2-5 營建署營建知識百科示意圖 ...17
圖2-6 企業組織特有營建知識百科示意圖 ...18
圖2-7 經知識分享與創造後的企業營建知識百科示意圖 ...19
圖2-8 經對外動態回饋後的營建署與企業之營建知識地圖與百科 ...20
圖2-9 Google 之 Wonder Wheel 展示範例...24
圖2-10 Kartoo 之 3D 展現範例 ...25
圖3-1 知識地圖三個要素 ...29
圖3-2 CKIP 中文斷詞系統畫面 ...34
圖3-3 CKIP 中文斷詞系統之斷詞結果畫面 ...34
圖3-4 關鍵字分群結果 ...40
圖3-5 文件分群結果 ...41
圖3-6 關鍵字與文件分群結果 ...42
圖3-7 關鍵字分群結果(決定切割位置) ...42
圖3-8 2D 階層式地圖展示範例 ...44
圖3-9 2D 地圖展示 XY 軸範例...45
圖3-10 2D 地圖展示 TreeMap 範例...46
圖3-11 關鍵字特徵值繪製 3D 等高線圖示之範例 ...46
圖3-12 單一組織的知識地圖分享機制 ...48
圖3-13 知識地圖對外分享與創造示意圖 ...49
圖3-15 資料來源與資料量多寡示意圖 ...50
圖3-16 資料開放程度與分享程度示意圖 ...51
圖3-17 知識地圖案例關係對應資料開放程度與分享程度示意圖 ...52
圖4-1 知識地圖三個要素 ...54
圖4-2 策略一沒有任何要素 ...60
圖4-3 策略二-a 專家 ...61
圖4-4 策略二-b 分類架構...62
圖4-5 策略二-c 資料文件 ...62
圖4-6 策略三-a 專家與分類架構 ...63
圖4-7 策略三-b 擁有專家與資料文件...64
圖4-8 策略三-c 擁有分類架構與資料文件 ...64
圖4-9 策略四-a 整合三要素 ...65
圖4-10 策略四-b 探索潛在知識...65
圖4-11 知識地圖導入策略與情境分析之關聯圖 ...66
圖5-1 碩博士論文網之圖表分析 ...71
圖5-2 碩博士論文查詢校內指導委員研究成果系統畫面 ...73
圖5-3 研究趨勢原始資料示意圖 ...74
圖5-4 論文標題與關鍵字之詞頻計算統計表 ...75
圖5-5 論文摘要與關鍵字之詞頻計算統計表 ...75
圖5-6 研究趨勢詞頻轉換統計示意圖 ...76
圖5-7 關鍵字與作者的關連度計算 ...77
圖5-8 關鍵字與關鍵字之相似度分群 a ...77
圖5-9 關鍵字與關鍵字之相似度分群 b ...78
圖5-10 關鍵字與關鍵字之相似度分群 c ...78
圖5-11 關鍵字與作者之關聯圖 ...79
圖5-12 關鍵字與時間作者之關聯圖 ...79
圖5-13 關鍵字知識地圖 ...80
圖5-14 論文知識地圖 ...83
圖5-15 搜尋引擎的相關搜尋建議 ...86
圖5-17 現有分類架構關鍵字於網路搜尋結果的知識地圖 ...89
圖6-1 標題與詞彙之詞頻矩陣 ...98
圖6-2 標題與標題關聯之知識地圖 ...99
圖6-3 關鍵字與關鍵字關聯之知識地圖 ...100
圖6-4 關鍵字知識地圖 ...101
圖6-5 標題與關鍵字關聯之知識地圖 a ...103
圖6-6 標題與關鍵字關聯之知識地圖 b ...103
圖6-7 工程專利資料庫資料內容範例 ...105
圖6-8 專利知識地圖 ...107
圖6-9 專利關鍵字知識地圖 ...108
圖6-10 專利範圍與專利範圍之相似度分群 a ...109
圖6-11 專利範圍與專利範圍之相似度分群 b ...109
圖6-12 專利功效與專利功效之相似度分群 a ...109
圖6-13 專利功效與專利功效之相似度分群 b ...109
圖6-14 專利範圍與專利功效之相似度分群 b ... 110
圖6-15 專利範圍與專利功效之相似度分群 a ... 110
圖7-1 專案名稱與九種類型之詞頻矩陣 ... 116
圖7-2 專案名稱與專案名稱於九種類型之相似度分群 ... 116
圖7-3 九種類型之相似度分群 ... 117
圖7-4 專案名稱與九種類型之相似度分群 a ... 117
圖7-5 專案名稱與九種類型之相似度分群 b ... 117
圖7-6 專案名稱與不同地區之詞頻矩陣 ... 118
圖7-7 專案名稱以不同地區為基準之相似度分群 a ... 118
圖7-8 專案名稱以不同地區為基準之相似度分群 b ... 119
圖7-9 專案地區之相似度分群 a ... 119
圖7-10 專案地區之相似度分群 b ... 119
圖7-11 專案名稱與專案地區之相似度分群 a...120
圖7-12 專案名稱與專案地區之相似度分群 b ...120
圖7-13 專案名稱與專案地區之相似度分群 c ...120
圖7-15 案例名稱知識地圖 ...123
圖7-16 專案以機關單位、技師、工程管理詞彙為基礎之相似度分群 a ...128
圖7-17 專案以機關單位、技師、工程管理詞彙為基礎之相似度分群 b ...128
圖7-18 以機關單位、技師、工程管理詞彙之相似度分群 ...129
圖7-19 專案與機關單位、技師、工程管理詞彙之相似度分群 a ...129
圖7-20 專案與機關單位、技師、工程管理詞彙之相似度分群 b ...129
圖7-21 專案與機關單位、技師、工程管理詞彙之相似度分群 c ...130
圖7-22 委員建議詞彙相似度分群 ...131
圖7-23 專案編號依 委員建議詞彙為基礎之相似度分群 ...131
圖7-24 專案編號與委員建議之相似度分群 a ...132
圖7-25 專案編號與 委員建議之相似度分群 b ...132
圖7-26 專家建議知識地圖 ...133
圖7-27 專家建議知識地圖子分類 ...134
表目錄
表2-1 知識分類與知識型態之應用程度一覽表 ...13
表3-1 知識地圖之建立要素與類型 ...32
表3-2 分類建立之步驟與命名 ...32
表3-3 論文資料編號與名稱 ...33
表3-4 關鍵字範例 ...35
表3-5 詞頻矩陣範例 ...35
表3-6 經過權重轉換之詞頻矩陣 ...37
表3-7 經過奇異值分解後之詞頻矩陣(1)...38
表3-8 經過奇異值分解後之詞頻矩陣(2)...38
表3-9 經過奇異值分解後之詞頻矩陣(3)...38
表3-10 由奇異值轉換轉換為詞頻矩陣(K=5) ...39
表3-11 關鍵字與關鍵字相關性矩陣 ...40
表3-12 文件與文件相關性矩陣 ...41
表3-13 關鍵字特徵值之範例 ...44
表3-14 關鍵字特徵值之範例 ...44
表3-15 關鍵字特徵值之範例 ...46
表4-1 知識地圖導入情境一 ...55
表4-2 知識地圖導入情境二 ...57
表4-3 知識地圖導入情境三 ...58
表4-4 知識地圖建立策略示意圖 ...59
表4-5 六個案例之資料來源與文件、文字數量比較表 ...68
表4-6 六個案例之原有分類架構與驗證方式 ...68
表5-1 碩博士論文查詢的現況 ...72
表5-2 分析資料項目說明 ...73
表5-3 曾惠斌教授研究領域關鍵字知識地圖分類表 ...81
表5-4 曾惠斌教授研究領域論文知識地圖分類表 ...84
表5-5 搜尋引擎查詢的現況 ...85
表5-7 現有的營建管理分類架構(國立台灣大學嚴慶齡工業發展基金會 2004)
...87
表5-8 分析資料項目說明 ...88
表5-9 現有分類架構關鍵字於網路搜尋結果的分類結果 ...89
表5-10 現有分類架構與網頁關鍵字知識分類的比較表 ...91
表5-11 現有分類架構在網頁內容沒有出現的分類內容 ...92
表6-1 資料使用的現況 ...95
表6-2 27 篇橋梁維護技術文件之標題 ...96
表6-3 27 篇橋梁維護技術文件之斷詞結果 ...97
表6-4 關鍵字分類表 ...102
表6-5 專利檢索的現況 ...104
表6-6 建築預鑄專利內容斷詞範例 ...106
表7-1 工程案例查詢現況 ... 113
表7-2 人工比對所需時間估算 ... 114
表7-3 九種類型之範例與次數分配 ... 115
表7-4 案例知識地圖分類表 ...122
表7-5 案例名稱知識地圖分類表 ...124
表7-6 工程案例專家學者分類現況 ...126
表7-7 第 1 類道路工程與運輸規劃專家之專長 ...126
表7-8 營建管理相關的單位、技師、管理要素等 30 個詞彙範例 ...128
表7-9 出現頻率最高的 30 個詞彙範例 ...130
表7-10 專家建議知識地圖分類表 ...134
表7-11 專家建議知識地圖子分類表 ...135
1. 第一章 前言
1.1. 研究動機與目的 1.2. 研究範圍與問題界定 1.3. 研究架構
1.4. 研究限制 1.5. 小結
知識地圖是知識管理領域研究中相當重要的一個分支,無論是教育界、產業 界中的資訊科技業、營造產業,皆希望能夠透過知識地圖來改善資訊過剩的情況
(Horwitch 2002)。由於資訊產業發展的技術,適用一般通識領域,不易應用到 營建產業,成為本研究的研究動機。本研究的主要目的,在提出知識地圖的導入 策略與應用情境,協助使用者面對不同來源的工程文件,能自動取得延伸的關鍵 詞彙與分類的資料文件。研究架構提出建構本研究的六個層次,說明每一個特色 與重點,最後再提出研究限制。
1.1. 研究動機與目的
有關知識管理在技術上的發展與應用,主要的研究是著重於資訊檢索、資訊 淬取之技術,無論有沒有藉由關鍵字或同義詞庫的輔助、知識本體論的建立
(Pandit 2007),主要的目的在於修正或創新演算法,以達到從大量繁複的文件 中,取得一個共通的特性,並且找出文件與文件之間的關係,或者是文件與關鍵 詞的關係(Lin and Hsueh 2006)。
然而在營造產業中的相關文獻,曾經探討不同分類方式的正確率與回收率;
比較在文件與文件之間建立不同的索引點關係,進而連結彼此之間的關連;透過 知識管理系統的建立,串聯各工地與公司之間的知識流動(Tserng 2004);藉由
概念的描述,說明動態知識地圖的架構與應用方式等等(Woo 2004),對知識地 圖詳細的建立機制與應用機制並沒有深入的研究。
雖然知識地圖能夠提升教育學習、知識取得、知識再利用等的效益(Gartner Group 1999),但大部分的研究仍停留在通識領域,對於不同的專業領域,如土 木營建之相關研究非常有限。如何將專家經驗中、歷史文件中的非結構化的隱性 知識,轉化為結構化的顯性知識,成為本文初始的研究動機。
工程人員遇到問題時,常會直接請教專家、或是透過網路搜尋引擎、公司內 部的全文檢索系統、資料庫系統等進行檢索,藉由檢索結果協助解決工程上的問 題。直接請教專家往往是最快的解決辦法,但專家們常會忙碌於更重要的事物,
沒有太多的時間為每一位有問題的工程師進行解答,因此就需要仰賴其他的資訊 系統作為輔助。目前常用的資訊系統包含網路上的搜尋引擎,以及公司內部的全 文檢索系統、或資料庫系統等等(Hung 2005)。工程人員在使用搜尋引擎、或全 文檢索系統時,經常發生搜尋出數百萬筆的資料,如果要一篇篇瀏覽網路資料,
會太耗費時間和精神,因此,如何有效整理搜尋結果,成為一個很重要的課題。
以目前營建公司外部有不同的搜尋引擎(如Google1,Yahoo2等)、內部有全 文檢索系統、資料庫、甚至是學術研究單位的資料庫為例(Lee and Hong 2003),
使用者使用關鍵字搜尋時,往往只能找到包含該關鍵字的文件,如圖1-1 搜尋引 擎使用與關鍵字的關聯圖,雖然很有效率,但是常發生兩個使用上的問題:(1) 不知道還有哪些與第一個關鍵字相關的字詞,(2)搜尋出來的文件太多,需要經 過人工閱讀才能瞭解文件中的分類。
1
Google、Yahoo等搜尋引擎 公司全文檢索系統、資料庫
使用者 使用者
不包含關鍵字 但與該關鍵字有關聯 的文件
不包含關鍵字 但與該關鍵字有關聯 的文件
關鍵字
包含關鍵字的文件
關鍵字 使用者
包含關鍵字的文件
使用者 知識地圖
知識地圖 知識地圖知識地圖
圖1-1 搜尋引擎使用與關鍵字的關聯圖
為了解決上述問題,資訊技術領域的研究,發展了許多資訊檢索、自動摘要、
自動分類等技術,然而這些技術與工具,以通識領域為對象,需要分析與測試的 資料數量相當龐大、資料來源也以外部網路資料為主。倘若需要處理不同專業領 域的資料,如土木營建業的資料,需要分析與測試的資料數量從數十篇至數百 篇、資料來源除了外部網路資料之外,更包含企業內部組織的資料,請參考圖 1-2。
外部網路資料 內部組織資料
資料量多
資料量少
搜 尋 引 擎
新聞資料
工程技術報告
工程專利技術 工程查核記錄
工程專案文件 搜 尋 引 擎
新聞資料
工程技術報告
工程專利技術 工程查核記錄
工程專案文件
通識領域 專業領域
圖1-2 通識領域與專業領域於資料來源與資料多寡之差別示意圖
由於不同專業領域相關的特殊詞彙或專有名詞,常造成斷詞系統的錯誤(中 文斷詞系統2009),所以紛紛有學者提出以知識本體論(Pandit 2007, Tserng 2009, 林顯堂 2009)建立詞彙之間的關聯,以彌補斷詞系統的不足。然而建立本體論
2009)。因此,如何減少專家投入的時間,讓建立本體論的前置作業能自動建立 詞彙之間的關聯,成為本研究最關心的課題。
本研究的主要目的,在提出知識地圖的導入策略與應用情境,協助使用者面 對不同來源的工程文件,能自動取得延伸的關鍵詞彙與分類的資料文件。
1.2. 研究範圍與問題界定
本研究以界定問題、研究方法與步驟,說明研究範圍,請參考圖1-3 所示。
首先是界定問題,土木營建產業之中,資訊搜尋與利用的情況,發生了幾個問題。
工程專案每天都在進行,不但會遇到各式各樣不同的問題,也會遭遇相同的 問題,如何將這些問題,分享給其他的工程專案,成為知識管理很重要的一個議 題。傳統的方式,是工程師一點一滴累積隱性工程經驗,進而轉化為不同的顯性 知識或報告書,累積與轉化的方式不外乎:參與眾多的工程專案、閱覽眾多的資 料文件、請益眾多的專家與學者等等。本研究將上述的過程,歸納為三點,第一 是眾多的參與、第二是眾多的閱覽、第三是眾多的請益。
其中,眾多的參與,需要長時間累積,以及工作機會的遭遇。雖然工程界常 常遇到類似的工程專案,但也常有不同的工程專案,一般的工程師,並沒有那麼 多的時間累積經驗,也沒有那麼多機會參與眾多工程專案。
其次,眾多的閱覽,非常耗費時間。工程師常常擁有龐大、雜亂未經整理的 資料,除了花費閱覽的時間,更需花費整理的時間。
最後是眾多的請益,雖然很多問題可以透過請益具有專業經驗的專家、學 者、資深工程師,然而這些請益,需要擁有廣大的人際脈絡,還需要專家們有時 間能夠抽空解答問題。
為了要處理上述累積與轉化的狀況,知識管理的概念漸漸被應用至實際的工 程專案。學者們提出導入知識管理、文件管理、知識社群、甚至是知識管理系統 這些概念,皆希望能夠解決知識再用與經驗傳承的問題。然而知識管理導入與系 統建立,需要耗費龐大的人力、物力、時間,因此本研究提出知識地圖導入策略 與應用,透過系統化的流程,減少整理龐雜資料的時間,協助建立詞彙之間的關 聯,促進知識再用與經驗傳承。針對前述經驗轉化所面臨到的問題,本研究提出 對應的解決對策。
第一,眾多的參與:本研究提出以現有的工程文件為基礎,透過語意分析的 方法,淬取詞彙間不同的概念,改善新進工程師無法參與眾多工程專案的先天缺 失。
第二,眾多的瀏覽:為了節省人工瀏覽的時間,本研究提出知識地圖的架構,
經過詞頻的計算,分析工程文件進行,找出文件之中的群聚關係,改善人工閱覽 與人工分群沒有統一的原則、及非常耗時的缺失。
第三,眾多的請益:為了避免眾多的請益,本研究以專家的歷史建議文件為 例,藉由語意分析方法,分析文件與工程專案之間的關聯,找出專案之間的相似 程度,進而分享不同的解決方法,以促進歷史文件再利用。
研究方法與步驟 界定問題
隱性知識保存在專家經驗中 不容易轉為顯性知識
隱性知識轉為顯性知識的來源 未經整理的資料/詞彙過於繁雜 不容易了解資料之間的關連 不容易了解詞彙之間的關連 不容易判斷資料與詞彙之間的關聯
缺乏建立結構化架構的機制
需求分析 定義問題與延伸關鍵字
分類建立 資料來源判斷 潛在語意分析 關鍵字建立 資料與關鍵字之詞頻計算
奇異值分解 資料分群 專家訪談
缺乏分享的機制 分享應用
單一組織與跨組織分享
缺乏結構化的展現機制 視覺化展現
1D、2D、3D
圖1-3 界定問題與研究方法之步驟
本研究提出的系統化過程,針對上述不同的問題,提出不同的解決對策,個 別對應為四個研究方法與步驟。
1.需求分析→訂定需要解決的問題,延伸與問題相關的關鍵字。
2.分類建立→確定資料來源與分析的焦點,以詞頻計算、語意分析、群集分 析、統計檢定等技術,減少工程師彙整資料的時間,並協助訂定分類架構,減少 專家學者制訂分類架構的時間。
3.視覺化展現→透過視覺化展現複雜的關聯,協助使用者瀏覽知識的結構。
4.分享應用→從單一組織的分享,延伸至跨組織的分享,讓知識不斷再利用。
1.3. 研究架構
本研究的主要架構分為六個層次,首先是建立研究動機與目的,發現營建產 業於應用的現況,並找出相關研究遇到的瓶頸。
第二是研究範圍界定與問題定義,界定知識地圖導入模式所要解決的議題,
以及相關的研究限制。
主要核心內容在於第三層「營建知識地圖導入模式」,包含需求分析、分類 建立、地圖展現、分享應用,其中以分類建立最為關鍵,從蒐集文件資料、斷詞 與訂定關鍵字、詞頻計算、詞頻矩陣計算、權重轉換、奇異值分解、資料分群、
至專家審查共包含八個步驟。
第四是營建知識地圖的導入策略,將知識地圖所遇到的問題與解決的方案,
以導入策略的方式進行分析,協助不同的組織建構所需的知識地圖。
第五個層次是將模式導入到營建產業、政府機構、學術單位共六個案例,從顯性 知識至隱性知識的資料來源,建構所需要的知識地圖。
最後是結論與建議,包含本研究對營建產業實務與學術研究的貢獻,並且指 出未來研究建議。
圖1-4 研究架構圖 文 獻 回 顧 第 2 章
產、官、學界案例情境分析 第 5、6、7 章 結論與建議 第 8 章
營建知識地圖導入策略 第 4 章 需求分析
第 3.1 節
地圖展現 第 3.3 節 分類建立
第 3.2 節
分享應用
第 3.4 節 回饋與修正 研究範圍與問題界定 第 1.2 節
定義研究動機與目的 第 1.1 節
1.4. 研究限制
本研究主要提出一套系統化的營建知識地圖導入模式,建構過程中所應用到 的斷詞系統與斷詞策略,以及延伸之斷詞技術、斷詞效益等議題,並不在本研究 的主要範圍。
無論是網路搜尋結果所產生的短篇文章,或是工程專利範圍等比較長篇的文 章,本研究皆有進行分析與測試。但主要的測試範例,仍以短篇文章為主,至於 長篇與短篇文章的分類效益,會受到文章長度的不同、內容集中度、關鍵字選取、
演算法特性等等之影響,這些影響的分析與比較,並不在本研究探討的範圍之內。
針對長篇文章的分類,本研究建議拆解成數篇短篇的文章,至於每一篇文章 以多少字為限,拆解的方式,可以參考OntoPassage 方法,以知識本體協助擷取 文件段落,提升特定領域文件檢索之效能(林顯堂,2009)。
有關地圖的展現,無論是1D 條列式、2D(XY 座標、階層架構)、3D 等高 線(XYZ 座標),應依照不同的使用需求,選擇展現結果。但不論是哪一種的呈 現方式,在展現方式背後的文件關連、辭彙關連、或者是文件與辭彙的關連,才 是建構知識地圖的重要核心,至於還有哪些知識地圖的展現方式,或者是有什麼 最佳的展現方式,則不在本研究範圍之內。
本研究和Google 的差異,在於排序結果 Google 主要以使用者閱讀網頁的情 況、以及網頁連結的情況作為計算的依據。目的在找出最多人瀏覽、最多網頁連 結的內容。但前提是,使用者知道要輸入哪些查詢的關鍵字,但使用者如果無法 正確輸入比較正確、或是與正確辭彙相關連的字彙,將很難找到真正需要的網頁 /文件。此外,Google 雖然能提供很多搜尋的結果,但是因為上述的排序原則,
Google 是希望排序在前面的內容就能夠讓使用者找到答案。但是如果排序在前 面的網頁,找不到需要的答案時,可能有下列幾個原因:
原因 1,Google 有搜尋到使用者想知道的答案,但因為 Google 搜尋的內容 比較廣泛,所以答案散落在不同的網頁內容之中,或是沒有列到排序比較前面的 網頁。
說明:Google「李孟學」3,排序在最前面的,並不是本研究的作者,而是 其他同名同姓的人。一直要瀏覽到第三頁,大約第二十幾筆的資料,才能得到本 文作者的訊息。
原因2,Google 沒有搜尋到使用者想知道的答案,可能是使用者輸入錯誤的 關鍵字,或者是沒有輸入到比較精確的關鍵字,所以搜尋不到所需的答案。
說明:尋找莫拉克颱風重建委員會,如果使用Google 搜尋八八水災委員會,
將找不到莫拉克颱風重建委員會這一個官方網站
本研究的分群方式,主要以網頁/文件的內容分析、以字彙的詞頻作為計算 依據。目的不在於如何排出優先順序,而是以一個辭彙,對搜尋後得到的網頁/
文件,進行斷詞與分群,進而獲得其他延伸與其他相關的辭彙。
1.5. 小結
本研究主要目的,在提出知識地圖的導入策略與應用情境,協助使用者面對 不同來源的工程文件,能自動取得延伸的關鍵詞彙與分類的資料文件。首先提出 研究動機,其次是提出完整的研究架構,以及相關的研究限制。第二章,將從文 獻回顧的角度,回顧國內外研究於知識地圖的現況與發展,並指出建立知識地圖 所需的核心概念與資訊技術,以作為營建知識導入模式的重要基礎。
2. 第二章 文獻回顧
2.1. 知識地圖
2.2. 營建產業知識地圖架構雛形 2.2.1. 需求分析階段
2.2.2. 開始導入階段 2.2.3. 成熟應用階段
2.2.4. 對內分享與創造階段 2.2.5. 對外動態更新與回饋階段 2.3. 文件相關性分析
2.3.1. 斷詞處理 2.3.2. 詞彙關聯性 2.3.3. 文件自動分類 2.4. 資訊形象化 2.5. 小結
營建產業中充滿了眾多非結構化的文件,這些文件累積了許多隱性的工程經 驗與專業知識,要如何將隱性的經驗與知識轉換成顯性,成為營建產業知識管理 很重要的研究(Gabrielaitis 2006, Lin 2006, Lin 2008)。
知識管理的領域被歸納為技術學派、經濟學派與行為學派(Earl 2001),其 中技術學派的著重於訓技術的創新與應用,經濟學派著重開發知識資產的經濟價 值(Goh 2006),行為學派著重於激發創造、分享、與應用知識的行為。
然而,技術學派之中,又細分為系統學派、工程學派、地圖學派。系統學派 的目的在於利用電腦技術,協助擷取、儲存、組織知識,並處理特定領域的知識。
以土木領域的文獻為例,如建立資訊檢索測試文件集,以分析文件特徵,建立特 定領域之知識本體論,以實驗驗證的方式,進而建立一個特定領域的應用系統(林 顯堂,2009)。發展以營建領域的專業知識,協助網路上產品資訊的方法。而工 程學派的特色在工作過程中提供共享資料庫,並由知識管理的原則尋求最佳化的 運作方式,以達到強化組織內部知識流通的核心能力(Lin and Soibelman 2006)。
藉由大規模的調查方式,發展以知識流程為核心且適用於營建產業特性的模型,
此外,更以本體論為基礎,實際導入營造廠之風險管理,進而促進知識的有效累 積與再利用(Tserng 2009)。至於地圖學派,焦點在於取得知識,紀錄與呈現成 員的專長目錄,下一節,將詳細回顧地圖學派方面的相關文獻。
2.1. 知識地圖
從 90 年代,知識地圖的概念就已經在教育界的研究被提出來,並指出知識 地圖是一種將文字轉換成結構化的技術,並且能表示目標主題的資訊(O’Donnell 1993, 1994)。使用者並且能透過知識地圖指出資料、資訊之間的架構與關連,找 到所需要的知識。知識地圖之作用在於有效找到知識來源、提供知識資產的資 訊、協助管理外顯的知識。知識地圖指的是專家、知識資產、知識資源、知識架 構或知識應用的地理代表圖。知識地圖可以提升知識分部的能見度,且支援專家 或知識來源的確認,促使知識使用者將新的知識,歸類到相關的類別裡,並促使 工作任務、專家、知識資產等相互連結(Lin and Hsueh 2006)。
知識地圖能呈現出企業內部組織成員的工作能力與實務工作經驗的分佈知 識地圖也能建立文件與文件之間的關連(Yang 2003, Srinivasan 1996, Xu and Ibrahim 2004),提升教學的效率(O'Donnell 1994, 1995),讓使用者能夠更容易 的找到資料庫中的資訊(Pyo 2005),促進知識的轉移(Meziane 2004, Rezgui 2006)。知識地圖也能呈現企業員工使用網際網路搜尋網路知識的分佈情況。知 識地圖除了能表達組織中的誰擁有知識之外,也能表達出知識物件與物件之間的 關係(Gordon 2000)。使用者並且能透過知識地圖指出資料、資訊之間的架構與 關連,找到所需要的知識(Lin, Wang and Tserng 2006, Pyo 2005)。
知識地圖的應用相當廣泛,應用的領域包含了法律(Yang 2003)、醫學
(Srinivasan 1996)、教育(O'Donnell 1994, 1995)、旅遊業(Pyo 2005) 、資訊工 程(Xu and Ibrahim 2004)、甚至是土木工程(Rezgui 2006)。
國內外對於知識地圖的應用仍在發展階段,尤其在營建相關領域中更少,以 下針對知識地圖的相關研究進行回顧。整合工程文件管理、專案管理及公司資料 之間的關係(Chan 2004),並指出未來的相關研究,應該著重於建立工程資料、
文件以及工程作業流程之間的連結(Hajjar 2000)。提出知識地圖的概念,並指 出藉由知識地圖的應用,促進組織間知識的建立,提升工作績效(Woo 2004)。
建立不同領域的分類架構、針對工程相關的專業進行分類,並且開發協同設計、
整合工程作業項目與歷史資料的知識管理系統(El-Diraby 2005)。
2.2. 營建產業知識地圖架構雛形
由於土木營建產業,屬於非常仰賴工程經驗與專業技術,許多的經驗充滿在 隱性的工程專案以及非結構化的文件之中(Gabrielaitis 2006, Lin 2006, Lin 2008),因此欲來越多的研究提出知識管理的理念,協助知識的傳承與再利用
(Majchrzak 2004, Tan 2007)。其中營建產業知識地圖的概念提出於 2004 年,但 是該研究僅提出知識地圖的概念(Woo 2004),並沒有實際建構知識地圖。實際 建構知識地圖架構雛形的研究,是營建署的一個研究計畫(國立台灣大學嚴慶齡 工業發展基金會,2005),針對知識地圖的架構,提出了知識分類與知識型態兩 個內容,並依知識管理應用程度的需求分析、開始導入、成熟應用、分享與創造、
動態更新與回饋等五個階段,共包含九大步驟,如表2-2 所示。
知識分類的內容中,主要包含分類架構與知識地圖,分類架構依據該研究報 告成果,歸納為三個軸向的分類架構,分為工程技術、工程應用、工程生命週期,
而知識地圖的概念,是屬於小型的分類架構,適合由圖形展示的方法呈現不同的 知識分類。知識型態這一個內容,主要是知識百科,該研究提出的定義,是類似
百科全書的概念,能彙整包羅萬象的知識,因此稱為知識百科。針對不同的知識 管理應用程度,以及不同的知識內容所建構的九大步驟,分別依照知識管理的五 個階段進行說明。
表2-1 知識分類與知識型態之應用程度一覽表
知識管理 應用程度
知識分類 知識型態
分類架構 知識地圖 知識百科
需求分析 Step 1
開始導入 Step 2 Step 3 Step 4
成熟應用 Step 5
分享與創造
(對內) Step 6
動態更新與回饋
(對外) Step 9 Step 8 Step 7 知識管理
應用程度
知識分類 知識型態
分類架構 知識地圖 知識百科
需求分析 Step 1
開始導入 Step 2 Step 3 Step 4
成熟應用 Step 5
分享與創造
(對內) Step 6
動態更新與回饋
(對外) Step 9 Step 8 Step 7
運 輸 水 資 源 建 築生
命生 態 結 大構 材地 環料 境 工 程 測 量
生 命 週 期 軸 規劃 設計 施工 管理
(國立台灣大學嚴慶齡工業發展基金會,2005)
2.2.1. 需求分析階段
步驟一(Step 1),調查導入知識管理的組織內部所需的知識分類架構,並下 載營建署所提供的標準知識分類範本,以工程專業技術(營建企業管理)為例,
一共分為十個分類,包含組織管理、人事管理、業務管理、經營策略、招標發包、
備標與投標管理、財務與會計、成本、企業流程再造、爭議處理等,詳圖2-1 所 示。營建產業界的組織,無論是營造廠、建設公司、建築師事務所等等,皆可以 參考這一個營建企業管理的架構,作為文件分類的依據,並依據組織內部不同的 部門分工、不同的企業文化等需求進行調整。
圖2-1 營建署提供的標準知識分類範本
2.2.2. 開始導入階段
步驟二(Step 2),開始導入知識地圖,乃是將所營建署提供的分類範本,下 載到組織內部,並配合組織內部所應用到的分類情形,修正屬於為該組織特有的 分類架構,以建築師事務所為例,該事務所除了需要營建企業內部的組織管理、
業務管理、招標發包、備標與投標管理、成本、爭議處理之外,尚需工程應用的 建築、防災、生態、政策管理、制度法規以及生命週期內的規劃、設計、招標等 等之分類架構,作為真正適合該建築師事務所的知識分類基礎,詳圖2-2 所示。
圖2-2 企業組織修正後分類架構示意圖
步驟三(Step 3),延續上一個步驟,組織修正所需的分類架構後,需要選擇 適合組織內部各個部門所需要的動知識地圖,詳圖2-3 及圖 2-4 所示。該二圖範 例代表著不同部門所需的不同知識地圖,例如,業務部門,該部門應用的範圍較 偏重於政策法規,則可選擇以爭議處理、政策管理、制度法規、設計等架構的知 識地圖;除此之外,設計規劃部門,可選擇規劃、設計、招標等分支,為該部門 專屬的知識地圖。
圖2-3 適合企業組織需要的動態知識地圖
圖2-4 適合企業組織需要的動態知識地圖(續)
步驟四(Step 4),依上一個步驟所訂定分類架構,作為導入資料文件的重要 基礎,初步規劃以營建署所提供的知識百科,內容包含該研究案所蒐集彙整的公 開文件、研究報告、期刊文章等,以及其他組織提供下載與使用的資料文件,作 為組織外的知識來源。如圖2-5 所示,代表使用知識地圖的組織,需要與規劃、
設計、招標等作業流程相關的知識百科,例如規劃階段類別之中,下載了工程師 的工作時間模式與實證、營建工程師時間規劃等論文研究,為該組織的主要外部 知識來源。
圖2-5 營建署營建知識百科示意圖
2.2.3. 成熟應用階段
發展到步驟五(Step 5),進入成熟應用階段。該階段代表著該組織除了下載 外部的資料來源之外,公司內部的工程文件、技術報告、法令規章等資料文件,
經過分類與處理,轉換至知識地圖的分類架構之中,並且擁有屬於組織內部私人 的知識百科,詳圖2-6 所示。該圖範例說明除了 Step 4 的下載營建署所提供的外 部知識百科外,尚有屬於公司內部獨有的知識百科,如規劃類別中,擁有的報告 包含基地現況、鄰近土地利用現況、地質調查報告、鑽探報告等等,然而法令規 章中,則有政府採購法、營造業法、建築法、促參法、技師法、建築師法等等。
圖2-6 企業組織特有營建知識百科示意圖
2.2.4. 對內分享與創造階段
當單一知識地圖經過成熟應用之後,就發展至步驟六(Step 6),對內分享與 創造階段。將營建署所提供的外部知識百科,與公司內部原有的知識文件整合 後,更重要的就是與內部其他部門的成員一同分享,或者是經由特定的知識社 群、知識團隊進行使用與維護。無論是內部的分享,或社群成員創造出更新的知 識文件,皆能回饋至組織的知識地圖之中,詳圖2-7 所示。該圖範例說明除了透 過營建署或者是公司內部所蒐集彙整而來的知識百科之外,更可以透過知識社群 的營運進行過程,進行知識百科的建置。
圖2-7 經知識分享與創造後的企業營建知識百科示意圖
2.2.5. 對外動態更新與回饋階段
步驟七(Step 7)從對內分享與創造,進一步延伸至對外的更新與回饋階段。
組織內部將可以對外公開的資訊,透過對外動態更新的機制,將公司內部建立完 備的知識百科,分享給其他同業組織或同業工會,進一步更正錯誤的訊息、及更 新最新的資訊,藉由分享來減少蒐集資訊的成本。
步驟八(Step 8),將公司內部已經修改的知識地圖,回饋給營建署當作參考 範例,讓其他的公司組織能夠作為導入知識地圖的參考,讓知識地圖達到知識再 利用,提高應用效益。
步驟九(Step 9),除了回饋容易展現成果的知識地圖之外,進而對營建署所
更貼近土木營建產業的實務需求,或者是迫切需求,並且藉由營建署的共享機 制,提供給同業公司應用的重要參考依據。(詳圖2-8 所示)
知識分類架構
運 輸
水 資 源
建 築
生 命
生 態 結
大構
材地
料 環 境 工 程 測 量
生 命 週 期 軸
規劃
設計
施工
管理
知識地圖
回饋與貢獻 知識百科
圖2-8 經對外動態回饋後的營建署與企業之營建知識地圖與百科
2.3. 文件相關性分析
文件分析的目的主要是整合結構化與非結構化文件,常應用的技術有文件探 勘、資訊檢索(Ong 2005)。文件探勘是近年來興起的一個文件分析的研究課題,
其主要定義為「從非結構性的文字或半結構性的文件中發掘出有用或是有趣的片 段、模型、方向、趨勢或規則」。文件探勘的文獻中,常結合資訊檢索,試圖從 文件中找出重要的項目或片語、項目間的關聯強度或分類和推論規則。其目的能 有效率地從大量文字性資料中整理出有用的資訊。
資訊檢索的研究,主要是著重於文件的分類,目前的檢索研究主要有透過詞 庫進行索引、不用透過詞庫進行索引、藉由機率及統計的概念計算文件與文件之 間的關係、或藉由將不同的文件轉換為空間向量的模型,進而計算彼此之間的相
似度等等。雖然有越來越進步的演算法可以提升分類的正確率與回收率,但文獻 中皆指出,要對不同專業領域的文件進行分類,最好能夠透過該領域的詞庫加以 輔助,才能達到事半功倍的效果 (Caldas 2002, Ong 2005)。
土木相關的領域雖然有研究進行資訊檢索相關的研究,但大多僅侷限於改善 演算法用以提升文件分類的正確率與回復率,目前尚未有透過詞庫協助文件的分 類,主要的原因在於詞庫的建立過於繁複龐雜,需要長時間的累積與眾多專家學 者的經驗累積,方能建立一套完整健全的詞庫。詞庫的建立,屬於斷詞處理的一 種方法,相關的處理方式,請參考下一個小節。
2.3.1. 斷詞處理
中文斷詞的處理方法,大致上可分為統計法、詞庫法、語法分析法、及概念 分析四種。統計法,需要蒐集一定數量的文件構成一個大的語料庫,再由字彙的 組成趨向,統計、學習與發現詞彙的界限。詞庫法,採用詞庫法必須預先蒐集常 用的詞彙,以建立一個有效詞詞庫,並以此詞庫所收錄的字詞與文件中的字組逐 步比對,以分辨文件內何種字組排列於中文使用上具有意義,並排除不具意義字 組出現的可能。語法分析法,需分析詞彙的辭類及排列方式,歸納出常見的排列 規則後,再依此文法規則對文件內容斷詞。概念分析,是從語意的角度對文件進 行斷詞,故對於各辭彙的意義必須詳加定義(曾元顯 1997)。
處理不同領域的文件時,由於不同專業領域相關的特殊詞彙或專有名詞,常 造成分詞系統產生錯誤,擴充專業領域的辭典、加強詞彙的搜集,是解決這個問 題最有效的方法(中文斷詞系統2009)。
2.3.2. 詞彙關聯性
詞彙關聯性的建立方式分為人工解析、自動化解析與自然語言處理等三種方 式。人工解析方式非常依賴領域專家建置詞彙間相關性之詞庫,如建立知識本體 論架構(Tserng 2009, 林顯堂 2009),建置過程非常耗時、且認定結果因人而異、
一致性不高。而以自動化解析方式建置相關性詞庫,優點是快速與節省人力,可 以達到有效率地建置各領域之相關性詞庫。自然語言處理方式乃是以自然語言解 析技術處理詞彙歧義、模糊不清的情況,透過文件內容分析、句法剖析,使詞彙 間之語意關係層次能獲得解析。
2.3.3. 文件自動分類
文件自動分類的目的,就是要將文件依照某些特徵,分類到我們預先定義好 的類別。常見的分類演算法是KNN(K Nearest Neighbors),SVM(Support Vector Machine),以及 TFIDF (Term Frequency Inverse Document Frequency)(Salton 1983, Caldas 2002, 曾元顯 2002)。
狹義的文件分類是根據文件的內容,透過自然語言的處理,自動指派到預先 定義好的類別。廣義的文件分類,乃是無論透過任何形式,只要將文件自動分類 的工作,如根據作者、語言、出版社等等。影響文件主題分類成效之因素,可分 成特徵選擇、特徵詞彙刪減、前置摘要處理、分類器選擇、分類架構、文件標示 原則、類別選擇、分類不一致、訓練資料量、成效評估方式、參數調整、分類器 的最大成效等12 項因素(曾元顯 2002)。
以往的文件分類研究大多注重於以紙本文件為主、以人工方式進行分類。而 隨著網際網路時代蓬勃發展,大量資訊相對增加,許多學者提出「文件自動分類」
的觀念,亦即透過資訊檢索、資料探勘等技術所建立之分類模型,將一篇新的文 件進行自動文件分類,由系統決定此文件類別,大幅降低人力耗費。
2.4. 資訊形象化
資訊形象化是利用電腦技術的支援,將摘要以視覺化之呈現方式描述對數據 的認知。然而,知識地圖就是資訊形象化的一種展示,為展現知識地圖所表達之 知識。目前應用資訊形象化的領域有搜尋引擎,如 Kartoo,財務金融,如 SmartMoney 等。經由文獻回顧及檢視現有的知識管理商業軟體後,歸納出下列 數種主要型態之知識地圖:檔案總管型、思考管理型、網狀地圖型、星狀地圖型、
點狀地圖型、條列地圖型、等高線地圖型(國立台灣大學嚴慶齡工業發展基金會 2005, Ong 2005, Lee 2004) 。
資訊形象化的技術包含Tree Map、Mind Map、…等等,人工的方式則是以 流程圖的呈現最為常見。其中的展現型態分為 one-dimensional space(1D)、
two-dimensional space(2D)、three-dimensional space(3D)(Ong 2005, Lee 2004)。
1D 排序的原則:最常使用的形象化展現方式,一次僅能表示一個維度內的 關係,維度與維度之間的關係,大多以英文字母的順序排列,展現的範例有:檔 案總管型、心智地圖型、條列狀型、Yahoo、Google。以 Google 瀏覽器為例,主 要的排序方式是Page Rank 技術,利用網頁與網頁間連結關係來評定網頁等級,
並藉此決定搜尋結果的排序(Brin and Page 1998)。除了 Page Rank 這種利用網 頁之間的連結作為排序原則之外,也可以藉由時間(文章發表的順序)、空間(發 表人所在的位置)、相似度(文章彼此之間的關連)等作為排序原則。
2D 的展現型態,屬於較為新穎的資訊化展現方式,一次能表達兩個維度的 關係,維度與維度之間的關係,大多以維度間的數量來表示,維度內的數量越多 者,所展現的形體就越大,有的以矩形、圓形、圓住狀的型態等,展現的範例有:
地圖、TreeMap(Brain 1991)、Vivisimo。同時以兩個排序原則當作展現依據,
就需要以二維空間作為表達的方式,例如Google Wonder wheel,同時以相關連 的詞彙加上Page Rank 的方式表達;Google Timeline,同時以文章發表的時間與 Page Rank 表達。
3D 等高線圖,最為新穎的資訊化展現方式,一次能表達三個維度的關係,
維度與維度之間除了形體外,更以距離的方式展現,甚至是顏色的方式表現,展 現的範例有:等高線地圖、TreeMap、螺旋地圖、Kartoo。
圖2-9 Google 之 Wonder Wheel 展示範例
圖2-10 Kartoo 之 3D 展現範例
2.5. 小結
經過本章節的回顧,可初步瞭解知識地圖於知識管理的定位,以及知識地圖 在不同領域的研究成果。除此之外,本研究更引用國內發展的營建產業知識地圖 架構雛形,詳述建立知識地圖的初步輪廓,並指出建立知識地圖的相關技術,包 含文件相關性分析、斷詞、詞彙關聯性、文件自動分類、資訊形象化等。然而,
相關的技術需要耗費大量的人力資源,並且缺乏系統化的分類與經驗傳承方式,
不同的領域亦需要額外的調整,因此,本研究提出以營建知識地圖導入模式,經 由統計分析與系統化的作業流程,節省文件分析過程中所需的大量人力,達到知 識再利用的目的。
3. 第三章 營建知識地圖導入模式
3.1. 需求分析 3.2. 分類建立
3.2.1. 步驟 1 蒐集文件資料 3.2.2. 步驟 2 斷詞、訂定關鍵字 3.2.3. 步驟 3 詞頻計算
3.2.4. 步驟 4 詞頻矩陣計算 3.2.5. 步驟 5 權重轉換 3.2.6. 步驟 6 奇異值分解 3.2.7. 步驟 7 資料分群 3.2.8. 步驟 8 專家審查 3.3. 地圖展現
3.4. 分享應用
3.4.1. 單一組織分享 3.4.2. 跨組織分享 3.5. 案例情境設計 3.6. 小結
營造產業中的相關文獻,曾經探討不同分類方式的正確率與回收率(Caldas 2002);探討在文件與文件之間建立不同的索引點關係,進而連結彼此之間的關 連(Hajjar 2000);透過知識管理系統的建立,串聯各工地與公司之間的知識流 動;藉由概念的描述,說明動態知識地圖的架構與應用方式等等(Woo 2004),
對知識地圖詳細的建立機制與應用機制並沒有深入的研究。
僅有以專案為主的知識地圖研究(Lin 2005),若是專案以外的知識,例如 各部門例行作業所需的知識、或特殊的工程專案知識,則無法直接參考與使用。
除此之外,現有的知識地圖研究,雖然有討論地圖如何建立,然而大多是以質化 的方式建立。另外,雖然有資訊技術的應用知識地圖於新聞文件中,然而因為營 建業充滿著不同來源的資料文件,因此不容易將知識地圖的概念,實際應用在營 建業之中。此外,直接經由專家訂定知識地圖,雖然能建構龐大且完整的架構,
但在蒐集相對應的資料文件、以及如何將資料文件分類至架構之中,依然是需要
仰賴人工的判斷(國立台灣大學嚴慶齡工業發展基金會 2004)。因此,如何減少 專家投入的時間,自動建立知識地圖,藉此協助使用者面對不同來源的工程文 件,自動取得延伸的關鍵詞彙與分類的資料文件,成為本研究最大的特色。
於第1.2 小節中,本研究針對不同的問題,提出不同的解決對策,分別呼應 四個研究方法與步驟。詳述如下:
1.需求分析→訂定需要解決的問題,延伸與問題相關的關鍵字。
2.分類建立→確定資料來源與分析的焦點,以詞頻計算、語意分析、群集分 析、統計檢定等技術,減少工程師彙整資料的時間,並協助訂定分類架構,減少 專家學者制訂分類架構的時間。
3.視覺化展現→透過視覺化展現複雜的關聯,協助使用者瀏覽知識的結構。
4 分享應用→從單一組織的分享,延伸至跨組織的分享,讓知識不斷再利用。
3.1. 需求分析
建立知識地圖的第一個階段,要確認知識的需求。以工程顧問公司的角色為 例,需要的知識經驗包含案例之可行性分析、基本調查、成本概估規劃、初步設 計、細部設計等。以營造廠為例,需要對案例有基本調查、備標、投標、施工、
監造、變更設計等工地專案管理的經驗。不同的組織,有不同的狀況及不同的需 求,不是所有的問題都能由知識地圖來解決。也不是所有的隱性知識,都能透過 知識地圖的導入,轉化成顯性知識。
本研究對「隱性知識轉化為顯性知識」的範圍,定義為將既有的資料文件,
經過系統化的分析方法,分析資料文件間、與詞彙間關聯,並由圖像化的方式呈
現。其中既有的資料文件,文件內容以文字資料為主,數值資料的分析與處理,
並不包含在本研究的範圍之內。
然而,探討資料間關聯的目的,在於協助新進及資淺工程師,找到所需的資 料。工程專案的執行過程中,累積了許多的專案文件,無論是會議記錄、工作日 誌、調查報告、技術報告等等,都是專案執行過程中相當重要的紀錄,有經驗的 工程師,瞭解這些文件中的整體輪廓,遇到問題時,知道如何找到這些資料。沒 有經驗的工程師,不瞭解這些文件的整體輪廓,遇到問題時,在無法快速吸收資 料,找到相關資訊的情況下,只能請教有經驗的工程師。
探討詞彙間關聯的目的,在於協助使用者,取得與問題相關聯的詞彙。除了 工程專案累積的內部文件外,網路上更充滿著各式各樣的外部文件,例如一般民 眾所使用的入口網站、論壇、討論區、搜尋引擎,屬於廣泛、通俗、易懂的資訊;
以及大專研究生所查詢的碩博士論文網,技術工程師檢索的專利資料庫等,屬於 專業、技術、深入的資訊。有經驗的網路重度使用者、專家、資深工程師,為在 短時間內,輸入與問題直接相關的關鍵詞彙,取得所需的、有用的資料;但沒有 經驗的使用者,僅會輸入與問題相關的一般詞彙,因此要花費時間,一筆筆尋找 埋沒在無用資訊中的、有用資料。
知識分享與經驗傳承的問題,常發生在工程專案執行的過程,企業部門的例 行作業流程,以及教育訓練人才培育的過程(Abudayyeh 2004, Cardoso 2006)。
因此建構地圖的第一個步驟是需要先瞭解解決的問題是什麼,屬於企業部門間問 題,工程專案間問題,或是工作小組間問題。
界定問題的來源之後,方能分析問題可能發生的原因,進一步尋找出解決問 題的方案。倘若是企業內部門間問題,能夠透過內部的部門主管進行問題的分 析;若是工程專案的問題,除了尋找企業內部的專案主管之外,同時要尋找共同 參與工程專案的外部專家;若是工作小組間問題,則是尋找經驗豐富的資深工程
師。透過專家來進行問題分析與解決對策的擬定,找到對的專家,方能有效的解 決所遇到的問題,並且判斷該問題是否已經是廣為流傳的顯性知識,或是僅保存 在少數專家腦中的隱性知識。若是顯性知識,就需要探討企業內的知識分享機 制,所示隱性知識,則需要透過知識地圖的建立,轉化為顯性知識。確定知識地 圖所要解決的問題,即能確切瞭解知識地圖的使用者、進而發展至知識地圖之建 立。
3.2. 分類建立
根據營建知識管理系統-建構營建產業知識地圖分類架構及知識交流標準研 究成果顯示,知識地圖的建立流程,需要先建立一群具有高度專業背景的專家委 員,成員包含了資深的教授、企業界的領導者、公家機關的資深管理者等等(國 立台灣大學嚴慶齡工業發展基金會,2004)。進而由專家委員,訂定出產業需要 的知識分類架構,該研究建立了三個構面的類別,分別是工程技術構面包含營建 管理、建築及都市計畫、環境工程、結構工程、大地工程、測量工程、水利及河 海工程、交通工程等八個小組;工程生命週期構面包含規劃、設計、施工、管理、
永續經營等問題;以及工程應用構面,包含建築、水資源、運輸等。最後再由專 家委員所建立的研究團隊,一一匯集所需的資料文件,用以完成整個營建產業的 知識地圖。本研究依據上述的流程,本研究將知識地圖歸納為三個要素。分別是 專家、分類架構、資料文件。
資料文件 分類架構
專家
資料文件 分類架構
專家
專家,指產官學界中具有豐富工程專案實務經驗、或學術理論經驗的人。
分類架構,指將廣泛、龐雜的知識進行分類,透過分類架構,讓使用者能夠 依循分類了解知識的輪廓,進一步找到所需的知識。重要的參考分類架構包含 OCCS、The BS6100、The bcXML、The OmniClas、The Construction Industry Classification Structure in Taiwan(CICS)、The Unified Classification for the Construction Industry (UniClass) (Caldas 2002, El-Diraby 2005, Rezgui 2006, Lin 2005),不論是要利用哪一種分類架構為基礎,各組織所建立的分類架構,皆需 要依據所要解決的問題需求進行調整,方能滿足使用者的實際需求。
資料文件,指知識地圖中最底層,包含經過彙整的報告書,以及尚未整理的 原始資訊。資料文件是建構知識地圖時所需要的顯性文件,由顯性的、龐大的、
繁瑣的文件,透過文件搜尋與檢索來探索隱性的、系統的知識。建立資料文件包 含三個重點,第一個是知識文件的資料來源、第二個是知識文件的檔案型態,第 三個是檔案結構。
資料來源包含組織內部與組織外部。組織內部是指由建立知識地圖的組織,
自己所擁有的知識文件,多為個人、部門所提供。組織外部指從組織外部所取得 的文件,取得來源多為同業組織、或學術研究機構、或網際網路。
檔案型態包含了實體紙本、電子檔案、網頁檔案等。實體紙本,主要是電腦 資訊技術尚未普及時所建立的文件,由於數量較少、而且多為特定的專業領域,
因此文件的分類與彙整多需透過特定領域的專家來執行,並且需要透過人力一份 一份閱讀與解析,方能判斷文件中的隱性知識;電子檔案、網頁檔案,由於資訊 技術的普及,導致數量非常龐大,除了特定領域的資料文件外,更有一般大眾的 通識資訊,因此多透過資訊技術等自動化的處理方式進行研究。無論是哪一種檔 案型態,針對營建領域的檔案內容,主要包含了圖說、設計規範、變更設計、時 程、品質控制報告、其他(Hajjar 2000, Tserng 2004, Caldas 2002)。
檔案結構包含結構化與非結構化的文件。結構化指的是文件中含有標籤語 言,例如XML 文件等。非結構化指的是組成文件的文字屬於沒有結構化,文字 間的關連就像黑盒子一般,如電子郵件、網頁文件等沒有詮釋資訊的文字。結構 化的文件往往能夠透過資訊檢索的技術,對文件進行解析與探索,進而發掘文件 中的隱性關連;非結構化的文件往往需要透過人工的閱讀進行分析,或透過半人 工、半自動的方式分階段分析,方能挖掘文件彼此之間的關係。
本研究將建立分類的三個要素,依據不同要素的排列組合,歸納為七種類 型,詳表3-1 所示。
類型1 由專家直接建立知識地圖:專家以人工的方式,依據經驗法則或參考 歷史案例的方式,直接對所需要解決的問題繪製知識地圖,如解決問題的作業流 程圖、分工結構圖等。
類型2 僅有分類架構的知識地圖:直接參考既有的分類架構,僅由分類架構 瞭解問題的範圍以及相關的概念。例如OCCS、營建知識地圖分類架構等。
類型3 以資料文件建立知識地圖:可藉由人工分類、或機器的協助,分析資 料文件中的關聯,依據文件內容的特性建立所需的知識地圖。
類型4 分類架構搭配資料文件:由藉由人工判斷、或機器的協助,整合分類 架構與資料文件,建立所需的知識地圖。
類型 5 專家搭配分類架構:由專家搭配分類架構,專家可以參考既有的分 類,彌補專家自行建立分類架構的疏漏,把制訂地圖的重點,集中在提出解決問 題的對策,除此之外,亦能聚焦既有的分類架構,避免分類過於廣泛而沒有深入 問題的需求。
類型6 專家搭配資料文件:由專家判斷資料文件,對資料文件進行分群,建 立所需的知識地圖。
類型7 專家、分類架構、資料文件互相整合:三種層次的整合,能夠截長補 短,補足單一層次及兩個層次組合的不足,讓知識地圖更加完善。
表3-1 知識地圖之建立要素與類型 類
型
說明 專
家 分 類 架 構
資 料 文 件
1 由專家的經驗法則來建立知識地圖。 ○
2 只有架構沒有的知識地圖。 ○
3 以資料文件直接建立知識地圖 ○
4 分類架構搭配資料文件 ○ ○
5 由專家訂定、修正分類架構 ○ ○
6 專家搭配資料文件 ○ ○
7 專家、分類架構、資料文件互相整合 ○ ○ ○ 雖然分類建立的要素中,以類型 7 最為完善,但因為需要專家長時間的投 入、人工分類需要大量閱讀的人力與時間、自動分類的在特定領域容易發生異常 的分類,執行方式很不容易。因此本研究提出一套建構知識地圖的分類方法,協 助類型7 的進行,減少人力的耗費、統一分類的原則。
表3-2 分類建立之步驟與命名 編號 步驟命名
步驟1 蒐集文件資料 步驟2 斷詞、訂定關鍵字 步驟3 詞頻計算
步驟4 計算詞頻矩陣 步驟5 權重轉換 步驟6 奇異值分解
Singular Value Decomposition 步驟7 資料分群
Cluster Analysis 步驟8 專家審查
3.2.1. 步驟 1 蒐集文件資料
無論資料來源是組織內部的專案資料或組織外的網路資料,知識地圖的分類 最重要的是蒐集文件。例如組織內的專案資料,可以從專案執行過程中的會議記 錄、工作日誌、施工日報等,建立工程專案的知識地圖;網路資料為例,可以從