• 沒有找到結果。

利用知識關聯圖達到外顯知識分享之研究

N/A
N/A
Protected

Academic year: 2021

Share "利用知識關聯圖達到外顯知識分享之研究"

Copied!
8
0
0

加載中.... (立即查看全文)

全文

(1)利用知識關聯圖達到外顯知識分享之研究 謝盛文. 陳道輝. 陳年興. 國立中山大學資訊管理學系. 國立中山大學資訊管理學系. 國立中山大學資訊管理學系. onyxhsw@cc.nsysu.edu.tw. dhchen@elearning.edu.tw. nschen@cc.nsysu.edu.tw. 摘要 近年來由於網際網路的蓬勃發展,使得資 訊的來源不但越來越豐富且更加的多樣化,但 正因資料過多導致資訊整合不易,這樣不僅不 能進行整體而有系統的知識分享,而且容易造 成學習者更大的負擔。因此近年來透過知識關 聯圖提供相關的知識字詞與知識字詞間的關 聯,使其瞭解相關知識字詞的關聯性,將可以 有效的降低學習迷失現象與避免資訊超載以 達成知識分享的相關研究越來越多,然而可以 發現在建立知識關聯圖的過程中,存在兩個問 題,一個是分析的內容不足且關聯程度缺乏統 一的衡量標準;另外是研究人員往往只能依靠 人工或者半自動的方法對於研究主題進行編 碼與分類。因此本研究針對上述二點提出新的 解決方式,本研究將修改之前研究者的作法, 除了以利用論文之標題、關鍵字與關鍵字出現 之頻率外,本研究將利用論文中的摘要內容建 立知識關鍵字之間的關聯強度及相關知識關 鍵字的關聯相似度。最後依據關聯強度與關聯 相似度,實作自動化建立知識關聯圖的系統。. 者在網際網路或多媒體等學習環境中,學習者 對其學習的位置與方向失去概念的一種傾 向,大致可分為「不知道下一步要去哪裡」 、 「知 道要去哪裡,但不知怎麼到達」 、 「不知道現在 自己的位置」三種(陳明溥、莊良寶,1999)。 迷失對學習效果有相當重要的影響,因為學習 者在學習的過程中會在繁多的資訊中尋找答 案,但對其所學習的知識字詞沒有一個整體的 概念,往往會迷失在探索的過程中,而偏離原 先的主題,自然會對學習造成嚴重的阻礙。此 外,迷失會造成學習者產生不安的感覺,容易 造成學習者對學習歷程的沮喪,進而對學習內 容產生恐懼感、降低學習意願,甚至不願意學 習(陳明溥、嚴榮泉,2001)。所以如何運用 系統化的方式,協助使用者更快、更有效率的 從大量網路資源中獲得真正所需的資訊與知 識,與及時的提供學習者相關的知識字詞與知 識字詞間的關聯,使其瞭解相關知識字詞的關 聯性,將可以有效的降低學習迷失現象與避免 資訊超載,以達到有效的知識分享。. 關鍵詞:知識關聯圖、外顯知識、資料挖掘、 知識分享、資訊管理. 一、研究背景與動機. 圖一、以資料探勘為研究主題之知識關聯圖. 近年來由於網際網路的蓬勃發展,使得資 訊的來源不但越來越豐富且更加的多樣化。使 用者在現今網路環境中,往往可以透過各種線 上資料庫或搜尋引擎的協助,取得大量的資訊 以獲取知識。然而,大量的資訊往往會造成資 訊超載,資訊超載是指在網際網路的學習環境 中,有著大量且豐富的資訊,能夠提供學習者 豐富資的料,但資料過多將導致資訊整合不 易。因為學習者在網際網路上蒐集資料時,得 到的往往是片段而零散的資料,所接受的資訊 遠超過學習者所能吸收的程度,這樣不僅不能 取得整體而有系統的知識,而且容易造成學習 者更大的負擔。且過多片段而零散的資訊,更 往往會造成使用者的迷失,導致使用者要花更 多的心力進行閱讀與整合。所謂迷失是指學習. 然而為了更明確的界定本研究知識分享 的範圍,我們必須對於知識的本質有更深入的 了解,學者 Alavi&Leidner(2001)建議透過 四種知識的特性來了解知識,包含知識能顯現 的清楚程度、儲存的單位、現象的瞭解以及實 務的運用。由於本研究的目的在於運用系統化 的方式,有效率的從大量網路資源中獲得真正 所需的知識,並提供學習者相關的知識字詞與 知識字詞間的關聯,以有效的降低學習迷失現 象與避免資訊超載。因此以知識能顯現的清楚 程度而言,本研究是屬於『外顯知識(Explicit knowledge)』(Nonaka,1994)。對於儲存的單 位而言,本研究是屬於『可編碼的知識』。對 於現象的瞭解則著重於『關係性的知識』。實 務的運用則可以用來做為『設計藍圖』 (林東.

(2) 清,2002)。對於此種利用可編碼的外顯知識 並強調關係性所形成的設計圖,稱之為知識關 聯圖,圖一是以資料探勘為主之研究主題的知 識關聯圖。由於知識關聯圖的產生可以有效的 降低學習迷失現象與避免資訊超載,以達到有 效的知識分享。因此近年來學術界有相當多針 對知識關聯圖的相關研究(Schultze、Leidner, 2002;He、Hui,2002;謝武星,2000;楊存 一,2001;張家華,2001;陳年興、孫振凱, 2002;王惠嘉,張毓倫,2002;李律品,2002)。 其中國內大部分的研究都將全國博碩士論文 網(http://datas.ncl.edu.tw)的相關資料視為可編 碼的知識(例如:論文之標題、關鍵字、引用 文獻內容等),來探討相關知識也就是關鍵字 的關係性。然而這樣的研究僅限於分析論文之 標題、引用文獻內容(謝武星,2000),或是僅 分析論文關鍵字共同出現之頻率(陳年興、孫 振凱,2002),可能稍嫌不足;而且這些分析 活動往往需要藉由大量的研究人員或是利用 半自動的方法對於研究主題進行編碼與分類 (王惠嘉,張毓倫,2002;楊存一,2001)。且 進行編碼的過程中由於缺乏各項研究主題之 間關聯程度的統一衡量標準,研究人員往往只 能依靠自身的判斷,或是透過閱讀非常大量的 文獻來了解研究主題之關聯程度。在這樣受限 制的情況下,使得研究人員在建置知識關聯圖 的過程中,除了造成非常大的不便外,更可能 無法建立正確的知識關聯圖。 整合上述問題,可以發現在建立知識關聯 圖的過程中,存在兩個問題,第一個是分析的 內容不足,且關聯程度缺乏統一的衡量標準; 第二是研究人員往往只能依靠人工或者半自 動的方法對於研究主題進行編碼與分類。因此 本研究針對上述二點提出新的解決方式,本研 究將修改之前研究者的作法,除了以利用論文 之標題、關鍵字與關鍵字出現之頻率外,本研 究將利用論文中的摘要內容,這是因為學術論 文的撰寫,除了論文本文之外,尚包括其他的 論文資訊,如摘要、關鍵字等內容。其中最能 代表整篇論文的研究主題的便是論文的關鍵 字與摘要。在選擇關鍵字時,作者往往會根據 論文之題目與研究範圍,使用最精簡的詞彙來 描述研究的主題;同樣的,在撰寫摘要時,作 者也會根據論文的內容與成果,在最短的篇幅 內寫出研究的成果為何。因此,研究人員在閱 讀學術論文時,必定會先檢視關鍵字與摘要的 部分,以期迅速了解該學術論文的研究主題與 大致內容,並作為接下來閱讀論文本文的輔 助;而由於論文摘要與關鍵字的重要性極高, 又可代表整篇論文的研究內容,取得也較容 易,因此,欲針對學術論文進行各項知識管理 活動時,若從論文的摘要與關鍵字著手,將可 收事半功倍的效果。所以本研究將透過計算知. 識關鍵字出現於摘要位置與兩兩知識關鍵字 於摘要的相對距離,從中擷取出知識與知識之 間的相關距離,並藉由相關距離的分析,建立 知識關鍵字之間的關聯強度及相關知識關鍵 字的關聯相似度。最後由於關聯強度與關聯相 似度的建立,將可使得系統依據關聯強度與關 聯相似度,自動化建立知識關聯圖。. 二、相關文獻 (一) 知識的分類 學者 Alavi&Leidner(2001)將知識作以 下幾種不同的分類,並建議以此來了解知識的 特性,包含知識能顯現的清楚程度、儲存的單 位、現象的瞭解以及實務的運用。知識能顯現 的清楚程度,Nonaka(1994)首先將知識分為內 隱知識與外顯知識。外顯知識其定義是指可用 文字、數字、圖形或其他象徵物(Symbol)來清 楚表達(如手冊、書本、程式)的知識,是可定 義、可擷取的知識,而且溝通容易。內隱知識 其定義是指高度個人化,難以正式化只可意 會,而且深植在個人的經驗、判斷、價值、潛 意識與心智模式。 儲存的單位,根據 Blackler 將知識分成五 個層次(林東清,2002),分別是內含於員工的 觀念型知識、內含於員工的經驗型知識)、內 含於組織文化的知識、內含於組織運作的知 識、可編碼的知識。內含於員工的觀念型知識 是指內含於員工的腦海裡和潛意識裡,例如一 些觀念化、抽象化、直覺式的知識。內含於員 工的經驗型知識是屬於員工的,例如透過邊做 邊學的訓練及練習。內含於組織文化的知識是 指組織內含有優良文化、共識和價值觀,這些 東西是員工帶不走而內含在組織裡,例如優良 的團隊精神、忠誠度高等等。內含於組織運作 的知識是指內含於例行的作業流程或人際社 會間的互動關係,例如有效率的生產線、有效 率的顧客服務等。可編碼的知識,這是知識的 最外層的部分,是由文字、數字等資訊來傳 達、顯示的知識,例如書、系統手冊、視聽教 材等等。由於本研究的的來源是全國博碩士論 文網其本是就非常類似手冊或者書本,因此全 國博碩士論文網的知識能顯現的清楚程度是 屬於外顯知識,且儲存的單位是屬於可編碼的 知識。現象的瞭解,由於 knowledge 是由 know 所發展出來,因此可將知識視為一種對於問題 的知曉能力,對於現象的瞭解與問題的知曉能 力一般可以從 5 個 W 的思考(林東清,2002)。 分別是描述性知識(Know-what)、程序性知識 (Know-how)、因果性知識(Know-why)、情境 性 知 識 (Know-when) 與 關 係 性 知 識 (Know-with)。由於本研究的目的在於瞭解知.

(3) 識與知識之間關聯的程度,所以本研究對於現 象的瞭解是屬於關係性知識。實務運用方面的 分類,這種分類主要是針對組織經營有價值的 知識,以其不同存在方式與相關性分類,這種 分類法可將企業內的知識歸內為企業流程、經 營模式、科技架構、分析報告、專案經驗、企 業架構、專利權、軟體程式、經驗、最佳實務、 工作計劃、專案與設計藍圖等(林東清,2002)。 由於本研究最後會將研究主題之間的關聯強 度與關聯相似度呈現給使用者,提供新進研究 人員或是初次接觸學術領域的學生一個參考 的指標與引導方向,並透過知識關聯圖的呈 現,將學術領域相關的知識以概念節點及連結 關係來加以呈現,因此實務運用方面是屬於設 計藍圖。對於此種利用可編碼的外顯知識並強 調關係性所形成的設計圖,稱之為知識關聯 圖,下面將介紹知識關聯圖的相關研究。 (二) 知識關聯圖的相關研究 目前國內外學界所對於對學術界的知識 管理,均有提出許多作法。其中 Schultze & Leidner(2002)將六本資訊管理領域最富盛名 的期刊中,94 篇關於知識管理的論文或文章 選出,並且利用人工編碼與分類,將這些文章 分為四個類別,分別為 Normative Discourse、 Interpretive Discourse 、 Critical Discourse 與 Dialogic Discourse,並且對未來知識管理的研 究提出建議與看法。He & Hui(2002)將 1987 至 1997 年關於資訊擷取的 1466 篇期刊論文中 的引用文獻取出,進行作者共同引用文獻之分 析,並且利用分群技術及多變量分析等方式, 建立資訊擷取技術領域的作者群組,並且可以 讓使用者快速了解與某作者相近領域之作者 與期刊文章。謝武星(2000)應用了特徵擷取、 中文字詞分析、統計及演算等方法,針對中文 學術論文的參考文獻及標題進行分析,透過專 業詞彙資料庫與虛字符號資料庫的建立,擷取 最適合描述論文研究主題的詞彙;並以中文文 獻及字詞的資訊化處理此研究主題的論文為 例,建立系統以驗證其所提出的作法,也達到 了良好的效果。張家華(2001)透過文獻調查 法與內容分析法,針對資訊管理研究所的學位 論文所援用之理論進行分析,以了解台灣資訊 管理學界領域近三年的研究重點與各個學校 的發展方向;並透過前述資訊,建構國內資訊 管理學界的知識地圖,期望對於未來研究者在 搜尋文獻資料時有一個良好的方向。。這些研 究的出現,顯示目前針對知識關聯圖的相關研 究有日益增多的趨勢。李律品(2002)將國外 著名之資訊管理領域期刊之內容,針對作者、 學校、標題、關鍵字等欄位加以編碼,將資訊 管理領域之期刊論文加以分類,並以系統化的 方式描繪資訊管理領域的研究發展歷程,並且. 依研究者研究議題的差異,進行資訊管理研究 生態演化之分析。陳年興與孫振凱(2002)透 過網際網路上搜尋引擎的功能,針對全國碩博 士資訊網進行關鍵字詞的擷取,並分析關鍵字 詞出現在網頁上的關聯,建構網際網路上的知 識分佈圖,以輔助線上教學,讓學習者探索網 際網路上的資料時能夠更有效率,避免學習者 發生認知迷失與資訊超載的情況。楊存一 (2002)利用類神經網路之自適應共振理論網 路,對資訊管理的碩博士論文進行分類,並進 行關鍵議題的找尋及排名,以了解國內資訊管 理學界關鍵議題之發展趨勢,同時讓研究者了 解過去該議題被研究的情況。但目前關於博碩 士論文資料的研究,僅限於分析論文之標題、 引用文獻內容,或是僅分析論文關鍵字共同出 現之頻率,而不考慮關鍵字出現位置;或是需 透過人力對論文內容或研究方法進行編碼,無 法達成自動化擷取、分類的功能。由於目前的 相關研究,均有其不足之處,本研究希望能改 進之前的作法,分析論文關鍵字在摘要之中出 現的位置,以建立關鍵字之間的關聯強度與關 聯相似度。. 三、系統設計與實作 首先,為了分析研究主題之間的關聯性, 本研究提出了兩個衡量指標:關聯強度與關聯 相似度,這兩個指標均是從論文內容所產生。 接下來本研究將實作系統,首先透過自動擷取 與分析程式,將網際網路上之資訊相關領域 (包含資訊管理、資訊工程、資訊科學等)的學 位論文資料進行分析與擷取。之後運用這兩個 指標,根據論文內容中的摘要與關鍵字,計算 研究主題與其他研究主題之關聯強度與關聯 相似度,讓使用者了解兩研究主題之間的關聯 性,並且以網頁的方式將最後計算結果呈現給 使用者。最後,本研究將評估本研究所提出之 關聯強度與其他關聯計算方法之不同,同時, 根據計算出來的關聯強度與關聯相似度,依照 不同年度、不同來源、不同學校等分類結果, 探討研究主題之間的關聯性為何,並對結果提 出分析以及評估,以描述主題之關聯性。 (一) 研究主題關聯衡量指標的三個基本原則 由於本研究所提出之衡量指標是根據論 文內容計算而來,因此本節將先簡介學術論文 的內容格式,並且根據論文內容與格式,提出 本研究之基本原則。最後再根據基本原則,提 出本研究之衡量指標:關聯強度與關聯相似 度。由於學術論文在撰寫上均具有一定之格 式,以符合學術界的要求。以博碩士學位論文 為例,通常包含以下的內容,在將論文送交國 家圖書館典藏時,也必須附上以下的資訊,供.

(4) 建檔及往後查詢使用:論文題目、作者、指導 教授、學年度、學校、系所名稱、中英文摘要、 關鍵字、目錄、論文本文、參考文獻、附錄等。 而在這些內容與資訊中,除了論文本文與論文 題目之外,以「摘要」與「關鍵字」最能代表 一篇論文之研究主題。相較於論文本文,「摘 要」與「關鍵字」內容均非常簡短,在極短的 時間內即可閱讀完畢;而研究者在閱讀論文 時,也經常藉由閱讀論文之摘要與關鍵字,快 速的了解論文的大致內容,如方法、流程、結 果等,以決定是否要對論文本文詳加閱讀。因 此,若要針對學位論文進行知識管理,可以藉 由分析論文內容中最能代表論文研究主題的 「關鍵字」與「摘要」來進行。所以,本研究 也將針對論文中之「關鍵字」與「摘要」兩個 必備內容進行分析與處理,論文中提出之衡量 指標也由這兩個內容發展而來。由於論文作者 在選擇關鍵字時,會選擇與該論文研究最相關 的詞彙,如研究的方向、使用到的理論基礎、 進行研究的方法等;而作者會選擇這些關鍵 字,代表在這些關鍵字之間,必定存在著研究 上的關係,作者才會將這些關鍵字同時放在一 篇論文的關鍵字中。因此本研究提出以下兩項 原則:一篇論文的每個關鍵字均代表著論文的 研究主題之一、一篇論文的每個研究主題,兩 兩之間必定有研究上的意涵存在。根據這兩項 原則,本研究便可以依照這些假設了解哪些研 究主題之間具有關聯性存在,並依此計算兩者 之關聯強度與關聯相似度。此外,由於中文文 法的特性,通常在寫作或是日常對話中,兩個 名詞若在文字中的距離越接近,且如果此種關 係出現的次數相當頻繁的話,則兩者的關係也 會越強烈。因此,本研究提出第三項原則:整 體而言若兩個名詞之間的平均距離越近,則兩 者的關聯性也越高。以圖二為例,網際網路與 資訊科技兩名詞之間的距離為 72 個字,而網 際網路與再仲介化之距離為 92 個字。由於網 際網路與資訊科技的距離較再仲介化為近,且 如果說存在這樣關係的文章越多,則本研究認 為網際網路與資訊科技之關聯性,比網際網路 與再仲介化來的高。根據前述三項原則,本研 究提出衡量兩研究主題關聯性之指標,分別為 「關聯強度」與「關聯相似度」,前者可衡量 研究主題之直接關聯性,後者則可衡量研究主 題之間接關聯性。. 圖二、距離越近的兩名詞,其關聯性也越高 (二) 關聯強度(R) 陳俊彰(2001)曾提出聯繫強度衡量方 法,計算兩位老師之間的關係強度,以建構教 師社會網路圖,如公式 1。本研究乃根據此衡. 量方法,經過修正之後提出兩研究主題之間的 關聯強度計算公式,以衡量兩研究主題之間的 直接關聯性。修正之後的公式如下(2),接下來 將對本研究所提出之公式做詳細的說明。 強度 = [∑ (關係強度分數 × 關係發生頻率)]× 關係發生類別. R (k 1, k 2 ) =. 1. (norm(avg _ dist ))2. × norm(count ) × type. (1). ..(2). R = 兩研究主題之關聯強度 , norm = 標準化函數 avg_dist = 兩研究主題在論文摘要 中之平均距離 count = 出現頻率, type = 出現類型. 本研究之關聯強度計算公式乃由聯繫強 度衡量方法修正而來,原公式中之關係強度分 數即為兩研究主題在摘要中之平均距離,而關 係發生頻率為本關聯在摘要中的出現頻率,關 係發生類別則為本關聯出現類型。根據本研究 之第二項原則,一篇論文的每個研究主題,兩 兩之間必定有研究上的意涵存在,因此若兩研 究主題不曾同時出現在一篇論文中,則表示兩 研究主題沒有研究上的意義存在,因而兩研究 主題將沒有關聯強度值;而根據本研究之第三 項假設,兩研究主題在摘要中的距離越近,則 兩者之關聯強度應越高,同時強度的變化程度 也應是成指數倍數變化,而非線性變化,故本 研究先將兩研究主題之間的平均距離轉換為 Z 分數;而 Z 分數有可能為負值,所以本研究 再將 Z 分數轉換為平均數為 5,標準差為 1 之 標準化分數,以確保標準化分數為正值。最 後,再以標準化分數平方之倒數為關係強度分 數。舉例來說,假設「網際網路」與「電子商 務」曾經出現於 32 篇博碩士學位論文中,而 平均距離為 86.7;轉換為標準化分數之後的出 現次數為 7.5,距離為 5,則此兩研究主題之 關聯強度為 1 5 × 7 . 5 × 1 = 1 . 5 。關聯強度越 高,表示兩研究主題在摘要中的平均距離越 短,同時也表示兩者同時出現在摘要中的次數 也越多,則兩研究主題之間的直接聯繫程度越 強,兩研究主題的研究程度越密切;反之,關 聯強度越低,表示兩研究主題在摘要中的平均 距離越長,同時也表示兩者同時出現在摘要中 的次數也越少,則兩研究主題之間的直接聯繫 程度越弱。 (三) 關聯相似度(S) 在過去的研究中,Jaccard 係數是在衡量 交易資料集時最為廣泛使用的相似度量測標 準(Guha, Rastogi & Shim, 1998)。Jaccard 係 數亦稱為 IOU 指標(Intersection Over Union measure) ,假設兩物件 a ,b 所屬交易之集合分 別為 X 與 Y,則 Jaccard 係數分子為 X 與 Y 交 集之大小,分子為 X 與 Y 聯集之大小。公式如 下。舉例來說,假設物件 a 出現於交易 T1, T2, T3, T4 中,物件 b 出現於交易 T2, T3, T5, T6 中,則 a 與 b 之 Jaccard 係數為 2/6=0.33。Jaccard.

(5) 係數介於 0 與 1 之間,0 表示兩者完全不相同, 1 表示兩者完全相同。Jaccard 係數主要的計算 方式是觀察物件共同出現的情形,而忽略物件 沒有出現的情形。由於 Jaccard 係數乃是計算 兩物件所屬之交易資料集之間的相似度,所以 若將論文之關鍵字視為一個物件,每個與該關 鍵字具有關聯存在的關鍵字視為一次交易,那 麼便可利用 Jaccard 係數的概念,計算兩研究 主題之間的關聯相似度。本研究乃根據 Jaccard 係數公式,來做為衡量兩研究主題之間的關聯 相似度的公式。因此關聯相似度越大,表示研 究主題之間重疊的研究主題越多,則兩者的間 接聯繫強度越強,兩研究主題之關聯研究主題 越相似;反之,若關聯相似度越小,則兩者之 間接聯繫強度則越弱,代表兩研究主題之關聯 研究主題越不相似。 ……………………(3) X ∩Y S=. X ∪Y. 產生之規則進行比較。接下來則將針對單一研 究主題,以本研究所提出之關聯強度與關聯相 似度分析其他相關研究主題之關聯性強弱。同 時,並以不同的面向,如年份、學校、科系等 參數,分析在各種面向下研究主題關聯性強弱 之變化,並藉此看出研究主題之主流與發展趨 勢。 WWW 瀏覽器. WWW 伺服器 資料輸入. PHP/Perl. 資料輸出 關係呈現系統 DHTML/JavaScript WebDot圖形產生器. 外部資料庫 全國博碩士論文 資訊網. 資料庫 關聯計算系統 關聯強度與關聯相 似度計算 資料 搜尋 引擎. , S = 關聯相似度. 資料庫. 資料格式 轉換過濾. 圖三、知識關聯圖系統架構圖. 四、系統建置 為了評估本研究所提出之研究架構及衡 量指標,本研究透過實際建置系統以實作關聯 強度與關聯相似度兩指標。圖三為本研究提出 知識關聯圖系統架構圖。系統架構圖,本系統 之主要流程可分為四個階段:論文資料擷取階 段、關鍵字處理階段、衡量指標計算階段及結 果呈現階段。由於篇幅關係,簡要各階段之內 容分述如下。階段一為論文資料擷取階段,自 動化擷取國內資訊相關系所的博碩士畢業論 文,並且自動擷取論文的各種屬性,如標題、 校系、作者、關鍵字、摘要等。階段二關鍵字 處理階段,由於國內並未強制規定博碩士論文 可以使用的關鍵字為何,造成關鍵字數量過於 龐大,因此本階段將對論文所使用的關鍵字進 行處理,將具有相同意義與意義相似的關鍵字 進行合併,並且設定門檻值過濾使用率較低的 關鍵字,最後的結果將作為衡量指標計算階段 與結果呈現階段中,相同或相似研究主題合併 之用。階段三衡量指標計算階段,針對每一篇 論文,先行計算衡量指標所需的數值資料,如 關鍵字配對個數、關鍵字之間的距離等,以提 升最後結果呈現階段的指標計算速度。階段四 結果呈現階段,根據使用者所輸入之各種參 數,如年份、學校、系所等,實際計算關聯強 度與關聯相似度,並且將最後結果透過網頁呈 現給使用者。. 五、評估與分析 在本章中,首先將針對本研究所提出之關 聯相似度,以資料挖掘中之關聯法則進行評 估,並與本研究所提出之關聯強度與關聯法則. (一) 關聯強度結果評估 本研究所提出之關聯強度,是衡量兩個研 究主題直接強度之指標,使用者可以根據衡量 指標之大小了解兩者關係的強弱;而根據本研 究之假設:「一篇論文的每個研究主題,兩兩 之間必定有研究上的意涵存在」,若兩研究主 題之間有關聯強度存在,則兩者必定同時出現 於某一篇論文的關鍵字欄位中。因此,若要對 關聯強度進行評估,可以利用其他演算法檢驗 兩研究主題之間是否有關聯存在,與關聯的強 弱大小。一篇論文通常具有多個關鍵字描述論 文主題。若將一篇論文視為一次交易,而將論 文中的關鍵字視為一次交易中所購買的項 目,則便可藉由資料挖掘中之購物籃分析,利 用關聯法則之方法,分析是否有研究主題出現 關聯法則,若有研究主題之間有關聯法則存 在,則表示兩者的關聯性極高。此外,若有關 聯法則出現,亦可分析關聯法則之有用性指標 值與確定性指標值,以評估關聯強度之正確 性。本研究乃根據購物籃分析之概念,透過關 聯法則評估關聯強度。評估流程如下,首先將 論文與其關鍵字之資訊轉換為相似於交易記 錄之格式。透過資料挖掘軟體,尋找其中是否 有規則存在。分析執行結果,並將執行結果與 關聯強度進行比較。本研究透過 DBMiner 公 司所推出之 DBMiner AX 2002 尋找資料中是 否有關聯法則的存在。DBMiner AX 2002 具有 高效能的關聯法則挖掘能力,同時可針對單一 維度或是多維度資料進行關聯法則挖掘。針對 挖掘時的參數值,在設定上如下,Minimum Support(有用性指標):1%、Minimum Confidence(確定性指標) :25%、Minimum Lift: 1。根據前述之參數設定,最後執行結果發現: 即使在所有參數值均是最低的情況下,.

(6) DBMiner AX 2002 依然沒有找出任何一條規 則。發現此結果之後,本研究嘗試將論文資料 依照系所別分開處理,希望藉由系所的分別, 找出該戲所中具有高強度的研究主題關聯 性。將不同系所的論文分開處理之後,於資訊 管理系所中僅產生了一條規則,其他的系所則 無規則出現。產生的規則如表一。 表一、由 DBMiner AX2002 所產生之關聯法則. 因此將論文視為交易,將關鍵字視為交易 中的項目,並一此設定透過資料挖掘軟體進行 關聯法則挖掘是可行的,所產生的結果也與本 研究所提出之關聯強度相類似。但是,即使將 有用性指標、確定性指標等參數值調到最低, 產生出的規則仍然非常非常之少,僅有在資訊 管理系所產生出一條規則,剩下之系所均無任 何規則存在。相較於本研究所提出之關聯強 度,可以將所有有關聯強度存在之研究主題取 出,使用者可藉由已排序之輸出資料,了解兩 研究主題之間的關聯程度,以及以多個面向, 如不同的時間、學校、系所等,了解在這些面 向下哪些主題具有高度的關聯性。因此,相較 於一般傳統的資料挖掘方法,本研究所提出之 關聯強度更適用於衡量學術論文中研究主題 之關聯性。. 關係。而從表二中可以發現,與知識管理關聯 強度最強之研究主題為知識管理系統等 4 個 同義或相似關鍵字,出現在論文中的頻率也最 高,共有 33 篇論文。而兩者的關聯相似度也 是這 20 個中最高的,為 10.58%。這兩者之間 詳細的關聯強度、關聯相似度之值與論文資 料,則如表三。若使用者想深入了解「知識管 理」與「知識管理系統架構」之研究,本系統 也包含了詳細的學術論文資料與指導教授資 料,使用者可以藉此尋找學位論文,或是尋找 該領域之專家,如表四。 表二、與知識管理關聯強度前 20 之研究主題. (二) 單一研究主題之結果分析 由於本系統提供使用者兩種不同的查詢 功能,因本研究也將針對兩種不同的執行結果 進行分析。本節將先針對「單一研究主題查詢」 之查詢功能,由於篇幅有限僅以資訊管理最熱 門的「知識管理」研究主題為例進行查詢,並 且針對執行結果進行分析,在下一節則將針對 「整體性研究主題查詢」之查詢功能,分別以 不同之年份、系所、學校等面向進行查詢,並 且針對執行結果進行分析。以「知識管理」為 研究主題,查詢資訊管理學系學位論文中與 「知識管理」相關之研究主題關聯強度前 20 名,可以得到如表二之結果,其中 R 為關聯強 度、S 為關聯相似度、A 為平均距離、N 為文 章總數,而這 20 個研究主題之間的交互關聯 強度圖如圖四。 從圖四中可以看出此 20 個研究主題之關 聯程度,其中,有 6 個研究主題與編號 4 資料 倉儲有關聯強度存在,有 7 個研究主題與編號 8 組織學習有關聯強度存在,表示這 20 個與 知識管理相關的研究主題,許多均與資料倉儲 與組織學習有關。然而資料倉儲與組織學習之 間雖然有關聯強度存在,兩者的卻關聯強度僅 有 0.84,代表兩者之間的直接關係不高,因此 由圖四的內容,本研究推論:與知識管理相關 的研究,也與組織學習與資料倉儲有著密切的. 圖四、以知識管理為研究主題之知識關聯圖 表三、「知識管理」與「知識管理系統」及同 義與相似關鍵字之詳細關聯資料. 表四、「知識管理」與「知識管理系統架構」 之詳細論文與指導教授資料. (三) 整體性研究主題之結果分析 查詢「整體性研究主題」時,可以依據不 同的年份、不同的學校與不同的科系等三個面 向進行查詢。本節中也將依據這三個面向分別 進行結果分析與探討,依順序分別為:根據不 同年份進行查詢、根據不同學校進行查詢、根 據不同系所進行查詢。透過系統查詢 81 學年 度至 90 學年度之全國資訊管理學系、所研究 主題之間的關聯強度與關聯相似度,可以得到 如近十年的結果。由於篇幅有限僅列出 88-90 年研究主題之間關聯強度之前五名。從表中可 以看出,88 學年度中網際網路與電子商務之 研究到達最高峰,兩者的關係強度高達 5.77。.

(7) 此時,知識管理與知識管理系統、供應鏈與供 應鏈管理之研究也開始增加。89 與 90 年兩者 並無太大的不同,網際網路與電子商務之關聯 強度仍然名列前茅,但到了 90 學年度已開始 下降;而 89 學年度開始資料倉儲與「資料挖 掘之研究開始大量增加,這種現象代表關於 「資料倉儲」與「資料挖掘」之相關研究已成 為現今資訊管理學界的熱門主題之一。 表五、88-90 年研究主題之間關聯強度前五名. 透過本系統,分別查詢中山大學、中央大 學、台灣大學、政治大學等國內四所歷史悠久 且具有高知名度之資訊管理研究所,學位論文 之研究主題關聯強度與關聯相似度,可以得到 如表六的研究主題關聯列表,表中僅列出研究 主題前五名。從表中可以發現,在四所學校的 資管系中,電子商務與網際網路之研究仍然佔 最大宗。除台大資管系外,在其他的學校均位 居關聯強度第一名。中山大學資管系中具有高 關聯強度之研究主題頗為平均,同時也是四所 學校中有關組織變革與資訊科技關聯強度排 名最高者。中央資管系中具有高關聯強度之研 究主題,前三名均與網際網路有密切關係。同 時,也是四所學校中關於資料挖掘與關聯規則 強度最強者,顯示中央大學進行相當多關於資 料挖掘之研究。政大資管系中具有高關聯強度 之研究主題中,供應鏈與供應鏈管理排名為第 二,僅次於電子商務與網際網路之後;同時, 排名第三與第四者均與資料庫有關,可見政大 資管研究著重於供應鏈與資料庫的相關研 究。台大資管系中具有高關聯強度之研究主題 與其他三所學校頗為不同。排名第一的為服務 品質與網際網路,而其他學校均為電子商務與 網際網路,可見台大資管系之研究著重於網路 服務品質的部分;此外,排名第四的拉格蘭氏 鬆弛法與最佳化,此關聯幾乎不存在於其他三 校中,同時其他三校的研究主題與台大資管系 的重複率甚低,可見台大資管系的走向與其他 學校的不同。從同一學校不同系所的查詢,更 可看出同為一間學校內之資訊相關領域系 所,其研究方向之不同。本研究分別以中山大 學之資訊工程與台灣大學之資訊工程兩系所 為例進行查詢,則可得到之結果如表七,中山 資管所之結果請參考表六。從表六和表七中, 可以很明顯的看出中山資管所與中山資工所 研究主題上的差異。中山資管所之主要研究主. 題與整體資管界並無太大不同;而由表七中, 可以看出中山資工所與全國所有資訊工程系 所研究主題的差異,網際網路在中山資工所並 不是一個熱門的主題,研究主題關聯強度前五 名中僅有第二名包含網際網路;相對的分散式 與相關之研究在中山資工所中是較為熱門之 研究主題。由表六和表七中亦可看出台大資工 所與台大資管所之研究方向差異,台大資管所 與整體資訊管理學界的研究方向有很大的不 同,而台大資工所之研究方向與整體資工系所 研究雖然仍有不同,但差異不如台大資管來的 大,網際網路在台大資工所之研究方向上仍佔 有一定之比率。而從表七的內容中,可以看出 台大資工所中排名第三之「資料探勘」與「頻 繁型樣」之相關研究在其他資訊工程系所中甚 少出現,同時兩者之關聯強度與關聯相似度都 很高,因此可見台大資工所之主要研究方向包 含了資料探勘中發掘頻繁型樣之方法。 表六、中山資管、中央資管、台大資管、政大 資管研究主題之間關聯強度之前五名. 表七、中山資工、台大資工研究主題之間關聯 強度之前五名. (四) 實務上之應用 對於剛接觸資訊領域的研究人員,本系統 提供了一個便利而快速的方法查詢資訊領域 中研究主題的關聯性。例如,若一個新接觸資 訊管理領域的研究人員,便可透過本系統查詢 資訊管理領域中具有高關聯強度之研究主 題,也可以探討各個學校之間具有高關聯強度 之研究主題的不同,進而了解研究人員所在學 校之研究走向;此外,若想針對某個研究主題 進行更深入的了解。也可藉由「單一研究主題 查詢」的功能,查詢研究人員有興趣的研究主 題與其他研究主題的關聯程度,進而快速的取 得相關學位論文列表,以閱讀相關的研究文.

(8) 獻。而對於一個在資訊領域多年的研究人員, 利用本系統也可了解其主要研究方向與其他 主題之間的關係,並且可藉此發現新的研究主 題,進行新的研究方向;同時,若研究者想進 行跨領域研究時,也可藉由本系統之查詢結果 了解其他領域之研究概況,進而快速取得其他 研究主題之研究文獻列表與該領域之研究人 員,讓研究者能夠快速的了解跨領域之研究概 況。. 環境中學習活動型態與學習成效之研究。 TANET 99 研討會論文,高雄。 [2]. 陳明溥、嚴榮泉(2001)。網路化問題導向 學習系統建構模式之研究。第十屆電腦輔 助教學國際研討會論文,台中。. [3]. 林東清(2002)。資訊管理-e 化企業的核心 競爭力。台北智勝。. [4]. 謝武星(2000) 。針對「學術論文」的知識 管理技術研究,政治大學,資訊管理研究 所碩士論文。. [5]. 楊存一(2001) 。利用自適應共振理論網路 探討 MIS 學術論文關鍵議題的發展趨勢, 雲林科技大學,資訊管理研究所碩士論文。. [6]. 張家華(2001) 。資訊管理學科文獻內援用 理論之探討-以台灣碩、博士論文為例, 政治大學,資訊管理研究所碩士論文。. [7]. 陳 年 興 、 孫 振 凱 (2002)。 透 過 網 頁 分 析建構知識分布圖以輔助線上教 學,第 十 三 屆 國 際 資 訊 管 理 學 術 研 討 會 , 675-682。. [8]. 王惠嘉,張毓倫(2002)。研討會之知識管 理及其系統之建構與發展,第十三屆國際 資訊管理學術研討會,659-666。. [9]. 李律品(2002) 。資訊管理研究之生態演化 分析,中山大學資管研究所碩士論文。. [10]. 陳俊彰(2001) 。從網頁中發掘教師知識 分佈圖,中山大學資管研究所碩士論文。. [11]. Alavi, M., and Leidner D.E., “ Review: Knowledge Management and Knowledge Management Systems: Conceptual Foundations and Research Issus,” MIS Quarterly (25:1), Mar. 2001.. [12]. Schultze, U. & Leidner, D.E. ( 2002 ) , “Studying Knowledge Management in Information System Research: Discourses and Theoretical Assumptions”, MIS Quarterly, vol.26, no.3.. [13]. He, Y. & Hui, S.C.(2002), “Mining a web citation database for author co-citation analysis”, Information Processing and Management vol.38, 2002.. [14]. Guha, S. R. Rastogi & Shim, K.(1998), “Cure: An efficient clustering algorithm for large databases”, Proceeding of 1998 ACM SIGMOD International Conference on Management of Data.. 六、結論 本研究之研究成果包含了以下數點,第一 點為提出衡量兩研究主題之間關聯性之衡量 指標:關聯強度與關聯相似度,可用來衡量研 究主題之間的直接關係與間接關係。第二點為 以自動化的方式,擷取網際網路上關於資訊相 關領域的學位論文資源,並計算資訊相關領域 研究主題之間的關聯強度與關聯相似度,分析 現今資訊相關領域中各個研究主題之間的關 聯性,並且提供相關研究主題與相關學位論文 給研究人員,作為對領域知識之基本認識與往 後研究之用。第三點為建立同義關鍵字與相似 關鍵字資料庫,以整合國內學術論文關鍵字用 法分歧的現象,並且實際運用於系統中,讓使 用者在進行查詢時可以一併了解相關研究主 題。第四點為針對單一研究主題,分析與其具 有高度直接關係之研究主題,以及這些研究主 題之間的關聯性。第五點為根據不同的時間 點,分析研究主題之間的關聯性,以了解在不 同的時間下,研究主題的關聯強度與關聯相似 度的變化,以及具有高關聯強度的研究主題變 化。論文中以 81 學年度至 90 學年度之資訊管 理領域之論文為例,分析十年內資訊管理學界 研究方向之變化。第六點為分析不同的學校、 系所,在相同的研究主題上關聯強度與關聯相 似度的差異,以及各學校與系所的研究主流。 論文中分別分析了國內資訊工程、資訊管理、 資訊科學三個領域研究方向之差異,以及中山 大學、中央大學、政治大學、台灣大學四所學 校之資訊管理學系研究方向,與中山大學資管 系與資工系、台灣大學資管系與資工系之研究 方向。. 致謝 本研究由國科會計畫獎助。名稱為知識分 享:顯性知識採用知識關聯圖及隱性知識採用 知識地圖。計畫編號:92-2213-E-110-041-。. 七、參考文獻 [1]. 陳明溥、莊良寶(1999)。全球資訊網學習.

(9)

參考文獻

相關文件

• 教師為全班選定一個原因,並為各組選 定其中一個解決方法,著各組就該解決

妳笑我就會開心 妳喊幫妳遞紙巾 妳忙陪妳捱眼瞓 妳攰膊頭任妳枕 妳嬲同妳一齊炆 妳遲到時我實等

成 功 。因 為畫 中顯 示中 國已 成立 製造 局, 自行 生產 西方 的來 福槍 及彈 藥,.

“Successful Knowledge Management Projects,” Sloan Management Review, Winter 1998. H., Some principles of knowledge management

時值知識經濟時代的來臨,台灣已加入了 WTO ( World Trade Organization,WTO ),企業面臨劇變之環境及廣闊的物料採購市 場,若能善用「知識管理」( Knowledge

介面最佳化之資料探勘模組是利用 Apriori 演算法探勘出操作者操作介面之 關聯式法則,而後以法則的型態儲存於介面最佳化知識庫中。當有

McCreedy , “The Process of Knowledge Management Within organization :a Critical Assessment of both Theory and Practice”, Knowledge and Process Management, Vol.6,

(1989), “A Theoretical Assessment of the User Satisfaction Construct in Information Systems Research,”.. Management