一、本體發展的原則
建構本體對於許多應用系統的發展,是一個極為重要的步驟,但 是目前的本體發展方法似乎還停留在藝術的層次,尚未達到科學的方 法。儘管如此,由許多過去的本體發展經驗中,仍然具有相當的參考 價值。首先本體是由許多概念所組成,而概念是一個抽象的東西,其 命名往往會影響到人們對概念的理解。因此,概念的命名必須要遵循 一定的規則,才能夠使概念的名稱有一致的基礎,不但容易將概念的 名 稱 插 入 本 體 之 中 , 也 比 較 容 易 辨 別 是 否 有 相 同 或 類 似 的 概 念 。 Schulze-Kremer (2002)更進一步提出了概念的命名原則如下:
1、使用單數型態:完全使用單數型態來命名,避免使用複數型態而 導致誤解,並且使用小寫字母代表類別,第一個字母使用大寫來 表示實例,縮寫字全部用大寫字母。如果本體需要帶入本體工具 之中,還要注意本體工具是否有特別的限制,例如是否可以使用 引號、減號、或底線等。
2、儘量使用現成的、約定成俗的名稱:如果沒有現成的名稱,則最 多以四個字組成名稱,每一個字也應該使用簡單的名稱,使其淺 顯易懂。
3、子類別的命名:可以用其父類別的名稱之後附加名稱,以利辨別 相互關係。
Uschold 與 Gruninger (1996)以設計企業模式本體的經驗,提出本 體的設計原則如下:
1、清析性 (clarity):本體要能夠有效的傳達其意圖,就必須要清楚 的表達所有的概念、實例與關係等,絕對不能有絲毫的模糊空間,
才不至於引起擴張的解釋。對於可能造成誤解的地方,最好能夠 詳細說明,並提供範例。對於整體的架構,應以正規理論來加以 表達,但還是需要提供自然語言的定義與文件的說明。
2、一致性 (coherence):本體需要具備內部一致性,包括理論基礎的 一致性、名詞定義的一致性、相互關係的一致性、文件的一致性 與範例的一致性等。
3、延展性 (extensibility):本體提供某個領域的概念架構、名詞字彙 與定義,有其特定的應用範圍。但本體還是應該具備延展性,也 就是在既有的基礎上,可以擴充其字彙與關係,來延展其應用範 疇。要達到延展性,就必須使本體合乎兩個準則:不做過多的承
諾與避免編碼誤差。前者是指在設定的應用範圍內發展本體,而 不要過度的擴張,後者則是將概念與關係轉換成正規表示法時,
要避免編碼的錯誤。
Borgo, Guarino, and Masolo (1996)、Gomez-Perez, & Benjamins (1999)等,也提出了五個本體的發展原則,這些原則都是一般性的原 則,在真正發展本體時,未必能夠提供實際的決策支援,但是卻可以 提醒本體發展者利用這些原則來檢視本體的內涵:
1、本體中所有的類別必須要有所差異,也必須要相互分離,不要將 具有相同或相近意義的概念放在同一階層或上下階層,而應該要 以同義詞的方式表示。
2、階層架構的正確性與多樣化,以提升多重繼承機制的效率,與分 類的多樣化。
3、減少相似概念之間的語意差異,並且將相似的概念放在同一組,
以相同的述詞來描述。
4、所使用的名稱要採標準化的命名方式,以求一致,並且最好讓名 稱具有意義,可以由名稱來瞭解大致的語意或概念。
5、減少模組與模組之間的聯結現象,如果一個類別有兩個以上的超 類別,這可能造成應用上的困擾,或是造成無窮的參考。
綜合前述,本體發展的一般性原則可以歸納如下:
1、有意義的命名方式,舉凡概念、關係與屬性等的命名,都應該採 用大眾化的名稱,避免太生澀或學術性的名稱,並且讓超類別與 子類別的名稱具有聯結關係。
2、確認關係的適合性,應該分別由上而下、由下而上,並且隔一層、
隔二層等依次檢查概念的層次關係與意義。
3、確認概念的一致性,也就是要檢查同一層的概念在意義上是否有 落差現象,避免造成概念所在的層次不正確。
4、確認本體提供足夠的資訊,本體是為了應用而發展,勢必會和應 用系統結合。因此,必須以應用的層面來考慮是否可以提供足夠 的資訊,而不致於太過簡略或瑣碎。
二、發展本體需要克服的困難
要建立一個最佳的本體極為不容易,有太多的困難需要加以克 服,這些困難有些是源自於建構本體過程中的疏失,有些則是對於應 用領域認識不夠所造成。整體而言,在發展本體時,需要克服的困難 如下 (Schulze-Kremer, 2002):
1、超類別與子類別之間的關係不易確認:由於本體的發展方法中,
並沒有公論最佳的方法可以確定何者才是最佳的子類別。因此可 能會造成任意決定子類別,這就可能導致本體的一致性不夠,因 此必須詳加檢查類別之間的關係。
2、遺失本體的組成元素:就是在發展過程中遺失了類別、屬性、或 關係等。本體中的類別由上而下應該是由抽象而逐漸具體,但是 如果中間缺少了類別,就會造成本體重要元素的遺失。例如由「動 物」直接到「人」,中間就缺少了重要的類別「哺乳動物」。
3、關係的混淆:類別之間的關係無法確認是一對一、一對多、或多 對多的關係,也會造成概念的遺失,或是把關係與屬性誤認為同 樣一件東西。
4、過於詳細:本體中最重要的元素為概念,最底層則為實例,如果
本體想要嘗試列出所有的概念或實例,就會造成太過詳細、或有 過多的元素等。
5、把重要的資訊當成是註解欄位或描述文字,造成重要的資訊遺失。
三、IDEF5 本體發展方法論
Knowledge Based Systems, Inc. (1994)指出,大型本體的發展需要 具備相當的技能與經驗,主要是因為領域的知識往往缺乏完整的記 載,這些知識只存在於少數專家的腦海中。宣告性的知識 (declarative knowledge) 還 比 較 容 易 以 顯 性 方 式 加 以 描 述 , 但 程 序 性 的 知 識 (procedural knowledge)就不容易以顯性方式來表徵。因此,一個大型 本體的發展必須有計畫、有組織、有管理的循序漸進、重複思考、詳 細討論、細心檢視與深切反省。過程中間需要領域專家的參與及團隊 合作,整個發展程序的五大活動如下:
1、組織與定義計畫 (organize and define the project):大型本體的發 展,其應用層面必定廣泛,因此,通常以計畫的方式進行,包括 組織計畫與定義計畫。
2、蒐集資料 (collect data):發展本體需要廣泛的蒐集資料,並且也 是 一 個 持 續 且 互 動 的 過 程 。 資 料 的 來 源 可 以 由 相 關 的 文 獻 中 分 析、訪問該領域的專家、與觀察組織的活動或現象等。資料的來 源則是和領域有關的知識,如名詞、名詞定義、概念、種類、物 件、實例、關係、問題與解決方案等。
3、分析資料 (analyze data):資料的分析是為了建立初步的本體,分 析的項目包括:列出領域中的物件、確認在範圍之內的物件、將 具有共同性質的物件加以分類等。
4、發展初步的本體 (develop initial ontology):剛開始發展本體時,
可能因為對於本體發展方法的運用不純熟,或是對於領域知識瞭 解不夠透徹。因此可以先發展初步的本體,也就是由初步的概念 開始,這些初步的概念會因為資料的獲得,或概念的釐清,而變 成固定且成熟的概念。初步的概念包括初步的類別、初步的屬性、
初步的值與初步的關係等,最後再畫出分類的圖示,以明確的表 示本體的架構。
5、精練與確認本體 (refine and validate ontology):初步的本體發展完 成之後,還需要加以確認名詞及其定義是否合適、種類與關係是 否正確。確認的方法可以透過蒐集更多的資料、並實際測試其正 確性。
IDEF5 的本體發展方法包括五個大型的活動,每一個活動都需要 許多人力的支援,這些參與的人力最好都具備領域的知識與本體發展 的經驗,但在發展方法中並未提及如何進行資料的分析,也沒有正規 化的步驟,也未談到和應用系統結合的方法。
四、TOVE 本體發展方法論
企業的營運與管理往往需要依靠資訊系統,過去的企業資訊系統 主要以儲存企業的靜態資料為主。例如人事、薪資、庫存、生產、訂 單與流通等資料,但是二十一世紀的企業,不但要能夠處理靜態的資 料,還要能夠處理動態的資料,甚至是語意的資料。也就是說,整個 企業的模式都應該是企業資訊系統的內涵,為了達成這樣的企業模 式,Gruninger 與 Fox (1995)發展了「多倫多虛擬企業」 (TOronto
Virtual Enterprise;TOVE),TOVE 的中樞是一個「常識企業模式」
(common sense enterprise model),也就是一個企業本體,用來支援 TOVE 的運作。Gruninger 與 Fox 由發展企業本體的經驗,提出了 TOVE 本 體 發 展 方 法 論 , 也 被 稱 為 企 業 塑 模 方 法 論 (Enterprise Modelling Methodology),其本體發展的步驟如下:
1、情境刺激 (motivating scenarios):本體的發展主要是基於應用上的 需求,當企業碰到問題時,就必須要尋求解決的方案,這就是一 種情境刺激的反應。解決企業問題的方案,可以是短期的問題導 向解決,也可以是長期的根本導向解決,後者的解決方式必定和 企業的本體知識有極大的相關。因此,為了解決企業的問題,較 好的方式是建立企業的本體,作為企業資訊系統的基礎。
2、定義非正規的能力問題 (informal competency questions):本體的 發展是先要瞭解應該解決那些問題,才能讓本體具有解決這些問 題的能力。這些問題首先以非正規的方法、也就是以自然語言描 述法來加以表示,就稱為非正規的能力問題。由於建構本體是一 件耗時費力的工作,本體一旦建立,就必須要全盤解決企業的所 有問題。因此,在形成非正規的能力問題時,必須要思考整個企 業要解決的問題有哪些,思考的方向可以由企業的組織架構與企
2、定義非正規的能力問題 (informal competency questions):本體的 發展是先要瞭解應該解決那些問題,才能讓本體具有解決這些問 題的能力。這些問題首先以非正規的方法、也就是以自然語言描 述法來加以表示,就稱為非正規的能力問題。由於建構本體是一 件耗時費力的工作,本體一旦建立,就必須要全盤解決企業的所 有問題。因此,在形成非正規的能力問題時,必須要思考整個企 業要解決的問題有哪些,思考的方向可以由企業的組織架構與企