• 沒有找到結果。

以Ontology為基礎的生物資訊系統

第二章、 文獻探討

第四節 進階元件化整合式系統:O NTOLOGY -B ASED 系統

2.4.6 以Ontology為基礎的生物資訊系統

z Carole A.Goble , TAMBIS(The Transparent Access to Multiple Bioinformatics

Information Source), 1999 [11] [12] [13]

TAMBIS 是英國曼徹斯特大學的生物科技、資訊管理以及資訊科學三個系所 的聯合研究計畫,是利用 ontology 來幫助生物學家在對其他資料庫執行查詢 指令時,有一個共同的查尋介面,使用者在使用系統時,就感覺是針對一個 資料庫系統做查尋,事實上是存取了不同資源的資料庫系統。TAMBIS ontology ( TaO ) 廣泛地敘述生物資訊領域的工作和資源 ,在 TAMBIS 中占 非常重要的角色。使用者可藉由 ontology 的 concept 之間的關係,組成一個 複雜、多個資源的詢問,例如:要查尋一個 protein 與某個個 protein 相似,

而且具有特定的 accession number。經由如此與資料來源無關的查尋語言,

使用者可以不用知道真正存放資料的到底是一個 oracle 的資料庫,還是一個 檔案系統,TAMBIS 會將這種與真正資料庫系統無關的查尋語言,轉換成在 資料庫系統真正可以執行的程式或在此資料庫系統可以使用的查尋語法,再 交給真正的資料庫系統處理。這時使用者就好像很直接的存取到不同的生物 資訊資料庫系統,給使用者有一種透明化存取多個生物資料庫的假象,只要 用同一種 TaO 定義的查尋語法,透過 TaO 描述的生物資訊領域的工作和資 源,可產生各式各樣不同的查尋結果。下頁圖 3 為 TAMBIS 的系統架構:

TAMBIS 強調出透過 ontology 的標準化,提供一個共同的介面,也就是 ontology,經由這個介面與不同的資料庫作溝通。對於使用者而言,只需要 學會和 TAMBIS Ontology Server 溝通的語言,也就是 Conceptual Query Formulation,而系統會將藉由查尋找出適當的 Service Model,將 Ontology 的查尋語法轉換成真正資料庫可以執行的查尋語法,再交給真的資源提供者 去執行,如此使用者面對的只是 TaO Server,不需要知道真正要如何去存取 不同的資料庫。TAMBIS 具有一個中央集中化的 Ontology Server,所以用同 一個 Ontology 去描述不同的資料庫所提供的資料,不會有因為由不同的資 要的知識,RiboWeb 利用四個 ontology 來紀錄,physical-thing ontology 、data ontology 、reference ontology 、methods ontology。 Physical-thing ontology 是用來描述核醣體的構成要素和其他輔因子(cofactor)。 Data ontology 明確 說明從生物實驗中所收集到的資料型態。Reference ontology 敘述已發表研 究的型態。 Methods ontology 紀錄在 RiboWeb 中可執行的一些功能的型態,

與需要執行這個功能所需要的主要參數。研究人員可將自己發表的核醣體 3D 結構模型加入至系統的知識庫中,當研究人員要了解自己發表的這個 3D 結構與現存已發佈的實驗結果的一致性,研究人員需要先從 method ontology 中選取適當 interpret 模組,它藉由使用者設成的參數,將資料解讀成可以被 相對比較的單位,此時研究人員只要選擇自己有興趣的資料,設定一些執行 此模組所需要的參數(可從 method ontology 中獲得哪些參數需要設定),執行

interpret 模組,即可獲得資料在這個 interpret 模組的單位距離。研究人員再 利用同樣的方法,對自己發表的 3D 結構模型執行相同的 interpret 模組,再 使用 compare 模組比對剛剛有興趣的資料與自己發佈的模型之間的一致 性,以幫助了解新發表的這個核醣體 3D 結構模型的可性度和正確性。

由此可看出 RiboWeb 是一種 Method-Oriented 的生物資訊整合系統。研 究人員自行判斷分析資料的方法,然後指定系統執行特定的資料分析程序,

系統會依照知識庫中描述分析程序所需要的參數或資料,在資料庫中選取出 來,再由使用者判斷自己需要的部分來執行分析動作,本論文將之歸類為模 組導向資料分析系統 (Method-Oriented Data Analysis System) 。反之,若是 研究人員希望針對某個型態的資料做分析,但是卻不知道有什麼樣的分析方 法可以使用,則系統的知識庫中將會描述分析工具的輸入資料型態,系統就 可以判斷研究人員指定的資料型態,並提供適當的模組給研究人員參考和執 行,本論文將之歸類為資料型態導向資料分析系統 (Data Type-Oriented Data Analysis System) 。

由上述之討論可歸納出在生物資訊的領域中,資料型態和分析方法之間的關 係相當繁雜,研究人員往往具備豐富生物資訊方面的知識,和大量的實驗數據,

資料中隱藏了人眼看不出來的有趣資訊,為了能夠把這些隱藏的資訊找出來,資 料型態導向資料分析系統就比模組導向資料分析系統較滿足生物資訊研究人員 的需求,研究人員僅需要將自己的實驗數據做正確的判斷,判斷出資料的型態和 特性,就可以直覺地針對這些資料執行分析動作。雖然僅僅是系統著眼點的不 同,但是對於使用者來說,從資料型態的角度判斷適合的分析方法,輔助使用者 更直覺的操作流程。

相關文件