本章我們要介紹在目前現有的研究計畫中,與我們系統有著類似目標與動 機的研究。
無論是在生物資訊領域,或是一般企業組織,各部門單位使用不同資料庫 管理系統來儲存和取得其重要資料,這幾乎是不可避免的,但這些系統常常來自 不同的廠商,通常情況下,會需要通過一個公用介面來使用兩個機構中經過組合 的資料。在這些情形下,資料庫的聯邦技術通過提供異構資料的統一介面有效地 解決這一問題。
在參考文獻[13]中,便是以生物資訊為研究領域,探討在對各處理生物資 訊資料且分散的資料庫所建立的邦聯,發展一個中介的程式(mediator)。此中介 程式能夠存取各分散資料庫的資料,並會利用預先收集好各資料庫的資訊與關 係,建立一個整合式的資料表綱要,讓使用者能夠對這個整合式的綱要進行任意 的資料庫的詢問(query)。若當有新的資料庫加入此邦聯,則需要對此中介程式增 加資料庫本身的描述資訊,才能重新整合並擴展整合式的綱要。
與其相較,我們建立的分散式資料庫環境中,由於各個資料庫皆使用相同 的generic data-type schema 設計,所以在對資料庫的詢問上,不需要另外建立一 個整合式的綱要,而能夠直接對資料庫作操作。加上我們的系統中使用一致的綱 要,讓使用者在編寫程序時,對各個資料庫都能有著一致性的操作,而不像邦聯 式的資料庫環境,對資料庫任何的操作皆需要透過中介程式。因此我們認為我們 建置的分散式資料庫系統,有著較好的一致性與操作性。
而對於資料庫內的資料分析,另一個常見的方法為線上即時分析(On-Line Analytic Processing,OLAP)。 線上即時分析是決策支援必要的元件,因為傳統資 料庫無法預測歷史性資料回歸分析、儲存方式速度太慢以及散佈各地的不同平 台,查詢時需要結合(join)多個資料表,造成系統整體效能低落。加上傳統的資 料庫技術並未提供組織決策市場的分析功能,於是資料倉儲的技術就是在這樣的 情勢下所產生的。
[15]這篇論文中,研究了將資料探勘與線上時分析的整合應用,並將其發 展成為工具。在他們的研究中提出,由於資料探勘需要對整合過且經過前處理的 資料上進行,因此資料倉儲的特性能夠符合此項要求。加上線上即時分析提供的 基本功能如drilling、pivoting、slicing 等等對資料立方體(data cube)的操作,讓使 用者可以在不同的層面的概念上作資料探勘。雖然如此,但是在作資料探勘時,
由於目前已有許多的資料探勘的函數,針對各個不同的資料領域,使用者必須要 能夠選擇適當的資料探勘函數,否則也無法獲得有意義的資訊。
而我們的系統在資料的儲存方式,是以 generic data-type schema 的概念 儲存,因此資料庫內資料皆是以複雜的實體與實體類型的關係存在,並不會建立
在參考文獻[24]中,作者整理了目前在格網計算的環境上,所提出的網格程 式模型(Programming Model)語言以及工具。在網格程式的發展中,可攜性、跨平 台,資源的尋找,效能的要求以及容錯,皆是網格程式模型的需求。而在工具與 語言方面,則依照其類型的不同,分為狀態共享 (Shared-State) 模型,訊息傳遞 (Message-Passing)模型,混合 (Hybrid) 模型,點對點 (Peer-to-Peer) 模型,架構 化元件 (Component) 模型,網路服務(Web Services)模型,以及協同(Coordination) 模型。我們的系統在程序的編寫過程中,可以利用呼叫已定義好的內儲程式,來 完成特定的運算,而這些運算可以被獨立成網路服務來單獨提供服務,因此在[24]
的分類之下,我們的系統屬於網路服務模型。