• 沒有找到結果。

OAI-PMH 與 OpenURL 的關係

在文檔中 一、 互通性的需求 (頁 41-46)

第五節 詮釋資料的應用

三、 OAI-PMH 與 OpenURL 的關係

Lagoze & Van de Sompel (2001)指出 OAI 希望各資料庫系統可以分成 3 個階 層,高的階層會包含底下階層的功能:

1. OAI-Comformant : 指 各 資 料 庫 系 統 可 以 支 持 協 定 的 定 義 。 因 為 XML Schemas 就是用來確認所有的回應,所以其一致性(Conformance)是經得起考 驗的;

2. OAI-registered:註冊使用由 OAI 維護的資料庫之各資料庫系統,都可在 OAI 的官方網站中找到。在註冊時,需提供一 baseURL,使得以用來檢測是否符 合 OAI 的規定,另外,使用這些已向 OAI 註冊的資料庫系統還有以下目的(轉 引自劉育君,2002):

(1) 使服務系統易於明瞭可獲取資料來源的儲存庫為何;

(2) 確保各資料庫系統是提供符合 OAI 協定所規範的;

(3) 提供 OAI 用來監督協定的使用情形以及作為規劃未來活動與策略;

3. OAI-namespace-registered:各資料庫系統選擇依照 OAI 對於識別號的命名機 制來為其資料錄命名,有以下 3 個組成屬性:

(1) oai:意指是在 OAI 的命名空間裡;

(2) <repoID>:在 OAI 命名空間裡,關於儲存庫的唯一識別號;

(3) <localID>:各儲存庫的唯一識別號,例:oai:arXiv:hep-th01。

利用 OAI-PMH 擷取資料 各資料庫系統

利用 Z39.50 檢索資料

服務系統

儲存庫採用此命名規範的好處在於:其資料錄識別號可由 OAI 解析器來負 責解析;另外,也希冀此解析器是可由 OpenURL 協定來組成(Van de Sompel &

Hochstenbach, 1999a),以得以藉 OAI 的識別號來達到開放連結,如 SFX 的應用 (Van de Sompel & Hochstenbach, 1999b)。

Van de Sompel & Bergmark(2002)指出 OpenURL 標準就是所謂的「架構標準 (Framework Standard )」,其構想源自並擴展於學術領域的服務概念:Bison-Fute’

模型(Van de Sompel & Beit-Arie, 2001)。

加入的會員都要在 OpenURL 架構中註冊(Registry),使提供以 OpenURL 為 基的情境服務,其主要的核心成份有(Van de Sompel & Young, 2003):

1. 識別號的命名空間(Namespaces of Identifiers):用來辨識資源的所在處;

2. 詮釋資料格式(Metadata Formats):用來描述資源;

3. 情境物件格式(ContextObjectFormats):用來呈現使用 well-formed 語法 的 OpenURL;

4. 會員檔案(Community Profiles):列出在 OpenURL 環境中,有出現在儲 存庫的會員名單。

參與由 NISO AX 委員會所贊助的 OpenURL 委員會的會員們,其參與的目 的就是為使學術環境形成一開放性的資訊環境,這些開放性的資訊環境會涵括以 下二點特徵:

1. 識別號命名空間:DOI 命名空間、PubMed 命名空間、OCLC WorldCat 會員 命名空間;

2. 詮 釋 資 料 已 在 註 冊 OpenURL 0.1 版 中 是 有 標 籤 的 (Van de Sompel, Hochstenbach & Beit-Arie, 2000),而 DC 和 MARCXML 也是有註冊的;而這 些詮釋資料格式不是從一個合於語法(Well-formed)的 XHTML 文件中的範本 產生出來,就是從 W3C XML 裡產生的。

至於 OpenURL 所定義的 ContextObjectFormats 有:

1. Key/Encoded-Value Format:用來呈現一組值其定義如 XHTML 範本所示;

2. 改為 XML 格式:OpenURL payload 是以 XML 實體文件所呈現的,此格式 定義由 W3C XML Schema 來定義。

Van de Sompel & Bergmark (2002) 指 出 NISO AX 標 準 委 員 會 建 議 將 OpenURL Registry 以 OAI-PMH 的形式來建置,以便 OpenURL 解析器利於更新 和擷取時所需的資訊。

在 OAI-PMH 裡的資源,就是在儲存褲裡的詮釋資料,即為 OpenURL 架構 中的核心份子,是由會員註冊來以利在其 OpenURL 環境中發佈。例如一個在 OAI-PMH 裡的資源可以用 OpenURL 中的 DOI 命名空間、OpenURL 中的 XML Metadata Format 來描述其類書本的物件;或 OpenURL 中的 Key/Encoded-Value ContextObject Format 來顯示 OpenURL 的空間(the payload of an OpenURL)。

每一個款目在註冊時會有一 OpenURL 的識別號,而後會成為 OAI-PMH 儲 存庫中 OAI 的識別號。目前 OAI-PMH 儲存庫裡支援了 3 種 OAI-PMH 的詮釋資 料格式,其 OAI-PMH 的詮釋資料前置元(Prefix)和特徵如下(Van de Sompel &

Young, 2003) :

1. oai_dc:DC 用來描述註冊的項目,即一個 DC 記錄就是一個註冊項目;

2. mfx:此 OAI-PMH 的詮釋資料格式是由 W3C XML Schema 對 XHTML 所做 的定義;其中 OAI-PMH 的詮釋資料格式是用來定義 OpenURL 架構中的 Key/Value 詮釋資料格式,另外在 OAI-PMH 中的記錄內容是以 XHTML 為 基的所定義在 OpenURL 中的詮釋資料格式;

3. xsd:此 OAI-PMH 的詮釋資料格式是由 W3C XML Schema 用來定義 W3C XML Schema 的。一個在 OAI-PMH 裡的 xsd 記錄可代表所有在 OpenURL 裡已註冊的 XML 詮釋資料格式;而且在 OAI-PMH 的記錄內容即為定義 OpenURL 中詮釋資料格式的 W3C XML Schema。

OAI-PMH 的儲存庫可因應不同需求而允許註冊,但其前提為需是 W3C XML Schema 所定義的,如:會員檔案資料應該被註冊以合於語法的 XML 實體出現,

不過此現象會與為特殊目的所定義的 W3C XML Schema 相衝突。

因此,如果此現象確實發生,則該儲存庫就應該要支援第四種的 OAI-PMH 之詮釋資料格式來採納此會員名單檔案。

為使符合 OAI-PMH 儲存庫的形式,因此會有一用來替代的架構,而此架構 裡的每一結果集(Set)就是 OpenURL Framework 裡的核心份子,而此結果集是用 來包含已註冊的是別號命名空間和字元編碼等。

Van de Sompel & Bergmark (2002)指出 OpenURL Registry 模組將註冊服務 (Registration Service)結合成聯邦式(Federates)的來提供以下服務見圖 2- 18:

1. 分散點(Distributed Nodes):負責管理使用 OpenURL 時會用到的 XML Schema;

2. 集中儲存庫(Central Repository):此項服務就是分散點與連結伺服器(Linking Servers)間的閘道(Gateway),以使兩者可以順利連結到資料庫綱要。

圖 2- 18 OpenURL Registry 模型

資料來源:Van de Sompel, H., Bergmark, Donna. (2002). A distributed registry for OpenURL Metadata Schemas with an OAI-PMH conformant central repository. IEEE Proceedings of the 2002 International Conference on Parallel Proceeding Workshops, 18-21 August 2002, Vancouver CA, pp. 470.

而此儲存庫中的集中點(Central Node)為分散點提供了以下的服務:

1. 提供登錄 XML Schema 的機制(A facility to register XML Schema);

2. 組成確認 XML Schema 的特殊開放需求(Open specific requirements)。

此外儲存庫提供利用 OAI-PMH 的擷取介面(Harvesting Interface)來支援連結 服務提供以下服務:

1. 辯識最近新註冊、更新和刪除的 XML Schema;

2. 追蹤關於新註冊 XML Schema 的複本。

只要有以下幾項核心屬性,則儲存庫即是符合 OAI-PMH 的儲存庫:

::

OAI-PMH poll registration

儲存庫

XML Schema

URL1

XML Schema

URLn XML Schema

URL2

註冊者

(Registrars)

連結伺服器

(Linking Servers)

polling registration

OAI-PMH harvesting

2. 款目(Item):在 OAI-PMH 裡是附有識別號(Identifier)資源的詮釋資料和註冊 XML Schema 網路位置的閘道;

3. 資料錄(Record):其表現型式有以下幾種方式:

(1) XML Schema 中關於無修飾詞的 Dublin Core(oai_dc);

(2) XML Schema 所定義的 XML Schema(xsi);

(3) 可以提供相關資源的新格式(poll)。

4. 結果集(Set):在儲存庫裡的架構有兩種形式:

(1) 符合 OpenURL 的版本;

(2) 利用 OpenURL 的指令:by-value 和 by-reference 來傳送詮釋資料。

5. Deletions:儲存庫在維護一致性上是有支援此一屬性的

由以上可以看出,當給定一值時,儲存庫會同時處理以下事項:

1. oai_record:登錄資訊。其時間戳記(Datestamp)即為紀錄該 XML Schema 是 何時登錄的。此值不變直到被刪除,刪除時會有”delete”的狀態訊息出現;

2. xsi_record:是一個登錄 XML Schema 的副本。其時間戳記是反應遠使資料 初次登錄的時間;此時間戳記會隨著維護工作做更新;

3. poll_record:是用來紀錄儲存庫中關於登錄 Schema 的遞迴情形。

以下幾種情形是儲存庫用來紀錄關於登錄的中 XML Schema 中 URLs 的情形:

1. HTTP status-code 200:當儲存庫不但會抓取在網路位置(Network Locations) 中的 XML Schema 時,也可以抓取其複本來做比對。

當遇到二者相異時,則複本會被取代,其 xsi_record 的時間戳記會依此 而更新;然 oai_dc-record 的時間戳記仍不變。新的款目會紀錄在 poll-record 裡,使其可與新的成功的 XML Schema 做比對(reflecting the successful polling of the Schema),而在 poll-record 的時間戳記是會更新的;

2. HTTP status-code 404:當儲存庫無法抓取在網路位置(Network Locations)中 的 XML Schema 時,則此時可以考慮取消註冊。此時 oai_dc-record 會收到 一個”刪除”的訊息,而其時間戳記會隨之更新。因為政策的限制,所以 XML Schema 的複本可以儲存在儲存庫裡也可以被刪除。

第一種情況下,在 xsi_record 的時間戳記不會改變,而第二種情況下,

xsi_record 會收到一個”刪除”的訊息,而其時間戳記會隨之更新。新的款目 會在 poll_record 裡產生,用來與失敗的 XML Schema 做對照,此時 poll_record 的時間戳記會隨之更新。在幾次不成功的更新後,儲存庫會取消 XML

Schema 的登錄,此方面的訊息會出現在 poll_record 裡以支援儲存庫做出相 關的對應動作。

儲存庫是利用 OAI-PMH 的檢索問句型態,來確保使用 OpenURL 時都是 XML Schema 型式的:

1. Poll-record 是紀錄有關於中央儲存庫中登錄 XML Schema 的遞迴情形。其時 間戳記反應最近的更新活動(polling-activity);

2. 經由時間戳記,oai_dc-records 提供關於 XML Schema 的登錄與取消登錄的 訊息;

3. xsi_records 提供新的 Schema 複本訊息。其時間戳記可反應 XML Schema 登 錄與更新的時間,另外依據其政策也可以看出何時被刪除。

由上述可以發現在此的 OAI-PMH 並不是利用其資源檢索的功能,在此是利 用中介媒體來擷取與發佈(Capturing and Exposing)關於分散物集合體的事件 (events occurring to a collection of distributed documents) ,是以此一模型應考慮到 數位物件的相關保護議題(Nelson & Allen, 2002)。

在文檔中 一、 互通性的需求 (頁 41-46)

相關文件