• 沒有找到結果。

第三章 以詮釋資料為基礎之存取控制

第一節 基本概念

3.1.1 詮釋資料模型(Metadata Model)

數位圖書館利用詮釋資料來描述數位物件,但是通常只用來描述藏品原件 (Original)的特性,代理物件(Surrogate)如圖檔、聲音和影片等的詮釋資料則因為 在資料檢索上較不重要,所以在著錄藏品資料的過程中常常會被忽略。但將詮釋 資料應用在存取控制時,代理物件的詮釋資料則非常重要,因為存取控制的對象 往往為代理物件。本論文中用於存取控制的詮釋資料不只包括原件的詮釋資料 (如創作者、權限範圍),也包括代理物件的詮釋資料(如創作者、權限範圍、資料 格式),但所操作的對象(指用來作存取控制的物件),則以代理物件為主。綜合上 述,以原件的詮釋資料為存取控制的條件時,所有該原件相關的代理物件皆受到 該條件所控制;當以代理物件的詮釋資料為存取控制的條件時,則只有符合該條 件的代理物件受到該條件控制。舉例來說,若一存取控制對象為所有蘇森墉的作 品,則此乃以原件的創作者為限制條件,因此所有作品包括樂譜圖檔、聲音、影 像...等,都將受該存取控制所限制;在另一方面,代理物件也有創作者,例如圖 檔掃描製作者等,但一般來說不具有作存取控制的意義。而以資料格式來說,雖 然原件也有此欄位,例如紙張、錄影帶等,但反過來說原件的資料格式通常亦不 具作存取控制的意義。本論文的討論將以原件的詮釋資料(如創作者、權限範圍)

及代理物件的詮釋資料(如資料格式)來作討論,依據 Swetland 對詮釋資料的分 飾語,我們為個別 DC 欄位建立修飾語階層(Qualifier Hierarchy)。階層內的修飾

Digital Original’s Metadata

Structure Metadata 2

\

Surrogate’s Metadata

Digital Material Key-metadata Original’s Metadata

Surrogate’s Metadata

Digital Material Key-metadata

語具有局部次序的關係,以πMQ表示,若修飾語 mq1具有比 mq2更特定的描述,

mq1 πMQ mq2表示。圖 13 及圖 14 分別是以資料格式及創作者來建立修飾語階 層的範例,其中,資料格式因為媒體類型(Medium)不同而分為 JPEG、TIFF、WMV...

等,而 JPEG 則又因解析度的不同分為高解析度及低解析度,高解析度為代理物 件的高品質圖檔,低解析度則為代理物件的縮圖;創作者則可分為作詞者 (Songwriter)、作曲者(Composer)、編曲者(Arranger)...等;其中具有

JPG res.

Low πMQ 、Lowres.πMQ Format 和Songwriter πMQ Creator等關係。

圖 13: 資料格式修飾語階層(Qualifier Hierarchy of FORMAT element)

圖 14: 創作者修飾語階層(Qualifier Hierarchy of CREATOR element)

如 3.1.1 所述,描述一個數位物件包含了原件及代理物件的詮釋資料,我們 用(o_id, o_name, state)來表示,o_id 為數位物件的識別;o_name 為此物件的名 稱;state 為(a1=v1, ... an=vn)的集合,a1, ... an為詮釋資料修飾語名稱,v1, ... vn為 對應的值。例如以下 Ex.1、Ex.2 及 Ex.3 三個數位物件:

天烏烏 樂譜 圖檔

(S004014,天烏烏,(Arranger=’蘇森墉’,Medium=’JPEG’))...[Ex.1]

天烏烏 合唱 影片

Creator

Songwriter Composer Arranger Format

JPG TIFF

Low res. High res. 56kbps 384kbps WMV

(M004014,天烏烏,(Arranger=’蘇森墉’,Medium=’WMV’,

BitRate=’384kbps’))...[Ex.2]

竹中校歌 合唱 影片

(M003001,竹中校歌,(Arranger=null,Medium=’WMV’,

BitRate=’384kbps’))...[Ex.3]

MBAC 利用(credentials, metadata, privilege)來描述一個授權,在 metadata 部分是 以實體(Entity)為授權單位,實體可以是特定的物件(藉由列舉(List)物件的識別) 或包含特定詮釋資料的物件(藉由詮釋資料表示式來表達)。我們修改定義 2.1 重 新定義實體為:

定義 3.1 (實體描述, Entity Specification)。物件描述可能為一個物件集合 2OI或者為詮釋資料表示式。2OI為物件識別的集合

詮釋資料表示式為一個物件集合,例如所有蘇森墉的作品,以

Composer=’蘇森墉’ ∨ Songwriter=’蘇森墉’ ∨ Arranger=’蘇森墉’...[C.1]

或 Creator=’蘇森墉’...[C.2]

來表示;而若要表示所有蘇森墉的表演影片,則可以

Creator=’蘇森墉’ ∧ Medium=’WMV’ ...[C.3]

來表示。

由於存取控制利用詮釋資料的欄位或修飾語來作限制,當有些欄位或修飾語 為空值時,則此物件不屬於該特定描述的集合,例如 Ex.1、Ex.2 符合 C.1 所描 述的集合,Ex.2 符合 C.3 所描述的集合,但是 Ex.3 卻都不屬於 C.1 及 C.3 的集 合。在此,我們利用 CBAM 所述 Denotes 及 Undef 來表示,例如:

Denotes(Creator=’蘇森墉’) = {Ex.1、Ex.2}

Denotes(Medium=’WMV’) = {Ex.2、Ex.3}

Denotes(Creator=’蘇森墉’ ∧ Medium=’WMV’) = {Ex.2}

Undef(Creator=’蘇森墉’ ∧ Medium=’WMV’) = {Ex.3}

第二節 存取控制模型

3.2.1 存取控制描述

在 MBAC 中,一個完整的授權如同 CBAM 中的一樣,包含四個元素:使用者(定 義 2.2)、實體、權力和正/負向符號,其中我們重新對實體作定義(定義 3.1),授 權的定義如下所述(沿用定義 2.3):

定義 3.2 (授權, Authorization)[1]。一個存取控制由四個元素所構成 (crd-spec, ent-spec, priv, sign),其中 crd-spec(Credential Specification)用來 描述該授權所授予權力的使用者;ent-spec(Entity Specification)用來描述 該授權所套用的物件;priv(Privilege)表示該授權所授予的操作權限為 何;sign 則用來表示該授權為正向或負向授權,分別用“+”及“- ”來表示。

所以,在 MBAC 中,授權亦可為正向授權或負向授權,正向授權表示可允許存 取,負向授權表示拒絕存取。底下是授權的範例:

1: (School=’NCTU’ ∧ Occupation=’UnderGraduate’,

Creator=’蘇森墉’ ∧ Medium=’JPG’ ∧ Resolution=’LOW’,View,+) 2: (School=’NTHU’,

Creator=’蘇森墉’ ∧ Medium=’JPG’ ∧ Resolution=’LOW’,View,-)

授權 1 表示所有交大大學部的學生可以瀏覽蘇森墉低解析度的樂譜圖檔,授權 2 則表示所有清大的學生不可以瀏覽蘇森墉低解析度的樂譜圖檔。因為存取控制除 了可以明確利用識別資料作辨識外,亦可利用使用者的身分資料或是物件的詮釋 資料來做權限控管,所以確認存取控制所套用的人及物是非常重要的。若有使用 者或實體描述所參考的資料欄位為空值的情形,我們將無法判斷該人/物是否應 該被該授權所控制。在 CBAM 中利用 Denoted Users 及 Denoted Objects 來表示受 存取控制所規範的人及物,根據 MBAC 的需求,我們修改定義 2.5 重新定義 Denoted Objects 為:

定義 3.3 (Denoted Objects)。假設 A 為一個存取授權,所有符合 A 的數 位物件必須具備下述條件,用 OA來表示:

l If ent-spec(A) ∈ 2OI, then OA = ent-spec(A) l If ent-spec(A) ∈ entity expression, then:

If sign(A) = “+”, then OA = Denotes(ent-spec(A));

If sign(A) = “-”, then OA = Denotes(ent-spec(A)) Undef(ent-spec(A)).

crd-spec(A), ent-spec(A), sign(A) 分別表示一個授權 A 中的使用者身份描述、實 體描述及正向或負向授權。

3.2.2 衝突解決策略

負向授權使存取控制描述更具彈性,但是也會帶來問題,當一個存取要求同 時擁有正向及負向授權時,系統將無法決定是否要接受或拒絕此要求。此類衝突 必須有效解決,才能使存取控制機制更有效地運作。本論文提出一套衝突解決策 略,利用使用者身份類型、詮釋資料及權力的階層觀念來解決這個問題,此策略 包含下列四點原則:

1. 根據使用者身份類型階層,擁有越特定描述的授權擁有較高的優先權。

2. 詮釋資料中擁有越特定描述的授權擁有較高的優先權。

3. 根據權力階層,擁有越特定描述的授權擁有較高的優先權。

4. 當以上都無法解決時,負向授權優先採用。

假設授權 3 如下

3: (School=’N CTU’,

Creator=’蘇森墉’ ∧ Medium=’JPG’ ∧ Resolution=’LOW’,View,-)

則若有一交大大學部的學生欲瀏覽蘇森墉低解析度的樂譜圖檔,此時授權 3 和授 權 1 同時符合此存取要求,因兩者一為正向授權,另一為負向授權,此時會產生 衝突,但是因為NCTUUndergraduate πCT NCTU,所以根據第 1 點原則,授權 1 擁有較高的優先權。

因為詮釋資料修飾語階層不像使用者身份或權力為單一階層,單一欄位及欄

位修飾語自成一個階層,如圖 13 及圖 14,因此詮釋資料中何謂擁有越特定的描 述?首先舉例說明詮釋資料表示式的衝突,及兩種衝突的類型(如圖 15),再進而 闡述何謂越特定的詮釋資料表示式。

圖 15: 跨階層及單一階層的衝突

例如有下列兩個存取控制分別為:

4: (School=’NCTU’,Creator=’蘇森墉’,View,+) 5: (School=’NCTU’,Medium=’WMV’,View,-)

則若一個使用者要瀏覽蘇森墉的影片,系統將無法判斷是否要同意其存取要求,

此情形屬於圖 15(a)的衝突(FORMAT 和 CREATOR 兩種階層的衝突);而若是如 下列兩個存取控制:

6: (School=’NCTU’,Medium=’WMV’,View,+)

7: (School=’NCTU’,Medium=’WMV’ ∧ BitRate=’384kbps’,View,-)

則依據資料格式修飾語階層,授權 7 擁有越特定的描述,因此拒絕使用者的存取 要求,此情形屬於圖 15(b)的衝突(FORMAT 階層內的衝突)。由此可知跨兩個階 層以上的衝突比單一階層的衝突較難克服,為了解決跨階層的衝突,底下為四種 可行的方法:

1. 為個別存取控制設定優先權 2. 為詮釋資料中的欄位設定優先權

3. 依據修飾語階層,只比較衝突的存取控制中相同的欄位 4. 為詮釋資料中的修飾語設定權重

方法 1 為最根本的解決辦法,若不存在兩個具有相同優先權的存取控制,則衝突

Qualifier Hierarchy Qualifier Hierarchy Qualifier Hierarchy

(a)inter-hierarchy (b)intra-hierarchy

即可迎刃而解,但是此方法也大幅增加了管理上的負擔,如優先權的給定。方法 2 則修改方法 1,改為設定詮釋資料欄位的優先權,若一存取控制含有較高優先 權的詮釋資料欄位,則優先採用該存取控制,但因為 DC 中每個欄位實為獨立的 描述,彼此相關性極小,因此如何設定優先權將是一個困難的課題。方法 3 則類 似單一階層的衝突解決辦法,比較有所衝突的存取控制中相同的欄位階層,但若 沒有相同的欄位則無法用此方法判斷。方法 4 則改採計權重的方式,欄位修飾語 階層中每個子節點權重皆為父節點權重的 a 倍,每個存取控制的詮釋資料表示式 權重為所有修飾語權重的總和,擁有較高的權重其優先權也越高,也就是說,擁 有越特定的詮釋資料表示式,正式定義為:

定義 3.4 (較特定的詮釋資料表示式)。假設 dlo 為數位物件,A1和 A2為 兩個授權,ent-spec(A1)和 ent-spec(A2)皆為詮釋資料表示式,且 dlo 為 A1和 A2的 denoted object,若 ent-spec(A1)中的詮釋資料修飾語權重∑W1

高於 ent-spec(A2)中的權重∑W2,則說 ent-spec(A1)比 ent-spec(A2)具有更 特定的詮釋資料描述。

如資料格式修飾語的權重給定 a = 10,則前述授權 6 和授權 7 其權重依圖 16 計 算分別為 1 和 11。

圖 16: 資料格式修飾語權重(a=10)

a 必須適當地給定大小,給定太小會產生困擾-含有 a 個權重為 1 的授權和 含有一個權重為 a 的授權將具有相同的優先權。所以在給定 a 的大小時,必須考 量每一欄位的修飾語可能個數,給予一個大於個數的值,本論文所有的舉例都以 a = 10 來討論。

衝突解決策略中的四點原則可利用較具權威性的授權來作定義,所謂較具權 Format

JPG TIFF

Low res. High res. 56kbps 384kbps WMV Weight=1

Weight=10

威性指的是該授權擁有較高的優先權,利用 CBAM 中的定義 2.6 和 2.8,及修改 定義 2.7 並重新定義較具權威性的實體描述為定義 3.5,定義 3.6 則沿用定義 2.8 中對較具權威性授權的定義。

定義 3.5 (較具權威性的實體描述, Stronger Entity Specification)。假設 dlo 為數位物件,A1和 A2為兩個授權,且 dlo 為 A1和 A2的 denoted object,

8: (School=’NCTU’ ∧ Occupation=’Graduate’,

Medium=’JPG’ ∧ Resolution=’HIGH’,View,+)

9: (School=’NCTU’ ∧ Occupation=’Graduate’,Creator=’蘇森墉’,View,+) 定義 3.6 (較具權威性的授權, Stronger Authorization)[1]。假設 u 為使用 者,dlo 為數位物件,A1和 A2為兩個授權,且 u 為 A1和 A2的 denoted user,

相關文件