• 沒有找到結果。

Spatial Reasoning and Similarity Retrieval for Image Database Systems Based on RS+-strings

N/A
N/A
Protected

Academic year: 2022

Share "Spatial Reasoning and Similarity Retrieval for Image Database Systems Based on RS+-strings"

Copied!
15
0
0

加載中.... (立即查看全文)

全文

(1)

影像資料庫系統之空間推論與相似度檢索植基於RS + -strings Spatial Reasoning and Similarity Retrieval

for Image Database Systems Based on RS

+

-strings

簡永仁

白貿元

靜宜大學資訊管理研究所

靜宜大學資訊管理研究所

[email protected] [email protected]

摘要

在影像資訊系統中,為了使影像檢索達到比對 更精確與查詢更快速的目標,發展一套良好的空間知 識表示法更顯得重要,透過空間知識表示法所儲存的 空間資訊作為影像索引,可支援空間推論與相似檢 索,以滿足使用者的需求。而RS-string與2D Z-string 乃著名的空間知識表示法,RS-string主要植基於極座 標系統,能夠達到旋轉不變之特性,而植基於卡笛生 座標系統的2D Z-string則藉由零切割機制,不僅縮減 字串長度且加入物件大小、位置、距離等計量資訊,

兩者都克服了2D string相關研究的一些缺點。然而,

我們發現在某些情況下,RS-string仍有精確度不足之 處,以致會做出相似比對的誤判。因此,在本文中,

我們以RS-string為基礎,排除在極座標系統中引用2D Z-string概念的困難,提出RS

+

-string空間知識表示 法,同時擁有了RS-string與2D Z-string的優點,進而 能夠達到更精確的空間推論與相似檢索。

關鍵詞:RS-string、RS

+

-string、2D Z-string、極座 標系統、相似度檢索

Abstract

In image information system, it is important to develop a well spatial knowledge representation in order to attain the goal that image retrieval can be much precisely and quickly. By spatial knowledge representation to store the spatial information, it can support spatial reasoning and similarity retrieval to help users query image to satisfy their request. RS-string and 2D Z-string are the two famous spatial knowledge representation. RS-string is based on polar coordinate system, so it can arrive at rotation-invariant. But, 2D Z-string is based on Cartesian coordinate system, its feature not only reduces the length of string by using zero-cutting but also records the metric information that includes the size of object、location and distance. Both of them overcome the drawbacks of the relative researches of 2D string. However, we find that RS-string can not attain much precisely similarity retrieval in some condition, so it may result in misjudging of similarity retrieval. Thus, in this paper, we propose a spatial knowledge representation which is based on RS-string

and we name it as RS

+

-string. At the same time, we overcome the difficulty to apply the concept of 2D Z-string to the polar coordinate system. In addition, RS

+

-string also has the advantages of RS-string and 2D Z-string, therefore it can attain much precisely spatial reasoning and similarity retrieval.

Keywords:RS-string、RS +

-string、2D Z-string、polar coordinate system、similarity retrieval

1. 前言

隨著電腦網路不斷的蓬勃發展,頻寬不斷地提升,

使得多媒體的相關應用日益普及,在傳統的資料庫系 統上是以文字方面的資料擷取為主,大部分在多媒體 擷取上較無支援,另外,隨著許多新的應用上的興 起,例如:辦公室自動化、電腦輔助設計、電腦輔助 製造、地理資訊以及工業零件搜尋等應用皆需要大量 的圖形資訊,使得在多媒體資料庫系統上的相關需求 與日俱增。

在影像資料庫系統上,當系統要識別影像時,必須 先經過影像處理取得影像中存在哪些物件,進而透過 這些物件的空間關係來做影像上的識別,而空間推論 (spatial reasoning)與相似度檢索(similarity retrieval)對 影像資料庫而言是兩個相當重要的功能,因此,如何 從影像裡萃取其特徵並且設計一種適當的圖像索引 (iconic indexing)來幫助影像儲存在資料庫裡以及如 何透過圖像索引來輔助做空間推論與相似度檢索也 就成為影像資料庫上的相當重要的議題。

在過去,學者們對於圖像索引的發展提出了許多相 關的研究成果,其中包含了以空間知識表示法(spatial knowledge representation)的相關研究,因此,藉由以 空間知識表示法為基礎的圖像索引,則可以用來支援 空間推論與相似度檢索,以幫助使用者做影像查詢。

然而,在此方面的相關研究,其最早可以追朔到Chang [14].所提出的 2D string。2D string 的精神為:以零大 小(zero-size)的物件來表示影像上的物件,然後,再以 直角系座標的投射方式將物件分別投射在x 軸與 y 軸 上,並且使用{'<','=',':'}-這三個空間知識來表達影像 物件在x 軸與 y 軸上的空間關係,因此,也就產生了 兩個維度的字串索引,其優點為保留了影像上物件之 間的空間關係(spatial relationship)以支援做空間推論。

1

(2)

然 而 ,2D string 僅 以 三 個 空 間 運 算 子 (spatial operator)來支援空間知識的表達,當應用在複雜的影 像時,則 2D string 無法給予較完整地空間描述。因 此,Jungert and Chang[13].藉由導入新的空間運算子 來對2D string 做擴充,即為 2D G-String,因此,2D G-string 的空間知識表示法比 2D string 更加完善,使 得 在 影 像 的 表 達 上 能 更 有 效 率 。 然 而 , 雖 然 2D G-string 解決了 2D string 在表達更複雜影像上的不 足,但是,由於 2D G-string 其本身使用的切割線 (cutting-line)架構,會將影像上物件重疊的關係-無論 是 完 整 重 疊(complete overlap) 或 是 只 有 部 分 重 疊 (partly-overlap),都切割成許多個子物件(subpart),因 此,在字串長度上,會增加儲存空間的負擔。

為了減少2D G-string 做切割線的次數以及經切割 後所產生出的子物件數量,Lee and Hsu[15]提出了 2D C-string,其表達方式也是以切割線架構為基礎,但 是,2D C-string 只針對當物件之間存在著部分重疊的 關係時才對物件做切割,因此,在使用切割線架構 上,2D C-string 會比 2D G-string 更有效率,並且也減 少因切割而產生出大量子物件的情況。同時,Lee and Hsu 也定義出七個空間運算子如表(1),來描述在單維 上物件彼此的空間關係。但因為2D C-string 在本質上 還是使用了切割線的架構,因此,假如使用過多切割 線的話,還是會造成儲存空間的負擔。

此外,因2D C-string 沒有紀錄物件的大小(size)、

位置(location)與物件之間的距離(distance)資訊,使得 2D C-string 的表達上會產生不明確的狀況,因此,

Huang and Jean[9]提出了 2D C

+

-string,其字串索引記 載著計量資訊(metric information),即:(1)物件的大 小 (2)距離資訊。因此,2D C

+

-string 在字串索引的表 達上會比2D C-string 更為精確。

雖然2D C

+

-string 克服了 2D C-string 不明確情況問 題的發生,但是,2D C

+

-string 與 2D C-string 在本質 上還是使用了切割線架構,因此,在最糟的情況下 (worst case),還是會因為使用過多的切割線而產生大 量的子物件,導致字串長度過長,造成儲存空間的負 擔。因此,為了克服使用切割線所產生的缺點,

Anthony and Chiu[1]提出了 2D Z-string。2D Z-string 因架構在零切割(zero-cutting)的方式之上,使得物件 不需要被切割成多個子物件,取而代之的是將物件一 一做合併(merge)。因此,2D Z-string 在字串長度上比 2D C

+

-string 較為精簡,故可降低儲存空間的需求,

而克服了2D C

+

-string 因使用過多的切割線所產生出 的缺點。此外,2D Z-string 也記載著計量資訊,因此,

也保有了2D C

+

-string 的優點。

上述的2D系列的字串都是植基於卡笛生座標系統 (Cartesian coordinate system),其共同的缺點為:當影 像經過旋轉後,則所產生的字串索引可能會與旋轉前 的字串索引不一致,而導致在相似度檢索上的誤判,

有鑑於此,Petraglia[4].提出了2D R-string。2D R-string 乃植基於極座標系統(Polar coordinate system),由一旋 轉中心物件(rotation center object)為起始,分別在同心 圓方向(ring-direction)與扇形方向(sector-direction)產 生出對應的空間關係字串,其字串索引的表達方式與 2D C-string的切割線架構相似。而在2D R-string的結

構上,是以一對的c-string與s-string來表達物件在同心 圓方向與扇形方向的空間關係,故2D R-string有著極 座標系統之旋轉不變(rotation-invariant)的特性而解決 了卡笛生座標系統的不足。

然而,2D R-string 的缺點在於其字串索引並沒有完 整地表達出中心物件,因此,缺少了中心物件與其他 物件之空間關係的訊息,使得會將原本不相似的影像 誤判成相似,此外,當選定不同的中心物件時,將會 產生不同的字串索引,因而容易將原本相似的影像誤 判成不相似。

在Hung and Jean[10]所提出的 RS-string 改善了 2D R-string 的缺點。RS-string 在其字串索引中,記載了 中心物件的資訊,故可以完整地表達出中心物件與其 他物件的空間關係,同時,RS-string 也維持了 2D R-string 之旋轉不變的優點,使得 RS-string 在相似度 檢索上能夠比2D R-string 更加精確。但是,假如使用 者希望能夠針對查詢影像做更進一步精確比對的 話,此時,便可發現RS-string 在精確比對上的不足。

另外,RS-string 並無記載計量資訊,因此,會和 2D C-string 一樣,可能會產生不明確的情況。

在本篇論文中,我們提出了植基於 RS-string 而改 良的空間知識表示法,稱為RS

+

-string。RS

+

-string 應 用了2D Z-string 之零切割架構,因此,在字串的長度 上,會比原本RS-string 精簡,並擁有了 RS-string 在 極座標系統上之旋轉不變的特性。同時,因RS

+

-string 在其字串中,參考了2D Z-string 的計量資訊,因此,

在相似度比對時,能夠比RS-string 更加精確且更能符 合使用者所下達的影像查詢之需求。

2. 先前研究

2D Z-string

2D Z-string 在 空 間 知 識 上 的 表 達 與 2D C-string、2D C

+

-string 一樣使用了如表(1)所示的七個 空間運算子,透過這七個空間運算子來表達了物件之 間 的 空 間 關 係 。2D Z-string 在字串中也有著 2D C

+

-string 記載計量資訊的優點,並且,因 2D Z-string 採用零切割的方法,改善了2D C

+

-string 在某些情況 下,可能因過多切割線造成大量子物件,導致字串長 度過長,增加儲存空間負擔的缺點,例如下圖(1)所 示,將物件們投射在 x 軸,比較 2D Z-string 與 2D C

+

-string 在 x 軸的字串長度,可以觀察出 2D Z-string 可降低字串長度的複雜度,然而,2D C

+-

string 因使 用較多的切割線,而使得在字串長度上會比較耗儲存 空間。因此,2D Z-string 的零切割架構更突顯出其優 點。

雖 然 ,2D Z-string 在 字 串 的 表 達 會 比 2D C

+

-string 更有效率,然而,它還是植基於卡笛生座標 系統,而卡笛生座標系統這一系列技術的共同特點 為:必須先將影像物件以直角系座標的投射方式分別 地投射在x 軸與 y 軸上,然後,透過物件在這兩軸上 的空間關係,分別地產生x 軸與 y 軸上的字串索引,

最後再以這兩軸的字串索引推論出任兩物件在影像 上的二元空間關係。因此,一旦將影像經過旋轉後,

(3)

3 則所得出來的字串索引可能會與原先的不一致,而導 致在相似度檢索上產生誤判。

表(1) 空間運算子的定義

Notations Conditions A < B end(A) < begin(B)

A = B begin(A) = begin(B),end(A) = end(B) A | B end(A) = begin(B)

A % B begin(A) < begin(B), end(A) > end(B) A [ B begin(A) = begin(B), end(A) > end(B) A ] B begin(A) < begin(B), end(A) = end(B) A / B begin(A) < begin(B) < end(A) < end(B)

2D C

+

u-string:A5]B3]C3]D2]E1|B3=C3=D3=E3|D2=E2|E1

2D Z u-string :(((A5/3(B6=C6))/5D7)/6E7) 圖(1)

RS-string

由於2D R-string 其字串索引缺乏了中心物件的 資訊,因此,無法完整的表達出全部物件之間的二元 空間關係(binary spatial relationships),然而,RS-string 在字串索引上則加入了中心物件的資訊,使得在推論 物件之間的二元空間關係能夠更加完善。因此,

RS-string 解決了 2D R-string 在相似度檢索時,會將原 本不相似的影像誤判成相似的缺失。另外,RS-string 在選擇中心物件時,會以較接近原點的物件為中心物 件,因此,在中心物件的選擇上,會比 2D R-string 更加明確,所以,可以避免因選擇不同的中心物件而 產生不一致的字串索引,故 RS-string 也克服了 2D R-string 另一項缺點-即會將原本相似的影像誤判成 不相似。

RS-string 其結構是由一對的 r-string 與 s-string 所組成的,而r-string 和 s-string 分別表達了影像物件 在同心圓方向與扇形方向的空間關係,並且,RS-string 在字串索引的表達上會與 2D C-string 有相似的表達 結構。RS-string 在字串索引的表達方式如下圖(2)所 示。

然而,RS-string 在某些的情況下,仍會造成相 似檢索的誤判,例如下圖(3.a)、圖(3.b)所示,這兩張 影像有相同的字串索引,因此,在 RS-string 的架構 下,此兩張影像會被判定為相似,然而,如圖所示般 的顯而易見,我們可以發現在圖(3.a)上的 A、B 兩物 件在扇形方向上的角度大小與圖(3.b)上的 A、B 兩物 件在扇形方向上的角度大小是不相等的,另外,在圖 (3.a)上的 A 物件,在同心圓方向上離中心物件比較 遠,然而,圖(3.b)上的 A 物件,在同心圓方向上卻離

中心物件比較近(B 物件亦然),因此,基於更加精確 比較的觀點,圖(3.a)和圖(3.b)是不相似的。

r-string

A<B=C]D=E|D=E]F=G|F=G s-string

A=(D']F|F](B<E)|E]G|G](C<D'')|D'')

圖(2)

RS-string

r-string: O < B / A s-string: O % ( A < B ) RS

+

-string r

+

-string:O1<8A1/B2

s

+

-string:O360%25(A40<160B15)

圖(3.a)

RS-string

r-string: O < B / A s-string: O % ( A < B ) RS

+

-string

r

+

-string:O1<1A1/B2

s

+

-string:O360%30(A100<60B35)

圖(3.b)

3. RS + -string

雖然RS-string 在字串索引的表達上,加入了中 心物件的資訊,而使得更能完整地表達出全部物件之 間的空間關係,進而克服了 2D R-string 之缺點,然 而,正如同上述的圖(3.a)、圖(3.b)所示,以肉眼的角 度來看,該兩張圖可以被認定為不相似,但經由 RS-string 的比對方式,則該兩張圖會被判定為相似,

故 RS-string 在其相似度檢索上,仍存在著盲點,因 此,在本研究中,我們主要參考2D Z-string 的計量資 訊以及零切割的概念,針對 RS-string 改良成為一個 新的空間知識表示法-RS

+

-string。

在卡笛生座標系統與極座標系統對於計量資訊 的表達上,雖然皆以數字型態的量化方式來表達,但 實際上,兩者如何求出計量資訊的方式卻有所不同。

卡笛生座標系統主要以直角系座標的投射方式將物

A

O

B

F

D

B

C E

G A

A B C

D E

A O

B

(4)

件投射到相對應的 x 軸與 y 軸,因此,就x 軸與 y 軸 而言,此兩軸會有ㄧ致性的計量資訊之產生方式。然 而,在極座標系統上,同心圓方向與扇形方向在產生 計量資訊的方式,並非如同在 x 軸與 y 軸上,具有一 致的生成方式,因此,同心圓方向與扇形方向對於計 量資訊的產生方式會有所不同。以下分別介紹同心圓 方向與扇形方向在計量資訊的產生方式。

‹

同心圓方向計量資訊的產生方式:

1. 首先是以原點為起始點,沿著同心圓方向往外擴 散出許多不同的同心圓。

2. 每一個物件與同心圓有著兩個正相切的點即為該 物 件 的 開 始 位 置(begin-bound) 與 結 束 位 置 (end-bound)。

3. 透過每個物件在同心圓上的開始位置與結束位置 來求出物件之間的計量資訊。

下圖(4.a)為同心圓方向上產生計量資訊的實 例,可以透過同心圓之間單位距離來推論出A 物件的 大小為1 (2-1),B 物件的大小為 3 (7-4),而 A、B 兩 物件之間的距離為2 (4-2)。

‹

扇形方向計量資訊的產生方式:

1. 首先是以原點為起始點,繪製一半直徑(half line) 並且將它放置於如圖(5.a)所示。半直徑從這個初 始位置做順時針的旋轉。

2. 當半直徑旋轉時,則每個物件會有兩個放射狀的 線段與其正相切而形成扇形面,而較接近初始位 置的放射狀線段稱為物件在扇形方向上的開始位 置,而另一個放射狀線段稱為結束位置。

3. 透過每個物件在扇型上的開始位置與結束位置來 求出物件之間的計量資訊。

下圖(4.b)為扇形方向上產生計量資訊的實例,可 以透過角度資訊來推論出A 物件的大小為 20

,B 物 件的大小為25

,而A、B 兩物件之間的距離為 30

。 在圖中,可以明顯觀察出同心圓方向與扇形方向在產 生計量資訊的不同點在於,同心圓方向是以單位距離 計算出計量資訊,然而,扇形方向卻以角度資訊來計 算出計量資訊。因此,同心圓方向與扇形方向在產生 計量資訊的方式上,會有所差異。

圖(4.a)

圖(4.b)

我們的RS

+

-string 主要是針對 RS-string 加入上 述的計量資訊,以求能透過更精確的比對,解決如圖 (3.a)及圖(3.b)相似比對誤判的問題。原本的 RS-string 是由一對r-string 與 s-string 所組成的,其分別表達了 影像物件在同心圓方向與扇形方向上的空間關係,而 RS

+

-string 在結構上與 RS-string 類似,其是由 r

+

-string 與s

+

-string 所組成的。r

+

-string、s

+

-string 不但改良了 r-string、s-string 所欠缺的不足,並且也和 r-string、

s-string 一樣,分別表達了物件在同心圓方向與扇形方 向的空間關係。RS

+

-string 除了改良了原本 RS-string 無法達到更加精確的相似度檢索之外,並且也維持了 旋轉不變的特性。總之,RS

+

-string 參考了在 2D Z-string 裡所提到的計量資訊,使得在相似度檢索上 能更加精確。此外,RS

+

-string 也應用了 2D Z-string 之零切割的架構,因此,在字串索引的長度上會比 RS-string 精簡。以下我們列出 2D Z-string[1]的字串生 成演算法:

Algorithm: String generation

Input: O1(B1E1), O2(B2,E2), ... , On(Bn,En) Output: a 2D u-string(or v-string)

1. Sort in non-decreasing order all the begin-bound points and end-bound points Bn, En, i = 1,2,…,n.

2. Group the same value points into a same-value-list.

Form a same-value-list sequence.

3. Loop from step 4 to step 8 for each same-value-list according to the non-decreasing order.

4. If there is no end-bound in the list, process the next same-value-list.

5. Find the dominating object from the objects in the same end-bound list so that the corresponding begin-bound of the dominating object is the smallest of them. Compute the size of the dominating object.

6. If there exist no objects partly overlapping with the dominating object, find the objects covered by the dominating object (including the dominating object itself). Call the template object generation algorithm with the covered objects as the input parameter.

7. If there exist objects partly overlapping with the dominating object, choose among them the object with the smallest end-bound. Let the chosen object be P. Perform the following three phrases.

(a) Find the objects covered by object P (including object P itself). Then call the template object

generation algorithm with the covered objects as

the input parameter. Let the returned template object be T1.

(b) Find the objects covered by the dominating object but not by object P (including the

A

B 60。 80。 110。

135。

1 A B

2 3 4 5 6 7

(5)

dominating object itself). Then call the template

object generation algorithm with the covered

objects as the input parameter. Let the returned template object be T2.

5 (c) Merge T1 and T2 into a new template object by

separators '(' and ')' with operator '/'. The distance associated with operator '/' is equal to the end-bound of object T2 minus the begin-bound of the object T1. The begin-bound of the template object is equal to the begin-bound of object T2. The end-bound of the template object is equal to the end-bound of object T1.

8. Collect the begin-bounds and end-bounds of the objects into the same-value lists.

9. Call the template object generation algorithm with all the remaining objects as the input parameter. Output the representation of the final object. This is the u- (or v-)string.

由於 RS

+

-string 改善 Hung and Jean 所提出的 RS-string,因此,在字串索引生成的步驟與 RS-string 極為相似,以下分別描述r

+

-string 和 s

+

-string 的字串 生成演算法:

演算法: 在同心圓方向之字串生成演算法 輸入: 一張被分割的影像與極座標系統的原點 輸出: r

+

-string

1. 以原點為起始點沿著同心圓方向往外擴散出許多 不同的同心圓,每一個物件與同心圓有著兩個正 相切的點即為該物件的開始位置(begin-bound)與 結束位置(end-bound),而較接近原點的點稱為開 始位置,較遠的點為結束位置。

2. 假如有一個物件包含著原點,則定義該物件在同 心圓方向的開始位置為0。

3. 得到一列S1(B1E1), S2(B2,E2), ... , Sn(Bn,En),其中 Si是物件符號,Bi和Ei是物件Si在同心圓方向的 開始位置與結束位置,i = 1 , 2 , ... , n。

4. 應用 2D Z-string 的字串生成演算法得到一串 r

+

-string。

演算法: 在扇形方向之字串生成演算法 輸入: 一張被分割的影像與極座標系統的原點 輸出: s

+

-string

1. 以原點為起始點,繪製一半直徑(half line)並且將 它放置於如圖(5.a)所示。半直徑從這個初始位置 做順時針的旋轉而最後會停止在相同的位置。在 扇形方向上任何位置的座標軸是介於0。到 360。

之間。當半直徑旋轉時,則每個物件會有兩個放 射狀的線段與其正相切而形成扇形面,而較接近 初始位置的放射狀線段稱為物件在扇形方向上的 開始位置,而另一個放射狀線段稱為結束位置。

2. 假如有一個物件O 在初始位置為 0 的地方被半直 徑切割的話,則O 物件會被視為有兩個邊對邊相 接的O'物件與 O''物件,如圖(5.b)所示,O'的開始 位置會與O''的結束位置相同。在圖(5.b)中,O'物 件、O''物件與中心物件 B 的開始位置與大小分別

為O'(0,30)、O''(320,40)和 B(0,360)。

3. 假如有一個物件包含著原點,則分別定義該物件 在扇形方向的開始位置與結束位置為0。與 360。 。 4. 得到一列S1(B1E1), S2(B2,E2), ... , Sn(Bn,En),其中

Si是物件符號,Bi和Ei是物件Si在扇形方向的開 始位置與結束位置,i = 1 , 2 , ... , n。

5. 應用 2D Z-string 的字串生成演算法得到一串 s

+

-string。

130。

160。

圖(5.a)

圖(5.b)

下圖(6)為一個 r

+

-string 與 s

+

-string 在表達方式 上的實例,其分別表達了影像物件在同心圓方向與扇 形方向的空間關係。在RS

+

-string 的字串中,因記載 了計量資訊(metric information) ,所以可以觀察出其 在字串索引的表達上比RS-string 能更加精確。此外,

在圖(3.a)與圖(3.b)中,假如以 RS

+

-string 的方式來表 達其字串索引的話,則在相似度比對時,可判別出此 兩張影像是不相似的,進而破除了原本的 RS-string 在相似度比對上的盲點。同時,我們也在 RS

+

-string 中應用了2D Z-string 之零切割(zero-cutting)的架構,

因此,RS

+

-string 與 2D Z-string 一樣在字串索引的表 達上,會比較精簡。

r

+

-string

(O1<2((D2/1(A2=C2=I2=J2))/1(B2=G2))) s

+

-string

(O360=(D'25<10(((A25/5B60)/5C25)<90(((I25/5G60)/5J25)<10

D''25))))

O'

O'' B

O

30。

40。

B

D

A C

O

J I

G

圖(6)

(6)

4. 影像重建演算法

在這一小節裡主要介紹影像重建演算法(picture reconstruction algorithm),透過影像重建我們可以將 RS

+

-string 轉換成符號圖像(symbolic pictures)以幫助 使用者在下達影像查詢的指令後,可以針對從資料庫 檢索出來的影像做視覺化的瀏覽(visual browsing)。

以下說明在影像重建演算法裡所使用到的字串 物件W(string object)與符號物件(symbolic object)O 之 符號標記。字串物件 W 代表著一個給定的 r

+

-string 或s

+

-string 裡的符號,在此所提及的符號包含有在字 串中代表影像物件的符號或是字串中代表空間運算

子的符號,而每一個字串物件 W 則有兩個相對應的

欄位,分別為W.sym 和 W.size。W.sym 表達了在字串 裡的符號(影像物件與空間運算子),然而 W.size 表達 了在字串中每一個影像物件所相對應的大小以及空 間運算子的距離資訊-即 (1)當 W.sym 所表達的是影 像物件時,例如圖(6)中的 s

+

-string 裡的 O 物件,則 W.sym='O'以及 W.size=360;(2)當 W.sym 所表達的是 空間運算子時,例如圖(6)中的 r

+

-string 裡的'<'運算 子,則 W.sym='<'以及 W.size=2。而在這些空間運算 子當中,除了'<'、'%'和'/'之外,其餘的運算子( '='、'|'、

'['、']' )的 W.size 欄位一律設置為 0。

相似地,影像物件O表達了符號圖像裡的物件,

每 一 個 影 像 物 件 有 三 個 相 對 應 的 欄 位 - 分 別 為 O.sym、O.size.與O.location。O.sym表達了符號物件 (symbolic object),O.size表達了符號物件的大小,

O.location則是表達符號物件的空間位置。RS

+

-string 在字串索引的主體上,乃植基於2D Z-string之零切割 架構,因此,在影像重建的結構上,會與2D Z-string 的影像重建有相似的流程。在同心圓方向的影像重建 執行步驟源自於2D Z-string[1]。以下為r

+

-string與

s+-string

之影像重建演算法執行步驟:

演算法:同心圓方向影像重建演算法

輸入:含有n個元素的r

+

-string: string = (W1, W2, ... Wn)

輸出:一串列的影像物件(O1, O2, ... Om)

1. Loc = 0; Object_List = null; Stack = null; i = 1; j

= 0; MoreOperators = False; /*Initialization*/

2. 假如在字串中還有任何剩餘的元素內容的話,則 goto 4; 否則輸出Object_List並且離開程式。

3. Loop from 步驟3.(a) ~ 步驟3.(b) 假如MoreOperators = true , 則

(a) i = i + 1; MoreOperator = false /* next operator */

(b) case Wi.sym

"%": Loc = Loc + Wi.size; i = i + 1;

"< ": Loc = Loc + PreviousObjectSize + Wi.size; i = i + 1;

"/ ": Loc = Loc + PreviousObjectSize – Wi.size; i = i + 1;

"| ": Loc = Loc + PreviousObjectSize;

i = i + 1;

"]":

假如 Wi+1.sym ≠ "(" , 則:

TemplateSize = Wi+1.size;

else

TemplateSize=GetTemplateSize(i+1,str ing);

Loc = Loc + PreviousObjectSize - TemplateSize; i = i + 1;

"=" or "[": i = i + 1;

")":

從堆疊移出一個template object W;

Loc = W.beginBound;

PreviousObjectSize = W.size;

MoreOperators = True;

4. Loop from 步驟 4.(a)~步驟 4.(c) (a) 假如Wi.sym = ' ( ' , 則

建立一個相對應的template object W;

W.beginBound = Loc;

W.size = GetTemplateSize(i,string);

(b) 將此 template object W 放入到堆疊中;

(c) i = i + 1;

5. 假如 Wi是個字串物件的話 , 則

j = j + 1;

建立一個新的物件 Oj

Oj.sym = Wi.sym;

Oj.size = Wi.size;

Oj.beginBound = Loc;

將此物件Oj附加到Object_List;

6. PreviousObjectSize = Wi.size;

7. MoreOperators = True; go to Step 3

演算法:扇形方向影像重建演算法

輸入:含有n個元素的s

+

-string: string = (W1, W2, ...

Wn)

輸出:一串列的圖示物件(O1, O2, ... Om)

1. 與同心圓方向影像重建相同的(1)~(7)步驟。

2. 假如有存在著兩個物件Oi與Oj,而此兩物件是被 半直徑在初始位置為0的地方所切割的物件之子 物件的話,並且Oi的位置為0的話,則:

(a) 合併Oi、Oj兩物件,則Oi開始位置會成為 Oj的開始位置。

(b) 從 Object_List 移除 Oj。

5. 空間推論

Lee 和 Hsu[15]指出任兩個物件在單一維度上總 共會有 13 種的空間關係。相似地,在極座標系統上

任兩個物件在同心圓方向或在扇形方向上也會有 13

種的空間關係。藉由推論物件之間的空間關係,可以 幫助使用者做相似度檢索的查詢。由於在 RS

+

-string 的字串中,記載了物件的計量資訊,因此,一旦將字 串索引經由影像重建後,可以得到每一個物件重建後 的位置、大小,之後再將兩兩物件透過 Huang and Jean[9]所提出的決策樹(圖(7)所示)以求出正確的空

(7)

間關係。由於極座標系統之旋轉不變的特性,使得在 同心圓方向與扇形方向的空間推論(spatial reasoning) 演算法有些許的不同,以下分別介紹同心圓方向與扇 形方向的空間推論演算法:

7 演算法:同心圓方向空間推論演算法

輸入:OA與OB兩個影像物件

輸出:A、B 兩物件在同心圓方向的二元空間關係 1. XA = OA

.

beginBound; l

A

x = OA

.

size;

XB = OB

.

beginBound; l

B

x = OB

.

size;

2. 使用決策樹找出A 物件與 B 物件之間的二元空間 關係。

演算法:扇形方向空間推論演算法 輸入:OA與OB兩個影像物件

輸出:A、B 兩物件在扇形方向的二元空間關係 1. BA = OA

.

beginBound; SA = OA

.

size;

BB = OB

.

beginBound; SB= OB

.

size;

2. If( (0<=BB<BA+SA-360)

&&

(BB+SB>BA+SA-360) ) then BB = BB+ 360;

If( (0<=BA<BB+SB-360)

&&

(BA+SA>BB+SB-360)) then BA = BA + 360;

If ((BB >= 0&&(BB+SB < BA+SA-360)) then BB = BB + 360;

If ((BA >= 0 && (BA+SA<BB+SB-360)) then BA = BA + 360;

If ((BB>=0&&(BB+SB==BA+SA-360)) then BB = BB + 360;

If ((BA>=0&&(BA+SA==BB+SB-360)) then BA = BA + 360;

If ((BB == BA+SA-360)) then BB= BB + 360;

If ((BA==BB+SB-360)) then BA = BA + 360;

If( (BB==0&&BB+SB==360)&&(BB+SB<BA+SA)) then SB = SB * 2;

If( (BA==0&&BA+SA==360)&&(BA+SA<BB+SB)) then SA= SA * 2;

3. XA = BA; l

A

x = SA; XB = BB; l

B

x = SB ;

4. 使用決策樹找出A 物件與 B 物件之間的二元空間 關係。

在同心圓與扇形方向空間推論演算法中,XA代表 物件A 的開始位置(begin-bound),l

A

x則是物件A 的 大小(size);XB代表物件B 的開始位置,l

B

x則是物件 B 的大小。在圖(5.b)中,字串索引的表達為( B360=(O'30

<290 O''40) ),值得注意的是,因為 O 物件被半直徑(half line)在初始位置為 0 的地方切割成兩個子物件,因 此,O 物件被切割成 O'與 O''兩個子物件,而此兩子

物 件 的 開 始 位 址 與 大 小 分 別 為 O'(0,30) 與 O''(320,40),因為 O'與 O''是相同物件的子物件,因此,

在扇形方向之空間推理演算法中必須將它們合併為 單 一 的 物 件 , 故 合 併 後 的 開 始 位 址 與 大 小 為 : O(320,70) , 而 中 心 物 件 B 的 開 始 位 置 與 大 小 為 B(0,360),因為 O 物件是由 O'和 O''兩個子物件所組 成,故在扇形方向的空間推理必須將B 物件的計量資 訊做暫時性的局部微調(tuning),以求出 O 物件與 B 物件正確的空間關係。在圖(8)的幾種情況也需要將物 件的計量資訊做暫時性的局部微調,以得到正確的空 間關係。這幾種情況的微調與RS-string 的微調情況相 似 , 但 因 為 RS-string 在 空 間 推 論 使 用 了 開 始 列 (begin-rank)與結束列(end-rank)的概念來代表影像物 件 在 邏 輯 上 的 開 始 位 置(begin-bound) 與 結 束 位 置 (end-bound),然而,RS

+

-string 在其字串中,則因多 了計量資訊的記載,故其意義上會比RS-string 更加精 確地表達出物件在空間上的開始位置與結束位置。

圖(7)

6. 相似度檢索

相似度檢索(similarity retrieval)是影像資料庫系 統的重要功能之一,當使用者對影像資料庫系統下達 相似度檢索的查詢時,則系統會在查詢影像與資料庫 影像之間做相似度比對,以過濾出相似的影像。當任 兩張影像被判斷相似時,則查詢影像中的物件集合必 定為資料庫影像中物件集合的子集合,另外,空間關 係在影像辨識上,亦是相當重要的特徵,所以,可透 過這兩項特點來過濾許多不相似的影像。

除此之外,角度旋轉的因素也會影響相似度檢 索的結果,例如2D string 這一系列相關的字串索引研 究,其主要是透過直角系座標的投射方式來判斷物件 之間的空間關係,因此,假如將影像經過旋轉後,則 產生出的字串索引往往會與旋轉前的不一致,進而產 生影像檢索的誤判。因此,對於一個良好的影像資訊 系統而言,即使影像經過任何角度的旋轉後,則也不 會影響其影像比對的結果。由於RS

+

-string 是植基於 極座標系統,因此,有著旋轉不變的優點。另外,因 RS

+

-string 在字串中,額外記載了計量資訊,所以,

(8)

A(325 , 75) and A(325 , 75) and B(0 ,25) Ö B(360 , 25) B (10 , 25) Ö B (370 , 25)

Î A %35 B Î A %45 B

A(325 , 75) and

B(15 , 25) Ö B(375 , 25) Î A ] B

A(325 , 75) and

B(20 , 40) Ö B(380 , 40) Î A /20 B

A(325 , 75) and

B(40 , 30) Ö B(400 , 30) Î A | B

A(325 , 75) and

B (0 , 40) Ö B (360 , 40) Î A ] B

A(325 , 75) and B (0 , 60) Ö B (360 , 60) Î A /40 B

A(325 , 75) and B (0 , 360) Ö B (0 , 720) Î A %325 B

A B

325。

B 40。

A

325。

40。 70。

B A

325。

40。 60。

B

A

325。

20。

40。 60。

B A

325。

40。

B A

325。

15。

40。

B A

325。

10。

35。 40。

B A

325。

25。

40。

圖(8)

(9)

我們可允許使用者在下達相似度檢索的查詢時,可以

9 動態調整所容許的誤差值,使得影像資訊系統在做影 像查詢時,不至於因計量資訊的條件太嚴苛而難以找 出相似的影像,此外,也因為在RS

+

-string 加入了計 量資訊進行相似度檢索,故使用者可以針對查詢影像 與資料庫影像做進一步的精確比對。以下介紹了 RS

+

-string 在相似度檢索時所用到的一些符號標記以 及在相似度之型別的定義式,而這些符號標記以及定 義 式 是 源 自 於 Huang and Jean[10] 所 提 出 的 RS-string。稍後,我們也會介紹 RS

+

-string 在精確比 對上所定義的符號標記與相似度之型別的定義式。

z

rABR :A物件與B物件在同心圓方向上的空間關係。

z

rABS :A物件與B物件在扇形方向上的空間關係。

z

C

f (

rABR

,

rABS

)

:A 物件與 B 物件在影像 f 上的類別空 間關係(category spatial relation)之集合,而rABR 是同 心圓方向上的空間關係,rABS 是扇形方向上的空間 關 係 ,C

f

∈{ DISJOINT, JOIN, PARTOVLP,

CONTAIN, BELONG }並且這五個類別空間關係可 以分別可以被縮寫成d、j、p、c、b。

z

Ofq:在查詢影像fq裡的全部物件的集合。

z

Ofd:在資料庫影像fd裡的全部物件的集合。

z

fq

R

rc

在查詢影像fq中,其以C物件為旋轉中心 (rotation center)在同心圓方向的全部二元空間關係 的集合(binary spatial relations)。

z

fq

R

sc

在查詢影像fq中,其以C 物件為旋轉中心在 扇形方向的全部二元空間關係的集合。

z R

rcfd

在資料庫影像fd中,其以C物件為旋轉中心 在同心圓方向的全部二元空間關係的集合。

z R

scfd

在資料庫影像fd中,其以C物件為旋轉中心

z O

rdcfq:在查詢影像fq中,其以C物件為旋轉中心 (rotation center),在同心圓方向之全部物件的計量 資訊(metric information)的集合。以下為其定義式:

{ O1 r O2 (O1-size , O2-size , distance) , O1 r O3 (O1

size , O3 size , distance) , O1 r On (O1-size , On-size , distance) , … , On-1 r On (On-1-size , On-size , distance) } , r 為 兩 物 件 之 間 的 二 元 關 係 (binary relation)並且n≥2。

z O

sdcfq :在查詢影像fq中,其以C物件為旋轉中心,

在扇形方向之全部物件的計量資訊的集合。以下為 其定義式:{ O1 r O2 (O1-size , O2-size , distance) , O1

r O3 (O1 size , O3 size , distance) , O1 r On (O1-size , On-size , distance) , … , On-1 r On (On-1-size , On-size , distance) },r為兩物件之間的二元關係,並且n≥2。

z O

rdcfd:在資料庫影像fd中,其以C物件為旋轉中心,

在同心圓方向之全部物件的計量資訊的集合。以下 為其定義式:{ O1 r O2 (O1-size , O2-size , distance) , O1 r O3 (O1 size , O3 size , distance) , O1 r On (O1-size , On-size , distance) , … , On-1 r On (On-1-size , On-size , distance) },r為兩物件之間的二元關係,並且n≥2。

z O

sdcfd:在資料庫影像fd中,其以C 物件為旋轉中心,

在扇形方向之全部物件的計量資訊的集合。以下為 其定義式:{ O1 r O2 (O1-size , O2-size , distance) , O1

r O3 (O1 size , O3 size , distance) , O1 r On (O1-size , On-size , distance) , … , On-1 r On (On-1-size , On-size , distance) },r 為兩物件之間的二元關係,並且 n≥2。

定義 5.3

假如資料庫影像fd與查詢影像fq符合空間型相似,

並且

O

rdcfq

O

rdcfd ,但是不符合

O

sdcfq

O

sdcfd ,則它們 為同心圓型計量相似(Ring-metric-similar)。

定義 5.4

假如資料庫影像fd與查詢影像fq符合空間型相似,

並且Osdcfq ⊆Osdcfd,但是不符合Ordcfq⊄Ordcfd ,則它們 在扇形方向的全部二元空間關係的集合。 為扇狀型計量相似(Sector-metric-similar)。

定義 5.1 定義 5.5

假如任兩個物件A、B∈O

f

q,同時A、B∈O

f

d以致於 假如資料庫影像fd與查詢影像fq符合空間型相似,

C

f

q(rABR

,

rABS ) = C

f

d(rABR

,

rABS ),則資料庫影像fd與查詢 並且同時符合 ,則它們

fq

Ordc Ordcfd Osdcfq Osdcfd 影像fq是類別型相似(category-similar)。 為RS 型計量相似(RS -metric-similar)。

定義 5.2

在本文中所提的 RS

+

-string 之相似度檢索演算 法,主要是以原本RS-string 的相似度檢索演算法為基 礎,進而再做其他方面的擴充,因此,在相似比對時,

可以比 RS-string 過濾出更相似的影像。以下介紹 RS

+

-string 在相似度檢索演算法的執行步驟。

假如資料庫影像fd與查詢影像fq符合類別型相似,並 且

R

rcfq

R

rcfd

R

scfq

R

fdsc,則資料庫影像fd與查詢 影像fq是空間型相似(spatial-similar)。

由於RS-string 在相似度檢索時,最多只能比對 到任兩物件之空間型態的相似,所以,假如將影像中 任兩物件之間的距離資訊列為相似度檢索的考量 時,則可以發現RS-string 無法滿足此方面的需求。因 此,為了讓 RS

+

-string 能夠達到更進一步的精確比 對,以下我們定義了RS

+

-string 在精確比對上所使用 到的符號標記以及在相似度之型別的定義式。

(10)

演算法:相似度檢索演算法

輸入:一張查詢影像以及一連串用RS

+

-string 所表達 的資料庫影像

輸出:Category_Similar_List Spatial_Similar_List Ring-Metric_Similar_List Sector-Metric_Similar_List RS-Metric_Similar_List

1. 分別以查詢影像 f

q

裡的每一個物件為旋轉中心 產生所相對應的RS

+

-string。

2. 在每一個以RS

+

-string 表達資料庫影像 fd之中,

假如O

f

q ⊆ O

f

d

並且fd的旋轉中心也是在O

f

q

當中,則

(a) 在同心圓方向與扇形方向使用空間推論演 算法來推斷出在

R

fdrc

R

fdsc中的全部二元 空間關係,然後再從

R

rcfd

R

fdsc推論出類 別型空間關係C

f

d。

(b) 在步驟 1 對 fq所產生出的RS

+

-string 之中,

挑 選 出 與 目 前 fd 有 相 同 旋 轉 中 心 的 RS

+

-string,接著透過同心圓方向與扇形方

向的空間推論演算法來推斷出在 與

中的全部二元空間關係,最後再從 與 推論出類別型空間關係C

f

q。

fq

R

rc fq

R

R

sc

R

fq rc

fq sc

(c) 假如 fd與fq是類別型相似的話,則 (1) 將 fd加入到Category_Similar_List。

(2) 假如 fd與 fq是空間型相似的話,則將 fd加入到Spatial_Similar_List。

(2.1)假如 fd與fq滿足空間型相似,並 且fd與fq符合同心圓型計量相似,但 不符合扇狀型計量相似,則將fd加入 到Ring-Metric_Similar_List。

(2.2)假如 fd與fq滿足空間型相似,並 且fd與fq符合扇狀型計量相似,但不 符合同心圓型計量相似,則將fd加入 到Sector-Metric_Similar_List。

(2.3)假如 fd與fq滿足空間型相似,並 且fd與fq同時符合同心圓型計量相似 與扇狀計量相似,則將fd加入到 RS-Metric_Similar_List。

3. 回傳Category_Similar_List、

Spatial_Similar_List、Ring-Metric_Similar_List、

Sector-Metric_Similar_List 和 RS-Metric_Similar_List。

由於 RS

+

-string 在字串索引上,加入了計量資 訊,所以,更能精確地表達任兩物件在影像上的空間 關係,例如在圖(10.p)中,中心物件A 與非中心物件 B 是'['的空間關係,但是,假如以 RS-string 的方式來表

達的話,則中心物件與非中心物件都固定為'%'的空間 關係。因此,RS

+

-string 比 RS-string 更能精確地表達 任兩物件在影像上的空間關係,同時,RS

+

-string 也 有著RS-string 在極坐標系統上之旋轉不變的特性。

因此,基於上述的觀點,當使用者下達影像查 詢時,RS

+

-string 在扇形方向上,必須忽略中心物件 與非中心物件的比對。例如,在圖(10.p)與圖(10.q)是 兩張相似的影像,然而,圖(10.q)是圖(10.p) 的順時針 旋轉45。的版本,我們可以發現

R

sAfp

R

sAfq(∵A[B≠A%

B),因此,假如將扇形方向上的中心物件與非中心物 件列為相似度比對項目的話,則圖(10.p)與圖(10.q)比 對後的結果會被判定為不相似,而這樣的結果嚴重地 違反極座標系統之旋轉不變的特性,所以,RS

+

-string 在扇形方向的相似度檢索上,必須忽略中心物件與非 中心物件的比對。同理,在扇形方向上,中心物件與 非中心物件之計量資訊的比對亦是如此,例如,在圖 (10.p)與圖(10.q)中,可以觀察出 fp

,所以,

OsdA OsdAfq

RS

+

-string 在扇形方向之精確的比對上,必須忽略中 心物件與非中心物件之計量資訊的比對。因此,為了 不違反旋轉不變之特性的情況下,在RS

+

-string 的扇 形方向上,我們只比對非中心物件彼此之間的空間關 係以及其計量資訊。

在圖(11)中,我們列舉了 RS

+

-string 在相似度檢 索演算法的例子,其中,fq是一張使用者所下達的查 詢影像,而f1、f2、f3、f4、f5、f6、f7則是資料庫裡的 影像。以下分別敘述相似度比對後的結果:

z

f1與fq不相似:因為Ofq

Of1,所以f1與fq為不相似。

z

f2與fq不相似:因為 C

f

q

C

f

2,所以f2與fq為不相 似。

z

f3與fq為類別型相似:因為 Cfq⊂Cf3,並且

R

sAfq

R

fsA3,但是

R

rAfq

⊄ R

rAf3,所以f3與fq為類別型相似。

z

f4與fq為空間型相似:因為 Cfq⊂Cf4,並且

R

rAfq

4,以及 ⊂ ,所以f4與fq為空間型相似。

R

frA

R

sAfq

R

fsA4

z

f5與fq為同心圓型計量相似:因為f5與fq符合空間 型相似的條件,並且OrdAfq ⊆Ordcf5,但是Osdcfq ⊄Osdcf5, 所以f5與fq為同心圓型計量相似。

z

f6與fq為扇狀型計量相似:因為f6與fq符合空間型 相似的條件,並且Osdcfq ⊆OsdAf6,但是OrdAfq ⊄OrdAf6

,所以f6與fq為扇狀型計量相似。

(11)

11

fq

S

+

-string:( A360 [ (B35 <90 C20) ) S

+

-string:( A360 %45 (B35 <90 C20) )

fp

R

sA

OsdA

: {A[B, A%C, B<C}

R

sAfq: {A%B, A%C, B<C}

OsdA

fp : A360[B35 (360,0,35) fq : A360<45B35 (360,45,35) A360<125C20 (360,125,25) A360<170C25 (360,170,25) B35<90C20(35,90,20) B35<90C20 (35,90,20)

圖(10.p)

圖(10.q)

f

q

f1

Center object:A

r

+

:( A1 <4 (B3 %1 C1) )

R

rAfq:{ A<B , A<C , B%C }

R

sA

s

+

:( A360 %50 (B25 /5 C45) ) :{ A%B , A%C , B/C } Cfq

=

{ AdB , AdC , BpC }

fq

OrdA

OsdA

:{ A<4B (1 , 4 , 3) , A<5C (1 , 5 , 1) , B%1C (3 , 1 , 1) }

fq :{ A%50B (360,50,25) , A%70C (360,70,45), B/5C (25,5,45) }

Ofq

Of1

f1 is not category-similar to fq. f1 is not spatial-similar to fq.

圖(11)

B

A B C

A

B

A C

B A

C

(12)

B C

A

f2

f3

f4

r

+

:(A1<2(B3/1(C3=D3)))

R

rAf2:{ A<B, A<C, A<D, B/C, B/D, C=D } s

+

:(A360%35((B35[D25)<30C35))

R

fsA2:{ A%B, A%C, A%D, B<C, B[D, D<C }

B D C

OrdAf2:{ A<2B (1,2,3), A<4C (1,4,3), A<4D (1,4,3), B/1C (3,1,3), B/1D (3,1,3) , C=D (3,0,3) }

OsdAf2:{ A%30B (360,35,35) , A%100C (360,100,35) , A%30D (360,35,25) ,

A

B<30C (35,30,35) , B[D (35,0,25 ) , D<40C (25,40,35 ) } Cf2

=

{ AdB , AdC , AdD , BdC , BpD , CdD }

Cfq⊄Cf2Æf2 is not category-similar to fq.

r

+

:(A1<2((D3/2B3)/2C4))

R

rAf3:{ A<B, A<C, A<D, B/C, D

/

B, D/C } s

+

:(A360%60((B30/10C30)/40D30))

R

sAf3:{ A%B, A%C, A%D, B/C, B

<

D, C/D }

C

OrdAf3:{ A<3B (1,3,3), A<4C (1,4,4), A<2D (1,2,3), B/2C (3,2,4),

B

D/2B (3,2,3), D<1C (3,1,4)}

OsdAf3:{ A%60B (360, 60, 30) , A%80C (360, 80, 30) , A%150D (360, 150, 30) ,

D

A

B/10C (30, 10, 30) , B<55D (30, 55, 30) , C<40D (30, 40, 30 ) }

Cf3

=

{ AdB , AdC , AdD , BpC , BdD , CdD } Cfq ⊂Cf3Æf3 is category-similar to fq.

fq

R

sA

R

sAf3 but

R

rAfq

⊄ R

rAf3 Æ f3 is not spatial-similar to fq.

r

+

:(A1<3((B3[C2)/1D3))

R

rAf4:{ A<B, A<C, A<D, B%C, B/D, C|D }

R

sA

s

+

:(A360%40((B30/20C55)/90D25)) f4:{ A%B, A%C, A%D, B/C, B

<

D, C<D }

OrdAf4:{ A<3B (1,3,3), A<3C (1,3,2), A<5D (1,5,3), B%1C (3,1,2), B/1D (3,1,3), C|D (2,0,3)}

OsdAf4:{ A%40B (360, 40, 30) , A%55C (360, 55, 55) , A%200D (360, 200, 25) , B/20C (30, 20, 55), B<125D (30, 125, 25), C<90D (55, 90, 25) } Cf4

=

{ AdB , AdC , AdD , BpC , BdD , CdD }

Cfq⊂Cf4Æf4 is category-similar to fq.

D

fq

R

rA

R

rAf4 and

R

sAfq

R

sAf4 Æ f4 is spatial-similar to fq.

圖(11)-continued.

(13)

13

B C

A

f5 f

q

r

+

:( A1 <3 ( D3 /2 (B3%1C1) ) )

R

frA5:{ A<B, A<C, A<D, B%C, D/B, D]C }

R

sA

s

+

:( A360 [ ( D30 <20 (B25 /20 C45) ) ) f5:{ A%B, A%C, A[D, B/C, D

<

B, D<C }

OrdAf5

OsdA

:{ A<4B (1,4,3), A<5C (1,5,1), A<3D (1,3,3), B%1C (3,1,1), D/2B (3,2,3), D]C (3,0,1)}

5

f :{ A%50B (360, 50, 25) , A%55C (360, 55, 45) , A[D (360, 0, 30) , B/20C (25, 20, 45) , D<20B (30, 20, 25) , D<25C (30 , 25 , 45) }

Cf5

=

{ AdB , AdC , AdD , BpC , BdD , CdD } Cfq⊂Cf5Æf5 is category-similar to fq.

fq

R

rA

OrdA

R

rAf5 and ⊂ Æ f5 is spatial-similar to fq. OrdA

fq

R

sA

OsdA

R

sAf5

OsdA

fqf5 but

fq

f5 Æ f5 is Ring-metric-similar to fq.

f6 f

q

r

+

:(A1<4(D3<1(B3%1C1))

R

rAf6:{ A<B, A<C, A<D, B%C, D

<

B, D<C }

R

sA

s

+

:(A360%50((B25/5C45)<30D20)) f6:{ A%B, A%C, A%D, B/C, B

<

D, C<D }

OrdAf6

OsdA

:{ A<8B (1,8,3), A<9C (1,9,1), A<4D (1,4,3), B%1C (3,1,1), D<1B (3,1,3), D<2C (3,2,1) }

6

f :{ A%50B (360, 50, 25) , A%70C (360, 70, 45) , A%70D (360, 145, 20) , B/5C (25, 5, 45) , B<70D (25, 70, 20) , C<30D (45 ,30, 20

)

}

Cf5

=

{ AdB , AdC , AdD , BpC , BdD , CdD } Cfq⊂Cf6Æf6 is category-similar to fq.

fq

R

rA

OsdA

R

rAf6 and ⊂ Æ f6 is spatial-similar to fq. OsdA

fq

R

sA

OrdA

R

sAf6

OrdA

fqf6 but fq

f6Æ f6 is Sector-metric-similar to fq.

D

B C

A B

A C

D

B C

A

圖(11)-continued.

(14)

B C

A

f7 fq

A

r

+

:(A1<4(D3/1(B4%1C1)))

R

frA7:{ A<B, A<C, A<D, B%C, B=D, D

%

C }

R

sA

s

+

:(A360%110((B25/5C45)<115D25)) f7:{ A%B, A%C, A%D, B/C, B

<

D, C<D }

OrdAf7

OsdA

:{ A<4B (1,4,3), A<5C (1,5,1), A<4D (1,4,3), B%1C (3,1,1), B=D (3,0,3), D%1C (3,1,1)}

7

f :{ A%110B (360,110,25) , A%130C (360,130,35) , A%290D (360,290,25) , B/5C (25,5,45) , B<155D (25,155,35) , C<115D (25,115,35) }

Cf7

=

{ AdB , AdC , AdD , BpC , BdD , CdD } Cfq⊂Cf7Æf7 is category-similar to fq.

fq

R

rA

OrdA

R

frA7 and ⊂ Æ f7 is spatial-similar to fq. OrdA

fq

R

sA

OsdA

R

sAf7

OsdA

fqf7 and fqf7Æ f7 is RS-metric-similar to fq.

B C

D

圖(11)-continued.

z

f7與fq為RS 型計量相似:因為 f7與fq符合空間

型相似的條件,並且 ⊆ 以及 ⊆

,所以f7與fq為同心圓型計量相似。

fq

OrdA OrdAf7 OsdAfq

OsdAf7

以下為此範例在經過相似度檢索演算法後的最 終結果:

Category_Similar_List = [f3、f4、f5、f6、f7] Spatial_Similar_List = [f4、f5、f6、f7] Ring-Metric_Similar_List = [f5] Sector-Metric_Similar_List = [f6] RS-Metric_Similar_List = [f7]

由上述結果可知,RS

+

-string 在影像檢索上,比 RS-string 更為完整,除了在比對上更加精確外,也 更能符合使用者所下達的影像查詢之需求。

7. 結論

2D string 在圖像索引的技術上開啟了另一道新 的研究領域,而之後相關的研究有2D G-string、2D C-string、2D B-string、2D C

+

-string、2D Z-string、

RCOS-string 等,這些研究都是植基於卡笛生座標 系統(Cartesian coordinate system)的投射方式,將物

件個別投射在x 軸與 y 軸,再從這兩軸所得到的字 串索引來探討物間之間的空間關係,然而,在卡笛 生座標系統的投射方式,其主要的缺點在於一旦影 像經過旋轉後則所產生的字串索引方式可能會與 旋轉前的字串索引不一致,而導致影像誤判的情況 發生,因此,假如一張查詢影像與資料庫影像恰巧 完全相同,但旋轉角度不同的話,則此兩張影像還 是有可能會被誤判成不相似,對於一個良好的影像 資料庫系統而言,它必須能夠自動處理此方面的狀 況,而非要求使用者在下達影像查詢時必須提供角 度方位的資訊。

在影像資訊系統中,為了使影像檢索能夠達到 比對更精確與更快速查詢的目標,發展一套良好的 空間知識表示法更加顯得重要,透過空間知識表示 法所儲存的空間資訊作為影像索引,可支援空間推 論與相似度檢索,以滿足使用者對於影像查詢的需 求。而RS-string 與 2D Z-string 兩者乃相當著名的 空間知識表示法,RS-string 因植基於極座標系統,

故,能夠達到旋轉不變之特性。另一方面,植基於 卡笛生座標系統的2D Z-string,其在字串中記載物 件大小、位置、距離等計量資訊,並且藉由零切割 的機制,使得其字串長度比2D C

+

-string 精簡。對 於RS-string 與 2D Z-string 而言,兩者都克服了 2D string 相關研究的一些缺點。然而,我們發現在某 些情況下,RS-string 仍有精確度不足之處,以致會 做出相似比對的誤判,此外,2D Z-string 因受限於 卡笛生座標系統的限制,一旦影像經過角度旋轉 後,則可能會導致相似度比對的誤判。因此,在本

(15)

15 篇論文中,我們以 RS-string 為基礎,並且,排除 在極座標系統中引用 2D Z-string 概念的困難,提 出 RS

+

-string 空間知識表示法。RS

+

-string 應用了 2D Z-string 的零切割方式來精簡字串長度,並能加 入物件大小、位置、距離等計量資訊。因此,

RS

+

-string 在 字 串 表 示 結 合 了 RS-string 與 2D Z-string 之優點,並且克服了此兩者空間知識表示 法的缺點,因此,RS

+

-string 不但提升了儲存空間 的上效益,同時也達到了更精確的空間推論與相似 檢索,以符合使用者的需求。

參考文獻

[1] Anthony J. T. Lee and H. P. Chiu, "2D Z-string: A new spatial knowledge representation for image databases." Pattern Recognition Letters 24(16):

3015-3026, 2003.

[2] C. C. Chang and C. F. Lee, "Relative coordinates oriented symbolic string for spatial relationship retrieval." Pattern Recognition 28(4): 563-570, 1995.

[3] Erland Jungert, "Extended Symbolic Projections as a Knowledge Structure for Spatial Reasoning."

Proceedings of the 4th International Conference on Pattern Recognition 301: 343 – 351, 1988.

[4] G. Petraglia, M. Sebillo, et al., "Towards normalized iconic indexing." Proceedings of the 1993 IEEE Symposium on Visual Languages:

392-394, 1993.

[5] G. Petraglia, M. Sebillo, et al., "Rotation invariant iconic indexing for image database retrieval."

Progress in Image Analysis and Processing III:

271-278, 1994.

[6] G. Petraglia, M. Sebillo, et al., "Virtual images for similarity retrieval in image databases." IEEE Transactions on Knowledge and Data Engineering 13(6): 951-967, 2001.

[7] P. W. Huang "Indexing pictures by key objects for large-scale image databases." Pattern Recognition 30(7): 1229-1237, 1997.

[8] P. W. Huang and P. L. Lin "Visibility Inference Based on Spatial Knowledge Representation From Observer's Perspective." International Journal of Intelligent Systems 12: 191-202, 1997.

[9] P. W. Huang and Y. R. Jean, "Using 2D C+-strings as spatial knowledge representation for image database systems." Pattern Recognition 27(9):

1249-1257, 1994.

[10] P. W. Huang and Y. R. Jean, "Spatial reasoning and similarity retrieval for image database systems based on RS-strings." Pattern Recognition 29(12): 2103-2114, 1996.

[11] S. K. Chang and A. Hsu, "Image information systems: where do we go from here?" IEEE Transactions on Software Engineering 4(5):

431-442, 1992.

[12] S. K. Chang, C. W. Yan, et al, "An intelligent

image database system." IEEE Transactions on Software Engineering 14(5): 681-688, 1988.

[13] S. K. Chang, E. Jungert, et al., "Representation and retrieval of symbolic pictures using generalized 2D strings." Technical Report, University of Pittsburg, 1988.

[14] S. K. Chang, Q. Y. Shi, et al., "Iconic indexing by 2-D strings." IEEE Transactions on Pattern Analysis and Machine Intelligence 9(3): 413-428, 1987.

[15] S. Y. Lee and F. J. Hsu, "2D C-string: a new spatial knowledge representation for image database system." Pattern Recognition 23(10):

1077-1087, 1990.

[16] S. Y. Lee and F. J. Hsu, "Picture algebra for spatial reasoning of iconic images represented in 2D C-string." Pattern Recognition Letters 12(7):

425-435, 1991.

[17] S. Y. Lee and F. J. Hsu, "Spatial reasoning and similarity retrieval of images using 2D C-string knowledge representation." Pattern Recognition 25(3): 305-318, 1992.

[18] S. Y. Lee, F. J. Hsu, et al., "Similarity Retrieval by 2D C-Trees Matching in Image Databases."

Journal of Visual Communication and Image Representation 9(1): 87-100, 1998.

[19] S. Y. Lee, M. K. Shan, et al., "Similarity retrieval of iconic image database." Pattern Recognition 22(6): 675-682, 1989.

[20] Wang, Y. H., "Image indexing and similarity retrieval based on spatial relationship model."

Information Sciences 154(1-2): 39-58, 2003.

[21] Y. I. Chang, B. Y. Yang, et al., "A generalized prime-number-based matrix strategy for efficient iconic indexing of symbolic pictures." Pattern Recognition Letters 22(6-7): 657-666, 2001.

[22] Y. I. Chang, B. Y. Yang, et al., "A bit-pattern-based matrix strategy for efficient iconic indexing of symbolic pictures." Pattern Recognition Letters 24(1-3): 537-545, 2003.

[23] Y. I. Chang, H. Y. Ann, et al., "A unique-ID-based matrix strategy for efficient iconic indexing of symbolic pictures." Pattern Recognition 33(8): 1263-1276, 2000.

參考文獻

相關文件