• 沒有找到結果。

第一章 緒論

1.3 相關研究回顧

在影像處理的辨識中,人們通常使用整體資訊(Global information)當特徵進 行辨識,但是使用整體資訊便已對此系統有了限制,那就是此系統不能工作於 物體被遮蔽的情況之下,當物體被遮蔽時,其擷取出的特徵必定變形,再與資 料庫比對必定出現錯誤的結果,大大降低了辨識率。那麼如何解決遮蔽的問題?

John W.[2]就提出了將整體資訊進行切割成多個部份資訊(Local information)進 行比對,因為切成多個部份特徵,所以運算量必定大於整體資訊的運算量,但 是部份特徵卻能解決遮蔽所帶來的問題,只要能忽略被遮蔽的資訊,將未被遮 蔽的部份資訊與資料庫相比(資料庫也是由區塊資訊所建構),如此就能判斷出 正確的物件。雖然犧牲了計算量,但是確實讓系統更加的聰明與健全。所以再

相關研究回顧

1. 傅利葉描述子(Fourier Descriptors):

由John W. , O. Robert 所提出的方法[2],他將擷取出的完整輪廓(contour)裁

運算量更是驚人[4]

圖 2.完整的飛機影像輪廓以及部份切割後的飛機輪廓。

2. 類神經網路(Neural Network):

類神經網路本身便有一特性,便是多對一輸出的特性,此一特性正好符合 多個區域特徵的輸入,以及單一個辨識結果的輸出,如圖 3 所示。N. Zheng, Y.

Li,[5]便是利用此特性,將類神經網路系統應用在遮蔽的物件辨識上。本篇論文 是利用線段和弧線的組成來近似所得到的輪廓,將組成後的角(corner)表示成一 個由 8 個成份組成的向量 a,a 由(a1…a8)所組成,將 a1…a8 當成類神經網路的 輸入(圖3 中的 layer1)

圖3.階數為 3 的類神經網路系統。

相關研究回顧

Layer1 所代表的意思是角特徵的輸入點,也就是 a 向量的輸入,所以圖中 的N=8 是固定的。將輸入與 M 中每個點的特徵比較取最小值,並將此最相近 的Mi點設為1,經過 P 次(一物件分 K 個部份)的計算後,可以得到 Layer2 的 資訊。Layer2 所代表的意思是資料庫中所有物件的角的特徵,也不會全部都列 進去,因為部份的角特徵太相近,可以當成一個特徵使用。Layer3 所代表的意 思就是最後的辨識結果,假設資料庫有8 個物件,那麼 C 就等於 8。Layer3 的 結果只有一個點(node)會顯示為 1,其餘皆顯示 0。判斷的依據是依 Layer2 中屬 於哪一個物件的旗標最多就是結果。優點為特徵與影像物件的位置(Location)以 及大小(Size)無關,而且對於旋轉(rotation)與轉移(translation)關係不大。缺點為 因為每個物件中的一個部份就要跟整個Layer2 比對,一個物件本身又有很多個 部份,所以運算量也是相當龐大。

3. 小波轉換(Wavelet):

Tiehu Du, K. B. Lim 所提出的方法[6],此作法跟傅利葉描述子類似,都是將 資訊轉換到頻域取係數當成辨識的依據,其使用的原始資訊是輪廓為基礎,將 切割後的輪廓由128 個點表示,其基本轉換與逆轉換如式(1-3)所示,再將 f(x)轉 換成式(1-4)的形式就可分出 scaling(C)和 wavelet(d)的係數。將得到的係數依 x, y 軸排列成如式(1-5)所示的形式,稱式(1-5)為特徵矩陣(Feature Matrix),此 式(1-5)為 3 階的小波分解。此方法有個極大的好處在於此系統可以階層式 (hierarchical)比對,先比對每個部份的C,比對的方程式如式(1-6)所示,如果C 滿足才進而比對d。優點為經過一些前處理可以得到一些特性,像是轉移、旋 轉、比例(scaling)的不變性,最大的優點在於因為使用階層式比對,所以大大減 少辨識的次數,減少運算量。

= −

Γ dx

s x x

s(τ) f( )ϕ*( τ)

(1-3)

論文最後要找出物件遮蔽的方位,所以選擇了角度(angle)與長度比(ratio of length)當重要特徵,經過一些三角轉換以及與資料庫的比對可以找出被遮蔽的

相關文件