• 沒有找到結果。

第一章 緒論

1.3 相關研究之探討

在本論文中,將採用距離影像及點雲資料做為辨識時所使用的資訊,由於拍 攝距離與測距儀能否拍攝到完整的塔台有密切的關係,則本論文將利用是否有擷 取到完整的塔台,做為辨識策略要採取距離影像或是要採取點雲資料,若是距離 足夠遠以致於雷射測距儀能拍攝到完整到塔台,則將採取距離影像,反之若是距 離過近以致於無法拍攝到完整的塔台,則將採取點雲資料。

不管在距離影像或是點雲資料的辨識方面,要辨識出場景中塔台對應資料庫 中哪種模型,將比對兩個物體所抽取出的特徵相似度,然而,特徵可分為全域特 徵(global feature)、區域特徵(local feature),當然,不同的應用會需要不同的特徵 來做為辨識的依據,這些特徵必頇具備有(1)旋轉不變性(rotation invariant),(2) 平移不變性(translation invariant),(3)尺度不變性(scale invariant)用以克服在不同 距離時影像尺度的不同,或是在不同角度拍攝下所產生影像旋轉的問題。三維物

3

體辨識的主要目的,是以物體的三維資訊為基礎來進行辨識,將複雜場景中的未 知物體,與資料庫中的已知物體進行比對,進而辨識出該物體。主要的比對方式 是根據物體表面的特徵是否相符,以決定兩物體是否相同。首先,本論文模擬雷 射測距儀拍攝到塔台,可同時得到距離影像及點雲資料做為系統的輸入,在分別 對這兩種資料型態作特徵抽取。

基於全域特徵的辨識演算法,例如:D. S. Zhang 及 G. J. Lu 等人提出傅立葉 描述子(Fourier descriptor)[1],則是根據物體輪廓對其做傅立葉轉換所成的特徵,

相較於傅立葉描述子是描述物體輪廓得部份,W. Y. Kim, Y. S. Kim 等人所提出 的則奈克矩描述子(Zernike moment descriptor)[2] 則是用來描述物體的內容部份,

對於物體利用傅立葉描述子當特徵時,由於只有考慮到輪廓的部份,故忽略的物 體內容的部份,而物體利用則奈克矩描述子當特徵時,卻只有考慮到內容的部份,

忽略了物體輪廓的部份,所以 D. S. Zhang 及 G. Lu 等人[3]又提出傅立葉描述子 結合則奈克矩描述子做為描述物體的特徵,其效果比起只有使用單一描述子時好,

由 R. Osada 等人[4]所提出之形狀分佈(shape distributions),屬於全域特徵的方法,

其特性為運算簡易,能容忍雜訊且不需做特別的處理就有旋轉不變性,但缺點就 是鑑別度不高,完全不同的物體卻有可能會有相似的特徵。此方法以形狀分佈作 為特徵表示,使用幾何形狀函數(shape function)把三維模型中的形狀轉為機率分 佈,再以簡單數學比較兩個模型的特徵分佈曲線,其作法首先藉由統計模型中每 一個面的面積,並基於其面積大小隨機取出適當的點位置做為整體模型的代表點,

然後隨機以這些點的組合的幾何形狀函式作為特徵,不過本論文有運算時間上的 考量,故在特徵的選取上必頇具備運算時間短,且辨識率能達到一定的水準。

基於區域特徵的辨識演算法,像是 A. E. Johnson 等人所提出的旋轉影像 ( spin image )[5],相對於全域特徵的特徵表示法,區域特徵在特徵的描述上更具 有彈性,因為只要物體表面上的點與鄰近點之間相對關係沒有改變,即使對於不 同尺寸的同樣物體,也會具有相同的特徵。這是一種與目標物姿態無關的表面特

4

徵,其做法乃是利用許多方向點( oriented point )作為基準點,來計算物體的表面 特徵。由於旋轉影像是使用局部座標,對該物體表面上的所有點來進行編碼,因 此取得的特徵,不會因為物體在三維空間中姿態的不同而改變,但由於旋轉影像 是針對物體表面上的每一個頂點都做特徵表述,最後每一個點將依據其鄰近點的 幾何關係建立出對應的旋轉影像,而在比對時是採用每點與每點的旋轉影像進行 比對故資料量十分龐大,也造成計算上龐大的負擔,而 C. Dorai 及 A. K. Jain 等 人所提出的形狀指標(shape index)[6],也是根據物體表面變化作為特徵抽取的基 礎,將一個三維物體表面之組成採用以自由曲面(free form)的方式來描述,能真 實的描述物的表面組成,然後抽取出物體表面的幾何特徵,作為特徵比對用,而 文獻[19]不僅使用形狀指標且加入了角度變化,以及每點像素的深度變化,再利 用一個高維度的直方圖來做為特徵的表現。

在結構特徵的表示上,T. J. Fan 與 G. Medioni 等人[7]所提出之方法乃是利 用圖(graph)的方式來做特徵的描述,其作法則是在距離影像下實現,基於圖所建 立的特徵則是利用一組節點 (node)與邊(edge)的構成來描述物體的幾何結構 (geometric structure),而[6]則是先將物體進行分割,利用找出物體的邊將每個獨 立出來的區塊可能是平面或是曲面作為圖的節點,則圖的邊乃是根據在物體上兩 個獨立相鄰的區塊所共同擁有的邊作為圖中連結節點與節點的邊,當圖建立完成 後必頇賦予節點與邊一些屬性(attribute),這些屬性的賦予當然是有利於在進行比 對時所使用,S. Biasotti 與 S. Marini 等人在文獻[8][9]中利用理布圖(Reeb graph) 的建立將三維物體分割成幾個補丁(patch),然後再將一個補丁視為一個節點,理 布圖是由定義於模型上的連續函數所確定的骨架,是由形狀與拓樸(topology)表 示的基本數據結構,理布圖的思想在三維模型上定義一個連續函數 f,首先計算 每個頂點的 f 函數值,然後根據 f 值將模型上的頂點進行分類,f 值相同的且位 於同一連通分量上的點歸為一類,最後得到原頂點集的一個商集,將商集中的點 根據原有模型點間的鄰接關係連接起來,可得原有模型的一個架構,而此利用理

5

布圖的這個演算法,大多都在找尋一個好的 f 函數來對模型進行分割,依據不同 的的 f 函數可得到不同的理布圖,在三維空間中所挑出之理布圖仍然要符合旋轉 不變性、尺度不變性、及平移不變性,而在賦予節點的屬性上採用 M. Kazhdan, T.

Funkhouser 等人[10]所提出之全域球諧波特徵(global spherical harmonic feature),

其特徵主要以球諧波函數(spherical harmonic function)為基礎,不考慮物體表面上 點與鄰近點之相對關係,只考慮物體的整體形狀,將物體的表面上的點利用體素 (voxel)推積方式來表示。之後利用類似傅立葉轉換法(Fourier transform),用一組 正交函數去近似每個有著固定半徑的球面其所涵蓋的體素數量。這樣表示法的優 點是考慮到物體部份的表面的整體形狀,但是會因為量測視角的些微差異,使得 物體的部份表面的整體形狀會有很大的差異,會受到異體姿態變化的影響很大,

最後在利用圖比對(graph matching)的方式來完成比對的程序,H. Sundar 等人[11]

則 是 利 用 骨 架 的 方 式 來 達 成 圖 的 建 立 , 輸 入 為 一 個 三 維 的 體 積 模 型 (3D volumetric model),經過細線(thin)化、分群(cluster)、連接(connect)後得到一個三 維線(3D line),而這個三維線可形成一個圖,用來表示這個物體的形狀,然後再 經過圖比對去找出相似的物體,但是在本論文中的資料型態為距離影像及點雲資 訊,且所得到的拍攝資料為部分的,故無法經由細線化來得到圖的表示,A.

Bucksch 與 H. A. Wageninegn[12]所提出的方法也是利用骨架的方式來達成圖的 建立,且輸入的資料為點雲資訊,在骨架化的過程是先產生八元樹(octree),接 下來從這些八元樹細胞(octree cells)抽取出一個圖,最後將圖有封閉的部分去除,

最後也可得到一個三維的線做為圖的表現,不過利用八元樹將點雲資料轉換成體 積模型將會增加運算時間,在利用形狀結構描述子在電腦視覺中已經被廣泛的被 應用,中軸轉換(medial axis transformation)[13],其提供了一個形狀突起的分解法,

藉由在形狀內不同半徑的球來偵測的動作,中軸對於人的形狀比對上提供了一個 很好的直覺性特徵,特別在二維圖像的表現上更是有好的效果,Zhu. X[31]中提 出利用骨架抽取搭配支持向量機(support vector machine)來對物體做辨識,而在

6

[8][9][11]所使用的影像都是需要為完整的資訊,故在只有部分影像的場景上並無 法使用,相較於旋轉影像是以某點與鄰近點的幾何關係所做出的特徵,形狀指標 則是以某個區域的表面幾何變化所成的特徵。

相關文件