• 沒有找到結果。

第二章 相關研究

2.3 三維特徵編碼

2.3.6 基於立體像素(voxel)的特徵擷取

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

19

描述具有關聯性層級關係的模型。

2.3.6 基於立體像素(voxel)的特徵擷取

Voxel 本身並不含有空間中位置的資料,然而卻可以從它們相對於其他 voxel 的位置來推敲,即它們在三維空間的數據結構中之位置。此章節將介紹三個特徵 描述方式,藉由其方式取得其特徵描述子,而獲得二元特徵向量。

Kazhdan[18]介紹了一種基於球面調和函數變換的 voxel 比對方法。首先,輸 入一個 3D 模型,計算出 3D 模型重心為球心的最小圓球,按照該圓半徑的 1/N 為單位,將其模型投射到2N × 2N × 2N的 voxel 空間中,該空間中心跟其模型重 心位置相同,N 可以為任意整數。每個 voxel 中若有 3D 模型表面上的點,就將 voxel 設為 1,反之亦然。這樣即為其 3D 模型的 voxel 表示法。接著是取樣點的 選擇,從這些voxel 中,依照密集程度隨機取得樣本特徵,但其值不能為零。然 而,現在還沒有其代表的特徵出現,所以我們還需要判斷哪些樣本點才是獨一無 二,無法被取代的點,前提可能還需要做正規化的動作,避免因為位置、方向等 不同因素,而導致擷取到錯誤的取樣點。最後再藉由分類方法,如:Bag-of-features (BF),把其類似的代表性取樣點放置在同一類,即可得到屬於其模型的一組特徵 向量。

圖 2.15 基於 voxel 的 3D 形狀特徵擷取過程[20]

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

20

在二維影像中,特徵常常會在感興趣區域(Region of Interesting, ROI)中藉由 像是FAST 或 Difference of Gaussian (DoG) 等特徵檢測子找到其特徵,而在三維 空間中密集取樣(dense sampling)常常會優於依據 ROI 取樣的特徵。下面將以圖 示輔助介紹幾個依照密集取樣的特徵:

第一個,3DLBP,全名為 3D Local Binary Pattern,其特徵由大小為N × N × N ≡ 𝑁3的三維 Volume of Interest (VOI)計算後得到,其做法為 VOI 由許多的 SLBPs(Sub-Local Binary Patterns)所組成,計算方式跟 LBP 相同,為中心的 voxel 跟其鄰近的6 個 voxel 做比較,若是鄰近 voxel 的值大於中心 voxel 設為 1,反之 設為0,則會得到 6 位元的一串二元字串,再轉換成十進位值,再把 voxel 內的 所有SLBP 集結成一個特徵向量,如圖 2.16,最後把特徵向量以直方圖的形式表 示。

圖 2.16 3DLBP 計算流程[20]

第二個,3DBRIEF,是基於二維影像所使用的 BRIEF 所演變而成二元編碼 之三維特徵描述子,其方法簡易,且可以快速的擷取到特徵。從voxel 中隨機選 取樣本對,如果一對 voxels 同時在位置 a 和位置 b 被選取,其編碼值 vox(a)和 vox(b),透過式( 2.2)計算所得到。其特徵描述方法對於位移擁有不變性的性質,

但是沒有旋轉和尺度的不變性。3DBRIEF 是個計算快速的方法,因為其是一個 二元特徵向量,計算上則使用Hamming distance,在計算二元字串上非常有效率。

第三個,3DORB,則是在 3DBRIEF 加入旋轉不變性,但是其旋轉正規化的 動作只針對每個local VOI 去做,而不是對全部的 voxel。此類別有幾種變型,如 圖 2.17 所示。一種變型為 3DORBL,L 則為設定一個門檻值做為平滑化的基準 值,其值會在VOS (Volume of Smoothing)中取得,其精準度會比原本的 3DORB 高,但是缺點為計算成本較為高昂。為了改善運算成本,而衍生出另一種變型

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

22

圖 2.17 3DORB 的三種型態[20]

圖 2.18 3DORB-CG 之旋轉正規化動作[20]

第四個,3DORB-PCA,顧名思義,在 VOI 內對 voxel 值使用 PCA 尋找模型 方向,雖然主軸分佈可以依照 PCA 得知,但是向量方向卻無法得知。旋轉方向 是透過比較物體重心和 VOI 的中心進行校正,而正規化後特徵向量擷取的方式 類似於3DORB-CG 或是 3DBRIEF。

相關文件