• 沒有找到結果。

第三章 背景技術

3.5 估測基礎矩陣流程

Hartley 的書中曾提過八點演算法(式 3.9),即表示有八組對應點座標時,即 可以計算出一組基礎矩陣,在第一章時我們曾介紹極限幾何關係(圖 1.1),接著

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

19

要估測出基礎矩陣,需要求解 3.11 聯立方程式,只要有八組對應點,就可 以有一組答案,但我們主要問題在於估測出來的基礎矩陣要是好的。倘若基礎矩 陣解出來不好,在後續找密集對應點的過程中會產生錯誤,我們該如何使用粒子 群最佳化演算法幫助初始隨機取樣後的結果呢,將在第四章時會說明。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

20

第四章

以粒子群最佳化演算法估測基礎矩陣

本章第一小節介紹兩個基礎實驗,分別是粒子群最佳化演算法應用於二維平面和 圓錐近似兩個實驗,透過模擬的實驗,我們可以更清楚演算法的流程和運作,第 二小節是估測基礎矩陣的研究方法與流程,會詳細說明每個步驟和設計的想法,

實驗結果將在第五章。

4.1 模擬基礎實驗

4.1.1 平面中粒子群最佳化

本實驗將在平面中模擬粒子群最佳化演算法,由於三維以上的空間我們很難 想像,因此我們用一個最簡單的例子,如圖 4.1,是一個二維平面找尋最佳解的 問題,我們將最佳解的目標假定在平面裡其中一個座標點位置,並且在限制位置 大小的範圍隨機分佈粒子個體,最終我們希望初始分散的所有粒子個體,可以逼 近至我們假定的最佳解目標,以及達到停止條件制訂的門檻值,實驗流程可以參 考圖 3.1。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

21

圖 4.1:二維平面問題示意圖

初始化

同 3.1 小節,在本實驗我們將維度設為二維,因為這是在平面中模擬的實驗,

位置向量的範圍即是二維的範圍,速度向量範圍會依據可移動的位置向量範圍做 調整。

計算評估值

同 3.1 小節,在平面實驗中,我們制訂了一個公式用來計算評估值 f,如 式 4.1。在這個模擬實驗我們假定最佳解是知道的,目的是為了觀察粒子個體 的移動。

i x

2

i y

2

fXGoalYGoal

(4.1)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

22

比較過去經驗、更新

和 3.1 小節皆相同。

疊代速度、檢查速度向量、疊代位置、檢查位置向量

因為在平面中搜尋範圍是有限制的,我們必須控制粒子個體的移動範圍、速 度向量,舉例來說,假設是 1000x1000 的搜尋空間,粒子個體在疊代步驟計算後,

位置向量很有可能超過我們預設的搜尋空間,因此我們這邊多了一個判斷的步驟 來確保粒子特體會存在範圍內。

其中速度向量在二維實驗中若有調整時,可再細分為兩種,速度向量正規化 和速度向量未正規化,表 1 是速度向量正規化演算法,第五章列出實驗結果實我 們會比較兩種做法的實驗結果,以及適合使用的時機。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

32

影像上特徵點在第二張影像上的對應點,由這個對應點,和極線計算距離誤差,

同理,將第二張影像上的特徵點,經由同樣的方法,也可以在第一張相片上畫出 極線,由對應在第一張影像上的點進行計算距離誤差,若是同一組對應點時,可 以取平均值當作最後的一組誤差,當我們統計的點數越多時,越可以清楚知道我 們估測基礎矩陣的好壞。圖 4.3 是計算誤差的示意圖,計算公式如式 4.6。

2 2

( , ) ax by c d m L

a b

 

 

(4.6)

m 為對應點的座標,L 為 m 在另外一張相片畫出的極線方程式

ax by    c 0

, 公式帶入後求出的 d 值即為誤差值。

圖 4.4:計算基礎矩陣誤差示意圖

fitness 值的制訂如式子 4.1,每次實驗我們會列出初始分佈和結束時的數據表格,

並列出每經過 100 次疊代後粒子移動後的圖形。

值為 0.657727。其餘粒子我們也將記錄初始 fitness 值,實驗停止條件為所有粒 子的 fitness 值皆要小於 0.1,實驗即停止,同時我們也記錄了初始 Gbest 和實驗

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

35

粒子 18 392.376 0.93267 粒子 19 495.773 0.172525 粒子 20 844.203 0.894932 Gbest 103.793 0.172525

平均值 555.49 0.631088

標準差 226.697 0.211664

疊代次數 526

在圖 5.1(a)中,是實驗初始 20 個粒子的分佈圖,我們採取了影像處理的座標 模式,將 X 座標置於圖的上方,Y 座標維持在圖的左方,可以看出,初始的隨 機分佈在圖中相當分散。

(a)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

36

經過 100 次疊代計算後,可以看出 20 個粒子已經漸漸收斂至我們假定的最 佳座標點,但是因為尚未達到實驗停止條件,因此實驗繼續進行,在 200 次疊代 計算後,其實粒子群變動的幅度已經不明顯,都收斂在最佳座標點附近,直到最 後實驗停止條件達成後,我們將實驗停止,並且列出最後結果。

(b)

(c)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

37

(d)

(e)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

38

(f)

(g)

圖 5.1:速度未正規化第一次實驗 (a)初始分佈 (b)疊代 100 次後 (c)疊代 200 次 後 (d)疊代 300 次後 (e)疊代 400 次後 (f)疊代 500 次後 (g) 實驗停止

Gbest 149.632 0.106686 平均值 507.419 0.608242 標準差 193.873 0.269995

疊代次數 345

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

40

(a)

(b)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

41

(c)

(d)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

43

粒子 14 648.885 0.276665 粒子 15 342.906 0.575668 粒子 16 317.728 0.928936 粒子 17 849.757 0.600338 粒子 18 828.211 0.687454 粒子 19 642.811 0.854468 粒子 20 644.612 0.321167 Gbest 164.403 0.035626 平均值 510.881 0.684448 標準差 191.859 0.261441

疊代次數 430

(a)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

44

(b)

(c)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

45

(d)

(e)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

46

(f)

圖 5.3:速度未正規化第三次實驗 (a)初始分佈 (b)疊代 100 次後 (c)疊代 200 次 後 (d)疊代 300 次後 (e)疊代 400 次後 (f)實驗停止

平均疊代次數:433.67

5.1.2 速度經過正規化

在速度經過正規化的實驗中,我們同樣列出三次實驗結果,實驗數據放在表 6、7、8,初始化採取隨機分佈 20 組粒子,以表 6 為例,粒子 1 初始 fitness 值 經過計算為 103.793,經過 526 次疊代計算後,停止的 fitness 值為 442.915。其 餘粒子我們也將記錄初始 fitness 值,實驗停止條件為所有粒子的 fitness 值皆要 小於 0.1,實驗即停止,同時我們也記錄了初始 Gbest 和實驗停止後的 Gbest,受 限於篇幅,我們無法列出所有座標點的詳細(x,y)座標,但可由圖 5.4~圖 5.6 看出 實驗進行的過程,可以看出,平均花費的疊代次數減少。

Gbest 27.3446 0.266683 平均值 503.867 0.646745 標準差 239.743 0.224104

疊代次數 172

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

48

(a)

(b)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

50

粒子 16 678.823 0.097698 粒子 17 512.375 0.811489 粒子 18 241.005 0.927598 粒子 19 519.15 0.4073 粒子 20 233.833 0.907129

Gbest 58.9923 0.097698 平均值 484.576 0.567664 標準差 205.052 0.267629

疊代次數 180

(a)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

51

(b)

(c)

圖 5.5:速度正規化第二次實驗 (a)初始分佈 (b)疊代 100 次後 (c)實驗停止

Gbest 192.907 0.203654 平均值 560.994 0.634178 標準差 196.626 0.209261

疊代次數 247

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

53

(a)

(b)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

54

(c)

(d)

圖 5.6:速度正規化第三次實驗 (a)初始分佈 (b)疊代 100 次後 (c)疊代 200 次後 (d) 實驗停止

平均疊代次數:199.67

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

56

(a)

(b)

convergence Particle Gbest

  

(5.1)

其中 Particlei表示第幾個粒子個體,N 表示第幾個點編號,c 表示我們計算 出的收斂值,接著我們將收斂值 convergence 值調整後,有以下的幾次實驗。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

58

convergence 值<12.25

(a)

(b)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

59

(c)

圖 5.8:convergence 值<12.25 為停止條件(a)第一次(b)第二次(c)第三次 實驗結果

convergence 值<9.8

(a)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

60

(b)

(c)

圖 5.9:convergence 值<9.8 為停止條件(a)第一次(b)第二次(c)第三次 實驗結果

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

61

convergence 值<7.35

\

(a)

(b)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

62

(c)

圖 5.10:convergence 值<7.35 為停止條件(a)第一次(b)第二次(c)第三次 實驗結果

convergence 值<6.12

(a)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

63

(b)

圖 5.11:convergence 值<6.12 為停止條件(a)第一次(b)第二次 實驗結果

convergence 值<4.9

圖 5.12:convergence 值<4.9 為停止條件第一次實驗結果

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

64

5.2.3 限制 fitness 值和對 Gbest 收斂

在本節實驗停止條件是限制 Gbest 的 fitness 值小於一定的門檻值,再利用收 斂當作我們的停止條件,因為在 5.2.2 節中只用收斂到 Gbest 這組粒子個體當作 停止條件,會發現很有可能還沒有近似到一定的準確率時就已達停止條件,因此 我們再修改了停止條件,目前先進行了幾次實驗如下。

Gbest

fitness

< 0.1 和 convergence 值<12.25

圖 5.12:Gbestfitness < 0.1 和 convergence 值<12.25 為停止條件第一次實驗結果

5.2.4 討論與分析

在 5.2.1、5.2.2 和 5.2.3 節中我們將三個不同實驗停止條件放在圓錐近似的實 驗中,得到的結果也不盡然相同,但目前仍有再改善的空間,目前幾個可能的問 題如下,在 5.2.1 節中,只單純的限制疊代次數是風險較大的做法,因為我們沒

得 ground truth 資料,第二組資料是由 Christoph[20]提供多視角影像和光達點雲 資料,也可以由投影矩陣計算出多視角相片中的 ground truth 資料幫助計算誤差,

我們將透過三種方法比較實驗結果,分別是 PSO、LMedS_PSO、LMedS,最後 做討論與分析。

5.3.1 第一組實驗(3DMAX)資料

我們用 3DMAX 建模並且假設兩台相機拍攝兩張相片(圖 5.13),圖 5.14 顯示 我們的實驗場景,相片解析度為 800x600,籃子大小為 80x60,共有 100 個,初

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

66

始找尋對應點時採用 SIFT 演算法,共可以找到 2494 組對應點,而用來驗證的 ground truth 資料,則有 1306 組對應點。

圖 5.13:3DMAX 實驗相片

圖 5.14:3DMAX 拍攝場景

我們採用較接近的疊代次數來比較實驗結果,PSO 實驗採用 10 組隨機取樣 的粒子個體經過疊代計算 117 次,共進行 1170 次疊代,而 LMedS_PSO 方法先 計算成功取樣機率為 80%,正確資料為 50%的一組結果,套用隨機取樣公式需

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

68

圖 5.15:3DMAX 實驗直方圖比較

圖 5.16:3DMAX 實驗折線圖比較

從圖表中我們看出,PSO 的方法在接近的疊代次數中,時間成本和平均誤差 值皆是表現最好的,接著下一節我們將列出第二組實驗結果。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

69

5.3.2 第二組實驗(LIDAR)資料

第一組 LIDAR 資料

光達資料是一種雷射成像系統,可以將三維模型中的座標記錄下來,相機對 物體拍攝相片後,只要透過投影矩陣,即可計算出三維物體在相片上的座標,我 們可以透過這個步驟獲得 ground truth 資料,圖 5.17 是實驗用的兩張相片。

圖 5.17:LIDAR 第一組實驗相片

相片解析度為 3072x2048,籃子大小為 256x256,共有 96 個,初始找尋對應 點時採用 SIFT 演算法,由於電腦記憶體不足以處理較大的相片解析度,因此我 們在找尋對應點時,會先將相片解析度縮小一半為 1536x1024,找到後的對應點 座標在乘上兩倍,便可以獲得對應點資訊,共可以找到 1336 組對應點,而用來 驗證的 ground truth 資料,則有 2121 組對應點。

採用 5.3.1 小節的三種方法和接近的疊代次數,我們可以有以下的實驗結果,

如表 11、12。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

70

表 11:LIDAR 場景估測基礎矩陣第一組結果

方法 1000 組平均誤差 1000 組標準差 1000 組需要時間 PSO 0.237 像素 0.1056 像素 8 小時 LMedS_PSO 0.247 像素 0.1056 像素 29 小時

LMedS 0.278 像素 0.1057 像素 70 小時

表 12:LIDAR 場景估測基礎矩陣第一組結果標準差分佈 方法 小於平均標準差 小於 0~1 倍 小於 1~2 倍

PSO 673 個 633 個 40 個

LMedS_PSO 642 個 599 個 43 個

LMedS 564 個 541 個 23 個

從表 11、12 可以發現,當我們資料量越多,花費的時間成本也相對增多,

不過 PSO 的方法仍是誤差最小,且時間花費最少的,接著我們統計三種方法的 一千組結果,計算總平均、標準差,繪製出直方圖和累積的折線圖,如圖 5.18、

5.19。

圖 5.18:LIDAR 第一組實驗直方圖比較

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

71

圖 5.19:LIDAR 第一組實驗折線圖比較

第二組 LIDAR 資料

第二組資料的兩張照片如圖 5.20。

圖 5.20:LIDAR 第二組實驗相片

相片解析度為 3072x2048,籃子大小為 256x256,共有 96 個,共可以找到 1157 組對應點,而用來驗證的 ground truth 資料,則有 1733 組對應點,實驗結 果如表 13、14。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

72

表 13:LIDAR 場景估測基礎矩陣第二組結果

方法 1000 組平均誤差 1000 組標準差 1000 組需要時間 PSO 0.385 像素 0.1683 像素 6 小時 LMedS_PSO 0.386 像素 0.1684 像素 23 小時

LMedS 0.431 像素 0.1685 像素 56 小時

表 14:LIDAR 場景估測基礎矩陣第二組結果標準差分佈 方法 小於平均標準差 小於 0~1 倍 小於 1~2 倍

PSO 638 個 520 個 118 個

LMedS_PSO 627 個 492 個 135 個

LMedS 515 個 420 個 95 個

PSO 的方法仍是誤差最小,且時間花費最少的,接著我們統計三種方法的一

PSO 的方法仍是誤差最小,且時間花費最少的,接著我們統計三種方法的一

相關文件