• 沒有找到結果。

使用單眼視覺進行本體移動估測

第二章 文獻探討

2.1 使用單眼視覺進行本體移動估測

本論文研究之目的,在於使用單眼視覺完成一個視覺測距系統。視覺測距系統除了 可以獨自應用外,亦可以輔助各種缺乏移動感測的裝置系統獲得移動路徑。

要如何讓系統知道自己在環境中的移動路徑? 如圖 2-1 所示,系統從 A 地移動至 B 地,感測裝置只知道周圍環境之影像有所變化,卻不清楚實際上本身之移動距離。因此,

本文使用單眼視覺方式,將連續時間點之影像做運算,取得相機在環境中的移動路徑,

而解決這類問題稱之為本體移動(Ego-motion)。

圖2-1 本體移動概念圖

解決本體移動問題的技術,類似於電腦視覺中的移動恢復結構法(Structure from Motion, SfM),稱之為本體移動估測(Ego-motion Estimation)或視覺測程(Visual Odometry, VO) [3],是一種使用不同時間點中的影像,進行影像匹配估測移動的技術。「本體移動」

一詞於 1994 年由 M. Irani 等人所定義[4],利用二維影像計算出相機在三維空間環境中 的移動,以解決本體移動計算的問題。但早在 1980 年,美國太空總署(The National Aeronautics and Space Administration, NASA)已開始研究[5],在火星探險任務中,火星探 測漫遊者號(Mars Exploration Rover, MER)[6]用來計算無人駕駛探測器在火星上的移 動路徑。另一種類似的估測技術為使用場景與當前影像的匹配來估測移動,希望系統從 未知環境的未知地點出發,在運動過程中通過重複觀測到的地圖特徵(比如,牆角,柱 子等)定位自身位置和姿態,再根據自身位置增量式的構建地圖,從而達到同時定位和 地圖構建的目的。稱之為視覺即時定位與地圖構建(Visual Simultaneous Localization and Mapping, V-SLAM)。大部分的學者們將本體移動估測與 V-SLAM 通稱為即時定位與地 圖構建(Simultaneous Localization and Mapping, SLAM)的問題研究。2006

年,Durrant-Whyte 等人對 SLAM 有詳細的介紹[7][8];2010 年 B. Williams 等人也對本體移動估測 與 V-SLAM 作介紹並共同實作[9]。

本體移動估測主要重點步驟如圖2-2 所示。首先進行影像擷取和校正,接著同時對 影像進行特徵偵測與匹配計算得出特徵點在三維空間中的座標,並將偵測到的特徵點進 行匹配,再利用特徵點在影像中之移動關係與相機參數估測出移動路徑,最後進行最佳 化處理使路徑結果更為完善。

圖2-2 本體移動估測之概略圖

移動估測為本體移動估測中最重要的步驟,使用相機進行移動估測計算移動矩陣時,

根據特徵點屬性主要可分為三種方式:1.二維影像特徵點的不同時間相互對應關係(2D-2D);2.三維結構與影像特徵點對應關係(3D-2D);3.三維資料的對齊(3D-3D)。最早開始 的移動估測,為三維資料的對齊(3D-3D),主要是使用三維資料進行對齊,其中迭代最 近點(Iterative Closest Point, ICP)演算法進行空間中座標點的對齊便為常使用的方法[10];

2012 年,Lui 等人使用了微軟公司的體感深度感測機(Kinect)進行深度的擷取[11],依然 使用到了 ICP 演算法來進行各時間點的空間座標點對齊的工作。而本論文為單眼視覺,

使用第一種方式(2D-2D)僅需使用一台相機在不同時間點的兩張影像進行估測。單眼視

如 2011 年的 L. Wei 等人使用全球定位系統(Global Positioning System, GPS)結合影像進 行車輛於城市中的移動估測與地圖建構[13]。

2010 年 D. Scaramuzza 等人提出了一份完整的研究報告,統整了近年來對於本體移 動估測的研究與討論[14][15];2013 年 H. Badino 提出了一種抗雜訊的 VO 特徵點追蹤:

MFI[16]演算法,它強調誤差不隨時間增加而累積變大,為當時 KITTI[17]上純視覺 VO 最好的演算法,因此,本研究在第三章將採用其方法來進行本體移動估測。此外 2013 年 P. S. Huang 以限制視窗方式剔除不必要的特徵點,並實作本體移動估測[18];2014 年 J. H. Zhang 以適應性方法增強特徵點匹配與追蹤正確性,提高本體移動估測之精確 度[19]。

相關文件