關鍵字:影像式建模、相機率定、焦距
2. 文獻回顧
測量領域中,LiDAR 已經能建立高精度、密 集的三維數值模型,但仍有專業人力處理、技術門 檻高、設備昂貴等問題;而 IBM 技術能夠改善傳 統測量面臨的困境,利用重疊影像快速產生可視化 三維模型。影像特徵點有許多萃取方式,其中 SIFT (Scale-Invariant Feature Transform) (Lowe, 2004)具 有對影像尺度、旋轉、視角、光照不變性,能有效 萃取特徵點。
SfM (Structure from Motion)不需要事先進行 相機率定,只要以影像特徵點為初始資訊,透過共 軛 點 原 理 就 能 推 算 相 機 內 外 方 位 參 數 (Zhou, 2010)。由於 SfM 計算會有誤差需要修正,其中 Bundler (Snavely, 2010) 以 非 線 性 最 二 小 乘 法 平 差,已普遍使用於 SfM 計算時的誤差平差。由於 SIFT 到 SfM 間運算太消耗硬體資源且費時,因此 VisualSfM (Wu, 2011)即利用多核心 CPU 與 GPU 平 行運算並結合 Bundler 技術,克服電腦在硬體上的 運算速度限制,加速特徵點萃取。然而 SfM 僅是 建立明顯的特徵點雲,故再透過 MVS (Multi-View Stereo) 技 術 模 擬 人 的 立 體 視 覺 , 利 用 CMVS (Furukawa et al., 2010) 將 影 像 分 群 與 PMVS (Furukawa & Ponce, 2010)點雲擴散,有效建立密集 完整的三維點雲。由 SIFT 到 MVS 串連起來,便 能快速半自動化建立場景的三維資訊(Lee et al., 2012)。
由於鏡頭畸變、拍攝位置等會造成影像形變,
需透過相機率定(Camera Calibration)校正相機參 數,提供演算法解算時的校正資訊。其中將黑白棋 盤格相間的交點視為控制點之率定法,只要拍攝不 同角度的棋盤格影像,利用線性代數解算相機參 數,求解容易且精度高,為電腦視覺領域中的率定 準則(Zhang, 1999);後續有許多率定法皆以 Zhang 法加以改良而成,如利用 Harris 角點自動偵測棋盤 交點(Douskos et al., 2009)。
以往 IBM 建模三維資訊的應用大多為模型的 展示或後續分析,但從 SfM 即可事先獲得相機的 相關參數,作為評估模型精度的初步依據。對此已
有透過 Zhang 率定方式,證實 SfM 計算的焦距十 分接近 Zhang 率定成果(王傳宇、等,2011)、(Yang et al., 2013)。
隨著智慧型行動裝置普及,相較於相機更為 簡便、快速取得,也能成為影像來源之一(紀凱程、
等,2009),並將模型應用於估算體積上(Rahman et al., 2012)。就精度而言仍以相機為主,但對便利、
快速獲取三維資訊而言,智慧型行動裝置亦成為考 量影像攝取來源的考量。
圖 1 研究流程圖
3. 研究方法
本研究設計使用各款智慧型手機與數位相機 拍攝同一物體重建三維模型,實驗分為兩大部分,
如圖 1 所示,其一為三維建模,採用 SIFT、SFM、
MVS 等 IBM 演算法重建三維模型,並將模型恢復 為真實尺度評估模型體積。運用電腦視覺相關演算 法,如運用 SfM、CMVS、MVS、及柏松表面重構 (Poisson surface reconstruction,PSR),使用消費型 相機與智慧型裝置拍攝不同物體角度之影像,透過
多張影像重構三維場景模型詳細步驟及效果可見
並計算基礎矩陣(Fundamental Matrix, F 矩陣),求 得不同位置拍攝影像時的相機參數,建立特徵點的 數,E 為本質矩陣(Essential Matrix)。因此為計算𝑥𝑙
與𝑥𝑟的共軛關係,左右像之核點(epipole) e與e′會
稱為再投影誤差(Reprojection Error),如圖 2 所示,
圖 2 再投影誤差示意圖
圖 3 SfM 稀疏點雲與 MVS 點雲擴散相關示意圖