緒論 - 三焦張量在多視角幾何中的計算與應用

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第一章緒論

1.1 研究動機與目的

由於資訊的發展相當快速，曾經認定為人工處理的工作，現在都可以交給機器去做更精密的計算及處理。尤其電腦視覺在軟硬體不斷的進步下，各種影像的計算測量都可以透過機器得到更加優化的結果，電腦視覺中的各種應用也應運而生。例如醫學影像的分析、天氣或地理圖的觀察、虛擬實境和三維模型建模的應用。在醫學上，觀察身體內部資訊的斷層掃描或是核磁共振都是以電腦視覺做視覺化的呈現使醫生獲得想要的資訊，並且做出更精確的診斷以及治療。天氣圖或是地理圖也可以利用影像的分割和影像的辨識重建三維地理深度圖。另外，虛擬實境(augmented reality (AR))[25]，也就是在真實的環境中加入虛擬的物體，像是現在很流行的 kinect 就是讓玩家單純揮動手臂就好像拿著棒子打棒球一樣與虛擬世界融為一體。最後，三維模型建模則為本篇研究的重點，下面章節會對三維建模加以詳述。上面所提到的應用都必頇建立在準確的辨識以及對應下才能做最好的呈現，我們的研究就是在對這個環節進行深入的探討。

三維模型建模在這一二十年都持續有利用光達(LiDAR)或雷達(RaDAR)來進行測量以及研究，但這必頇要有非常精密的儀器與投入較高的財力。我們則是期望以較簡單的方法取得相同資訊以降低成本，並且達成同樣甚至更好的效果，例如一般的相機或是衛星影像。要從二維影像中建置出三維的物體，這觀念就好比人的眼睛，必頇要有一對才能看到立體的事物，而且能觀察出物體的遠近。也就

‧

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

是說，至少要有兩張影像的資訊才能建模出三維的物體。先前的研究多半單就兩張影像之間的關係做探討，在 Armangue[11]就分析了許多種兩張影像之間計算的演算法以及其準確性與計算速率。但是，由於相機的普及，我們對同一場景或建築的多視角拍攝影像取得越來越容易，不管是自己拍攝或是從網路中下載。所以我們的研究是以多視角影像進行處理以改善單就兩張影像的實驗結果。也由於我們影像的來源是不知道任一台相機拍攝的位置以及拍攝焦距，所以本研究中引用了 Bundler 軟體幫助我們做相機的校正，計算出任兩張影像的對應點以及在同一座標系統下相對的位置也就是投影矩陣。Bundler 在這領域中被普遍使用，許多具權威的作者也推薦它是自動產生相機參數非常好的軟體。在 Furukawa[12]和蔡瑞陽[8]中提出的三維建模方法都是在多視角影像環境下完成，但是首先都必頇要找出特徵點以及各張影像中特徵點的對應關係即稱為對應點。對應點的好壞關係著建構出三維模型的完整性與準確性。本研究就是針對對應點選取的準確程度做分析與研究，使最後在電腦視覺應用的呈現能夠更完整與精確。

本篇論文透過一個名為三焦張量(trifocal tensor)[3][10][20][26][15][16]的數學模型進行對應點過濾的實驗。三焦張量就是三張影像之間的幾何關係，它存在一個基礎的推導就是以某兩張影像的對應點或是對應線計算出第三張影像上的對應點或對應線。在先前的許多研究中，大部分都是以兩兩張影像之間的幾何關係進行對應點的篩選，像是 Furukawa[12]與蔡瑞陽[8]甚至本研究使用到的 Bundler 都是依賴存在兩張影像之間基礎矩陣(fundamental matrix)的轉換關係。而我們的研究就是以三焦張量在三張影像之間的幾何關係改善以兩兩張影像轉換時可能存在錯誤累積的狀況。

為了能實現建構三維模型或更多的應用使其準確的呈現，三焦張量的準確度變成這些應用的基石。對應點的選取攸關三焦張量的好壞，三焦張量計算後誤差

‧

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

值越低，相對這些應用的精準度就會越高，效果越好。無庸置疑，設計一個好的三焦張量過濾機制使對應點準確度得以提升就是這項研究的目的。也因為是透過三焦張量的幾何關係判斷對應點的準確性，不用大範圍的比對相似度以降低計算量，提升效率同時也是這項研究的附加價值。

‧

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

1.2 問題描述

影像之間對應點的準確性為本篇論文最大訴求，利用三焦張量幾何關係修正多張影像拍攝相同物體較偏差的對應點即是我們解決問題的方向。電腦視覺中許多應用都建立在兩張影像或是多張影像之間的關係上，而影像之間的聯繫就在於特徵點與特徵線的對應，假使對應點準確度相當高，在應用中理所當然就可以更準確地呈現。

在蔡瑞陽[8]、丁彥弘[1]或其他的參考論文中，大部分是利用極線轉換 (epipolar transfer)去找出更密集的對應點，而極線轉換在電腦視覺中扮演非常重要的角色。但論文中使用極線轉換可能存在退化的問題，在相關研究會加以詳述。

這個影響因素會造成部分對應點找不到的問題，甚至在最後在三維建模會造成偏差。另外，極線轉換的優劣程度是仰賴基礎矩陣的準確性，如同前一節所說，它是以兩張影像之間的關係為基礎，而我們則以每三張影像之間的幾何關係來加強影像之間轉換的準確性。本研究就是希望解決上述問題改善對應點的準確性，最後以網路上的資料進行實驗與數據分析。

‧

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在文檔中三焦張量在多視角幾何中的計算與應用 - 政大學術集成 (頁 12-16)