第一章 緒論
1.1 前言
目標物追蹤在計算機視覺領域中是一個極為重要且具有挑戰性的主題。伴隨 著電腦運算速度的提升,以及便宜且易取得的攝影機,促使學者們紛紛投入並利 用自動化的動態視頻進行分析,至今已發展出許多目標物追蹤的演算法。利用影 像序列追蹤分析主要包含三個步驟:偵測欲追蹤之移動物體、由兩個不同時間所 捕捉的畫面進行物體追蹤、分析與辨識各障礙物之行為。目前追蹤物體技術已相 當成熟,應用的領域大致可分為六大類,分別為基於運動模式的物體辨識、自動 化監視系統、視訊索引、人機介面、監視交通狀況以及車輛導航等應用。
偵測及追蹤技術的應用伴隨著人並與安全息息相關,近幾年全球汽車工業發 展蓬勃,加上各國交通道路建設日趨發達,使得汽車的使用量大增,卻造成交通 事故經常發生,探究其原因多為駕駛人專注力不佳或是未注意其他車輛而造成擦 撞的意外,為了增加駕駛人的行車安全,主要車廠如 TOYOTA 公司,所出產的 新型車款皆將防撞安全機制 (Pre-Crash Safety, PCS) 列為重要配備,並開發車輛 避障系統。此技術以裝設攝影機、雷達、超音波等感測器最為常見,其中車商 VOLVO 公司利用雷射感應系統開發了車輛行人偵測系統 (Pedestrian Detection System, PCS) 以取得車前資訊;日本的 Mazda 車廠已將追蹤技術應用在車道偏 離警示系統 (Lane Departure Warning System) 並用以進行車輛導航;另外,先進 停車導引系統 (Advanced Parking Guidance System, APGS) 不但是令人耳目一新 的主動式停車輔助技術,也是目前國際大廠投入先進安全車輛的成果,其運用超 音波與影像辨識之感測技術偵測車輛周圍鄰近障礙物,再配合電腦計算之路徑引 導駕駛者以自動控制車輛進入停車格,以達到更安全有效率之停車動作。
想獲得環境資訊的方法有很多種,常見的距離感測器如紅外線、雷射、立體
2
視覺、超音波等且各有其優缺點,感測器種類的選定則端看其用途。超音波不受 物體顏色及光源影響,Elfes et al. (1987) 將機器視覺結合聲納應用在自走型機器 人建立室內環境時的障礙物偵測;軍事之海底深度的估測也常以超聲波來取得海 中物體的位置資訊;而雷射的高準確度應用受環境限制較少,Garcia et al. (2009) 以及 Guivant et al. (2000) 將雷射測距儀架設於車輛上於戶外進行地圖重建並導 航。立體視覺則是經由兩個攝影機組成並可得大量的環境資訊,包括物體外形,
顏色,明暗,陰影等,與上述之其他種類的感測器獲得較為單純的量測資訊相比 則有較豐富的環境訊息。一般而言,單顆攝影機能解決大部分簡單應用 (Liu et al., 2007),但應用層面多在於辨識、追蹤的部分,雖然特定狀況下可達到環境偵 測的功能,但僅限於嚴格定義下之空間環境,面對實際應用則相對困難。立體視 覺指的是裝設兩個以上攝影機,利用立體視覺原理依據兩攝影機之間距使得左右 影像有所差異,分析兩張影像之關係以獲得目標深度為主的資訊,此方法須仰賴 有效的圖像匹配 (Correspondence Matching) 以及極限幾何 (Epipolar Geometry) 演算法,同時也具有視覺偵測的優點。由於各種感測器之優缺點不同,近年來結 合多種感測器以獲得更大效益的探討相當廣泛 (Mockel et al., 2003; Wender and Dietmayer, 2007)。徐 (2011) 則結合雷射測距儀和數位單眼相機同時取得深度及 色彩資訊,於場景中多個位置運用馬達原地旋轉取景,獲得不同位置中 360 度的 空間及顏色資訊,將三維座標中坐標資訊的點雲 (Point Cloud) 投影至平面上將 色彩與點雲結合。
利用影像序列進行物體追蹤在近年研究尤為常見,主要為找尋前後兩不同影 像中物體的特徵點或具代表之物理特性做為匹配過程中的依據。Zhu (2011) 運用 尺度不變特徵轉換 (Scale-Invariant Feature Transform, SIFT) 來偵測與描述影像 中的局部性特徵進行匹配,以及色彩之密度函數為特徵的均值平均追蹤 (Mean-Shift) 演算法來搜尋影像中欲追蹤物體的位置。另外,Cohn et al. (1998) 利用光 流法 (Optical Flow) 在不同影像中,亮度恆定且物體運動位移相對小且為剛體運 動下等條件考量追蹤選定之物體。
3
農業領域中立體視覺也廣泛被使用。基於影像處理技術利用立體視覺計算作 物之高度及寬度等物理特性以便計算其生長率 (Chapron et al., 1993),另外 Billingsley (2005) 曾利用立體視覺偵測農場周圍之野生動物,以避免農作物遭到 破壞;立體視覺在農業上的應用範疇也包含追蹤技術,但早期攝影機並不普及 Ollis 和 Stenz (1996) 僅以黑白攝影機利用演算法及影像處理找出影像中收割機 的位置,來追蹤收割作物時的情形。
1.2 研究目的
在探討以上眾多文獻之後,許多感測器可獲得前方物體資訊,但各有其缺點,
雷射搭配單一攝影機難以將兩者完美結合,無法給予每個座標點正確的色彩資訊,
主要是因為攝影機無法提供深度資訊且必須知道畫面中每個像素所代表的實際 距離,攝影機與雷射之間座標轉換關係需精確才得以準確獲得前方色彩及深度資 訊。市上銷售之遊戲機使用之 Kinect 攝影機雖能同時獲得深度及色彩資訊但卻 受紅外線干擾而受限於室內的使用。而紅外線則是容易受各種熱源與光線干擾且 偵測的距離也有較大限制,須配合雷射使用但也造成成本上的增加。反觀,使用 雙攝影機以模仿人類的雙眼視覺系統,可達成立體成像和測距的目的,且攝影機 價格相較其他感測器更為廉價,故此方法較為合乎成本效益且不受限於室內或室 外等特定場景。為了能將立體視覺應用於農業監測與車輛安全上,本論文主要的 研究方向為三個部分:障礙物追蹤、避障方法,並以校園、市區、農場做為實驗 驗證的場景。以下利用條列的方式說明本研究之具體分項項目:
1. 由 1.1 節提及的文獻可知運用單一攝影機下所發展之演算法普遍可解決 部分追蹤問題,但現實情況常會遇到物體顏色相似度過高的情形,因此 單顆攝影機所提供的色彩資訊不足以解決這類型問題;然而各種距離感 測器則僅能提供片面的深度資訊而僅以此訊息卻無法有效追蹤多個並 排的物體,而此種情形尤為常見。因此,如欲同時解決上述之特殊情形
4
下的物體追蹤,色彩與距離資訊的結合是必要的。
2. 車輛對障礙物的安全避障與導航概念源自於機器人領域,強調在當了解 周圍環境狀況後進行正確的判斷跟規劃,自走車除了必須偵測前方資訊 之外,亦會利用路徑規劃 (Pathfinding) 進行避障與導航的功能。然而,
路徑規劃僅能將事先利用感測器所得到的環境資訊納入考量,因此先建 立 地 圖 (Grid Map) 再 根 據 目 標 方 向 與 定 位 引 入 價 值 函 數 (Cost Function) 作為演算法計算最小成本的規範。本文的避障方法將依據偵 測與追蹤到之障礙物進行動態行為判斷以及運動模型的建立,再利用演 算法達成障礙物的位置估測和路徑規劃,如此一來便有足夠資訊提供給 駕駛員進行行車安全的判斷達到警示之效果。
3. 立體視覺已有眾多發展卻鮮少將立體視覺同時應用於農業車輛與行人 偵測及追蹤上。因此,本研究之實驗場景主要以農業車輛安全上之應用 為主軸進行系統的驗證跟效能測試。
5