第六章 主體選取與運鏡路線規劃
第二節 主體挑選
當主體候選者產生後,接下來要從中挑選最合適拍攝主體。本研究以五個標 準對每個主體候選者做評比,這五個標準分別為運動鄰近程度 (motion field neighborhood)、構圖(composition)、亮度(luminance)、畫面連續性(continuous)以及 畫面重複性(repetition)。運動鄰近程度代表被作為主體候選者的觀眾做出動作的 可能性;構圖指的是主體候選者是否符合攝影學中常用的畫面結構。畫面的亮度 會影響觀賞者對主體的辨識程度,因此利用該評比項目來降低主體亮度過低的主 體候選者。另外,不斷重複的畫面會讓影片變的單調,所以影片的重複性亦為評 比的標準之一。以下將就這五個評比標準作介紹:
圖6.2 Cascade classifier 概念圖[Vio04]
54
6.2.1 運動區域鄰近程度(motion field neighborhood)
由於拍攝主體候選者多為觀眾的臉部,且在觀眾席上產生 motion 的物體多為 觀眾所造成,所以當主體候選者附近有 motion 產生代表該觀眾可能正在做出某種 動作。動作中的觀眾相較於其他觀眾更容易被注意,一般在演講廳的觀眾的動作 並不多,若有觀眾做出動作很可能是舉手或是需要被其他人注意的情況。運動區 域鄰近程度即為用來計算該主體候選者做出動作可能性,首先對運動能量歷史影 像(MEHI)做二元化處理,以凸顯有 motion 產生的 pixels。接著對其進行 connected component labeling,此步驟可以把影像中相連且 intensity 值不為0且相連的 pixel 標記為同一個區塊。當每一個產生 motion 的區塊都被標記為不同的 label,接著 對每個不同 label 的區塊計算其重心座標,並計算主體候選者的中心座標和每一個 motion 區塊的中心座標的距離。當距離越小代表該觀眾做出動作的可能性越高,
應要在此項評比中獲得較高的分數。令C 為主體候選者的中心座標,s Cmi 為 label 為 i 的 motion 區塊中心座標,0in,iN,n 為 motion 區塊的數量,dis 為 兩點間的幾何距離函數,則主體候選者的運動區域鄰近程度分數為A : n
)) , ( min( s mi
n dis C C
A
6.2.2 構圖(composition)
畫面的構圖是一個較為抽象的攝影詞彙,凡以畫面的結構、光影、顏色等構 圖6.3 井字構圖法與井字構圖遮罩 (a)井字構圖法 (b)井字構圖遮罩
(a) (b)
55
成畫面的要素達到畫面的平衡,都能夠稱作構圖。本研究所探討的構圖是以達到 畫面中結構的配置平衡為訴求,結構的配置意指畫面中物體的位置分配,或是背 景層次的呈現。該種類的構圖所常用的構圖方法有「井字構圖法」、「三分構圖法」
以及「對角線構圖法」,雖然構圖並沒有實際的標準或規則,這些構圖方法為學 理上的基礎構圖法,若符合該構圖法的規則仍具一定的公信力。
本系統以最為常用的「井字構圖法」(rule of thirds,圖6.3(a))作為構圖評比的 標準,首先建立井字格線遮罩Mrot(如圖6.3(b)),該遮罩的大小以 ACMM 輸出的 景別做調整。接著將遮罩中的點P 和主體候選者中心點1 C 對齊,然後對遮罩內的s 影像作 line detection[Ham99]處理。將得到的直線依照斜率分為水平、垂直左45 度角和右45度角四類,留下垂直和水平兩類的直線,並計算遮罩的井字標準線到 畫面中最近的同類斜率直線之距離。例如令距離標準線L 的水平類直線為1 L ,如2 圖6.4所示,則L 和1 L 的距離定義為到點2 U 的到0 L 的距離2 d(L2,U0),點U 為0 L 標1 準線和其中垂腺的交點。將四條遮罩標準線使以同樣方法計算該距離,並相加得 到構圖評比Acp。
6.2.3 亮度(luminance)
畫面的亮度會影響畫面中景物的清晰度以及觀看的舒適度,如果畫面亮度太 高會使得景物變得模糊,而且給人刺眼的感覺。若畫面亮度太低會讓景物難以辨 識,並會使畫面的顏色變得暗沉而不鮮麗。為避免主體在畫面中所在的位置有亮
圖 6.4 畫面中直線與井字遮罩標準線距離示意圖
56
度過高或過低,本研究在 HSV 色彩空間中做出亮度的限制,在主體候選者的區 域中不符該限制的 pixels 越多則亮度評比越低。
HSV 色彩空間的三個維度分別是 hue(色調)、saturation(色度)和 value(亮度),
如圖6.5(a)所示。令 R、G、B 分別為 RGB 色彩空間中的紅色、綠色、藍色的 intensity 值,則其經由 RGB 色彩空間轉換成 HSV 色彩空間的轉換公式如下: 值約在50~70之間是辨識物體最為清楚的明亮程度[李04][周12],因此將 V 空間分 成數個區間(如表6.1所示),一個 pixel 的 V 值所處的區間越靠近50~70區間的亮度
57
6.2.4 畫面連續性(continuous)
在運鏡切換的過程中,若鏡頭的移動幅度較大會造成前後兩個運鏡的畫面差 異較大,造成畫面間不連續的情況,該情況會使得畫面突兀且會失去和運鏡間的 關聯性。解決此問題的方法為減少攝影機在兩個運鏡之間過大幅度的移動,因此 當一個運鏡結束後,運鏡 PTZ 攝影機的鏡頭所停留的位置和下一個運鏡的主體候 選者之間的距離將作為畫面連續性的評比標準。令(x,y)為主體候選者在全景 PTZ 攝影機的畫面中的中心座標,全景 PTZ 攝影機的畫面中心座標為(0,0),為避免 分母為0的常數,則主體候選者的畫面連續性評比A 為: cn
2 2
1 y x Acn
當該主體候選者的中心距離畫面中心越近,代表運鏡 PTZ 攝影機在連續兩個運鏡 間的移動幅度越小,因此在此項評比中的分數越高。
重複性(repetition)
當一個主體在短時間內重複被選取到會讓觀看者有時間錯亂的感覺,尤其演 講廳的環境並不容易有大幅度的改變,若選到同樣的主體極可能使得目前的畫面 和先前的畫面極為相像。為避免畫面重複的狀況,本研究以主體歷史分布圖
圖6.5 HSV 色彩模型 (a)模型示意圖[27] (b)上方為原始彩色影像,下方為 V 值亮度影像[28]
(a) (b)
58
(subject history map,SHM)降低此情況發生的可能性。主體歷史分布圖為大小和 原輸入影像大小相同的灰階影像,該影像中每個 pixel 的 intensity 初始值為0。令 I 為原始輸入影像,t 為當前時間, 為灰階影像的 intensity 值之上限,a 為主體s 6.6(b)為 SHM 的執行結果,SHM 的 intensity 值越高的部分代表主體剛出現在這個 區域。因此在下一次進行主體挑選時,若該主體候選者位於 SHM 的 intensity 值
59