系統流程

第三章系統概述

第二節系統流程

以觀眾為拍攝主體之虛擬攝影師系統之流程圖如圖3.5所示，其主要架構分為運動特徵擷取(motion feature extraction)、運鏡判斷(camera movement decision)以及路線規劃(path planning) 三個部分。Motion feature extraction 包含連續畫面的

圖3.3 PTZ 攝影機架設角度示意圖 (a)垂直俯角 (b)水平偏差角 (a) (b)

圖3.4全景 PTZ 攝影機實際拍攝影像 (a)階梯式演講廳 (b)會議室(水平地面)

(a) (b)

motion 擷取、motion feature 的擷取以及 motion feature 的模糊化(fuzzification)。

Camera movement decision 包含判斷是否需要切換運鏡、運鏡的選擇以及景別的選擇。Path planning 包括拍攝主體候選者的偵測、拍攝主體的選擇以及運鏡路線的規劃，最後操作運鏡 PTZ 攝影機進行運鏡的動作。以下會對這三個主要流程做進一步的說明。

圖3.6為 motion feature extraction 之流程圖，分為 MEHI calculation、feature extraction 以及 feature fuzzification 三個部分。首先從全景 PTZ 輸入連續影像，然後對每張影像偵測 motion，為求運算的便利及速度，偵測 motion 的方法使用差值影像法(intensity difference image，IDI)。以此法所得到的 motion 為單一時點的資訊，只能知道 motion 產生，而不能得到 motion 的方向和持續性。因此使用 motion history image (MHI) 技術來擷取連續的 motion 資訊，MHI 以重疊 IDI 和隨時間衰減的方式記錄 motion 的時序性。但是由於 MHI 具覆蓋先前 motion 資訊的性質，

此性質會造成被覆蓋 motion 能量的佚失而不利於某些 motion feature 的擷取。因此本研究利用改變 MHI 重疊的方式另創 motion energy history image (MEHI)讓 motion 的能量不會被覆蓋以便於 feature 的擷取。

Frame input

Camera movement decision Motion feature extraction

Path planning

PTZ work

圖 3.5 系統流程圖

在完成 motion 資訊的擷取後，接著進行 feature extraction 的步驟，該步驟會從 MHI 及 MEHI 共擷取四種 motion features。此四種特徵分別為運動強度(motion strength)、運動集中度(motion concentration)、運動強度亂度值(motion strength entropy)、運動方向亂度值(motion orientation entropy)。這四種 features 能夠代表觀眾的熱烈程度和動作的一致性，可以來判斷適合的運鏡。

由於這五種 motion features 都是明確的數值，難以和人類的感覺做連結，例如由上個步驟擷取的 motion strength 是一個數值，但是以人的觀點來度量這項特徵通常會以「強」、「弱」來區分。Fuzzification 是個連結這兩種關係的方法，可將純數值和人類的語言中的語義結合對應，讓使用者能夠用語言表達的方式定義規則。如此不但可將 motion features 和攝影師判斷運鏡的標準作結合，同時也利於人工擷取 motion features。關於 motion feature extraction 之內容將在第四章詳細介紹。

圖 3.6 Motion feature extraction 流程圖 MEHI calculation

Feature fuzzification Motion

strength Motion

strength entropy

Motion orientation

entropy Motion

concentration MHI calculation

圖3.7為 camera movement decision (CM decision)的流程圖，分為 CM change checking、CM transition、shot decision 三個主要步驟。Change check 的步驟主要在確認切換運鏡的必要性，影響運鏡是否切換的要素有二，第一是 fuzzy motion feature 值的改變，第二是前一個運鏡的持續時間。Fuzzy motion features 是上一個步驟所得到的模糊化 motion features，若是這些特徵值發生變化表示畫面中的 motion features 已經有明顯足以辨認的強弱差異，系統在其發生大幅變化時應該要採取改變運鏡的動作。運鏡的持續時間是指運鏡開始執行到切換至下一次運鏡的時間間隔，運鏡持續時間太短會造成短時間內連續的切換而使得影片混亂而且瑣碎。若是運鏡持續時間太長又會讓人感覺缺乏變化，透過相關研究[Chu09]得知

，一般影片的運鏡持續時間約在5.3秒左右。因此本系統設定運鏡持續時間的最短 No

Yes

Frame input

CM transition

CM timer

圖 3.7 Camera movement decision 流程圖 CM change check

Shot decision Motion feature extraction

Does CM change?

Fuzzy motion features

為3秒(3秒內不得切換運鏡)，最長不超過6秒(6秒內必須切換運鏡)來避免以上問題

。若運鏡持續時間不到最短時間或是 fuzzy motion features 沒有變化就被視為不需要切換運鏡(回到輸入連續影像)，反之則進入下一個步驟 CM transition。

CM transition 的目的在於選擇合適的運鏡種類，這個步驟除了必須考慮如何模仿攝影師的經驗判斷外，另外還需考慮鏡頭間的關聯性。系統要模仿攝影師必須要有能夠學習並記錄攝影師習慣的能力，並且要能夠將攝影師的經驗轉化成系統能夠接受的型式。鏡頭間的關聯性指的是連續運鏡之間的關係，前幾個運鏡可能間接或直接的影響到下一個運鏡的選擇，例如連續的定點攝影、定點攝影接著拉近或拉遠以及拉近後橫移等等。本研究提出 automatic camera movement model (ACMM)以解決上述的問題，ACMM 以 finite state machine (FSM)為基礎，主要結構分為 camera movement state (CMS)以及 transition probability model (TPM)。CMS 如同 FSM 的 states，先前的每個輸入都會影響到 CMS 的轉移，也可以說是具有紀錄先前輸入的性質，這個性質有利於運鏡間關聯性的建立。任意兩個 CMS 間皆有 TPM 連接，TPM 具有指向性，其功能為記錄攝影師的運鏡習慣。ACMM 的輸入為 fuzzy motion features，並將這些特徵值放入與當前 CMS 連接且方向向外的 TPM 中。每個接收到輸入的 TPM 將會產生一轉移機率，然後挑選具最高機率的 TPM 做為轉移方向。而該 TPM 所指方向之 CMS 的輸出即為下一個運鏡。

在決定合適的運鏡之後，shot decision 步驟將決定與該運鏡配合的景別。

ACMM 的每個 TPM 上都具有景別機率模型 (shot probability model)，該模型統計了通過此 TPM 的景別機率分布。藉由上一步驟所挑選出的 TPM 其上的景別機率模型可以得到每種景別的使用率，為避免每次都只用同一種景別，在挑選景別時以使用率的高低作為選取的機率以增加選擇的多元性。以上關於 CM decision 的部分將在第五章作詳細介紹。

圖3.8為 path planning 之流程圖，主要步驟分別為 face target detection、motion target detection、target decision 以及 CM path planning。當 ACMM 決定運鏡及景

別後，path planning 將會決定拍攝主體並依據所決定的運鏡規劃運鏡 PTZ 攝影機鏡頭的移動路線。拍攝的候選主體有兩種產生方式，一種是以觀眾的臉部作為目標，另一種是以產生 motion 的區域中心做為目標。由於本系統以觀眾為拍攝主體

，因此以觀眾臉部的拍攝較為優先。Motion targets 則做作為備用以及排序 face targets 的條件之一。

利用前一步驟挑選出拍攝候選主體之後，target decision 將從中決定拍攝主體

。其決策標準包含構圖(composition)、專注分布(saliency map)、光線明暗、主體與畫面中心的距離以及主體和 motion targets 的距離。經由以上條件的評比將會選出此次運鏡的拍攝主體。Composition 代表畫面的構圖，在構圖法中以井字構圖法最為普遍。因此本研究以此構圖法作為標準，將攝影主體候選者放置在井字構圖法中的理想位置來計算構圖評分[Ban07]。Saliency map 表示畫面中被觀賞者注意區域的分布，該值越高表示越容易受到注意。由於光線的明暗會影響到拍攝的效果，畫面中過於黑暗或是明亮的部分將被評為不適合拍攝的區域。主體與畫面中心的距離會影響運鏡 PTZ 攝影機移動的幅度，移動幅度越大越容易影響到與前一

PTZ Work CM path planning

CM timer Face target detection Motion target detection

圖 3.8 Path planning 流程圖 Target decision

Camera movement decision

張畫面的連續性。另外，主體和 motion target 的距離越近表示該觀眾可能正在動作，相較於其他沒有 motion 相鄰的觀眾較為突出，因此兩者之間的距離越近越適合當作拍攝主體。

最後，CM path planning 將會依運鏡種類的不同替拍攝主體規劃運鏡 PTZ 的移動路線及產生運鏡 PTZ 的控制參數。運鏡 PTZ 的控制參數包含起始位置(start point)、結束位置(end point)、運鏡速度(move speed)及推拉速度(zoom speed)。其中 start point 及 end point 與運鏡的種類相關；move speed 會依 motion strength 強弱作改變；zoom speed 的快慢則和景別與拍攝主體的面積比有關。最後這些參數將會轉成 PTZ 的指令傳送給運鏡 PTZ，執行運鏡的動作。Path planning 的詳細作法將會在第六章說明。

在文檔中以觀眾為拍攝主體之虛擬攝影師系統 (頁 33-40)

第三章 系統概述

第二節 系統流程

第三章系統概述

第二節系統流程