虛 擬 導 播 系 統 使 用 反 傳 遞 類 神 經 網 路 (counterpropagation network,CPN)
[Hec86]來對多個畫面進行決策。本章將詳細說明為何使用 CPN 網路做為畫面決 策的模型,再敘述如何將其運用至畫面決策中。第一節將描述選用 CPN 網路的 理由與簡述其設計原理、第二節將說明如何將 CPN 網路運用在畫面決策上。
4.1、真實導播與 CPN 網路
本節將描述 CPN 網路的設計精神與真實導播之間的對應,再進一步簡述
CPN 網路的架構。
4.1.1、真實導播與 CPN 網路的連結
真實
導播在一場演講或節目的錄製中,導播是其中的靈魂人物,雖然導播的地位如此 重要,但是絕大部分的導播並非科班出生。一般而言,導播的養成必須從攝影、
剪輯開始學習,要成為合格導播必須有快速的臨場反應能力、領導力與觀察力,
而這些能力的培養,必須從基層做起。累積到一定的經驗後,便開始到有經驗的 導播旁學習如何指揮攝影師、選鏡等。起初先從模仿中學習,等到技能純熟後,
再慢慢加入自己的風格,成為獨當一面的導播。
39
導播的選鏡方式沒有一定的準則而且學習過程緩慢,因此只能從反覆的操作、
練習中慢慢體會,在心中形成屬於自己的選鏡規則。而這些規則最後會逐漸的轉 變成具有自我風格的”規則庫”。
CPN 網路
CPN 網路於 1986 年由 Robert Helcht-Nielsen 所提出。此網路通常適用於近 似函數(approximation functions)的問題或是有關聯想、記憶等問題。也就是說,
當輸入與預期輸出之間,並非簡單的函數關係(例如:線性函數)可以描述時,CPN 網路會利用自身的結構”記憶”輸入與預期輸出之間的關係,而此關係可以視為一 條”規則”,這些規則將累積形成一組”規則庫”。
真實導播與 CPN 網路的連結
考慮 CPN 網路的建構,其原理是利用輸入資料對應至預期輸出之間的關係,
進而建立規則庫;而真實導播則是利用模仿前輩選鏡的方式與技巧,建立自身的 規則庫。
規則庫建立完成後,當一組新的輸入資料進入 CPN 網路時,此網路會自動 選出與輸入資料最相近的規則,並將對應於此規則的預期結果輸出;對照真實導 播在選鏡時的思考模式,當導播收到攝影師傳來的影像時,會憑藉自身的經驗(已 建立好的規則庫)選出最適合的鏡頭播出。
40
以上真實導播的運作模式正符合 CPN 網路的建構精神,因此本研究使用 CPN 網路做為學習選鏡與畫面決策的模型。
4.1.2、CPN 網路簡介
圖 4-1 是完全連結的倒傳遞類神經網路的架構圖,主要分成五層,分別由兩 層輸入層(input layers)、兩層輸出層(output layers)、以及一層隱藏層(hidden layer) 所組成。圖中的輸入層分別輸入兩組資料,一組為 X 輸入層的輸入值,輸入訓
(cluster layer)。類別層中的每個神經元代表每一個類別,而連接 X 輸入層的神經
元x1,...,xn與隱藏層神經元之間的權重向量w ,用於判斷每組輸入值被歸類為ji R1
41
輸出的便是對應於該預期結果的輸入值x1*,...,x 。 *n
上述連結輸入層與隱藏層之間的權重向量w 、ji u ,以及連結輸出層與隱藏jk 層之間的權重向量v 、kj t 的訓練方式將於 4.2 節說明。 ij
4.2、CPN 網路學習演算法用於畫面決策
完全連結反傳遞網路的其中一項特色,在於輸入一組預期的結果至網路中,
會得到一組相對應的輸入資訊。然而,虛擬導播決策出來的畫面,不全然由一種 狀況觸發,也就是說,假設導播切換至全景畫面時,可能是因為講者與觀眾有頻 繁的互動,抑或是設備有突發狀況而播放的安全畫面。因此,我們不需要 X 輸 出層的結果,便將完全連結反傳遞網路的架構圖簡化,更新後的架構如圖 4-2 所 示,稱之為 Forward-mapping CPN。
圖 4-1、完全連結反傳遞類神經網路架構圖。
42
Forward-mapping CPN 的網路架構是由輸入層、一層隱藏層、以及一層輸出 層所組成。主要分成兩個部分:如圖 4-3 所示,左圖中黃色虛線框選的區域,稱 為 Kohonen 層 。 該 層 的 學 習 演 算 法 為 非監 督 式 學 習 , 使 用 「贏 者 全 拿 」 (winner-take-all)演算法來訓練權重向量w 。另一個部分,稱為 Grossberg 層,如ji 圖 4-3 右圖中,黃色虛線框選之處。此層使用的是 Grossberg 演算法來訓練權重 向量u ,屬於一種監督式學習演算法。由於隱藏層的神經元表示一種類別,也jk 可表示一種規則,而隱藏層與輸入層和輸出層之間的連結關係,則可以視為一句
圖 4-2、Forward-mapping CPN 架構圖。
圖 4-3、Kohonen 層(左)與 Grossberg 層(右)示意圖。
43
4.2.1、Kohonen 層學習演算法
隱藏層中每一個神經元可代表一個規則,因此整個 Kohonen 層即可視為一
winner
min
jj n
d d
.44
winner i winner i winner i winner i
w t w t x t w t
圖 4-4、winner-tak-all 示意圖。45
的 Y 輸入層作為連結輸出層的權重。
4.2.2、Grossberg 層學習演算法
Grossberg 層中,判斷分類好的類別必須輸出哪一種結果是這個階段主要的 工作。權重學習的方式是使用 Grossberg 演算法,屬於一種監督式學習法,也就 是必須藉由輸入期望的目標來更新權重。流程與 Kohonen 層類似。其演算法的
46
能被更新。
1,...,
winner min j
j n
d d
4. 同樣只更新連結到贏家的權重,更新公式如下:
,
( 1)
,( ) [
,( )
,( )]
winner i winner i winner i winner i
w t w t x t w t
*
,
( 1)
,( ) [
,( )
,( )]
winner k winner k winner k winner k
u t w t y t u t
為學習速率,此階段為一定值,即為在 Kohonen 層最後收斂的值。 是
Grossberg 層的學習速率,為一固定值。
4.2.3、Forward-mapping CPN 於測試(testing)階段之架構
圖 4-7 是 Forward-mapping CPN 在測試(testing)階段的架構圖。在同一演講場
47
圖 4-7、Forward-mapping CPN 之 testing 架構圖。
48