多重畫面決策 - 自動化演講錄製系統之虛擬導播子系統

虛擬導播系統使用反傳遞類神經網路 (counterpropagation network,CPN)

[Hec86]來對多個畫面進行決策。本章將詳細說明為何使用 CPN 網路做為畫面決策的模型，再敘述如何將其運用至畫面決策中。第一節將描述選用 CPN 網路的理由與簡述其設計原理、第二節將說明如何將 CPN 網路運用在畫面決策上。

4.1、真實導播與 CPN 網路

本節將描述 CPN 網路的設計精神與真實導播之間的對應，再進一步簡述

CPN 網路的架構。

4.1.1、真實導播與 CPN 網路的連結

真實

導播

在一場演講或節目的錄製中，導播是其中的靈魂人物，雖然導播的地位如此重要，但是絕大部分的導播並非科班出生。一般而言，導播的養成必須從攝影、

剪輯開始學習，要成為合格導播必須有快速的臨場反應能力、領導力與觀察力，

而這些能力的培養，必須從基層做起。累積到一定的經驗後，便開始到有經驗的導播旁學習如何指揮攝影師、選鏡等。起初先從模仿中學習，等到技能純熟後，

再慢慢加入自己的風格，成為獨當一面的導播。

導播的選鏡方式沒有一定的準則而且學習過程緩慢，因此只能從反覆的操作、

練習中慢慢體會，在心中形成屬於自己的選鏡規則。而這些規則最後會逐漸的轉變成具有自我風格的”規則庫”。

CPN 網路

CPN 網路於 1986 年由 Robert Helcht-Nielsen 所提出。此網路通常適用於近似函數(approximation functions)的問題或是有關聯想、記憶等問題。也就是說，

當輸入與預期輸出之間，並非簡單的函數關係(例如：線性函數)可以描述時，CPN 網路會利用自身的結構”記憶”輸入與預期輸出之間的關係，而此關係可以視為一條”規則”，這些規則將累積形成一組”規則庫”。

真實導播與 CPN 網路的連結

考慮 CPN 網路的建構，其原理是利用輸入資料對應至預期輸出之間的關係，

進而建立規則庫；而真實導播則是利用模仿前輩選鏡的方式與技巧，建立自身的規則庫。

規則庫建立完成後，當一組新的輸入資料進入 CPN 網路時，此網路會自動選出與輸入資料最相近的規則，並將對應於此規則的預期結果輸出；對照真實導播在選鏡時的思考模式，當導播收到攝影師傳來的影像時，會憑藉自身的經驗(已建立好的規則庫)選出最適合的鏡頭播出。

以上真實導播的運作模式正符合 CPN 網路的建構精神，因此本研究使用 CPN 網路做為學習選鏡與畫面決策的模型。

4.1.2、CPN 網路簡介

圖 4-1 是完全連結的倒傳遞類神經網路的架構圖，主要分成五層，分別由兩層輸入層(input layers)、兩層輸出層(output layers)、以及一層隱藏層(hidden layer) 所組成。圖中的輸入層分別輸入兩組資料，一組為 X 輸入層的輸入值，輸入訓

(cluster layer)。類別層中的每個神經元代表每一個類別，而連接 X 輸入層的神經

元x₁,...,x_n與隱藏層神經元之間的權重向量w ，用於判斷每組輸入值被歸類為_ji R₁

輸出的便是對應於該預期結果的輸入值x₁^*,...,x 。 ^*_n

上述連結輸入層與隱藏層之間的權重向量w 、_ji u ，以及連結輸出層與隱藏_jk 層之間的權重向量v 、_kj t 的訓練方式將於 4.2 節說明。 _ij

4.2、CPN 網路學習演算法用於畫面決策

完全連結反傳遞網路的其中一項特色，在於輸入一組預期的結果至網路中，

會得到一組相對應的輸入資訊。然而，虛擬導播決策出來的畫面，不全然由一種狀況觸發，也就是說，假設導播切換至全景畫面時，可能是因為講者與觀眾有頻繁的互動，抑或是設備有突發狀況而播放的安全畫面。因此，我們不需要 X 輸出層的結果，便將完全連結反傳遞網路的架構圖簡化，更新後的架構如圖 4-2 所示，稱之為 Forward-mapping CPN。

圖 4-1、完全連結反傳遞類神經網路架構圖。

Forward-mapping CPN 的網路架構是由輸入層、一層隱藏層、以及一層輸出層所組成。主要分成兩個部分：如圖 4-3 所示，左圖中黃色虛線框選的區域，稱為 Kohonen 層。該層的學習演算法為非監督式學習，使用「贏者全拿」 (winner-take-all)演算法來訓練權重向量w 。另一個部分，稱為 Grossberg 層，如_ji 圖 4-3 右圖中，黃色虛線框選之處。此層使用的是 Grossberg 演算法來訓練權重向量u ，屬於一種監督式學習演算法。由於隱藏層的神經元表示一種類別，也_jk 可表示一種規則，而隱藏層與輸入層和輸出層之間的連結關係，則可以視為一句

圖 4-2、Forward-mapping CPN 架構圖。

圖 4-3、Kohonen 層(左)與 Grossberg 層(右)示意圖。

4.2.1、Kohonen 層學習演算法

隱藏層中每一個神經元可代表一個規則，因此整個 Kohonen 層即可視為一

winner

min

j n

d d



 _.

winner i winner i winner i winner i

w t   w t   x t  w t

圖 4-4、winner-tak-all 示意圖。

的 Y 輸入層作為連結輸出層的權重。

4.2.2、Grossberg 層學習演算法

Grossberg 層中，判斷分類好的類別必須輸出哪一種結果是這個階段主要的工作。權重學習的方式是使用 Grossberg 演算法，屬於一種監督式學習法，也就是必須藉由輸入期望的目標來更新權重。流程與 Kohonen 層類似。其演算法的

能被更新。

1,...,

winner min j

j n

d d

 

4. 同樣只更新連結到贏家的權重，更新公式如下：

( 1)

( ) [

( )

( )]

winner i winner i winner i winner i

w t   w t   x t  w t

( 1)

( ) [

( )

( )]

winner k winner k winner k winner k

u t   w t   y t  u t

為學習速率，此階段為一定值，即為在 Kohonen 層最後收斂的值。 是

Grossberg 層的學習速率，為一固定值。

4.2.3、Forward-mapping CPN 於測試(testing)階段之架構

圖 4-7 是 Forward-mapping CPN 在測試(testing)階段的架構圖。在同一演講場

圖 4-7、Forward-mapping CPN 之 testing 架構圖。

在文檔中自動化演講錄製系統之虛擬導播子系統 (頁 48-58)