簡介 - 自動化演講錄製系統之虛擬導播子系統

第一章簡介

1.1、研究動機

近年來，由於光纖網路(optical network)、無線網路(wireless network)與行動通訊網路(例如：3G、4G)的蓬勃發展，使用者已經不再僅僅只能透過定點式的電腦上網，更能夠透過手持式裝置或是平板電腦隨時隨地的上網漫遊、觀看網路上的多媒體資訊。伴隨著網路普及率以及民眾上網時數的提升，多媒體數位內容產業逐漸受到世界各國的重視，在高科技及教育的國家中，甚至將數位化的科技教育列為國家未來發展重點項目之一。根據美國研究機構 Ambient Sight 的調查報告顯示，在 2009 年時，數位學習或數位服務產值在全球已達到兩百多億美元，

該機構進一步預估，產值將於 2014 年時攀升至將近五百億美元。

表 1-1、全球市場的數位學習產品及服務產值。(資料來源：Ambient Sight)

在各式各樣的數位多媒體學習服務中，演講錄製以及課程教學錄製更是近年來大專院校與學習機構的重點發展項目之一，而這些錄製完成的影片會被上傳到網路或雲端伺服器中，提供線上學習以及遠距教學等數位學習服務。在台灣，線上學習服務及遠距教學平台已經相當普及，像是補教界知名的數位學堂(圖 1-1，

左圖)、以及國立交通大學的開放式課程系統(圖 1-1，右圖)，皆能夠幫助學生在課後自行加強練習，或者讓偏遠地區的學子也能一睹大師風采；在國外，知名的教學演講平台 TED 提供各國學者、機構將錄製好的演講上傳至網路，並可依據語言的不同添加字幕，隨時提供最新的演講與科技資訊，更是風靡全世界。由此可見，在這資訊爆發的時代，演講及課程錄製已在整個教育界與媒體傳播界中佔有相當重要的地位。

要完整的錄製一場演講需要眾多的人力，而且準備工作相當繁複。在演講開始之前，攝影團隊必須先對拍攝的場地進行勘查作業，依照場地的限制來規劃人員的安排及器材的架設，最重要的是在事先規劃好的位置架設攝影機；在演講過程中，需要由多位攝影師利用已架設好的攝影機從不同的角度拍攝演講現場，並

圖 1-1、左圖為數位學堂介面、右圖為交通大學開放式課程系統。

(來源:TKB 數位學堂、國立交通大學)

1.2、文獻探討

為了降低演講錄製時所需的人力與設備成本，近年來有許多探討自動化錄製系統的研究及產品。自動化演講錄製系統最早是由[Cru94]提出，但是 Cruz 只使用一台位置固定的攝影機拍攝演講現場，呈現出來的畫面相當單調。即便使用了多台位置固定的攝影機分別拍攝講者、聽眾、和演講素材(投影片)，但是由於攝影機仍然是固定式架設，長時間觀看仍然非常容易造成人類感官上的疲勞。

[Bia98]則改進上述缺點，提出一套自動演說轉播系統，使用多台可動式攝影機拍攝，這些攝影機結合了影像分析軟體，能夠偵測到演講者所在的位置並且追蹤演講者的動態，藉此來控制攝影機運轉。[Oni04]則更進一步辨識演說者的動作，

結合演講者的動作及其位置來決定攝影機的運作，已達成自動化拍攝的目標。

除了學術界有相關研究之外，產業界也陸續推出自動化錄製的相關系統。飛庭科技於 2010 年推出「多媒體全自動錄播系統」，該系統主要針對學校於教學上

(a) (b)

圖 1-2、現存產品(a)多媒體全自動錄播系統輸出畫面 (資料來源：飛庭科技)。(b) HDVR 系統輸出畫面。(資料來源：控智科技)

的使用以及一般公司行號使用於視訊會議，輸出的畫面是由三個子母畫面以及演講者之簡報所組成，使用者可以從多個子畫面中自行選擇想要觀看的畫面(圖

1-2)，並將其放大顯示。除此之外，控智科技(Konzesys)也推出一套播錄平台，

稱之為 HDVR (High Definition Video Record System)，該系統可提供最多五個子畫面同時播放，並且搭配投影片等多媒體素材一併播放(圖 1-2)。來逐漸增多，像是[Gle00]提出了 virtual videography、以及[Liu01]則是探討從多部影片中，分別截取有意義的片段來組成新的影片；類似方法的還有[Kum02]、

[Oku07]，Kumano 使用 video grammar 來分析攝影機的運動，並藉由攝影機運動的情況，將多個影片素材組合編輯成一個較完整的影片。[Wan09]則是透過基因演算法(genetic programming)來分析影片結構，並且使用攝影學中常用的運鏡方

6 擬導播的相關研究一直不多，[Liu10]以有限狀態機(finite state automaton)來模擬導播選鏡的工作、[Mac02]則提出整合導播所有工作的網路系統，並稱之為虛擬導播(virtual director)系統。

1.2.2 影像品質的評估與分析

1.3、論文架構

本論文將於第二章介紹系統架構，並詳細說明虛擬導播系統的運作流程及系統的設計原理；第三章的影像品質的評估與分析章節，將介紹虛擬導播如何依據各方面的評選準則對畫面進行評分；而第四章說明虛擬導播如何藉由評分的結果，

學得導播選鏡習慣與技巧，並且能夠根據所習得的模型對畫面做出決策，選出最適合的畫面播放。第五章是實驗結果，該章節將呈現本研究的方法與其他方法的比較與實驗數據。第六章為總結，討論未來可能的研究方向與改進空間。

在文檔中自動化演講錄製系統之虛擬導播子系統 (頁 11-18)

簡介

第一章 簡介

1.1、研究動機

1.2、文獻探討

1.3、論文架構

第一章簡介