1
第一章 緒論
1.1 研究動機
隨著各種資訊產品的普及、電腦運算能力的進步以及網路頻寬的提升,資料 儲存格式也從靜態的文字發展成多媒體,多媒體資料是指包含影像、聲音、文字、
圖片、動畫等內容的檔案,其中以視訊影片最能結合各種形式的內容,在各方面
的應用也最為廣泛,例如:使用視訊進行線上會議、透過網路電視收看國內外節目、
在網站上分享短片、線上教學系統等等。
以往各種演講、研討會、課程等活動都必需親身前往參與,很容易因為其它
因素而錯過。另外在聽講的過程必需要以筆記或錄音的方式將內容記錄下來,時
常會發生來不及做筆記或因專注於筆記而忽略講述的內容,而錄音會因無法看到
老師講解過程,對於老師上課所寫的文字及講解順序都難以掌握,要找出某一個
段落也十分不容易。
現今攝影器材已具備價格合理及使用簡便的特性,對於上述的種種問題,以
攝影機將各種活動的內容錄下來,並將影片即時轉播或放至網站上是非常理想的
解決方案。不必親身前往就能同步觀看活動內容,隨時都能重複觀看。從活動主
持人的角度來看,如果主持人在活動當天無法到場或是另有要事,也可以透過網
路即時視訊或事先錄製影片來應對。
這些影片因為要透過網路傳輸,解析度及畫質都受到限制,以減小網路頻寬
2
和影片儲存的負擔。除了解析度不高、畫質不清析,在拍攝影片時會受到空間、
光源的限制,使得拍攝的角度、對比都無法掌握。上述幾項因素都使得在觀看影
片時難以解讀其內容,因此需要將原始文件(例如:投影片)同步播放,達到較好的
觀看效果。除了同步播放原始文件外,為了方便找到想要觀看的片段,將影片切
割並建立索引也是必要的工作,若以人工方式處理,隨著影片數量的增加,將是
非常耗費人力的工作。
如果能運用電腦視覺技術,使系統自動對影片進行處理,即可節省大量的時
間及人力。本研究針對以投影片為主的影片,提出一影像比對的演算法,對影像
畫面中投影片與原始文件間進行比對搜尋。實驗對象以教學影片為主,運作的方
式與線上教學系統相似[1-5, 11],在播放影片的同時,找出對應的原始文件同步顯
示。圖 1-1 為一般常見的線上教學系統,左右分別是教學影片及所對應的教材內
容。
1.2 研究目的
本研究的目的在於運用影像比對技術發展一影像比對演算法,來解決影片 畫面與原始文件間的搜尋與比對問題。目前已有不少相關的研究,但都只考慮單
純且固定的投影片背景,對於圖片的辨識能力也較差,本研究所發展的影像比對
演算法,將以解決上述問題為目標。
投影片的使用上最常見的文件格式是由 Microsoft 所開發的 PowerPoint 軟體,
除了文字之外尚能加入表格、圖片等,此軟體能將原始檔案匯出為圖片檔案格式,
3
但匯出的圖片檔案不會包含轉場特效及動畫,本研究將針對此軟體進行實驗。
1.3 研究範圍與限制
1. 教材投影片是以 Microsoft 的 PowerPoint 所製作而成,簡報的佈景主題不 加以限制,可容許同一段影片中使用不同佈景主題的投影片,但要能以
人眼清楚辨別其內容為原則,如圖 1-2 (a),文字內容因為與佈景主題的
對比度不佳導致難以辨識。
2. 在教學進行的過程中,使用單機投影機將教材投影片投影至白色布幕,投
影片內容要能完整投影至布幕中,不可有部分投影至布幕外。
3. 拍攝教學影片時,攝影機架在固定位置,鏡頭對著布幕,必需能完整拍進
整個布幕,如圖 1-2(b),投影片區域有一部分在畫面外,會造成投影片內 圖 1-1 常見的線上教學系統,左上角所播放的是教學影片,右半部是所對
應的教材內容
4
容遺失。投影布幕部分需佔影片畫面的二分之一以上。鏡頭方向與布幕
垂直,可容許 5 度的誤差。
4. 拍攝的過程中,教學者可進入影片畫面內進行解說,但不能長時間停留於
布幕之前。
5. 拍攝環境中的光源不加以限制,但至少需能夠進行教學為準則,不能因光
源不足、照明不均勻或有色光源而使投影片內容無法辨識。
1.4 論文架構
本論文共分為六章,第二章探討與本研究相關文獻。第三、四章為本研究所
使用的理論與方法,第三章敘述建立結構描述特徵及比對方法,第四章說明比對
的前置處理及如何判別文字與圖片區域。第五章提出實驗結果與說明。第六章為
總結及未來研究。
(a) (b)
圖 1-2 (a)投影片佈景主題與文字對比度太差,導致文字內容不易辨識 (b)投影片區域沒有完整地進入畫面