第一章緒論

(1)

1

第一章緒論

1.1 研究動機

隨著各種資訊產品的普及、電腦運算能力的進步以及網路頻寬的提升，資料 儲存格式也從靜態的文字發展成多媒體，多媒體資料是指包含影像、聲音、文字、

圖片、動畫等內容的檔案，其中以視訊影片最能結合各種形式的內容，在各方面

的應用也最為廣泛，例如:使用視訊進行線上會議、透過網路電視收看國內外節目、

在網站上分享短片、線上教學系統等等。

以往各種演講、研討會、課程等活動都必需親身前往參與，很容易因為其它

因素而錯過。另外在聽講的過程必需要以筆記或錄音的方式將內容記錄下來，時

常會發生來不及做筆記或因專注於筆記而忽略講述的內容，而錄音會因無法看到

老師講解過程，對於老師上課所寫的文字及講解順序都難以掌握，要找出某一個

段落也十分不容易。

現今攝影器材已具備價格合理及使用簡便的特性，對於上述的種種問題，以

攝影機將各種活動的內容錄下來，並將影片即時轉播或放至網站上是非常理想的

解決方案。不必親身前往就能同步觀看活動內容，隨時都能重複觀看。從活動主

持人的角度來看，如果主持人在活動當天無法到場或是另有要事，也可以透過網

路即時視訊或事先錄製影片來應對。

這些影片因為要透過網路傳輸，解析度及畫質都受到限制，以減小網路頻寬

(2)

2

和影片儲存的負擔。除了解析度不高、畫質不清析，在拍攝影片時會受到空間、

光源的限制，使得拍攝的角度、對比都無法掌握。上述幾項因素都使得在觀看影

片時難以解讀其內容，因此需要將原始文件(例如:投影片)同步播放，達到較好的

觀看效果。除了同步播放原始文件外，為了方便找到想要觀看的片段，將影片切

割並建立索引也是必要的工作，若以人工方式處理，隨著影片數量的增加，將是

非常耗費人力的工作。

如果能運用電腦視覺技術，使系統自動對影片進行處理，即可節省大量的時

間及人力。本研究針對以投影片為主的影片，提出一影像比對的演算法，對影像

畫面中投影片與原始文件間進行比對搜尋。實驗對象以教學影片為主，運作的方

式與線上教學系統相似[1-5, 11]，在播放影片的同時，找出對應的原始文件同步顯

示。圖 1-1 為一般常見的線上教學系統，左右分別是教學影片及所對應的教材內

容。

1.2 研究目的

本研究的目的在於運用影像比對技術發展一影像比對演算法，來解決影片畫面與原始文件間的搜尋與比對問題。目前已有不少相關的研究，但都只考慮單

純且固定的投影片背景，對於圖片的辨識能力也較差，本研究所發展的影像比對

演算法，將以解決上述問題為目標。

投影片的使用上最常見的文件格式是由 Microsoft 所開發的 PowerPoint 軟體，

除了文字之外尚能加入表格、圖片等，此軟體能將原始檔案匯出為圖片檔案格式，

(3)

3

但匯出的圖片檔案不會包含轉場特效及動畫，本研究將針對此軟體進行實驗。

1.3 研究範圍與限制

1. 教材投影片是以 Microsoft 的 PowerPoint 所製作而成，簡報的佈景主題不 加以限制，可容許同一段影片中使用不同佈景主題的投影片，但要能以

人眼清楚辨別其內容為原則，如圖 1-2 (a)，文字內容因為與佈景主題的

對比度不佳導致難以辨識。

2. 在教學進行的過程中，使用單機投影機將教材投影片投影至白色布幕，投

影片內容要能完整投影至布幕中，不可有部分投影至布幕外。

3. 拍攝教學影片時，攝影機架在固定位置，鏡頭對著布幕，必需能完整拍進

整個布幕，如圖 1-2(b)，投影片區域有一部分在畫面外，會造成投影片內圖 1-1 常見的線上教學系統，左上角所播放的是教學影片，右半部是所對

應的教材內容

(4)

4

容遺失。投影布幕部分需佔影片畫面的二分之一以上。鏡頭方向與布幕

垂直，可容許 5 度的誤差。

4. 拍攝的過程中，教學者可進入影片畫面內進行解說，但不能長時間停留於

布幕之前。

5. 拍攝環境中的光源不加以限制，但至少需能夠進行教學為準則，不能因光

源不足、照明不均勻或有色光源而使投影片內容無法辨識。

1.4 論文架構

本論文共分為六章，第二章探討與本研究相關文獻。第三、四章為本研究所

使用的理論與方法，第三章敘述建立結構描述特徵及比對方法，第四章說明比對

的前置處理及如何判別文字與圖片區域。第五章提出實驗結果與說明。第六章為

總結及未來研究。

(a) (b)

圖 1-2 (a)投影片佈景主題與文字對比度太差，導致文字內容不易辨識 (b)投影片區域沒有完整地進入畫面

第一章 緒論