• 沒有找到結果。

第一章 緒論

N/A
N/A
Protected

Academic year: 2021

Share " 第一章 緒論 "

Copied!
4
0
0

加載中.... (立即查看全文)

全文

(1)

1

第一章 緒論

1.1 研究動機

隨著各種資訊產品的普及、電腦運算能力的進步以及網路頻寬的提升,資料 儲存格式也從靜態的文字發展成多媒體,多媒體資料是指包含影像、聲音、文字、

圖片、動畫等內容的檔案,其中以視訊影片最能結合各種形式的內容,在各方面

的應用也最為廣泛,例如:使用視訊進行線上會議、透過網路電視收看國內外節目、

在網站上分享短片、線上教學系統等等。

以往各種演講、研討會、課程等活動都必需親身前往參與,很容易因為其它

因素而錯過。另外在聽講的過程必需要以筆記或錄音的方式將內容記錄下來,時

常會發生來不及做筆記或因專注於筆記而忽略講述的內容,而錄音會因無法看到

老師講解過程,對於老師上課所寫的文字及講解順序都難以掌握,要找出某一個

段落也十分不容易。

現今攝影器材已具備價格合理及使用簡便的特性,對於上述的種種問題,以

攝影機將各種活動的內容錄下來,並將影片即時轉播或放至網站上是非常理想的

解決方案。不必親身前往就能同步觀看活動內容,隨時都能重複觀看。從活動主

持人的角度來看,如果主持人在活動當天無法到場或是另有要事,也可以透過網

路即時視訊或事先錄製影片來應對。

這些影片因為要透過網路傳輸,解析度及畫質都受到限制,以減小網路頻寬

(2)

2

和影片儲存的負擔。除了解析度不高、畫質不清析,在拍攝影片時會受到空間、

光源的限制,使得拍攝的角度、對比都無法掌握。上述幾項因素都使得在觀看影

片時難以解讀其內容,因此需要將原始文件(例如:投影片)同步播放,達到較好的

觀看效果。除了同步播放原始文件外,為了方便找到想要觀看的片段,將影片切

割並建立索引也是必要的工作,若以人工方式處理,隨著影片數量的增加,將是

非常耗費人力的工作。

如果能運用電腦視覺技術,使系統自動對影片進行處理,即可節省大量的時

間及人力。本研究針對以投影片為主的影片,提出一影像比對的演算法,對影像

畫面中投影片與原始文件間進行比對搜尋。實驗對象以教學影片為主,運作的方

式與線上教學系統相似[1-5, 11],在播放影片的同時,找出對應的原始文件同步顯

示。圖 1-1 為一般常見的線上教學系統,左右分別是教學影片及所對應的教材內

容。

1.2 研究目的

本研究的目的在於運用影像比對技術發展一影像比對演算法,來解決影片 畫面與原始文件間的搜尋與比對問題。目前已有不少相關的研究,但都只考慮單

純且固定的投影片背景,對於圖片的辨識能力也較差,本研究所發展的影像比對

演算法,將以解決上述問題為目標。

投影片的使用上最常見的文件格式是由 Microsoft 所開發的 PowerPoint 軟體,

除了文字之外尚能加入表格、圖片等,此軟體能將原始檔案匯出為圖片檔案格式,

(3)

3

但匯出的圖片檔案不會包含轉場特效及動畫,本研究將針對此軟體進行實驗。

1.3 研究範圍與限制

1. 教材投影片是以 Microsoft 的 PowerPoint 所製作而成,簡報的佈景主題不 加以限制,可容許同一段影片中使用不同佈景主題的投影片,但要能以

人眼清楚辨別其內容為原則,如圖 1-2 (a),文字內容因為與佈景主題的

對比度不佳導致難以辨識。

2. 在教學進行的過程中,使用單機投影機將教材投影片投影至白色布幕,投

影片內容要能完整投影至布幕中,不可有部分投影至布幕外。

3. 拍攝教學影片時,攝影機架在固定位置,鏡頭對著布幕,必需能完整拍進

整個布幕,如圖 1-2(b),投影片區域有一部分在畫面外,會造成投影片內 圖 1-1 常見的線上教學系統,左上角所播放的是教學影片,右半部是所對

應的教材內容

(4)

4

容遺失。投影布幕部分需佔影片畫面的二分之一以上。鏡頭方向與布幕

垂直,可容許 5 度的誤差。

4. 拍攝的過程中,教學者可進入影片畫面內進行解說,但不能長時間停留於

布幕之前。

5. 拍攝環境中的光源不加以限制,但至少需能夠進行教學為準則,不能因光

源不足、照明不均勻或有色光源而使投影片內容無法辨識。

1.4 論文架構

本論文共分為六章,第二章探討與本研究相關文獻。第三、四章為本研究所

使用的理論與方法,第三章敘述建立結構描述特徵及比對方法,第四章說明比對

的前置處理及如何判別文字與圖片區域。第五章提出實驗結果與說明。第六章為

總結及未來研究。

(a) (b)

圖 1-2 (a)投影片佈景主題與文字對比度太差,導致文字內容不易辨識 (b)投影片區域沒有完整地進入畫面

參考文獻

相關文件

理論,則認為人的情緒不是單純由事件本身引發的,更多是由當事人對事件的 理解或看法而引起的。ABC 理論的 A 是指誘發事件 (Activating

‡戴爾安裝了位在維吉尼亞州的 WebMethods 公司所開發的 B2B 整合軟體。WebMethods 公司所開發的 B2B 整合軟體 WebMethods

在這次的實作遊戲中,我們必須要先對所使用到的硬體 和軟體有其基本的認識,這樣我們才能充分利用我們所擁有 的條件,進一步達成目標。首先 DE2-70 繼承了 Altera 一系 列的開發軟體,如

 試著將投影片第 12 頁的範例加上 critical section ,解決 race

Windows/ Linux/ Mac 各種平台的開發套件,使我們能夠透過各種平台來開發 Android 軟體,所有的 Android 應用程式都是使用 Java

FPGA(Field Programmable Gate Array)為「場式可程式閘陣列」的簡稱,是一 個可供使用者程式化編輯邏輯閘元件的半導體晶片

電腦視覺的影像處理與分析在軟體部分,本研究分別使用美國微 軟公司所開發的 Visual C++ 6.0 以及美國 Matrox Imaging 公司所發展 出來的 Matrox Imaging Library 7.0。其中

HTML Agility Pack 是由法國的一位軟體架構師 Simon Mourier 所發展,並且 由 DarthObiwan 以及 Jessynoo 輔助開發出來的一個軟體工具,它可以讓剖析鬆散 格式