第五章 結論與未來工作
5.2 未來工作
在影片字幕擷取上,本論文並沒有提供一個好的解決方法。也許可將esrXP 輸出的字幕圖片作去污處理,來增進OCR 的文字辨認效果。或者直接對於動態影 像,利用字幕背景會移動的特性,來擷取靜態的字幕。如此一來,即可對於所有 類型的影像檔案皆可快速的擷取影片字幕,並製作字幕檔,而讓影音系統能夠利 用。
在系統效能上,本系統使用傳統的HTML 網頁設計,因為前後兩個頁面中的 大部分HTML 碼是相同的,因此浪費了許多客戶端與伺服器端的回應時間,造成 網頁反應時間過長。將介面改為使用模組化的架構,以及版面配置的設計加上 AJAX 網頁設計,應可使系統效能更進一步。
在數位人文領域中,除了可建立對於許多資料都可使用的一般性工具,也可 以根據數位資料特性來建立相關的系統或工具,讓使用者能處於一個為特定資料 設計的研究環境底下,來進行資料的使用、分析或處理。本系統原立意於讓影片 可讓大眾快速存取及使用,但也利用了一些資料特性,如演講手冊。若要將此影 音資料看做研究材料的話,則需要進一步的思考,來製作一些分析工具。
參考文獻
[1]陳詩沛、杜協昌、項潔,〈史料整體分析工具之幕後-介紹臺灣歷史數位圖書館的 資料前置處理程序〉,數位典藏與數位人文國際會議,臺北市,2009
[2]蕭屹灵,〈日治法院檔案系統及其後分類呈現〉,碩士論文,資訊網路與多媒體 研究所,國立台灣大學,2008
[3]臺大文學講座系列,臺大出版中心<http://www.press.ntu.edu.tw/>
[4]王駿發,〈多媒體影音系統〉,《科學發展》2007 年 3 月,411 期,6-13 [5]臺灣歷史數位圖書館(Taiwan History Digital Library),<http://thdl.ntu.edu.tw/>
[6]VAST: Academic Video Online,
<http://alexanderstreet.com/products/vast-academic-video-online>
[7] Hsiang-An Wang, Chih-Yi Chiu, Yu-Zheng Wang , "VCenter: A Digital Video Broadcast System of NDAP Taiwan," 11th European Conference on Research and Advanced Technology for Digital Libraries, 2007.
[8]夏勝雄,〈結合字幕與視覺特徵以進行棒球視訊中語意式事件之偵測與分類〉,
[16]cphktool,< https://sites.google.com/site/cphktool/esrxp>
[17]W3C,< http://www.w3.org/TR/2011/WD-html5-20110113/video.html>
附錄一 臺大文學講座系列影音光碟列表
附錄二 MODI 常見錯字取代列表
正確 錯字 正確 錯字 正確 錯字 正確 錯字 正確 錯字
正確 錯字 正確 錯字 正確 錯字 正確 錯字 正確 錯字
附錄三 資料處理流程
1.DVD 轉檔
使用軟體將 DVD 轉換成 mp4 檔案(編碼 x264(H.264),解析度 720*480,位元率 768bps,幀率 30fps)。此處為 DVD 影片原解析度及幀率,給 esrXP 分析影片使用。
並另轉出 mp4 檔案(編碼 x264(H.264),解析度 480*320,位元率 192 bps,幀率 25fps),
以及 webm 檔案(編碼 VP8,解析度 480*320,位元率 192 bps,幀率 25fps)。後兩者 給系統使用,放在 media 這個資料夾中。
2.字幕圖片擷取
2.1 字幕嵌在影片畫面上的影片
a.開啟 esrXP,點選 File -> Open Video...,選擇轉檔好的影片檔案(.mp4)。
b.點選 Subtitle->Filter,打開過濾畫面,先點擊預覽畫面下面的 bar,找到影片 中有字幕出現畫面。
c.選取字幕區域,直接點擊預覽畫面可選取字幕區域,或可開啟 Full width 來 進行選取。
d.設定字幕顏色及字幕外框顏色。
可用滑鼠指著預覽畫面中的顏色,RGB 值會在左下方顯示。
e.視情況選擇過濾方式,可選字幕顏色或者字幕顏色加外框
f.勾選 Enable filter,並開啟 Advance 來調整過濾器,直到字幕出現,並選擇其 他部分的影片預覽畫面來確定其他部分的字幕也有過濾到。
可點選 Recommend Setting 來使用軟體建議的設定。
g.開啟 Postprocessing 來選擇後處理選項。
h.回到 esrXP 主視窗,設定 Rip Option。
i.按下左下角的 start,開始分析影片。
j.等到進度條跑完,開啟 Subtitle->Manager,刪除及合併多餘的字幕。 左鍵點 選字幕是刪除該字幕;右鍵點選第一個你要合併的字幕,再點選最後一個要合併 的字幕,就會將這段時間的字幕都合併起來,合併的字幕會出現上下箭頭在字幕 上,接著可用左鍵選取這段合併字幕中要顯示的字幕。
k 選擇 Option->White Background 將字幕反白,最後點選 File->Save OCR Image 存成給 OCR 辨識的圖檔(.bmp)。設定每個圖片包含 500 subtitles(太多圖檔會太大),
scale 為 1。
2.2 外掛字幕的影片
a.安裝 subrip 並開啟。b.點選 File->Open VOBs,在開啟的視窗中再點選 Open IFO,選擇 DVD 中的 IFO 檔案,通常為較大那個 IFO 檔案。
或者也可以點選 Open Dir,再選擇 DVD 中的 vob 檔案。
c.右邊選擇 Save Subpictures as BMP 以及勾選 + TC& Res.,然後點選 start。
d.選擇儲存資料夾及輸入檔名之後,在開啟的視窗中選擇 I-Author,以及左方 設定字幕的顏色,設定成字幕看起來清楚,筆畫分明的顏色,點選 OK。
e.在下方的子視窗中,點選 Output Format->Set Output Format,在 text Formats 中 找到 SubRip(*.srt),並勾選 Extended Format,再按 Convert to this Format。
f.等程式將字幕讀取完之後,點選子視窗的 File->Save as,將 srt 檔案與圖檔存 在一起,這種 srt 檔案是沒有文字用圖檔代替。
g.開啟 esrXP,點選 File->Open...,開啟剛剛存好的 srt 檔案。
h.一樣另存 OCR Image,讓 OCR 軟體辨識。
c.執行 correct.php,此處使用瀏覽器執行,畫面上會顯示處理後的文字。注意 要將 txt 檔以及 replacement.txt 跟 correct.php 檔案放在一起。
d.將處理後的文字貼回 esrXP 主視窗中的文字區域。
e.由於使用 MODI 的關係,辨認結果的斷句並不完美,因此需要手動斷句。如 果使用其他 OCR 軟體,應該可以直接貼上結果。
f.點選 esrXP 中 File->save as,另存成 srt 檔案(非 srt with bmp)。
5.匯入系統
名(example.srt 跟 example.txt 表示同一個影片的字幕檔以及演講手冊)。如果 srt 檔案 沒有相對應的 txt 檔,則在 importdata.php 的第 83 行及第 176 行,在無逐字稿檔案 中加入 srt 檔案判斷。c.在 DVD_titles.txt 中加入新增的字幕檔以及 DVD 標題和主講者姓名(重要)。
d.執行 importdata.php,需要跟 rdy 資料夾及 txts 資料夾放在一起,此程式因為 跑 LCS 會花很多時間以及記憶體,得使用 cmd line 來執行,php 的執行時間也得設 定。
註:
設定:
1.若要使 Firefox 可以讀取 webm,apache 設定檔中要加上 AddType video/webm webm。
2.php.ini 設定 memory_limit upload_max_filesize post_max_size 皆 800M max_input_time = 3600
max_execution_time = 36000