• 沒有找到結果。

整合式解交錯演算法之設計

N/A
N/A
Protected

Academic year: 2021

Share "整合式解交錯演算法之設計"

Copied!
93
0
0

加載中.... (立即查看全文)

全文

(1)

電機資訊學院 電子與光電學程

整合式解交錯演算法之設計

An Integrated De-interlacing Algorithm Design

研究生:曾坤源

指導教授:杭學鳴 博士

(2)

整合式解交錯演算法之設計

An Integrated De-interlacing Algorithm Design

研 究 生:曾坤源 Student:Kun-Yuan Tseng

指導教授:杭學鳴 Advisor:Hsueh-Ming Hang

國 立 交 通 大 學

電機資訊學院 電子與光電學程

碩 士 論 文

A Thesis

Submitted to Degree Program of Electrical Engineering

Computer Science

College of Electrical Engineering and Computer Science

National Chiao Tung University

in Partial Fulfillment of the Requirements

for the Degree of

Master of Science

in

Electronics and Electro-Optical Engineering

August 2004

Hsinchu, Taiwan, Republic of China

中華民國九十三年八月

(3)

整合式解交錯演算法之設計

曾坤源 杭學鳴

國立交通大學 電機資訊學院

摘 要

在最近幾年,數位電視已經開始播放和循序掃描的輸出顯示裝置已普及一般家 庭,因此將交錯掃描轉換成循序掃描的解交錯(De-interlacing)演算法就變得相當重要, 雖然移動可適性解交錯(Motion Adaptive De-interlacing)的演算法已經廣泛應用在現今許 多的商品上,但在某些移動區域的畫質仍有需要再提昇。

本篇論文提出的整合式解交錯(Integrated De-interlacing)的演算法,可以有效提昇移 動區域的畫面,但是當移動估計不正確時,反而會使移動補償後的畫面變得很差,為了 改善這種情況,因此結合移動可適性解交錯的優點,並將空間圖場內插(Spatial

Interpolation)的方式改成 ELA(Edge Line Average)來設計,經過電腦模擬的結果發現,不 僅在視覺上提高畫面的解析度,在某些影像峰值訊號雜訊比(Peak Signal Noise Ratio , PSNR)也比線平均解交 錯(Line Average De-interlacing)多出好幾分貝的畫質增益。

此外,在整合式解交錯演算法中也增加影片偵測(Film Detection)和影像加強(Image Enhancement)的演算法設計,在這樣演算法的架構下,透過影片偵測的演算法,我們可

真實地還原3:2 Pull Down 的影片格式,而不會有鋸齒狀(Saw-Toothed)的畫面出現,而影

像加強的演算法,則可以在解交錯後,經過影像的調整,使輸出畫面呈現不同的效果, 達到消費者的需求。

(4)

An Integrated De-interlacing Algorithm Design

Student: Kun Yuan Tseng Advisor: Prof. Hsueh Ming Hang

Institute of Electronics

National Chiao Tung University

Abstract

In recent years, progressive scanning output devices have becoming very popular. However, many video sources are still using the conventional interlaced TV format. Therefore, the

de-interlacing technique which converts interlaced picture to progressive picture is essential. It has been used widely in various kinds of commercial products. But the conventional simple de-interlacing method does not provide good picture quality particularly in the moving areas.

The main theme of this thesis is an integrated de-interlacing system, which incorporates several known and improved techniques in a nice manner to produce good de-interlaced image quality. We first develop an accurate motion detector that classifies image regions into

stationary, low-motion, and high-motion categories. The simple field merging method is applied to the stationary regions. The edge line average interpolation method is applied to the slow-motion regions. Finally, the motion-compensated interpolation is applied to the

high-motion regions. In addition, hierarchical motion estimation and motion vector smoothing techniques are employed to enhance the quality of estimated motion vectors. Our computer simulation shows that the subjective image quality is improved by using the proposed scheme. Also, its PSNR measures are better than the conventional spatial or temporal interpolation schemes.

In addition, in real applications, interlaced TV pictures are often derived from the films at different frame rate. To achieve a good picture quality, a film detector and an associated image enhancement scheme are added to our de-interlacing system. In this proposed system architecture, we can recover the 3:2 pull down format. With image enhancement algorithm after de-interlacing, the subjective image quality is generally improved.

(5)

誌 謝

走過木棉,走過杜鵑,陽光燦爛裡,蟬嘶啼亮,鳳凰花紅,又一季驪歌輕揚。 三年的時間,不長也不短,若自比為一株小樹苗,經過漫長的培育、灌溉、施肥。 如今,成長茁壯,最最感謝的,是那位不辭辛勞的園丁──論文指導教授──杭學鳴老師。 他,嚴謹的治學態度,讓我看得更遠、更廣;積極的研究精神,令我嘆為觀止;親切的 為人處事,更值得我學習、效法。 論文研究的這段期間,非常感謝杭學鳴教授給我很大的幫忙,不僅像大海中的燈 塔,正確地導引我的研究方向,而且在我遇到困難或瓶頸時,都能適時給我很好的建議, 並不斷的給我鼓勵,才能完成論文的研究。 另外,我要感謝我的家人,謝謝他們在背後給我的支持,尤其是我的妻子,因為家 庭和小孩在她妥善的照顧下,讓我無後顧之憂,能全心全意投入論文研究,才能順利完 成論文。

(6)

中文提要 ……….… i 英文提要 ………. ii 誌謝 ………. iv 目錄 ………. v 表目錄 ………. vii 圖目錄 ………. viii 一、 緒論……….…… 1 二、 各類解交錯的原理概述 ………. 4 2.1 解交錯的起源………. 4 2.1.1 交錯掃描的格式分析………... 5 2.1.2 非交錯掃描的格式分析………...……….. 6 2.1.3 解交錯的定義………. 7 2.2 非移動補償解交錯………. 9 2.2.1 空間解交錯………... 9 2.2.2 時間解交錯………... 10 2.2.3 可適性移動補償解交錯………...……….. 12 2.2.4 混合式解交錯………. 13 2.3 移動補償解交錯介紹………. 15 2.3.1 基本移動補償解交錯………. 15 2.3.2 時間遞廻解交錯………..………... 16 2.3.3 可適性遞廻解交錯……….……..……….. 18 2.4 解交錯系統架構……….……..……….. 20 三、 整合式解交錯演算法之設計………. 22 3.1 整合式解交錯的架構………... 22 3.2 移動估計的設計………. 24 3.2.1 交錯掃描格式的移動估測設計………. 25 3.2.2 移動估測搜尋範圍與方塊大小的設計………. 30 3.3 移動向量平滑處理的設計..………..………. 34 3.4 移動補償的設計………. 37 3.5 移動偵測的設計……….……… 40

(7)

四、 電影膠卷偵測與影像加強的演算法設計………. 43 4.1 電影膠卷模式的介紹………. 43 4.2 電影膠卷偵側架構設計………. 44 4.3 前置與後置處理器的設計………. 48 4.3.1 黑階位準延伸設計………. 49 4.3.2 邊緣加強高頻雜訊濾除設計………. 51 4.3.3 對比度和亮度調整的設計………. 53 4.3.4 膚色補償的設計………. 55 4.3.5 色度與飽合度調整的設計………. 58 五、 模擬的結果分析……….… 61 5.1 解交錯演算法的模擬方式………. 61 5.2 解交錯演算法的模擬結果………. 67 5.3 解交錯演算法的模擬分析………. 77 六、 結論與未來的工作……….… 78 參考文獻 ……….… 80 自傳 ……….……… 82

(8)

表 目 錄

表 1 數位電視訊號格式……….……….…... 4 表 2 各種方式移動估計的比較表.………...………. 30 表 3 移動搜尋法的比較表….………...………... 32 表 4 黑階位準延伸設計參數表………. 49 表 5 邊緣加強高頻雜訊濾波器設計參數表………... 51 表 6 對比度和亮度設計參數表………..……... 53 表 7 膚色補償設計參數表………... 56 表 8 色度和飽合度設計參數表………..………... 59 表 9 各種解交錯演算法MSE 的比較………... 67

(9)

圖 目 錄

圖1.1 圖場和圖框……….……… 1 圖1.2 解交錯示意圖……….……….………... 2 圖2.1 交錯掃描格式輸出 ………...……….…………... 5 圖2.2 循序掃描格式輸出….……….………... 6 圖2.3 解交錯轉換處理………..………... 8 圖2.4 空間垂直平均解交錯.………... 10 圖2.5 時間平均解交錯……….… 11 圖2.6 移動偵測示意圖………..….……….. 12 圖2.7 角度偵測掃描線平均解交錯………..………... 13 圖2.8 移動補償解交錯………..………... 16 圖2.9 時間遞迴解交錯……….……….... 17 圖2.10 可適性遞廻解交錯……….… 18 圖2.11 移動補償解交錯架構參考(一).………. 20 圖2.12 移動補償解交錯架構參考(二).………. 21 圖3.1 整合式移動補償解交錯的架構……… 22 圖3.2 整合式移動補償解交錯的資料流程圖……….… 23 圖3.3 交錯式的資料格式………... 24 圖3.4 資料格式的轉換………. 24 圖3.5 移動向量定義……….. 25 圖3.6a 理論上偶數圖場對奇數圖場的移動估計……….. 25 圖3.6b 實際上偶數圖場對奇數圖場的移動估計……….. 26 圖3.7a 理論上偶數圖場對偶數圖場的移動估計……….…. 26 圖3.7b 實際上偶數圖場對偶數圖場的移動估計……….. 26 圖3.8a 偶數圖場對奇數圖場模式1 的移動估計….……… 27 圖3.8b 偶數圖場對奇數圖場模式2 的移動估計………. 27 圖3.8c 偶數圖場對奇數圖場模式3的移動估計………...… 28 圖3.8d 偶數圖場對偶數圖場的移動估計………..……….... 28 圖3.8e 雙向偶數圖場對奇數圖場的移動估計………...……….……….. 29 圖3.9 階層式搜尋法方塊………..……….… 31 圖3.10 階層式搜尋法步驟………... 31 圖3.11 不同移動估計搜尋法的模擬結果………..… 33

(10)

圖3.12b 移動向量符號……….……….… 34 圖3.12c X座標移動向量………... 34 圖3.12d Y 座標移動向量………..……… 34 圖3.13 移動向量平滑處理的測試圖………... 35 圖3.14 移動向量平滑處理的模擬結果…...….……….… 36 圖3.15 移動補償的架構……….. 37 圖3.16 移動偵側區塊圖……….. 41 圖3.17 移動偵測流程圖……….. 42 圖4.1 3 : 2 Pull Down 資料格式………..….………..… 43 圖4.2 電影膠卷偵側方塊圖………....……….………. 44

圖4.3 3 : 2 Pull Down Speedway 測試結果……….………. 46

圖4.4 3 : 2 Pull Down Music 測試結果……….………....…. 47

圖4.5 後置處理器方塊圖……….….. 48 圖4.6 黑階位準延伸方塊圖……….… 49 圖4.7 黑階位準延伸測試結果………...….. 50 圖4.8 邊緣加強高頻雜訊濾波器方塊圖……….... 51 圖4.9 邊緣加強高頻雜訊濾波測試結果……….. 52 圖4.10 對比度與亮度方塊圖………...…………...… 53 圖4.11 對比度與亮度測試結果………...… 54 圖4.12 臉的膚色示意圖………..………...… 55 圖4.13 膚色補償調整方塊圖………...… 56 圖4.14 膚色補償測試結果………...… 57 圖4.15 色度與飽合度調整方塊圖………...… 58 圖4.16 色度與飽合度測試結果……….………...… 60 圖5.1 解交錯演算法模擬方法1………...….. 62 圖5.2 解交錯演算法模擬方法2.………...… 62 圖5.3 模擬程度的流程圖……….. 63 圖5.4(a) 模擬程式第一頁……….. 64 圖5.4(b) 模擬程式第二頁……….. 64 圖5.4(c) 模擬程式第三頁……….. 65 圖5.4(d) 模擬程式第四頁……….. 65 圖5.4(e) 模擬程式第五頁……….. 66 圖5.4(f) 模擬程式第六頁……….. 66 圖5.5 各類解交錯演算法直方圖……….………….……….. 67

(11)

圖5.6 第一種模擬方式的解交錯結果(一)………….……….. 69

圖5.7 第一種模擬方式的解交錯結果(二)………….……….. 70

圖5.8 第二種模擬方式的解交錯結果(一)………….……….. 72

圖5.9 第二種模擬方式的解交錯結果(二)………….……….. 74

(12)

第一章 緒論

早期的電視系統,因為頻寬及生產技術上的限制,電視機是以交錯式(Interlaced) 的掃描方式來產生畫面,讓消費者可以獲得較為流暢的影像。但隨著科技的進步,漸進 式(Progressive)的顯示裝置快速的發展,如電腦螢幕、電漿電視、液晶電視等的輸出 配備,已是漸進式的掃描方式。由此看來,交錯式的掃描方式,已漸漸無法符合今日漸 進式的輸出顯示裝置

Even Lines Field Odd Lines Field

Frame

圖 1.1 圖場和圖框

交錯式掃描是在傳統電視SDTV(Standard Definition Television)就制定的一種掃

描方式。在連續交錯式的視訊廣播訊號中,影像畫面是以“圖場”(Field)為單位, 在螢幕上互相顯示,每張圖場開始輸出時,電子槍會開始掃描。掃描到水平方向的最後 一個像素,會跳到隔二行掃描的那些空的掃描線來開始掃描。同樣地,在水平方向的最 後一點時,會跳到隔二行再繼續掃描,如此不斷的掃描動作即稱為交錯式掃描 (Interlaced)。在這樣的掃描模式裡面,每張圖場的垂直解析度是整個畫面的一半,和 傳統CRT 螢幕不一樣的是,現在的液晶螢幕是從最左上角的像素,開始掃描到最右下 角,這稱為漸進式的掃描。每張畫面的垂直解析度,就是整個畫面的垂直解析度,稱為 圖框(Frame) ,圖 1.1 說明圖場和圖框的資料掃描格式。 以前使用交錯式掃描主要的原因有兩個:第一個原因是以人類能接受的流暢度而 言,也就是螢幕的「更新頻率」速度,必須就像日光燈一樣,每一秒必須閃動60 次以 上,對人的眼睛來說才不會有閃爍的感覺。但由於在過去技術並不成熟,對訊號頻寬有

(13)

很大的限制,所以在有限的頻寬下,人們制定出每秒60 張圖場的規格。因此,相較於 每秒60 張圖框,我們不但只需要一半的頻寬就足夠,而且又能給人們比較流暢的畫面 享受。第二個原因是在於電子槍打到螢幕上,而螢幕上的磷粉發光時,磷粉的光芒並不 會很快的消失掉,這是以前的電視特性。基於這個特性,再加上人類的視覺殘留現象, 可以讓人們覺得畫面是連續的。因此,即使我們用每秒60 張圖場,由於視覺暫留的關 係,我們也看不到有缺陷的畫面。 當我們要將交錯式掃描的畫面輸出到漸進式(Progressive)掃描的顯示裝置時,漸 進式掃描不能直接將兩張相鄰圖場的像素合併在一起輸出,因為這兩張畫面是在不同時 間點拍攝的,所以一起輸出時,有些物件的位置改變了,會造成畫面有「交叉邊緣」(line crawling)的畫質。為了解決這個問題,使得交錯式的掃描畫面,可以顯示在漸進式掃 描的顯示器上,解交錯這項技術便開始受到重視,也越來越多的人投入這方面的研究。 解交錯是要將60 圖場/每秒,轉換成 60 圖框/每秒,這 60 圖場/每秒的資料,是將 一秒鐘切成六十等份,每一份取一次資料;而30 圖框/每秒則只切成 30 份,圖 1.2 即 是解交錯示意圖[1]。在時間軸來看,交錯式的取樣遠比漸進式較多,交錯式所取得的 資料卻只有一半的畫面,而漸近式則是完整的畫面。在一般要將60 圖場/每秒轉成圖 框/每秒的方法中,最直接的方法便是將兩個圖場交錯合併成一個圖框。但是這樣子會 造成交叉邊緣的現象,因為相併的兩張畫面在時軸上,並不是屬於同一個時間點的位。 如此,將使得整個畫面上的物體,會有一半是在前一個時間點,另一半在這個時間點, 畫面就會變模糊了。 圖 1.2 解交錯示意圖 Interlaced Progressive n-1 n n+1 n-1 n n+1 De-interlacing

(14)

解交錯的演算法,從最早的掃描線重覆(Line Repetition) 解交錯,到目前應用在 現今大多數商業使用移動可適性解交錯(Motion Adaptive De-interlacing)的方式,已經 漸漸無法滿足消費者的需求,於是移動補償解交錯(Motion Compensated De-interlacing) 的方式,將會是未來發展的趨勢。它可以提高畫面的解析度,並運用移動估計(Motion Estimation)尋找移動的軌跡,對插點作適當的移動補償。但相對地,這種方式也有它 的缺點,除了所需的硬體成本高之外,最大的困難是──如何偵測及修正錯誤的移動向 量,這在本文中將是一個研究的重點。 在下面的章節中,我們將從理論的推導,進而作各種方式解交錯演算法模擬,整合 它們的優點,而成為新的解交錯架構。在第二章我們將介紹非移動補償解交錯,和移動 補償解交錯兩大類的理論推導。第三章我們整合新的解交錯的架構,並針對每一方塊除 了做詳細的說明外,並針對不同的方法作模擬分析比較。第四章則增加影片模式偵測、 影片還原及影像加強等設計,可以讓解交錯系統的模妳更完整。第五章是模擬結果的分 析,比較不同解交錯演算法的差異,第六章是結論與未來的工作。

(15)

第二章 各類解交錯的原理概述

2.1 解交錯的起源

「數位電視」在世界各國掀起一片熱潮,一般來說,所謂的數位電視必需可以接收、

顯示18 種數位電視訊號。美國消費電子協會(CEA , Consumer Electronics Association)

將數位電視訊號分成三類:高畫質數位電視(HDTV)、加強畫質數位電視(EDTV) 與標準畫質數位電視(SDTV),各種的數位電視訊號如表 1 所列。隨著數位電視時代 來臨,電視機的接收也都將變為數位接收,所以電視在未來不僅可以收看電視,還可以 同時利用現有的電視頻道上網、進行資料傳輸。「數位電視」能提供收視戶超越傳統「類 比電視」的畫質、品質、影音與個人化服務的電視廣播技術。此外,美國在一九九六年 初通過電信修正法案、該年年底訂出高畫質數位電視標準,接著在一九九七年四月宣佈 數位電視的實施時程,顯示出美國即將邁入西元兩千年數位化、寬頻化的魄力與決心。 垂直掃描線 水平像素 畫面比例 畫面掃描頻率 480 720 16:9 or 4:3 60p, 60i, 30p, 24p 720 1280 16:9 60i, 30p, 24p 1080 1920 16:9 60i, 30p, 24p 表 1 : 數位電視訊號格式 數位電視有許多優點,它能提供高畫質的影像與聲音品質。現行使用的傳統類比電 視只有525 條掃描線,影像解析度較低、畫面易閃動、易產生「鬼影」;數位電視以 「010101」的數位方式傳送,可避免外界干擾,不會有畫面模糊及「鬼影」現象,數位 電視將525 條掃描線提高至 1080 條,亦提供了清晰、鮮艷、穩定且生動的高品質電視 畫面。由於液晶電視是今年當紅的產品,液晶電視的優點是──可對應電影、電視,甚 至是高畫質數位電視的播放速率,使螢幕播放動畫影像時流暢無殘影,精彩節目不拖泥 帶水。全方位支援高畫質數位電視的720p、1080i 訊號規格,同時具有 16:9 顯示比例, 可以輕鬆迎接即將全面開播的數位電視系統,或者接收國外高畫質衛星節目,迎頭趕上 全球高畫質數位電視潮流。 數位電視和高畫質數位電視究竟是採用「循序式」抑是「交錯式」掃描,一直是爭 論的話題。「循序式掃描」被視為個人電腦業者,突破家電業者長久把持數位電視規格

(16)

卻是一起發展1080 條交錯掃描式,和 480 條循序式掃描兩種規格之技術,打破了兩業 界技術藩籬的嚴重歧見。此一結果証明這兩種掃描型式各有其優缺點,適用之場合迴 異。「交錯式掃描」的最大優點是所需傳輸的資料量較小,動態影像的色彩鮮明度和對 比也比較好;但缺點是無法顯示細膩的文字,不利於互動式資訊在電視上的應用,而此 功能已被視為數位電視所必備的,足以為廣播業者帶來巨大的商業利益,突破類比廣播 營收惡化之窘境。而循序式掃描則沒有這個問題,這是當年個人電腦業者群起攻之的關 鍵性理由。然而循序式掃描也有致命的缺點,即其資料傳送量要比交錯式大,硬體成本 偏高,且在影像的品質上也不如交錯式。在講究高解析度的場合下,特別是1080 條掃 描線的情況下,只有大畫面電視才用得著,畫質之對比和鮮明度尤其重要,所以交錯式 比較適合,且其資訊傳輸量也能控制得較少。 從各方面所得到的資訊,我們可以得到一個結論──不管是現有的 NTSC 或 PAL 的電視系統,以及將來的數位電視和高畫質數位電視的電視系統,傳送交錯式掃描訊號 格式仍是不會改變的趨勢。所以如何將交錯式掃描訊號顯示在液晶電視(LCD)或電漿 電視,只有透過解交錯的處理,才能讓畫面的穩定度與精細感都會大幅提升,消費者在 看電視時因畫面不容易閃爍,即使長時間觀看眼睛也不容易疲勞。

2.1.1 交錯掃描的格式分析

在傳統CRT 電視中,它的影像掃描方式是利用映像管內電子束的射出,其方向是 靠著一個「偏向裝置」,分為垂直偏向線圈和水平偏向線線圈,裝置利用磁場的改變, 影響電子束上下左右射出方向。映像管中電子槍的方式可分為:交錯式掃描和非交錯掃 描。交錯式掃描的方式是電子束第一次掃描時方式先掃描各奇數列,第二次掃描時在掃 描偶數列,兩次掃描後完成影像的更新;非交錯的掃描的方式,是先掃描奇數列再掃描 偶數列,而且畫面看起來比較不會閃爍,對眼睛比較不會造成傷害。 圖2.1 交錯掃瞄格式輸出 Time 1 3 5 7 9 2 4 6 8 10 1 3 5 7 9

(17)

交錯掃描可以顯示更平順的動態影像,但是在顯示靜態影像時容易閃爍。由於電腦 螢幕不是使用交錯掃描顯示,所以在電腦螢幕上顯示電視畫面時,經常會產生梳子狀的 效應,利用解交錯可以減少或消除這種效應。交錯模式與非交錯模式差別在交錯模式 時,電子束的掃描方式並非由上到下逐一掃描的,而是先由一、三、五條的往下掃描, 然後再二、四、六條往下掃描,圖2.1 是交錯掃描輸出的資料格式。解析度越高時,因 為頻寬的要求也愈高,此時再同時要達到高垂直更新率就比較難,因此透過交錯掃描的 方式來達成,而與交錯掃描方式不同的逐一掃描方式,就稱為非交錯模式。

2.1.2 非交錯掃描的格式分析

所謂的「循序掃描Progressive scan」就是以 1、2、3、4、5 至 525 線順序描繪出所 有的掃描線圖,圖2.2 是循序掃描的輸出方式。循序掃描方式,可消除交錯掃描形成的 雜訊,提供穩定、不閃爍和不傷眼的畫面。 圖 2.2 循序掃瞄格式輸出 Time 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 倍頻掃描是把水平掃描頻率提升為二倍,也就是把原來15.7KHz 的水平掃描頻率 提升到31.5KHz,而水平掃描線的密度提升為二倍。這樣一來,畫面的細緻程度就會增 加很多,以一個圖場掃240 條線來說,倍頻就是 480 條線,這樣一來它與一個圖場一次 ﹝60 分之一秒﹞就掃 480 條線的循序掃描有什麼不同?單就掃描線的結果來看是一樣 的,但是實際上倍頻的做法與循序掃描的過程有很大的不同。以電視的視訊來說,原本 就是每秒30 個圖場的掃描方式來形成圖像,然後再進行快速儲存記憶與播放的動作。 而循序掃描卻是基礎上將一個圖場的掃描速度提升到二倍。若是從電影訊號來看,那就 更複雜,因為電影訊號每秒24 格,電視訊號每秒 30 格,所以這中間還要經過 3:2 Pull

(18)

樣,所以會產生畫面的人工失真(Artifact),在有些地方二個圖場所合起來的一個圖 框會有失真的畫面。從電影轉電視訊號的角度來看,循序掃描不會有這種人工失真,而 從交錯掃描倍頻之後的畫面,仍然會有這種人工失真,除非倍頻器的內部其實是以循序 掃描方式在動作。 「倍頻掃描」這個名詞,基本上正式的說法應該稱之為循序漸進式掃描,在早期的 電腦玩家則是曾稱之為「非交錯式掃描」,指的都是倍頻掃描的意思,事實上倍頻掃描 就是將掃描頻率倍增,將交錯式掃描藉著畫面增加的方式來呈現畫面。 循序式掃描,每秒則傳送60 張完整的畫面,因此 NTSC 訊號經過倍頻掃描的畫面 會更為「緊密、不閃爍與穩定」。但絕對不是解析度倍增這麼神的功能,反而經過晶片 倍頻處理後的畫面,經過測試還會發現解析度減少的情況,值得注意的是,並不是交錯 式掃描就是有這樣的缺點,只要交錯式掃描的掃描線夠高,眼睛也是看到緊密的高畫質。

2.1.3 解交錯的定義

解交錯的目地,主要是輸入交錯掃描格式的圖場時,補足在同一個時間點,輸入沒 有傳送進來的偶數線或奇數線資料。偶數圖場缺的是奇數線的資料,奇數圖場缺的是偶 數線的資料,我們可從圖2-3 解交錯示意圖中,輸入偶數圖場(Even Field)時,有資 料的掃描線是1、3、5、7、9,輸入奇數圖場時,有資料的掃描線是 2、4、6、8、10。 在輸出影像時,都必須轉換為循序格式的圖框,掃描線是1、2、3、4、5、6、7、8、9、 10 皆有資料。由此我們可以定義這輸出圖框的數學式[2]為(式 2.1) :

f

out

x, n)=

fo

x , n),

(y mod 2 = n mod 2) (式2.1)

f i

x n),

(otherwise) 

,

 

x =( )

x 表示為離散空間的位置,n 為圖場數目。 y  f o(x , n) 為原始圖場,當 y 除以 2 等於 n 除以 2 時。  f i(x , n) 為需插入的像素(Pixel),當 y 除以 2 不等於 n 除以 2 時。 目前,已有很多解交錯的演算法發表於過去的文獻中,及應用在現今商業產品上。

(19)

這些不同的演算法,在品質的表現上也有很大的差別,隨著科技的進步,需要大量運算 的移動補償解交錯的演算法,已成為未來趨勢。 圖 2.3 解交錯轉換處理 De-Interlacing n n Interlaced Progressive 1 3 5 7 9 2 4 6 8 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10

(20)

2.2 非移動補償的解交錯

非移動補償的解交錯技術,能在靜態影像的部份,獲得較佳的品質。但動態的影像, 就無法得到較佳的結果。因為非移動補償解交錯的缺點是忽略物件移動的路徑,而利用 時間與空間上的技術來作圖場的插點,這些解交錯技術的運算比較簡單,所以硬體成本 相對地就比較少,這是它最大的優點。我們可以將非移動補償解交錯的方式分成兩大 類,分別為線性技術與非線性技術兩種解交錯的方式,在下面章節中,將會做詳細的討 論。

2.2.1 空間解交錯

空間解交錯(Spatial De-interlacing)是利用同一圖場中,找垂直鄰近的像素來做中 間插補的像素。這種作法適合物體移動較少的的畫面,所需的硬體成本少。一般來說比 較常用的方法有兩種,掃描線複製(Line Repetition)是其中最簡單的方式,也是最早 被運用在商業產品上,若以數學式來表示,其表示式如(式 2.2):

f

out(x, n)=

f

o(x, n), y mod 2 = n mod 2 (式2.2)

f

i(x-uy, n), otherwise

 

 

uy = (0,1) T 為轉換函數

 T

另一種方式為掃描線垂直平均解交錯(Line Averaging De-interlacing),比前一種方式

更受歡迎,因為它可以減少受雜訊的干擾,圖2.4 是掃描線垂直平均解交錯的示意圖。

假設目前處理圖場為n-1,則 C 像素的值等於 A 加上 B 再除 2,處理圖場為 n,則 F 像

素的值等於D 加上 E 再除 2,數學式表示如(式 2.3):

f

out(x, n)=

f

o(x, n), y mod 2 = n mod 2 (式2.3)

[

f

i (x-uy, n)+

f

i(x+uy, n)] / 2, otherwise

 

   

uy = (0,1) T為轉換函數 T

(21)

B

n-1

n

Orginal Pixel

Sample to be Interpolated Current Interpolation Pixel

圖 2.4 空間垂直平均解交錯 y-1 y y+1 y y+1 x x x-1 x+1 field number x-1 x+1 E A y+2 F D C

2.2.2 時間解交錯

時間解交錯的方式是利用不同時間領域的圖場像素,經由一些的數學運算,來作插 點的像素,這種方式的演算法最適合使用在完全靜態的影像,它是一種很簡單的解交錯 方式,稱為圖場複製解交錯(Field Repetition De-interlacing),數學式為(式 2.4):

f

out(x, n)=

f

o(x, n), y mod 2 = n mod 2 (式 2.4)

f

i (x, n)= f(x, n-1), otherwise

 

 

因為圖場複製解交錯的方法,在硬體設計上需要有2 張圖場容量的記憶體,但它容

易受雜訊的干擾,所以就有另一種時間平均解交錯(Temporal Averaging De-interlacing)

演算法被提出。這種解交錯的硬體成本就比較高一些,它需要3 張圖場的記憶體,但它

可以避免一些外界雜訊的干擾,我們可參考圖2.5 的示意圖,假如目前處理的圖場為 n,

其中C 點像素的值,是由 n-1 圖場中的 A 點和 n+1 圖場中的 B 點相加之後,再除以 2,

(22)

f

out(x, n)=

f

o(x, n), y mod 2 = n mod 2 (式 2.5)

f

i(x, n)= f [(x, n-1)+ f(x, n   +1)] / 2 B n-1 n Orginal Pixel Sample to be Interpolated Current Interpolation Pixel

圖 2.5 時間平均解交錯 y-1 y y+1 y y+1 x x x-1 x+1 field number x-1 x+1 A y-1 C y y+1 x x-1 x+1 y-1 n+1

(23)

2.2.3 可適性移動補償解交錯

移動可適性解交錯(Motion Adaptive De-interlacing)是利用移動偵測來決定解交錯 演算法,是使用空間掃描線垂直平均或是時間平均解交錯,所以移動偵測的正確,就變 成相當重要,尤其是在交錯式輸入影像,連續的圖場像素,不能直接去比較同一位置的 像素差異值,來判別是否有物件在畫面中移動。因此我們必須用圖場中或圖場間的很多 資訊作計算,來判別每一點是否移動,找到適合解交錯演算法。在過去文獻中,已經有 很多移動偵測的演算法被提出。在圖2.6 是一種較常被使用作移動偵測的演算法,首先 計算(A 與 C)、(B 與 C)、(F 與 G)、(H 與 G)的絕對差異值,然後取其四個值的平均值 等於X,再計算(D 與 E) 的絕對差異值等於 Y,比較 X 與 Y 的值,數值比較大的,即 為移動的數值M,經由實驗統計分析,可找到 M 與 β 之間的關係式,其中 β 是移動偵 測的因素(Factor),因此移動可適性解交錯的數學式如(式 2.6)所示:

f

out(x, n)=

f

o(x, n), y mod 2 = n mod 2 (式 2.6)

f

i(x, n)=βf st(x, n)+ (1-β)

f

mot(x, n),otherwise     

f

st 是在靜態影像插補演算法

f

mot 是在動態影像插補演算法 β 是移動偵測的圖素(Factor),範圍介於 0∼1 之間 β=0 表示偵測的結果是動態影像 β=1 表示偵測的結果是靜態影像 B n-1 n 圖 2.6 移動偵測 示意圖 y-1 y y+1 A C n+1 D E Orginal Pixel Sample to be Interpolation Current Interpolation Pixel

field number

(24)

移動偵測在判別移動或靜止影像時,很容易受到雜訊的干擾,所以它必須在硬體上 設計一些低通濾波器或是高通濾波器等,來避免外界雜訊的影響。除此之外連續輸入的 圖場,在相同的位置上會相差一條掃描線,所以如何有效且正確辨別圖場的移動區域, 也是另外一項研究的重點。

2.2.4 混合式解交錯

移動可適解交錯是目前在商業產品上,使用最多的演算法,但是它在物體做低角度 移動時,所得到的效果,就不會令人滿意。針對這個問題,就有角度偵測(Edge Detection) 的演算法[3]被提出,圖 2.7 是它的示意圖。從圖中我們可以知道,要決定目前插點 X 的值,要先尋找(A 與 R)、(B 與 Q)、(C 與 P)、(D 與 O)、(E 與 N)、(F 與 M)、(G 與 L)、 (H 與 K)、(I 與 J) 等每一對點對點之間最小的差異值對。假設找到的最小的差異值對是 (A 與 R) ,那 X 的值即為(A 和 R)相加的平均值。我們可以推測此一影像的紋路方向為 (A,X,R) 。 B Orginal Pixel Sample to be Interpolation Current Interpolation Pixel

圖 2.7 角度偵測掃描線平均解交錯 y-1 y y+1 x-3 x x+1 x-4 x-2 A C x+3 x-1 x+4 F E D G x+2 H I J K L M N O P Q y+2 y-2 X R 在(式 2.7)中定義了 A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P、Q、 R 等每一像素相對應的位置,而(式 2.8)則定義 XAR、XBQ、XCP、XDQ、XEN、XFM、 XGL、XHK、X I J 等可能插點到 X 的值。經由這些式子和之前所提到移動可適性解交

(25)

錯方式,我們可以得到如同(式 2.9)的數學式,它結合移動可適性解交錯和角度偵測的 演算法,而合成混合式解交錯的演算法。它的優點是物體在各種角度時,都有很好的表 現。

A=

f

ox-4uxuy, n) J=

f

ox-4uxuy, n) (式 2.7)

     

B=

f

o(      x-3uxuy, n) K=

f

ox-3uxuy, n)

C=

f

o(     x-2uxuy, n) L=

f

ox-2uxuy, n)

D=

f

o(      x-uxuy, n) M=

f

ox-uxuy, n) E=

f

o(    x-uy, n) N=

f

ox+uy, n) F=

f

o(    x+uxuy, n) O=

f

ox+ux+uy, n)

G=

f

o(      x+2uxuy, n) P=

f

ox+2uxuy, n)

H=

f

o(       x+3uxuy, n) Q=

f

ox+3uxuy, n) I=

f

o(      x+4uxuy, n) R=

f

ox+4uxuy, n)

XAR=(A+R)/2 DEAR=│A-R│ (式 2.8) XBQ=(B+Q)/2 DEBQ=│B-Q│ XCP=(C+P)/2 DECP=│C-P│ XDQ=(D+O)/2 DEDQ=│D-Q│ XEN=(E+N)/2 DEEN=│E-N│ XFM=(F+M)/2 DEFM=│F-M│ XGL=(G+L)/2 DEGL=│G-L│ XHK=(H+K)/2 DEHK=│H-K│ X I J =(I+J)/2 DE I J=│I-J│ uy = (0,1) T為轉換函數 T 

f

o(x, n), y mod 2 = n mod 2 (式 2.9)

f

out(x, n)=

f

i=[

f

o(x, n1)+

f

o(x, n1)] /2 , 物體靜止

f

i=min(DEAR, DEBQ, DECP, DEDQ, DEEN, DEPM, DEGL,

DEHK, DEIJ), 物體紋路方向



(26)

2.3 移動補償解交錯介紹

大多數先進的解交錯演算法,都是利用移動補償[4]的方式,來作為產品的主要技 術。因為越來越多的消費者能接受比較昂貴的價格,在一些高級電視機中,都應用到這 樣的技術。 在介紹移動補償解交錯的定理前,我們將先定義一些參數。我們使用d(x, n)= (dx ( x, n ), dy ( x, n ))來描述移動向量,其中 dx 代表水平的方向,dy 代表垂直的方向。 在交錯掃描影像輸入時,並不是所有時間的資訊變化,都能被適當的描述而得到正確地 移動向量。像場景改變時,或者背景變微弱時及在矇朧背景情況下等,都是比較困難的 部份。不過,這物體的移動模式有很強烈自然定律,如物體的移動有物理慣性,在時間 改變中不會突然消失,或突然改變物體時幾何形狀,所以我們可以運用這個自然定律, 找到正確的移動向量,適當補償到要插入的點。在這個章節中,我們將討論各種移動補 償演算法。   

2.3.1 基本移動補償解交錯

基本移動補償解交錯的方式是利用移動估計的技術,來找到每一個插點的移動向 量,進而從相對應移動向量的像素中,插入要插補的像素。移動估計主要是運用區塊與 區塊之間的比對方式,所以可以很準確的找到移動向量,經由圖2.8 移動補償解交錯的 示意圖,我們可得知圖中D 的值,經移動向量後得到 C 的值,從數學的觀點來看,可 得到(式 2.10)。因為基本移動補償解交錯的方式是在理想的情況下,才會有很好的結 果。但實際上會有各種不同的情形發生,例如畫面中有很多雜訊之類,所以下面將有其 它改善的演算法被提出。

f

out ( x , n ) =

f

o ( x , n ) , y mod 2 = n mod 2 (式2.10)

f

i( x - d(x, n), n-1) , otherwise

 

  

(27)

n-1 n A B C Orginal Pixel

Previous Interpolated Pixel Current Interpolated Pixel

Motion Vector 圖 2.8 移動補償解交錯 y-1 y y+1 y y-1 y+1 x x x-1 x+1 D

2.3.2 時間遞廻解交錯

時間遞廻解交錯(Time Recursive De-interlacing)是被 Wang et al. [5]提出的。它是 利用前一張已作過解交錯的圖場來作移動補償,這種的想法是很簡單概念,但它可用強 而有力來形容。 不過,要讓時間遞廻解交錯達到最大的效果,我們必需保證已經得到正確的移動 向量,然後將前一張的圖場運用廣義取樣定理[6][7][8]的方式,取得原始像素與插點之 後的像素,作為目前圖場將要插點的像素。我們可從圖2.9 中,可看出目前要插入的像 素,通常取自上一張圖場的原始像素,與插點後的中間值,但如此的作法會因為兩張圖 場基準點不同,就如某一個時間點圖場它是由偶數線組成,那它前一張或下一張的圖場 則由奇數線組成,所以當前一張畫面由圖場變為圖框之後,假設它移動補償的像素是錯 誤的,那之後圖場的移動補償插點也都不會正確,這是它最主要的缺點。 為了彌補這個的缺點,可利用中值濾波器(Median Filtering)作一個保護機制,讓 時間遞廻解交錯的演算法,變成非常地有效益,它的輸出數學式可定義成(式 2.11) :

(28)

fo ( x , n ) y mod 2 = n mod 2 (式2.11)

f

out ( x , n )=

f

i( x - d(x, n), n-1)

median

f

o( x-uy,n) otherwise

f

i( x+uy,n)          n-1 n A B C D E X field number v er tic a l p o sitio n Orginal Pixel

Previous Interpolated Pixel Current Interpolated Pixel Motion Vector

y-2

y

y+2

圖 2.9 時間遞迴解交錯

(29)

2.3.3 可適性遞廻解交錯

可適性遞廻解交錯(Adaptive Recursive De-interlacing)是被 De Haan et al. [9] 提 出的,它是運用一階遞迴時間濾波器(First-Order Recursive Filtering)來作插點的移動

補償,式 2.13 是 它 的 數 學 表 示 式 。從這數 學 式子,需要在作每一插點時,都要重 新計算K1、K2的參數值,所以這種解交錯的演算法,假設每一次都能找到一個最適當 K1、K2的值,則可避免在移動估計時,因為找到不正確的移動向量,或是移動向量需 整數處理而捨去小數點誤差,而造成了移動軌跡不平滑,進而產生的鋸齒狀(Aliasing) 的畫面。從圖2.11 示意圖中,我們可清楚的了解它在作移動補償解交錯時,僅需要兩 張圖場的記憶體,這些都是它的優點。但也因為可適性遞廻解交錯的演算法,在每一插 點都需要大量且複雜的計算,而成為它最大的缺點。 n-1 n A B C D E X field number v er ti cal p o si ti on Orginal Pixel

Previous Interpolated Pixel Current Interpolated Pixel

Motion Vector

y-2

y

y+2

圖 2.10 可適性遞迴解交錯

Sub-Pixel Interpolated Pixel

f

out ( x , n )=K1 ( x , n )

f

i ( x , n )+(1- K1( x , n))

f

o( x-d(x, n) , n-1 ) , ( y mod 2=n mdo 2) K2( x , n)

f

i( x , n)+(1- K2( x , n)) fo( x-d(x, n) , n-1 ), (otherwise) ( 式 2.13)             

(30)

K2( x, n)= (式 2.14 ) │A+B│+ δ 2│

f

i(    x , n)-

f

o(x-d (x, n), n1 )│+ δ A =

f

o(x     -uy, n)-

f

o(x-d(x, n)-uy, n1) B =

f

o(x+uy, n)-      

f

o(x-d(x, n)+uy, n1) (式 2.15 ) δ 是一個常數 uy = (0 , 1) T T 是轉換函數 K1x, n) = clip ( 0, 1, C1√Diff ) (式 2.16 )

0 , (a<o) clip(0, 1, a) = 1 , (a>1) a , (otherwise) (式 2.17 )

Diff ( x , n )=∣ fo(x-d(x, n), n-1)-f i(x, n)∣  (式 2.18 ) 在上面的(式 2.14)、(式 2.15)是計算 K2的數學運算式,其中δ 是一個常數,它的 用意主要是保護(式 2.14)的分母不為 0,並使得(式 2.14)為一個合適的數值,若分母為 0,(式 2.14)就無法計算數值了。另外(式 2.16)、(式 2.17) 、(式 2.18) 是計算 K1的數 學運算式,其中最重要的參數是C1,它必需透過很多的實驗數據,去歸納統計找到最 適當的值,所以可適性遞廻解交錯的演算法是相當複雜數學式,如果要得到很好的影像 品質,就必須不斷修正K1、K2的參數值。

(31)

2.4 解交錯系統架構

在本文的第三章和第四章,將提出一個整合式解交錯的架構,但在此之前,我們需

要分析在過去文獻中,已經被提出的解交錯架構,在圖2.11 的解交錯架構[10],它至少

需要四張圖場的記憶體,主要的方塊圖包括雙向移動估計 (Bi-directional Block-base Motion Estimation) 方塊、移動向量修正偵測(Motion Vector Correctness Detection)方塊、 權重產生器(Weighting Generation)方塊、圖場內內插(Intra-Field Interpolation)方塊、圖場 間內插(Inter-Field Interpolation) 方塊等組成。它的優點是針對錯誤的移動向量有很多偵 測補償的機制,但它並未考慮影片偵測及雜訊干擾之類的問題,而且對於何時使用圖場 內解交錯、圖場間解交錯及移動補償解交錯的機制,並沒有建立出來,這些都是需要改 進的地方。 圖 2.11 移動補償解交錯架構參考(一) Intra-field Interpolation Inter-fields Interpolation Soft Switching Previous MV Bi-directional Block-based Motion Estimation MV Correctness Detection (pixel based) Error MV judge (block based) Weighting Generation TD VC fintra finter a fn fn-1 fn+1 fmc 從圖2.12 中,我們可以了解另一個解交錯的架構[11],它主要的方塊圖包括移動補

償圖場插點(Motion Compensated Field Interpolation,簡稱 MCFI)方塊、圖場間內插(Field Merging)方塊、移動向量修正偵測(Rearrangement)方塊等。其中比較特殊的為移動補償 圖場插點方塊,它含有移動估計、移動向量平滑處理及圖場插點等功能。這個架構也需

(32)

要有三張圖場的記憶體,在移動估計時,使用雙向相同圖場來找移動向量,由於點對點 比對的絕對差異總合(SAD),同為偶數圖場或奇數圖場,所以很容易找到正確的移動 向量,這是它的優點。但是當畫面中的物體在快速移動時,因為超出移動估計的搜尋範 圍,可能無法找到最好的移動向量,而且在移動估計不正確時,應設計另一種解交錯的 演算法來代替移動補償解交錯,形成保護機制,不然會有很差的畫面出現,這些都是需 要加強的部份。 圖2.12 移動補償解交錯架構參考(二) Bi-directional ME MV Smoothing Field Interpolation Field(n+1) Field(n-1) MCFI Field merging Field(n+1) Field(n-1) Fn Rearrangement Rearrangement Field(n) MCFI

(33)

第三章 整合式解交錯演算法設計

3.1 整合式解交錯架構

本文所提出的整合式移動補償解交錯的架構,是以三張圖框為基礎的系統架構。其 中的方塊圖主要包括移動估計方塊、移動偵測方塊、移動補償方塊、影像前置處理方塊、 影像後置處理方塊、移動向量平滑方塊、影片偵測方塊,及記憶體方塊等。圖3.1 是移 動補償解交錯架構方塊圖,其中實線表示資料路徑,虛線表示控制信號,在這章節(第 三章)及下一個章節(第四章)我們將詳細說明每一個方塊的設計理論。 (n-1) field Memory n field Memory (n+1) field Memory Motion Detecting Film Detecting Motion Estimation Field In Film Recovery Motion Compensation Temporal Averaging Interpolation Edge Line Average Interpolation Frame Out Motion Vector Smoothing Previous MV Previous MD 圖3.1 整合式移動補償解交錯的架構 Post-Processing Pre-Processing 在下圖3.2 中,將說明移動補償解交錯的資料處理流程。透過這個資料處理的流

(34)

在移動補償解交錯的架構中,記憶體的大小會影響硬體的成本,所以本文所提出的 架構,是以最小記憶體的概念,來設計每一個區塊的演算法。這樣的想法,是期望未來 有機會能在硬體上實現,為了驗證每一個演算法的正確性及可行性,我設計一套移動補 償解交錯模擬工具,藉由這套模擬的工具,可清楚地了解每一個演算法的效果。 圖3.2 整合式移動補償解交錯的資料流程圖 Start 3 Fields Pre-Processing Film Mode Motion Estimation MV Smoothing Motion Compensation MV Correcting Edge Line Average Field Merge Pre-MD Pre-MV Film Recovery Post-Processing End Yes N0 Yes Motion ? Yes No No

(35)

3.2 移動估計的設計

移動估計(Motion Estimation)的演算法,是設計在移動補償解交錯的架構中。這 是相當重要的系統方塊,因為當移動估計錯誤時,錯誤的移動向量很難作正確的移動補 償而還原真實影像,因此移動估計的目地主要是找到畫面間的移動向量,如圖3.3 所 示。輸入影像的資料格式是交錯格式,我們可以假設目前的畫面是偶數圖場,前一個畫 面則是奇數圖場,同理若是目前的畫面是奇數圖場,前一個畫面則是偶數圖場。這表示 我們若要補償目前的畫面偶數圖場成一個圖框,就必需從目前的偶數圖場,和利用前一 個奇數圖場作移動估計,而得到目前的偶數圖場奇數線,而合成一個圖框,這一連串的 過程即可稱為解交錯,如下圖3.4 所示。 圖3.3 交錯式的資料格式 Evrn Field

Odd Field Odd Field

Even Field time time Fi el d Nu mb er y y 在這些過程中,我們知道移動估測運用在影像壓縮,和運用在交錯掃描格式移動估 計是有很大的不同。不同的地方是影像壓縮在作移動估測,主要減少平均預測的錯誤值 (Average Predictive Error),並針對整個畫面,找尋移動向量。而運用在交錯掃描格式 時,可以比較的資料只有一半的畫面,所以如何找到真實的移動向量,就顯得相當重要。

time y

evrn field

odd field

Interlaced fields Progressive frames

(36)

3.2.1 交錯掃描格式的移動估測設計

交錯掃描格式的電視訊號是由連續的圖場所組成的,而交錯掃描格式移動估計是要 從相鄰的兩個圖場,找到每一個像素的移動向量,而移動向量的定義,即由圖3.5 所示。 由現在的影像往前一張找到最相似的區塊,我們可將(X1, Y1)-(X2, Y2)作為移動向量。 圖 3.5 移動向量定義 ( X1,Y1) ( X2,Y2) Current Image Previous Image 解交錯掃描格式轉換過程中,移動向量的估測,若是用連續的兩個圖場作為比對的 標準,我們可從圖3.6a 得知,虛線表示不存在的掃描線,實際的影像應如圖 3.6b 所示。 偶數圖場只有偶數線,奇數圖場只有奇數線,若是用連續兩個圖場作為移動估計,垂直 的方向就有一條線的差異。但如果考慮的是奇數場對奇數場,偶數場對偶數場,就如圖 3.7a 和圖 3.7b 所示。也就是對相同的圖場畫面作移動估計,那就可以避免上述的問題 產生,但卻又衍生另一個問題,假設有一個物件移動速度相當的快,它將超出在兩場的 移動搜尋範圍。因此可能將找不到正確的移動向量,但是如果只隔一個圖場的時間,通 常就不會有此問題,所以在此我們將探討下列幾種方法。 圖3.6a 理論上偶數圖場對奇數圖場的移動估計 Even Field Odd Field

Even Line 0

(37)

圖3.6b 實際上偶數圖場對奇數圖場的移動估計 Even Field Odd Field

Even Line 0 Even Line 1

Odd Line 0 Odd Line 1

Even Field Odd Field

Even Line 0 Odd Line 0 Even Field Even Line 0 Odd Line 0 圖3.7a 理論上偶數圖場對偶數圖場的移動估計 圖3.7b 實際上偶數圖場對偶數圖場的移動估計 Even Field Odd Field

Even Line 0 Even Line 1 Even Field Even Line 0 Even Line 1 在一般影像處理系統中,以方塊比對的移動估計使用最廣泛,主要是硬體計算非常

(38)

準則(match criterion),是使用的誤差方程式(Error function)中絕對差異的總和(Sum of Absolute Difference, SAD)。在 MPEG 中,通常是在連續的全場畫面中,計算絕對差 異的總和。不同於解交錯掃描格式轉換,移動向量估測所用來計算絕對差異總和的方 法,在解交錯掃描格式轉換中,連續的圖場畫面有奇數圖場和偶數圖場的差異。如果直 接拿相鄰的兩個圖場,來計算絕對差異的總和是不適當的,會發生一些問題。尤其是在 畫面垂直亮度訊號的高頻成分很大時,影響更為嚴重。 依據交錯掃描格式圖場的不同,我們將移動估計作法,大約分成下列五種方式: 方法一 : 偶數圖場對奇數圖場模式 1 的移動估計,如圖 3.8a 所示,若目前的圖場 是奇數圖場,而它前一張是偶數圖場。其中黑色的點,表示有資料;白色的點,表示無 資料,所以用兩張圖場的資料,來作移動估計的區塊比對,則會有一條線的差異。

n-1 (even field) n (odd field)

圖3.8a 偶數圖場對奇數圖場模式1的移動估計

方法二 : 偶數圖場對奇數圖場模式 2 的移動估計,如圖 3.8b 所示。若目前的圖場 是奇數圖場,而它前一張是偶數圖場,其中黑色的點表示有資料,白色的點表示無資料。 因為用兩張圖場的資料來作移動估計的區塊比對,則會有一條線的差異,所以可利用奇 數圖場奇數線,作垂直兩點的平均,而得到偶數線,再與前一張偶數圖場作移動估計。

n-1 (even field) n (odd field)

(39)

方法三 : 偶數圖場對奇數圖場模式 3 的移動估計,如圖 3.8c 所示。若目前的圖場 是奇數圖場,而它前一張是偶數圖場,其中黑色的點表示有資料,白色的點表示無資料, 灰色的點表示已插點過的資料。可利用這些點和目前的圖場點作移動估計,而不會有位 置的差異。不過這種方式必需保證已插過點是正確的,否則解交錯的畫質會隨時間越來 越差。

n-1 (even field) n (odd field)

圖3.8c 偶數圖場對奇數圖場模式3的移動估計

方法四 : 偶數圖場對偶數圖場的移動估計,如圖 3.8d 所示。若目前的圖場是奇數 圖場,而它前一張是偶數圖場,下一張也是偶數圖場,其中黑色的點表示有資料,利用 前一張偶數圖場,和下一張偶數圖場作移動估計,而不會有位置的差異。但當物體移動 速度很快時,移動向量可能已經超過搜尋範圍。

n-1 (even field) n (odd field)

圖3.8d 偶數圖場對偶數圖場的移動估計

n+1 (even field)

方法五 : 雙向偶數圖場對奇數圖場的移動估計[12],如圖 3.8e 所示。若目前的圖 場是奇數圖場,而它前一張是偶數圖場,下一張也是偶數圖場,由目前的奇數圖場分 別向前一張,及下一張的偶數圖場作移動估計,然後將兩個移動估計的值作平均的處

(40)

n-1 (even field) n (odd field) n+1 (even field) 圖3.8e 雙向偶數圖場對奇數圖場的移動估計 各種移動估計的方式,是先取得循序掃描方式拍攝的自然圖片,由於它的寬和高 的像素為1920*1080,拿來觀察與分析並不方便。所以選取某一區域的大小為 720*480 的像素,連續取20 張,將它作成交錯掃描的格式,依照偶數圖場、奇數圖場、偶數圖 場、奇數圖場的排列順序,由循序掃描格式(720*480)轉換成偶數圖場時,需將奇數線 的資料移除,因此偶數圖場變成720*240。同理循序掃描格式(720*480),轉換成奇數圖 場時,需將偶數線的資料移除,因此奇數圖場變成720*240,由這樣的作法及即可得到 交錯掃描的格式。將這20 張交錯掃描的格式,輸入到上述五種不同移動估計解交錯系 統,可得到720*480 循序掃描圖片(720*480)輸出,將這 20 張的輸出和原始的循序掃描 圖片(720*480)作 MSE 的計算,可得到表 2 的結果。MSE 的數學式如( 式 3.1)所 式 : MSE =

Σ Σ Σ

│ F (x, y, n)- F (x, y, n)│ N-1 X-1 Y-1 n=0 x=0 y=0 ^ 2 1 NX.Y ( 式 3.1) N 表示圖場數,N = 20 張 X 表示圖場寬度 X = 720 像素 Y 表示圖場高度 Y = 480 像素

F │x, y, n│

表示原始的循序掃描圖片

F │x, y, n│

^ 表示解交錯後循序掃描圖片

(41)

經過實際模擬的結果,我們可得到表2 中的結果。其中方法二和方法五有差不多的 表現(Performance),而方法五是使用雙向偶數圖場對奇數圖場的移動估計。所以這種 方式所需要的運算量、速度及硬體成本等都要雙倍的增加,因此最理想移動估計是採用

方法二,偶數圖場對奇數圖場模式2 的移動估計。

fish (慢速移動) tomato (鏡頭縮放) traffic (快速移動)

方法一 0.7351 1.1415 1.2269 方法二 0.6665 1.1044 1.0394 方法三 0.7819 1.5515 2.0916 方法四 0.8629 1.3815 3.1943 方法五 0.6706 0.9949 1.1085 表 2 : 各種方式移動估計的比較表

3.2.2 移動估測搜尋範圍與方塊大小的設計

在影像壓縮標準中,有很多的移動估計的搜尋法已的文獻被提出。在本文中,將使 用兩種搜尋法來作模擬:第一種是全區域搜尋法(full search)。全區域搜尋法是對於每 一個區塊,其相對的搜尋範圍內,所有的位置都做SAD 值的計算與比對,最後選取擁 有最小SAD 值的區塊位置,而相對的位移就是此區塊的移動向量。因為所有搜尋位置 的區塊位置都要計算SAD 值,所以保證可以找到最小的 SAD 值,也就是最相似的候 選區塊。換言之,就可以找到最佳的移動向量,但是相對地,需要很高的運算量。 由於全區域搜尋需要大量的運算量,因此有許多運算量較小,且達到相似結果的演 算法已被提出,統稱為快速搜尋演算法。這些快速演算法可以區分為兩類,第一類是只 計算在搜尋區域當中,最有可能擁有最小SAD 值的位置,如三步數搜尋法(Three-Step

Search)、鑽石搜尋法(Diamond Search) 等。而另一類是減少計算 SAD 值時所需要的 運算量,也就是將比對的兩個區塊作次取樣而不需要計算每一點的絕對差值,如階層式 的搜尋法(Hierarchic Search)。

(42)

它是一種將搜尋的範圍由粗而細,從方塊16*16 變 8*8 最後是 4*4。其中在方塊 16*16 大小時,是四個像素只取一個像素,方塊8*8 大小時,是兩個像素只取一個像素,方塊 4*4 大小時則是每一個像素都比對。由於這樣的作法會減少計算 SAD 值時所需要的運 算量,另外也對搜尋範圍做改變,方塊8*8 大小搜尋的範圍減少為 4*4,方塊 4*4 大小 時則減少為2*2,從圖 3.10 我們就可以很清楚的了解它的搜尋過程。 以方塊為基準的移動估計,有兩個重要參數需要決定。其中一個參數是方塊的大 小,當方塊選擇太大時,計算量就相地增加、硬體成本高。當方塊選擇太小時,在作方 塊比對時,容易有誤判的情況發生,而且容易受到雜訊的干擾。 圖3.9 階層式搜尋法方塊 16 16 8 8 4 4 圖3.10 階層式搜尋法步驟

(43)

圖3.11 是針對不同的區塊大小所模擬的結果,其中圖 3.11a 是區塊大小 4*4 移動估 計,因為比對區塊小,就容易找到很多相似的區塊而造成誤判,所以在鐘擺球的邊緣就 有很多鋸齒狀。若區塊設計太大時,除了增加運算量,也會在一些特別形狀的物體上, 無法找到最好的區塊。圖3.11b 是區塊大小 16*16 移動估計,鐘擺的地方就呈現不規則 線。因此為了解決上述兩種的問題,可採用階層式的搜尋法,如圖3.11 是階層式的搜 尋法模擬的結果。此外,在表3 中,我們可以得到全區域搜尋法,和階層式搜尋法的三 種不同畫面MSE 值。歸納這些數據,可以得到階層式搜尋法和全區域搜尋法有相同的 效能,而且階層式搜尋法的速度快,是它的另一項優點。

fish (慢速移動) tomato (縮放) traffic (快速移動) 全區域搜 尋法 0.7351 1.1415 1.2269 階層式搜 尋法 0.7167 1.1079 1.1127 表 3 : 移動搜尋法的比較表

(44)

(b)

(c)

圖3.11 不同移動估計搜尋法的模擬結果 : ( a ) 4*4 區塊全區域搜尋法

(45)

3.3 移動向量平滑處理的設計

影響移動向量測量的最主要因素包括影像本身的雜訊,和在作方塊比對時,方塊定 義太小,或是搜尋範圍不夠大,都會影響移動向量的估計。我們假設一個移動物件,至 少會大於數個方塊的大小,因此在相同的移動物體內若出現不同的移動向量,很可能出 現了錯誤判斷,如圖3.12a 所示。由此特性我們定義,包含要被處理的移動四週的資訊, 總共3±3 區塊的區域,用文字來表示,可以如 3.12b 所示,表示方式為 MV1、MV2、 MV3、MV4、MV5、MV6、MV7、MV8、MV9 等九個移動向量。移動向量若以兩度 空間作平滑處理,將會變得很複雜,對整個解交錯系統來說,比較重要的是在移動估計 時,找到正確的移動向量,而不是在移動估計找到錯誤的移動向量時,透過移動向量平 滑處理來改善。因此,為了減少移動向量平滑處理的複雜度,可以使用簡單一維空間對 這九個移動向量,作水平方向平滑處理及與垂直方向的平滑處理,其符號如圖3.12c 及 圖3.12d 所示。 圖 3.12a 移動向量

MV1

圖 3.12b 移動向量符號

MV2 MV3

MV4 MV5 MV6

MV7 MV8 MV9

Xa Xb Xc Xd Xe Xf Xg Xh Xi 圖 3.12c X座標移動向量 Ya Yb Yc Yd Ye Yf Yg Yh Yi 圖 3.12d Y座標移動向量

(46)

方式一 : 辨別移動向量的方向,將移動向量分成水平方向與垂直方向各別處理, 辨別的方式為假設物件移動的範圍超過3±3 區塊,則中心點(Xe 或 Ye)的移動向量是向 右,其它八個點的移動向量是向左。表示中心點(Xe 或 Ye)的移動向量是錯誤的,我們 可依據上一張同一點的移動向量,比較得到其它八點最接近移動向量,來代替中心點(Xe 或Ye)的移動向量。 方式二 : 和方式一相同的方式去辨別移動向量的方向是否正確,當辨別中心點 (Xe 或 Ye)的移動向量是錯誤時,我們可將其它八點的移動向量做平均後,所計算的值, 來代替中心點(Xe 或 Ye)的移動向量。 方式三 : 將 3±3 區塊的每一個移動向量,依水平方向和垂直方向,分別作大小的 排序,取得九個移動向量中,排序第五的移動向量,來代替中心點(Xe 或 Ye)的移動向 量。 ( b ) ( a ) 圖3.13 移動向量平滑處理測試圖 (a). 第一張圖 (b). 第二張圖 圖3.13 是移動向量的測試圖,由第一張圖和第二張圖的前後關係,可以知道移動 向量的方向是由右下角往左上角的方向移動,所以圖 3.14 是不同移動向量平滑處理的 結果。圖 3.14(a)是無移動向量平滑處理的結果,圖 3.14(b)是方式一的移動向量平滑處 理的結果,這是最簡單的一種方式,硬體成本低是它最大的優點。圖 3.14(c)是方式二 的移動向量平滑處理的結果,這種平均處理的方式,比第一種的方式稍為複雜一些,但 它的優點是可以避免一些雜訊的干擾。圖 3.14(d)是方式三的移動向量平滑處理的結 果,這種經由排序的方式,而取中間值的移動向量,從圖來看是移動向量是最平滑,但 相對地成本高是它的缺點,而且要減少作移動估計時,一些雜訊的干擾,否則會有更差 的效果。基於成本的考量,我們將使用方式一的移動向量平滑處理,在解交錯的系統架 構中。

(47)

( a )

( b )

( c )

( d )

(48)

3.4 移動補償的設計

在一連串的圖場當中,其實只要物體並沒有消失或是轉動,大部份的圖像,即使在 目前的圖場沒有移動的物體,也可以在相鄰的圖場找到相似可契合的部份來貼上,這是 移動補償解交錯的優點。而要在附近的圖場找出契合的部份來貼上,最常被使用到的是 移動補償,移動補償解交錯最早也和移動可適性解交錯一樣,是使用前一張圖場和現在 圖場這兩張圖場來做移動估計,再將估計好的移動向量經過移動向量平滑處理後,再作 移動補償的處理,讓它重新組合出一張,可以和現在圖場契合的另一張圖場。由圖3.15 可了解整個移動補償的架構,由於使用了移動補償的技術,使得新增的圖場大部份都是 真實的像素,如此也增加了相當多的解析度。 然而,因為移動估計使用不同的圖場,若以SAD 為基礎的移動估計在這時候也會 找不準,因此錯誤的移動向量會造成移動補償錯誤。所以本文中,會增加一個角度偵測 線平均(ELA)解交錯演算法,當某一個區域無法以移動補償來成功完成解交錯的時候, 便會使用角度偵測線平均解交錯演算法來完成。 圖 3.15 移動補償的架構 Motion Estimation Motion Vector Smoothing Motion Compensation Edge Line Average MUX Field In 1-K K Output K Look-Up Table

(49)

在(式 3.2)中 ,輸出式 f out(x, n)是循序掃描的資料格式,f o(x, n)是目前圖 場的原始資料,f i(x, n)是目前圖場需要插點的資料。在式(3.2) 中有三種圖場插點 的方式,我們先用移動向量是否作錯誤第一次的判斷,若移動向量是正確時,選擇使用 (式 3.2)中 (C 式 ) 移動補償解交錯的方式來插點,否則使用非移動補償解交錯的方式 來作插點。若選擇非移動補償時,需要再作第二次的判斷,透過移動偵測的機制,若判 斷為靜態時,則用(式 3.2)中 (A 式 )時間平均解交錯的方式來插點,否則為動態,則 用(式 3.2)中 (B 式 )角度偵測線平均(ELA)解交錯的方式來插點。   

f

o(x, n), y mod 2 = n mod 2

f

out

x, n)= f

i(x, n) = [

f

o(x, n1)+

f

o(x, n+1)] / 2 , (Static)

f

i(x, n)= Min(DEAR, DEBQ, DECP, DEDQ, DEEN, DEPM, DEGL, DEHK, DEIJ), (MV Correct)

f

i(x, n) = K( x , n)

f

i ( x , n)+(1- K) ( x , n)

f

o ( x- d(x, n) , n-1 ), (MV Incorrect)            (C 式 )  (A 式 ) (B 式 ) ( 式 3.2) A =

f

o(x     -uy, n)-

f

o(x-d(x, n)-uy, n1) (式 3.3 ) B =

f

o(x+uy, n)-      

f

o(x-d(x, n)+uy, n1) (式 3.4 ) C =

f

ix, n)-    

f

o(x-d(x, n), n1) (式 3.5 ) 在(式 3.2)中 ,K 值的參數將影響整個移動補償的效能,所以如何計算 K 值就 變得很重要,K 值的範圍在 0~1 之間。首先,將(式 3.3)的 A 和將(式 3.4)的 B 相加等 於D,然後利用 C 與 D 則得到下列的演算法 : 演算法如下: if C≦D Begin if (C=0) R=0

(50)

K=0.5 else if ((D-C) ≦4) K=0.4 else if ((D-C) ≦6) K=0.3 else if ((D-C) ≦8) K=0.2 else if ((D-C) ≦10) K=0.1 else K=0 End else //if ( D<C) Begin if (C=0) K=0 else if ((C -D) ≦2) K=0.5 else if ((D-C) ≦4) K=0.6 else if ((D-C) ≦6) K=0.7 else if ((D-C) ≦8) K=0.8 else if ((D-C) ≦10) K=0.9 else K=1 End

(51)

3.5 移動偵測的設計

由於移動補償仍有部份不能解決的問題,像是超越搜尋範圍的移動、轉動或是縮 放。所以當某一個區域,無法以移動補償來成功地完成解交錯的時候,便會使用非移動 補償解交錯來完成,針對無法用移動補償的區域,將利用移動偵測(Motion Detection) 的機制,來辦別每一像素。若移動偵測的結果是不動時,便使用時間平均解交錯,否則 就採用角度偵測線平均(ELA)解交錯的演算法,因此移動偵測的準確性將變得很重要。 一般用來移動偵測的方法,是將前一張圖場,及目前的圖場的內容儲存在外部的記 憶體裡。在讀到某一像素的資料時,就直接輸入兩個像素的資料,然後要經過一個加法 器對他們做相減,就可以得到該位置的差異。再透過位準(Threshold)的比對,對於 差異較大的值就判定為在移動的區域,並將辨別符號顯示為“1”;差異不大的值,就 是在判定為靜止的區域,辨別符號顯示為“0”。 但這樣的做法,有一個缺陷:前一張圖場和目前的圖場在拍攝時,並非具有相同的 真實空間位置。直接拿來作處理的話,會有空間上的差異,也就是他們對應到的真實空 間會相差一行。另外,多半都有經過人工處理的部分,畫面上往往都會有字幕或是旁白 的標示出現。如果我們忽略他們,直接全部相減,將會把字幕當成也在運動的部份,而 把整個字幕變模糊。 因此在這裡,我們所提出來的演算法,是將目前的圖場和前一張圖場都存起來,然 後做後一張圖場和前一張圖場的差異。這樣的好處是,字幕以及對應到真實空間的位置 都會是恆定的,就不會造成每張畫面都有不少誤判的部份了。但是缺點是前一張圖場, 及後一張圖場在時間軸上會有較大的落差,我們要用這兩個圖場的資訊,來判定目前的 圖場,在移動的地方會不妥。因此我們在前端做了小處理,增加低通濾波器及高通濾波 器,可以讓畫面中的雜點都不見了、消除了許多外圍的雜點。圖3.16 是移動偵測的方 塊,圖3.17 是移動偵測的流程圖,由這兩個圖可以很清楚地了解移動偵測的作法及設 計的概念。

(52)

圖3.16 移動偵測區塊圖 3*3 LP 3*3 LP 3*3 LP 121 LP 121 LP 121 LP n+1 Field n Field

n-1 Field Field Pixel Difference Frame Pixel Difference Field Pixel Difference Motion Flag Previous Field Motion Previous Frame Motion

(53)

圖3.17 移動偵測流程圖 Start Data Calaulate Film ? MV Correct ? Film Recovery Motion Compensation End Previous Information Edge Low

Angle Field Merge Motion ? No Yes Yes No Yes No

數據

圖 1.1  圖場和圖框
圖 2.4  空間垂直平均解交錯 y-1yy+1y y+1xxx-1x+1field numberx-1x+1EAy+2FDC 2.2.2 時間解交錯  時間解交錯的方式是利用不同時間領域的圖場像素,經由一些的數學運算,來作插 點的像素,這種方式的演算法最適合使用在完全靜態的影像,它是一種很簡單的解交錯 方式,稱為圖場複製解交錯(Field Repetition De-interlacing),數學式為(式 2.4):
圖  2.5   時間平均解交錯 y-1yy+1yy+1xx-1xx+1field numberx-1x+1Ay-1C y y+1xx-1x+1y-1n+1
圖 2.7  角度偵測掃描線平均解交錯  y-1yy+1x-3xx+1x-4x-2ACx+3x-1 x+4FEDGx+2H IJKLMNOPQy+2y-2X R 在(式 2.7)中定義了 A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P、Q、 R 等每一像素相對應的位置,而(式 2.8)則定義 XAR、XBQ、XCP、XDQ、XEN、XFM、 XGL、XHK、X I J  等可能插點到 X 的值。經由這些式子和之前所提到移動可適性解交
+7

參考文獻

相關文件

則察看自己的 cache 是否有紀錄,若否才前往 root(.)3. DNS 主機會先將該查詢記錄記憶在自己的

設計了正立方體框架的組合,在計算方塊個數與框架的差異性可透過等差數列的概念作 結合;而作品「腳踏實地」

分項計畫「海上絲路之探索」之設計與推行,基本上針對本校通

應用閉合電路原理解決生活問題 (常識) 應用設計循環進行設計及改良作品 (常識) 以小數加法及乘法計算成本 (數學).

2.「情境」創設對非華語學生學中文的影響 3.應用「調適架構」配合情境訂立教學目標 二、 第二語言教學流派..

本論文結合了 GPU-FPM 以及 Bitmap 的優點,並利用 Multi-GPU 架構提出 Multi-GPU CSFPM 的演算法,由於 CSFPM 如同 GPU-FPM

由於本計畫之主要目的在於依據 ITeS 傳遞模式建構 IPTV 之服務品質評估量表,並藉由決

其硬體架構如圖 9.3 所示。本實驗最主要的目的是要將之前學長所做的 GPS/INS 整合 部分中的加速儀用