• 沒有找到結果。

行政院國家科學委員會專題研究計畫 成果報告

N/A
N/A
Protected

Academic year: 2022

Share "行政院國家科學委員會專題研究計畫 成果報告"

Copied!
35
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會專題研究計畫 成果報告

使用空間與時間關聯預測之 H.264/AVC 快速 Intra/Inter 模式決定系統

研究成果報告(精簡版)

計 畫 類 別 : 個別型

計 畫 編 號 : NSC 98-2221-E-216-034-

執 行 期 間 : 98 年 08 月 01 日至 99 年 07 月 31 日 執 行 單 位 : 中華大學資訊工程學系

計 畫 主 持 人 : 連振昌 共 同 主 持 人 : 周智勳

報 告 附 件 : 出席國際會議研究心得報告及發表論文

處 理 方 式 : 本計畫可公開查詢

中 華 民 國 99 年 10 月 27 日

(2)

1

行政院國家科學委員會補助專題研究計畫 ■成果報告

□期中進度報告

使用空間與時間關聯預測之 H.264/AVC 快速 Intra/Inter 模式決定系統

計畫類別: ■ 個別型計畫 □整合型計畫 計畫編號: NSC 98-2221-E-216 -034

執行期間: 98/08/01 ~ 99/07/31

執行機構及系所:中華大學資訊工程學系

計畫主持人:連振昌 共同主持人:周智勳

計畫參與人員:余冠霖、黃耀德

成果報告類型(依經費核定清單規定繳交):■精簡報告 □完整報告

本計畫除繳交成果報告外,另須繳交以下出國心得報告:

□赴國外出差或研習心得報告

□赴大陸地區出差或研習心得報告

■出席國際學術會議心得報告

□國際合作研究計畫國外研究報告

處理方式:除列管計畫及下列情形者外,得立即公開查詢

□涉及專利或其他智慧財產權,□一年□二年後可公開查詢

中華民國九十九年十月二十七日

(3)

2

一、 前言

在 H.264/AVC 編碼標準[1],對於 Inter frame 運動向量預估模式、entropy coding、

多張參考 frame 之 Inter frame 編碼、I-frame 的 Intra frame 預測編碼模式及更精準的次像 素運動向量預估模式微調等,提供很大的彈性以獲得最佳的 R-D cost。對於 Inter frame 運動向量補償編碼中,最主要的運算落在每一個方塊內,必須從 4×4 到 16×16 的七種動 態預估模式中找尋最佳的動態補償誤差值(motion compensation error)。對於 Intra frame 預測模式編碼中,8×8 色度(Chroma)區塊與 16×16 亮度(Luma)區塊會有四種預測模式,

4×4 亮度區塊會有八個方向及一個 DC 的預測模式。因此,我們可以發現在 JM-14.0 參 考軟體中,高複雜的 Intra/Inter frame 完整搜尋方式造成編碼過程非常耗時。所以,許多 的方法應運而生,如 SAD、相同區塊的分析、邊緣偵測等都是為了抉擇最佳的動態預估 模式。然而,這些的運用都需要在動態補償過程中,花費額外的時間與資源。在此計畫 中,我們所發展之技術不需要額外的影像處理,就可以達成的快速視訊壓縮編碼。本計 劃構思利用當前畫面和參考畫面間,分析 Intra/Inter 預測模式空間與時間的關聯性,找 出在空間和時間上,每一個 macroblock 預估模式的關聯性後,建構快速模式決定的方法。

而且,在模式處理過程中,採取漂移補償來避免誤差的累積。目前於實驗數據中,可以 發現總運算量的時間可以節省約百分之七十,傳輸率(bit rate)方面只增加百分之三點七,

平均的 PSNR 大約只有損失 0.08 dB。

二、 研究目的

新一代的視訊編碼標準 H.264/AVC[1]是 Joint Video Team (JVT) [1]所發展的低位元 率壓縮技術。在 H.264/AVC 編碼標準[1],對於 Inter frame 運動向量預估模式、entropy coding、多張參考 frame 之 Inter frame 編碼、I-frame 的 intra frame 預測編碼模式及更精 準的次像素運動向量預估模式微調等,提供很大的彈性以獲得最佳的 R-D cost。特別是 在七種運動向量預估模式從 4×4 到 16×16 模式在每個 macroblock 找最小運動補償誤差 值。在當前的 JVT 參考軟體中,七種模式(各式各樣的 block sizes)被應用於進行運動補 償過程,此類的最佳化的 R-D cost 定義如(1)

R D

J

Mode= +

λ

Mode× (1) 在式子中 D 表示 macroblock 運動補償誤差值,

λ

Mode是 Lagrange multiplier,R 表示要求 的位元率。為了得到最佳的運動向量估計模式,我們必須在一些費時的過程,例如包含 運動向量估計,DCT 轉換,量化器,計算每一個運動向量估計模式的 R-D cost。

另外,利用七種運動向量估計模式從 4×4 到 16×16 (見 Fig. 1)去決定在每個 macroblock 最佳的運動向量估計模式。對 intra 預測模式,利用在 Fig. 2 中的四種預測模式去編碼 8×8 chroma 與 16×16 luma blocks 及利用在 Fig. 3 中的八種預測方向和一種 DC 預測去 編碼 intra 4×4 luma block 。然而,在參考軟體 JM-14.0[6]使用全域搜尋法(Full Search) 會需要大量的計算量,使得此技術變的無效率。

(4)

三、

近年 應用目前 種的 bl 事先定義 16×8 和 類型去決 域分類 7(8×8,8 sub-mac 一個 8×

F

Fig. 2 Pr

文獻探討

年來,許多 前的 frame lock 適合於

義的 thresh 和 8×16 bloc 決定。在文 類。如果 m 8×4,4×8 和 croblock 且

×8 的 sub-m

Fig. 1 Macro

rediction mo

Fig. 3 P

多研究[7-14]

e 和前一張 於運動向量估

hold 比較,如 ck 類型之中 文獻[8],邊緣

macroblock 和 4×4)會被

且分析每一個 macroblock 是

oblock and S

odes in Intr

Prediction m

]提出關於快 frame 之間 估計過程。

如果 SAD 比 中選擇。否則

緣偵測[9]被 屬於 hom 被移 除掉 。 個 sub-macr 是 homogen

3

Sub-macrob

a 16×16 lum

modes in Int

快速模式的 間的 SAD (s

。在文獻[7]

比 threshold 則,運動向 被應用於將 mogeneous 的

否 則, ma roblock 是不 neous 則運動

block partiti

ma and Intra

tra 4×4 lum

的決定方法 um of abso ]的方法如下 d 值小,則運 向量估計模式

homogeneo 的區域則運 acroblock 會 不是屬於 h 動向量預估

ions in H.26

a 8×8 chom

ma block.

,在文獻[7]

olute differe 下所述,第 運動向量估 式將會由估 ous 和 non- 運動向量估

會 被分成 許 homogeneou 估模式 5,6 和

64

ma blocks.

],每個 mac ence),去估 第一,計算 估計模式將從

估計所有七種 -homogeneo 估計模式 4 許 多 大小 us 的區域。

和 7(8×4,4×8

croblock 估計哪一

SAD 和 從 16×16,

種 block ous 的區 4,5,6 和 8×8 的 如果每 8 和 4×4)

(5)

4

會 被 移 除 掉 。 直 到 所 有 的 sub-macroblock 都 被 計 算 過 這 個 程 序 才 停 止 。 最 後 , rate-distortion 最佳化被利用於去決定哪個是最好的運動向量預估模式。在文獻[9],Pan 等應用邊緣方向值方圖去降低 intra 預測模式的決定的計算成本。在文獻[10],Zhu 等應 用低解析度的影像和邊緣偵測去決定運動向量預估模式 (8×4,4×8 和 4×4)。在文獻[11],

Meng 等應用兩個方法降低模式決定的複雜度。第一,marroblock decimation 被利用於估 計模式的最小的粗略 R-D cost。第二,如果 R-D cost 比事前定義的 threshold T 來的小,

則我們選擇這個模式和這它的兩個鄰近的模式當作候選的模式。

對於 H.264/AVC 的 intra coding,文獻[12]Cheng 等應用三個步驟階層搜尋方法去 預測 4×4 intra 預測方法。第一,三個模式 0, 1 和 2 根據 R-D cost 被計算。第二,基於步 驟一的作法估計,兩個模式求一組(5,7)和(6,8)的值。最後,分析四組(4, 5) ,(3, 7), (4, 6) 和 (6, 8)的 R-D cost 去選擇最佳的 intra 預測模式。在每個步驟,獲得最小的 R-D cost 決定 下一個去計算,且它會降低計算 cost 從 9 模式到 6 模式。在文獻[13],Hwang 等應用時 間的資訊去預測 intra 模式在 P-frames。對每一個 block 在同一個位置 previous 預測模式 且它鄰近的 block 被當作候選預測模式去減少重要的搜尋方法。在文獻[14], Lien 等不 只應用時間的資訊也利用空間的相關性去發展新的快速模式決定方法利用空間-時間預 測模式。空間-時間相關性在參考 frame 和鄰近 macroblocks 之中被分析去發展快速模式 決定方法不利用額外的影像處理。此外,drift compensation 的概念被採用避免在模式決 定的過程累積的誤差值。

在本計劃,不但利用在參考 frame 和鄰近 macroblocks 之中時間-空間的關聯性開發 快速模式決定(運動估計)方法,也使用 P-frame 的 intra 預測模式。這個新的想法不需要 額外的影像處理且這個新的想法可以比[14]省更多的 cost。除此之外,此計劃有別於文 獻[14],我們除了考慮 interframe coding 也同時考慮 intraframe frame coding. 也就是較完 整的研究如何改善 H.264/AVC 的編碼效能。根據比較 JM-14.0 參考軟體,實驗結果顯示 總共的計算 cost 可減少 70%以上,總共的 bitrate 只增加 3.7%而且平均的 PSNR 只有下 降大約 0.08dB。

四、 研究方法

4.1 H.264/AVC 以及 JM-14.0 參考軟體

近年來,新的視訊編碼標準 Advanced Video Coding (AVC)被提出到 ISO/IEC 國際標 準 ISO/IEC 14496-10 視訊編碼和 ITU-T H.264[1]。H.264/AVC 編碼的主要目的是要為了 改善壓縮效率、網路適應性、抗錯能力與互動式和無互動式視訊應用。為了獲得最佳的 R-D cost,在 H.264/AVC 編碼標準中,對於運動估計模式有很大的彈性,提供多張參考 frame、多種 I-frame 的 intra 預測模式、更精準的次像素運動向量預估模式微調、entropy coding…等。H.264/AVC 編碼架構如 Fig.4 中所顯示。

(6)

5

Fig. 4 The structure of H.264 Encoder

4.1.1 H.264/AVC Baseline 組態

概括來說,H.264/AVC 有四種編碼器組態:baseline、main、extended 和 fidelity range extensions(FREXT)[16]。在本計劃中,我們只利用 baseline 組態來發展快速模式決定方 法對於 Intra/Inter frame 編碼。在 baseline 組態中,只支援 I-和 P-slices。I-slices 由 intra-coded macroblock 構成,而 P-slices 是由 intra-coded,inter-coded 和 skipped macroblock 構成。

在 P-slices 的 inter-coded macroblock 是經由多重參考 frame(先前編碼的畫面)的運動補償 處理編碼而來的。接著冗餘資訊用 4×4 的整數轉換器[14]轉換和量化。轉換係數是藉由 context-adaptive variable length coding scheme (CAVLC)[17-18]編碼。

在傳統的視訊編碼標準中,例如,Mpeg-II,參考 frame 為了編碼 P-frame 是固定的 當作前面的 frame。不過,在 H.264/AVC 中參考 frame 可能是許多前面的 frame。另外,

運動補償預測處理的 block size 不再限制為 16×16。在 H.264/AVC 中,block size 可能從 16×16 到 4×4(Fig.1)的變化。總共有七種 block sizes 可以用在運動補償預測的處理。因此,

運動向量將會在每一個 macroblock 和 sub-macroblock 內來做計算。如果編碼系統選擇大 的預測尺寸(16×16, 16×8 或 8×16)則較少的位元數來編碼運動向量。相反的,如果邊編 碼系統選擇小的預測尺寸(8×8, 8×4,4×8 或 4×4)則編碼運動向量要求較大的位元數。

對於 intra 預測編碼系統,macroblocks I16MB(16×16)和 I8MB(8×8)被四種 intr 預測 模式(見 Fig. 2)包含模式 0(垂直),模式 1(水平),模式 2(DC),模式 3(平面)來編碼。在 Fig. 3 有一些範例對 4×4 block 的 intra 編碼的說明。如果選擇模式 1,pixels a, b, c 和 d 會 被鄰近的 pixel I 預測到;pixels e, f, g 和 h 會被鄰近的 pixel J 預測到,諸如此類。如果 選擇模式 4,pixel c 會被(A/4 + B/2 + C/4)的四捨五入後的數值預測到,pixel d 會被(B/4 + C/2 + D/4)的四捨五入後的數值預測到諸如此類。如果選擇模式 2,所有的 pixels 會被 (A+B+C+D+I+J+K+L)/8 的數值預測到。

因此,在 H.264/AVC 中 intra 預測模式的選擇是一個非常耗費時間的過程。luma 和 chroma 預 測 模 式 在 一 個 macroblock 的 搜 尋 數 量 計 有 M8×(M4×16+M16) 和 592(4×(16×9+4)),被需求去找最好的 RDO 模式。

(7)

6

4.1.2 The JM-14.0 編碼結構

在本計劃中,利用 H.264/AVC 參考軟體 JM-14.0[6]去發展快速模式決定方法。Fig. 5 顯 示 JM-14.0 編 碼 器 的 主 要 部 份 的 流 程 圖 。 在 JM-14.0 參 考 軟 體 中 , configuration (encoder_baseline.cfg)被初始化在 main”function 的開頭。然後,frame_picture function 用 來 定 義 interlaced 或 是 progressive 的 視 訊 型 態 。 在 field_picture function 中 , PartitionMotionSearch function 用來分割 frame 成為 macroblock, encode_one_macroblock function 用來編碼每一個 macroblock。最後 BlockMotionSearch function 選擇運動估計模 式用於運動補償編碼。

Fig. 5 Flowchart of the JM-14.0 encoder.

Fig. 6 顯示在參考軟體 JM-14.0 中再每一個 macroblock 運動估計模式的決定方法與視訊 壓縮編碼的 rate distortion 最佳化的流程。

main()

encode_one_frame()

frame_picture()

field_picture()

code_a_picture()

encode_one_slice()

encode_one_macroblock()

PartitionMotionSearch()

BlockMotionSearch() FastIntegerPelBlockMotionSearch()

FullPelBlockMotionSearch()

FastFullPelBlockMotionSearch()

SubPelBlockMotionSearch()

FastSubPelBlockMotionSearch()

(8)

7

Fig. 6 The flowchart of function “encode_one_macroblock”.

4.2 快速模式決定方法

在參考軟體 JM-14.02 中用全域搜尋處理(16×16, 8×8,…, 4×4)去決定估計模式,如此 會使編碼過程很沒有效率。在本計劃,我們所提出的快速模式決定方法,首先會先分析 空間與時間的關聯性,找出在空間和時間每一個 macroblock 估計模式的關聯性後,建構 快速模式決定的方法。

4.2.1 空間-時間模式關聯性

經由仔細的觀察在 JM-14.0 參考軟體裡模式決定過程,一個 macroblock 的運動估計 模式與上一張的參考 frame(多重參考 frame)中 macroblock 鄰近的相同位置的模式有很高 的相關性。在 Fig.7 中描述模式關聯性

(9)

8

Fig. 7 The mode correlation for a macroblock between adjacent frames.

在 P-frame #2 圖中所示的 macroblock,所採用之運動向量預估模式的機率會近似於在 P-frame #1 中以此 macroblock 位置為中心的鄰近 macroblock (在 Fig.7 P-frame #1 的編號 1~9) 所採用之運動向量預估模式。根據 JM 參考軟體,運動向量預估模式關聯性之分析 列在 Table 1。在這裡,我們分析運動向量預估模式:16×16, 16×8,8×16, 8×8 和 skip 模式 之模式關聯性。

Table 1. Probabilities for the mode of a macroblock on P-frame #2 is similar to the modes of the neighboring macroblocks centered at the same position on P-frame #1.

Sequences QP28 QP32 QP36 QP40 Akiyo 95.11% 96.02% 97.22% 98.26%

Container 93.35% 94.88% 96.40% 97.55%

Hall_Monitor 95.28% 96.62% 97.16% 97.51%

Moth&Daug 91.77% 93.59% 95.11% 96.42%

News 92.90% 93.63% 94.52% 95.73%

Salesman 94.63% 95.10% 96.00% 97.31%

Carphone 88.54% 90.16% 92.32% 94.40%

Coastgrd 86.05% 87.31% 89.17% 92.70%

Foreman 87.28% 88.29% 89.22% 90.90%

在 Table 1 中,九個長度 200 frame 的 video sequences 被使用在分析模式關聯性。此外,

量化的 step size 分別設定為 QP=28, 32, 36 和 40。對於用 QP=28 的 Foreman video sequence,macroblock 的估計模式的可能性是接近於前一張參考 frame 中鄰近的

macroblock 相同位置的中心附近的估計模式是 87.28%。從 Table 1 的分析結果中,觀察 到模式關聯性對於在兩個相鄰的 frame 的 macroblock 是很高的。另外,對於模式關聯性 的亮個額外的實驗線顯示在 Table 2 和 3 中。在 Table 2 和 3 中,skip 和 16×16 模式被當

(10)

9

程式同一類。Table 2 和 3 說明 macroblock 的估計模式相似於第一名和前二名分別在前 一張參考 frame 的鄰近 macroblock 之估計模式機率。

Table 2. Probability that the estimation mode of a macroblock is similar to the top one mode sorted from the neighboring macroblocks centered at the same position on the previous frame.

Table 3.

Proba bility

that the estima

tion mode of a macroblock is similar to the top two modes sorted from the neighboring macroblocks centered at the same position on the previous frame.

Sequences QP28 QP32 QP36 QP40 Akiyo 93.48% 95.74% 97.76% 98.94%

Container 93.08% 95.37% 97.30% 98.70%

Hall_Monitor 96.01% 96.48% 96.41% 97.22%

Moth&Daug 86.42% 92.06% 95.95% 97.85%

News 87.86% 90.41% 93.16% 95.51%

Salesman 91.85% 92.35% 95.19% 97.80%

Carphone 78.22% 84.90% 90.51% 94.81%

Coastgrd 73.61% 79.11% 86.36% 93.32%

Foreman 72.11% 77.30% 84.31% 89.66%

在 Table1,2 和 3 中觀察,我們發現到 macroblock 的運動估計模式與前一張參考 frame 的 鄰近 macroblock 位置具有很高的關聯性。根據以上的模式相關性分析,我們提出一個新 的快速模式決定的方法去改善在 H.264/AVC 編碼系統中模式決定處理的計算量。

4.2.2 使用空間-時間模式關聯性的快速 Intra/Inter 模式決定

對於每一個 GOP,我們使用 JM 參考軟體中之全域搜尋方法來決定第一個 P-frame 中每 一個 macroblock 所使用之運動向量預估模式。對於後面之 P-frame,我們會利用前畫面 已知運動向量預估模式預測每一個 macroblock 所使用之運動向量預估模式。快速模式決 定方法的演算法在下列作描述。

Sequences QP28 QP32 QP36 QP40 Akiyo 90.10% 93.78% 96.76% 98.57%

Container 89.18% 93.38% 96.46% 98.49%

Hall_Monitor 91.58% 92.65% 93.74% 95.60%

Moth&Daug 78.31% 87.71% 93.86% 97.30%

News 81.11% 85.39% 90.04% 93.76%

Salesman 85.52% 87.99% 92.64% 96.69%

Carphone 64.70% 76.14% 85.99% 92.74%

Coastgrd 53.23% 65.31% 78.79% 89.42%

Foreman 54.29% 63.22% 74.78% 84.00%

(11)

10

步驟 1. macroblock 追蹤

對每一個 macroblack 找出運動向量預測模式之統計直方圖,為了精準求出每一個 macroblack 之統計直方圖,我們需要找到這個 MB 在前一個 frame 的所在位置。相鄰兩 畫面同一個 MB 的位移關係可由前一個 frame MB 所在位置鄰近方塊之權重運動向量計算 之,如方程式(2)所示。Fig. 8 說明了此追蹤程序。

∑ ∑

= +

= +

=

=

= 1

1 1

1

) , ( )

, (

x i

x i

y j

y j

)/T j i (

y x

MV

m (2) 這裡 MV 是指預測運動向量,x 和 y 是指目前 frame 的 block 的座標,m(i, j)是在前一張 frame 的 block( i, j)的運動向量。Fig. 8 說明估計運動向量的方法。運動向量的精確估計 可能被計算利用權重的每一個 block 根據面積比率的 block 到 4×4block。舉個例,Table 4 說明顯示在 Fig. 8 中每一個 macroblock 內之 block 相對於 4×4 block 的面積比率。在 Eq.

(2)至中數值 T 是觀察到的所有權重 factors 的總和。然而,當 MV 的數值不是整數時,

我們選擇最接近的 macroblock 如 Fig. 9 所示,去計算模式的統計直方圖。

Fig. 8 Distribution of motion vectors for a macroblock on P-frame #2.

Table 4 The number of the available motion vectors in Fig. 8

No.1 No.2 No.3 No.4 No.5 No.6 No.7 No.8 No.9 T

16 0 4 8 16 0 0 0 0 44

Fig. 9 The prediction block from previous block.

Current prediction corresponding block Motion estimation block Preview block

Motion vector after calculating Eq. (2)

(12)

11

步驟 2 模式統計直方圖的計算

一但畫面中的每一個macroblock追蹤後,我們可以發現目前畫面(current frame)中追蹤過 的macroblock的位置如 Fig.10。每一個追蹤過的macroblock的模式統計直方圖,可以靠 目前畫面(current frame)追蹤過的macroblock位置為中心的鄰近macroblock的模式數量獲 得。而為了降低運算量,Fig. 1中所有的模式依照block的大小歸類成五個種類(列於Table 5),省略計算運算模式統計直方圖,我們用整理種類統計直方圖來加以替換。根據整理 出的種類統計直方圖,我們選擇在最高兩個種類的block形式,當作模式決策程序的候 補。

×

MB_16×16

P Frame #1 P Frame #2

Fig. 10 The mode histogram for each tracked macroblock (P-frame #2) may be obtained by calculating the number of each mode among the neighboring macroblocks centered at the position of the tracked macroblock on previous frame (P-frame #1).

Table 5 Five categories for the block mode classification.

Mode Category

1 SKIP / 16×16

2 16×8 / 8×16

3 8×8 4 8×4 / 4×8

5 4×4

步驟 3 漂移補償

為了預防在模式決策和運動向量預測程序時的產生的失真累積補償現象,當 macroblock Bij的 R-D cost 大於一開始定義的臨界值 Tij時,候選種類必須重新尋找。首先我們紀錄 包含於 JM 模式決策中(使用 full search),第一個 P-frame 中每一個 macroblock Bij的 R-D cost Cij。接著每一個 macroblock 的臨界值 Tij 設為αCij,對於連續 P-frames 每一個 macroblock 的 R-D cost 需跟 Tij作比較。假如 macroblock Bij的 R-D cost 大於 Tij,模式 決策程序將由以下規則重新尋找::

(13)

12

1. 用較小的 block 組成當成新的候選模式類別置換較大的 block 組成模式類別。但是新 的被選擇的模式類別不應該和已被挑選的模式類別一樣。

2. 如果候選模式類別不能更新成較小的 block size,換言之,候選模式類別被類別#4 和

#5 組成,那麼候選模式類別要停止更新。

3. 一旦決定了每一個 macroblock 的運動估計模式,分割系統和相對應的運動 向量會被 紀錄。

舉例來說,如果在 Fig.11 中的 P-frame#2 的 macroblock#2 的 R-D cost 大於 Fig.11 中的 P-frame#1 的 macroblock#1 的 R-D cost,那麼 P-frame#3 的 macroblock#3 的候選模式將 會被決定藉由以上的規則。

Fig. 11 The drift compensation process.

步驟 4 快速 Intra 預測

在 H.264/AVC 中,intra 預測模式決定是很複雜且非常耗時的。在此計劃有別於文獻[14],

我們除了考慮 interframe coding 也同時考慮 intraframe frame coding. 也就是較完整的研 究如何改善 H.264/AVC 的編碼效能。在這裡,每一個 GOP 內,JM 完全模式搜尋被應用 在第一個 P-frame 作全模式之搜尋,並且對於每一個 macroblock 的 intra 編碼所決定的模 式要被紀錄起來。在後繼的 P-frame 中被追蹤到的 macroblock 所可能採取的 Intra 預測 編碼模式,即可以參考前一 P-frame 所記錄的 Intra 預測編碼模式。本計劃所提出的模式 決定方法可應用於 intra 16×16 預測模式和 intra 4×4 預測模式兩者。在 JM 完全模式搜尋 方法,模式估計的數量大約是 592 = 4×(16×9+4)。然而,利用空間-時間預測系統,模式 決定的數量可以減少成 17=1×(16+1)。

步驟 5 模式紀錄

一旦在每一個 macroblock 所決定之 Inter/Intra 預測編碼模式,macroblock 分割圖,和相 對應的運動向量都需要記錄起來。

當我們想要在 P-frame 中編碼 macroblock,將會需要做兩個重要的步驟( intra 預測和 inter 預測)。之後每一個 R-D cost 的計算,我們將得到最好的預測模式。intra / intera 模式決 定方法利用空間-時間關聯性的 block diagram 說明在 Fig. 12。它有兩個部份去作這個演 算法,一個是快速 inter 預測模式和另一個是 intra 預測模式,兩者都被利用於降低預測

(14)

13

模式計算複雜度,所以效率可以被大幅提昇。

Fig. 12 The block diagram of fast Intra/Inter mode decision using spatial-temporal mode correlation.

五、結果與討論

5.1 針對固定 QP 參數的效率和 PSNR 的分析

在這個章節中。說明針對固定 QP 參數的效率和 PSNR 的分析。在 H.264/AVC 中 QP 參 數被固定為 28, 32,36,40 在這方面對以上作分析。利用 E q. (3)分析計算率和利用 E q. (4) 分析傳送速率。效率分析被執行經由計算保留的時間從我們提出的方法到 JM 全域搜尋 的方法而且說明在 Table 6。明顯的利用空間-時間關聯性的模式決定的所有解法可以降 低計算時間大約 70%對 9 段 video sequences。PSNR 的分析說明在 Table 7。快速模式決 定方法的平均 PSNR 降低大約 0.08 dB。bit-rate 分析說明在 Table 7。他顯示我們提出的 方法至增加大約 3.7%。總共的編碼 cost 降低計算時間大約 70%。一般而言,效率改善 的程度對於 high motion 的 video sequences (Carphone, Coastgrd, Foreman)會比 low motion (Akiyo, Container, Hall_Monitor, Moth&Daug)來的小。

(15)

14

% ] 100

[

] [

]

[ x

JM Time

proposed Time

JM T =Time

∆ (3)

% ] 100

[

] [ ]

[ x

proposed BitRate

JM BitRate proposed

BitRate

R= −

∆ (4)

Table 6 The motion estimation speed up analysis of proposed and Lien’s method.

Moiton

Estimation Video Clip Type 28 32 36 40

A

akiyo Proposed method 73.0% 73.7% 72.5% 71.2%

Lien’s method [14] 74.5% 73.1% 72.0% 71.2%

container Proposed method 73.7% 73.8% 73.6% 74.7%

Lien’s method [14] 73.1% 72.7% 73.7% 74.7%

hall monitor Proposed method 72.3% 72.4% 70.4% 71.4%

Lien’s method [14] 74.9% 73.4% 72.6% 71.1%

Moth&Daug Proposed method 71.1% 71.4% 71.1% 69.8%

Lien’s method [14] 71.3% 71.1% 71.0% 68.3%

B

news Proposed method 72.5% 71.0% 71.8% 72.4%

Lien’s method [14] 70.3% 68.7% 70.6% 71.7%

salesman Proposed method 72.2% 72.2% 71.1% 70.6%

Lien’s method [14] 72.5% 71.2% 70.2% 71.0%

C

carphone Proposed method 71.7% 70.4% 70.7% 70.5%

Lien’s method [14] 70.9% 70.6% 70.1% 70.7%

coastgrd Proposed method 71.5% 71.9% 72.2% 71.2%

Lien’s method [14] 70.8% 71.2% 71.6% 72.7%

foreman Proposed method 70.8% 70.1% 70.1% 70.1%

Lien’s method [14] 69.5% 70.3% 71.0% 69.8%

Table 7 The PSNR (dB) analysis of proposed and Lien’s method.

Y PSNR Video Clip Type 28 32 36 40

A

akiyo Proposed method -0.07 -0.12 -0.1 -0.07 Lien’s method [14] -0.07 -0.12 -0.1 -0.07 container Proposed method -0.08 -0.11 -0.11 -0.09 Lien’s method [14] -0.08 -0.11 -0.1 -0.09 hall monitor Proposed method -0.07 -0.09 -0.1 -0.08 Lien’s method [14] -0.05 -0.09 -0.09 -0.08

(16)

15

Moth&Daug Proposed method -0.06 -0.06 -0.05 -0.02 Lien’s method [14] -0.07 -0.06 -0.04 -0.01

B

news Proposed method -0.09 -0.1 -0.11 -0.09 Lien’s method [14] -0.08 -0.1 -0.1 -0.09 salesman Proposed method -0.07 -0.08 -0.06 -0.04 Lien’s method [14] -0.06 -0.07 -0.06 -0.04

C

carphone Proposed method -0.1 -0.14 -0.11 -0.13 Lien’s method [14] -0.1 -0.12 -0.09 -0.11 coastgrd Proposed method -0.02 -0.02 -0.05 -0.06 Lien’s method [14] -0.02 -0.02 -0.05 -0.06 foreman Proposed method -0.11 -0.15 -0.14 -0.1

Lien’s method [14] -0.1 -0.14 -0.12 -0.11 Table 8 The bit-rate analysis of proposed and Lien’s method.

Total

BitRate Video Clip Type 28 32 36 40

A

akiyo Proposed method 3.7% 0.8% 0.0% -0.2%

Lien’s method [14] 3.8% 0.8% 0.0% -0.2%

container Proposed method 3.8% 0.9% -0.3% -0.9%

Lien’s method [14] 3.5% 0.9% -0.1% -0.9%

hall monitor Proposed method 6.9% 6.3% 4.5% 3.0%

Lien’s method [14] 6.9% 6.2% 4.5% 2.7%

Moth&Daug Proposed method 5.1% 3.4% 1.7% 2.0%

Lien’s method [14] 4.8% 2.9% 1.7% 2.0%

B

news Proposed method 6.8% 5.5% 3.9% 2.3%

Lien’s method [14] 6.2% 4.7% 3.0% 1.8%

salesman Proposed method 6.5% 3.6% 1.4% 0.1%

Lien’s method [14] 6.4% 3.4% 1.4% 0.3%

C

carphone Proposed method 6.9% 4.1% 2.0% 1.1%

Lien’s method [14] 6.5% 4.0% 1.9% 1.0%

coastgrd Proposed method 7.7% 7.5% 4.8% 2.5%

Lien’s method [14] 7.7% 7.6% 4.7% 2.6%

foreman Proposed method 10.1% 7.3% 5.1% 3.5%

Lien’s method [14] 9.7% 6.8% 4.6% 2.7%

Table 9 The total encoding cost speed up analysis of proposed and Lien’s method.

(17)

16

Total

encoding Video Clip Type 28 32 36 40

A

akiyo Proposed method 74.3% 73.8% 73.4% 72.9%

Lien’s method [14] 40.7% 42.1% 43.7% 44.3%

container Proposed method 72.0% 72.3% 73.1% 73.5%

Lien’s method [14] 41.8% 42.9% 44.9% 46.4%

hall monitor Proposed method 73.6% 73.1% 72.4% 72.2%

Lien’s method [14] 39.6% 40.4% 42.4% 43.5%

Moth&Daug Proposed method 70.5% 70.5% 70.5% 70.3%

Lien’s method [14] 44.7% 45.7% 45.7% 44.3%

B

news Proposed method 72.0% 71.9% 71.8% 71.6%

Lien’s method [14] 41.1% 42.5% 44.2% 45.7%

salesman Proposed method 73.1% 72.6% 72.5% 71.9%

Lien’s method [14] 41.0% 44.0% 46.3% 46.8%

C

carphone Proposed method 67.6% 68.0% 68.3% 68.4%

Lien’s method [14] 45.7% 46.7% 47.1% 46.5%

coastgrd Proposed method 66.8% 67.3% 68.2% 68.8%

Lien’s method [14] 51.4% 52.1% 52.7% 52.7%

foreman Proposed method 66.5% 66.7% 66.8% 66.8%

Lien’s method [14] 48.4% 49.1% 50.1% 50.0%

5.2 The Rate-Distortion Analyses

在章節 4.2,rate-distortion 的分析針對 bit-rate 100K 到 2500K bit/sec 作說明。rate-distortion 的分析被執行在下列兩個環境設定:(1)所有的運動估計模式在 JM-14.0 中被利用,(2) 利用 Len 的方法。從 Fig. 13 到 Fig. 15,模擬結果顯示 PSNR 數值接近從 JM-14.0 參考 軟體獲得的最佳數值。

SNR vs. bit-rate for sequence-akiyo.qcif

40 42 44 46 48 50 52

100 200 300 400 500 600 700 800

Bit rate (kbit/s) @ 30.00 Hz

Proposed method Lien's method JM 14.0

SNR Y (dB)

(18)

17

Fig. 13 Rate-distortion curves for Akiyo video sequence obtained by JM-14.0, our proposed method, and Lien's method.

Fig. 14 Rate-distortion curves for Foreman video sequence obtained by JM-14.0, our proposed method, and Lien's method.

Fig. 15 Rate-distortion curves for News video sequence obtained by JM-14.0, our proposed method, and Lien's method.

(a)

(b)

SNR vs. bit-rate for sequence-news.qcif

36 38 40 42 44 46 48 50 52

100 200 300 400 500 600 700 800 900 1000 1500

Bit rate (kbit/s) @ 30.00 Hz

Proposed method Lien's method JM 14.0

SNR Y (dB)

SNR vs. bit-rate for sequence-foreman.qcif

32 37 42 47 52

100 200 300 400 500 600 700 800 900 1000 1500 2000 2500 Bit rate (kbit/s) @ 30.00 Hz

Proposed method Lien's method JM 14.0

SNR Y (dB)

SNR vs. bit-rate for sequence-akiyo.qcif

0 20 40 60 80 100

100 200 300 400 500 600 700 800

Bit rate (kbit/s) @ 30.00 Hz

Proposed method Lien's method JM 14.0

Total encoding time (Sec)

SNR vs. bit-rate for sequence-news.qcif

0 20 40 60 80 100 120

100 200 300 400 500 600 700 800 900 1000 1500

Bit rate (kbit/s) @ 30.00 Hz

Proposed method Lien's method JM 14.0

Total encoding time (Sec)

(19)

18 (c)

Fig. 16 The computation time of the total encoding cost for (a)Akiyo, (b)News and

(c)Foreman video sequences using the JM-14.0 reference software, our proposed method, and Lien's method.

我們可以從 Fig.16 看見,我們提出的所以模式覺得的解法對於壓縮效率可以接近大約 3 倍的改善。在最好 bit rate 上我們提出的方法還比”Lien 的方法”快。最後,我們可以發現 空間-時間關聯性不只是對運動估計有效也適合用於 P frame 的 intra 預測。運動估計和 intra 預測都有計算時間上的速度提昇。所有的 bit rate 也沒有增加太多,而且 PSNR 也 大多相同於” Lien 的方法 ”。

六、 參考文獻

[1] “Draft ITU-T recommendation and final draft international standard of joint video specification (ITU-T Rec. H.264/ISO/IEC 14486-10 AVC,” in Joint Video Team (JVT) of ISO/IEC MPEG and ITU-T VCEG, JVT-G050, March, 2003.

[2] Iain E. G. Richardson, H.264 and MPEG-4 video compression, John Wiley & Sons, 2003.

[3] ITU-T Recommendation H.263, “Video coding for low bit rate communication,” version 3, Nov. 2000.

[4] ISO/IEC 14496-2: “Information technology-coding of audiovisual objects-part 2: visual,”

Geneva, 2000.

[5] J. Ostermann, J. Bormans, P. List, D. Marpe, M. Narroschke, F. Pereira, T. Stockhammer, T. Wedi, “Video coding with H.264/AVC: tools, performance, and complexity,” IEEE

Circuits and Systems Magazine, vol. 4, no. 1, pp. 7 - 28, March, 2004.

[6] Joint Video Team (JVT) Reference software JM-14.0, May, 2008,

http://iphome.hhi.de/suehring/tml/

[7] X. Jing and L. P. Chau, “An efficient inter mode decision approach for H.264 video coding,” IEEE International Conference on Multimedia & Expo, ICME2004, Taipei, Taiwan, June 2004.

[8] D. Wu, S. Wu, K. P. Lim, Pan Feng, Z. G. Li, C. C. Ko, “Fast inter mode decision with adaptive thresholds for H.264 encoding,” Accepted by 8th International Symposium on Consumer Electronics (ISCE'2004), Reading, UK, 1-3 Sept. 2004.

[9] F. Pan, X. Lin, R. Susanto, K. P. Lim, Z. G. Li, G. N. Feng, D. J. Wu, and S. Wu, “Fast mode decision algorithm for intra prediction in JVT,” ISO/IEC JTC1/SC29/WG11 (JVT_G013) MPEG2003, Pattaya, Thailand, March, 2003

[10] D. Zhu, Q. Dai and R. Ding, “Fast inter prediction mode decision for H.264,” IEEE the

fifth International Conference on Multimedia and Exposition (ICME 2004), Taipei, June

SNR vs. bit-rate for sequence-foreman.qcif

20 40 60 80 100 120 140 160

100 200 300 400 500 600 700 800 900 1000 1500 2000 2500

Bit rate (kbit/s) @ 30.00 Hz Proposed method Lien's method JM 14.0

Total encoding time (Sec)

(20)

19

28, 2004.

[11] B. Meng, O.C. Au, “Fast intra-prediction mode selection for 4A blocks in H.264,” IEEE

International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2003),

vol. 3, pp. 389-92, April, 2003.

[12] C.-C. Cheng, T.-S. Chang, “Fast three step intra prediction algorithm for 4/spl times/4 blocks in H.264,” IEEE International Symposium on Circuits and Systems (ISCAS 2005), vol. 2, pp. 1509 - 1512, May, 2005.

[13] M.-C. Hwang, J.-K. Cho, J.-S. Kim, J.-H. Kim, S.-J. Ko, “Fast Intra Prediction Mode Selection Scheme Using Temporal Correlation in H.264,” IEEE International Region 10

Conference, pp. 1-5, Nov., 2005.

[14] C.-C. Lien, C.-P. Yu, “A Fast Mode Decision Method for H.264/AVC Using the Spatial-Temporal Prediction Scheme,” International Conference for Pattern Recognition (ICPR 2006), vol. 4, pp. 334 – 337, 2006

[15] P. Yin, A. Vetro, H. Sun, B. Liu, “Drift compensation for reduced spatial resolution transcoding,” IEEE Transactions on Circuits and Systems for Video Technology, vol. 12, no. 11, pp. 1009-1020, Nov. 2002.

[16] G. J. Sullivan, P. Topiwala, and A. Luthra, “The H.264/AVC advanced video coding standard: Overview and introduction to the fidelity range extensions,” SPIE Conference

on Applications of Digital Image Processing, Aug. 2004.

[17] H.264/AVC Part 10 Tutorials, “H.264 variable length coding,” Oct. 2002,

http://www.vcodex.com/h264.html

[18] G. Bjontegaard and K. Lillevold, “Context-adaptive VLC coding of coefficients,” Fairfax, VA, JVT-C028, May, 2002.

(21)

20

七、 附錄

部分成果已發表在

Cheng-Chang Lien, Chih-Chang Chen and Yang-Kai Chang, “Fast Intra/Inter Mode Decision for H.264/AVC Using the Spatial-Temporal Prediction Scheme,” IEEE Symposia and Workshops on Ubiquitous, Autonomic and Trusted Computing in conjunction with the UIC’09 and ATC’09 conferences, Brisbane Australia, July 7- 9, 2009, pp. 194-199. (EI)

(22)

21

(23)

22

(24)

23

(25)

24

(26)

25

(27)

國科會補助專題研究計畫項下出席國際學術會議心得報告

日期: 99 年 10 月 27 日

一、 參加會議經過

這 一 次 參 加 之 會 議 發 表 論 文 一 篇 , 題 目 為 People counting using multi-mode multi-target tracking scheme。論文主題為提出一項多模式目標物追蹤技術,並另用此 技術發展 front view 之人員計數技術。會議所報告之 SESSION 為

Session A01:Multimedia Signal Processing for Intelligent Applications

A01-01【IIH-MSP-2009-IS32-01】

People Counting Using Multi-Mode Multi-Target Tracking Scheme Cheng-Chang Lien, Ya-Lin Huang, and Chin-Chuan Han Chung Hua University, Taiwan, R.O.C.

A01-02【IIH-MSP-2009-IS32-02】

Human Behavior Description Model Based on Action Recognition Fang-Hsuan Cheng and Cheng-Yuan Chang

Chung Hua University, Taiwan, R.O.C.

A01-03【IIH-MSP-2009-IS32-03】

A New Feature Integration Approach and Its Application to 3D Model Retrieval Jau-Ling Shih, Chang-Hsing Lee, Chih-Hsun Chou, and Yu-Cheng Chang Chung Hua University, Taiwan, R.O.C.

A01-04【IIH-MSP-2009-IS32-04】

Modulation Spectral Analysis of Static and Transitional Information of Cepstral and Spectral Features for Music Genre Classification

Chang-Hsing Lee, Hwai-San Lin, Chih-Hsun Chou, and Jau-Ling Shih Chung Hua University, Taiwan, R.O.C.

A01-05【IIH-MSP-2009-IS32-05】

Face Image Super-Resolution Using Two-dimensional Locality Preserving Projection Yuan-Kai Wang and Cai-Ren Huang

Fu Jen University, Taiwan, R.O.C.

A01-06【IIH-MSP-2009-233】

計畫編號 NSC 98-2221-E-216 -034

計畫名稱 使用空間與時間關聯預測之 H.264/AVC 快速 Intra/Inter 模式決定系 統

出國人員

姓名 連振昌 服務機構

及職稱

中華大學資訊工程學系

會議時間

2009 年 9 月 12 日 至

2009 年 9 月 14 日

會議地點

日本 京都

會議名稱

(中文)IEEE 智慧訊息隱藏暨多媒體訊號處理國際會議

(英文) IEEE International Conference on Intelligent Information Hiding and Multimedia Signal Processing 2009 (IIH-MSP 2009) (EI)

發表論文 題目

(中文)使用多模式多目標物追蹤之人員計數系統

(英文) People counting using multi-mode multi-target tracking scheme

(28)

Random Number Generator Designed by the Divergence of Scaling Functions Jengnan Tzeng, I-Te Chen, and Jer-Min Tsai

National Chengchi University, Taiwan, R.O.C.

A01-07【IIH-MSP-2009-292】

A Provably Secure Two-Party Attribute-based Key Agreement Protocol Hao Wang, Qiuliang Xu, and Tao Ban

Shandong University, China.

A01-08【IIH-MSP-2009-317】

A Secure Steganography: Noisy Region Embedding Yifeng Lu, Xiaolong Li, and Bin Yang

Peking University, China.

於會議中也日本學者交換意見。IIHMSP 會議是由 IEEE 協會主辦,會議所發表之論 文也會被 EI 所索引,以增加論文之能見度。這一次 IIHMSP2009 會議之 Program 及參與會議之圖像記錄列表如下:

Sept. 11, 2009

Time Schedule Place

14:00--17:00

15:00--20:00 Registration Lobby of the sixth floor in MIELPARQUE, Kyoto Sept. 12, 2009

Time Pragram Place Notes

8:15--9:00 NULL NULL

Registration Lobby of the sixth floor in MIELPARQUE, Kyoto 9:00--9:15 Opening Conference Room A

9:15--10:15 Keynote speech Conference Room A 10:15--10:30 Coffee Break Conference Room A 10:30--12:30 Session

A01--A05 Conference Room A--E 14:00--16:00 Session

A06--A10 Conference Room A--E 16:00--16:20 Coffee Break Conference Room A 16:20--18:20 Session

A11--A15 Conference Room A--E 19:00--20:30 Receiption

Party the seventh floor in MIELPARQUE, Kyoto Sept. 13, 2009

Time Pragram Place Notes

8:15--9:00 NULL NULL

Registration Lobby of the sixth floor in MIELPARQUE, Kyoto 9:00--10:00 Keynote speech Conference Room A

10:00--10:20 Coffee Break Conference Room A 10:20--12:20 Session

B01--B05 Conference Room A--E 14:00--16:00 Session

B06--B10 Conference Room A--E 16:00--16:20 Coffee Break Conference Room A 16:20--18:20 Session

B11--B15 Conference Room A--E

19:00--21:00 Banquet Party Genji Ballroom of Hotel Granvia Kyoto (3F) Sept. 14, 2009

Time Pragram Place Notes

8:15--9:00 NULL NULL Registration

Lobby of the sixth floor 9:00--10:00 Keynote speech Conference Room A

(29)

10:00--10:20 Coffee Break Conference Room A in MIELPARQUE, Kyoto 10:20--12:20 Session D01 and C01--C03 Conference Room

A--D 14:00--16:00 Session C04--C06 Conference Room

B--D 16:00--16:20 Coffee Break Conference Room A 16:20--18:20 Session C07 and P01--P02 Conference Room

B--D

二、 與會心得

每一次國際會議都會發現許多新技術的發展與應用,以及了解多媒體領域發展的 新趨勢。因此研究要與國際接軌,參加國際學術研討會是必要的。

三、考察參觀活動(無是項活動者略) 無此項活動

四、建議 無

五、攜回資料名稱及內容

攜回資料為會議議程及論文光碟片。

六、其他

(30)

國科會補助計畫衍生研發成果推廣資料表

日期 2010年10月26日

國科會補助計畫

研發成果名稱

發明人 (創作人)

技術說明

技術移轉可行性及 預期效益 技術/產品應用範圍

產業別

計畫名稱:

計畫主持人:

計畫編號: 學門領域:

(中文)

(英文)

成果歸屬機構

(中文)

(英文)

使用空間與時間關聯預測之H.264/AVC快速Intra/Inter 模式決定系統 連振昌

98 -2221-E -216 -034 - 影像處理

“Fast Intra/Inter Mode Decision for H.264/AVC Using the Spatial- Temporal Prediction Scheme,” IEEE Symposia and Workshops on

Ubiquitous, Autonomic and Trusted Computing in conjunction with the UIC’09 and ATC’09 conferences“Fast Intra/Inter Mode Decision for H.264/AVC Using the Spatial- Temporal Prediction Scheme,” IEEE Symposia and Workshops on

Ubiquitous, Autonomic and Trusted Computing in conjunction with the UIC’09 and ATC’09 conferences

中華大學 連振昌,陳志昌

我們可以發現在JM-14.0參考軟體中,高複雜的Intra/Inter frame完整搜尋方 式造成編碼過程非常耗時。所以,許多的方法應運而生,如SAD、相同區塊的分 析、邊緣偵測等都是為了抉擇最佳的動態預估模式。然而,這些的運用都需要 在動態補償過程中,花費額外的時間與資源。在此計畫中,我們所發展之技術 不需要額外的影像處理,就可以達成的快速視訊壓縮編碼。本計劃構思利用當 前畫面和參考畫面間,分析Intra/Inter預測模式空間與時間的關聯性,找出在 空間和時間上,每一個macroblock預估模式的關聯性後,建構快速模式決定的 方法。而且,在模式處理過程中,採取漂移補償來避免誤差的累積。目前於實 驗數據中,可以發現總運算量的時間可以節省約百分之七十,傳輸率(bit rate)方面只增加百分之三點七,平均的PSNR大約只有損失0.08 dB。

The high computation cost of the full search method in the reference software JM-14.0 make the encoding process inefficient. Therefore, the methods of applying the SAD (sum of absolute difference), homogeneous region analysis, and edge detection are developed to determine the optimum motion estimation mode. However, the additional computation cost of the image processing will reduce the efficiency of the motion compensation process. In this paper, the spatial- temporal correlations between the current frame and the reference frame are analyzed to develop a fast mode decision method for Inter/Intra frame encoding in which no extra image processes are used. Furthermore, the concept of drift compensation is adopted to avoid the error accumulation phenomenon during the mode decision process. The experimental results show that the total computation 研究發展服務業

視訊壓縮相關產品

於視訊串流之技術移轉具可行性,預期效益在於大幅加速H.264壓縮速度。

註:本項研發成果若尚未申請專利,請勿揭露可申請專利之主要內容。

(31)
(32)

98 年度專題研究計畫研究成果彙整表

計畫主持人:連振昌 計畫編號:98-2221-E-216-034-

計畫名稱:使用空間與時間關聯預測之 H.264/AVC 快速 Intra/Inter 模式決定系統

量化

成果項目 實際已達成

數(被接受 或已發表)

預期總達成 數(含實際已 達成數)

本計畫實 際貢獻百

分比

單位

備 註 質 化 說 明:如 數 個 計 畫 共 同 成 果、成 果 列 為 該 期 刊 之 封 面 故 事 ...

期刊論文 0 0 100%

研究報告/技術報告 0 0 100%

研討會論文 0 0 100%

論文著作 篇

專書 0 0 100%

申請中件數 0 0 100%

專利 已獲得件數 0 0 100% 件

件數 0 0 100% 件

技術移轉

權利金 0 0 100% 千元

碩士生 2 2 100%

博士生 0 0 100%

博士後研究員 0 0 100%

國內

參與計畫人力

(本國籍)

專任助理 0 0 100%

人次

期刊論文 0 1 0% 準備投期刊中

研究報告/技術報告 0 0 100%

國外 論文著作

研討會論文 1 1 100%

'Fast

Intra/Inter Mode Decision for H.264/AVC Using the

Spatial-Temporal Prediction

Scheme,' IEEE Symposia and Workshops on Ubiquitous, Autonomic and Trusted

Computing in conjunction with the UIC'09 and ATC'09

conferences, Brisbane

Australia, July 7- 9, 2009, pp.

194-199. (EI)

(33)

專書 0 0 100% 章/本

申請中件數 0 0 100%

專利 已獲得件數 0 0 100% 件

件數 0 0 100% 件

技術移轉

權利金 0 0 100% 千元

碩士生 0 0 100%

博士生 0 0 100%

博士後研究員 0 0 100%

參與計畫人力

(外國籍)

專任助理 0 0 100%

人次

其他成果

(

無法以量化表達之成 果如辦理學術活動、獲 得獎項、重要國際合 作、研究成果國際影響 力及其他協助產業技 術發展之具體效益事 項等,請以文字敘述填 列。)

已發表 EI 研討會論文

Cheng-Chang Lien, Chih-Chang Chen and Yang-Kai Chang, 'Fast Intra/Inter Mode Decision for H.264/AVC Using the Spatial-Temporal Prediction Scheme,' IEEE Symposia and Workshops on Ubiquitous, Autonomic and Trusted Computing in conjunction with the UIC'09 and ATC'09 conferences, Brisbane Australia, July 7- 9, 2009, pp. 194-199. (EI)

成果項目 量化 名稱或內容性質簡述

測驗工具(含質性與量性) 0

課程/模組 0

電腦及網路系統或工具 0

教材 0

舉辦之活動/競賽 0

研討會/工作坊 0

電子報、網站 0

目 計畫成果推廣之參與(閱聽)人數 0

(34)
(35)

國科會補助專題研究計畫成果報告自評表

請就研究內容與原計畫相符程度、達成預期目標情況、研究成果之學術或應用價 值(簡要敘述成果所代表之意義、價值、影響或進一步發展之可能性) 、是否適 合在學術期刊發表或申請專利、主要發現或其他有關價值等,作一綜合評估。

1. 請就研究內容與原計畫相符程度、達成預期目標情況作一綜合評估

■達成目標

□未達成目標(請說明,以 100 字為限)

□實驗失敗

□因故實驗中斷

□其他原因 說明:

2. 研究成果在學術期刊發表或申請專利等情形:

論文:■已發表 □未發表之文稿 □撰寫中 □無 專利:□已獲得 □申請中 ■無

技轉:□已技轉 □洽談中 ■無 其他:(以 100 字為限)

3. 請依學術成就、技術創新、社會影響等方面,評估研究成果之學術或應用價 值(簡要敘述成果所代表之意義、價值、影響或進一步發展之可能性)(以 500 字為限)

H.264 視訊壓縮快速演算法的研究一直在各項串流應用上扮演極重要的目的,例如安全監 控之視訊流傳輸應用。本計劃,考慮在目前 frame 和參考 frame 之間的空間-時間的關聯 性去發展快速模式決定方法,他不需要額外的影像處理。此外,漂移補償的概念被採用去 避免在模式決定處理期間的誤差值累積現象。在 P-frame 中的 intra 預測模式也是用於這 種方法,而且我們可以根據這種架構去發展演算法。不需要有額外的計算,可以得到較好 的結果。實驗結果顯示總共的計算 cost 可以降低大約 70%而且平均的 PSNR 只掉下的大約 0.08dB。

參考文獻

相關文件

The major qualitative benefits identified include: (1) increase of the firms intellectual assets—during the process of organizational knowledge creation, all participants

This research is to integrate PID type fuzzy controller with the Dynamic Sliding Mode Control (DSMC) to make the system more robust to the dead-band as well as the hysteresis

This paper integrates the mechatronics such as: a balance with stylus probe, force actuator, LVT, LVDT, load cell, personal computer, as well as XYZ-stages into a contact-

This project integrates class storage, order batching and routing to do the best planning, and try to compare the performance of routing policy of the Particle Swarm

由於本計畫之主要目的在於依據 ITeS 傳遞模式建構 IPTV 之服務品質評估量表,並藉由決

As for current situation and characteristics of coastal area in Hisn-Chu City, the coefficients of every objective function are derived, and the objective functions of

Subsequently, the relationship study about quality management culture, quality consciousness, service behavior and two type performances (subjective performance and relative

Ogus, A.,2001, Regulatory Institutions and Structure, working paper No.4, Centre on Regulation and Competition, Institute for Development Policy and Management, University