行政院國家科學委員會專題研究計畫 成果報告
參與國際 MPEG 標準會議
研究成果報告(完整版)
計 畫 類 別 : 個別型 計 畫 編 號 : NSC 98-2219-E-009-015- 執 行 期 間 : 98 年 09 月 01 日至 99 年 07 月 31 日 執 行 單 位 : 國立交通大學電子工程學系及電子研究所 計 畫 主 持 人 : 杭學鳴 共 同 主 持 人 : 蔡淳仁、彭文孝、李國君 計畫參與人員: 碩士班研究生-兼任助理人員:游瑋玲 碩士班研究生-兼任助理人員:王澤瑋 碩士班研究生-兼任助理人員:吳崇豪 碩士班研究生-兼任助理人員:陳均富 博士班研究生-兼任助理人員:孫域晨 博士班研究生-兼任助理人員:陳&;#28175;紋 博士班研究生-兼任助理人員:林和源 博士班研究生-兼任助理人員:蔡家揚 報 告 附 件 : 出席國際會議研究心得報告及發表論文 處 理 方 式 : 本計畫可公開查詢中 華 民 國 99 年 10 月 28 日
行政院國家科學委員會補助專題研究計畫
■
成果報告 □期中進度報告參與國際
MPEG 標準會議
MPEG Standards Participation
計畫類別:□ 個別型計畫 ■ 整合型計畫
計畫編號:
NSC 98-2219-E-009 -015
執行期間:
98 年 9 月 1 日至 99 年 7 月 31 日
計畫主持人:杭學鳴
計畫共同主持人:
李國君
,
蔡淳仁
,
彭文孝
計畫參與人員:蔡家揚、陳渏紋、孫域晨、林和源、王澤瑋、吳崇豪、游
瑋玲、陳均富
成果報告類型(依經費核定清單規定繳交):□精簡報告 ■完整報告
本成果報告包括以下應繳交之附件:
■赴國外出差或研習心得報告一份
□赴大陸地區出差或研習心得報告一份
□出席國際學術會議心得報告及發表之論文各一份
□國際合作研究計畫國外研究報告書一份
處理方式:除產學合作研究計畫、提升產業技術及人才培育研究計畫、列
管計畫及下列情形者外,得立即公開查詢
□涉及專利或其他智慧財產權,□一年□二年後可公開查詢
執行單位:國立交通大學電子工程學系
中 華 民 國
99 年 10 月 27 日
(一) 中文摘要
本計畫目的在持續本團隊過去參加 MPEG 標準的活動,繼續參加 MPEG 及 ITU 多媒體標準
會議。本團隊參與了2010 年 4 月由 MPEG 與 ITU VCEG 共同舉辦之高效能視訊壓縮徵求提
案競賽,主觀測試結果在參賽 27 組隊伍中獲得總成績第 12 名。其中,我們提出了參數化交
疊區塊動作補償演算法以提升壓縮效率。由於此演算法具有容易與任意形狀之動作區塊結合
的特性,因此,目前此技術亦成為「技術實驗 3:畫面間預測技術」的重點討論對象之一。
另一方面,我們持續參與Reconfigurable Video Coding (RVC)的標準制定,除了將我們的想法
提案至標準會議,亦經由參與MPEG 會議得到了許多相關資訊,進而發展出了可重組態架構
的設計方式。利用CAL 語言去幫助建立 dataflow model,來幫助在演算法階層萃取出架構設
計的參數,達到演算法計架構共同設計。此外,在3DVC 方面,追跡目前的發展動態,對現
在的狀態有著充分的了解,進而參與未來制定 3DVC。希望實地參與標準會議可了解國際標
準制定與領先國之多媒體技術,幫助國內產業直接跟領先國在技術與產品研發上接軌,並將
我們開發之技術推展到國際舞台。在計畫執行期間共參與三次國際MPEG 標準會與一次美國
MPEG 標準會。
關鍵詞: MPEG 標準會議、ITU 視訊標準、高效能視訊壓縮、Reconfigurable Video Coding、
立體視訊壓縮標準
(二) 英文摘要
The objective of this project is to participate in the international MPEG standard meetings and to propose our technologies to the MPEG and ITU multimedia standards. In response to the HEVC Call for Proposals issued jointly by MPEG and VCEG in April, 2010, the NCTU group submitted a proposal for the standard competition. Our proposal features a parametric overlapped block motion compensation (POBMC) scheme, which enables a pixel-adaptive temporal prediction on irregular motion sampling grids. Together with other promising coding tools in the current KTA software, it was ranked 12 overall (and 10 with Low Delay Settings) among 27 proposals, in terms of the average mean opinion score. With its promising results and compatibility with existing tool features, POBMC is now being evaluated in several formal tool experiments. In this contest, NCTU is one of the only two universities worldwide which completed all the test cases. The NCKU team continues their active participation in the Reconfigurable Video Coding (RVC) activity. In addition to the contributions to the standard, we were hinted by the RVC idea and designed the reconfigurable architecture. The CAL language helps us to construct the dataflow model. Hence, the architecture parameters can be extracted at the algorithmic level. Subsequently, the design methodology of algorithm/architecture co-exploration can be achieved. As another work item, we traced the current status of 3DVC for participating in the standardization of the 3DVC standard. Attending standards meeting can acquire the first-hand information on the development of standard technology, knowing the progress of the world technology-leading institutes. In addition, we promote our own technology to the outside world. In 2009 to 2010, we participated in three MPEG standards
Keywords: MPEG Standard Meeting, ITU Video Standard, High Efficiency Video Coding,
(三) 計畫背景與目的
本計劃的主要目的為參與Moving Pictures Expert Groups (MPEG)及 ITU-T Video Coding Experts Group (VCEG)目前最新進展之高效能視訊壓縮標準(High Efficiency Video Coding, HVC)以及立體視訊壓縮標準(3D Video Coding)開發。其具體目標之一為參與 2010 年的 HEVC Call-for-Proposal 和 3D Video Coding 的 Exploration Experiments 活動,並將關注後續技
術發展。其次是參與正在籌備中的 3D Video Coding 標準制定,預期 2011 年初將正式展開 Call-for-Proposal。我們期望藉由參與標準會議能夠取得第一手資料,使得我們在 MPEG 及 ITU 標準相關之技術,可與世界級的組織完全且直接地接軌。同時讓國內的學界與廠商獲知 標準會中最新的發展狀況,幫助國內產業直接跟領先國在技術與產品研發上取得同等地位。 隨著影像擷取與顯示的技術躍進,越來越多的高畫質(High-definition, HD)1視訊逐漸在各 式各樣的多媒體應用環境流通。現今的網路技術在傳遞大量高畫質視訊上已顯窘迫。儘管此 一現況將因傳送技術的進展而逐漸獲得改善,然而下一代超高畫質(Ultra High-definition, UHD)2視訊的出現也意味著位元率增加的速度將超過現有網路頻寬改善技術所及。此外高畫 質視訊在行動多媒體應用上也趨向普及:越來越多的多媒體行動裝置如新一代手機,PDA, 數位相機等已逐步朝向高畫質邁進。再者,因為 3D 顯示器技術的逐漸成熟,3D 視訊在娛 樂、廣告、資訊、自然觀察、藝術以及資料保存建檔等領域中,展現了豐富的應用可能性並 能夠有效地提升人類視覺之真實感受,所以 3D 立體視訊技術之需求也隨之提高。各方面的 證據皆顯示針對高解析度視訊進行壓縮設計以及開發 3D 立體視訊處理及編碼的相關技術確 有其必要性與迫切性。 MPEG 及 VCEG 標準組織在過去幾年透過各種不同的實驗得知現今最為人所熟知的 H.264/AVC 在壓縮高畫質或超高畫質視訊上有其改善空間。兩大組織皆在今年不約而同宣告 發展High-Performance Video Coding (VCEG 計畫名稱為 Next-Generation Video Coding)標準。 其中MPEG 國際標準制定委員會從 2007 年起陸續舉辦多次的 Future Video Workshop 商討視 訊壓縮未來發展,在2009 年 4 月確立了 HVC 發展目標並成立一 Ad Hoc Group,同時於 7 月 倫敦會議中完成HVC Call for Evidence (CfE)競賽。此次競賽共有 11 件貢獻案,參與者包含 了 3 間大學 (Leibniz Universität Hannover, Germany; RWTH Aachen University, Germany; Zhejiang University, China)與 5 家國際知名廠商(LG; Samsung; TOSHIBA; Mitsubishi; NEC),
足見 HVC 在產學界受重視之程度。目前最新技術已顯示超越 H.264/AVC 達 30%的效能改
善,確立了HVC 標準之可行性。此外 VCEG 也早已在 2005 年起著手開始積極蒐集創新的視
訊編碼演算法,並已實現相關方法於Key Technology Area (KTA)軟體(其效能亦與 MPEG CfE 的結果雷同)。
ISO/MPEG 及 ITU/VCEG 兩大組織在今年(2010)合作設立 Joint Collaborative Team on Video
1常見高畫質視訊其解析度(Resolution)與畫率(Frame Rate)包含以下幾種格式:1280x720p@30Hz,
Coding (JCT-VC),共同宣告發展 High Efficiency Video Coding (HEVC)標準,2010 年 4 月進 行 Call-for-Proposal (CfP)的競賽。依據不同的視訊壓縮應用,分為 Random Access 與 Low Delay 兩組測試設定。Random Access 設定要求解壓縮時的 GOP 結構延遲不可大過 8 張畫面,
以及任意讀取畫面的等待時間不可超過 1.1 秒,而 Low Delay 設定則要求畫面解壓縮順序與
播放順序必須一致。測試資料的解析度包含了極大的範圍,共分為五個層級 (Class A ~ Class E),其中最小的為 Class D 的 416x240 解析度,到最大為 Class A 的 2560x1600 解析度,顯示
出 JCT-VC 對此競賽的高度重視。本團隊由彭教授提案參與,與來自世界各國企業的研發單
位與各國的研究學術單位共 27 件提案一起競賽。其中,完全出自學術單位的提案只有我們
與徳國 Aachen University 兩件。台灣除了我們之外,只有聯發科技(MediaTek)提案參加。由
競賽共 27 件提案的數目來看,這些數字亦可顯示業界對此標準的重視。以下針對我們的提 案在本次HEVC CfP 的貢獻條列詳述如下: – 主觀測試結果獲得總成績第12 名,並且在 Low Delay 設定部分中取得第 10 名的成 績(在本次競賽獲取前 10 名者皆被考慮為重要的提案), – 在Random Access 設定的 65 個測資中,12 個測資獲得前 10 名的成績, – 在Low Delay 設定的 80 個測資中,2 個測資獲得第 1 名的成績,15 個測資獲得前 5 名的成績,38 個測資獲得前 10 名的成績。 HEVC CfP 競賽結束後,預計兩年內密集開會提案改進,整合標準參與者的群體智慧,制 定下一世代超高畫質視訊的標準。現在會議中國際知名的多媒體相關產業多有專家與會(例 如有Samsung、Qualcomm、Intel…等),約有 200 人。從 2010 年 4 月在德國德勒斯登(Dresden) 的第一次會議開始,到 2010 年 10 月的中國廣州會議,所有提案單位皆積極發表貢獻案及參 與討論,從第一次開會的50 件貢獻案,第二次的 127 件貢獻案,到最近一次開會多達 317 件 的貢獻案,由數量以及數字上的遞增可以再次看出業界對此標準的重視程度。其中本團隊貢 獻了 5 篇貢獻案,不僅提出了新的 Inter Prediction 視訊壓縮技術參數化交疊區塊動作補償
(Parametric Overlapped Block Motion Compensation,POBMC)演算法,更結合了樣板比對預測 方法(Template Matching Prediction,TMP),以達到更有效率的壓縮,此外還參與了「Tool Experiment 3: Inter Prediction in HEVC」的實驗,此實驗之主要目的為改善動作補償(Motion Compensation)的效率與發掘更有效率的區塊分割方式,此實驗的結果在 HEVC 標準開發中佔
有舉足輕重的地位。其中我們所提出之POBMC 與 TMP 結合演算法亦納入此實驗討論對象之
一。
此外,MPEG 針對 3D Video Coding 標準也已經設立一 Ad Hoc Group,目前正在執行探索 實驗(Exploration Experiments),這個探索實驗的目的在於發展一個適合的參照技術(reference technique)及相對應的原碼(source codes)提供 MPEG 成員使用以利發展一個新的 3D 視訊專 案。此參照技術的功能是為了編碼及重建原始3D 視訊並進而產生虛擬視點(virtual viewpoint)
以提供3D 顯示器播放。而探索實驗包含了四個主要方向:深度預測、圖像合成、3D 視訊格
2010 年 4 月在德國德勒斯登舉辦的 MPEG 會議,針對 3DVC 的部分提出了 Draft Call for Proposals on 3D Video Coding Technology,其內容主要是依據在前幾次的 MPEG 會議中所做
的探索實驗所訂定而出的,並且2010 年 7 月在瑞士日內瓦的會議中,針對了 CfP 的草案做更
完整地討論,內容包含了新興的3DVC 所要 encoding 的畫面數,以及是否要與 MPEG-4 中的
Multi-view Vidoe Coding 作向下相容。並且從之前的探索實驗去找到適合的參照技術,包含畫
面合成以及深度估測,另外更發展出多組在不同解析度之下之視訊序列對照組。參與 3DVC
的公司或研究單位有Philips,GIST,Nagoya University,以及 HHI 等,這些組織在國際上的 技術發展上都頗為知名。3DVC 在 2010 年 10 月的 MPEG 會議繼續修改 CfP,預計在下次會 議(明年初)可以完成,開始在 3DVC 上提案競爭。
在 Reconfigurable Video Coding (RVC)方面,RVC 標準中提出了利用 CAL 語言建立 dataflow model 的方式,因為此語言提供了利用資料傳遞的事件發生與否,來模擬演算法中資
料的流動,因此透過CAL 建立的 dataflow model 可以有效地幫助在演算法的的階層去對硬體
架構的資訊加以萃取。而 RVC 想要達成的目的是透過組合不同的基本 function units 以及
management units 來達到實現不同 standard,所以在驗證各基本元件完整性及正確性是相當重
要的一環。且RVC 在規劃時,不只是想要包含過去以往的標準,而是有著豐富彈性可以相容
未來新興的標準。而目前對 RVC 的貢獻案,主要是對現在所既有的 function units 以及
management units 去做 conformance testing,所以從 RVC 的團隊分配各組織要負責 conformance testing 的部分後,就即刻著手所負責的部分,目前雖然 RVC 還不能完整支援 H.264 中的所 有 profile 以及 level,但已經開始逐步地完成。我們團隊主要在建構 conformance testing 的 functional units 以及 management units,在 RVC 中佔有重要地位。
MPEG 標準會議每年約有四次會議,每次會議天數約五至七天。會議舉辦地點則是遍佈 世界各地。通常於前一年公告次年之會議排程與地點。此外,身為美國標準組織成員,我們
美年尚須參加約一至二次美國的MPEG 標準會議。參與 MPEG 國際會議之具體成果在下節分
(四) 具體工作績效
針對下一代的視訊編碼標準,我們進行了以下幾項技術的開發,有些技術已提出為標準
提案,亦同時有部分研究成果已發表到國際期刊與研討會上,共有3 篇期刊論文與 8 篇
國際研討會論文,在國際研討會發表時獲得良好回響。我們參與國際標準制定,一方面 瞭解國際技術開發方向與層級;另一方面也推廣我們技術於國際舞台。HEVC 標準包括 數個新工具(Tool),其中重要項目之一為 Inter Prediction。我們開發的參數化交疊區塊 動作補償(Parametric Overlapped Block Motion Compensation,POBMC)技術參與了「Tool Experiment 3: Inter Prediction in HEVC」的實驗,此實驗的結果在 HEVC 標準開發中佔
有舉足輕重的地位。因此我們的技術有機會成為未來 HEVC 國際標準的一部分。在計
畫執行期間共參與三次國際 MPEG/ITU 標準會與一次美國 MPEG 標準會。並在計畫執
行期間總計有 11 件貢獻文件(Contributions/Documents)。4 份出國心得報告,請參閱附 件。
(1) 利用 Excitation-based 的 Linear Predictive Coding 技術設計新的 Intra frame 編碼 法。目前主流的 Intra frame 編碼法是利用影像的畫素在二維畫面中延著某一個方向, 通常會有單純的連續性變化。因此預測編碼法可以利用這個特性建置模型。然而,在複 雜而且色彩變化豐富的情況下,這些簡單的預測模型往往不能得到好的結果。而且,如 果影像本身有雜訊(如數位化的舊電影),也會影響到預測編碼的效能。我們開發的方 法是針對傳統二維預測編碼法做不好的部份,利用一維的 Excitation-based Linear Predictive Coding 方式來進行預測編碼法。這個方法所獲得的預測結果,畫質可以比二 維預測法所得到的 PSNR 好超過 6dB,不過目前在模型參數及預測誤差(residual)的 部份,我們還在研究要如何進行最佳的熵編碼法。 (2) 已經有實驗結果展示,如果我們在 decoder-side 作移動量補償的動作,我們可以透過 降低 motion vector 的資料量,雖然 residual errors 會因而上昇一些,但整體而言還是 可以提昇編碼效率。進一步,我們的研究發現,如果我們在 encoder 跟 decoder 同時進 行motion estimation 時,是針對 true motion 而非導致最小 residual errors 的 motion vectors 來進行估測,那麼,我們不只可以降低 motion vector 的傳輸資料量,也有可以同時降
低residual errors,因此可以進一步提昇編碼效率。目前這想法的初期成果已經發表國際
研討會論文一篇。
(3) 我們以新的觀點重新解讀動作補償預測(Motion-compensated Prediction,MCP)機制的運 作,將MCP 的結構視為動作場(motion field)取樣及亮度場(intensity field)重建兩個部份, 在此觀點下我們提出了參數化交疊區塊動作補償(Parametric Overlapped Block Motion Compensation,POBMC)的技術來加強 MCP 的效率。傳統的區塊動作補償(OBMC)是用 來解決區塊動作補償(BMC)所具有之動作不確定性(Motion Uncertainty)的問題,藉由考 慮鄰近區塊動作估測(Block Motion Estimation,BME)的結果,來做亮度的 LMMSE 估
測。OBMC 已被證實能夠提供較 BMC 為佳的編碼效率。然而在 H.264/AVC 採用了可變
區塊大小動作補償(VBSMC)的技術下,OBMC 與 VSBMC 的結合,變成了一大挑戰。
Vector)近似為區塊中心點動作向量的假設,提出了 POBMC 技術。此技術根據每個像素 點各自所有的鄰近動作向量以及此像素點到各動作向量對應的區塊中心點距離,來分配
最佳的權重以達到最佳的MCP 效能。
(4) 樣板比對預測(Template Matching Prediction,TMP)經實驗證明所帶來的壓縮效率極 高,此技術是利用在解碼端根據解壓縮後的亮度資料做動作估測所得到的動作向量來取 代SKIP mode 的動作向量。我們透過 MCP 全新觀點的解讀,發現 TMP 所得到的動作向 量可以被視為樣板中心點的 true motion。透過理論分析板比對預測,本團隊提出將 POBMC 與 TMP 結合的技術,結合解碼端 TMP 所提供之無傳輸負擔的動作向量,以達 到更好的MCP 效能。 (5) 在 MCP 新觀點的解讀下,我們發現多數文獻僅著墨於亮度場重建的部分,甚少提及動 作場取樣效率的影響。然而直觀上動作場取樣的效率將會為後端亮度場重建的結果帶來 不小的影響。因此在分析過H.264/AVC VBSME 取樣效率後,發現 NxN/2 區塊大小的 取樣效率尚有改善空間,因此我們提出一新動作場取樣之技術,由加強前端取樣效率的 方式從而提升MCP 的整體效率。 (6) 鑒於 HEVC 標準發展在即,我們亦提出一綜觀性質的國際研討會論文來描述此新標準 的發展現況。 (7) 針對目前 MPEG 中的 3DVC 的相關資訊,發表了對於現今 3D 的系統探討,以及未來 可能的發展方向,內容談到了3D 視訊的來源、視訊播放器的探討的相關文章,而目前 力於將2D 視訊轉換至 3D 視訊以提供更多的 3D 視訊內容。 (8) 在之前就致力於演算法際架構共同設計的李國君教授,發現在 RVC 之中用 CAL 來建
立演算法的data flow model 是一個有效且可以帶給很大回饋的方式,因為在 CAL 中,
各模組接的溝通是透過data 的傳遞,這種方法較趨近於未來真正在硬體實現時的行為, 所以透過這樣的方式,可以在較前早的設計階層就得知道淺在的硬體架構的特性,有效 地幫助架構設計。 (9) RVC 中所提出的理念就是想透過不同的基本 coding tool 來去實現較為複雜的標準,所 以就必須去對不同標準之間作共通性的萃取,使得在細分基本coding tool 時可以找到最 佳基本單元,使其可以節省最多的coding tool 的使用。這個概念幫助了我們發展出可重 組態支架構設計。 (10) 目前也透過數據證明,可重組態架構設計所耗費的硬體資源的確會少於非重組態架 構,但所能夠達到的功能性卻是一樣的。也就是說,可重組態架構的確是較優於一般的 架構設計的。 除了積極參與視訊標準制定之外,本團隊亦於各知名國際研討會舉辦相關的學術活動, 以下列舉各舉辦學術會議之相關資訊。
(1) ICME 2010 Special Session on Emerging Techniques for High-quality Video Coding
(2) APSIPA ASC 2010 Special Session on High-Efficiency Video Coding (HEVC)
蔡教授及彭教授與韓國Gwangju Institute of Science and Technology (GIST)在國際研討會 APSIPA ASC 2010 攜手合作,透過舉辦 HEVC 的 Special Session 積極提升 HEVC 標準 開發的曝光度。其中,CfP 競賽名列前茅的 Samsung 亦在此 Special Session 投稿論文。 (3) VCIP 2011 主辦權
VCIP 2011 為 VCIP 由原本所屬之 Society of Photo-Optical Instrumentation Engineers (SPIE) 轉到Institute of Electrical and Electronics Engineers (IEEE)後的第一次開會,本團隊順利 的在此重大變遷階段,合作爭取到了VCIP 2011 的主辦權。General Co-Chair 為日本名 古屋大學Tanimoto 教授、杭教授及成大楊家輝教授,Technical Co-Chair 為李教授與彭
教授,其中HEVC 與 3DVC 皆被列為此次會議的重點項目之一。
(4) 第 21 屆超大型積體電路設計暨計算機輔助設計技術研討會之 3D Fourm
在台灣的第21 屆 VLSI/CAD 會議中,舉辦了 3D Forum,其中更邀請了普林斯頓大學的
貢三元教授與成功大學楊家輝教授一同來探討3D video 壓縮技 術的未來展望,使台灣
可以跟進世界的標準。
(5) Participation in Audio and Video coding Standard working group (AVS)
在大陸的視訊壓縮標準會議之中,我們提供3D 視訊的測試影片,作為未來大陸在發展
3D 視訊壓縮時的一個對照組。(由中華電信提供器材並且協助拍攝)。
(五) 未來工作構想
在HEVC 部份,由於 HEVC 標準預定於 2011 年 10 月完成 final draft,因此未來具體目標為: (1) 持續參與 2010/2011 年之 HEVC 的標準制定工作
(2) 提出新的視訊編碼壓縮技術 (3) 參與 Core Experiment
(4) 發表 HEVC 相關論文
(5) 分析 HEVC Test Model 的結構
在3DVC 部份,由於 3DVC 標準於 2011 年 1 月開始公開地徵求提案(Call for proposal),因此 具體目標為:
(1) 持續參與 2010/2011 年之 3DVC 標準制定工作 (2) 參與 3DVC 的壓縮競賽
(3) 發表 3DTV 或 3DVC 相關論文
(4) 分析 3DVC 中深度估測以及畫面合成的部分,以改進目前致力於的 2D 視訊轉 3D 視訊之 演算法。
(六) 計畫成果自評
本計畫有以下幾類成果。第一類為開發出參數化交疊區塊動作補償(Parametric Overlapped Block Motion Compensation,POBMC)、基於 Linear Predictive Coding 的 Intra frame 編碼法、 可重組態架構(Reconfigurable Architecture)等技術及實驗成果。這些成果多與國際 MPEGITU 標準及業界產品相關,極具實用價值,可促進國內工業技術研發。第二類為在計畫執行期間 共參與三次國際 MPEG/ITU 標準會與一次美國 MPEG 標準會,總計有 11 件貢獻文件 (Contributions/Documents)。第三類為計畫執行過程所獲得之研究成果論文,已發表於(含接受) 國內外學術會議及國外期刊,共有 3 篇期刊論文與 8 篇國際研討會論文。此外,參與計畫之 同學可獲得國際多媒體最先進的MPEG/ITU 相關技術及多媒體系統及架構設計經驗,畢業後 進入產業,直接有助於產業界開發新產品,提昇我國工業技術能力,達到人才培育之目的。 綜合評估:本計畫產出相當多具有學術與應用價值的成果,特別是直接參與國際標準會 議,在國際上展示成果。並培育視訊壓縮領域及架構設計領域高科技人才,計博士兩人(蔡家 揚、林和源)、碩士三人(王澤瑋、游瑋玲、陳均富),整體成效可稱良好。
(七)
Publications (含前一年相關研究計畫發表)
Journal Papers:1. C.-Y. Tsai and H.-M. Hang, “One-sidedρ-GGD source modeling and rate-distortion optimization in scalable wavelet video coder,” IEEE Trans. Circuits Syst. Video Technol., accepted, 2010.
2. Y.-W. Chen and W.-H. Peng, “A parametric OBMC scheme for pixel- adaptive temporal prediction on irregular motion sampling grids,” IEEE Trans. Circuits Syst. Video Technol., submission, 2010.
3. G.-G. (Chris) Lee, Y.-K. Chen, M. Mattavelli, and E. S. Jang, “Algorithm/ Architecture Co-Exploration of Visual Computing on Emergent Platforms: Overview and Future Prospects,” IEEE Trans. Circuits Syst. Video Technol., vol.19, no. 11, pp. 1576-1587, Nov. 2009.
Conference Papers:
1. H.-M. Hang, W.-H. Peng, C.-H. Chan and C.-C. Chen, “Towards the Next Video Standard: High Efficiency Video Coding,” Asia-Pacific Signal and Information Processing
Association (APSIPA) Annual Summit and Conference 2010, December 14 -17, 2010,
Singapore.
2. Y.-W. Chen, C.-L. Lee and W.-H. Peng, “Parametric Overlapped Block Motion Compensation for Pixel-Adaptive Temporal Prediction,” Asia-Pacific Signal and
Information Processing Association (APSIPA) Annual Summit and Conference 2010,
December 14 -17, 2010, Singapore.
3. Y.-C. Tseng, C.-H. Wu, Y.-W. Chen, T.-W. Wang and W.-H. Peng, “On the Analysis and Design of Motion Sampling Structure for Advanced Motion-Compensated Prediction,”
IEEE Int’l Conf. on Image Processing, 2010.
4. T.-W. Wang, Y.-W. Chen and W.-H. Peng, “Analysis of Template Matching Prediction and Its Application to Parametric Overlapped Block Motion Compensation, ” IEEE Int’l
Symposium on Circuits and Systems, 2010.
5. Y.-W. Chen, T.-W. Wang, Y.-C. Tseng, W.H. Peng, and S.-Y. Lee, “A Parametric Window Design for Overlapped Block Motion Compensation with Variable Block-size Motion Estimates,” IEEE Int’l Workshop on Multimedia Signal Processing, 2009.
6. Y. Chin and C.-J. Tsai, “Bayesian Dense Motion Field Estimation with Landmark Constraint,” IEEE Int’l Conf. on Image Processing, 2010.
7. J. Gorin, M. Raulet, Y.-L. Cheng, H.-Y. Lin, N. Siret, K. Sugimoto and G.-G. Lee, “An RVC Dataflow Description of the AVC Constrained Baseline Profile Decoder,” IEEE Int’l
Conf. on Image Processing, 2009
8. G.-G. Lee, W.-C. Yang, M.-S. Wu, and H.-Y. Lin, “Reconfigurable Architecture Design of Motion Compensation for Multi-Standard Video Coding,” IEEE Int’l Symposium on
附錄
A 參與標準會議之提案與編撰文件(MPEG/ITU documents) 2009.10 -2010.7
1. G.-G. (Chris) Lee, C. Lucarz, and H.-Y. Lin, “Study Text of ISO/IEC 23002-4/FPDAM 1 Video Tool Library Conformance and Reference Software,” 93rd MPEG meeting input contribution, N11470, Geneva, CH, July 2010.2. A. Krutz, T. Sikora, A. Glantz, S. Park, J. Lim, E. Francois, P. Chen, X. Zheng, H. Yu, S. Paschalakis,N. Sprljan, S. Li, A. Tabatabai, T. Suzuki,T. Chujoh, W.-H. Peng, “Tool Experiment 3: Inter Prediction in HEVC,” ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 2nd meeting, JCTVC-B303, Geneva, CH, July 2010.
3. Y.-W. Chen, C.-H. Wu, C.-L. Lee, T.-W. Wang, W.-H. Peng, “MB Mode with Joint Application of Template and Block Motion Compensations,” ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 2nd meeting, JCTVC-B072, Geneva, CH, July 2010.
4. G.-G. Lee, H.-Y. Lin, J.-W. Liang, C.-F. Chen, “Conformance testing and debugging report for intra prediction management FUs of AVC Constrained Baseline Profile,” 92nd MPEG meeting input contribution, M17622, April 2010, Dresden, Germany
5. A. Krutz, A. Glantz, T. Sikora, J. Park, S. Park, E. Francois, P. Yin, P. Chen, X. Zheng, H. Yu, W.-J. Han, W.-H. Peng, “Tool Experiment 3: Inter Prediction in HEVC,” ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 1st meeting, JCTVC-A303, Dresden, DE, April 2010.
6. Y.-W. Chen, T.-W. Wang, C.-H. Chan, C.-L. Lee, C.-H. Wu, Y.-C. Tseng, W.-H. Peng, C.-J. Tsai, H.-M. Hang, “Description of video coding technology proposal by NCTU,” ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 1st meeting, JCTVC-A123, Dresden, DE, April 2010.
7. G.-G. Lee, H.-Y. Lin, T. Y. Huang, J.-W. Liang, “RVC Conformance testing for IQ/IDCT and intra prediction of MPEG-4 AVC,” 91st MPEG meeting input contribution, M17325, January 2010, Kyoto, Japan
8. G.-G. (Chris) Lee, C. Lucarz, and H.-Y. Lin, “Study Text of ISO/IEC 23002-4/FPDAM 1 Video Tool Library Conformance and Reference Software,” 91st MPEG meeting input contribution, N11092, January 2010, Kyoto, Japan
9. G.-G. (Chris) Lee, C. Lucarz, and H.-Y. Lin, “Study of ISO/IEC 23002-4/FPDAM 1 Video Tool Library Conformance and Reference Software,” 90th MPEG meeting input contribution, N10921, Xian, China, Oct. 2009.
10. C.-J. Tsai, S.-Y. Tseng, “Consolidation of Video Syntax and Entropy Coders through HVC Standard,” ISO/IEC JTC, 90th MPEG meeting input contribution, M16887, Xian, China, Oct. 2009.
11. G.-G. Lee, H.-Y. Lin, J.-W. Liang, M.-S. Wu, “RVC Conformance testing for IQ/IDCT and intra prediction of MPEG-4 AVC,” 90th MPEG meeting input contribution, M17058, Xian, China, Oct. 2009.
附錄
B 出席標準會議之個別報告
2010 年 1 月 MPEG 國際標準會議報告
蔡淳仁、彭文孝 國立交通大學資訊工程系 李國君 國立成功大學電機工程系 一、前言西元 2010 年 ISO/IEC JTC 1/SC 29/WG 11 MPEG (Moving Picture Experts Group)主辦的第 九十一屆國際標準會議(91th ISO/IEC JTC 1/SC 29 WG 11 Meeting)在 2010 年 1 月 16 日至 1 月22 日於日本京都(Japan, Kyoto)舉辦,本次 MPEG 會議共有
260
件貢獻案(Contributions)。 這次交通大學團隊有兩位教授(蔡淳仁、彭文孝)與一位碩士生(游瑋玲)參加,而國立成功大學 李國君教授和學生林和源亦參與會議。這次主要之目的是 (1)參與討論 HVC 的 requirement (N11096),(2)參與討論與修改最終版本的 Joint Call for Proposals on High-Performance Video Coding (N11113),(3)了解參加 CFP 所需的條件以及測試的方法,(4)獲取最新的技術貢獻資 訊。 二、出席會議經過 MPEG-HVC 分組會議在 1 月 17 日開始,為期 6 天。在分組會議中主要的議題包括 (1)討論 HVC 的 requirement(N11096)(2)審查前次會期的 Draft Call for Proposals (N10926)文件,並於此次會議中訂定最 終版本(N11113)
(3)審查本次會期的貢獻案
(4)制訂 anchor 的測試條件,參加 CFP 所需的基本條件,以及所需的費用
所有test sequences 都已經釋出,參加 CFP 者必須在 2/22 前上傳所有 encoded sequences
以及 decoded sequences,且參加費用也必須繳清:(1)在測試視訊方面,依解析度大小分成 5
個類別(A, B, C, D, E),每 1 類別包含了 2 到 5 個視訊序列;解析度最大可達 2560x1600,最 小為416x240;B, C, D,E 三類需要壓 5 個 rate point,並採用主觀視覺評比方式,且 5 個類別 都會採用BD PSNR and rate criteria 評量;大會並要求必須提供 B, C, D, E 四類才可參與 CfP 競賽(2)在 anchor 的測試條件方面,分成 random access 與 low delay 兩類,其主要差別在於 GOP 結構的不同,至於其他像是CABAC、8x8 transform、RDO 與 RDOQ 等壓縮技術的要求則一 致。
關於新的技術的貢獻主題則有下面幾項:
Motion Compensated Prediction by Subsampled Block Matching for Zoom Motion Contents
Unified Loop Filter for Video Coding
Advanced Direct Mode for Bi-directionally Predictive Block Coding
Variable Block Size Skip Mode and New Partition Modes for Inter-prediction PSPNR Tool 2.1
Block-based Pyramid Prediction (BPP) for High-performance Video Coding Mobile visual search
此次會議中新技術的討論並不多,會議的重點還是放在 CFP 的修訂,以及最後
subjective 的測試方法以及參加者必須遵守的條件,總共參加 CFP 的報名者有 33 組,報 名費用為8900 CHF + 7.6% VAT。
新技術討論中BPP 的那一篇,提出的方法應用在 intra coding,low bitrate 時會有 1.7% 至9.4%的 bitrate saving,另外一篇 PSPNR Tool 2.1 量測 perceptual noise based on JND (just noticeable difference) 以及 temporal noise,此方法實驗於大部分的 sequence 中是優於 psnr 以及SSIM 兩種方法。
Mobile visual search 的部分,”Comparison of Image Feature Descriptors for Mobile Visual Search”此篇提出 SIFT 和 CHoG 兩種新的 feature matching 方法,”Recent Advances in Mobile Visual Search” 此篇提出應該要將 feature matching 和 data compression 概念整合 在一起才能夠在有限的頻寬下快速將 mobile 獲得的訊息和 database sever 做比對以及傳 輸。
三、攜回資料
無。所有會議相關之資料與檔案皆可以在MPEG 的網頁中取得。
2010 年 2 月 INCITS L3 美國標準會議報告
李國君
國立成功大學電機工程系 1. 前言
本屆INCITS L3( International Committee for Information Technology Standards L3)美國會 議,於2010 年 2 月 23 日至 2010 年 2 月 25 日在美國科羅拉多的 Louisville 舉行,多位來自美
國各地的多媒體學者專家皆受邀參加。由於筆者近日也致力於 3D Video 的研究,因此在 22
日首先前往Cablelab 參加 SCTE-3D AHG meeting,這次會議所得到關於 3D Video 的資訊對於
筆者在近期在3D 的研究有極大的幫助。從 23 日開始的 L3 會議主要分成兩個部分:INCITS
L3.1 是對於 MPEG 在影像處理、壓縮、編碼、架構與應用以及其它相關技術的討論,而 INCITS L3.2 是對於 JPEG 相關技術之討論。筆者於會議期間主要參與 INCITS L3.1 對於 MPEG 影像處理技術上的討論與美國標準規格的制訂,會議的內容與筆者的研究具有高度相 關性,因此筆者也藉此機會向與會人士分享研究上常碰到的問題與解決方法。 2. 出席會議經過及與會心得 INCITS L3 為國際多媒體相關技術相當著名且規模不斷成長的會議,參與會議之成員皆具 有相當高的水準且多為各國在多媒體方面的專家,對於從事多媒體相關研究的學者而言,每 年的參與皆可獲得相當程度的幫助,同時亦可接觸到目前熱門的研究主題,提升台灣在國際 上的能見度與競爭力,更增台灣參與國際標準制定的機會。 在參與此次的會議中,筆者與會議中各國專家互相交流多媒體技術的最新發展狀況以及 未來的發展方向和瓶頸,希望能提供台灣在多媒體相關領域的研究經驗以供各國專家參考, 除了吸收新的專業知識之外,亦藉此增廣自己的國際視野。筆者希望透過與各國多媒體相關 研究人員學術交流的機會,將此次會議中所得到的多媒體相關領域之先進技術引進國內,以 幫助國內多媒體相關產業與學術研究有更進一步的發展。
SCTE Meeting in Colorado Feb. 22, 2010 on 3DTV
李國君
國立成功大學電機工程系
Some Action Items Discussions
3D@home will have a glossary for 3D terminologies: ongoing SMTPE provided a liaison copy of 3D glossary (follow-up on this)
There has been proposals for conditional access vendors to investigate any possible
implications of the carriage of 3D content on security systems used today by cable operators
CableLabs 3DTV Report
Phase-0 Anaglyph 3D:
No changes to SCTE standards
Fully SCTE compliant
No impact on STB or Encoders
No changes to SCTE standards needed Phase-2 Add Metadata for 3D signal identification
Requires simple 3D format identification tags (SEI messages)
― 3D Tags needed to support MPEG-2 AVC/H.264 and VC-1 video coding May need supplemental depth or disparity data to improve graphics overlay
― Further investigation needed. Is this transport, coding or metadata? Non-SCTE work. CAblesLabs specification changes impacted
― OpenCable Host CFR, VOD CEP, OCAP, others? Phase-3: Full resolution 2-Channel stereoscopic
Further investigation is required by operators No action by SCTE is needed at this time
Update from MPEG (Primarily by Anthony Vetro)
Corrigendum activities on MVC coding
Frame packing Arrangement SEI Message is pretty updated Looking forward to enhance 3D format by Oct. this year Finalized MVC reference software and conformance
Carriage of MVC on MPEG-2 System and transport was approved July 2009 and amendment
is ongoing
Discussions on the Transport of multiple streams for both 2D and 3D Video
Different Cable operators were talking about the arrangement of having different video streams
with a mix of 3D and 2D
Gary had concerns on the switch between 2D and 3D
There were mixed feelings on this switch since people may not want to take shutter glasses on
and off during the switch
Some switch use cases in the cable could be: 2D to 3D to 2D
3D to 2D to 3D
2010 年 4 月 MPEG 國際標準會議報告
杭學鳴、蔡淳仁、彭文孝 國立交通大學電子工程系/資訊工程系 李國君 國立成功大學電機工程系 1. 前言西元 2010 年 ISO/IEC JTC 1/SC 29/WG 11 MPEG (Moving Picture Experts Group)主辦的第 九十二屆國際標準會議(92th ISO/IEC JTC 1/SC 29 WG1 & WG 11 meetings)在 2010 年 4 月 19 日至 4 月 23 日於德國德勒思頓 (Dresden, Germany)舉辦而第一屆的 ITU-T/ISO/IEC Joint Collaborative Team (JCT) on Video Coding 則同樣在 2010 年 4 月 16 日至 4 月 23 日於德國德勒 思頓 (Dresden, Germany) 舉行。本次交通大學團隊一共有兩位教授(蔡淳仁、彭文孝)、一 位博士生(陳渏紋)與兩位碩士生(游瑋玲、王澤瑋)。交通大學杭學鳴與成功大學李國君 兩位教授已報名註冊訂下旅館,但因冰島火山灰雲阻撓航運,未能成行。 此次主要之目的是 參加Joint Collaborative Team on Video Coding (JCTVC) 在 Joint Call for Proposal(CfP)on Video Compression Technology 的相關討論。共有 27 個團隊參加此次 CfP,大部分團隊皆為國 際性的組織與企業(TI/MIT, Hitachi, Sony, NEC, SHARP, Intel, Mitsubishi, JVC, MediaTek, LG, Huawei/Hisilicon, RWTH Aachen, SK telecom/Sejong Univ./Sungkyunkwan Univ., France Telecom/NTT/NTT DOCOMO/Panasonic/Technicolor, Fujitsu, Fraunhofer HHI, Toshiba, Microsoft, Tandberg/Ericsson/Nokia, RIM, Qualcomm, NHK/Mitsubishi, NCTU, Samsung/BBC, Renesas, ETRI);JCTVC-A123 為我團隊代表交通大學參加了 CfP 的文件編號。交通大學團隊 在主觀測試中獲得了總成績第12 名,Low Delay 測試環境第 10 名,以及在一測試 Case 第 1 名的成績。此外,交大為所有參與的學校單位中(MIT, U.S.; RWTH Aachen, Germany; Sejong Univ. & Sungkyunkwan Univ., Korea)主觀成績最佳者。
2. 出席會議經過 JCTVC 分組會議在 4 月 16 日開始,為期 8 天。在分組會議中主要的議題包括 (1)互相檢查 27 團隊所繳交資料的正確性 (2)審查本次會期的貢獻案 (3)討論貢獻案的主觀測試表現 (4)討論新標準的開發平台
(5)制訂 AHGs 與 Code Experiment (CE)的測試項目與環境
本次 JCTVC 分組會議中共有 40 個提案。其中有 27 提案回應 CfP 有關的文件,13 件有
關新的編碼工具。會議一開始隨即進行了27 個 CfP 提案的 2 進位檔(binary files)的互相檢查 (cross-check),cross-check 活動雖然費時,但是最終結果並沒有任何發現任何一個團隊有 CODEC 執行檔或是編解碼方面的違規行為。接下來三天舉行 CfP 回應案報告,每一個提案 所提出的新編碼工具可以分為下列幾項:
Block-based
Variable block sizes
Block motion compensation Fractional-pel motion vectors Spatial intra prediction
Spatial transform of residual difference Integer-based transform designs
Arithmetic or VLC-based entropy coding In-loop filtering to form final decoded picture
大多數的提案的編碼表現都比現今 H.264/AVC anchor 更為有效率,主觀測試第一名的團隊
(Samsung)甚至可以在比 H.264/AVC anchor 少了 40%Bit-rate 的情況下而達到主觀上更好的畫 質。
結束了回應CfP 文件的報告後就進入了 13 件新編碼工具的相關報告,報告內容大致上與
其公司的 CfP 文件雷同或其延伸。之後便主要在討論次世代編碼標準軟體開發平台的設計,
經過了激烈的辯論之後,由幾家在主觀測試中前幾名的公司共同發表了一個參考平台 Test
Model under Consideration" (TMuC) ─文件編號 JCTVC-A033。在 TMuC 僅包含一些較有希望 的編碼工具,這些編碼工具來自於不同的文件,其中包含了:
JCTVC-A114 (from France Telecom, NTT, NTT DOCOMO, Panasonic and Technicolor)
JCTVC-A116 (from HHI)
JCTVC-A119 ("TENTM" from Tandberg, Ericsson, and Nokia) JCTVC-A120 (from RIM)
JCTVC-A121 (from Qualcomm)
JCTVC-A124 (from Samsung, with BBC) JCTVC-A125 (from BBC, with Samsung)
這個參考平台主TMuC 要提供兩樣特點: 1) 編碼效率必須與 CfP 主觀測試第一名的團隊相當
2) 計算複雜度必須要跟 CfP 中計算複雜度最低的提案相當。不過在 TMuC 中的編碼工具並沒 有被正式的驗證過,因此成立了四個驗證編碼工具的團隊(Tool Experiments),其中 JCTVC A301~JCTVCA304 主要在描述此 Tool Experiments 的細節。再者因為有許多不同的編碼工具
在此次的 CfP 被提出,因此大會也針對眾多的編碼工具做分類並且為每一類的編碼工具成立
Ad Hoc Group 深入討論各個編碼工具。 3. 主要貢獻
文件編號JCTVC-A123 代表交通大學參加第一屆 JCTVC 所舉辦的 Joint Call for Proposal (CfP)on Video Compression Technology,我團隊的成果表現於 27 個隊伍中排名第 12,並且 領 先 所 有 參 加 CfP 的 所 有 國 際 大 學 (MIT, RWTH Aachen Univ., Sejong Univ. 與 Sungkyunkwan Univ.)。
我 們 主 要 提 出 了 參 數 化 交 疊 區 塊 動 作 補 償(Parametric Overlapped Block Motion Compensation)演算法並結合樣板比對預測方法(Template Matching Prediction)與數個在 Key Technology Area(KTA)中具有高壓縮效率的編碼工具包含(RDOQ, MDDT, ExtMB, AIF 與 ALF)並實作於 kta2.4r1 的軟體平台上。本團隊的貢獻案最終獲得良好的效果,與大會提供的
22%以及對 Gamma anchor 41%的 BD-rate saving。特別在 WVGA 測試片段 Racehorses 在 1.2M bit/s 與 lowdelay 的測試情況下我們的主觀測試結果拿到了第一名。 4. 攜回資料 所有會議相關之資料與檔案皆可以在MPEG 和 JCT 的網頁中取得。 http://mpeg.nist.gov http://ftp3.itu.int/av-arch/jctvc-site/2010_04_A_Dresden/ 5. 參考文獻
甲、 JCTVC-A123: Video coding technology proposal by National Chiao Tung University (NCTU) 乙、 JCTVC-A301: Tool Experiment 1: Decoder-side motion vector derivation
丙、 JCTVC-A302: Tool Experiment 2: Internal bit-depth increase (IBDI) and memory compression 丁、 JCTVC-A303: Tool Experiment 3: Inter prediction
2010 年 7 月 MPEG 國際標準會議報告
杭學鳴、彭文孝 國立交通大學電子工程系/資訊工程系 李國君 國立成功大學電機工程系 1. 前言西元 2010 年 ISO/IEC JTC 1/SC 29/WG 11 MPEG (Moving Picture Experts Group)主辦的第 九十三屆國際標準會議(93rd ISO/IEC JTC 1/SC 29 WG 11 meetings)在 2010 年 7 月 26 日至 30 日於瑞士的日內瓦(Geneva, Switzerland)舉辦,而第二屆的 Joint Collaborative Team on Video Coding (JCT-VC) meeting 在 2010 年 7 月 21 日至 7 月 28 日同樣於瑞士日內瓦舉行。本次 MPEG 會議共有279 貢獻案(Contributions),而 JCT-VC 會議則有 109 件貢獻案,其中包含來自交通 大 學 團 隊 在 HEVC 的 1 件 貢 獻 案 (JCTVC-B072) 及 成 功 大 學 李 國 君 教 授 (m17622) 在 Reconfigurable Video Coding (RVC)的貢獻案。這次交通大學團隊共有兩位教授(杭學鳴、彭文 孝)與一位碩士生(吳崇豪)參加,而國立成功大學李國君教授和學生陳均富亦參與會議。在 HEVC 部分,此行主要之目的是(1)於 JCT-VC 會議發表 High Efficiency Video Coding (HEVC) 增進視訊壓縮提案(JCTVC-B072), (2)參加 HEVC 的相關討論,(3)了解 HEVC 標準發展過程
的 最 即 時 狀 態 ,(4)獲取最新的技術貢獻資訊。這次 MPEG 主要之目的是將 RVC 的
conformance testing 做一個完整驗證以及在 3D Video Coding (3DVC)的部分做探索,以便未來 在適當的時機參與訂定新興的3D Video Coding 的 Standard。
2. 出席會議經過
JCT-VC 分組會議在 7 月 21 日開始,為期 8 天。在分組會議中主要的議題包括 (1)報告各個 Ad Hoc Group (AHG)的討論結果
(2)審查前次會期 Test Experiments (TEs)的結果 (3)審查本次會期的貢獻案
(4)討論參考軟體 Test Model under Consideration (TMuC)的發展 (5)討論 TMuC 的參考測試條件 (6)建立下次會期的 TEs 本次JCT-VC 會議,總共有 109 個提案,為了讓會議有效率的進行,會議分成兩個 Parallel Session 進行,各自由一位主席來主導會議過程。 會議首先由各個AHG 報告各自的討論結果,內容分別為 (1) JCT-VC project management (2) TMuC editing
(4) Intra prediction
(5) Alternative transforms (6) MV precision
(7) In-loop filtering (8) Large block structures (9) Parallel entropy coding
接著討論上次會期TEs 的結果。其中包含
(1) TE 1: Decoder side motion derivation (2) TE 2: IBDI and memory compression (3) TE 3: Inter prediction in HEVC (4) TE 4: Variable length coding
至於在審查本次會期的貢獻案時,內容則大致分成以下幾類, (1) Parallel entropy coding
(2) Intra prediction (3) Transforms for intra (4) Large block sizes
(5) MV prediction and coding (6) Loop filtering and AIF (7) Quantization
(8) Application area specific contribution (9) Performance measure, new test material
HEVC 標準目標是為了解決現存標準對高解析度視訊的壓縮效率能不足而制定的新一代
視訊壓縮標準,由於HEVC 標準制訂尚處於初始階段,因此有蠻多的新壓縮演算法被提出,
在現場也可以強烈感受的到專家們高度的興趣,多數的貢獻案都有不少的討論,但可惜的是 大多數的貢獻案都是從舊有的演算法裡稍微做些修改,較少有令人耳目一新的新想法提出。 在這次會議裡,我們也提出了一個inter prediction 的演算法(JCTVC-B072),被歸類於 MV prediction and coding。此方法是利用在解碼端使用 template matching 得到的無傳輸負擔的 motion vector,配合我們在前一期會議所提出的 proposal (JCTVC-A123)裡的 parametric OBMC 演算法,改變了現有block motion vector 的估測方式,以達到加強 prediction 的效率。此方法 是屬於不同以往演算法的新做法,也被主席認可為一有趣的想法。
後續大家持續討論未來 HEVC 的發展,許多專家積極的提出自己的想法與建議,其中包
含參考軟體的演算法撰寫優先順序、測試條件的公平性…等,甚至有專家要求每一個新的演 算法都要被單獨測驗過有效果後才能夠被考慮是否採納。
最後會議發出12 組 TEs,內容為
(1) Decoder-Side Motion Vector Derivation (2) IBDI and memory compression
(3) Inter Prediction in HEVC (4) Variable Length Coding
(5) Simplification of Unified Intra Prediction (6) Intra Prediction Improvement
(7) MDDT Simplification (8) Parallel entropy coding
(9) Large Block Structure (10) In-loop filtering (11) Motion Vector Coding (12) Evaluation of TMuC Tools
我們也參與了Inter Prediction in HEVC 的項目,希望下次會期時能有好的成果產出,也期 望下一次會期前,專家們能腦力激盪一下,發揮自己的創意,在下次會期時帶回振奮人心的 結果。 MPEG 部分的分組會議在 7 月 24 日開始。在這次與會當中,主要參加的有 RVC 以及 3DVC 兩個會議。RVC 的部分,此次與會對於 RVC 的 conformance testing 上有很大的貢獻, 替台灣在標準制定上爭取一席之地。而在3DVC 方面,現今 3D 的話題不斷延燒,舉凡電影、 電視都有其蹤跡,所以在與會過程中也十分密切地注意其動向,在3DVC 中,參與的國家都
是一些相當有知名度的公司組織以及學校,例如Philips, Nokia, HHI, GIST 等。李國君教授以 國際標準組織/國際電氣委員會中 MPEG 的代表以及 MPEG 中 RVC 技術研究小組(Ad Hoc Group)中擔任主編 IEEE 期刊 TCSVT 以及 International Journal of Signal Processing Systems 的 Associate Editor 的身分參與此次 MPEG 會議。
在此次會議中,成功大學團隊由李國君教授與陳均富碩士生參與。發表了一篇貢獻案, 以及共同編撰一份輸出文件。主要內容是Conformance testing and debugging report for intra prediction management FUs of AVC Constrained Baseline Profile (M17622)以及 Text of ISO/IEC 23002-4/PDAM 2 Functional Units for AVC High Profile (N11472)。在此次 MPEG 標準會議之 中,也完成了RVC 中針對 H.264/AVC baseline profile 的 functional units 的 conformance testing,
使得RVC 的發展往前了一大步。3DVC 方面,為了因應現今 3D 的火熱程度,此團隊想要探
索出一個較佳的3D 的視訊壓縮方式,目前這個團隊處於 Call for Proposal 的階段,由各成員
提出針對此標準未來發展的方向,然後一起討論,進而訂定出 3D 視訊壓縮的標準。而目前
所提出的草案為(N11476, Draft Call for Proposals on 3D Video Coding Technology),內容主要包 含了對於訂定新興標準的一些建議方式,例如是否要基於Multi-view Video Coding 的方式來
對3D 視訊作向下相容,還有對於 3D 視訊的內容要求文件做修正,讓其更加完備。
對於3D 視訊品質的好壞,目前還沒有一套正確且客觀的方式來評斷,所以 3DVC 團隊在
每次會議都會邀請與會人員一同評斷3D 是訊的品質,而此次也參與了 3D 視訊品質的評斷,
也從中可以了解到目前世界上各知名的公司組織以及學校的研究成果。而評斷的視訊內容同
時包含了裸眼式以及戴配眼鏡式,針對其利用不同數量的views 以及不同大小的 Quantization
Parameter(QP)來評斷壓縮的好壞,裸眼式的包含了 9 個 views,而戴眼鏡式的則有 2 views 或
是 3views。透過此次的與會,更加了解了未來標準的制定方向,進一步可以去一同訂定新興
的標準,將自己的研究成果變成為標準的一部份。
MPEG 涵蓋的範圍包括系統、視訊、音訊等,而受矚目的世界標準包含 MPEG-2, MPEG-4 part II and part 10, MPEG-7, MPEG-21, 等。對於視訊壓縮,Call for Proposals on 3D Video Coding Technology 正是這各領域目前最熱門的主題之一。可以預期近期的 MPEG 會議
3. 攜回資料
無。所有會議相關之資料與檔案皆可以在MPEG 和 JCT-VC 的網頁中取得。
http://wg11.sc29.org/index.xalter http://ftp3.itu.int/av-arch/jctvc-site/ 4. 參考文獻
1. JCTVC-A123: Description of video coding technology proposal by NCTU 2. JCTVC-B072: MB Mode with Joint Application of Template and Block Motion
Compensations
3. JCTVC-B303: Tool Experiment 3: Inter Prediction in HEVC
4. M17622: Conformance testing and debugging report for intra prediction management FUs of AVC Constrained Baseline Profile
2010 年 1 月 MPEG 國際標準會議報告
蔡淳仁、彭文孝 國立交通大學資訊工程系 李國君 國立成功大學電機工程系 1. 前言西元 2010 年 ISO/IEC JTC 1/SC 29/WG 11 MPEG (Moving Picture Experts Group)主辦的
第九十一屆國際標準會議(91th
ISO/IEC JTC 1/SC 29 WG 11 Meeting)在 2010 年 1 月 16 日至 1 月 22 日於日本京都(Japan, Kyoto)舉辦,本次 MPEG 會議共有
260
件貢獻案 (Contributions)。這次交通大學團隊有兩位教授(蔡淳仁、彭文孝)與一位碩士生(游瑋玲)參 加,而國立成功大學李國君教授和學生林和源亦參與會議。這次主要之目的是 (1)參與討 論 HVC 的 requirement (N11096),(2)參與討論與修改最終版本的 Joint Call for Proposals on High-Performance Video Coding (N11113),(3)了解參加 CFP 所需的條件以及測試的方法, (4)獲取最新的技術貢獻資訊。2. 出席會議經過
MPEG-HVC 分組會議在 1 月 17 日開始,為期 6 天。在分組會議中主要的議題包括 (1)討論 HVC 的 requirement(N11096)
(2)審查前次會期的 Draft Call for Proposals (N10926)文件,並於此次會議中訂定 最終版本(N11113)
(3)審查本次會期的貢獻案
(4)制訂 anchor 的測試條件,參加 CFP 所需的基本條件,以及所需的費用 所有 test sequences 都已經釋出,參加 CFP 者必須在 2/22 前上傳所有 encoded sequences 以及 decoded sequences,且參加費用也必須繳清:(1)在測試視訊方面,依解析度大小分成 5 個類別(A, B, C, D, E),每 1 類別包含了 2 到 5 個視訊序列;解析度最大可達 2560x1600, 最小為 416x240;B, C, D,E 三類需要壓 5 個 rate point,並採用主觀視覺評比方式,且 5 個 類別都會採用 BD PSNR and rate criteria 評量;大會並要求必須提供 B, C, D, E 四類才可參 與 CfP 競賽(2)在 anchor 的測試條件方面,分成 random access 與 low delay 兩類,其主要差 別在於 GOP 結構的不同,至於其他像是 CABAC、8x8 transform、RDO 與 RDOQ 等壓縮 技術的要求則一致。
關於新的技術的貢獻主題則有下面幾項:
Motion Compensated Prediction by Subsampled Block Matching for Zoom Motion Contents
Block-based Pyramid Prediction (BPP) for High-performance Video Coding Mobile visual search
此次會議中新技術的討論並不多,會議的重點還是放在 CFP 的修訂,以及最後 subjective 的測試方法以及參加者必須遵守的條件,總共參加 CFP 的報名者有 33 組, 報名費用為 8900 CHF + 7.6% VAT。
新技術討論中 BPP 的那一篇,提出的方法應用在 intra coding,low bitrate 時會有 1.7%至 9.4%的 bitrate saving,另外一篇 PSPNR Tool 2.1 量測 perceptual noise based on JND (just noticeable difference) 以及 temporal noise,此方法實驗於大部分的 sequence 中是優於 psnr 以及 SSIM 兩種方法。
Mobile visual search 的部分,”Comparison of Image Feature Descriptors for Mobile Visual Search”此篇提出 SIFT 和 CHoG 兩種新的 feature matching 方法,”Recent Advances in Mobile Visual Search” 此 篇 提 出 應 該 要 將 feature matching 和 data compression 概念整合在一起才能夠在有限的頻寬下快速將 mobile 獲得的訊息和 database sever 做比對以及傳輸。
3. 攜回資料
無。所有會議相關之資料與檔案皆可以在 MPEG 的網頁中取得。 http://mpeg.espalier.co.jp/general_information.html
2010 年 2 月 INCITS L3 美國標準會議報告
李國君
國立成功大學電機工程系 1. 前言
本屆 INCITS L3( International Committee for Information Technology Standards L3)美國 會議,於 2010 年 2 月 23 日至 2010 年 2 月 25 日在美國科羅拉多的 Louisville 舉行,多位 來自美國各地的多媒體學者專家皆受邀參加。由於筆者近日也致力於 3D Video 的研究, 因此在 22 日首先前往 Cablelab 參加 SCTE-3D AHG meeting,這次會議所得到關於 3D Video 的資訊對於筆者在近期在 3D 的研究有極大的幫助。從 23 日開始的 L3 會議主要分 成兩個部分:INCITS L3.1 是對於 MPEG 在影像處理、壓縮、編碼、架構與應用以及其它 相關技術的討論,而 INCITS L3.2 是對於 JPEG 相關技術之討論。筆者於會議期間主要參 與 INCITS L3.1 對於 MPEG 影像處理技術上的討論與美國標準規格的制訂,會議的內容與 筆者的研究具有高度相關性,因此筆者也藉此機會向與會人士分享研究上常碰到的問題 與解決方法。 2. 出席會議經過及與會心得 INCITS L3 為國際多媒體相關技術相當著名且規模不斷成長的會議,參與會議之成員 皆具有相當高的水準且多為各國在多媒體方面的專家,對於從事多媒體相關研究的學者而 言,每年的參與皆可獲得相當程度的幫助,同時亦可接觸到目前熱門的研究主題,提升台 灣在國際上的能見度與競爭力,更增台灣參與國際標準制定的機會。 在參與此次的會議中,筆者與會議中各國專家互相交流多媒體技術的最新發展狀況以 及未來的發展方向和瓶頸,希望能提供台灣在多媒體相關領域的研究經驗以供各國專家參 考,除了吸收新的專業知識之外,亦藉此增廣自己的國際視野。筆者希望透過與各國多媒 體相關研究人員學術交流的機會,將此次會議中所得到的多媒體相關領域之先進技術引進 國內,以幫助國內多媒體相關產業與學術研究有更進一步的發展。
SCTE Meeting in Colorado Feb. 22, 2010 on 3DTV
李國君
國立成功大學電機工程系
Some Action Items Discussions
3D@home will have a glossary for 3D terminologies: ongoing
SMTPE provided a liaison copy of 3D glossary (follow-up on this)
There has been proposals for conditional access vendors to investigate any possible
implications of the carriage of 3D content on security systems used today by cable operators
CableLabs 3DTV Report
Phase-1 Two Channel “Frame compatible” 3D:
Fully SCTE compliant
No impact on STB or Encoders
No changes to SCTE standards needed
Phase-2 Add Metadata for 3D signal identification
Requires simple 3D format identification tags (SEI messages)
― 3D Tags needed to support MPEG-2 AVC/H.264 and VC-1 video coding May need supplemental depth or disparity data to improve graphics overlay
― Further investigation needed. Is this transport, coding or metadata? Non-SCTE work. CAblesLabs specification changes impacted
― OpenCable Host CFR, VOD CEP, OCAP, others?
Phase-3: Full resolution 2-Channel stereoscopic
Further investigation is required by operators
No action by SCTE is needed at this time
Update from MPEG (Primarily by Anthony Vetro)
Corrigendum activities on MVC coding
Frame packing Arrangement SEI Message is pretty updated
Looking forward to enhance 3D format by Oct. this year
Finalized MVC reference software and conformance
Carriage of MVC on MPEG-2 System and transport was approved July 2009 and amendment is ongoing
Discussions on the Transport of multiple streams for both 2D and 3D Video
Different Cable operators were talking about the arrangement of having different video streams with a mix of 3D and 2D
Gary had concerns on the switch between 2D and 3D
There were mixed feelings on this switch since people may not want to take shutter glasses on and off during the switch
Some switch use cases in the cable could be:
2D to 3D to 2D
3D to 2D to 3D
2010 年 4 月 MPEG 國際標準會議報告
杭學鳴、蔡淳仁、彭文孝 國立交通大學電子工程系/資訊工程系 李國君 國立成功大學電機工程系 1. 前言西元 2010 年 ISO/IEC JTC 1/SC 29/WG 11 MPEG (Moving Picture Experts Group)主辦的
第九十二屆國際標準會議(92th
ISO/IEC JTC 1/SC 29 WG1 & WG 11 meetings)在 2010 年 4 月 19 日至 4 月 23 日於德國德勒思頓 (Dresden, Germany)舉辦而第一屆的 ITU-T/ISO/IEC Joint Collaborative Team (JCT) on Video Coding 則同樣在 2010 年 4 月 16 日至 4 月 23 日於 德國德勒思頓 (Dresden, Germany) 舉行。本次交通大學團隊一共有兩位教授(蔡淳仁、彭 文孝)、一位博士生(陳渏紋)與兩位碩士生(游瑋玲、王澤瑋)。交通大學杭學鳴與成 功大學李國君兩位教授已報名註冊訂下旅館,但因冰島火山灰雲阻撓航運,未能成行。 此 次主要之目的是參加 Joint Collaborative Team on Video Coding (JCTVC) 在 Joint Call for Proposal(CfP)on Video Compression Technology 的相關討論。共有 27 個團隊參加此次 CfP, 大部分團隊皆為國際性的組織與企業(TI/MIT, Hitachi, Sony, NEC, SHARP, Intel, Mitsubishi, JVC, MediaTek, LG, Huawei/Hisilicon, RWTH Aachen, SK telecom/Sejong Univ./Sungkyunkwan Univ., France Telecom/NTT/NTT DOCOMO/Panasonic/Technicolor, Fujitsu, Fraunhofer HHI, Toshiba, Microsoft, Tandberg/Ericsson/Nokia, RIM, Qualcomm, NHK/Mitsubishi, NCTU, Samsung/BBC, Renesas, ETRI);JCTVC-A123 為我團隊代表交通大 學參加了 CfP 的文件編號。交通大學團隊在主觀測試中獲得了總成績第 12 名,Low Delay 測試環境第 10 名,以及在一測試 Case 第 1 名的成績。此外,交大為所有參與的學校單位 中(MIT, U.S.; RWTH Aachen, Germany; Sejong Univ. & Sungkyunkwan Univ., Korea)主觀成 績最佳者。 2. 出席會議經過 JCTVC 分組會議在 4 月 16 日開始,為期 8 天。在分組會議中主要的議題包括 (1)互相檢查 27 團隊所繳交資料的正確性 (2)審查本次會期的貢獻案 (3)討論貢獻案的主觀測試表現 (4)討論新標準的開發平台
(5)制訂 AHGs 與 Code Experiment (CE)的測試項目與環境
本次 JCTVC 分組會議中共有 40 個提案。其中有 27 提案回應 CfP 有關的文件,13 件 有關新的編碼工具。會議一開始隨即進行了 27 個 CfP 提案的 2 進位檔(binary files)的互相 檢查(cross-check),cross-check 活動雖然費時,但是最終結果並沒有任何發現任何一個團隊
提案所提出的新編碼工具可以分為下列幾項: Block-based
Variable block sizes
Block motion compensation Fractional-pel motion vectors Spatial intra prediction
Spatial transform of residual difference Integer-based transform designs
Arithmetic or VLC-based entropy coding In-loop filtering to form final decoded picture
大多數的提案的編碼表現都比現今 H.264/AVC anchor 更為有效率,主觀測試第一名的團隊 (Samsung)甚至可以在比 H.264/AVC anchor 少了 40%Bit-rate 的情況下而達到主觀上更好的 畫質。
結束了回應 CfP 文件的報告後就進入了 13 件新編碼工具的相關報告,報告內容大致 上與其公司的 CfP 文件雷同或其延伸。之後便主要在討論次世代編碼標準軟體開發平台的 設計,經過了激烈的辯論之後,由幾家在主觀測試中前幾名的公司共同發表了一個參考平 台 Test Model under Consideration" (TMuC) ─文件編號 JCTVC-A033。在 TMuC 僅包含一 些較有希望的編碼工具,這些編碼工具來自於不同的文件,其中包含了:
JCTVC-A114 (from France Telecom, NTT, NTT DOCOMO, Panasonic and Technicolor)
JCTVC-A116 (from HHI)
JCTVC-A119 ("TENTM" from Tandberg, Ericsson, and Nokia) JCTVC-A120 (from RIM)
JCTVC-A121 (from Qualcomm)
JCTVC-A124 (from Samsung, with BBC) JCTVC-A125 (from BBC, with Samsung)
這個參考平台主 TMuC 要提供兩樣特點: 1) 編碼效率必須與 CfP 主觀測試第一名的團隊相 當 2) 計算複雜度必須要跟 CfP 中計算複雜度最低的提案相當。不過在 TMuC 中的編碼工 具並沒有被正式的驗證過,因此成立了四個驗證編碼工具的團隊(Tool Experiments),其中 JCTVC A301~JCTVCA304 主要在描述此 Tool Experiments 的細節。再者因為有許多不同的 編碼工具在此次的 CfP 被提出,因此大會也針對眾多的編碼工具做分類並且為每一類的編 碼工具成立 Ad Hoc Group 深入討論各個編碼工具。
3. 主要貢獻
文件編號 JCTVC-A123 代表交通大學參加第一屆 JCTVC 所舉辦的 Joint Call for Proposal(CfP)on Video Compression Technology,我團隊的成果表現於 27 個隊伍中排名 第 12,並且領先所有參加 CfP 的所有國際大學(MIT, RWTH Aachen Univ., Sejong Univ. 與 Sungkyunkwan Univ.)。
我 們 主 要 提 出 了 參 數 化 交 疊 區 塊 動 作 補 償 (Parametric Overlapped Block Motion Compensation)演算法並結合樣板比對預測方法(Template Matching Prediction)與數個在 Key Technology Area(KTA)中具有高壓縮效率的編碼工具包含(RDOQ, MDDT, ExtMB, AIF 與 ALF)並實作於 kta2.4r1 的軟體平台上。本團隊的貢獻案最終獲得良好的效果,與大會提供
的 H.264/AVC anchor bitstream 做比較時,我們所提出的軟體架構對於 Alpha/Beta anchor 可獲得 22%以及對 Gamma anchor 41%的 BD-rate saving。特別在 WVGA 測試片段 Racehorses 在 1.2M bit/s 與 lowdelay 的測試情況下我們的主觀測試結果拿到了第一名。 4. 攜回資料
所有會議相關之資料與檔案皆可以在 MPEG 和 JCT 的網頁中取得。 http://mpeg.nist.gov
http://ftp3.itu.int/av-arch/jctvc-site/2010_04_A_Dresden/ 5. 參考文獻
甲、 JCTVC-A123: Video coding technology proposal by National Chiao Tung University (NCTU) 乙、 JCTVC-A301: Tool Experiment 1: Decoder-side motion vector derivation
丙、 JCTVC-A302: Tool Experiment 2: Internal bit-depth increase (IBDI) and memory compression 丁、 JCTVC-A303: Tool Experiment 3: Inter prediction
2010 年 7 月 MPEG 國際標準會議報告
杭學鳴、彭文孝 國立交通大學電子工程系/資訊工程系 李國君 國立成功大學電機工程系 1. 前言西元 2010 年 ISO/IEC JTC 1/SC 29/WG 11 MPEG (Moving Picture Experts Group)主辦的
第九十三屆國際標準會議(93rd
ISO/IEC JTC 1/SC 29 WG 11 meetings)在 2010 年 7 月 26 日至 30 日於瑞士的日內瓦(Geneva, Switzerland)舉辦,而第二屆的 Joint Collaborative Team on Video Coding (JCT-VC) meeting 在 2010 年 7 月 21 日至 7 月 28 日同樣於瑞士日內瓦舉 行。本次 MPEG 會議共有 279 貢獻案(Contributions),而 JCT-VC 會議則有 109 件貢獻案, 其中包含來自交通大學團隊在 HEVC 的 1 件貢獻案(JCTVC-B072)及成功大學李國君教授 (m17622)在 Reconfigurable Video Coding (RVC)的貢獻案。這次交通大學團隊共有兩位教 授(杭學鳴、彭文孝)與一位碩士生(吳崇豪)參加,而國立成功大學李國君教授和學生陳均富 亦參與會議。在 HEVC 部分,此行主要之目的是(1)於 JCT-VC 會議發表 High Efficiency Video Coding (HEVC)增進視訊壓縮提案(JCTVC-B072), (2)參加 HEVC 的相關討論,(3) 了解 HEVC 標準發展過程的最即時狀態,(4)獲取最新的技術貢獻資訊。這次 MPEG 主要 之目的是將 RVC 的 conformance testing 做一個完整驗證以及在 3D Video Coding (3DVC)的 部分做探索,以便未來在適當的時機參與訂定新興的 3D Video Coding 的 Standard。
2. 出席會議經過
JCT-VC 分組會議在 7 月 21 日開始,為期 8 天。在分組會議中主要的議題包括 (1)報告各個 Ad Hoc Group (AHG)的討論結果
(2)審查前次會期 Test Experiments (TEs)的結果 (3)審查本次會期的貢獻案
(4)討論參考軟體 Test Model under Consideration (TMuC)的發展 (5)討論 TMuC 的參考測試條件 (6)建立下次會期的 TEs 本次 JCT-VC 會議,總共有 109 個提案,為了讓會議有效率的進行,會議分成兩個 Parallel Session 進行,各自由一位主席來主導會議過程。 會議首先由各個 AHG 報告各自的討論結果,內容分別為 (1) JCT-VC project management (2) TMuC editing
(4) Intra prediction
(5) Alternative transforms (6) MV precision
(7) In-loop filtering (8) Large block structures (9) Parallel entropy coding
接著討論上次會期 TEs 的結果。其中包含 (1) TE 1: Decoder side motion derivation (2) TE 2: IBDI and memory compression (3) TE 3: Inter prediction in HEVC (4) TE 4: Variable length coding
至於在審查本次會期的貢獻案時,內容則大致分成以下幾類, (1) Parallel entropy coding
(2) Intra prediction (3) Transforms for intra (4) Large block sizes
(5) MV prediction and coding (6) Loop filtering and AIF (7) Quantization
(8) Application area specific contribution (9) Performance measure, new test material
HEVC 標準目標是為了解決現存標準對高解析度視訊的壓縮效率能不足而制定的新一 代視訊壓縮標準,由於 HEVC 標準制訂尚處於初始階段,因此有蠻多的新壓縮演算法被提 出,在現場也可以強烈感受的到專家們高度的興趣,多數的貢獻案都有不少的討論,但可 惜的是大多數的貢獻案都是從舊有的演算法裡稍微做些修改,較少有令人耳目一新的新想 法提出。 在這次會議裡,我們也提出了一個 inter prediction 的演算法(JCTVC-B072),被歸類於 MV prediction and coding。此方法是利用在解碼端使用 template matching 得到的無傳輸負 擔的 motion vector,配合我們在前一期會議所提出的 proposal (JCTVC-A123)裡的 parametric OBMC 演算法,改變了現有 block motion vector 的估測方式,以達到加強 prediction 的效率。 此方法是屬於不同以往演算法的新做法,也被主席認可為一有趣的想法。
後續大家持續討論未來 HEVC 的發展,許多專家積極的提出自己的想法與建議,其中 包含參考軟體的演算法撰寫優先順序、測試條件的公平性…等,甚至有專家要求每一個新 的演算法都要被單獨測驗過有效果後才能夠被考慮是否採納。
最後會議發出 12 組 TEs,內容為
(1) Decoder-Side Motion Vector Derivation (2) IBDI and memory compression
(3) Inter Prediction in HEVC (4) Variable Length Coding
(5) Simplification of Unified Intra Prediction (6) Intra Prediction Improvement