第一章 介紹
由於資訊的日新月異和網際網路的發展,藉由網路來傳遞資料,使資料傳遞 更為迅速便捷,但是也帶來了安全上的問題,因此資料的安全性和多媒體的版權 保護便成為重要的議題。資訊隱藏(Information Hiding) 或數位浮水印 (Digital Watermark)[1]是在數位多媒體中加入有意義的圖形或文字,用來做為數位多媒體 的版權或完整性的認證,此外,資訊隱藏可以應用於機密資料的傳送,即在多媒 體中嵌入所需傳送的機密訊息,且多媒體在嵌入機密訊息後,其視覺或聽覺上的 品質差異,不容易被人類的視覺或聽覺所察覺。因此,除了傳送者與接收者外,
沒有人知道資訊隱藏的事實,可以達到機密傳送的目的。
數位浮水印因應不同的應用,浮水印的技術會著重在不同的目標:容量 (Capacity)[2] 、 不 可 察 覺 性 (Invisible)[3] 、 強 韌 性 (Robustness)[4] 、 可 逆 性 (Reversible)[5]等。浮水印可依其嵌入方式,分成空間域(Spatial Domain)[6, 7]與 頻率域(Frequency Domain)[8, 9],空間域的嵌入是直接對空間域的像素值做修改,
來達到嵌入的效果,如最低有效位(Least Significant Bits, LSB) [10]等常見的方法,
但是容易破壞原圖的外觀,且較不能抵抗攻擊,而頻率域數位浮水印是利用特定 的公式如離散餘旋轉換(Discrete Cosine Transform, DCT),離散小波轉換(Discrete Wavelet Transform, DWT)等,將空間域像素值轉換為頻率域的係數,藉由轉換 後能量集中在低頻的特性,來選擇嵌入的位置,再利用演算法嵌入版權訊息,來 達成資訊的隱藏。
H.264/AVC 視訊格式[11, 12]是由國際電信聯盟標準化組織(ITU-T)的視訊編 碼專家組(VCEG)和國際化標準組織(ISO/IEC)的動態影像專家(MPEG)共同組成 的 聯 合 視 訊 組 (Joint Video Team) 所 開 發 的 最 新 視 訊 編 碼 標 準 , 被 稱 作 ISO/IEC14496-10 或 MPEG-4/AVC。此格式在 ITU-T 組織中命名為 H.264,在 ISO 組織中則納入 MPEG-4 Part10,但其編解碼技術是相同的,在研究上通常合併稱
2
為 H.264/AVC,其目的是希望能達到編碼效率的增加和極佳的視訊品質,此編解 碼技術也被稱為進階視訊編碼 (Advanced Video Coding, AVC)。
在視訊編碼中,主要的冗餘訊息是時間冗餘,其次是空間冗餘,而 H.264 視 訊壓縮[11, 12]的原理即是消除空間與時間的冗餘(Redundancy),來達到壓縮的目 的,透過畫面內預測(Intra-Prediction)來消除畫面內(Intra frame)的空間冗餘,以 畫面間預測(Inter-Prediction)來消除畫面與畫面間(Inter frame)的時間冗餘,透過 當前區塊與畫面內或畫面間預測所得的預測區塊相減,得到殘差區塊(Residual block),殘差區塊進行轉換(Transform)與量化(Quantize),並將轉換與量化後的係 數 進 行 熵 編 碼 (Entropy encode) , 其 中 熵 編 碼 為 適 應 性 變 動 長 度 編 碼 法 (Context-Based Adaptive Variable Length Coding, CAVLC)或前文參考之適應 性二元算術編碼法(Context-Based Adaptive Binary Arithmetic Coding, CABAC),
如圖 1.1 所示。
在 4×4 畫面內預測模式的編碼,由於有九種不同的畫面內預測方向,因此至 少需要 4 個位元才能夠正確地編碼所選擇的預測模式。為了減少編碼畫面內預測 模式所需要的位元,由於相鄰區塊的預測模式是有相關的,因此 H.264 提供最可
圖 1.1:H.264 編碼器架構
3 Propagation)的 H.264/AVC 資訊隱藏技術,利用修改量化後 4 ×4 DCT 亮度區塊中 的係數對,使得反 DCT 後之右邊或下面的像素值變化量為 0,每個量化後的 4×4 DCT 亮度區塊取三對係數來藏機密訊息,每組係數對可以用來嵌入一位元的資 訊,係數對的修改並不會影響參考像素,因為畫面內預測使用鄰近已編碼區塊來 預測,若在修改時避免修改到預測方向之參考像素,則可以避免錯誤傳播問題。
4
Bouchama 等學者[17]在 2012 年,提出一種對於即時應用的 H.264/AVC 資訊 隱藏技術基於畫面內預測模式,在這個方法中,9 種畫面內預測模式被劃分為四
5
6
性,該方法利用 Logistic Chaotic Map 來選擇欲藏入資訊的區塊,並利用拖尾係 數的奇偶性來藏入隱藏位元,由於人類的視覺系統對於低頻部分較為敏感,而拖 尾係數(Tailing Ones)是屬於高頻的部分,因此視訊品質的下降是難以察覺的。
Li 等學者[26]在 2010 年,提出兩種不同的嵌入方式,分別為在畫面間編碼 中嵌入資訊以及在 CAVLC 中嵌入資訊,可以根據不同的應用環境來選擇不同的 嵌入方式,在畫面間編碼中嵌入資訊,該方式是將區塊的類型對應隱藏位元,例 如:16×16 對應位元 00,根據隱藏位元來強制改變匹配塊(Matching blocks)的大 小來完成隱藏資訊。在 CAVLC 中嵌入資訊,則是修改拖尾係數(Trailing Ones) 的符號位元來隱藏資訊,因為拖尾係數通常為高頻的係數並且都為±1,所以利用 拖尾係數符號位元的資訊隱藏方法,可以限制位元率(Bit-rate)的增加以及保證視 訊品質,也就是說,當需要較高的視訊品質時,資訊主要嵌入於畫面間編碼,而 當需要限制位元率時,則將資訊主要嵌入於 CAVLC 的拖尾係數中,此外,這兩 種嵌入方式可以被結合,來達到更好的視訊品質和位元率。
在本論文中,我們提出基於運動向量與運動向量差之特性的方法,來進行資 訊隱藏及可逆式資訊隱藏。對於資訊隱藏方法,我們依照所要藏入的機密訊息來 修改運動向量至周圍鄰近點,以達到資訊隱藏的目的。此外,我們增加限制條件,
避免修改運動向量為零者,以減低嵌入後對視訊檔案大小的影響。而對於可逆式 資訊隱藏,我們則是依照運動向量差的數值,來決定該運動向量差是要進行位移 或藏入資訊。本文剩餘章節安排如下。第 2 章介紹一些 H.264 相關的資訊隱藏 技術;第 3 章介紹我們所提出的資訊隱藏方法;第 4 章介紹我們所提出的可逆 式資訊隱藏方法;第 5 章提出實驗結果;最後,在第 6 章中提出結論。
7