• 沒有找到結果。

H.264/AVC基於運動向量之資訊隱藏技術

N/A
N/A
Protected

Academic year: 2021

Share "H.264/AVC基於運動向量之資訊隱藏技術"

Copied!
64
0
0

加載中.... (立即查看全文)

全文

(1)國立屏東大學資訊科學系碩士班 碩 士 論 文 指導教授:楊政興博士. H.264/AVC 基於運動向量之資訊隱藏技 術 Data Hiding for H.264/AVC Based on the Motion Vector. 研究生:昌俊豪撰. 中華民國一百零四年七月.

(2) H.264/AVC 基於運動向量之資訊隱藏技術 Data Hiding for H.264/AVC Based on the Motion Vector. 研 究 生:昌俊豪. Student:Chun-Hao Chang. 指導教授:楊政興. Advisor:Cheng-Hsing Yang. 國 立 屏 東 大 學 資 訊 科 學 系 碩 士 論 文. A Thesis Submitted to Department of Computer Science College of Sciences National Pingtung University in Partial Fulfillment of the Requirements for the Degree of Master in Computer Science July 2015 Pingtung, Taiwan, Republic of China. 中華民國一百零四年七月.

(3)

(4) 誌. 謝. 在屏東大學研究所求學的兩年中,首先誠摯的感謝指導教授楊政興博士及林 義凱博士,感謝兩位教授在這兩年中的悉心指導及幫助,讓我能對視訊壓縮及影 像處理這些領域有所了解,雖然在這求學期間也經常遇到許多困難與挫折,感謝 指導教授不嫌麻煩地幫我解決問題並指點我正確的方向,一一克服困難,使我在 這兩年中學習到許多寶貴的經驗。此外,指導教授對於學問的嚴謹更是我們學習 的典範。 感謝於百忙之中仍然抽空來擔任口試委員的陳宗和博士和林義凱博士,並在 口試中給我許多寶貴的建議,使我的論文能更加完善,非常感謝兩位教授的指 導。 感謝影像處理實驗室的冠良學長及莉雯學姐,讓我能快速地熟悉環境,同時 也要感謝影像處理實驗室的博瀚同學,感測網路實驗室的新璋及嘉俊同學,每當 遇到問題時,都能經由相互討論來解決問題,使我的研究路程走的並不孤單,另 外,也感謝實驗室的家佑、柏融、俊龍及宣堯學弟,謝謝你們的協助與熱心幫忙。 最後,我要感謝我的父母,在我求學生涯中不斷給予我鼓勵,無論是在精神 上或經濟上,若沒有您們的支持與幫助,就沒有今時今日的我,也感謝姊姊在我 成長的路上,不忘扶持我這個弟弟,感謝家人一路上的陪伴,讓我擁有一個溫馨 和諧的家庭,謝謝您們。. 昌俊豪. 謹誌. 中華民國一百零四年七月十八日 i.

(5) 摘. 要. 由於多媒體壓縮和網際網路的發展,使得以往的資料轉變為數位資訊,大量 的儲存和藉由網路傳播。由於容易被修改及非法複製,所以需要注意資料傳輸時 的安全問題以及版權保護的問題,而數位浮水印(Digital Watermark)是在多媒體中 加入有意義的圖形或文字,用來作為多媒體的版權保護,也可以應用於機密通訊, 即是在多媒體傳送的過程中嵌入我們需要的機密訊息,且多媒體在加入機密訊息 後不會顯著影響其視覺或聽覺上的品質,不會輕易被察覺,在網路傳輸時除了傳 送者跟接收者以外,其他人不知道有資訊隱藏的事實,可以防止未經授權的竊 取。 在本論文中,我們針對 H.264/AVC 視訊格式,提出基於運動向量與運動向 量差之特性的資訊隱藏方法,來進行資訊隱藏及可逆式資訊隱藏。對於資訊隱藏 方法,藉由修改運動向量至周圍鄰近點來達到資訊隱藏的目的。而對於可逆式資 訊隱藏,則是透過修改運動向量差的數值來達到可逆式資訊隱藏的目的。實驗結 果顯示,我們提出之方法在藏入機密訊息之後,可以維持不錯的視訊品質,且可 容易取回藏入之機密訊息,並具有相當不錯之藏量。. 關鍵字:H.264/AVC、運動向量、資訊隱藏、版權保護. ii.

(6) Abstract Due to the development of digital techniques and the Internet, lots of digital multimedia are created, stored, and spread over the Internet. Because digital video can be modified easily and copied illegally, we need to pay attention to the issues of data security and copyright protection during transmission. Digital watermark, which embeds meaningful marks or words into the digital video, is a kind of methods used as the video copyright protection or the secret communication. In other words, during the transmission of multimedia, we embed the secret data. In addition, as the secret data has been embedded in the multimedia, it doesn’t affect the visual and audio quality and wouldn’t be easily noticed. When the multimedia are transmitted on the Internet, no one knows the fact of data hiding except the sender and receiver. It can prevent people from stealing the copyright. In this paper, we propose a data hiding technique specific to the H.264/AVC video format based on the motion vectors and the motion vector differences for data hiding and reversible data hiding. We achieve the purpose of data hiding by modifying the motion vectors to their neighboring points. As for reversible data hiding, the purpose can be achieved by modifying the values of the motion vector differences. Experimental results show that our methods can maintain a good video quality after the secret data are embedded. Moreover, our methods have a large embedding capability and the embedded data can be easily extracted.. Keywords: H.264/AVC, Motion Vector, Data Hiding, Copyright Protection.. iii.

(7) 目. 錄. 誌. 謝 ................................................................................................................. i. 摘. 要 ................................................................................................................ ii. Abstract .................................................................................................................... iii 目. 錄 ............................................................................................................... iv. 圖. 次 ............................................................................................................... vi. 表. 次 ............................................................................................................. viii. 第一章. 介紹 ....................................................................................................... 1. 第二章. 文獻探討 ............................................................................................... 7. 第一節 畫面內預測(Intra Prediction) ............................................................... 7 第二節 畫面間預測(Inter Prediction) ............................................................... 8 第三節 H.264 上資訊隱藏的相關文獻............................................................ 9 第三章. H.264 之資訊隱藏技術 ....................................................................... 18. 第一節 運動向量之觀念................................................................................ 18 第二節 資訊隱藏方法 ................................................................................... 19 第三節 基於 bit-rate 的限制條件................................................................... 23 第四節 資訊萃取方法 ................................................................................... 24 第四章. H.264 之可逆式資訊隱藏技術............................................................ 26. 第一節 運動向量預測值(MVP)及運動向量差(MVD)之介紹 ....................... 26 第二節 可逆式資訊隱藏方法 ........................................................................ 27 第三節 資訊萃取與恢復方法 ........................................................................ 31 第五章. 實驗結果與數據分析 .......................................................................... 34. 第一節 資訊隱藏實驗參數設定 .................................................................... 34 第二節 資訊隱藏實驗之測試影片及客觀評估方式 ..................................... 35 第三節 本論文資訊隱藏之實驗數據 ............................................................ 37 iv.

(8) 第四節 本論文資訊隱藏與其他學者方法比較 ............................................. 41 第五節 可逆式資訊隱藏實驗參數設定......................................................... 44 第六節 可逆式資訊隱藏實驗之測試影片及客觀評估方式 .......................... 45 第七節 可逆式資訊隱藏之實驗數據 ............................................................ 46 第六章. 結論 ..................................................................................................... 49. 參考文獻 ................................................................................................................ 50. v.

(9) 圖. 次. 圖 1.1:H.264 編碼器架構...................................................................................... 2 圖 2.1:9 種畫面內預測模式................................................................................... 7 圖 2.2:16×16 畫面內預測模式 .............................................................................. 8 圖 2.3:畫面間預測模式的 7 種切割方式 .............................................................. 8 圖 2.4:依 X 軸分類之 MV 搜尋區域 ..................................................................... 9 圖 2.5:在資訊隱藏後 MVD 改變的幅度 .............................................................. 11 圖 2.6:修改 MVD 的 LSB 位元之資訊隱藏過程 ................................................. 11 圖 2.7:1/4 像素運動估計的搜尋圖 ...................................................................... 12 圖 2.8:對於第一組和第二組的嵌入過程 ............................................................ 14 圖 2.9:對於第三組和第四組的嵌入過程 ............................................................ 14 圖 2.10:已編碼的 4 × 4 亮度區塊和四個相鄰亮度區塊的關係.......................... 15 圖 3.1:運動估計 ................................................................................................... 18 圖 3.2:運動向量與鄰近的 4×4 座標點 ................................................................ 20 圖 3.3:嵌入流程圖 ............................................................................................... 21 圖 3.4:嵌入值計算的範例 ................................................................................... 22 圖 3.5:萃取流程圖 ............................................................................................... 25 圖 4.1:當前鄰近分割(相同尺寸) ......................................................................... 27 圖 4.2:當前鄰近分割(不同尺寸) ......................................................................... 27 圖 4.3:運動向量差之嵌入方法示意圖 ................................................................ 28 圖 4.4:嵌入流程圖 ............................................................................................... 29 圖 4.5:萃取與恢復流程圖 ................................................................................... 32 圖 5.1:原始視訊 ................................................................................................... 35 圖 5.2:無限制條件嵌入後視訊 ............................................................................ 35 圖 5.3:限制 MVx 或 MVy 不為零之嵌入後視訊 ................................................ 36 vi.

(10) 圖 5.4:可逆式嵌入後之視訊................................................................................ 45 圖 5.5:機密訊息提出並恢復後的視訊 ................................................................ 45. vii.

(11) 表. 次. 表 2.1:四個鄰近區塊與參考像素關係的五種分類 ............................................. 16 表 5.1:視訊格式 ................................................................................................... 34 表 5.2:JM 資訊隱藏相關參數 .............................................................................. 34 表 5.3:無限制條件之實驗數據 ............................................................................ 37 表 5.4:限制 MVx 或 MVy 不為零之嵌入後視訊之實驗數據 ............................. 37 表 5.5:無限制條件與原始視訊之比較數據......................................................... 38 表 5.6:限制 MVx 或 MVy 不為零之嵌入後視訊與原始視訊之比較數據 .......... 38 表 5.7:藏入機密訊息的 H.264 檔案大小與機密訊息壓縮後的檔案大小........... 40 表 5.8:Bridge-Close 序列的結果比較與 Hu 和 Wang 學者 ................................. 41 表 5.9:Carphone 序列的結果比較與 Hu 和 Wang 學者....................................... 41 表 5.10:Foreman 序列的結果比較與 Hu 和 Wang 學者 ...................................... 42 表 5.11:News 序列的結果比較與 Hu 和 Wang 學者 ........................................... 42 表 5.12:Silent 序列的結果比較與 Hu 和 Wang 學者........................................... 42 表 5.13:本論文提出之資訊隱藏方法與 Zhu 等學者提出之方法比較結果 ........ 43 表 5.14:可逆式資訊隱藏實驗的 JM 相關參數 .................................................... 44 表 5.15:可逆式嵌入之實驗數據 .......................................................................... 46 表 5.16:機密訊息提出並恢復後的視訊後之實驗數據 ....................................... 46 表 5.17:可逆式嵌入與原始視訊之比較數據....................................................... 47 表 5.18:可逆式恢復後視訊與原始視訊之比較數據 ........................................... 47. viii.

(12) 第一章. 介紹. 由於資訊的日新月異和網際網路的發展,藉由網路來傳遞資料,使資料傳遞 更為迅速便捷,但是也帶來了安全上的問題,因此資料的安全性和多媒體的版權 保護便成為重要的議題。資訊隱藏(Information. Hiding) 或數位浮水印 (Digital. Watermark)[1]是在數位多媒體中加入有意義的圖形或文字,用來做為數位多媒體 的版權或完整性的認證,此外,資訊隱藏可以應用於機密資料的傳送,即在多媒 體中嵌入所需傳送的機密訊息,且多媒體在嵌入機密訊息後,其視覺或聽覺上的 品質差異,不容易被人類的視覺或聽覺所察覺。因此,除了傳送者與接收者外, 沒有人知道資訊隱藏的事實,可以達到機密傳送的目的。 數位浮水印因應不同的應用,浮水印的技術會著重在不同的目標:容量 (Capacity)[2] 、 不 可 察 覺 性 (Invisible)[3] 、 強 韌 性 (Robustness)[4] 、 可 逆 性 (Reversible)[5]等。浮水印可依其嵌入方式,分成空間域(Spatial Domain)[6, 7]與 頻率域(Frequency Domain)[8, 9],空間域的嵌入是直接對空間域的像素值做修改, 來達到嵌入的效果,如最低有效位(Least Significant Bits, LSB) [10]等常見的方法, 但是容易破壞原圖的外觀,且較不能抵抗攻擊,而頻率域數位浮水印是利用特定 的公式如離散餘旋轉換(Discrete Cosine Transform, DCT),離散小波轉換(Discrete Wavelet Transform, DWT)等,將空間域像素值轉換為頻率域的係數,藉由轉換 後能量集中在低頻的特性,來選擇嵌入的位置,再利用演算法嵌入版權訊息,來 達成資訊的隱藏。 H.264/AVC 視訊格式[11, 12]是由國際電信聯盟標準化組織(ITU-T)的視訊編 碼專家組(VCEG)和國際化標準組織(ISO/IEC)的動態影像專家(MPEG)共同組成 的 聯 合 視 訊 組 (Joint Video Team) 所 開 發 的 最 新 視 訊 編 碼 標 準 , 被 稱 作 ISO/IEC14496-10 或 MPEG-4/AVC。此格式在 ITU-T 組織中命名為 H.264,在 ISO 組織中則納入 MPEG-4 Part10,但其編解碼技術是相同的,在研究上通常合併稱. 1.

(13) 為 H.264/AVC,其目的是希望能達到編碼效率的增加和極佳的視訊品質,此編解 碼技術也被稱為進階視訊編碼 (Advanced Video Coding, AVC)。 在視訊編碼中,主要的冗餘訊息是時間冗餘,其次是空間冗餘,而 H.264 視 訊壓縮[11, 12]的原理即是消除空間與時間的冗餘(Redundancy),來達到壓縮的目 的,透過畫面內預測(Intra-Prediction)來消除畫面內(Intra frame)的空間冗餘,以 畫面間預測(Inter-Prediction)來消除畫面與畫面間(Inter frame)的時間冗餘,透過 當前區塊與畫面內或畫面間預測所得的預測區塊相減,得到殘差區塊(Residual block),殘差區塊進行轉換(Transform)與量化(Quantize),並將轉換與量化後的係 數 進 行 熵 編 碼 (Entropy encode) , 其 中 熵 編 碼 為 適 應 性 變 動 長 度 編 碼 法 (Context-Based Adaptive. Variable. Length Coding, CAVLC)或前文參考之適應. 性二元算術編碼法(Context-Based Adaptive Binary Arithmetic Coding, CABAC), 如圖 1.1 所示。. 圖 1.1:H.264 編碼器架構 在 4×4 畫面內預測模式的編碼,由於有九種不同的畫面內預測方向,因此至 少需要 4 個位元才能夠正確地編碼所選擇的預測模式。為了減少編碼畫面內預測 模式所需要的位元,由於相鄰區塊的預測模式是有相關的,因此 H.264 提供最可 2.

(14) 能的模式(Most. Probable. Mode, MPM),是由上面和左邊區塊中較小的預測模. 式來決定的,如果所選擇的預測模式與 MPM 相符合,則只需要 1 個 flag 位元來 表示,否則,該 flag 被設為 0,並且需要額外 3 個位元來表示所選到的畫面內預 測模式。而在畫面間模式,因為相鄰區塊的運動向量(Motion Vector, MV)通常是 相關的,利用鄰近已編碼的運動向量來預測當前區塊的運動向量,只針對預測的 運動向量(MVP)與實際的運動向量(MV)的殘差值(MVD)進行編碼:MVD = MV MVP,這樣能有效的對運動向量進行壓縮。 在近幾年的視訊資訊隱藏技術中,有關於 H.264 壓縮標準所設計的視訊浮水 印系統,較常見的嵌入方法有:嵌入到頻率域的係數上或嵌入到視訊畫面內預測 模式(Intra-prediction mode)中[13][14][15][16][17][18][19],嵌入到畫面間預測的運 動 向 量 (Motion Vector) [20][21][22][23][24] ,及修改 適應性 變動 長度編 碼法 (CAVLC)係數值[25][26]等方法。 在頻率域的係數或畫面內預測模式的嵌入方法方面,Hu 等學者[13]在 2007 年,提出一種透過修改畫面內 4×4 預測模式的資訊隱藏技術,將資訊隱藏在畫面 內 4×4 編碼區塊(I4-block),透過修改該區塊的預測模式來嵌入 1 位元的資訊, 但是該方法的嵌入容量是較低的,此外,許多的畫面內預測模式被修改,導致位 元率(Bit-rate)明顯增加。 Li 等學者[14]在 2010 年,利用轉換和量化後的非零係數大部分為±1 的特性, 使用每個 4×4 亮度區塊經量化後的最後一個非零係數配合門檻值來進行資訊隱 藏,因此若門檻值選的合適,該方法對於視訊品質的影響是較小的。 Ma 等學者[15]在 2010 年,提出一種畫面內預測之沒有錯誤傳播(Error Propagation)的 H.264/AVC 資訊隱藏技術,利用修改量化後 4 ×4 DCT 亮度區塊中 的係數對,使得反 DCT 後之右邊或下面的像素值變化量為 0,每個量化後的 4×4 DCT 亮度區塊取三對係數來藏機密訊息,每組係數對可以用來嵌入一位元的資 訊,係數對的修改並不會影響參考像素,因為畫面內預測使用鄰近已編碼區塊來 預測,若在修改時避免修改到預測方向之參考像素,則可以避免錯誤傳播問題。 3.

(15) Yang 等學者[16]在 2011 年,提出一種基於矩陣編碼之 H.264 畫面內預測模 式的資訊隱藏技術,改進 Hu 等學者[13]之方法,將 9 種畫面內預測模式分為兩 類,第一類為奇數模式(1, 3, 5, 7),第二類為偶數模式(0, 2, 4, 6, 8),每三個 4×4 編碼區塊(I4-block)被表示為一組,基於映射規則的矩陣編碼將每兩個隱藏位元調 整到這三個 4×4 編碼區塊的預測模式,因此在相同組內只有一個 4×4 編碼區塊 的預測模式將會被修改,基於這種修改方式,在資訊隱藏之後可以得到較高的 PSNR 和輕微的位元率增加,此外,4×4 編碼區塊的選擇是透過嵌入位置的模版 來選擇的,這將進一步提高資訊隱藏的安全性。 Bouchama 等學者[17]在 2012 年,提出一種對於即時應用的 H.264/AVC 資訊 隱藏技術基於畫面內預測模式,在這個方法中,9 種畫面內預測模式被劃分為四 組,每組畫面內預測模式是由相鄰的畫面內預測模式所組成的,機密資訊的嵌入 是透過修改相同組的預測模式,這樣能保持良好的視覺品質及限制額外計算的數 目。 Lin 等學者[18]在 2013 年,提出一個基於 DCT 之 H.264 畫面內預測高容量 資訊隱藏技術,改進 Ma 等學者[15]方法之藏量。在 Ma 等學者所提出的方法中, 只有 46%的 4×4 亮度區塊可以用來嵌入機密訊息,而 Lin 等學者提出的修改 DCT 係數的方法,在不同的分類中額外嵌入 1 位元的機密訊息,充分利用剩餘 54% 的亮度區塊來嵌入機密訊息。 Su 等學者[19]在 2013 年,提出一種透過資訊隱藏在 H.264/AVC 中的私密保 護方法,在畫面當中一些較敏感或較私人的視覺資訊,不應該讓任何人都可以進 行觀看,該方法是將相關隱私區域的 4×4 畫面內預測模式都改為使用最可能的模 式(MPM),這樣的好處是能降低加密後視訊的大小,為了避免畫面內預測產生錯 誤傳播(Error Propagation)的問題,在隱私區域的周圍區塊也限制了可使用的預測 模式,避免使用到加密後的資訊來進行畫面內預測,而在畫面間預測模式只是用 較大的區塊,如 16×16、16×8、8×16,將其運動向量差(MVDx, MVDy)較大的垂 直分量或水平分量修改為 0,使運動向量在隱私區域將被解碼為錯誤的值,為了 4.

(16) 讓有授權的用戶可以恢復加密的視訊,正確的資訊如 4×4 畫面內預測模式、運動 向量差以及隱私區域的座標,將透過 F4 演算法[27]將這些資訊隱藏在量化後的 係數值當中,使有授權的用戶可以恢復正確的視訊內容。 在運動向量的嵌入方法方面,Wang 等學者[20]在 2008 年,提出一種利用運 動向量所屬的區域來嵌入資訊,每個宏塊(Macroblock)根據要嵌入的浮水印位元 來搜尋特定區域,並尋找誤差最小最匹配的運動向量來做運動估計,因此影像品 質略微下降。 Wang[21]等學者在 2008 年,提出一種基於運動向量及模式選擇的視訊浮水 印嵌入方法,透過限制運動向量的搜尋範圍來嵌入浮水印,與 Wang[20]不同的 地方在於,在該方法中模式的選擇也被考慮來嵌入浮水印,這樣可以有效改善視 訊的品質。 Liu 和 Chen 學者[22]在 2008 年,提出一種透過改變 H.264 中編碼塊的大小 來實現資訊隱藏的技術,在該方法中,他們分別為畫面內預測及畫面間預測的編 碼塊大小建立一個映射表來映射藏入的位元。首先將要藏入的資訊轉換為二進制, 並依照畫面內預測或畫面間預測來選擇映射表,如果要藏入的位元與目前使用的 編碼塊大小所對應的位元相同,則不做任何改變,否則,將強制修改為對應的編 碼塊大小。 Zhu 等學者[23]在 2010 年,提出的 H.264 資訊隱藏技術是基於 1/4 像素的運 動估計,將搜尋點依照奇偶性分為兩個組,資訊的嵌入是根據搜尋點和嵌入位元 之間的映射規則。 Hu 和 Wang 學者[24]在 2011 年,提出一種大容量的資訊隱藏技術,利用修 改每個運動向量差(MVDx , MVDy)的 LSB 位元來隱藏兩個位元的資訊,由於 MVD 的修改幅度是. ,其中. 為運動向量差的修改幅度,因此. 該方法對於視訊品質影響不大。 在 CAVLC 編碼法的嵌入方法方面,Liao 等學者[25]在 2009 年,提出一種利 用 CAVLC 之拖尾係數(Tailing Ones)的資訊隱藏技術,為了增加隱藏資訊的安全 5.

(17) 性,該方法利用 Logistic Chaotic Map 來選擇欲藏入資訊的區塊,並利用拖尾係 數的奇偶性來藏入隱藏位元,由於人類的視覺系統對於低頻部分較為敏感,而拖 尾係數(Tailing Ones)是屬於高頻的部分,因此視訊品質的下降是難以察覺的。 Li 等學者[26]在 2010 年,提出兩種不同的嵌入方式,分別為在畫面間編碼 中嵌入資訊以及在 CAVLC 中嵌入資訊,可以根據不同的應用環境來選擇不同的 嵌入方式,在畫面間編碼中嵌入資訊,該方式是將區塊的類型對應隱藏位元,例 如:16×16 對應位元 00,根據隱藏位元來強制改變匹配塊(Matching blocks)的大 小來完成隱藏資訊。在 CAVLC 中嵌入資訊,則是修改拖尾係數(Trailing Ones) 的符號位元來隱藏資訊,因為拖尾係數通常為高頻的係數並且都為±1,所以利用 拖尾係數符號位元的資訊隱藏方法,可以限制位元率(Bit-rate)的增加以及保證視 訊品質,也就是說,當需要較高的視訊品質時,資訊主要嵌入於畫面間編碼,而 當需要限制位元率時,則將資訊主要嵌入於 CAVLC 的拖尾係數中,此外,這兩 種嵌入方式可以被結合,來達到更好的視訊品質和位元率。 在本論文中,我們提出基於運動向量與運動向量差之特性的方法,來進行資 訊隱藏及可逆式資訊隱藏。對於資訊隱藏方法,我們依照所要藏入的機密訊息來 修改運動向量至周圍鄰近點,以達到資訊隱藏的目的。此外,我們增加限制條件, 避免修改運動向量為零者,以減低嵌入後對視訊檔案大小的影響。而對於可逆式 資訊隱藏,我們則是依照運動向量差的數值,來決定該運動向量差是要進行位移 或藏入資訊。本文剩餘章節安排如下。第 2 章介紹一些 H.264 相關的資訊隱藏 技術;第 3 章介紹我們所提出的資訊隱藏方法;第 4 章介紹我們所提出的可逆 式資訊隱藏方法;第 5 章提出實驗結果;最後,在第 6 章中提出結論。. 6.

(18) 第二章. 文獻探討. 第一節 畫面內預測(Intra Prediction) 在 H.264 壓縮標準中, I 畫面(I-Frame)並沒有參考其他畫面(Frame)的資訊, I 畫面的編碼是採用類似 JPEG DCT 壓縮方式,透過鄰近已編碼宏塊(Macroblock) 的像素值來進行畫面內預測,主要是利用其空間上的相關性,來消除大量的冗餘 資訊量,臨近區塊的選擇一般是欲編碼區塊的左邊與上面兩個已編碼過的區塊。 H.264 畫面內預測分為三種模式:4×4 Luma Prediction Mode、16×16 Luma Prediction Mode、8×8 Chroma Prediction Mode。 1.. 4×4 Luma Prediction Mode H.264/AVC 在 4×4 亮度區塊提供了 9 種預測模式,如圖 2.1[18]所示,標示. 0~8 表示其預測方向及預測模式,其中 mode 2 表示 DC 模式,而圖中大寫 A~M 表示臨近已編碼過的像素,做為計算預測值的參考像素,4×4 預測模式適用於細 節紋理的區域。. 圖 2.1:9 種畫面內預測模式 7.

(19) 2.. 16×16 Luma Prediction Mode H.264/AVC 在 16×16 亮度區塊提供 4 種預測模式,如圖 2.2 所示,16×16 預. 測模式適用於平坦的區域。. 圖 2.2:16×16 畫面內預測模式 3.. 8×8 Chroma Prediction Mode 在 8×8 色度區塊的預測模式是類似於畫面內 16×16 亮度區塊的四種預測模. 式,只是模式的編號不同,包括 DC (mode 0)、Horizontal (mode 1)、Vertical (mode 2)、Plan (mode 3)。. 第二節 畫面間預測(Inter Prediction) H.264/AVC 利用時間相關性來做畫面間預測(Inter Prediction),每個 P 畫面 (P-frame)的宏塊(Macroblock)可以再細分為 16×16、16×8、8×16、8×8、8×4、4×8、 4×4 等 7 種不同的子區塊,如圖 2.3 所示。H.264/AVC 採用切割區塊的做法,如 果是屬於比較平滑的區域,可以用比較大的區塊進行分割,例如:16×16 的區塊 大小,如果碰到比較細微的地區,則用較小的區塊,例如:4×4 的區塊大小,來 更精確的預測移動區域的運動向量。. 圖 2.3:畫面間預測模式的 7 種切割方式 8.

(20) 第三節 H.264上資訊隱藏的相關文獻 Wang 等學者[20]在 2008 年,提出一種利用運動向量的嵌入方法,利用運動 向量所屬的區域來嵌入資訊,每個宏塊根據要嵌入的浮水印位元來搜尋特定區域 (如區域 I),並尋找誤差最小最匹配的運動向量來做運動估計,如圖 2.4 所示。運 動向量的搜尋區域以橫坐標分為兩類,如公式 2-1,MVx 大於等於零稱為區域 I, MVx 小於零稱為區域 II。. (2-1). II. I. 圖 2.4:依 X 軸分類之 MV 搜尋區域 依欲藏入之資訊修改其運動向量之數值,搜尋範圍如公式 2-2: 嵌入之位元為 :將. 設定為區域 的運動向量. 搜尋範圍. (2-2) 嵌入之位元為 :將. 設定為區域. 的運動向量. 利用一個運動向量 MV 來嵌入一個位元的執行步驟如下: 1. 根據要嵌入的位元,依照公式 2-2 設定 MV 的搜尋範圍。 2. 在搜尋範圍內,找到誤差最小最匹配的區塊。 3. 將運動向量 MV 修改成最匹配區塊的向量。 在取回資訊時,可依照運動向量所屬的搜尋區域,根據公式 2-2 判斷取出的 資訊,若 MV 屬於區域 I 則代表取回位元為 0,反之,MV 屬於區域 II 則取回位 元為 1。 Wang 等學者[21]在 2008 年,改善 Wang 等學者[20]的方法,利用運動向量 所屬區域及模式的選擇來嵌入浮水印。和 Wang 等學者[20]的方法相同,每個宏 9.

(21) 塊根據要嵌入的浮水印位元來搜尋特定區域(如區域 I),並尋找誤差最小最匹配 的運動向量來做運動估計,不同的地方,當要嵌入浮水印位元 0 時,可以選擇畫 面內預測模式或畫面間預測模式且運動向量設在區域 I,依照拉格朗日的成本函 數來評估,選擇所需成本較小者。依欲藏入之資訊修改其運動向量之數值或模式, 搜尋範圍如公式 2-3: 嵌入之位元為 :將. 設定為區域 的運動向量. 或採取畫面內預測模式. 搜尋範圍 =. 嵌入之位元為 :將. 設定為區域. (2-3). 的運動向量. 浮水印的嵌入過程如下描述: 1. 獲得該宏塊的運動向量及預測的運動向量。 2. 根據要嵌入的位元和公式 2-3,確認當前宏塊的搜尋範圍。 3. 在搜尋範圍內,找到誤差最小最匹配的區塊,並計算畫面間的拉格朗日成本。 4. 若嵌入之位元為 0 時,計算畫面內預測模式的拉格朗日成本。 5. 根據畫面間模式及畫面內模式的拉格朗日成本來決定當前宏塊的編碼模式。 6. 前往下一個宏塊。 在取回浮水印時,是非常容易和方便的,只要判斷該宏塊的編碼模式,若編 碼模式為畫面內預測模式則取回位元為 0,若編碼模式為畫面間預測,則需判斷 該運動向量所屬的區域,根據公式 2-3 來判斷取出的資訊。 Hu 和 Wang 學者[24]在 2011 年,提出一種大容量的資訊隱藏技術,利用修 改每個運動向量差(MVDx, MVDy)的 LSB 位元來隱藏兩個位元的資訊,由於 MVD 的修改幅度是. ,其中. 為運動向量差的修改幅度,如圖 2.5,. 所以該方法對於視訊品質影響不大,此外,該方法在隱藏資訊的取回是簡單而且 快速的,因為該方法只需要解碼運動向量差的部分,若 MVD 的 LSB 位元為 0 就取回位元 0,若 MVD 的 LSB 位元為 1 則取回位元 1。圖 2.6 顯示其藏入之位 元修改運動向量差的 LSB 位元,其中 WiWi+1 代表預藏入的兩個位元。. 10.

(22) 圖 2.5:在資訊隱藏後 MVD 改變的幅度. 圖 2.6:修改 MVD 的 LSB 位元之資訊隱藏過程. Zhu 等學者[23]在 2010 年,提出的 H.264 資訊隱藏技術是基於 1/4 像素的運 動估計,將搜尋點依照奇偶性分為兩個組,如公式 2-4,資訊的嵌入是根據搜尋 點和嵌入位元之間的映射規則,如公式 2-5,來調整 1/4 像素的運動估計的搜尋 點,如圖 2.7 所示。. (2-4) 如果嵌入位元為 ∈. (2-5) 如果嵌入位元為. 11.

(23) 圖 2.7:1/4 像素運動估計的搜尋圖 利用修改 1/4 像素運動估計的搜尋點來嵌入一個位元的執行步驟如下: 1. 根據嵌入位元,依照公式 2-4 來要選擇 M 或 N 組。 2. 利用率失真優化(Rate Distortion Optimization, RDO)來決定修改為哪一個搜尋 點,如公式 2-6。 ∈. ∈. }. (2-6). 如果嵌入位元為 = 如果嵌入位元為 3. 編碼 MV 到位元流(bit-streams)中。 在取回資訊時,依照運動向量的水平和垂直分量,根據公式 2-7 判斷取出的 資訊,當 MVx 和 MVy 相同時,取回位元 0,反之,則取回位元 1。 ⊕. ,其中. 代表取出的位元. (2-7). Li 等學者[14]在 2010 年,提出的 H.264 資訊隱藏技術,利用轉換和量化後 的非零係數大部分為±1 的特性,使用每個 4×4 亮度區塊經量化後的最後一個非 零係數來進行資訊隱藏。首先,根據隱藏資訊的大小以及視訊序列的特性來選擇 一個合適的門檻,門檻值實際上代表一個 Zig-Zag 掃瞄點的位置,範圍從 0 到 15, 12.

(24) 其次判斷搜尋到的最後一個非零係數的 Zig-Zag 位置是否大於該門檻值,若大於 該門檻值,則判斷該非零係數的奇偶性,依照公式 2-8、2-9 來進行資訊隱藏。 當嵌入位元為 0,非零係數 Va 將被修改為:. (2-8) 當嵌入位元為 1,非零係數 Va 將被修改為:. (2-9) 該方法在隱藏資訊的取回,首先判斷最後一個非零係數是否大於門檻值,若 大於門檻值,則根據非零係數的奇偶性來取回隱藏位元,當非零係數為偶數時取 回隱藏位元 1,當為奇數時則取回隱藏位元 0。 Bouchama 等學者[17]在 2012 年,提出一種對於即時應用的 H.264/AVC 資訊 隱藏技術,利用畫面內預測模式具有接近的預測方向及使用相同的預測樣本來計 算該預測值的特性,將九種畫面內預測模式劃分為 4 組,在相同組間的畫面內預 測模式是使用相同的預測樣本,因此能有效控制位元率的增加,基於這個想法, 模式的群組可以被定義如下: Group 1:Modes 1 and 8. Group 2:Modes 3 and 7. Group 3:Modes 2, 4, 5 and 6. Group 4:Modes 0 and 2. 對於第一組的嵌入過程,如果最佳模式等於 Mode 1 且最可能的模式(MPM) 是不等於 Mode 1 or 8,當浮水印位元等於 1 時,水平模式(Mode 1)是保持不變的, 反之,如果浮水印位元等於 0 時,它將會被修改成 Mode 8,類似地,如果最佳 模式等於 Mode 8 且最可能的模式(MPM)是不等於 Mode 1 or 8,當浮水印位元等 於 0 時,Mode 8 保持不變,反之,如果浮水印位元等於 1 時,它將會被修改成 Mode 1,相同的原理應用於第二組,如圖 2.8 所示。 13.

(25) 對於第三組,如果最佳模式等於 Mode 4, 5 and 6 時,將嵌入兩個位元到該模 式當中,修改過程如圖 2.9 所示,例如,如果最佳模式等於 Mode 4 且最可能的 模式(MPM)是不等於 Mode 4, 5 or 6,如果兩個連續的浮水印位元等於“ ”時,該 Mode 4 將被修改成 Mode 2;如果兩個連續的浮水印位元等於“ ”時,該 Mode 4 將不會被修改;如果兩個連續的浮水印位元等於“10”時,該 Mode 4 將被修改成 Mode 5;如果兩個連續的浮水印位元等於“ ”時,該 Mode 4 將被修改成 Mode 6。 對於第四組,如果最佳模式等於 Mode 0,並且最可能的模式(MPM)是不等 於 Mode 0,只有當連續兩個浮水印位元等於“ ”時,該 Mode 0 將被修改為 Mode 2(DC),當連續兩個浮水印位元等於“ ”、“ ”、 “ ”時,將不進行浮水印的嵌 入。. 圖 2.8:對於第一組和第二組的嵌入過程. 圖 2.9:對於第三組和第四組的嵌入過程. 該方法在機密訊息的取回是相當容易的,從畫面內編碼的 4×4 區塊的預測模 式中,我們可以很容易判斷出所嵌入的機密訊息,根據圖 2. 8 及 2. 9 各個模式所 相對應的浮水印位元,例如,當最佳模式等於 Mode 4 且最可能的模式(MPM)是 14.

(26) 不等於 Mode 4, 5 or 6,則取出兩個浮水印位元為“01”; 當最佳模式等於 Mode 5 且最可能的模式(MPM)是不等於 Mode 4, 5 or 6,則取出兩個浮水印位元為“ ”; 當最佳模式等於 Mode 6 且最可能的模式(MPM)是不等於 Mode 4, 5 or 6,則取出 兩個浮水印位元為“ ”,對於特殊情況,最佳模式等於 Mode 2 且最可能的模式 (MPM)是不等於 Mode 0, 4, 5 or 6,則取出兩個浮水印位元“ ”。 Lin 等學者[18]在 2013 年,提出一個基於 DCT 之 H.264 畫面內預測高容量 資訊隱藏技術,改進 Ma 等學者[15]方法之藏量。圖 2.10 為編碼過程中,已編 碼的 4 × 4 亮度區塊. 和四個相鄰亮度區塊的關係,根據所選用的預測模式, 、. 、 、 、 、 、 將成為預測. 、. 、. 、. 時的參考像素。. Lin 等學者將已編碼的 4 × 4 亮度區塊和四個相鄰亮度區塊的關係分成五類,如 表 2.1 所示,其中 Case1 代表區塊 參考像素;Case2 代表區塊 像素,Case3 代表區塊. 所選用的預測模式(Mode)使用到 和. 所選用的預測模是會用到. 所選用的預測模是會用到. 中的. 中的參考. 中的參考像素。藏入. 資訊的方法是藉由修改 QDCT(Quantized DCT Coefficients)後的係數來代表嵌入 的機密訊息,QDCT 係數的修改方式會避開對參考像素之影響,而這些參考像 素是用來預測四個相鄰亮度區塊,所以可以避免錯誤傳播問題(Error Propagation Problem)。. 圖 2.10:已編碼的 4 × 4 亮度區塊和四個相鄰亮度區塊的關係 15.

(27) 表 2.1:四個鄰近區塊與參考像素關係的五種分類. 在畫面內預測的編碼過程中,給定預編碼的區塊 Block)為. ,相對應之殘餘區塊(Residual Block)為. ,其預測區塊(Predicted ,其關係式為. 。4 × 4 亮度區塊的殘餘區塊經過 DCT 轉換和量化後之係數矩陣稱為. ,. 其轉換方式如公式 2-10 所示。. (2-10). 對於類別 Cat1,Lin 等學者定義垂直之係數對 SV={(Y10,Y12), Y20,Y22), Y30,Y32) Y00,Y02)},其中前三個係數對為 Ma 等學者所提出之嵌入係數對,Lin 等學者所提 出的方法增加一個係數對(Y00,Y02)來增加藏量。如果 4 × 4 亮度區塊屬於 Cat1,則 對 SV 中每一個係數對(Ymn,Ypq),若其值為(0,0)則不藏,否則透過公式 2-11 來藏 入一位元的機密訊息 h,藏完後的結果為(Y’mn,Y’pq):. (2-11). 當. 屬於 Cat2 或 Cat4 時,其嵌入方法與 Cat1 類似。當. 屬於 Cat3 時,則. 16 個係數中的每一個係數 Ymn 皆可以用來嵌入一個位元,當 Ymn 為 0 時不藏,否 則透過公式 2-12 來藏入一位元的機密訊息 h,藏完後的結果為 Y’mn:. 16.

(28) (2-12). 當. 屬於 Cat5 時則定義一個四重係數(Y00,Y02,Y20,Y22)來嵌入一個位元。當四. 蟲係數全為 0 時不藏,否則透過公式 2-13 來藏入一個位元的機密訊息 h,藏完後 的結果為(Y’00,Y’02,Y’20,Y’22):. (2-13). 在取回機密訊息時,只需檢驗修改後係數對中第一個係數的奇偶性,便可取 回藏入之機密訊息,取回機密訊息方法如下面公式 2-14、2-15。 如果當前的亮度區塊屬於 Cat1、Cat2 或 Cat4 時,檢查每對修改後的係數對 (Y’mn,Y’pq),若其值為(0,0)代表沒有藏入機密訊息,否則透過第一個係數 Y’mn 來 取回機密訊息,如公式 2-14: (2-14) 如果當前的亮度區塊屬於 Cat3,檢查每個非零係數 Y’mn 的奇偶性,便可取 該亮度區塊中的機密訊息。如果當前的亮度區塊屬於 Cat5,檢查四重係數對 (Y’00,Y’02,Y’20,Y’22)若其值為(0,0,0,0),代表沒有藏入訊息,否則利用第一個係數 Y’00 取回機密訊息,如公式 2-15: (2-15). 17.

(29) 第三章. H.264之資訊隱藏技術. 本章將介紹我們提出的視訊隱藏技術,由先前章節的介紹得知,H.264 在編 碼的過程中會將每個畫面(Frame)進行細部的處理,首先會將畫面依照紋理的不 同分割成不同大小的宏塊(Macroblock),隨後進行畫面內預測或畫面間預測得到 殘餘值,最後再將殘餘值進行轉換以及量化。. 第一節 運動向量之觀念 由前面章節提到 H.264 是利用畫面間的相關性,使用區塊為基礎的方式來描 述移動的資訊,因為移動軌跡都可以被描述,故我們只需要編碼送出第一個畫面 及每個區塊的移動軌跡資訊,重建時只需要將每一個區塊依照自己的軌跡重建即 可,這種用來描述移動的資訊我們稱之為運動向量(Motion Vector),利用運動向 量,我們可以做畫面間的運動補償預測,運動估計的程序是以前一個參考畫面及 目前畫面為輸入,在參考畫面中找到與目前畫面最匹配之宏塊,輸出每一個區塊 的運動向量(參考畫面與目前畫面該區塊之位移),如圖 3.1 運動估計,並做運動 補償。 運動補償預測器的功能是利用前一個參考畫面,加上每一個方塊的運動向量, 建立出一個目前畫面的預測畫面,達到畫面間的運動補償預測,之後將目前畫面 減去預測畫面便得到誤差影像,誤差影像再經過編碼送出。. 圖3.1:運動估計 18.

(30) 第二節 資訊隱藏方法 在本文中,我們提出一個基於運動向量之特性的方法,來進行資訊的藏入, 假設目前畫面為 P 畫面,我們所需要儲存的資料主要為目前畫面以及參考畫面的 移動資訊,並記錄兩個畫面間的運動向量,利用修改運動向量來達到資訊隱藏的 效果,依照所要藏入的機密訊息來修改運動向量至周圍鄰近點,如圖 3.2 嵌入示 意圖,圖 3.3 嵌入流程圖,詳細的演算法如下描述。. 嵌入演算法(Embedding Algorithm) 輸入:原始視訊 H、機密訊息 S 輸出:偽裝視訊 H’ 1. 輸入原始視訊 H,讀取畫面間預測運動向量MV(Motion vector),假設修改前 的運動向量為(u, v),其中 u 為MV之橫坐標,而 v 為MV之縱坐標。 2. 將運動向量(u, v)和其 4×4 範圍內的鄰近點代入公式 3-1 計算函數值: F(u’, v’) = [4 × (u’ mod 4) + (v’ mod 4)] mod 16, 其中 .. (3-1). 3. 從 S 中讀取 4 位元的機密訊息,並將它轉換成十進制之數值 val,選擇 4×4 鄰近點滿足 F(u’, v’) = val,將其運動向量(u, v)修改成新的運動向量(u’, v’)。 4. 重複執行上述步驟,直到所有機密訊息都被嵌入或視訊序列已結束。 5. 輸出偽裝視訊 H’. 19.

(31) 例如,欲藏入之資訊為 0000,則將運動向量修改,使其運動向量(u’, v’)帶入 公式後為 F(u’, v’) = 0,若欲藏入之資訊為 0001,則將運動向量修改,使其運動 向量(u’, v’)帶入公式後為 F(u’, v’) = 1,若欲藏入之資訊為 0010,則將運動向量 修改,使其運動向量(u’, v’)帶入公式後為 F(u’, v’) = 2,以此類推達到嵌入的效果, 一個運動向量可以藏入 4 個位元。. MV= (u, v). (u-1,v-1). (u-1,v). (u-1,v+1). (u-1,v+2). ○. ○. ○. ○. (u,v-1). (u,v). (u,v+1). (u,v+2). ○. ○. ○. ○. (u+1,v-1). (u+1,v). (u+1,v+1). (u+1,v+2). ○. ○. ○. ○. (u+2,v-1). (u+2,v). (u+2,v+1). (u+2,v+2). ○. ○. ○. ○. 圖3.2:運動向量與鄰近的4×4座標點. 20.

(32) 嵌入算法開始. 搜尋最匹配區塊. 處理下一個區塊. 紀錄最匹配區塊 MV. 從起始點開始 找鄰近 4×4 區域. 根據機密訊息和 F(u’, v’)修改 MV 到 對應位置. No. 視訊序列是 否結束?. Yes 嵌入演算法結束. 圖3.3:嵌入流程圖. 21.

(33) 以下舉例說明本論文的藏入方法,若欲藏入之機密訊息為 0001,且起始點之 運動向量(u, v) = (2, 2)。將起始點和附近 4 × 4 範圍鄰近點帶入公式 3-1,將運動 向量修改到 F(u’, v’) = 1 的位置,所以(u’, v’) = (4, 1),如圖 3.4 所示。 (1,1). (2,1). (3,1). (4,1). F(u’, v’) = 5. F(u’, v’) = 9. F(u’, v’) = 13. F(u’, v’) = 1. (1,2). (2,2). (3,2). (4,2). F(u’, v’) = 6. F(u’, v’) = 10. F(u’, v’) = 14. F(u’, v’) = 2. (1,3). (2,3). (3,3). (4,3). F(u’, v’) = 7. F(u’, v’) = 11. F(u’, v’) = 15. F(u’, v’) = 3. (1,4). (2,4). (3,4). (4,4). F(u’, v’) = 4. F(u’, v’) = 8. F(u’, v’) = 12. F(u’, v’) = 0. 圖3.4:嵌入值計算的範例. 22.

(34) 第三節 基於bit-rate的限制條件 若原始的運動向量(MVx 或 MVy)有較多等於零時,意味著該視訊序列屬於 比較靜態的序列,此時,若因機密訊息的藏入,而將運動向量(MVx 或 MVy)修 改成非零,這將會導致 bit-rate 的大量增加,因為 H.264 針對運動向量(MVx, MVy) = (0, 0)時,會採用特殊的編碼方式,如:略過模式(Skip Mode),因此我們將避免 修改到原始 MVx 等於零或原始 MVy 等於零,此外,我們也必須確保藏入後的 MVx 或 MVy 不等於零,以保證能順利提取藏入的機密資訊。詳細的限制條件如 下描述。. 限制條件(Limit Rules): 1. 若MVx == 0 && MVy != 0 時,修改MVy來藏入兩個bit,並且注意修改後的 MVy不等於0,若修改後的MVy等於0,則MVy需加4或減4,以保證能順利提 取藏入的機密資訊。 2. 若MVx != 0 && MVy == 0 時,修改MVx來藏入兩個bit,並且注意修改後的 MVx不等於0,若修改後的MVx等於0,則MVx需加4或減4,以保證能順利提 取藏入的機密資訊。 3. 若MVx !=0 && MVy != 0時,修改MVx及MVy來藏入四個bit,並且注意修改 後的MVx及MVy不等於0,若修改後的MVx或MVy等於0,則MVx或MVy需加 4或減4,以保證能順利提取藏入的機密資訊。. 23.

(35) 第四節 資訊萃取方法 透過上一節的嵌入算法得知,機密資訊的嵌入是藉由修改紀錄運動資訊的運 動向量,因此我們只需要將修改後的運動向量代入公式 3-1,判斷其代表的數值 便可取回所藏入的機密資訊,對於無限制條件之萃取機密訊息的方法如下描述, 其萃取流程如圖 3.5 所示。 萃取演算法 (Extracting Algorithm) 輸入:偽裝視訊 H’ 輸出:機密訊息 S 1. 從偽裝視訊H’讀取運動向量(u’, v’),將其運動向量(u’, v’)代回公式3-1。 2. 計算F(u’, v’)得到十進制數值val,將十進制數值val轉換成4位元的機密訊息 S。 3. 重複執行上述步驟,直到所有機密訊息都被提取或視訊序列已結束。輸出機 密訊息 S。. 24.

(36) 萃取演算法 開始. 讀取 MV 資料. 代入公式 3-1 計算 F(u’, v’)值 取回機密訊息. 讀取下一個 MV 資料. No. 所有 MV 是 否處理完畢 Yes 萃取演算法結束. 圖3.5:萃取流程圖. 我們接續上一個範例來說明萃取的方法。偽裝視訊所讀取的運動向量(u’, v’) = (4, 1),代入公式 3-1,F(u’, v’) = 1,所以萃取出機密訊息 0001。. 25.

(37) 第四章. H.264之可逆式資訊隱藏技術. 在本章中,我們提出視訊上之可逆式資訊隱藏技術,我們利用每個區塊的運 動向量差(Motion Vector Difference)來進行視訊上之可逆式資訊隱藏。在 H.264 編 碼過程中,因為相鄰區塊的運動向量(Motion Vector)是有相關性的,因此 H.264 在編碼時只針對運動向量差(Motion Vector Difference)來進行編碼,這樣可以有效 減少編碼所需要的資訊量。. 第一節 運動向量預測值(MVP)及運動向量差(MVD)之介紹 在編碼每個區塊的運動向量時需要相當多的位元量(bits),特別是使用較小 分割的區塊,像是 4×4 的區塊。在 H.264 編碼中,為了有效減少傳輸的位元量, 可以利用相鄰區塊的運動向量具有較強的相關性,因此運動向量可以透過鄰近已 編碼的區塊來進行運動向量的預測,即運動向量預測值(MVP),並針對當前的運 動向量(MV)與運動向量預測值(MVP)的運動向量差(MVD)進行編碼:即 MVD = MV - MVP,最終只有運動向量差(MVD)被編碼和傳送,這樣能有效的對運動向 量進行壓縮。 假設 E 為當前區塊或區塊分割的子分割,A、B、C 分別為 E 的左、上、右 上方的三個對應區塊,如果 E 的左邊不止一個分割,取其中最上方的一個區塊 為 A;如果 E 的上方不止一個分割時,取最左邊一個為 B,圖 4.1 顯示所有分割 具有相同尺寸時的鄰近分割的選擇,圖 4.2 顯示不同尺寸時鄰近分割的選擇。 1. 當區塊的分割不等於16×8和8×16時,運動向量預測值(MVP)為A、B、C區塊 運動向量的中值。 2. 當區塊分割為16×8時,上半區塊的運動向量預測值(MVP),透過B區塊的運動 向量來預測,下半區塊的運動向量預測值(MVP),透過A區塊的運動向量來預 測。 3. 當區塊分割為8×16時,左半區塊的運動向量預測值(MVP),透過A區塊的運動 向量來預測,右半區塊的運動向量預測值(MVP),透過C區塊的運動向量來預 測。 26.

(38) 圖 4.2:當前鄰近分割(不同尺寸). 圖4.1:當前鄰近分割(相同尺寸). 第二節 可逆式資訊隱藏方法 可逆式資訊隱藏方法(Reversible Data Hiding)在嵌入機密訊息到掩護媒體後, 可在機密訊息取出時完全恢復嵌入前掩護媒體的內容。在本文中,我們提出一個 基於畫面間預測的運動向量差異值之可逆式資訊隱藏技術,運動向量差是當前的 運動向量與運動向量預測值的差值,透過修改運動向量差,來達到資訊隱藏的目 的,並且在機密訊息的提取後,我們可以完全恢復原始的運動向量差。 我們所提出的基於運動向量差之可逆式資訊隱藏方法,利用運動向量差為 1 或 -1 的部分來嵌入資料,詳細的演算法如下描述。. 嵌入演算法(Embedding Algorithm) 輸入:原始視訊 H、機密訊息 S 輸出:偽裝視訊 H’ 1. 輸入原始視訊 H,讀取畫面間預測運動向量MV(Motion vector),假設當前運 動向量為. ,運動向量預測值為. ,其中 u 為MV之橫坐標,而 v 為. MV之縱坐標。 2. 將運動向量(u, v)和運動向量預測值 = 3. 將運動向量差. 代入公式 4-1 計算運動向量差:. -. (4-1) 根據公式 4-2 進行嵌入機密訊息 S 與位移(Shifting)。. 27.

(39) (4-2) ∈ ∈ ∈ ∈ 其中. 為修改後的運動向量差,b ∈ {0,1}為欲嵌入之機密訊息S。. 4. 重覆執行上述步驟直到所有的機密訊息都被嵌入。 5. 輸出偽裝視訊 H’ 。. 圖 4.3 為我們的嵌入方法示意圖,實心座標點代表可以用來嵌入一位元的機 密訊息,虛線箭頭代表位移(Shifting)的方向。圖 4.4 為嵌入流程圖。. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ●. ●. ●. ○. ○. ○. ○. ○. ○. ●. ○. ●. ○. ○. ○. ○. ○. ○. ●. ●. ●. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. ○. 圖4.3:運動向量差之嵌入方法示意圖. 28.

(40) 嵌入算法開始. 搜尋最匹配區塊. 處理下一個區塊. 紀錄最匹配區塊 MV. 計算運動向量差. 根據機密訊息及公 式 4-2 修改 到對應位置. No. 視訊序列是 否結束?. Yes 嵌入演算法結束. 圖4.4:嵌入流程圖. 29.

(41) 以下舉例說明本論文的藏入方法,若欲藏入之機密訊息 S 為 101,且計算後 的運動向量差分別為{MVD1 = (-1, 2)、MVD2 = (-1, 1)、MVD3 = (-2, 0)、MVD4 = (-1, 0)、MVD5 = (-1, -2)、MVD6 = (-1, -1)}。將運動向量差及機密訊息帶入公式 4-2, 將運動向量差進行位移及嵌入機密訊息修改到. 的位置。. 運動向量差計算過程如下描述。 1. MVD1 = (-1, 2) 代入公式 4-2 得知需進行位移,則 MVD1 被修改為(-1, 3),使 (-1, 2)這個位置可用來嵌入機密訊息。 2. MVD2 = (-1, 1) 代入公式 4-2 得知可進行嵌入機密訊息且 S1 = 1,則 MVD2 被 修改為(-1, 2)這個位置。 3. MVD3 = (-2, 0) 代入公式 4-2 得知需進行位移,則 MVD3 被修改為(-3, 0),使 (-2, 0)這個位置可用來嵌入機密訊息。 4. MVD4 = (-1, 0) 代入公式 4-2 得知可進行嵌入機密訊息且 S2 = 0,則 MVD4 還 是等於(-1, 0)。 5. MVD5 = (-1, -2) 代入公式 4-2 得知需進行位移,則 MVD5 被修改為(-1, -3), 使 (-1, -2)這個位置可用來嵌入機密訊息。 6. MVD6 = (-1, -1) 代入公式 4-2 得知可進行嵌入機密訊息且 S3 = 1,則 MVD6 被修改為(-1, -2)這個位置。. 30.

(42) 第三節 資訊萃取與恢復方法 透過上一節的嵌入演算法得知,機密訊息的嵌入是藉由修改運動向量差為±1 的部分,因此我們可以根據修改後的運動向量差. 代入公式 4-3,來萃取. 所藏入的機密訊息 b,並透過公式 4-4 來進行恢復,萃取機密訊息與恢復的方法 如下描述,其萃取與恢復流程如圖 4.5 所示。. (4-3) ∈. ∈ ∈ ∈ ∈ 其中. 為修改後的運動向量差,. (4-4). 為恢復後的運動向量差。. 萃取與恢復演算法 (Extracting Algorithm) 輸入:偽裝視訊 H’ 輸出:機密訊息 S、恢復後的視訊 H’’ 1. 讀取偽裝視訊H’,將H’之運動向量差. 代入公式4-3萃取機密訊息S。. 2. 根據公式4-4將運動向量差進行反向位移(Shifting)來達到恢復的效果。 3. 輸出機密訊息 S 及恢復後的視訊 H’’。. 31.

(43) 萃取演算法 開始. 讀取 MVD 資料. 代入公式 4-3 依照 所在的位 置取回機密訊息. 讀取下一個 MVD 資料. 根據公式 4-4 將運動 向量差反向位移達 到恢復效果. No. 所有 MVD 都處理完畢 Yes 萃取演算法結束. 圖4.5:萃取與恢復流程圖. 32.

(44) 我們接續上一個範例來說明萃取與恢復的方法。機密訊息的提取與恢復如下 描述。 1. MVD1 = (-1, 3),代入公式 4-3,沒有提取機密資訊,再代入公式 4-4 進行反 向位移,則 MVD1 被恢復為(-1, 2)。 2. MVD2 = (-1, 2)代入公式 4-3 提取出機密訊息 b = 1,再代入公式 4-4 則進行反 向位移,則 MVD2 = (-1, 2)被恢復為(-1, 1)。 3. MVD3 = (-3, 0),代入公式 4-3,沒有提取機密資訊,再代入公式 4-4 進行反 向位移,則 MVD3 被恢復為(-2, 0)。 4. MVD4 = (-1, 0)代入公式 4-3 提取出機密訊息 b = 0,再代入公式 4-4 不需要進 行反向位移,則 MVD4 = (-1, 0)。 5. MVD5 = (-1, -3),代入公式 4-3,沒有提取機密資訊,再代入公式 4-4 進行反 向位移,則 MVD5 被恢復為(-1, -2)。 6. MVD6 = (-1, -2)代入公式 4-3 提取出機密訊息 b = 1,再代入公式 4-4 則進行反 向位移,則 MVD6 = (-1, -2)被恢復為(-1, -1)。. 33.

(45) 第五章. 實驗結果與數據分析. 前兩章介紹了我們所提出的資訊隱藏方法,在本章透過實驗來證實我們所提 出的資訊隱藏方法及可逆式資訊隱藏之可行性,我們使用 H.264/AVC 的原始碼 為 JVT(joint video team)所發布之 JM13.2 [28]原始碼作為實驗的基礎。. 第一節 資訊隱藏實驗參數設定 本實驗使用 Akiyo、Bridge-Close、Carphone、Container、Foreman、Highway、 Mobile、News、Salesman、Silent 等十個 QCIF 視訊格式檔案為測試影像,QCIF 為通用影像傳輸格式,是視訊會議(Video conference)中常使用的影像傳輸格式, 解析度為 176 × 144 畫素,影像傳輸可達每秒 30 frame,符合 ITU 視訊會議資料 傳輸協定。表 5.1 為視訊格式、表 5.2 為 JM 資訊隱藏相關參數。 表5.1:視訊格式 格式. 影像解析度. SQCIF. 128 × 96. QCIF. 176 × 144. CIF. 352 × 288. 4CIF. 704 × 576. 16CIF. 1408 × 1152. 表5.2:JM資訊隱藏相關參數 Profile. Baseline. YUV format. 4:2:0. Sequence type. IPPP. Motion estimation scheme. Full search. Image format. QCIF. 34.

(46) 第二節 資訊隱藏實驗之測試影片及客觀評估方式 以下為本實驗使用 Akiyo、Bridge-Close、Carphone、Container、Foreman、 Highway、Mobile、News、Salesman、Silent 等十個 QCIF 視訊格式,做為測試影 片並實驗分析其影像品質上之影響。以第 15 個 frame 為例,圖 5.1 為原始測試視 訊、圖 5.2 為無限制條件嵌入後視訊、圖 5.3 為有限制條件嵌入後視訊。. (a). (b). (c). (d). (e). (f). (g). (h). (i). (j). 圖5.1:原始視訊:(a)Akiyo、(b)Bridge-Close、(c)Carphone、(d)Container、(e)Foreman、 (f)Highway、(g)Mobile、(h)News、(i)Salesman、(j)Silent. (a). (b). (c). (d). (e). (f). (g). (h). (i). (j). 圖 5.2:無限制條件嵌入後視訊:(a)Akiyo、(b)Bridge-Close、(c)Carphone、 (d)Container、(e)Foreman、(f)Highway、(g)Mobile、(h)News、(i)Salesman、(j)Silent. 35.

(47) (a). (b). (c). (d). (e). (f). (g). (h). (i). (j). 圖 5.3 :限制 MVx或MVy不為零 之嵌入後視訊: (a)Akiyo 、 (b)Bridge-Close、 (c)Carphone 、 (d)Container 、 (e)Foreman 、 (f)Highway 、 (g)Mobile 、 (h)News 、 (i)Salesman、(j)Silent 在實驗中,影片在經過嵌入修改後,一般可以利用峰值訊號雜訊比 (Peak Signal-to-Noise Ratio; PSNR) 來客觀評估其影像品質變化,其定義如下:. 其中 MSE 是原始影像與偽裝影像的均方差(Mean Square Error; MSE) ,MSE 的 定義如下:. Pi,j Pi,j'. 其中, Pi,j 與 Pi,j' 分別代表原始影像與偽裝影像上的像素值;M 與 N 表示影像的寬 度與高度。. 36.

(48) 第三節 本論文資訊隱藏之實驗數據 表 5.3 ~ 5.6 為針對本實驗使用 Akiyo、Bridge-Close、Carphone、Container、 Foreman、Highway、Mobile、News、Salesman、Silent 等十個測試影片的實驗數 據,每個測試影片取前 30 個 frame 來做實驗,影片在經過嵌入修改之後計算其 PSNR 值與藏量,評估其影像品質、位元率變化。其中,Video size 為嵌入資訊 後的偽裝視訊之檔案大小,單位為位元。 表5.3:無限制條件之實驗數據 Video Sequence. Embedding Capacity(bits). Video size. PSNR Y. PSNR U. PSNR V. Foreman. 182848. 158768. 36.92. 40.69. 42.21. Akiyo. 183232. 55784. 38.71. 40.87. 41.81. Carphone. 181056. 133000. 37.56. 40.57. 40.98. Container. 182912. 66776. 36.51. 40.94. 40.71. Highway. 181248. 86760. 38.08. 37.95. 38.68. Mobile. 183616. 531968. 34.25. 35.79. 35.17. News. 181696. 102968. 37.12. 39.81. 40.38. Salesman. 183616. 112360. 35.87. 39.58. 40.27. Silent. 181632. 109554. 36.19. 39.02. 40.02. Bridge-Close. 183744. 136544. 35.08. 37.29. 37.94. 表5.4:限制MVx或MVy不為零之嵌入後視訊之實驗數據 Video Sequence. Embedding Capacity(bits). Video size. PSNR Y. PSNR U. PSNR V. Foreman. 124784. 154032. 38.86. 40.70. 42.36. Akiyo. 12694. 38560. 38.59. 40.99. 41.79. Carphone. 102480. 128008. 37.55. 40.55. 41.05. Container. 13244. 50232. 36.47. 40.95. 40.73. Highway. 67240. 78200. 38.06. 37.94. 38.66. Mobile. 148390. 526656. 34.24. 35.75. 35.15. News. 20578. 84520. 37.05. 39.76. 40.37. Salesman. 23944. 94432. 35.81. 39.54. 40.21. Silent. 26196. 93320. 36.15. 39.00. 40.00. Bridge-Close. 7944. 111600. 35.01. 37.24. 37.92. 37.

(49) 表5.5:無限制條件與原始視訊之比較數據 Video Sequence. Embedding Capacity(bits). Increase in Bit-rate(%). PSNR Y. PSNR U. PSNR V. Foreman. 182848. +10.96. +0.04. +0.03. +0.02. Akiyo. 183232. +48.39. +0.12. -0.1. +0.03. Carphone. 181056. +9.95. +0.03. +0.06. +0.04. Container. 182912. +32.87. +0.04. -0.04. +0.01. Highway. 181248. +16.91. +0.02. +0.01. +0.01. Mobile. 183616. +5.81. +0.03. +0.02. -0.01. News. 181696. +23.72. +0.07. +0.01. +0.02. Salesman. 183616. +22.79. +0.05. +0.04. +0.04. Silent. 181632. +20.18. +0.01. +0.01. 0. Bridge-Close. 183744. +22.10. +0.07. +0.04. +0.01. 表5.6:限制MVx或MVy不為零之嵌入後視訊與原始視訊之比較數據 Video Sequence. Embedding Capacity(bits). Increase in Bit-rate(%). PSNR Y. PSNR U. PSNR V. Foreman. 124784. +7.65. +1.98. +0.04. +0.17. Akiyo. 12694. +2.58. 0. +0.02. +0.01. Carphone. 102480. +5.82. +0.02. +0.04. +0.11. Container. 13244. -0.05. 0. -0.03. +0.03. Highway. 67240. +5.38. 0. 0. -0.01. Mobile. 148390. +4.75. +0.02. -0.02. -0.03. News. 20578. +1.56. 0. -0.04. +0.01. Salesman. 23944. +3.20. -0.01. 0. -0.02. Silent. 26196. +2.37. -0.03. -0.01. -0.02. Bridge-Close. 7944. -0.21. 0. -0.01. -0.01. 38.

(50) 我們從這些實驗結果可以看出,視訊之 PSNR 值略微下降,但是人眼幾乎沒 有察覺,透過實驗數據的分析,我們發現在無限制條件時,動態之測試影片 (Carphone、Foreman、Mobile),因為影片的運動較劇烈使得找到之最匹配區塊與 修改後區塊相差無幾,並且本身的運動向量有許多不為零的情況,此時修改運動 向量來嵌入機密訊息,將會使得位元率輕微上升,相較而言,靜態之測試影片 (Akiyo、News、Salesman),因為找到之最匹配區塊與修改後區塊相差較大,並 且本身的運動向量有許多等於零的情況,此時修改運動向量來嵌入機密訊息,將 導致位元率增加較多。在這種的情況下,應避免修改運動向量等於零的情況,相 對的藏量會有一點程度的損失,但可以使位元率的增加達到有效的控制,並且對 影像品質方面影響較小。 在我們的實驗中,每個測試影片取前 30 個 frame 來做實驗,測試影片的解 析度為 176 × 144,除了第一個畫面為 I frame,其餘畫面皆為 P frame,因此有 29 個 P frame 可以被用來嵌入,而一個 P frame 中有 99 個 16×16 大小的區塊,一個 16×16 大小的區塊裡面有 16 個 4×4 大小的區塊,每個 4×4 大小的區塊,透過我 們提出來的方法一個運動向量可以藏 4 bits,故最大藏量 29 × 99 × 16 × 4 = 183744 bits 機密訊息。. 39.

(51) 此外,在實驗中我們發現了一個很有趣的現象:嵌入後的偽裝視訊的檔案大 小比所嵌入的機密訊息之大小還要小。例如,以表5.3中的Akiyo為例,藏入的機 密資訊為183,232位元,但是藏完後的偽裝視訊為55,784位元,其大小比機密資訊 還小。所以,與其直接傳送機密訊息,不如應用我們的方法將機密訊息藏入視訊 檔後再傳送,如此可以減少傳送的資料量。表5.7顯示藏入機密訊息的H.264檔案 大小與機密訊息壓縮後的檔案大小,其中機密訊息的壓縮方式,是將其轉成8個 位元為一組的ASCII Code,存成純文字檔後進行Zip壓縮。由於機密訊息是0與1 的亂碼,所以用Zip壓縮的效果不明顯。表5.7顯示,機密訊息壓縮後的平均檔案 大小為22,915 byte(約22.37 KB),但是將機密訊息藏入H.264的視訊檔中,視訊檔 的平均檔案大小為18,681 byte(約18.24 KB),比起壓縮後的機密訊息還要小。表 5.7中的Mobile是個例外,可能是原始的Mobile檔案較大,並且其含有較多的細節 紋理。 表5.7:藏入機密訊息的H.264檔案大小與機密訊息壓縮後的檔案大小 原始視訊使用 H.264 編 碼器壓縮後的大小 Foreman Akiyo Carphone. 全藏 4 bit 並使用 H.264 編碼器壓縮後. 機密訊息純文字檔壓縮 後的大小. 17,885 byte(約 17.5 KB) 19,846 byte(約 19.3 KB). 22,950 byte(約 22.4 KB). 4,699 byte(約 4.6 KB). 6,973 byte(約 6.80KB). 15,121 byte(約 14.8 KB) 16,625 byte(約 16.2 KB). 22,998 byte(約 22.4KB) 22,725 byte(約 22.1 KB). Container. 6,282 byte(約 6.1 KB). 8,347 byte(約 8.15 KB). 22,958 byte(約 22.4 KB). Highway. 9,276 byte(約 9.1 KB). 10,845 byte(約 10.5 KB). 22,750 byte(約 22.2 KB). Mobile. 62,844 byte(約 61.4 KB) 66,496 byte(約 64.9 KB). 23,048 byte(約 22.5 KB). News. 10,403 byte(約 10.2 KB) 12,871 byte(約 12.5 KB). 22,806 byte(約 22.2 KB). Salesman. 11,438 byte(約 11.2 KB). 14,045 byte(約 13.7 KB). 23,048 byte(約 22.5 KB). Silent. 11,395 byte(約 11.1 KB). 13,693 byte(約 13.3 KB). 22,798 byte(約 22.2 KB). BridgeClose. 13,979 byte(約 13.7 KB). 17,068 byte(約 16.6KB). 23,064 byte(約 22.5 KB). Average. 16,332 byte (約 15.9KB) 18,681 byte(約 18.24KB). 22,915 byte(約 22.37 KB). 40.

(52) 第四節 本論文資訊隱藏與其他學者方法比較 此節使用 Bridge-Close、Carphone、Foreman、News、Silent 等五個測試影片, 我們提出之方法(限制 MVx 或 MVy 不為零)與 Hu 和 Wang 學者[24]、Zhu 等學者 [23]提出之方法比較,影片嵌入修改後之 PSNR 值與藏量比較,實驗數據如表 5.8~5.13。. 表5.8:Bridge-Close序列的結果比較與Hu和Wang學者. proposed. Hu [24]. PSNR Y. 35.01. 35.00. PSNR U. 37.24. 37.27. PSNR V. 37.92. 37.96. BRI(%). -0.21. +1.26. 7944. 6396. Embedding Capacity (bits). 表5.9:Carphone序列的結果比較與Hu和Wang學者. proposed. Hu [24]. PSNR Y. 37.55. 37.50. PSNR U. 40.55. 40.49. PSNR V. 41.05. 40.94. BRI(%). +5.82. +0.6. 102480. 13260. Embedding Capacity (bits). 41.

(53) 表5.10:Foreman序列的結果比較與Hu和Wang學者. proposed. Hu [24]. PSNR Y. 38.86. 36.87. PSNR U. 40.70. 40.65. PSNR V. 42.36. 42.19. BRI(%). +7.65. +1.31. 124784. 18255. Embedding Capacity (bits). 表5.11:News序列的結果比較與Hu和Wang學者. proposed. Hu [24]. PSNR Y. 37.05. 37.05. PSNR U. 39.76. 39.80. PSNR V. 40.37. 40.34. BRI(%). +1.56. +0.89. 20578. 7630. Embedding Capacity (bits). 表5.12:Silent序列的結果比較與Hu和Wang學者. proposed. Hu [24]. PSNR Y. 36.15. 36.18. PSNR U. 39.00. 38.99. PSNR V. 40.00. 40.03. BRI(%). +2.37. +0.83. 26196. 9432. Embedding Capacity (bits). 42.

(54) 表5.13:本論文提出之資訊隱藏方法與Zhu等學者提出之方法比較結果. proposed BRI(%). Zhu [23]. Embedding. BRI(%). Capacity (bits). Embedding Capacity (bits). Foreman. +7.65. 124784. -0.10. 18554. Carphone. +5.82. 102480. -0.01. 12000. Container. -0.05. 13244. +0.2. 1688. Highway. +5.38. 67240. -0.17. 9478. News. +1.56. 20578. +0.05. 7130. Silent. +2.37. 26196. -0.02. 7564. Bridge-Close. -0.21. 7944. +0.03. 3456. 在這節實驗中我們的方法與 Hu 和 Wang 學者、Zhu 等學者之方法做比較, 從實驗結果中可以看出,我們提出之方法視訊之 PSNR 值與 Hu 和 Wang 學者提 出之方法沒有明顯的差異,在視覺上是難以察覺的,而機密訊息的藏量部分,我 們所提出的方法,藏量遠遠比 Hu 和 Wang 學者、Zhu 等學者提出之方法來的多, 但是在 BRI(Increase in Bit-rate)卻有顯著的增加,範圍從 1.56%到 7.65%。. 43.

(55) 第五節 可逆式資訊隱藏實驗參數設定 本實驗使用 Akiyo、Bridge-Close、Carphone、Container、Foreman、Highway、 Mobile、News、Salesman、Silent 等十個 QCIF 視訊格式檔案為測試影片,表 5.14 為我們的可逆式資訊隱藏實驗在 JM 程式上的相關參數。. 表5.14:可逆式資訊隱藏實驗的JM相關參數 Profile. Baseline. YUV format. 4:2:0. Sequence type. IPPPPPPPPP. Motion estimation scheme. Full search. Image format. QCIF. Number Reference Frames. 10. 44.

(56) 第六節 可逆式資訊隱藏實驗之測試影片及客觀評估方式 以下為本實驗使用 Akiyo、Bridge-Close、Carphone、Container、Foreman、 Highway、Mobile、News、Salesman、Silent 等十個 QCIF 視訊格式,做為測試影 片並實驗分析其影像品質上之影響,以下取第 15 個 frame 做呈現,圖 5.4 為可逆 式嵌入後之視訊、圖 5.5 為機密訊息提出並恢復後的視訊。. (a). (b). (c). (d). (e). (f). (g). (h). (i). (j). 圖 5.4:可逆式嵌入後之視訊:(a)Akiyo、(b)Bridge-Close、(c)Carphone、(d)Container、 (e)Foreman、(f)Highway、(g)Mobile、(h)News、(i)Salesman、(j)Silent. (a). (b). (c). (d). (e). (f). (g). (h). (i). (j). 圖5.5:機密訊息提出並恢復後的視訊:(a)Akiyo、(b)Bridge-Close、(c)Carphone、 (d)Container、(e)Foreman、(f)Highway、(g)Mobile、(h)News、(i)Salesman、(j)Silent. 45.

(57) 第七節 可逆式資訊隱藏之實驗數據 表 5.15 ~ 5.18 為針對 Akiyo、Bridge-Close、Carphone、Container、Foreman、 Highway、Mobile、News、Salesman、Silent 等十個測試影片的實驗數據,每個 測試影片取前 30 個 frame 來做實驗,影片在經過嵌入修改之後計算其 PSNR 值 與藏量,評估其影像品質、位元率變化。其中,Video size 為嵌入資訊後的偽裝 視訊之檔案大小,單位為位元。 表5.15:可逆式嵌入之實驗數據 Video Sequence. Embedding Capacity(bits). Video size. PSNR Y. PSNR U. PSNR V. Foreman. 1422. 181424. 28.48. 40.50. 41.63. Akiyo. 441. 74152. 36.94. 40.85. 41.94. Carphone. 1338. 152968. 31.02. 40.65. 41.18. Container. 320. 95168. 33.31. 41.12. 40.69. Highway. 741. 96768. 34.09. 37.95. 38.71. Mobile. 3509. 581320. 22.11. 34.50. 32.81. News. 661. 131752. 32.21. 38.95. 40.34. Salesman. 992. 143424. 33.16. 39.68. 40.30. Silent. 664. 138672. 34.77. 39.04. 40.04. Bridge-Close. 566. 162928. 34.66. 37.25. 37.98. 表5.16:機密訊息提出並恢復後的視訊後之實驗數據 Video Sequence. PSNR Y. PSNR U. PSNR V. Foreman. 37.04. 40.79. 42.47. Akiyo. 38.83. 40.99. 41.96. Carphone. 37.8. 40.72. 41.35. Container. 36.95. 41.18. 40.88. Highway. 38.3. 37.95. 38.71. Mobile. 34.35. 36.09. 35.53. News. 37.41. 39.94. 40.66. Salesman. 36.1. 39.7. 40.32. Silent. 36.38. 39.06. 40.07. Bridge-Close. 35.22. 37.25. 37.98. 46.

(58) 表5.17:可逆式嵌入與原始視訊之比較數據 Video Sequence. Embedding Capacity(bits). Increase in Bit-rate(%). PSNR Y. PSNR U. PSNR V. Foreman. 1422. +1.18. -8.56. -0.32. -0.82. Akiyo. 441. +0.65. -1.90. -0.15. -0.02. Carphone. 1338. +1.50. -6.79. -0.06. -0.15. Container. 320. +0.48. -3.64. -0.06. -0.19. Highway. 741. +0.67. -4.23. 0. -0.01. Mobile. 3509. +0.61. -12.25. -1.6. -2.73. News. 661. +0.70. -5.20. -1.0. -0.31. Salesman. 992. +1.12. -2.94. -0.04. -0.01. Silent. 664. +0.37. -1.62. -0.02. -0.04. Bridge-Close. 566. -0.27. -0.58. 0. -0.01. 表5.18:可逆式恢復後視訊與原始視訊之比較數據 Video Sequence. PSNR Y. PSNR U. PSNR V. Foreman. 0. -0.03. +0.02. Akiyo. -0.01. -0.01. 0. Carphone. -0.01. +0.01. +0.02. Container. 0. 0. 0. Highway. -0.02. 0. -0.01. Mobile. -0.01. -0.01. -0.01. News. 0. -0.01. +0.01. Salesman. 0. -0.02. +0.01. Silent. -0.01. 0. -0.01. Bridge-Close. -0.02. 0. -0.01. 47.

(59) 我們從這些實驗結果可以看出,雖然視訊之 PSNR 值有明顯下降,但是大部 分的 PSNR 都還是維持在 30. 以上,因此人眼幾乎沒有察覺,除了 Foreman. 及 Mobile 這兩個視訊外。透過實驗數據的分析,我們發現在比較動態之測試影 片(Carphone、Foreman、Mobile),因為影片的運動較劇烈,使得運動向量差有許 多不為零的情況,此時我們修改運動向量差來進行位移及嵌入機密訊息,將會對 影像品質方面影響較大,相較而言,靜態之測試影片(Akiyo、News、Salesman), 因為本身的運動向量差有許多等於零的情況,在我們的嵌入方法中,運動向量差 等於零時,將不會做任何的修改,在這種的情況下,對於影像品質方面影響較小。 此外,我們所提出的可逆式資訊隱藏方法,將機密訊息提取出來後,並將運動向 量差修改為正確的運動向量差後,可以恢復成與 H.264 編碼器所產生的視訊幾乎 一致的品質。 在理論上,我們所提出的基於運動向量差的可逆式資訊隱藏方法應該是完全 可逆的,但是實驗結果顯示有些微的差異,可能是因為 H.264 編碼器自行做了某 些調整,導致我們所提出的方法無法完全可逆,只能與 H.264 編碼器所產生的視 訊非常相近,而這正是我們未來想要克服的問題。. 48.

(60) 第六章. 結論. 本論文提出使用 H.264 畫面間預測的運動向量及運動向量差之特性,來實現 資訊隱藏與可逆式資訊隱藏的技術。對於資訊隱藏,我們藉由修改運動向量至臨 近區域來藏入機密資訊,每一個運動向量而言,最多可以藏入四個位元。對於可 逆式資訊隱藏,我們則透過修改運動向量差的數值,來進行位移或藏入機密訊息。 實驗結果顯示,我們提出之資訊隱藏方法,在藏入機密訊息之後,影像品質並沒 有明顯的變化,但在 BRI(Increase in Bit-rate)卻有顯著的增加,在機密資訊的提 取過程中,不需要原始視訊做比對,即可取出所藏入的資訊,並具有相當不錯的 藏量。而我們提出之可逆式資訊隱藏方法,在藏入機密訊息後,視訊之 PSNR 雖 然有明顯下降,但是大部分的 PSNR 都還是維持在 30. 以上,因此人眼幾乎沒. 有察覺。此外,我們所提出之可逆式資訊隱藏方法,在將機密訊息提取出來後, 並將運動向量差修改為正確的運動向量差後,可以恢復成與 H.264 編碼器所產生 的視訊幾乎一致的品質。. 49.

(61) 參考文獻 [1] 張真誠、黃國峰、陳同孝,電子影像技術(Electronic Imaging Techniques), 松崗電腦圖書資料股份有限公司,2000 年 12 月. [2] Y.K. Lee, L.H. Chen, “Hi h Capacit. ma e te an raph ,”. r cee in s. on Vision Image, and Signal Processing, Volume 147, no. 3, pp. 288-294, 2000. [3] Y. . Kim, O.H. K. n an. . ark, “Wave et. Di ita ma es Usin the Human isua. ase Watermarkin. stem,”. ethod for. ectr nics Letters,. ume 3 ,. no. 6, pp. 466-468, Mar. 1999. [4] C. . Lu, .K. Huan , C.J. ze, an H.Y. . Lia , “C cktai Watermarkin f r Di ita ma e r tecti n,”. Transacti ns n. u time ia,. ume 2, no. 4,. Dec. 2000. [5]. .U. Ce ik, G. harma, A. . Teka p, an Data mbe. in ,”. . aber, “L ss ess Genera ize -LSB. Transacti ns n ma e r cessin ,. ume 4, n . , pp.. 253-266, Feb. 2005. [6]. . . H an , C.C. Chan , K.F. H an , “A Watermarkin Technique Based on One–Wa. Hash Functi ns”,. Transacti ns. n C nsumer. ectr nics,. Volume 45, no. 2, pp. 286-294, 1999. [7]. .L. Lin, “. bust Transparent. echanisms,” The J urna. f. ma e Watermarkin stems an. stem. ith. patia. ft are,. ume. , pp.. 7-116,. Di ita. i nature f r. ma e. 2000. [8] C. . Lu, an. H.Y. . Lia , “ tructura. Authenticati n: An nci enta Dist rti n. esistant cheme,’’. Transacti n. on Multimedia, Volume 5, no. 2, pp. 161-173, Jun. 2003. [9] J. Spaulding, H. Noda, M.N. Shirazi, and E. Ka a uchi, “ Usin. ZW L ss C mpresse. ma es”, attern ec 50. C. te an raph. niti n Lett.,. ume 3,.

數據

圖 1.1:H.264  編碼器架構
圖 2.1:9 種畫面內預測模式
表 2.1:四個鄰近區塊與參考像素關係的五種分類
圖 5.3:限制MVx或MVy不為零之嵌入後視訊: (a)Akiyo 、 (b)Bridge-Close、

參考文獻

相關文件

Depending on the specified transfer protocol and data format, this action may return the InstanceID of an AVTransport service that the Control Point can use to control the flow of

• The  ArrayList class is an example of a  collection class. • Starting with version 5.0, Java has added a  new kind of for loop called a for each

In this paper, we propose a practical numerical method based on the LSM and the truncated SVD to reconstruct the support of the inhomogeneity in the acoustic equation with

we use data (random sample) to test if the data provides significant evidence to reject the null hypothesis.. If X > c reject

It is well known that the Fréchet derivative of a Fréchet differentiable function, the Clarke generalized Jacobian of a locally Lipschitz continuous function, the

A=fscanf(fid , format, size) reads data from the file specified by file identifier fid , converts it according to the specified format string, and returns it in matrix A..

For the data sets used in this thesis we find that F-score performs well when the number of features is large, and for small data the two methods using the gradient of the

• In the present work, we confine our discussions to mass spectro metry-based proteomics, and to study design and data resources, tools and analysis in a research