第三章 浮水印檢測分析
4.2 特定模型的解碼機制
4.2.1 解碼演算的簡化
因此公式(4.3)中的每項
A
j皆可分成:( )
1(
, ,)
4.2.2 解碼函數的統計分析
[ ] { [ ]
2}
我們將(4.13)、(4.14)式帶回(4.11)、(4.12)式中,便可求得 時 的 平均與變異值,其中
應用中央極限定理(central limit theorem),可把(4.10)式中 的分 佈當成是高斯的向量機率函數,據此再推出其位元誤碼機率。列出 平均
2
[ ]
4.3 非特定模型的解碼機制
[證明]:
因為s
為獨立且同型分佈(i.i.d.)隨機變數,由中央極限定理可因此最大可能性隱藏訊息的決定可以當成是每個位元的逐一解碼,如(4.24)
在此所謂的可調
c
值,是利用(3.11)式事先估算個別轉換係數的c
, 而固定c
值則是為了簡化分析而設定所有c
值為相同。k
k
, −1
結論:圖 4.2 與圖 4.3 顯示出單一位元(
b
0∈{ 1 })、不同秘密金鑰之解 碼函數r
的分布情形。可發現不論固定c
值或可調c
值,對加印音訊 嵌入訊息b
或b
所得到之r
值的分布有明顯差距,可據此準確 地判斷音訊嵌入之隱藏訊息為 1 或-1。另外將不同位元(N
=1、2、4) 解碼函數之統計特性分別列於表 4.2、表 4.3、表 4.4 及表 4.5 中,比較解碼器對不同位元浮水印的解碼效能,可觀察出實驗值與理論 值具有一致性。進一步觀察,餘弦係數機率模型的參數
c
對解碼效 能有很大之影響,在固定c
值中以c
=0.5 之解碼效能達到最佳,可 調式c
值亦與c
=0.5 之效能相當接近。弦樂四重奏N
位元特定模型 解碼效能的理論值示於圖 4.4,觀察可得在位元數愈高時,可調式c
值能得到較佳的解碼效能;而固定c
值中以c
=0.5 之解碼效能達到 最佳。特別強調的一點是,解碼效能隨著位元數的增加而遞減,因 為在位元數越高時,所加入訊息的可能情形越多,造成解碼越不易。0
0 =1 0 = −1 0
0 10 20 30 40 50 60 70 80 90 100 0
1000 2000 3000 4000 5000 6000 7000 8000
K (PN Sequence index)
r0 C=0.5
C=1 C=2 Adaptive C
圖 4.2 弦樂四重奏在單一位元(
b
0 =1)特定模型中的解碼值分布C=0.5 C=1 C=2 Adaptive C
N=1,
b
0 =1實驗值 理論值 實驗值 理論值 實驗值 理論值 實驗值 理論值 SNR
(dB) 38.44 39.47 36.67 38.42 34.83 33.65 39.06 37.82[ ]0
E r 4.61 10 ⋅
34.60 10 ⋅
35.32 10 ⋅
35.30 10 ⋅
31.20 10 ⋅
41.19 10 ⋅
47.73 10 ⋅
37.74 10 ⋅
3[ ]
0Var r 3.05 10 ⋅
32.39 10 ⋅
36.08 10 ⋅
34.03 10 ⋅
34.73 10 ⋅
46.14 10 ⋅
47.43 10 ⋅
39.88 10 ⋅
3表 4.2 弦樂四重奏單一位元(
b
0 =1)特定模型解碼值的統計特性0 10 20 30 40 50 60 70 80 90 100 -8000
-7000 -6000 -5000 -4000 -3000 -2000 -1000 0
K (PN sequence index)
r0
C=0.5 C=1 C=2
Adaptive C
圖 4.3 弦樂四重奏在單一位元(
b
0 = −1)特定模型中的解碼值分布C=0.5 C=1 C=2 Adaptive C
N=1,
b
0= − 1 實驗值 理論值 實驗值 理論值 實驗值 理論值 實驗值 理論值 SNR
(dB) 38.43 39.47 36.66 38.42 34.82 33.65 39.06 37.82[ ]
0E r − 4.60 10 ⋅
3− 4.60 10 ⋅
3− 1.20 10 ⋅
4− 1.19 10 ⋅
4− 7.73 10 ⋅
3− 7.74 10 ⋅
3[ ]
0Var r 3.05 10 ⋅
32.39 10 ⋅
36.08 10 ⋅
34.03 10 ⋅
34.73 10 ⋅
46.14 10 ⋅
47.43 10 ⋅
39.88 10 ⋅
35.30 10
3− ⋅ − 5.30 10 ⋅
3表 4.3 弦樂四重奏單一位元(
b
0 = −1)特定模型解碼值的統計特性C=0.5 C=1 C=2 Adaptive C
SNR
35.53 36.53 34.65 35.46 32.09 31.46 36.43 36.64[ ]
0SNR
33.15 33.57 32.60 32.55 29.18 28.86 34.10 33.80[ ]
00 25 50 75 100 125 150 175 200 225 250 10
15 20 25 30 35 40
Average of SNR for watermarking decoding for string quartet
N (number of watermarked bits)
Average of SNR (dB)
C=0.5 C=1 C=2 Adaptive C
圖 4.4 弦樂四重奏
N
位元特定模型解碼效能的理論值[實驗 4-2]
目的:針對弦樂四重奏音樂,探討在非特定之轉換係數機率模型中,不同位 元之隱藏訊息
b
對浮水印解碼函數r
i及其效能之影響。步驟: 我們考慮單一位元(
N = 1
且M
=2)的浮水印Β = b { }
0 ,及兩個位元 (N = 2
,M
=22 =4 ) 的 浮 水 印Β = b b {
0,
1, b b
2,
3}
, 及 四 個 位 元N = 4
(
M
=24 =16)的浮水印Β
={ b
0, b1, , b15}
。實驗中我們將這些隱藏訊息 分別以不同的 100 組虛擬亂數製成浮水印,再嵌入於相同的弦樂四 重奏音樂中,製成 100 組不同的加印音訊,再對其做解碼。結論: 圖 4.5 顯示出在單一位元、不同秘密金鑰,非特定模型的解碼值 分 布情形,可發現針對不同隱藏訊息,解碼值 的分布具有相當差距,
故可正確解碼出嵌入之隱藏訊息。表 4.6 及表 4.7 列出不同隱藏位元 的解碼值統計特性,其中亦可發現理論值與實驗值具有一致性,且 解碼效能隨著位元數的增加而遞減。特別強調的是與實驗 4-1 作比 較,我們可發現特定模型確實比非特定模型得到較佳的解碼效能,
這是因為在我們所實驗的環境下,係數分布確實可用廣義高斯機率 模型來近似;但非特定模型解碼器可省略模型分析過程且應用範圍 更廣泛。
r
0r
0
0 10 20 30 40 50 60 70 80 90 100
-1.5 -1 -0.5 0 0.5 1
1.5x 104 Distribution of r0 for decoding 1-bit watermarking
K (PN sequence index)
r0
Decode b=1 Decode b=-1
圖 4.5 弦樂四重奏單一位元在非特定模型解碼值分布
N=1,
b
0= 1
N=1,b
0=− 1 實驗值 理論值 實驗值 理論值 SNR
(dB) 34.04 33.65 34.03 33.65[ ]
0E r 1.19 10 ⋅
41.19 10 ⋅
4− 1.19 10 ⋅
4− 1.19 10 ⋅
4[ ]
0Var r 5.62 10 ⋅
46.14 10 ⋅
45.62 10 ⋅
46.14 10 ⋅
4表 4.6 弦樂四重奏單一位元非特定模型解碼值的統計特性
N=2 N=4
實驗值 理論值 實驗值 理論值
Aveeage (dB)
SNR
30.60 31.46 27.57 28.86[ ]
0SNR r
(dB) 29.12 28.21 21.82 25.49[ ]
1SNR r
(dB) 31.70 33.29 28.54 26.13[ ]
2SNR r
(dB) X X 16.79 17.11[ ]
3SNR r
(dB) X X 31.37 33.54表 4.7 弦樂四重奏雙位元、四位元在非特定模型中解碼值的統計特性
[實驗 4-3]
目的:針對鋼琴音樂,探討在特定模型與非特定模型中,單一隱藏位元之 浮水印解碼效能,並與弦樂四重奏音樂的實驗結果作比較。
步驟:我們考慮單一位元(
N
=1,M
=2)的浮水印。實驗中我們將這些隱藏訊息 分別以不同的 100 組虛擬亂數製成浮水印,再嵌入於鋼琴音樂中,製成 100 組不同的加印音訊,再對其做解碼。
結論:比較表 4.8 與表 4.3,表 4.9 與表 4.6,我們可發現鋼琴音樂之解碼效 能較差,這是因為鋼琴音樂之理論 值(示於圖 3.5)分布較亂,不若 弦樂四重奏音樂般集中。此外,亦可發現鋼琴音樂在固定 c 值之解 碼效能以 c=1 時達到最佳。至於其它統計特性,則可得到與弦樂四 重奏音樂類似的結果,舉例而言,不論固定
c
值或可調c
值,對加 印音訊及原始音訊所得到之r
值的分布有明顯差距,可據此準確地判 斷音訊嵌入之隱藏訊息;亦可觀察出實驗值與理論值具有一致性,由圖 4.6 我們亦可發現解碼效能隨著位元數的增加而遞減。
c
ki
Piano C=0.5 C=1 C=2 Adaptive C
N=1,
b
0= − 1 實驗值
l理論值 實驗值 理論值 實驗值 理論值 實驗值 理論值 SNR
(dB) 25.89 27.40 26.58 28.54 25.79 26.13 27.03 27.47[ ]
0E r − 7.83 10 ⋅
2− 7.79 10 ⋅
2− 1.07 10 ⋅
3− 1.06 10 ⋅
3− 1.85 10 ⋅
3− 1.84 10 ⋅
3− 1.31 10 ⋅
3− 1.29 10 ⋅
3[ ]
0Var r 1.58 10 ⋅
31.10 10 ⋅
32.51 10 ⋅
31.57 10 ⋅
39.05 10 ⋅
38.29 10 ⋅
33.41 10 ⋅
32.98 10 ⋅
3表 4.8 鋼琴單一位元特定模型解碼值的統計特性
Piano N=1 N=1,
b
0= − 1 實驗值 理論值
SNR (dB)
1 25.82 26.13[ ]
0E r − 1.86 10 ⋅
3− 1.84 10 ⋅
3[ ]
0Var r 9.05 10 ⋅
38.29 10 ⋅
3表 4.9 鋼琴單一位元非特定模型解碼值的統計特性
0 50 100 150 200 250 0
5 10 15 20 25 30
Average of SNR for watermarking decoding for piano
N (number of watermarked bits)
Average SNR (dB)
C=0.5 C=1 C=2 Adaptive C
圖 4.6 鋼琴 N 位元特定模型解碼效能的理論值
[實驗 4-4]
目的:針對長笛音樂,探討在特定模型與非特定模型中,單一隱藏位元之 浮水印解碼效能,並與弦樂四重奏、鋼琴音樂的實驗結果作比較。
步驟:我們考慮單一位元(
N
=1,M
=2)的浮水印。實驗中我們將這些隱藏訊息 分別以不同的 100 組虛擬亂數製成浮水印,再嵌入於長笛音樂中,製成 100 組不同的加印音訊,再對其做解碼。
結論:比較表 4.10、表 4.8 與表 4.3,表 4.11 表 4.9 與表 4.6,我們可發現長 笛音樂之解碼效能與弦樂四重奏相近,比鋼琴較佳,這是因為長笛
音樂之理論
c
值(示於圖 3.11)分布較鋼琴集中,而與弦樂四重奏音樂 相近。其統計特性則可得到與弦樂四重奏音樂類似的結果,舉例而 言,不論固定c
值或可調c
值,對加印音訊及原始音訊所得到之 值 的分布有明顯差距,可據此準確地判斷音訊嵌入之隱藏訊息;亦可 觀察出實驗值與理論值具有一致性,由圖 4.7 我們亦可發現解碼效 能隨著位元數的增加而遞減。另一值得注意的是:長笛音樂在可調c
值的解碼效能達到最佳。k
r
iFlute C=0.5 C=1 C=2 Adaptive C
N=1,
b
0= − 1 實驗值
l理論值 實驗值 理論值 實驗值 理論值 實驗值 理論值 SNR
(dB) 38.64 41.83 38.21 41.89 40.05 41.44 43.64 44.48[ ]
0E r − 7.85 10 ⋅
3− 7.84 10 ⋅
3− 1.10 10 ⋅
4− 1.10 10 ⋅
4− 5.00 10 ⋅
4− 4.99 10 ⋅
4− 1.59 10 ⋅
4− 1.59 10 ⋅
4[ ]
0Var r 8.42 10 ⋅
34.03 10 ⋅
31.83 10 ⋅
47.82 10 ⋅
32.47 10 ⋅
51.79 10 ⋅
51.09 10 ⋅
49.02 10 ⋅
3表 4.10 長笛單一位元特定模型解碼值的統計特性
Flute N=1 N=1,
b
0= − 1 實驗值 理論值
SNR (dB)
1 38.78 41.44[ ]
0E r − 4.99 10 ⋅
4− 4.99 10 ⋅
4[ ]
0Var r 3.30 10 ⋅
51.79 10 ⋅
5表 4.11 長笛單一位元非特定模型解碼值的統計特性
0 50 100 150 200 250 15
20 25 30 35 40 45
Average of SNR for watermarking decoding for flute
N (number of watermarked bits)
Average SNR (dB)
C=0.5 C=1 C=2 Adaptive C
圖 4.7 長笛 N 位元特定模型解碼效能的理論值
第五章 結論與未來展望
回顧本篇論文內容,主要是探討離散餘弦轉換域的加成性展頻音訊浮 水印設計,及浮水印檢測器與解碼器的整體效能分析。一開始我們先建立 音訊餘弦係數的廣義高斯機率分佈函數,並透過最大相似度檢測理論,推 導最小誤警機率 且最大確認機率 的浮水印檢測演算法;再根據最大相 似度解碼理論,推導最小誤碼機率 的浮水印解碼演算法。接著我們探討 一更廣泛之方法,如果無適當之機率模型可近似時,我們仍可透過降維轉 換
r
P
FP
DP
e( , )
=
h K y
之充分統計特性,應用最大相似度檢測與解碼理論,推導出相 關演算法;此方法並可得到降低計算量、省略模型分析過程及應用層面更 廣之優點。在論文中我們引入人耳遮蔽效應於音訊浮水印的嵌入架構,並 嘗試於浮水印檢測與解碼演算法則下建立一個效能分析的平台,藉以探討 各參數及不同之音樂與浮水印檢測解碼效能間的關係。經由分析模型的推 演結果發現,當可能隱藏訊息個數M
值增加時,對整個檢測的效能並無很 大的影響,但對解碼器的效能卻造成下降的現象。不論是特定的廣義高斯的機率分佈函數模擬,或是非特定的機率模 型,再配合人耳聽覺模型分析,發展出兼具透明度及安全性的音訊展頻浮 水印機制,推導出具快速實現的浮水印檢測與解碼演算法,並在理論分析
的實驗上有了初步令人滿意的具體成果。不過這些條件都是假設無訊號處 理失真,也就是
y
=z
z
的情況下推導出來的,因此在實際應用的層級上仍有 一段距離。畢竟經過網路傳輸或訊號處理,在正常的狀態下,接收端所接 收到的加印訊號 並不完全等於
y
。因此未來我們必須先推導條件機率函數y
p
z ,用來表示y
與 之間的關係,再應用最大相似度檢測與解碼理論,求 出z
≠ z
的情況下,快速可實現的相關演算法。y
此外,我們將浮水印先鎖定在音樂 CD,由於現今高壓縮率 MP3 技術的廣 泛應用,使得非法盜拷嚴重影響到智慧財產權。因此未來我們必須先求出 有無適用於 MP3 音樂的特定機率模型,再由此特定或非特定模型,配合最 大相似度檢測與解碼之理論分析,求出快速可實現之相關演算法。若能成 功發展出適用在 MP3 音樂上的技術,對智慧財產權之保護,將可得到更佳 之效果。
參考文獻
[1] M. D. Swanson, M. Kobayashi, and A. H. Tewfik, “Multimedia Data-embedding and Watermarking Technologies,” Proceedings of the IEEE, Vol. 86, Jun 1998, pp.
1064-1087.
[2] F. Hartung, and M. Kutter, “Multimedia Watermarking Techniques,” Proceedings of the IEEE, Vol. 87, Jul 1999, pp. 1079-1107.
[3] C. I. Podilchuk, and E. J. Delp, “Digital Watermarking: Algorithms and Applications,”
IEEESignal Processing Magazine, Vol. 18, Jul 2001, pp. 33-46.
[4] P. Bassia, I. Pitas, and N. Nikolaidis, “Robust Audio Watermarking in the Time Domain,” IEEE Transactions on multimedia, Vol. 3, Jun 2001, pp. 232-241.
[5] A. N. Lemma, J. Aprea, W. Oomen, and L. van de Kerkhof, “A Temporal Domain Audio Watermarking Technique,” IEEE Transactions on Signal Processing, Vol. 51, Apr 2003, pp. 1088-1097.
[6] Ye Wang, “A New Watermarking Method of Digital Audio Content for Copyright Protection,” Signal Processing Proceedings of
ICSP '98
, Vol. 2, 1998, pp. 1420-1423.[7] Xin Li, and H. H. Yu, “Transparent and Robust Audio Data Hiding in Subband Domain,” International Conference on Information Technology: Coding and Computing, 2000.
[8] Sang-Kwang Lee and Yo-Sung Ho, “Digital Audio Watermarking in the Cepstrum Domain,” IEEE Transactions on Consumer Electronics, Vol. 46, Aug 2000, pp.
744-750.
[9] L. Boney, A. H. Tewfik and K. N. Hamdy, “Digital Watermarking for Audio Signals,”
Processings of MULTIMEDIA
'
96, IEEE, 1996, pp. 473-480.[10] M. D. Swanson, B. Zhu, A. H. Tewfik and L. Boney, “Robust audio watermarking using perceptual masking,” Signal Processing, Vol. 66, Nov 1997, pp. 337-355.
[11] C. Neubauer, and J. Herre, “Digital Watermarking and its Influence on Audio Quality,”
AES.
[12] I. J. Cox, J. Kilian, F. T. Leighton, and T. Shamoon, “Secure spread spectrum watermarking for multimedia,” IEEE Transactions on Image Processing, Vol. 6, Dec 1997, pp. 1673-1687.
[13] I. I. Cox, M. L. Miller, and J. A. Bloom, “Digital Watermarking,” Morgan Kaufmann Publishers , 1st Edition, 2001.
[14] M. Kutter, and S. Winkler, “A vision-based masking model for spread-spectrum image watermarking,” IEEE Transactions on Image Processing, Vol. 11, Jan 2002, pp. 16-25.
[15] J. R. Hernandez, M. Amado, and F. Perez-Gonzalez, “DCT-domain watermarking techniques for still images: detector performance analysis and a new structure,” IEEE Transactions on Image Processing, Vol. 9, Jan 2000, pp.55-68.
[16] K. A. Birney, and T. R. Fischer, “On the modeling of DCT and subband image data for compression,” IEEE Transactions on Image Processing, Vol. 4, Feb 1995, pp.186-193.
[17] 許宇鳳, “影像與音訊之數位浮水印技術,” 國立台灣大學電信工程研究所碩士論 文, 2001.
[18] 張北辰, “音樂信號上的數位浮水印,” 國立台灣大學資訊工程研究所碩士論文, 2001.
[19] J. R. Hernandez, and F. Perez-Gonzalez, “Statistical Analysis of watermarking schemes for copyright protection of images,” Proceedings of the IEEE, Vol. 87, Jul 1999, pp.1142-1166.
[20] A. V. Oppenheim, R. W. Schafer, and J. R. Back, “Discrete-Time Signal Processing,”
Prentice Hall International, Inc, Second Edition, 1998.
[21] 蔡若望,“餘弦轉換統計模型在音訊浮水印之研究,”國立交通大學電信工程研究所
[21] 蔡若望,“餘弦轉換統計模型在音訊浮水印之研究,”國立交通大學電信工程研究所