解碼演算的簡化

第三章浮水印檢測分析

4.2 特定模型的解碼機制

4.2.1 解碼演算的簡化

因此公式(4.3)中的每項

A

_j皆可分成：

( )

(

^, ^,

)

4.2.2 解碼函數的統計分析

[ ] { [ ]

}

我們將(4.13)、(4.14)式帶回(4.11)、(4.12)式中，便可求得時的平均與變異值，其中

應用中央極限定理(central limit theorem)，可把(4.10)式中的分佈當成是高斯的向量機率函數，據此再推出其位元誤碼機率。列出平均

[ ]

4.3 非特定模型的解碼機制

[證明]：

因為

s

為獨立且同型分佈(i.i.d.)隨機變數，由中央極限定理可

因此最大可能性隱藏訊息的決定可以當成是每個位元的逐一解碼，如(4.24)

在此所謂的可調

c

值，是利用(3.11)式事先估算個別轉換係數的

c

，而固定

c

值則是為了簡化分析而設定所有

c

值為相同。

, −1

結論：圖 4.2 與圖 4.3 顯示出單一位元(

b

₀∈{ 1 })、不同秘密金鑰之解碼函數

r

的分布情形。可發現不論固定

c

值或可調

c

值，對加印音訊嵌入訊息

b

或

b

所得到之

r

值的分布有明顯差距，可據此準確地判斷音訊嵌入之隱藏訊息為 1 或-1。另外將不同位元(

N

=1、2、4) 解碼函數之統計特性分別列於表 4.2、表 4.3、表 4.4 及表 4.5 中，

比較解碼器對不同位元浮水印的解碼效能，可觀察出實驗值與理論值具有一致性。進一步觀察，餘弦係數機率模型的參數

c

對解碼效能有很大之影響，在固定

c

值中以

c

=0.5 之解碼效能達到最佳，可調式

c

值亦與

c

=0.5 之效能相當接近。弦樂四重奏

N

位元特定模型解碼效能的理論值示於圖 4.4，觀察可得在位元數愈高時，可調式

c

值能得到較佳的解碼效能；而固定

c

值中以

c

=0.5 之解碼效能達到最佳。特別強調的一點是，解碼效能隨著位元數的增加而遞減，因為在位元數越高時，所加入訊息的可能情形越多，造成解碼越不易。

0 =1 0 = −1 0

0 10 20 30 40 50 60 70 80 90 100 0

1000 2000 3000 4000 5000 6000 7000 8000

K (PN Sequence index)

r0 C=0.5

C=1 C=2 Adaptive C

圖 4.2 弦樂四重奏在單一位元(

b

₀ =1)特定模型中的解碼值分布

C=0.5 C=1 C=2 Adaptive C

N=1,

b

₀ =1

實驗值理論值實驗值理論值實驗值理論值實驗值理論值 SNR

(dB) 38.44 39.47 36.67 38.42 34.83 33.65 39.06 37.82

[ ]0

E r 4.61 10 ⋅

4.60 10 ⋅

5.32 10 ⋅

5.30 10 ⋅

1.20 10 ⋅

⁴

1.19 10 ⋅

⁴

7.73 10 ⋅

7.74 10 ⋅

[ ]

Var r 3.05 10 ⋅

2.39 10 ⋅

6.08 10 ⋅

4.03 10 ⋅

4.73 10 ⋅

⁴

6.14 10 ⋅

⁴

7.43 10 ⋅

9.88 10 ⋅

表 4.2 弦樂四重奏單一位元(

b

₀ =1)特定模型解碼值的統計特性

0 10 20 30 40 50 60 70 80 90 100 -8000

-7000 -6000 -5000 -4000 -3000 -2000 -1000 0

K (PN sequence index)

C=0.5 C=1 C=2

Adaptive C

圖 4.3 弦樂四重奏在單一位元(

b

₀ = −1)特定模型中的解碼值分布

C=0.5 C=1 C=2 Adaptive C

N=1,

b

₀

= − 1 實驗值理論值實驗值理論值實驗值理論值實驗值理論值 SNR

(dB) 38.43 39.47 36.66 38.42 34.82 33.65 39.06 37.82

[ ]

E r − 4.60 10 ⋅

− 4.60 10 ⋅

− 1.20 10 ⋅

⁴

− 1.19 10 ⋅

⁴

− 7.73 10 ⋅

− ^{7.74 10} ⋅

[ ]

Var r 3.05 10 ⋅

2.39 10 ⋅

6.08 10 ⋅

4.03 10 ⋅

4.73 10 ⋅

⁴

6.14 10 ⋅

⁴

7.43 10 ⋅

9.88 10 ⋅

5.30 10

− ⋅ − 5.30 10 ⋅

表 4.3 弦樂四重奏單一位元(

b

₀ = −1)特定模型解碼值的統計特性

C=0.5 C=1 C=2 Adaptive C

SNR

35.53 36.53 34.65 35.46 32.09 31.46 36.43 36.64

[ ]

SNR

33.15 33.57 32.60 32.55 29.18 28.86 34.10 33.80

[ ]

0 25 50 75 100 125 150 175 200 225 250 10

15 20 25 30 35 40

Average of SNR for watermarking decoding for string quartet

N (number of watermarked bits)

Average of SNR (dB)

C=0.5 C=1 C=2 Adaptive C

圖 4.4 弦樂四重奏

N

位元特定模型解碼效能的理論值

[實驗 4-2]

目的:針對弦樂四重奏音樂，探討在非特定之轉換係數機率模型中，不同位元之隱藏訊息

b

對浮水印解碼函數

r

_i及其效能之影響。

步驟: 我們考慮單一位元(

N = 1

且

M

=2)的浮水印

Β = b { }

0 ，及兩個位元 (

N = 2

，

M

=2² =4 ) 的浮水印

Β = b b {

,

, b b

₂

,

₃

}

, 及四個位元

N = 4

(

M

=2⁴ =16)的浮水印

Β

{ b

₀, b₁, , b₁₅

}

。實驗中我們將這些隱藏訊息分別以不同的 100 組虛擬亂數製成浮水印，再嵌入於相同的弦樂四重奏音樂中，製成 100 組不同的加印音訊，再對其做解碼。

結論: 圖 4.5 顯示出在單一位元、不同秘密金鑰，非特定模型的解碼值分布情形，可發現針對不同隱藏訊息，解碼值的分布具有相當差距，

故可正確解碼出嵌入之隱藏訊息。表 4.6 及表 4.7 列出不同隱藏位元的解碼值統計特性，其中亦可發現理論值與實驗值具有一致性，且解碼效能隨著位元數的增加而遞減。特別強調的是與實驗 4-1 作比較，我們可發現特定模型確實比非特定模型得到較佳的解碼效能，

這是因為在我們所實驗的環境下，係數分布確實可用廣義高斯機率模型來近似；但非特定模型解碼器可省略模型分析過程且應用範圍更廣泛。

r

0 10 20 30 40 50 60 70 80 90 100

-1.5 -1 -0.5 0 0.5 1

1.5x 10⁴ Distribution of r₀ for decoding 1-bit watermarking

K (PN sequence index)

Decode b=1 Decode b=-1

圖 4.5 弦樂四重奏單一位元在非特定模型解碼值分布

N=1,

b

₀

= 1

N=1,

b

₀

=− 1 實驗值理論值實驗值理論值 SNR

(dB) 34.04 33.65 34.03 33.65

[ ]

E r 1.19 10 ⋅

⁴

1.19 10 ⋅

⁴

− 1.19 10 ⋅

⁴

− 1.19 10 ⋅

⁴

[ ]

Var r 5.62 10 ⋅

⁴

6.14 10 ⋅

⁴

5.62 10 ⋅

⁴

6.14 10 ⋅

⁴

表 4.6 弦樂四重奏單一位元非特定模型解碼值的統計特性

N=2 N=4

實驗值理論值實驗值理論值

Aveeage (dB)

SNR

30.60 31.46 27.57 28.86

[ ]

SNR r

(dB) 29.12 28.21 21.82 25.49

[ ]

SNR r

(dB) 31.70 33.29 28.54 26.13

[ ]

SNR r

(dB) X X 16.79 17.11

[ ]

SNR r

(dB) X X 31.37 33.54

表 4.7 弦樂四重奏雙位元、四位元在非特定模型中解碼值的統計特性

[實驗 4-3]

目的：針對鋼琴音樂，探討在特定模型與非特定模型中，單一隱藏位元之浮水印解碼效能，並與弦樂四重奏音樂的實驗結果作比較。

步驟：我們考慮單一位元(

N

=1,

M

=2)的浮水印。實驗中我們將這些隱藏訊息分別以不同的 100 組虛擬亂數製成浮水印，再嵌入於鋼琴音樂中，

製成 100 組不同的加印音訊，再對其做解碼。

結論：比較表 4.8 與表 4.3，表 4.9 與表 4.6，我們可發現鋼琴音樂之解碼效能較差，這是因為鋼琴音樂之理論值(示於圖 3.5)分布較亂，不若 弦樂四重奏音樂般集中。此外，亦可發現鋼琴音樂在固定 c 值之解 碼效能以 c=1 時達到最佳。至於其它統計特性，則可得到與弦樂四 重奏音樂類似的結果，舉例而言，不論固定

c

值或可調

c

值，對加印音訊及原始音訊所得到之

r

值的分布有明顯差距，可據此準確地判斷音訊嵌入之隱藏訊息；亦可觀察出實驗值與理論值具有一致性，

由圖 4.6 我們亦可發現解碼效能隨著位元數的增加而遞減。

c

Piano C=0.5 C=1 C=2 Adaptive C

N=1,

b

₀

= − 1 實驗值

理論值實驗值理論值實驗值理論值實驗值理論值 SNR

(dB) 25.89 27.40 26.58 28.54 25.79 26.13 27.03 27.47

[ ]

E r − 7.83 10 ⋅

− 7.79 10 ⋅

− 1.07 10 ⋅

− 1.06 10 ⋅

− 1.85 10 ⋅

− 1.84 10 ⋅

− 1.31 10 ⋅

− 1.29 10 ⋅

[ ]

Var r 1.58 10 ⋅

1.10 10 ⋅

2.51 10 ⋅

1.57 10 ⋅

9.05 10 ⋅

8.29 10 ⋅

3.41 10 ⋅

2.98 10 ⋅

表 4.8 鋼琴單一位元特定模型解碼值的統計特性

Piano N=1 N=1,

b

₀

= − 1 實驗值理論值

SNR (dB)

1 25.82 26.13

[ ]

E r ₋ _{1.86 10} _⋅

₋ _{1.84 10} _⋅

[ ]

Var r 9.05 10 ⋅

8.29 10 ⋅

表 4.9 鋼琴單一位元非特定模型解碼值的統計特性

0 50 100 150 200 250 0

5 10 15 20 25 30

Average of SNR for watermarking decoding for piano

N (number of watermarked bits)

Average SNR (dB)

C=0.5 C=1 C=2 Adaptive C

圖 4.6 鋼琴 N 位元特定模型解碼效能的理論值

[實驗 4-4]

目的：針對長笛音樂，探討在特定模型與非特定模型中，單一隱藏位元之浮水印解碼效能，並與弦樂四重奏、鋼琴音樂的實驗結果作比較。

步驟：我們考慮單一位元(

N

=1,

M

=2)的浮水印。實驗中我們將這些隱藏訊息分別以不同的 100 組虛擬亂數製成浮水印，再嵌入於長笛音樂中，

製成 100 組不同的加印音訊，再對其做解碼。

結論：比較表 4.10、表 4.8 與表 4.3，表 4.11 表 4.9 與表 4.6，我們可發現長笛音樂之解碼效能與弦樂四重奏相近，比鋼琴較佳，這是因為長笛

音樂之理論

c

值(示於圖 3.11)分布較鋼琴集中，而與弦樂四重奏音樂相近。其統計特性則可得到與弦樂四重奏音樂類似的結果，舉例而言，不論固定

c

值或可調

c

值，對加印音訊及原始音訊所得到之值的分布有明顯差距，可據此準確地判斷音訊嵌入之隱藏訊息；亦可觀察出實驗值與理論值具有一致性，由圖 4.7 我們亦可發現解碼效能隨著位元數的增加而遞減。另一值得注意的是:長笛音樂在可調

c

值的解碼效能達到最佳。

r

Flute C=0.5 C=1 C=2 Adaptive C

N=1,

b

₀

= − 1 實驗值

理論值實驗值理論值實驗值理論值實驗值理論值 SNR

(dB) 38.64 41.83 38.21 41.89 40.05 41.44 43.64 44.48

[ ]

E r − 7.85 10 ⋅

− 7.84 10 ⋅

− 1.10 10 ⋅

⁴

− 1.10 10 ⋅

⁴

− 5.00 10 ⋅

⁴

− 4.99 10 ⋅

⁴

− 1.59 10 ⋅

⁴

− 1.59 10 ⋅

⁴

[ ]

Var r 8.42 10 ⋅

4.03 10 ⋅

1.83 10 ⋅

⁴

7.82 10 ⋅

2.47 10 ⋅

⁵

1.79 10 ⋅

⁵

1.09 10 ⋅

⁴

9.02 10 ⋅

表 4.10 長笛單一位元特定模型解碼值的統計特性

Flute N=1 N=1,

b

₀

= − 1 實驗值理論值

SNR (dB)

1 38.78 41.44

[ ]

E r − 4.99 10 ⋅

⁴

− 4.99 10 ⋅

⁴

[ ]

Var r 3.30 10 ⋅

⁵

1.79 10 ⋅

⁵

表 4.11 長笛單一位元非特定模型解碼值的統計特性

0 50 100 150 200 250 15

20 25 30 35 40 45

Average of SNR for watermarking decoding for flute

N (number of watermarked bits)

Average SNR (dB)

C=0.5 C=1 C=2 Adaptive C

圖 4.7 長笛 N 位元特定模型解碼效能的理論值

第五章結論與未來展望

回顧本篇論文內容，主要是探討離散餘弦轉換域的加成性展頻音訊浮水印設計，及浮水印檢測器與解碼器的整體效能分析。一開始我們先建立音訊餘弦係數的廣義高斯機率分佈函數，並透過最大相似度檢測理論，推導最小誤警機率且最大確認機率的浮水印檢測演算法；再根據最大相似度解碼理論，推導最小誤碼機率的浮水印解碼演算法。接著我們探討一更廣泛之方法，如果無適當之機率模型可近似時，我們仍可透過降維轉換

r

P

( , )

h K y

之充分統計特性，應用最大相似度檢測與解碼理論，推導出相關演算法；此方法並可得到降低計算量、省略模型分析過程及應用層面更廣之優點。在論文中我們引入人耳遮蔽效應於音訊浮水印的嵌入架構，並嘗試於浮水印檢測與解碼演算法則下建立一個效能分析的平台，藉以探討各參數及不同之音樂與浮水印檢測解碼效能間的關係。經由分析模型的推演結果發現，當可能隱藏訊息個數

M

值增加時，對整個檢測的效能並無很大的影響，但對解碼器的效能卻造成下降的現象。

不論是特定的廣義高斯的機率分佈函數模擬，或是非特定的機率模型，再配合人耳聽覺模型分析，發展出兼具透明度及安全性的音訊展頻浮水印機制，推導出具快速實現的浮水印檢測與解碼演算法，並在理論分析

的實驗上有了初步令人滿意的具體成果。不過這些條件都是假設無訊號處理失真，也就是

y

z

的情況下推導出來的，因此在實際應用的層級上仍有一段距離。畢竟經過網路傳輸或訊號處理，在正常的狀態下，接收端所接收到的加印訊號並不完全等於

y

。因此未來我們必須先推導條件機率函數

p

z ，用來表示

y

與之間的關係，再應用最大相似度檢測與解碼理論，求出

z

≠ z

的情況下，快速可實現的相關演算法。

y

此外，我們將浮水印先鎖定在音樂 CD，由於現今高壓縮率 MP3 技術的廣泛應用，使得非法盜拷嚴重影響到智慧財產權。因此未來我們必須先求出有無適用於 MP3 音樂的特定機率模型，再由此特定或非特定模型，配合最大相似度檢測與解碼之理論分析，求出快速可實現之相關演算法。若能成功發展出適用在 MP3 音樂上的技術，對智慧財產權之保護，將可得到更佳之效果。

參考文獻

[1] M. D. Swanson, M. Kobayashi, and A. H. Tewfik, “Multimedia Data-embedding and Watermarking Technologies,” Proceedings of the IEEE, Vol. 86, Jun 1998, pp.

1064-1087.

[2] F. Hartung, and M. Kutter, “Multimedia Watermarking Techniques,” Proceedings of the IEEE, Vol. 87, Jul 1999, pp. 1079-1107.

[3] C. I. Podilchuk, and E. J. Delp, “Digital Watermarking: Algorithms and Applications,”

IEEESignal Processing Magazine, Vol. 18, Jul 2001, pp. 33-46.

[4] P. Bassia, I. Pitas, and N. Nikolaidis, “Robust Audio Watermarking in the Time Domain,” IEEE Transactions on multimedia, Vol. 3, Jun 2001, pp. 232-241.

[5] A. N. Lemma, J. Aprea, W. Oomen, and L. van de Kerkhof, “A Temporal Domain Audio Watermarking Technique,” IEEE Transactions on Signal Processing, Vol. 51, Apr 2003, pp. 1088-1097.

[6] Ye Wang, “A New Watermarking Method of Digital Audio Content for Copyright Protection,” Signal Processing Proceedings of

ICSP '98

, Vol. 2, 1998, pp. 1420-1423.

[7] Xin Li, and H. H. Yu, “Transparent and Robust Audio Data Hiding in Subband Domain,” International Conference on Information Technology: Coding and Computing, 2000.

[8] Sang-Kwang Lee and Yo-Sung Ho, “Digital Audio Watermarking in the Cepstrum Domain,” IEEE Transactions on Consumer Electronics, Vol. 46, Aug 2000, pp.

744-750.

[9] L. Boney, A. H. Tewfik and K. N. Hamdy, “Digital Watermarking for Audio Signals,”

Processings of MULTIMEDIA

'

96, IEEE, 1996, pp. 473-480.

[10] M. D. Swanson, B. Zhu, A. H. Tewfik and L. Boney, “Robust audio watermarking using perceptual masking,” Signal Processing, Vol. 66, Nov 1997, pp. 337-355.

[11] C. Neubauer, and J. Herre, “Digital Watermarking and its Influence on Audio Quality,”

AES.

[12] I. J. Cox, J. Kilian, F. T. Leighton, and T. Shamoon, “Secure spread spectrum watermarking for multimedia,” IEEE Transactions on Image Processing, Vol. 6, Dec 1997, pp. 1673-1687.

[13] I. I. Cox, M. L. Miller, and J. A. Bloom, “Digital Watermarking,” Morgan Kaufmann Publishers , 1^st Edition, 2001.

[14] M. Kutter, and S. Winkler, “A vision-based masking model for spread-spectrum image watermarking,” IEEE Transactions on Image Processing, Vol. 11, Jan 2002, pp. 16-25.

[15] J. R. Hernandez, M. Amado, and F. Perez-Gonzalez, “DCT-domain watermarking techniques for still images: detector performance analysis and a new structure,” IEEE Transactions on Image Processing, Vol. 9, Jan 2000, pp.55-68.

[16] K. A. Birney, and T. R. Fischer, “On the modeling of DCT and subband image data for compression,” IEEE Transactions on Image Processing, Vol. 4, Feb 1995, pp.186-193.

[17] 許宇鳳, “影像與音訊之數位浮水印技術,” 國立台灣大學電信工程研究所碩士論文, 2001.

[18] 張北辰, “音樂信號上的數位浮水印,” 國立台灣大學資訊工程研究所碩士論文, 2001.

[19] J. R. Hernandez, and F. Perez-Gonzalez, “Statistical Analysis of watermarking schemes for copyright protection of images,” Proceedings of the IEEE, Vol. 87, Jul 1999, pp.1142-1166.

[20] A. V. Oppenheim, R. W. Schafer, and J. R. Back, “Discrete-Time Signal Processing,”

Prentice Hall International, Inc, Second Edition, 1998.

[21] 蔡若望,“餘弦轉換統計模型在音訊浮水印之研究,”國立交通大學電信工程研究所

在文檔中音訊展頻浮水印檢測與解碼之研究 (頁 54-0)

第三章 浮水印檢測分析

4.2 特定模型的解碼機制

4.2.1 解碼演算的簡化

A

( )

(

)

4.2.2 解碼函數的統計分析

[ ] { [ ]

}

[ ]

4.3 非特定模型的解碼機制

[證明]：

s

c

c

c

c

b

r

c

c

b

b

r

N

c

c

c

c

c

N

c

c

c

b

b

實驗值 理論值 實驗值 理論值 實驗值 理論值 實驗值 理論值 SNR

E r 4.61 10 ⋅

4.60 10 ⋅

5.32 10 ⋅

5.30 10 ⋅

1.20 10 ⋅

1.19 10 ⋅

7.73 10 ⋅

7.74 10 ⋅

[ ]

Var r 3.05 10 ⋅

2.39 10 ⋅

6.08 10 ⋅

4.03 10 ⋅

4.73 10 ⋅

6.14 10 ⋅

7.43 10 ⋅

9.88 10 ⋅

b

b

b

= − 1 實驗值 理論值 實驗值 理論值 實驗值 理論值 實驗值 理論值 SNR

[ ]

E r − 4.60 10 ⋅

− 4.60 10 ⋅

− 1.20 10 ⋅

− 1.19 10 ⋅

− 7.73 10 ⋅

− 7.74 10 ⋅

[ ]

Var r 3.05 10 ⋅

2.39 10 ⋅

6.08 10 ⋅

4.03 10 ⋅

4.73 10 ⋅

6.14 10 ⋅

7.43 10 ⋅

9.88 10 ⋅

5.30 10

− ⋅ − 5.30 10 ⋅

b

SNR

第三章浮水印檢測分析

實驗值理論值實驗值理論值實驗值理論值實驗值理論值 SNR

= − 1 實驗值理論值實驗值理論值實驗值理論值實驗值理論值 SNR

− ^{7.74 10} ⋅

=− 1 實驗值理論值實驗值理論值 SNR

實驗值理論值實驗值理論值

理論值實驗值理論值實驗值理論值實驗值理論值 SNR