音訊展頻浮水印檢測與解碼之研究
全文
(2) 音訊展頻浮水印檢測與解碼之研究 Detection and Decoding of Audio Spread-Spectrum Watermarking. 研 究 生:李維晟. Student: Wei-cheng Lee. 指導教授:張文輝. Advisor: Wen-Whei Chang. 國立交通大學 電信工程學系碩士班 碩士論文. A Thesis Submitted to Institute of Communication Engineering College of Electrical Engineering and Computer Science National Chiao Tung University In Partial Fulfillment of Requirements for the Degree of Master of Science in Electrical Engineering. June 2004 Hsinchu, Taiwan, Republic of China 中華民國 九十三年 六月.
(3) 音訊展頻浮水印檢測與解碼之研究 學生:李維晟. 指導教授:張文輝 博士. 國立交通大學電信工程學系碩士班. 中文摘要. 由於網際網路的廣泛應用及影音壓縮技術的躍進,使得盜版傳播的問 題日益嚴重,為保障原創者之智慧財產,在多媒體檔案中隱藏認證資訊有 其必要性。最佳之浮水印設計必須兼顧隱密性、強軔度及可靠度,隱密性 使其不被盜版者察覺,強軔度使之能對抗惡意破壞,而可靠度能減少誤警 情況的發生。我們採用離散餘弦轉換配合直序展頻技術來建構嵌入浮水印 之函數,主要之關鍵在於設定一離散餘弦係數之廣義高斯機率模型,再根 據最大相似度理論,設計最佳的檢測與解碼機制。除此之外,我們也探討 非特定機率模型的一般情況,並推導出相關之檢測與解碼演算法。 i.
(4) Detection. and. Decoding. of. Audio. Spread-Spectrum Watermarking Student:Wei-Cheng Lee. Advisor:Dr. Wen-Whei Chang. Institute of Communication Engineering National Chiao Tung University. Abstract In this thesis, we address the problem of the performance analysis of audio watermarking systems that use a spread spectrum technique in the discrete cosine transform (DCT) domain. Two tests are involved in the ownership verification process. First, a watermark detector decides whether the audio under test contains a watermark generated with a certain key. If the audio is watermarked , then authorship by the key holder is proved and extraction of hidden message can be performed by a detector. Most current research concentrate on correlation detectors, despite evidence showing that the underlying Gaussian model assumption does not match the intrinsic natures of DCT coefficients. Recognizing this, we first investigate a statistical approach that uses the generalized Gaussian probability to characterize the DCT coefficients and then use it as a basis for the application of statistical decision theory to the design of efficient detector and decoder structures. We also generalize this approach to the possible nonexistence of a statistical description of the original audio. ii.
(5) 誌謝. 本篇論文的完成,首先要感謝指導教授張文輝老師的悉心指導與耐心 啟蒙,讓我從一個對研究懵懂的新生,進而了解作研究的方法與態度,幫 助我逐漸在音訊浮水印的研究領域中建立信心且獲益良多。 感謝實驗室學長若望在研究上的經驗傳承,以及學長姊亨仰、承龍、 雅茹在課業上的細心解答與生活上的扶持與關照,世耀、志杰、淑羚在實 驗室的朝夕相處,特別感謝玟瑜對我的支持與鼓勵。最後僅以本論文獻給 始終在背後默默支持我的父母與所有關心我的人。. iii.
(6) 目錄 中文摘要……………………………………………………..…….……..i 英文摘要……………………………………………………..…….…….ii 誌謝……………………………………………………………………...iii 目錄……………………………………………………………………...iv 表目錄…………………………………………………………………...vi 圖目錄…………………………………………………………………..vii. 第一章 緒論 1.1 研究動機………………………………………………………..1 1.2 研究方向……………………………………………….……….3 1.3 章節概要……………………………………………….……….6. 第二章 加成性展頻浮水印 2.1 基本架構…………………………………….………………….7 2.2 浮水印嵌入機制………………………….…………………….9 2.3 人耳聽覺模型分析…………………………………………….11. 第三章 浮水印檢測分析 3.1 最佳檢測演算法…………………….………………………...15 3.2 特定模型的檢測機制……………………………………..…..18 3.2.1 廣義高斯機率模型……...…………………………..….18 3.2.2 檢測效能理論分析………...………………………...…23 3.3 非特定模型的檢測機制…………...………………..………..28 3.4. 實驗結果與分析……………………………………………...31. iv.
(7) 第四章 浮水印解碼分析 4.1 最佳解碼演算法則……………………………………………41 4.2 特定模型的解碼機制…………………….…………………...43 4.2.1 解碼演算的簡化……………………………………….44 4.2.2 解碼函數的統計分析………………………………….47 4.2.3 誤碼機率的推導……………………………………….48 4.3 非特定模型的解碼機制…………..…………….…………….50 4.4 實驗結果與分析……………………………………..………..52. 第五章 結論與未來展望……………..……………….……………….64. 參考文獻…………………………………………………...…..……….66. 附錄……………………………………………………………………..69 附錄 A 雙位元特定模型檢測函數的平均與變異值之推導……...69 附錄 B N 位元非特定模型檢測函數的平均與變異值之推導…...71 附錄 C 不固定分區時解碼函數之平均與變異值之推導………...73. v.
(8) 表目錄. 表 3.1 弦樂四重奏單一位元特定模型檢測值的統計特性………….33 表 3.2 弦樂四重奏兩位元特定模型檢測值的統計特性…………….34 表 3.3 弦樂四重奏四位元特定模型檢測值的統計特性…………….35 表 3.4. 弦樂四重奏在非特定模型中檢測值的統計特性…………….37. 表 3.5 鋼琴單一位元特定模型檢測值的統計特性………………….38 表 3.6 鋼琴單一位元非特定模型檢測值的統計特性……………….38 表 3.7 長笛單一位元特定模型檢測值的統計特性………………….39 表 3.8 長笛單一位元非特定模型檢測值的統計特性……………….40 表 4.1. bl , j 與 bm, j 關係對照表…………………………………………..44. 表 4.2 弦樂四重奏在單一位元 (b0 =1) 特定模型解碼值的統計特性....54 表 4.3 弦樂四重奏在單一位元 (b0 = −1) 特定模型解碼值的統計特…..55 表 4.4 弦樂四重奏兩位元特定模型解碼值的統計特性………….…56 表 4.5. 弦樂四重奏四位元特定模型解碼值的統計特性…………….56. 表 4.6. 弦樂四重奏單一位元非特定模型解碼值的統計特性……….59. 表 4.7. 弦樂四重奏雙、四位元在非特定模型中解碼值的統計特性..59. 表 4.8. 鋼琴單一位元特定模型解碼值的統計特性………………….60. 表 4.9. 鋼琴單一位元非特定模型解碼值的統計特性……………….60. 表 4.10 長笛單一位元特定模型解碼值的統計特性………………….62 表 4.11 長笛單一位元非特定模型解碼值的統計特性……………….62. vi.
(9) 圖目錄 圖 2.1 數位音訊浮水印系統…………………………………..………8 圖 2.2 加成性展頻浮水印系統………………………….……………10 圖 3.1 浮水印檢測流程圖…………………..…………………….…..16 圖 3.2 二元假說下的誤警機率與確認機率分佈圖…….……...….…17 圖 3.3 廣義高斯分佈函數圖……………………………………….…19 圖 3.4. F (c ) 對應 c 函數圖……………………………………..…….…22. 圖 3.5 鋼琴音樂轉換係數的理論 ck 值圖………………………….…22 圖 3.6 檢測器效能與 SNR1 關係圖………………………………….…26 圖 3.7 弦樂四重奏音樂轉換係數的理論 ck 值圖…………….………32 圖 3.8 弦樂四重奏單一位元特定模型中加印音訊與原始音訊的檢 測值分布………...……………………………………………...33 圖 3.9 弦樂四重奏兩位元特定模型中加印音訊與原始音訊的檢測 值分布…………....……………………………………………..34 圖 3.10 弦樂四重奏四位元特定模型中加印音訊與原始音訊的檢測 值分布………………….……………………………………….35 圖 3.11 長笛音樂轉換係數的理論 ck 值圖………………………….…40 圖 4.1 浮水印解碼流程圖………………………………………….…43 圖 4.2 弦樂四重奏在單一位元( b0 = 1 )特定模型中加印音訊與原始 音訊的檢測值分布……………………...……………………...54 圖 4.3 弦樂四重奏在單一位元( b0 = −1 )特定模型中加印音訊與原始 音訊的檢測值分布…………………………...…..………….…55. vii.
(10) 圖 4.4 弦樂四重奏 N 位元特定模型解碼效能的理論值………….…57 圖 4.5 弦樂四重奏單一位元在非特定模型解碼值分布…………….58 圖 4.6 鋼琴 N 位元特定模型解碼效能的理論值………….…………61 圖 4.7 長笛 N 位元特定模型解碼效能的理論值………….…………63. viii.
(11) 第一章. 緒論. 所謂數位音訊浮水印(digital audio watermarking),就是將一些智慧財產 權的認證訊息,例如原作者、擁有者、出版處、聯絡公司地址、公司商標 等,隱藏於音樂軟體產品當中。如果使用中的音樂軟體被懷疑是非法拷貝 的,可以檢查其是否嵌入有隱藏的數位浮水印,再依此判斷這個音樂軟體 究竟合法或非法拷貝的,以保護創作人之智慧財產。. 1.1 研究動機 近幾年來網際網路的廣泛應用,配合商業化的多媒體資料壓縮技術, 使得數位音樂與影像可以無失真地複製,非法拷貝和線上傳播已嚴重威脅 到原創業者的生存空間。為了有效保障其智慧財產權,數位浮水印技術逐 漸被應用於保護數位化的多媒體資訊[1,2,3]。目前大部分的研究都集中在影 像和視訊的數位浮水印上,因為一般而言只要視覺上不要有太大的差異, 嵌入浮水印的影像及視訊訊號都可以被人眼所接受。但由於人類的聽覺比 視覺更加敏銳,訊號稍有失真很容易就被人耳所察覺,所以在音訊訊號上 嵌入數位浮水印的技術相對就較為困難。. 1.
(12) 在音訊浮水印的處理上,嵌入的領域不外乎分為時間領域[4,5]及轉換 領域[6,7,8]兩種,亦有合併此兩種領域來嵌入浮水印的技術[9,10]。至於嵌 入浮水印的主要方法則有下列幾種:低位元編碼(low-bit coding)、相位 編碼(phase coding)、回聲隱藏(echo data hiding)及展頻調變(spread spectrum modulation)等,近年來利用展頻調變技術將可認証用的訊息隱 藏嵌入於原始影音訊號頻域的數位浮水印機制最為常見。展頻調變的原理 類似展頻通訊,先將一個窄頻訊號轉換成較大的寬頻後再傳送,以期避免 鄰近通道間的干擾進而提昇其通訊保密性[9,10,11,12]。因為使用資料應用延 展技術相對的復原比率也相對增加,例如我們傳送一個 1,則如果我們接收 到的也是一個 1,那我們可以說結果是正確的;但如果將這 1 延展 3 次變成 111,這時如果接收到的資料是 011、101、110、111,則藉由多數決(majority vote)的原理,我們還是可以得到原來正確的資料亦是 1。由於傳送訊息的 每個位元被展成較長的擬亂序列,再嵌入於原始音訊當中,因此可嵌入的 浮水印資料容量較受限,但展頻調變浮水印最大的優點就是具備有較佳的 強韌度與保密安全性。. 展頻調變中最多使用的方法就是直序展頻技術(direct sequence spread spectrum)。在嵌入浮水印的過程中,影音訊號扮演著展頻通訊中寬頻雜訊 的角色,而認証用的浮水印則代表窄頻訊號,經過處理嵌入浮水印的影音. 2.
(13) 檔即可放心的傳播流通。本論文選用的加成性展頻浮水印系統,就要是採 用離散餘弦域的直序展頻通訊技術,把原始音訊當成通道雜訊,並運用虛 擬亂數序列調變生成一組隱藏資訊製成浮水印,再嵌入音訊中以保護其智 慧財產權。當著作權的確認有爭議時,即可藉由檢測解碼隱含於音訊訊號 中的浮水印來保障原創作者的正當性。. 數位浮水印主要有以下幾種應用:(1)廣播監視:我們可透過在廣播內 容裡隱藏浮水印的資訊,來判斷廣播電台公司是否正確地播放商品業者的 廣告時間,避免真正廣告的時段低於商品業者的付費時間,造成損失;而 表演者亦可經此知道是否電台公司是否有無虛報應給與報酬之使用次數費 用;(2)追查非法傳播來源:我們可在浮水印中隱藏原購買者的資訊,一旦 此購買者於購買商品後非法盜拷傳播,我們便可透過檢測非法傳播品所隱 含之浮水印,輕易地追查出非法傳播者;(3)原創者或擁有者的證明:若原 創人、原創公司或擁有者希望在其影音軟體中加入以供證明的資訊,我們 亦可在浮水印中加入其想隱含之資訊,以便做為日後驗證之證據[13]。. 1.2 研究方向 數位浮水印的技術主要應用於智財權的保護,如同一般的密碼系統, 需要一組秘密金鑰來製成浮水印,甚至決定浮水印嵌入於音訊的位置。除. 3.
(14) 此之外,浮水印系統必須具備下列重要的特性:(1)感知透明度(Perceptual transparency) ; 浮 水 印 的 嵌 入 不 能 影 響 原 有 音 質 且 不 易 被 使 用 者 察 覺 (imperceptible),也就是說,數位浮水印隱藏於多媒體的資料中,為了保持 原始的音訊資料和浮水印的隱密,從原始音訊中是無法察覺數位浮水印資 料的存在;(2)強軔度(Robustness);無論採用何種訊號處理或遭遇惡意的攻 擊,浮水印皆不能遭受到破壞且還能正常取回,以確保數位浮水印的完整 性,這些處理包括有類比數位間的轉換(A/D、D/A)、濾波(filtering)和壓縮 (compression)等。由於音訊訊號處理的攻擊對浮水印而言是很大的傷害,也 是數位浮水印必須克服的最大問題,因此浮水印必須有足夠的強軔度,方 能承受音訊處理的攻擊;(3)可靠度(Reliable);數位浮水印必須保證其隱密 性(secure),使一般人無法任意移除其資料,唯有擁有者方能有效地檢測出 浮水印,解碼還原其智財權的訊息,並避免過多誤警情形(false alarm)的發 生。. 因此理想的浮水印系統設計應兼顧其隱密性與強軔度,前者要求嵌入 的認証訊號不能被盜版者察覺其存在,而後者則強調非法的惡意攻擊不致 於破壞浮水印的完整性。目前已知的相關研究集中在影像浮水印[14,15]及 其檢測演算法(detection algorithm),主要是基於頻域係數呈高斯機率分佈的 假設而推導的相關式檢測器(correlation detector)[10,12]。但這不符合影音訊. 4.
(15) 號頻域係數的實際量測結果[16],因此我們深信浮水印的檢測機制仍有許多 改善的空間。相對而言,音訊浮水印技術的開發仍在起步階段 [10,12,17,18],而音訊頻域係數的機率分佈模型也未見分析整理。有鑑於 此,我們將推導一種廣義的高斯(generalized Gaussian)機率函數,藉以有效 地描述不同演奏內容音樂的頻域分佈變化,並建立一種能快速實現的浮水 印檢測及解碼演算法。. 此外,我們亦探討非特定機率模型的問題,假設待測的浮水印之機率 模型未知或很難去近似時,例如非餘弦頻域係數並無適當之機率模型可近 似[19],亦即我們無特定的機率模型可應用於檢測與解碼中,此時須透過一 種降維轉換運算子的充分統計特性來進行理論分析,故其可應用於非餘弦 頻域中,應用範圍廣泛。由於降維轉換運算子利用一類似投影的方法大量 地降低其維度,所以不論在檢測或解碼中皆可大量地降低其計算量,此為 一重要之優點,除了可增進驗證時的速度外,亦使得應用於硬體實現上更 具可能性。此外,非特定模型無須像特定模型須經事先分析其多項參數, 所以節省了事先模型參數分析的步驟,此點亦增進了硬體實現上的可能 性。綜合而言,非特定模型擁有著可省略模型分析過程、降低計算量及應 用範圍更廣泛之優點。. 5.
(16) 1.3 章節概要 整篇論文分為五個章節。第一章對於數位浮水印技術作一般性的簡 介,及說明本論文的研究方向。第二章描述加成性展頻浮水印的基本架構 與嵌入機制。第三章討論浮水印檢測機制,透過離散餘弦轉換係數的統計 分析,建構其快速實現的最佳檢測演算法。此外,也針對未知餘弦係數之 機率模型時,實現其最佳的浮水印檢測機制,並顯示理論值分析與實驗數 據的相關比較。第四章討論特定與非特定模型的浮水印解碼機制,利用最 大相似度預估理論,推演出最佳解碼演算法則,並呈現解碼效能分析的實 驗數值。最後,第五章對整篇論文做一總結,同時指出未來的研究方向。. 6.
(17) 第二章. 加成性展頻浮水印. 數位音訊浮水印技術主要是經由一序列的訊號處理,將智財權認證資 料轉換成人耳無法察覺的浮水印,再嵌入各種音樂軟體產品當中。為了有 效偵測區隔出非法拷貝,浮水印訊號若未經所有者的允許而自行去除,將 嚴重破壞原始音樂訊號的品質。因此浮水印的設計,必須考慮其無法移除 和修改等特質,並能抵擋住傳輸錯誤、壓縮失真、以及非法使用者的惡意 攻擊。. 2.1 基本架構 標準的數位浮水印系統可用圖 2.1 來表示,其中傳輸端的工作為浮水印 嵌入(watermark embedding),而接收端的工作則包括檢測(detection)及解碼 (decoding)兩項任務。傳輸端的處理流程敘述如下:先將原始音訊以 L 點作 音框分割,其轉換係數以向量表示成 x = [x0 , x1 ,. x L −1 ] T 。再配合秘密金鑰 K 及. 隱藏位元向量 b = [b0 , b1 , bN −1 ] T ,經嵌入函數 f 產生認証用的浮水印訊號 w 。 最後將 w 嵌入 x 而製成了加印(watermarked)音訊訊號 y = x + w 。由於輸入端 的秘密金鑰 K 只有智財權擁有者知曉,其他的人無法任意從加印訊號 y 中擷 取隱藏訊息 b ,因此可藉以達到智財權保護的安全性。. 7.
(18) 圖 2.1 數位音訊浮水印系統. 加印訊號 y 的特色在於,不僅音樂品質近似原本的音訊 x ,更提供浮水 印嵌入保護的機制,因此得以在網路上提供散播下載等服務。當著作權的 歸屬有問題的時候,將透過秘密金鑰 K 及有效的認證機制解決其爭議。至 於在接收端部分,觀察到的音訊 z 和原來的加印音訊 y 或許並不相同,其差 異源自網路的傳播雜訊、壓縮處理失真,或遭到有心人士的惡意攻擊,我 們採用條件機率函數 p z y 來表示 y 與 z 之間的關係。接收端的重要工作是進 行浮水印認證的處理程式,其關鍵在於引入檢測及解碼兩個函數來測試此 問題。在整個研究過程中,為簡化理論分析,我們將假設無訊號失真的情 況,亦即 z = y 。. 檢測函數 d 是用來決定訊號 y 是否含有一待測秘密金鑰 K 所製成的浮 水印訊號,因此該檢測問題可以視為兩事件的二元假說測試,其中事件 H 1 代. 8.
(19) 表音訊 y 含有金鑰 K 產生的浮水印,而 H 0 則代表音訊 y 不包含金鑰 K 產生的 浮水印,則 H1 : y = x + w. (2.1). H0 : y = x. ∆. 我們定義誤警機率(probability of false alarm), PF = P { d ( y, K ) = H1 | H 0 } , ∆. 及確認機率(probability of detection), PD = P { d ( y, K ) = H1 | H1 } ,作為量測浮 水印檢測效能的指標。誤警機率表示不含浮水印的音訊 y 遭誤判為含有浮水 印的機率,而確認機率則是能正確檢測出含有浮水印音訊的機率。假如檢 測函數 d 偵測出音訊 y 中確實含有浮水印訊號,則繼續把音訊 y 及金鑰 K 送 進浮水印的解碼函數 e ,進行浮水印訊號的粹取與解碼工作,以期還原出嵌 ∧. 入於原始音訊 x 中的隱藏訊息 b 。至於評估浮水印解碼效能的指標,則定義 為錯誤機率(probability of error), Pe = P b ≠ b ,其值越高則代表該解碼器的 ∆. ∧. . . 功能愈差。. 2.2 浮水印嵌入機制 理想的浮水印系統設計應兼顧其隱密性與強軔度,前者要求嵌入的認 証訊號不能被盜版者察覺其存在,而後者則強調非法的惡意攻擊不致於破 壞浮水印的完整性。本篇論文選用的加成性展頻浮水印系統,主要是仿造 數位通訊系統中對抗干擾的直序展頻通訊技術,把原始音訊當成通道雜. 9.
(20) 訊,並運用虛擬亂數序列調變生成一組隱藏資訊製成浮水印,再嵌入音訊 中以保護其智慧財產權。加成性展頻音訊浮水印系統如圖 2.2 所示。. 圖 2.2 加成性展頻浮水印系統. 浮水印嵌入機制的處理細節如下: (1)先對一音框的 L 個取樣點作離散餘弦轉換(Discrete Cosine Transform, DCT),再將 L 個轉換係數所對應的索引劃分成互不相關的 N 個子集合. {S } j. ,滿足 S j ∩ Si = φ , ∀i ≠ j,則子集合 S j 代表著第 j 個訊息位元 b j 可. N −1 j =0. 隱藏的空間。在本論文中,音框長度將固定為 L = 256 。 (2)為了不被人耳察覺出音訊中附加的嵌入訊息,我們執行聲響心理模型分 析,計算出個別 DCT 係數 x k 所對應的加權比重值 α k 。 (3)加權比重值 α k 與秘密金鑰 K 產生的虛擬亂數 s k 相乘,再乘上訊息位元 b j 製 成 展 頻 浮 水 印 訊 號 wk 。 更 明 確 地 說 , w = P ( K , x ) ⋅ b , 其 元 素 wk = b j ⋅ α k ⋅ s k , ∀k ∈ S j ,其中 k ∈ { 0,1,. , L − 1 },. j ∈ { 0,1,. , N −1 }。 S j 代. 表第 j 個訊息位元 b j 將嵌入的轉換係數之索引集合,而 P(K , x ) 代表 L × N. 10.
(21) 的矩陣,其元素 p kj 滿足: α ⋅ s , if k ∈ S j p kj = k k otherwise 0,. (2.2). (4)嵌入浮水印後的加印音訊為 y = x + w ,其元素 y k = xk + wk ,k = 0,1, , L − 1 。 由此可知,隱藏訊息的 N 個位元 b 被展頻調變成 L 個維度的碼字 w ,進而 涵蓋整段的離散餘弦域係數。由於浮水印 w 的製成和秘密金鑰 K 息息相 關,也惟有擁有金鑰的著作原創者能把隱藏訊息 b 從加印音訊 y 中粹取出 來。. 2.3 人耳聽覺模型分析 如果有兩個聲音同時存在,則較高音量的聲音會使低音量的聲音聽不 見,這種現象我們稱為「遮蔽效應」 。遮蔽效應常常出現在日常生活當中, 例如在安靜的街道中講話音量很小彼此就可聽見,若此時有一輛卡車從旁 經過,若講話音量仍保持不變就聽不見對方說些什麼,也就是說講話的聲 音被卡車的噪音給遮蔽了。卡車經過前跟經過後對講話者的影響都很短 暫,分別稱之為前遮蔽(pre-masking)及後遮蔽(post-masking),前遮蔽維持約 20ms 而後遮蔽維持約 200ms。. 11.
(22) 當卡車正經過時會全程影響說話者,稱之為同時遮蔽(simultaneous masking)。這是因為遮蔽效應發生在頻域上,兩個幾乎同時發生的訊號在頻 率軸上很接近,因此能量比較強的訊號會使能量比較弱的訊號聽不見。為 了量化地描述遮蔽效應的程度,一般均以遮蔽臨界值(masking threshold)為 之。遮蔽者對被遮蔽者的影響,會存在某個臨界值,此臨界值即稱為遮蔽 臨界值,此時被遮蔽者的音量必須大於此臨界值才能為人耳所聽見,反之 則聽不見。有了遮蔽臨界值的資訊,我們便可設計出頻域處理之浮水印機 制。. 理想的浮水印設計,就是在人耳的遮蔽效應與浮水印的強軔度之間取 得一個平衡。透過傳統的聲響心理學模式,我們可以計算一組傅利葉轉換 頻域上的遮蔽臨界曲線,其計算流程包括有臨界頻帶濾波、等響度預處理, 以及主觀響度單位轉換。該曲線就是浮水印能嵌入音訊內而不被察覺所允 許的最大頻域值,而尚待解決的課題是如何將其改為在離散餘弦轉換軸上 展開。我們的解決方案如下[20]: 1 L −1 ⋅ ∑ q [ n ] ⋅ e − j 2π kn L , k = 0,1, 2, L n =0. DFT: xDFT [ k ] =. DCT: xDCT [k ] =. L −1 π ⋅ k ( 2n + 1) 2 ⋅ γ [ k ] ⋅ ∑ q [ n ] ⋅ cos , k = 0,1, 2, L 2L n =0 . 1. γ [k ] = . , L −1. 1. 2. , ,. k =0 k = 1,2,.., L − 1. 12. (2.3). , L −1. (2.4).
(23) 欲求發展兩轉換間的關係式,首先考慮一段訊號序列 q [ n ] , 0 ≤ n ≤ L − 1 ,將其表示為一個行向量 q = [ q[0], q[1],…, q[ L − 1] ]T 。則離. 散 傅 利 葉 轉 換 向 量 x DFT = [ xDFT [0], xDFT [1],. , xDFT [ L − 1] ]T 可 表 示 為. x DFT = Aq ,其中. …1 1 1 1 −j2π(1)(1)/L −j2π(1)(2)/L … e−j2π(1)(L−1)/L e 1 1 e A= L −j2π(L−1)(1)/L −j2π(L−1)(2)/L −j2π(L−1)(L−1)/L 1 e …e e. 而 餘 弦 轉 換 向 量 x DCT = [ x DCT [0], xDCT [1],. , x DCT [ L − 1]]T 亦 可 轉 換 為. x DCT = Bq ,其中 1 1 2 2 π(1)(3) cos(π(1)(1)) cos( ) B= 2L 2L π(L −1)(1) π(L−1)(3) cos( 2L ) cos( 2L ) . 。 π(L−1)(L−1) cos( ) 2L 1 2 π(1)(2L−1) cos( ) 2L. 進一步觀察,可得其間的互轉關係為. x DCT = Bq = BA -1x DFT. (2.5). 13.
(24) 最後,我們整理計算 DCT 域的遮蔽曲線之處理細節如下:. (1) 我們先把 DFT 頻域求得之遮蔽曲線 u' = [ u '[0], u '[1], u '[2],. , u '[ L − 1]] ,先 T. 將其標準化: u=. u'. (2.6). L −1. ∑ u '[k ] k =0. (2)再將標準化後之 u 透過(2.5)式轉換到 DCT 域,意即 uDCT = BA -1u 。 (3)初步實驗證實 uDCT 之虛數部份接近 0,故取其實數部份後而得浮水印的 加權比重 α 為 α = Re{u DCT } 。. 依上述三步驟所得的 α = [α [0], α [1], α [2],. , α [ L − 1]] 即為容許浮水印嵌入的 T. 最大變動值。透過人耳聽覺模型的分析,計算出遮蔽臨界曲線並據以調整 各轉換係數的加權比重,將有助於浮水印的透明度及強軔度間取得最佳平 衡。. 14.
(25) 第三章. 浮水印檢測分析. 傳送端採用離散餘弦轉換配合展頻調變原理建構的浮水印嵌入機制, 在接收端如要建立快速實現的浮水印檢測演算法,其關鍵在於設定一能涵 蓋音訊轉換係數特性的機率模型[19],同時依據統計預估原理設計一最佳 的浮水印檢測機制,以提昇檢測器效能及其快速實現能力。目前國內外相 關研究所採用的相關式檢測器,是依據高斯機率模型的假設來推導,並不 足以正確反應不同演奏音樂內容的頻域係數分佈變化。有鑑於此,我們將 先量測各種音樂餘弦轉換係數的統計特性,配合廣義高斯機率函數的數學 推導[21],重新規劃其快速實現的最適化浮水印檢測機制。除此之外,我 們也探討在未知音樂餘弦轉換係數的統計特性的情況下,如何做最佳的浮 水印檢測機制。. 3.1 最佳檢測演算法 加印訊號 y 一旦散播出去,原創者就必須有能力自接收到的音訊 y 中擷 取智財權的資訊,用以證明自己的合法擁有權並追蹤非法的盜版者。在浮 水印認證的過程中,首要之務在檢測收到的音訊中是否含有認證用的浮水 印訊號 w ,其檢測處理流程如圖 3.1 所示。. 15.
(26) 圖 3.1 浮水印檢測流程圖. 浮水印檢測機制的處理細節如下: (1)假設無法取得原始音訊 x ,對收到的音訊每 L 個取樣點作離散餘弦轉 換,求得該音框的 L 個轉換係數 y k 。 (2)分析轉換係數 y k 的統計特性,估算出標準差 σ k ,並透過聲響心理分析, 計算出個別轉換係數 y k 所對應的加權比重值 α k 。 (3)將檢測時所必要配合的轉換係數 y k 、標準差 σ k 、加權比重值 α k 、及秘密 金鑰 K 產生的虛擬亂數 sk ,輸入檢測器的相似函數中,並透過決策臨界值 η 的判斷,判別該音訊是否含有浮水印。. 浮水印檢測器的設計,旨在正確判別待測試的音訊檔內是否含有嵌入 認証用的浮水印訊號,此檢測問題可視為兩事件的二元假說測試,其中事 件 H 1 代表音訊 y 經過測試含有金鑰 K 產生的浮水印,H 0 則代表音訊 y 經過測 試不包含金鑰 K 產生的浮水印。最佳化檢測器的設計旨在降低誤警機率. 16.
(27) ∆. ∆. PF = P { d ( y, K ) = H1 | H 0 } 且提高確認機率 PD = P { d ( y, K ) = H1 | H1} 。其關鍵在於. 透過奈曼-皮爾生法則(Neyman-Pearson test)推導出最佳的決策公式。如 圖 3.2,我們限制誤警機率 PF = α p 不能超過其上限 α th,首先建構一個函數 G:. G = (1 − PD ) + η ⋅ (PF − α ). (. ) (∫ P ( y | H ) dy + η ⋅ (1 − ∫ P. = 1 − ∫ Py|H1 ( y | H1 ) dy + η ⋅ Z1. = ∫ Py|H1 Z0. 1. Z1. Z0. y |H 0. y |H 0. ( y | H 0 ) dy − α p. ( y | H 0 ) dy − α p. ). ). = η ⋅ (1 − α p ) + ∫ Py|H1 ( y | H1 ) − η ⋅ Py|H 0 ( y | H 0 ) dy Z0. (3.1). 其中 Z 0 及 Z1 分別表示事件 H 0 和 H 1 發生的區域。. 圖 3.2 二元假說下的誤警機率與確認機率分佈圖. 明顯地,公式(3.1)在 PF = α p ≤ αth 限制條件下,函數 G 的值越小,則確認機 率 PD 的值就會越大。由於積分式中指向的區域屬於 Z 0 ,因此若維持積分項 式的值為負數,將可有效滿足降低函數 G 值的條件,據此我們推導浮水印. 17.
(28) 檢測的最佳決策法則符合: Λ ( y ) = ln. Py|H1 ( y | H1 ). Py|H 0 ( y | H 0 ). = ln. f y ( y | H1 , K ) f y ( y | H0 ). = ln ∑ b. p ( b ) ⋅ f x ( y − Pb ) fx (y). H1 >. <. H0. η = ln. p( H 0 ) p ( H1 ). (3.2). 其中 η 為決策臨界值,若我們偵測音訊為未加印音訊與加印音訊的機率相 同, P( H1 ) = P( H 0 ) = 0.5 ,則此決策臨界值η = 0 。. 3.2 特定模型的檢測機制 若我們將音訊頻域係數假設為廣義高斯分佈機率,再代入相似函數 Λ ( y ) 中,應可預期推導出浮水印檢測的快速實現演算法,同時保證其整體. 效能會較基於係數呈高斯分佈假設而推導的相關式檢測器為佳。. 3.2.1 廣義高斯機率分析 有鑒於音訊頻域機率分佈的未知性,我們將嘗試建構個別的離散餘弦 轉換係數 xk 之機率模型 f x (x ) ,再據以設計音訊浮水印訊號的最佳檢測演算 法。初步鎖定在廣義高斯分佈函數,其定義如下: f x (x ) =. β ⋅c. 2Γ(1 c ). ⋅e. − β ⋅x. c. 1 Γ(3 c ) , β = ⋅ σ Γ(1 c ) . 1. 2. ∞. (3.3). 其中 Γ(n ) = ∫0 v n −1 ⋅ e −v dv , n > 0 ,而 β 值則可用標準差 σ 及參數 c 來表示。. 18.
(29) 選擇此機率函數有兩個理由,一則是因為只需精確估算 σ 及 c 的數值, 即可有效掌握離散餘弦域係數的廣義高斯分佈特性。另一個理由是因為可 藉由參數 c 的調整而能涵蓋不同轉換係數的機率分佈變化,例如 c = 1 代表拉 普拉斯(Laplace)分佈,而 c = 2 代表高斯分佈,如圖 3.3。 Generaliz ed Gaus s ian Dis tribution 2.5. c = 1/2 2. f(x ). 1.5. 1. c=1. 0.5. c=2 0 -0.05. -0.04. -0.03. -0.02. -0.01. 0 X. 0.01. 0.02. 0.03. 0.04. 0.05. 圖 3.3 廣義高斯分佈函數圖. 由於廣義高斯函數的 β 值可用標準差 σ 及參數 c 來表示,首要任務在於 正確估算出 σ 及 c 的值,即可精確建立音訊離散餘弦域係數的廣義高斯分佈 函數模型。但是離散餘弦域上每個係數的分佈皆不盡然相同,據此模擬之 廣義高斯分佈函數在不同係數 xk 所求出之標準差 σ k 及最佳 ck 值,也存在著 明顯的差異。透過統計分析,就是要求出每個係數所對應的最適化機率分 佈函數。有了這些參數估計值,我們方能配合廣義高斯機率函數的推導,. 19.
(30) 建構一適合的浮水印檢測機制。所以在接收端拿到音訊 y 的第一個步驟, 是分析該音訊以估算原始餘弦係數 xk 的標準差 σ k 及參數 ck 。有關餘弦係數 xk 標準差 σ k 值的推算,由於我們在接收端無法取得原始音訊 x ,所以必須. 從收到的音訊 y 上著手,第 k 個轉換係數 yk 所對應的變異值為: 1 σ (k ) = Nb 2 y. 1 Nb −1 (i ) − y ∑ ∑ yk k N b2 i =0 i =0 . N b −1. 2. (i ) 2. k = 0,. , L −1. (3.4). 其中 y k(i ) 為第 i 個音框內的第 k 個轉換係數, N b 表示音訊 y 依 L 個取樣點分割 所得的音框總數。同理可推,因 b j 及 sk 均為 ± 1 值, wk = b jα k sk 的變異值為: σ w2 ( k ) =. 1 Nb. N b −1. ∑ α ( ) i =0. i. 2. k = 0,1,. k. , L −1. (3.5). 有了加印訊號 y 的變異值 σ y2 (k ),並假設原始訊號 x與浮水印 w兩者獨立互不 相關,我們利用 y k = xk + wk 來估算原始音訊 x 內第 k 個係數 xk 的變異值,公 式推導如下: σ x2 ( k ) = σ y2 ( k ) + σ w2 ( k ) − 2 ⋅ Cov ( yk , wk ) = σ y2 ( k ) + σ w2 ( k ) − 2( E[ yk ⋅ wk ] − E[ yk ] ⋅ E [ wk ] ) = σ y2 ( k ) + σ w2 ( k ) − 2( E[( xk + wk ) ⋅ wk ]) = σ y2 ( k ) + σ w2 − 2 ⋅ E[ wk2 ] = σ y2 ( k ) − σ w2 ( k ). k = 0,. , L −1. (3.6). 20.
(31) 至於參數 c 值的估算,原則上雖應由音訊 y 求得,但較簡單的方法是 利用原始音訊 x 事先作分析求得。主要是利用餘弦係數 x 的平均絕對值 E [ x ]及變異值 σ 2 ,其推導公式如下:. E[ x ] = ∫. ∞. ∞. −∞. x ⋅ f x ( x ) dx = 2 ∫ x ⋅ f x ( x ) dx = 0. 在(3.7)式中,令 y = (β ⋅ x )c ⇒ x = E[ x ] =. β ⋅c. ∞. 1. Γ(1 c ) ∫0 β. 1 c. ⋅ y ⋅e. −y. β. ∞. Γ(1 c ) ∫0. 1. ⋅ y c , dx =. x⋅e. − β ⋅x. c. dx. (3.7). 1. −1 1 y c dy 可得 β ⋅c. 1. −1 1 ⋅ ⋅ y c dy β ⋅c. 2. =. −1 ∞ 1 −y y c ⋅ e dy ∫ β Γ(1 c ) 0. =. 1 Γ(2 c ) ⋅ β Γ(1 c ). 1. 1. β ⋅c. ⋅. (3.8). 同理可推 σ 2 = Var[x ] = ∫−∞ x 2 ⋅ f x (x ) ⋅dx 則 ∞. σ2 =. 1. β2. −1 ∞ 1 1 Γ(3 c ) −y y c ⋅ e dy = 2 ⋅ ∫ β Γ(1 c ) Γ(1 c ) 0 3. ⋅. (3.9). 根據上述公式,第 k 個轉換係數 xk 所對應的機率模型參數值 ck 之計算公式 為: E [ xk. σk. ]=. Γ(2 c k ). Γ(1 c k ) ⋅ Γ(3 c k ). E [ xk ⇒ ck = F −1 σk. ] . = F (ck ). k = 0,1,. (3.10). , L −1. 21. (3.11).
(32) 根據公式(3.10), F (c ) 與 c 的對應關係如圖 3.4 所示。舉例而言,我們選擇 一鋼琴音樂作測試,利用音框長度 L = 256 與公式(3.11),求得該音訊所屬 個別的餘弦轉換係數 xk 所對應的理論最佳 ck 值。結果發現鋼琴音樂的餘弦 係數分佈,如圖 3.5 所示,在低頻處 ck 值都介於 1.0~0.5 之間,而高頻處 則趨近於 2。 0.9 0.8 0.7 0.6. F(c ). 0.5 0.4 0.3 0.2 0.1 0 0.5. 1. 1.5 C. 2. 2.5. 3. 圖 3.4 F (c ) 對應 c 函數圖. P iano.wav-1 3. 2.5. V alue of C. 2. 1.5. 1. 0.5. 0 50. 100 150 DCT coefficient position. 200. 250. 圖 3.5 鋼琴音樂轉換係數的理論 ck 值圖. 22.
(33) 3.2.2 檢測效能理論分析 一旦利用音訊餘弦係數的機率分佈,推導出最佳的浮水印檢測演算 法,接下來我們將透過誤警機率 PF 及確認機率 PD ,作為浮水印檢測效能評 估的指標。在實驗中假設秘密金鑰 K 的選取是隨機的,該實驗的目標就是 在測試這些金鑰產生的浮水印,嵌入原始音訊 x 製成加印訊號 y 後,我們對 這些加印訊號檢測的結果。. ∆. 若給定一共有 M = 2 N 個可隱藏的訊息集合 Β ={ b 0 , b1 , , b M −1 },假設每個 隱藏訊息 b l = { bl ,0 , bl ,1 , , bl ,N −1 }被嵌入音訊的機率均相等為 p(b l ) =. 1 ,且假設 M. K x −1. 不同餘弦係數間互相獨立,則 f x (x ) = ∏ f x ( xk ) ,再將廣義高斯分佈機率函數 k =0. k. 代入(3.2),推導結果如下: Λ ( y ) = − ln M +. K x −1. ∑β k =0. ∧. 其中定義 k = (k. C∧ k. ∧. k. ⋅ yk. C∧ k. C∧ + ln ∑∏ exp − ∑ β ∧ k ⋅ yk − bl ,i ⋅ α k ⋅ s k k∈Si k l =0 i =0 M −1 N −1. C∧ k. (3.12) . mod L) , K x 為音訊取樣點的總數目。(3.12)式中的 β ∧ 及 c∧ 代 k. 表其值不受音框改變而不同,亦即 β = β ( k ∧. k. mod L ). , c∧ = c( k k. mod L ). k. ,因此每一音. 框中相同位置上之值皆相同。反之,{ yk ,α k } 則會因音框與係數位置的不同而 有差異。至於虛擬亂數 sk ,則是用同一組 256 個亂數序列在每一個音框中重 覆使用。. 23.
(34) 在浮水印檢測理論分析的第一部份,我們先將實驗鎖定隱藏的訊息為 單一位元( N = 1 )且 b0 = 1 ( M = 1 )的特殊狀況,也就是嵌入單一位元的浮水印 (pure watermark)。則此條件帶入(3.12)式中,檢測器的相似函數 Λ ( y ) 將 可簡化為: Λ (y) =. K x −1. ∑β k =0. C∧ k. ∧ k. ⋅ . C∧ k. yk. − yk − α k ⋅ sk. C∧ k. . (3.13). 首先考慮事件 H 0 為真的情況,代表測試的音訊 y 不包含金鑰 K 產生的浮水 印,則(3.13)式可寫成: Λ (y) =. K x −1. ∑β k =0. C∧ k. ∧. k. ⋅ . xk. C∧ k. − xk − α k ⋅ sk. C∧ k. . (3.14). 公式(3.14)式中 Λ ( y ) 為 K x 個統計獨立的項次總和,所以 Λ ( y ) 在事件 H 0 為 真的情況下,其函數趨近於高斯分佈,符合圖 3.2 中當初的假設。再者 sk 若 為+1 及-1 值各佔一半的虛擬亂數,我們將可求出 Λ ( y ) 的平均值與變異值:. E Λ ( y ) | H 0 =. K x −1. ∑β k =0. (. C∧ k. ∧. k. ⋅ xk. C∧ k. 1 K x −1 C∧k − ∑ β ∧ ⋅ xk + α k 2 k =0 k . Var ( Λ ( y ) | H 0 ) = E Λ ( y ) − E Λ ( y ) | H 0 . ). 2. C∧ k. − xk − α k. K x −1 2 C ∧ =1 k ⋅ xk + α k β ∧ ∑ 4 k =0 k . 24. C∧ k. C∧ k. . − xk − α k. (3.15) C∧ k. 2. (3.16) .
(35) 同理可推,在事件 H 1 發生的情況下 yk = xk + α k ⋅ sk ,則(3.13)式等於: Λ (y) =. K x −1. ∑β k =0. C∧ k. ∧. k. ⋅ xk + α k ⋅ sk . C∧ k. . C∧ k. − xk. (3.17). 同樣(3.17)式的 Λ ( y ) 亦為 K x 個統計獨立項次的總和,在事件 H 1 為真的情況 下, Λ ( y ) 的函數趨近於高斯分佈,我們並可求出 Λ ( y ) 的平均值與變異值:. 1 K x −1 C∧ E Λ ( y ) | H1 = ∑ β ∧ k ⋅ xk + α k 2 k =0 k . C∧ k. 1 K x −1 2C∧ Var ( Λ ( y ) | H1 ) = ∑ β ∧ k ⋅ xk + α k 4 k =0 k . − xk − α k. C∧ k. C∧ k. − xk − α k. K x −1 C∧k − ∑ β k∧ ⋅ xk k =0. C∧ k. . C∧ k. (3.18). 2. (3.19). 比較(3.15)、(3.16) 、(3.18) 、(3.19)式,我們發現 Λ ( y ) 在事件 H 1 發 生時的分佈函數,在理想狀況恰與事件 H 0 發生時的分佈函數依原點對稱, 且皆屬於高斯分佈,因此圖 3.2 的決策臨界值將設定為 η = 0 。我們定義 ∆. ∆. m1 = E Λ ( y ) | H1 和 σ 12 = Var ( Λ ( y ) | H1 ) ,則誤警機率 PF 及確認機率 PD 可分別表. 示成: η + m1 η − m1 , PD = Q PF = Q σ1 σ1 . (3.20). 25.
(36) 其中 η 稱為決策臨界值,也就是 Λ ( y ) 在兩事件下分佈曲線的實際交點,而 Q (v ) =. 1 2π. ∫. ∞. v. e. −t2. 2. dt 。假設我們限制誤警機率不能超過其上限 PF ,對應至某. 一 臨 界 值 符 合 此 條 件 , v = Q −1 (PF ) , 也 就 是 說 Q (v ) = PF 。 接 著 我 們 定 義 ∆. SNR1 =. m12. σ 12. ,則(3.20)式將可改寫成:. (. η − m1 η + m1 m = Q − 2 1 = Q Q −1 (PF ) − 2 SNR1 PD = Q σ1 σ1 σ1. ). (3.21). 透過公式(3.21)我們可以輕易地分析檢測器效能與 SNR1 的關係,在固定的 誤警機率 PF 條件下, SNR1 的值越大則代表確認機率 PD 越高,也就是正確檢 測出金鑰 K 產生浮水印的機率越高,代表檢測器效能越好。如圖 3.6 所示, 當 SNR1 大於 10dB 以上時, PF 臨界值在 10 −6 以下都能達到不錯的檢測效果。. 圖 3.6 檢測器效能與 SNR1 的關係圖. 26.
(37) 在理論分析的第二部份,我們針對多位元(N=2)隱藏訊息的環境做進一 步推導,修改其檢測演算法如下: Λ ( y ) = − ln M +. K x −1. ∑β k =0. ⇒ Λ '(y) =. K x −1. ∑β k =0. c∧ k. ∧. k. C∧ k. ∧. k. ⋅ yk. ⋅ yk. C∧ + ln ∑ ∏ exp − ∑ β ∧ k ⋅ yk − bl ,i ⋅ α k ⋅ s k k∈Si k l =0 i = 0 M −1 N −1. C∧ k. C ∧ + ln ∑ ∏ exp − ∑ β ∧ k ⋅ yk − bl ,i ⋅ α k ⋅ s k k∈Si k l =0 i =0 M −1 N −1. c∧ k. C∧ k. C∧ k. H1 > 0 (3.22) < H0. H1 > ln M (3.23) < H0. 因為 Λ ' ( y ) 為 K x 個統計獨立項次的總和, 由中央極限定理得知, Λ ' ( y ) 的函 數趨近於高斯分佈,且 sk 若為+1 及-1 值各佔一半的虛擬亂數,在事件 H 0 為 真的情況下我們可求出 N=2 時 Λ ' ( y ) 的平均值與變異值: E Λ ' ( y ) | H 0 ≈. K x −1. ∑β k =0. C∧ k. ∧. k. ⋅ xk. C∧ k. 1 K x −1 C∧k − ∑ β ∧ ⋅ xk + α k 2 k =0 k . 1 K x −1 2C∧k Var ( Λ ' ( y ) | H 0 ) ≈ ∑ β ∧ ⋅ xk + α k 4 k =0 k . C∧ k. − xk − α k. C∧ k. C∧ k. . − xk − α k. C∧ k. . (3.24). 2. (3.25). 同理,在事件 H1 為真的情況,我們也可推得 N=2 時 Λ' ( y) 的平均值與變異值 (詳細推導過程示於附錄 A): 1 K x −1 C∧k E Λ ' ( y ) | H1 ≈ ∑ β ∧ ⋅ xk + α k 2 k =0 k 1 K x −1 2C∧k Var ( Λ ' ( y ) | H1 ) ≈ ∑ β ∧ ⋅ xk + α k 4 k =0 k . C∧ k. − xk − α k. C∧ k. 27. − xk − α k. C∧ k. C∧ k. K x −1 C∧k − ∑ β k∧ ⋅ xk k =0 . C∧ k. (3.26). 2. (3.27).
(38) 由(3.24) 、(3.25)、(3.26)、(3.27)式,我們可發現 N=2 時 Λ ' ( y ) 的分佈函 數與第一部份(N=1 且 M=1)的 Λ ( y ) 的分怖情形相同,意即其皆為高斯分佈, 且平均值與變異值皆相同。不同之處為 N=2 時 Λ ' ( y ) 判斷為事件 H1 或事件 H 0 的決策臨界值η = ln 4 ,有別於第一部分的η = 0 。進一步推導後,我們亦發 現 N=2 情況的 PD 值亦可推出如同(3.21)式之結果,只須設定式中之η = ln 4 即可。. 3.3 非特定模型的檢測機制 在此探討一個更廣泛的問題,假設待測的浮水印之機率模型 f x (x) 未知 或很難去近似時,例如在非餘弦頻域時並無適當之機率模型可近似,在此 情況下,那我們該如何進行浮水印檢測呢?在 2.2 節所描述的展頻浮水印產 生過程中,N 位元的隱藏訊息 b 經展頻成為 L (L>>N)維度的 w,再產生加 印訊號 y=x+w。若反向思考,我們也可透過一種轉換 r=h(K,y),由原本 L 維度的待測訊號 y 取得 N 維度的 r 再作浮水印的檢測[19]。在實際應用上, 我們可事先量測原始訊號之統計特性,如:各態歷經(ergodicity)或類各態歷 經(quasi-stationarity),利用其特性得到原始訊號 x 的一階與二階動差(first-. and second-order)。在這些情況下,即使原始訊號 x 的真正分布情形未知, 但至少可得知其平均值、變異值、與互變異值(cross variance),以便能幫助 我們設計效能較佳的降維轉換函數 h(K,y)。我們所使用的轉換如下:. 28.
(39) ri = 4 ⋅ ∑. α k sk y k σ k2. ,. i ∈ {0,. , N-1} (3.28). ∧. k :0≤ k ≤ K x −1, ∧ k∈Si . ∧. 此為一種透過計算其相關性的方法來降低其維度,其中 σ k2 為第 k 個轉換係數 ∧. 的變異值。因為 sk 為獨立且同型分佈(i.i.d.)隨機變數,由中央極限定理可 得知, ri 可近似為高斯分佈且假設互為獨立。在事件 H1 為真情況下, yk = xk + bl ,iα k sk ,假設 xk 與 sk 互為獨立,可推導得 ri 的平均與變異值分別為. α k2 α k2 xk2 2 a = 4 = 16 σ ∑ 2 , r ∑ σ4 。 E[ri | H1 ] = bl ,i ai , Var[ ri | H 1 ] = σ ,其中 i k∈S σ k∈S 2 ri. i. ∧. i. i. k. ∧. k. 1 N −1 ( ri − bl ,i ai ) f ( r | H ) = ⋅ exp[ − ]。 ∑ 其機率分布則為 r 1 2 N N −1 σ 2 2 = i 0 ri (2π ) ∏ σ ri 2. 1. i =0. 而在事件 H 0 為真情況下, yk = xk ,假設 xk 與 sk 互為獨立,可推導得 ri 的. α k2 xk2 平均與變異值分別為: E[ri | H 0 ] = 0 , Var[ ri | H 0 ] = σ = 16 ∑ σ 4 。其機 k∈S 2 ri. i. ∧. k. 1 N −1 ( ri )2 ⋅ exp[ − ∑ 2 ] 。進一步利用奈曼-皮爾 率分布則為 f r ( r | H 0 ) = N N −1 2 i =0 σ ri 2 (2π ) ∏ σ ri 1. i =0. 生法則推導出最佳決策法則如下: f ( r | H1 ) Λ ( r ) = ln r = ln f r (r | H 0 ). f (r | H ) ∑b P(b) f r ( r | H 1 ) 0 r. 29. H1 >. <. H0. η = ln. P( H 0 ) P ( H1 ). (3.29).
(40) 其中η 為決策臨界值。假設 P(b) = 1 M 且 P( H1 ) = P( H 0 ) = 0.5 ,則 1 N −1 ( ri − bl ,i ai ) ⋅ exp[ − ∑ ] 2 N N −1 2 σ 2 0 i = r i (2π ) ∏ σ ri 2. 1. M −1. 1 Λ ( r ) = ln{∑ ⋅ l =0 M. i =0. 1 (2π ). N. N −1 2. ∏ σ ri. ⋅ exp[−. 1 N −1 ( ri ) 2 ∑ ] 2 i =0 σ r2i. H1 }. >. <. H0. η = ln. 0.5 =0 0.5. i =0. 1 N −1 ai2 N −1 ar Λ (r ) = − ∑ 2 + ∑ ln[cosh( i 2i )] σ ri 2 i =0 σ ri i =0. H1 >. <. η=0. (3.30). H0. 在附錄 B 中,我們進一步推出在事件 H 0 與 H1 為真的情況下, Λ ( r ) 期望 值與變異值如下:. 1 N −1 ai2 E[ Λ ( r ) | H1 ] ≈ ∑ 2 − N ⋅ ln 2 2 i =0 σ ri. (3.31). 1 N −1 ai2 E[Λ ( r ) | H 0 ] ≈ − ∑ 2 − N ⋅ ln 2 2 i =0 σ ri. (3.32). N −1. Var[ Λ ( r ) | H1 ] = Var[ Λ ( r ) | H 0 ] ≈ ∑ i =0. ∆. 由此可求出 SNR1 =. ai2. (3.33). σ r2 i. E[ Λ ( r ) | H1 ]2 ,進而利用(3.21)式計算其確認機率 PD 。同 Var[ Λ ( r ) | H1 ]. 樣地,我們可以輕易地分析檢測器效能與 SNR1 的關係,在固定的誤警機率 PF 條件下,SNR1 的值越大則代表確認機率 PD 越高,也就是正確檢測出金鑰 K 產 生浮水印的機率越高,代表檢測器效能越好。. 30.
(41) 3.4 實驗結果與分析 [實驗 3-1] 目的:針對弦樂四重奏音樂,探討在特定的廣義高斯模型中,不同位元之 隱藏訊息 b ,及模型參數 c 對浮水印檢測函數 Λ ( y ) 及其效能之影響。. 步驟:我們考慮單一位元( N = 1 且 M = 1 )的浮水印 Β = { b0 = 1} ,及兩個位元 ( N = 2 , M = 22 = 4 ) 的 浮 水 印 Β = { b0 , b1 , b2 , b3} , 及 四 個 位 元 ( N = 4 , M = 2 4 = 16 )的浮水印 Β = { b 0 , b1 ,. , b15 } 。在實驗中,我們將這些隱藏. 訊息分別以不同的 100 組虛擬亂數製成浮水印,再嵌入於相同的弦 樂四重奏音樂中,製成 100 組不同的加印音訊。並以經事先分析所 得到的可調 c 值(如圖 3.7 所示),及固定 c 值(0.5、1、2)來做比較。 在此所謂的可調 c 值,是利用(3.11)式事先估算個別轉換係數的 ck , 而固定 c 值則是為了簡化分析而設定所有 ck 值為相同。. 結論:圖 3.8、圖 3.9 及圖 3.10 顯示出針對不同隱藏位元及不同秘密金鑰之 檢測函數 Λ( y ) 值的分布情形,可發現不論固定 c 值或可調 c 值,對加 印音訊及原始音訊所得到之 Λ ( y ) 值的分布有明顯差距,可據此準確地 判斷音訊是否嵌入浮水印。另外將其統計特性分別列於表 3.1、表 3.2 及表 3.3 中,比較檢測器對不同位元浮水印的檢測效能,可觀察出實. 31.
(42) 驗值與理論值具有一致性。進一步觀察,發現因為我們所加入之浮水 印之長度皆相同,故在 N=1、N=2、N=4 之情況下,檢測效能亦無明顯 差距。此外餘弦係數機率模型的參數 c 對檢測效能有很大之影響,在 固定 c 值中以 c=0.5 之檢測效能達到最佳,可調式 c 值亦與 c=0.5 之 效能相當接近。. D istribution of C of string quartet 3. 2.5. Value of C. 2. 1.5. 1. 0.5. 0. 0. 50. 100 150 C oefficient position. 200. 圖 3.7 弦樂四重奏音樂轉換係數之理論 ck 值圖. 32. 250.
(43) Distribution of /\(y) of string quarete 6000. 4000. Adaptive C. /\(y). 2000 C=0.5 C=0.5 C=1 C=1 C=2 C=2. 0. -2000. -4000. -6000. Adaptive C. 0. 10. 20. 30. 40 50 60 K( PN sequence index). 70. 80. 90. 100. 圖 3.8 弦樂四重奏單一位元特定模型中加印音訊與原始音訊的檢測值分布. C=0.5 N=1, M=1 SNR1 (dB). C=1. C=2. Adaptive C. 實驗值. 理論值. 實驗值. 理論值. 實驗值. 理論值. 實驗值. 理論值. 34.05. 33.41. 32.02. 32.85. 28.44. 27.63. 34.72. 33.38. E Λ ( y ) | H1 . 4.90 ⋅ 103 4.88 ⋅ 103 2.26 ⋅ 103 2.25 ⋅ 103 1.50 ⋅ 103 1.49 ⋅ 103 5.63 ⋅ 103 5.56 ⋅ 103. Var Λ ( y ) | H1 . 9.46 ⋅ 103 1.08 ⋅ 104 3.21 ⋅ 103 2.62 ⋅ 103 3.21 ⋅ 103 3.84 ⋅ 103 1.07 ⋅ 104 1.42 ⋅ 104. E Λ ( y ) | H 0 . −4.90 ⋅ 103. Var Λ ( y ) | H 0 . 9.46 ⋅ 103 1.08 ⋅ 104 3.21 ⋅ 103 2.62 ⋅ 103 3.21 ⋅ 103 3.84 ⋅ 103 1.07 ⋅ 104 1.42 ⋅ 104. −4.88 ⋅ 103 −2.29 ⋅ 103 −2.25 ⋅ 103. −1.63 ⋅ 103. −1.49 ⋅ 103. −5.63 ⋅ 103 −5.56 ⋅ 103. 表 3.1 弦樂四重奏單一位元特定模型檢測值的統計特性. 33.
(44) Distribtuion of /\(y) for detection 2-bit watermarked string quartet 6000. 4000 Adaptive C. /\(y). 2000 C=0.5 C=0.5 C=1 C=1 C=2 C=2. 0. -2000. Adaptive C. -4000. -6000. 0. 10. 20. 30. 40 50 60 K (PN sequence index). 70. 80. 90. 100. 圖 3.9 弦樂四重奏兩位元特定模型中加印音訊與原始音訊的檢測值分布. C=0.5 N=2, M=4 SNR1 (dB). 實驗值. E Λ ( y ) | H1 . 4.91 ⋅ 10. 理論值. 33.91. 實驗值. 33.41 3. Var Λ ( y ) | H1 9.79 ⋅ 103 E Λ ( y ) | H 0 . C=1. 4.88 ⋅ 10. C=2 理論值. 32.40 3. 1.08 ⋅ 104. 2.26 ⋅ 10. 實驗值. 32.85 3. 2.95 ⋅ 103. 2.25 ⋅ 10. 理論值. 27.58 3. 2.62 ⋅ 103. 1.50 ⋅ 10. Adaptive C 實驗值. 27.63 3. 3.96 ⋅ 103. 1.49 ⋅ 10. 理論值. 33.82 3. 3.84 ⋅ 103. 5.63 ⋅ 10. 33.38 3. 5.56 ⋅ 103. 1.32 ⋅ 104. 1.42 ⋅ 104. −4.80 ⋅ 103 −4.88 ⋅ 103 −2.24 ⋅ 103 −2.25 ⋅ 103 −1.55 ⋅ 103 −1.49 ⋅ 103 −5.58 ⋅ 103 −5.56 ⋅ 103. Var Λ ( y ) | H 0 9.79 ⋅ 103. 1.08 ⋅ 104. 2.95 ⋅ 103. 2.62 ⋅ 103. 3.96 ⋅ 103. 3.84 ⋅ 103. 1.32 ⋅ 104. 表 3.2 弦樂四重奏兩位元特定模型檢測值的統計特性. 34. 1.42 ⋅ 104.
(45) Distribution of /\(y) for detecting 4-bit watermarked string quartet 6000. 4000. Adaptive C. /\(y). 2000 C=0.5 C=0.5 C=1 C=1 C=2 C=2. 0. -2000. Adaptive C -4000. -6000. 0. 10. 20. 30. 40 50 60 K (PN sequence index). 70. 80. 90. 100. 圖 3.10 弦樂四重奏四位元特定模型加印音訊與原始音訊的檢測值分布. C=0.5. C=1. C=2. Adaptive C. N=4, M=16 SNR1 (dB). 實驗值. 實驗值. 實驗值. 實驗值. 34.14. 33.02. 28.24. 35.82. E Λ ( y ) | H1 . 4.89 ⋅ 103. 2.26 ⋅ 103. 1.50 ⋅ 103. 5.63 ⋅ 103. Var Λ ( y ) | H1 . 9.22 ⋅ 103. 2.54 ⋅ 103. 3.36 ⋅ 103. 8.29 ⋅ 103. E Λ ( y ) | H 0 . −4.77 ⋅ 103. −2.22 ⋅ 103. −1.53 ⋅ 103. −5.51 ⋅ 103. Var Λ ( y ) | H 0 . 9.22 ⋅ 103. 2.54 ⋅ 103. 3.36 ⋅ 103. 8.29 ⋅ 103. 表 3.3 弦樂四重奏四位元特定模型檢測值的統計特性. 35.
(46) [實驗 3-2] 目的:針對弦樂四重奏音樂,探討在非特定之轉換係數機率模型中,不同 位元之隱藏訊息 b 對浮水印檢測函數 Λ ( y ) 及其效能之影響。. 步驟:我們考慮單一位元( N = 1 且 M = 1 )的浮水印 Β = { b0 = 1} ,及兩個位元 ( N = 2 , M = 22 = 4 )的浮水印 Β = { b0 , b1 , b2 , b3} ,及四個位元( N = 4 , M = 2 4 = 16 )的浮水印 Β = { b 0 , b1 ,. , b15 } 。實驗中我們將這些隱藏訊息. 分別以不同的 100 組虛擬亂數製成浮水印,再嵌入於相同的弦樂四 重奏音樂中,製成 100 組不同的加印音訊,再對其做偵測。. 結論:表 3.4 列出不同隱藏位元的檢測值統計特性,其中亦可發現理論值與 實驗值具有一致性,且針對加印音訊與非加印音訊所得之檢測值 Λ ( y ) 具有相當差距,故亦可正確偵測出音訊是否嵌入浮水印。特別. 強調的是與實驗 3-1 作比較,我們可發現特定模型確實比非特定模型 得到較佳的檢測效能。. 36.
(47) N=1. N=2. N=4. 實驗值. 理論值. 實驗值. 理論值. 實驗值. 理論值. SNR1 (dB). 28.02. 27.63. 26.99. 28.44. 30.17. 28.84. E Λ ( r ) | H1 . 1.16 ⋅ 103. 1.16 ⋅ 103. 1.40 ⋅ 103. 1.40 ⋅ 103. 1.54 ⋅ 103. 1.53 ⋅ 103. Var Λ ( r ) | H1 . 2.12 ⋅ 103. 2.32 ⋅ 103. 3.94 ⋅ 103. 2.80 ⋅ 103. 2.27 ⋅ 103. 3.07 ⋅ 103. E Λ ( r ) | H 0 . −1.12 ⋅ 103. −1.16 ⋅ 103. −1.34 ⋅ 103. −1.40 ⋅ 103. −1.45 ⋅ 103. −1.53 ⋅ 103. Var Λ ( r ) | H 0 . 2.12 ⋅ 103. 2.32 ⋅ 103. 3.94 ⋅ 103. 2.80 ⋅ 103. 2.27 ⋅ 103. 3.07 ⋅ 103. 表 3.4 弦樂四重奏在非特定模型中檢測值的統計特性. [實驗 3-3] 目的:針對鋼琴音樂,探討在特定模型與非特定模型中,單一隱藏位元浮 水印檢測效能,並與弦樂四重奏音樂的實驗結果作比較。. 步驟:我們考慮單一位元(N=1,M=1)的浮水印。實驗中我們將這些隱藏訊息 分別以不同的 100 組虛擬亂數製成浮水印,再嵌入於鋼琴音樂中, 製成 100 組不同的加印音訊,再對其做偵測。. 結論: 比較表 3.5 與表 3.1,表 3.4 與表 3.6,我們可發現鋼琴音樂之檢測效 能較差,這是因為鋼琴音樂之理論 ck 值(示於圖 3.5)分布較亂,不若 弦樂四重奏音樂般集中。此外,亦可發現鋼琴音樂在固定 c 值之檢 測效能以 c=1 時達到最佳。至於其它統計特性,則可得到與弦樂四 重奏音樂類似的結果,舉例而言,不論固定 c 值或可調 c 值,對加. 37.
(48) 印音訊及原始音訊所得到之 Λ ( y ) 值的分布有明顯差距,可據此準確 地判斷音訊是否嵌入浮水印;亦可觀察出實驗值與理論值具有一致 性。. Piano. C=0.5. N=1, M=1. 實驗值. SNR1 (dB). 19.45. C=1. 理論值. 實驗值. 21.08. C=2. 理論值. 20.35. 實驗值. 22.51. Adaptive C. 理論值. 19.65. 實驗值. 20.10. 理論值. 20.45. 21.73. E Λ ( y ) | H1 . 7.09 ⋅ 10 7.18 ⋅ 10 3.84 ⋅ 10 3.89 ⋅ 10 2.29 ⋅ 10 2.30 ⋅ 10 4.73 ⋅ 10 4.77 ⋅ 102. Var Λ ( y ) | H1 . 5.71 ⋅ 103 4.02 ⋅ 103 1.36 ⋅ 103 8.49 ⋅ 102 5.67 ⋅ 102 5.18 ⋅ 102 2.01 ⋅ 103 1.53 ⋅ 103. E Λ ( y ) | H 0 Var Λ ( y ) | H 0 . 2. -7.08 ⋅ 102. 2. 2. -7.18 ⋅ 102 -3.84 ⋅ 102. 2. 2. -3.89 ⋅ 102. −2.30 ⋅ 102. 2. 2. −2.30 ⋅ 102 −4.42 ⋅ 102 −4.77 ⋅ 102. 5.71 ⋅ 103 4.02 ⋅ 103 1.36 ⋅ 103 8.49 ⋅ 102 5.67 ⋅ 102 5.18 ⋅ 102 2.01 ⋅ 103 1.53 ⋅ 103. 表 3.5 鋼琴單一位元特定模型檢測值的統計特性. Piano. N=1 實驗值. SNR1 (dB). 19.62. 理論值. 20.08. E Λ ( r ) | H1 . 2.02 ⋅ 10. 2. 2.04 ⋅ 102. Var Λ ( r ) | H1 . 4.48 ⋅ 102. 4.10 ⋅ 102. E Λ ( r ) | H 0 . -1.89 ⋅ 102. -2.06 ⋅ 102. Var Λ ( r ) | H 0 . 4.48 ⋅ 102. 4.10 ⋅ 102. 表 3.6 鋼琴單一位元非特定模型檢測值的統計特性. [實驗 3-4] 目的:針對長笛音樂,探討在特定模型與非特定模型中,單一隱藏位元浮 水印檢測效能,並與弦樂四重奏、鋼琴音樂的實驗結果作比較。. 38.
(49) 步驟:我們考慮單一位元(N=1,M=1)的浮水印。實驗中我們將這些隱藏訊息 分別以不同的 100 組虛擬亂數製成浮水印,再嵌入於長笛音樂中, 製成 100 組不同的加印音訊,再對其做偵測。. 結論: 比較表 3.7 與表 3.5、表 3.1,表 3.8 與表 3.4、表 3.6,我們可發現長 笛音樂之檢測效能與弦樂四重奏相近,比鋼琴較佳,這是因為長笛 音樂之理論 ck 值(示於圖 3.11)分布較鋼琴集中,而與弦樂四重奏相 近。此外,亦可發現長笛音樂在固定 c 值之檢測效能以 c=0.5 時達到 最佳。至於其它統計特性,則可得到與弦樂四重奏音樂類似的結果, 舉例而言,不論固定 c 值或可調 c 值,對加印音訊及原始音訊所得 到之 Λ ( y ) 值的分布有明顯差距,可據此準確地判斷音訊是否嵌入浮 水印;亦可觀察出實驗值與理論值具有一致性。另一值得注意的是: 長笛音樂在可調式 c 值的檢測效能達到最佳。. Flute. C=0.5. N=1, M=1 SNR1 (dB). 實驗值. 理論值. 35.16. 38.00. E Λ ( y ) | H1 . 1.04 ⋅ 10. Var Λ ( y ) | H1 . 3.30 ⋅ 104. E Λ ( y ) | H 0 Var Λ ( y ) | H 0 . 4. 1.04 ⋅ 10. C=1 實驗值. 理論值. 34.62 4. C=2 實驗值. 37.83. Adaptive C. 理論值. 33.50. 實驗值. 35.42. 36.13. 38.84. 5.49 ⋅ 10 5.49 ⋅ 10 6.24 ⋅ 10 6.24 ⋅ 10 1.07 ⋅ 10 1.06 ⋅ 104 3. 3. 3. 3. 4. 1.71 ⋅ 104 1.04 ⋅ 104 4.97 ⋅ 103 1.74 ⋅ 104 1.12 ⋅ 104 2.80 ⋅ 104 1.47 ⋅ 104. −1.06 ⋅ 104 −1.04 ⋅ 104 −6.02 ⋅ 103 −5.49 ⋅ 103 −6.58 ⋅ 103 −6.24 ⋅ 103 3.30 ⋅ 104. 理論值. −1.19 ⋅ 104 −1.06 ⋅ 104. 1.71 ⋅ 104 1.04 ⋅ 104 4.97 ⋅ 103 1.74 ⋅ 104 1.12 ⋅ 104 2.80 ⋅ 104 1.47 ⋅ 104. 表 3.7 長笛單一位元特定模型檢測值的統計特性. 39.
(50) Distribution of C for flute 3. 2.5. Value of C. 2. 1.5. 1. 0.5. 0. 0. 50. 100 150 Coefficient position. 200. 圖 3.11 長笛音樂轉換係數之理論 ck 值. Flute. N=1 實驗值. 理論值. SNR1 (dB). 32.75. 35.42. E Λ ( r ) | H1 . 6.95 ⋅ 103. 6.96 ⋅ 103. Var Λ ( r ) | H1 . 2.57 ⋅ 104. 1.39 ⋅ 104. E Λ ( r ) | H 0 . −6.83 ⋅ 103. −6.96 ⋅ 103. Var Λ ( r ) | H 0 . 2.57 ⋅ 104. 1.39 ⋅ 104. 表 3.8 長笛單一位元非特定模型檢測值的統計特性. 40. 250.
(51) 第四章. 浮水印解碼分析. 接收到的音訊經過檢測確認含有金鑰 K 製成的浮水印後,接下來的工 作便是要把隱藏訊息 b 自加印訊號 y 中擷取出來,還原成為提供智財權認證 的重要資訊。而浮水印解碼亦可視為展頻通訊系統的解調問題,把隱藏訊 息當成傳輸位元,至於原始音訊就是傳輸通道中的雜訊,利用擬亂序列的 自相關特性,把隱藏位元逐一解碼回來。如同第三章的檢測機制,我們運 用音訊餘弦係數的廣義高斯機率模型,配合最大相似度演算法 (maximum. likelihood algorithm),來推導出快速實現的最適化浮水印解碼機制[21];並 在最後探討在未知餘弦係數模型的情況下,如何設計最佳的浮水印解碼機 制。. 4.1 最佳解碼演算法則 浮水印解碼器的設計旨在正確還原加印音訊 y 中嵌入的隱藏訊息 b ,假 ∆. 設我們共有 M = 2 N 個可隱藏的訊息集合 Β ={ b 0 , b1 , , b M −1 },則此問題可視為 選擇一個最大可能性的訊息作為解碼輸出結果。假設嵌入的隱藏訊息 b = b l , l ∈ { 0,1,. , M − 1},則產生的浮水印訊號為 w l = P(K , x ) ⋅ b l ,且其元素可. 寫成 wl ,k = bl , j ⋅ α k ⋅ sk , ∀k ∈ S j ,其中 k ∈ { 0,1, , L − 1 }, j ∈ { 0,1, , N − 1 } 。因此 解碼器的輸出便是在給定金鑰 K 的情況下,搜尋所有的訊息集合 B ,最後找. 41.
(52) 到的輸出訊息 b l 必須使得誤碼機率 Pe 最小。假設訊息集合中的每個訊息. { b 0 , b1 ,. , b M −1 }擁有相同的先驗機率 P( bl ) = 1. M. ,則最大相似度解碼器所搜尋. 輸出的訊息 b l 必須滿足: ∧. b = arg max f y ( y | bl ) M −1 {bl }l = 0. ∧. b = bl if ln. f y ( y | bl ). f y ( y | bm ). = ln. f x ( y − wl ) >0, ∀m≠l f x ( y − wm ). (4.1). 我們定義誤碼機率 Pe = P b ≠ b ,作為評估浮水印解碼效能優劣的指 ∆. ∧. . . ∧. 標。誤碼機率 Pe 表示從浮水印擷取還原的訊息資料 b 與嵌入的原始隱藏訊息 ∧. b 之間存在差異的機率,當誤碼機率過大時,還原的訊息 b 則可能無法提供. 作為認證與辨識使用。所以我們在將隱藏訊息製成浮水印前,可適時加入 錯誤修正碼(forward control code)或交插編碼(interleaving)等保護, 來對抗網路傳輸的失真或惡意的攻擊。. ∧. 把浮水印從加印訊號 y 中擷取出來,還原回隱藏訊息 b 的過程,稱之為 浮水印解碼。如圖 4.1 所示,解碼處理過程可視為浮水印嵌入程式的逆向 操作。訊號處理細節敘述如下,首先對收到的音訊每 L 個取樣點作離散餘弦 轉換,求得該音框的 L 個轉換係數 yk ,將所求得的轉換係數 yk 、標準差 σ k 、 加權比重值 α k 、及秘密金鑰 K 產生的虛擬亂數 sk 共同輸入解碼器當中,再 利用解碼函數將嵌入音訊內的浮水印每個訊息位元逐一還原。. 42.
(53) 圖 4.1 浮水印解碼流程圖. 4.2 特定模型的解碼機制 若我們將音訊頻域係數假設為廣義高斯分佈機率,再代入(4.1)式之解 碼法則中,應可預期推導出浮水印解碼之快速實現演算法。根據廣義高斯 分佈函數公式(3.3),並假設 y 元素之間互相獨立,則. f y ( y | bl ) = f y ( y − w l ) βk∧ ck∧ c∧ c∧ k k =∏ ⋅ exp( − βk∧ ⋅ yk − wl ,k ) k = 0 2 Γ(1/ ck∧ ) K x −1. ln. f y ( y | bl ). f y ( y | bm ). K x −1. c∧. k = ∑ yk − wm ,k − yk − wl ,k k =0. 1. C∧. 其中 β k. ∧. ln. k. c∧ k. c∧. ⋅β ∧ k k. 1. 2 Γ(3/ C∧ ) 2 1 Γ(3/ Ck∧ ) k > 0 。因此(4.1)式可簡化為 = 而 C∧ Γ(1/ C∧ ) (1/ C Γ ∧ ) k σk k k . f y ( y | bl ). f y ( y | bm ). >0 ≡. K x −1. ∑ k =0. yk − wm ,k. C∧ k. σ. − yk − wl ,k C∧ ∧. k. k. 43. C∧ k. >0. , ∀m≠l. (4.2).
(54) 4.2.1 解碼演算的簡化 若依轉換係數索引集合 S j 來分別考量,(4.2)式可改寫成:. ∑[A ] + ∑[A ] +. k∈S0. 其中 Aj =. 0. k∈S1. yk − bm , j ⋅ α k ⋅ sk. C∧ k. ∑ [A ] > 0. +. 1. k∈S N −1. N −1. − yk − bl , j ⋅ α k ⋅ sk. σ. C∧ ∧. , ∀m≠l. (4.3). C∧ k. , k ∈Sj. k. k. 再進一步分析得知,當 k ∈ S j 時滿足 yk = xk + bl , j ⋅ α k ⋅ sk ,而隱藏訊息位元符合 b j = 1 或 b j = −1 ,所以經由表 4.1 的歸納,我們又可將 k ∈ S j 的轉換係數索引. 集合,分成 k ∈ S +j 及 k ∈ S −j 兩項子集合。. bl , j. bm , j. Aj. 1. 1. 0. 1. -1. S +j. -1. 1. S −j. -1. -1. 0. 表 4.1 bl , j 與 bm, j 關係對照表. 44.
(55) 因此公式(4.3)中的每項 A j 皆可分成:. Aj =. yk − bm , j ⋅ α k ⋅ sk. C∧ k. − yk − bl , j ⋅ α k ⋅ sk. σ. C∧ k. ,k ∈Sj. C∧ ∧. k. k. =. ∑. xk + 2α k ⋅ s k. σ. k∈S +j. C∧ k. − xk. C∧ k. C∧ ∧. +. ∑. σ. k∈S −j. k. C∧ k. xk − 2α k ⋅ sk. k. − xk. C∧ k. (4.4). C∧ ∧. k. k. ∧. [定理]:最大相似度解碼器的輸出訊息 b 可簡化為: ∧. b = arg max bTl ⋅ r. (4.5). bl ∈B. ∆. 其中 r = {r0 , r1 , , rN −1} , rj = ∑ T. yk + α k ⋅ sk. k∈S j. C∧ k. σ. − yk − α k ⋅ sk C∧ ∧. C∧ k. (4.6). k. k. [證明]:若嵌入的隱藏訊息為 b = b l ,則由公式(4.5),我們解出的訊息應 ∧. 為 b = b l ,且符合:. b Tl ⋅ r > b Tm ⋅ r , ⇒. (b. T l. − b Tm ) ⋅ r > 0 , ∀ m ≠ l. 將(4.7)式依轉換係數索引集合 S j 來個別展開:. 45. (4.7).
(56) T T ( bl − bm ) ⋅ r = ∑ j =0 N −1. N −1 = ∑ j =0 . ∑. 2 . (. bl , j − bm , j ) ⋅ ∑. C∧ k. − xk. C∧. σk. C∧ k. − yk − α k ⋅ sk C∧. σk. k∈S j. xk + 2α k ⋅ sk. k∈S +j. yk + α k ⋅ sk. C∧ k. +. ∑. 2 . xk − 2α k ⋅ sk. C∧ k. C∧. σk. k∈S −j. k. k. k. C∧ k. . − xk. C∧ k. > 0 (4.8) . (4.8)式的條件與(4.4)式代入(4.3)所得的結果相同,因此最大相似度解碼 器的解碼函數可用(4.5)式來表示。. [定理]:最大相似度解碼器的輸出位元可簡化為 b j = sign (rj ) , ∧. j ∈ { 0,1,. , N −1. }. (4.9). [證明]: 因為隱藏訊息集合 B 的每個訊息皆為 N 位元的雙極性(binary antipodal)碼字,也就是 bl , j ∈ { 1, −1} 。所以在訊息集合 B 中的 M = 2 N 個可能 ∧. 訊息裡,最大相似度解碼器就是要從其中挑選出一個嵌入訊息 b,使得 bTl ⋅ r 的值為最大。由於 bTl ⋅ r = bl ,0 ⋅ r0 + bl ,1 ⋅ r1 +. + bl , N −1 ⋅ rN −1 ,所以當 bl , j 和 rj 的正負號 ∧. 相同時,就能滿足 bTl ⋅ r 乘積值為最大的條件。因此最大相似度隱藏訊息 b 的 可由每個位元的逐一解碼而得: b j = sign (rj ) , ∧. 46. j ∈ { 0,1,. , N −1. }.
數據
Outline
相關文件
Singleton,”A methd for computing the fast Fourier Transform with auxiliary memory and limited high-speed storage”, IEEE Trans. Audio
Zhang, “A flexible new technique for camera calibration,” IEEE Tran- scations on Pattern Analysis and Machine Intelligence,
F., “A neural network structure for vector quantizers”, IEEE International Sympoisum, Vol. et al., “Error surfaces for multi-layer perceptrons”, IEEE Transactions on
Muraoka, “A Real-time Beat Tracking System for Audio Signals,” in Proceedings of International Computer Music Conference, pp. Goto, “A Predominant-F0 Estimation Method for
On the content classification of commercial, we modified a classic model of the vector space to build the classification model of commercial audio, and then identify every kind
Godsill, “Detection of abrupt spectral changes using support vector machines: an application to audio signal segmentation,” Proceedings of the IEEE International Conference
Ahmad, A Variable Block Size Motion Estimation Algorithm for Real-time H.264 Video Encoding, Signal Processing: Image Communication,
D.Wilcox, “A hidden Markov model framework for video segmentation using audio and image features,” in Proceedings of the 1998 IEEE Internation Conference on Acoustics, Speech,