第二章 何謂浮水印
2.2 資訊隱藏的運用-浮水印
隨著網際網路(Internet)的普及和它的便利性,使得資料的取得 已經變得十分容易且得以快速的複製與傳播。尤其是當圖畫、音樂、
影像等等經過數位化的處理後,任何人都可以藉由網際網路輕易取得 他人的原創作品,若未經作者的同意而任意覆製、修改,而侵害到原 作者的智慧財產權,為了能夠保護原創作者的權利,可利用浮水印的 技術在數位資訊裡頭加入宣告擁有者的(owner)一些資訊,而浮水 印便是一個跟資訊隱藏有關係的技術了。
何謂浮水印技術?簡單的說,就是一種可以將一些額外的資訊
(如文字、影像、聲音等)藏到一份媒體的技術。例如像文字、、聲 音、影像、多媒體影片等,都可稱作為媒體。 然而,浮水印又分為
密秘訊息、表達言外之音、智慧財產權的保護、以及其他種種的用途 等等,而這也就是為何浮水印近來會這麼受歡迎的原因之一。
2.3浮水印介紹
保護著作權的首要課題就是原創作者如何去證明某項電子文件 的全部或其一部份,確實為其所創作。而最原始的作法就是將作者的 電子簽章 (Digital Signature),放進其創作裏。這裏所指的電子簽章,
也就是所謂的電子浮水印 (Digital Watermarking ),用以和一般文字 檔案的電子簽章區別,通常用於影像(image)、聲音(audio)、視訊(video) 等資料中。
電子浮水印可分成可見(visible) 和不可見(invisible) 兩類,其做 法與目的也各不相同。前者最常見的例子就是有線電視(CATV)頻道 上所傳送的視訊資料角落通常會有屬於該頻道所特有的半透明商標 (logo),其最主要目的乃在於嚇阻作用,防止非法的使用,雖然減低 了該資料的商業價值,卻無損於擁有人的使用。
相反的,不可見的浮水印 (invisible watermark)藉由將屬於原創作 者的電子浮水印隱藏於影像資料中的不顯眼處,做為將來起訴非法使 用者的舉證,因此其最主要的目的乃是增加起訴非法使用者的成功 率,以保障原創作者的著作權。
當然,如果非法的使用者發現了浮水印,便會嘗試將其去除,因
此一個好的 電子浮水印必須要滿足以下五點要求:
1)透明性(Transparency):
加入的浮水印,需肉眼看不見或聽不見難以被人察覺,這樣能對 於原影像或聲音品質的影響應減至最低。
(2)不可移除性(Nonremovable) :
在儘量不影響影像品質的前提下,浮水印不可輕易被輕易剪下或 移除。
(3)強健性(Robustness) :
在經過一些影像處理的動作或壓縮後,浮水印仍能存在於影像資 料中維持其功能或浮水印能忍受各種數位處理與攻擊,至少在其被破 壞前原始影像已嚴重失真。
(4)可解碼性(Decodeability) :
對於經過授權的合法使用者,不需要原始的影像檔案,必須要能 輕易地將不可見的浮水印抽取出來。
(5)安全性(Security):
即使使用者知道加入的浮水印的程序也無法讓未經授權者移除 所加入的浮水印。
但目前要做到使上面五點通通做到還有困難,所以還有努力的空間。
我們小組也是以這五個方向為努力的目標來做我們的MP3浮水 印。而MP3之檔案格式,因為定義了許多檔頭(Header)及Side Information,故有許多空間可存放浮水印資料,且不會影響聲音品 質,但由於可輕易地被了解MP3檔案格式的人移除,不符合上述之 Nonremovable性質,故並不適用。所以一般來說是將浮水印資料,直 接隨機地加在聲音資料中。所應用的原理是另一種人體聲學現象:
Masking Effect(遮蔽效應),即兩個頻率相近的聲音,其中聲音較大 者(Masker)會將聲音較小者(Maskee)蓋過去,造成人耳幾乎完全 聽不到較小聲的聲音。故若將聲音來源先作快速傅立葉轉換,再將 Sound Press Level(聲壓)對頻率作圖,則可得到Masking Threshold 曲線,而在此曲線之下的聲音就幾乎聽不到了。利用此特性,則可以 將適量的浮水印資料加入聲音中,形成控告非法侵權的證據,而不會 被發現了。
2.4 常見的浮水印的技術
Spatial domain
最低位元法 Least significant bit (LSB):
Least significant bit embedding 是藉由 M_sequence 來改變電子
浮水印的表現,作法如下:第一步:將影像資料轉換為 8bit 的二 進位明文,舉例如果灰色圖素的值是 90 轉換結果值將為
01011010。第二步:選擇圖素的 Least significant bit 插入
watermark 一個位元轉換成新的資料,舉例說明如果我們想要嵌 入一個”1”在灰色值 90 的圖素裡我們將得到一個新的圖素資料 91 它的二進位是 01011011。
當我們執行 L S B 數位浮印技術我們可以得到的好處是非常的 簡單快速而且容易製作,加入浮水印的位元設在圖片區塊位元的 最低位元,是不易被人眼所觀察出來的。但是相對的它的缺點是 容易被雜訊及幾何改變的破壞,容易被刪除,安全性不高。
頻域轉換法
(frequency transform)
Discrete cosine transform (不連續餘弦轉換) :
不連續餘弦轉換是屬於區段基礎的處理,自從大部分影像及圖像 壓縮藉由 JPEG, MPEG 或 H.261/263 標準來處理,這些方法是
利用 DCT 的基礎技術,使用 DCT 來作電子浮水印處理是相當的 合宜,當我們利用 DCT 轉換作浮水印嵌入,一個圖檔會被分割 成兩個變動大小的同質性區塊,使用 DCT 作浮印處理的好處是 具有非常強韌性的資料而且不會降低視覺的品質。作法如下:1.
計算 DCT 包含於 N*N 個 BLOCK。2.選擇一對互相作用的 KEY 依照下列的規則嵌入 watermark
嵌入 1 當 X>Y,嵌入 0 當 X<Y
目前最新進的展頻技術是利用 DCT watermarking。
Wavelet transform(微波轉換):
在應用數位微波轉換之後原始資料將被轉換成數個波段,這些波 段包括低-低波段,低-高波段,高-低波段,高-高波段,利用微波 轉換來作浮印處理我們可以得到的好處是強化 MPEG 的程式及 重作和多重嵌入浮印處理的能力。
展頻 Spread spectrum
目前在電信通訊及人造衛星系統都使用展頻技術來增加資料安全的 能力及消除雜訊人為干擾,自從資料能夠應用延展技術相對的資料復 原比率也相對增加,舉例:我們傳送一個”1”如果我們接收到的也是
一個”1”,我們可以說這傳送是正確的,如果將”1”延展 3 次變
成”111”,這時接收到的可能是”011”,”101”,”110”,”111”,藉由多 數或最大可能性的原理我們得到原來正確的資料也是”1”,最近幾年 來展頻技術已經應用在浮水印處理技術上,無論如何最常使用的一個 方法是利用直接展頻,在這裡我們建議兩個新的處理方法叫做區段展 頻,主要是應用在區塊的處理,另外一個叫做重複展頻,是利用複製 的特性,藉由以上兩種方法我們可以增加嵌入資訊的品質,減少嵌入 的體積,更能增加復原的能力。
Direct sequence spread (直接序列展頻) :
下面的例子直接說明序列展頻的作法,步驟一:假設 watermark 的資料流是”1011001”,原始圖檔資料流是”00101001(41),
01010100(84),00111010(58),10000111(135),00011111(31),
10001000(136),00000000(0),11111111(255),
10101111(175),…..”,在此藉由展頻技術將 watermark 嵌入在影 像的資料裡面。步驟二:將 watermark 的資料流”1011001”延展 3 次可得”111000111111000000111”。步驟三:如果選擇 least
significant bit 的方法去嵌入將可得到”00101010(42),
01010101(85),00111011(59),10000111(135),00011111(31),
10001001(136),00000001(1),11111111(255),
10110000(176),…”。步驟四:將嵌入的資料取出我們可得到”1,
1,1,0,0,0,1,1,0…”。步驟五:應用多數理論的原則來 還原原始的 watermark 得到的是”1,0,1,1,0,0,1”。
Block spread spectrum (區塊展頻技術) :
區塊展頻技術是應用在區塊及周期性的遞歸處理上,如果利用 least significant bit 將 logo X 嵌入在圖檔 Y 裡面,這個資料的容 量等於圖檔圖素的總合,典型的區段展頻 least significant bit 資 料嵌入的作法如下步驟,步驟一:假設 logo X 是 I*J,圖像資料 Y 的容量是 M*N,I,J << M,N(最好>32 次)。步驟二:展開 X 的容量 I*J 變成二位元的資料流,得到 I*J*8 位元資料 X’。步 驟三:將圖像資料 Y 分割成(M*N)/(I*J*8)個區塊,我們叫做 Y’
區塊陣列。步驟四:每一個 Y’的區塊陣列圖素的 least significant bit 位置上嵌入 X’資料,一次一個 bit,順序是 Y’[1,1],Y’[1,
2]…Y’[k,n-k]。
以上的方法是利用區段展頻結合 least significant bit,圖檔的容量 剛好等於圖素的總合,在這裡,圖檔將被區分為多少個區塊呢?
這個答案將根據不同的 logo 和不同的圖檔特性來決定。
Duplication spreading (重複展頻) :
重複展頻的基礎只是應用反覆的嵌入處理,將 logo 展開的二位 元資料流嵌入圖檔的每一個圖素裡,重複執行,直到圖檔的最後 一個圖素。作法如下,步驟一:假設 logo X 的容量是 I*J,圖檔 Y 的資料容量是 M*N,在這裡 M,N >= I,J。步驟二:展開 logo X 成為二位元的資料,得到結果是 I*J*8 位元資料流 X’。步驟 三:將 X’嵌入圖檔 Y 順序是 Y[1,1],Y[1,2]…Y[M,N],按 照順序重複 X’直到 Y 檔案結束為止。
應用重複展頻技術可提高資料還原及安全性,此方法僅較優於直 接序列展頻。
展頻方法的比較 :
在直接序列展頻,浮水印的資料是不能回歸而且沒有周期性的性質,
因此可靠度是比較令人不滿意的。在區段展頻方面,最重要的好處是 不論 logo,watermark 或嵌入資料將很平均的被展開在原始影像檔 裡,而且分佈的很完美。應用重複展頻資料的安全度可被增加,但是 嵌入的資料不能分散的很均勻,它的效果比區段展頻技術較差。
第三章 何謂MP3
在初步了解浮水印後,在試著在MP3裡加入浮水印之前,我們必 須了解MP3的檔案架構以及解壓縮原理,才能找到適合我們存放隱藏 資訊的地方。
3.1 MP3 歷史:
MP3 所使用之演算法乃 1987 年由德國的整合研究發展機構 Fraunhofer IIS 與 University of Erlangen 合作研發出來。至今,
Fraunhofer 的編碼程式,依舊被視為 MP3 編碼的工業級標準。MP3 其實是 MPEG1 Audio Layer3 之縮寫,即 MP3 原本是定義在 MPEG
(Moving Picture Expert Group)中的一項聲音壓縮標準。
圖一 ISO MPEG 組織圖
如圖所示,ISO MPEG 的標準包含了四種壓縮標準:MPEG-1、
MPEG-2、MPEG-3、MPEG-4。而其中 MPEG-1 又分為五個部分:namely system,vidio,audio,compliance testing,software simulation。其中 MPEG-1 Audio 演算法是其中一種國際標準的數位壓縮技術,壓縮過 程並不會破會自然音樂的音質。他不但可以獨自應用在音樂方面的應 用軟體上也可以和其他視訊軟體結合使用。MPEG-1 依照不同的應用 需求分成了三層:Layer I,Layer II,Layer III。這三層分別支援 32kHz,
44.1kHz,48kHz 取樣頻率和四種撥放模式:Single Channel -單聲道 模式;Dual Channel-雙重聲道,利用一組資料流位元表示兩種獨立
44.1kHz,48kHz 取樣頻率和四種撥放模式:Single Channel -單聲道 模式;Dual Channel-雙重聲道,利用一組資料流位元表示兩種獨立