• 沒有找到結果。

應用卷積類神經網路於中文簽名圖形辨識之研究

N/A
N/A
Protected

Academic year: 2021

Share "應用卷積類神經網路於中文簽名圖形辨識之研究"

Copied!
13
0
0

加載中.... (立即查看全文)

全文

(1)

技術學刊 第三十四卷 第三期 民國一○八年  

Journal of Technology, Vol. 34, No. 3, pp. 145-157 (2019)



應用卷積類神經網路於中文簽名圖形辨識之研究 

洪偉嘉



侯東旭





海華科技股份有限公司資訊暨智能工程部

雲林科技大學工業工程與管理系

摘 要

生活有許多重要場合需要使用手寫簽名,當中牽涉龐大的利益,偽造簽名 的問題也層出不窮。因此,建立快速、有效、科學化的簽名真偽辨識工具一直 是個實際且重要的議題。現實生活中,收集專業的偽造簽名十分困難,因此根 據經濟考量下提出二種不同的實驗,提供給使用者參考。實驗一是訓練時與最 終測試時使用相同作家的簽名,實驗二是訓練時與測試時使用不同作家的簽 名。一般來說,國際上常見的相關文獻以實驗二居多。

深度學習中的卷積類神經網路 FRQYROXWLRQDOQHXUDOQHWZRUN &11  是近 年興起的影像辨識方法,以其具有較高的模型績效而聞名。本研究使用5HV1HW

Y,試驗了 、、 層對於  種實驗的結果,每種組合收集了  次的結 果。

結果方面,本研究發現實驗一的平均錯誤率只有 至  之間,

實驗二與其他研究的績效比較之下,有比較低的錯誤驗收率。本研究發現在 種層數下,分類錯誤率的差異並不明顯。因此,在實務中使用時,似乎可以尋 找更少層數的模型,來減少時間與硬體的耗用。另外,本研究發現到,整體而 言,模型有錯誤驗收率低於錯誤拒絕率的傾向,這表示本研究所提出的 &11 辨識系統在無法接受偽造簽名的簽名識別下具有優勢。

關鍵詞:離線簽名,深度學習,卷積類神經網路。





$678'<2)$33/,&$7,212)&2192/87,21$/1(85$/

1(7:25.6,12))/,1(&+,1(6(6,*1$785(5(&2*1,7,21

:HL&KLD+XQJ   7XQJ+VX+RX 

Intellectual Technology and Engineering Deaprtment AzureWavw Technologies, Inc.

New Taipei City, Taiwan 231, R.O.C.

Department of Industrial Engineering & Management National Yunlin University of Science and Technology

Yunlin, Taiwan 640, R.O.C.

Key Words: RIIOLQH VLJQDWXUH YHULILFDWLRQ GHHS OHDUQLQJ FRQYROXWLRQDO

QHXUDOQHWZRUN



通訊作者:侯東旭,HPDLOKRXWK#\XQWHFKHGXWZ

&RUUHVSRQGLQJDXWKRU7XQJ+VX+RXHPDLOKRXWK#\XQWHFKHGXWZ

(2)

 技術學刊 第三十四卷 第三期 民國一○八年

$%675$&7

+DQGZULWWHQVLJQDWXUHVDUHUHTXLUHGRQPDQ\LPSRUWDQWRFFDVLRQVLQOLIH 

$VVLJQDWXUHVDUHLPPHQVHO\UHODWHGWRKXPDQLQWHUHVWVLVVXHGZLWKIRUJHG

VLJQDWXUHV FRQVWDQWO\ DULVH  ,W LV WKHUHIRUH FUXFLDO WR HVWDEOLVK D IDVW

HIIHFWLYH DQG VFLHQWLILF VLJQDWXUH YHULILFDWLRQ PHWKRG  0RVW H[LVWLQJ

PHWKRGVXVHGWRYHULI\&KLQHVHVLJQDWXUHVKDYHIDLOHGWRDFKLHYHVDWLVI\LQJ

UHVXOWV  ,QFRQWUDVWWKHFRQYROXWLRQDOQHXUDOQHWZRUN &11 LQGHHSOHDUQLQJ

WKDWKDVHPHUJHGLQUHFHQW\HDUVLVDPHWKRGRILPDJHUHFRJQLWLRQDQGLV

NQRZQIRULWVKLJKPRGHOSHUIRUPDQFH  7KLVVWXG\WKXVKRSHVWRDFKLHYH

JRRGUHVXOWVLQ&KLQHVHVLJQDWXUHUHFRJQLWLRQE\XVLQJ&11LQGHHSOHDUQLQJ

,QSUDFWLFHLWLVYHU\GLIILFXOWWRFROOHFWSURIHVVLRQDOO\IRUJHGVLJQDWXUHV

7KHUHIRUH EDVHG RQ HFRQRPLF FRQFHUQV WZR GLIIHUHQW H[SHULPHQWV ZHUH

SURSRVHGWRWHVWWKHSHUIRUPDQFHRIWKH&11,QWKHILUVWH[SHULPHQWWKH

VLJQDWXUHVRIWKHVDPHRZQHUVZHUHXVHGGXULQJWKHWUDLQLQJDQGWKHILQDO

WHVWZKLOHLQWKHVHFRQGH[SHULPHQWWKHVLJQDWXUHVRIGLIIHUHQWRZQHUVDUH

XVHG ,W LV ZRUWK PHQWLRQLQJ WKDW LQ PRVW RI WKH H[LVWLQJ GRFXPHQWV WKH

VHFRQGPHWKRGRIH[SHULPHQWZDVDGRSWHG

,Q WKLV VWXG\ WKH OD\HU OD\HU DQG OD\HU GHHS UHVLGXDO

FRQYROXWLRQDO QHXUDO QHWZRUNV 5HV1HWY  ZHUH XVHG UHVSHFWLYHO\ WR

HVWDEOLVK WKH VLJQDWXUH UHFRJQLWLRQ V\VWHP  6LQFH WKHUHDUH WZR W\SHV RI

H[SHULPHQWVHDFKZLWKWKUHHW\SHVRIQHWZRUNFRQILJXUDWLRQVWKHUHDUHD

WRWDO RI VL[ H[SHULPHQW FRPELQDWLRQV DQG WKLUW\ UHSOLFDWLRQV IRU HDFK

FRPELQDWLRQ KDYH EHHQ FRQGXFWHG  7KHUHIRUH D WRWDO RI  QHWZRUN

SHUIRUPDQFHGDWDKDYHEHHQFROOHFWHGDQGDQDO\]HG

7KH UHVXOWV VKRZHG DQ HUURU UDWH RI WKH ILUVW H[SHULPHQW DV EHWZHHQ

  :KHQZHFRPSDUHGWKHSHUIRUPDQFHRIWKHVHFRQGH[SHULPHQW

ZLWKWKDWLQRWKHUVWXGLHVZHIRXQGWKDWWKHSURSRVHGPHWKRGKDGDORZHU

IDOVHDFFHSWDQFHUDWH  :HDOVRIRXQGWKDWWKHFODVVLILFDWLRQHUURUUDWHVRI

WKHWKUHHW\SHVRIQHWZRUNFRQILJXUDWLRQVKRZHGQRVLJQLILFDQWGLIIHUHQFH  7KLVUHVXOWLPSOLHVWKDWLQUHDOLW\WKHXVHUFDQXVHIHZHUOD\HUVRIQHWZRUNWR

UHGXFHWLPHDQGKDUGZDUHFRQVXPSWLRQ  )LQDOO\LQWKLVUHVHDUFKWKHIDOVH

DFFHSWDQFHUDWHLVORZHUWKDQWKHIDOVHUHMHFWLRQUDWHLQWKHVL[H[SHULPHQWDO

FRPELQDWLRQV  ,WLPSOLHVWKDWWKHSURSRVHG&11UHFRJQLWLRQV\VWHPKDVWKH

DGYDQWDJHRIQRWDFFHSWLQJIRUJHGVLJQDWXUHUHFRJQLWLRQ





一、緒 論

在科技進步的二十一世紀,生活中有許多東西都已電 子化,簽名也漸漸邁向電子化。儘管科技在進步,仍有許 多使用傳統紙筆簽名的場合。例如公家機關在簽署公文、

憑證,私人企業與民眾簽署房屋、汽車租賃、各式買賣契 約,信用卡付款,銀行開戶等,皆是使用傳統的紙筆簽名。

對於簽名而言,一直有偽造的問題存在。時至今日,

依然有許多仿冒簽名所引起的法律爭議。我國對於紙本簽 名的鑑定通常是鑑識人員憑借自身的知識與經驗進行鑑 定,其鑑定流程耗工費時,每次鑑定簽名需要約一個月左 右,並沒有一個有效、可靠、快速的科學化工具可以使用。

離線簽名 RIIOLQHVLJQDWXUH ,指的是透過筆簽名在各 式媒材上所得到的簽名,若要進行辨識,僅能依據媒材上 簽名的影像進行辨識。離線簽名辨識再細分可以分為兩種 任務,作家獨立與作家依賴。所謂的作家獨立任務指的

是,為每個要進行辨識的作家建立各別一套模型辨識真 偽。作家依賴模型希望建立一個通用模型,不需要為了一 個作家又新建立一個模型,但通常正確率也較低。

/LZLFNL 等人>@ 整理了投稿至電機電子工程師學會

,QVWLWXWHRI(OHFWULFDODQG(OHFWURQLFV(QJLQHHUV,(((  所舉 辦第  屆國際文件分析與辨識會議 WK ,QWHUQDWLRQDO

&RQIHUHQFHRQ'RFXPHQW$QDO\VLVDQG5HFRJQLWLRQ,&'$5  簽名辨 識比 賽 ,&'$5  6LJQDWXUH 9HULILFDWLRQ

&RPSHWLWLRQ6LJ&RPS  中共有  種方法,其中  種作 家依賴模型的離線簽名辨識方法,結果顯示,中文簽名辨 識的錯誤率遠高於荷蘭文的簽名。.HQQDUG 等人>@ 與 +X 等人>@ 的研究結果也顯示,其提出的方法在荷蘭文具有 不錯的效果,但在中文上的成效不佳。中文簽名辨識是個 碩大的挑戰,也因此探討中文的離線簽名辨識是具有價值 的。深度學習是近年在學界與業界興起的風潮,深度學習 與眾多研究相比,才剛發展沒有多久,仍有許多的未知數

(3)

 洪偉嘉和侯東旭:應用卷積類神經網路於中文簽名圖形辨識之研究 



 輸入或特徵映射圖與 î 核函數步幅為  的卷積計算







 î 步幅為  池化的運算範例





存在,人們也對其予以期待。卷積類神經 FRQYROXWLRQDO

QHXUDOQHWZRUN&11  是深度學習中用來辨識影像的方法,

也是目前進行影像辨識被認為較佳的方法之一。透過自動 尋找影像中的特徵,並從特徵中尋找更為抽象的特徵的設 計,使得卷積類神經網路在影像識別上具有優勢。目前有 一 些 學 者 +DIHPDQQ 等 人 >@ 、 +DIHPDQQ 等 人 >@ 、 .KDODM]DGHK 等人>@ 將卷積類神經網路應於識別手寫簽名 上,但尚未有學者運用卷積類神經網路對於中文的離線簽 名進行討論。因此本研究希望透過卷積類神經網路,建立 一個具有良好成效的中文簽名真偽辨識系統。

二、文獻探討

 卷積類神經網路

卷積類神經網路屬於監督式學習,透過梯度下降法,

修正參數,使誤差函數最小化,主要用於處理分類問題,

被運用在許多領域。卷積類神經網路一般照卷積對象的維 度,分為一維、二維、三維。原始的一維卷積類神經又被 稱為時間延遲類神經,通常用於訊號或序列的分析,三維 則用於動態影像或是體積型影像分析>@。二維卷積類神經 網路的應用十分廣泛與多變,人臉辨識、場景標籤、影像 辨識、文本分析、語音識別等>@,尤其是靜態影像辨識領 域獲得重大的突破>@。本研究屬於二維卷積類神經網路 中的影像辨識。

卷積類神經網路具有四個關鍵性的概念,局部連結、

共享權重、池化與多層>@。其基本結構可以被分為兩個部

份,第一個部份為卷積層與池化層,其功能在於尋找影像 中的局部特徵,卷積類神經的第一部份可以由若干的卷積 層與池化層組合而成。第二部份為全連結層,其結構近似 於傳統的倒傳遞類神經網路,功能在於進行分類。 一 卷積層

 在類神經網路中討論卷積時,通常不是指數學中正式 的離散卷積運算>@,以下將會針對卷積在類神經網 路實際應用上進行介紹。

 在卷積層中,通常會透過上一層,輸入或是特徵映射  IHDWXUHPDS ,與多個核函數 NHUQHOIXQFWLRQ  進 行運算,運算完的結果稱為特徵映射圖。當中,核函 數也被稱為濾波器 ILOWHU 。核函數在後向傳遞運算的 過程也會被修正,因此自身也可以被視為權重。數學 式表達如下:



l l l l

X g

¦

X  K b   

 其中, 代表卷積運算,Kl為核函數,bl為臨界值,上 標為第O 層。輸入或特徵映射圖與 u 核函數步幅為

 的卷積計算 如圖  所示 。

二 池化層

 影像中特徵的相對位置,可能有些許變化、變形、扭 曲等,藉由池化層將影像粗糙化,把類似的特徵合併 成一個新特徵,這使得神經網路可以學習粗糙化後的 特徵,來可靠地檢測圖案>@。î 步幅為  的池化 範例 如圖  所示 ,I ڄ  為池化方法。目前常見的池

 

 





Q x

x

xm

xm xm xm,n xm,n

xmn

x xn xn

k k k

k k k

k k k

xn

N P N

核函數 輸入的輸入層或特徵映射圖

 

 





T

S

xk + xk + xk

+ xk + xk + xk

+ xk + xk + xk

xmk + xmk + xmk

+ xmk + xmk + xmk

+ xmk + xmk + xmk

xnk + xnk + xnk

+ xnk+ xn-1k + xnk

+ xnk+ xn-1k + xnk

xmnk + xmnk+ xmnk

+ xmnk + xmnk + xmnk

+ xmnk + xmn-k + xm,nk

I x x x x I x x x x I x x x x

I x x x x

I x x x x

I x x x x

I x x x x

I x x x x

I x x x x

x x x x x x

x x x x x x

x x x x x x

x x x x x x

x x5 x x x x

x x x x x x

(4)

 技術學刊 第三十四卷 第三期 民國一○八年

 化方法有最大池化法、平均池化法>@ 與 /範數池 化法>@。

最大池化為取池化範圍的PuQ 個元素中的最大值作 為輸出值,以數學式表達如下:

PD[

   m n

f x x x x u   

三 全連結層

 全連結層與傳統的全連結倒傳遞類神經相似,在卷積 類神經中主要扮演著分類器的角色。卷積類神經網路 是一個基於倒傳遞演算法的類神經網路,考慮一個簡 單的卷積類神經模型,其可分前向傳遞與後向傳遞兩 個階段。

四 歸一化函數與交叉熵

 過去在倒傳遞類神經網路上,經常會使用誤差平方 VTXDUHHUURUIXQFWLRQ  做為誤差函數,修正網路之權 重。對於處理分類問的卷積類神經網路而言,對於輸 出的結果,會透過歸一化函數 又稱為 VRIWPD[ 函數  進行歸一化,將輸出的每個元素轉換到 >@ 之間,

且所有元素和為>@。簡單來說,就是轉換為機率 值。歸一化函數公式如下:

Ö VRIWPD[i i yiyj j

t y e

¦

e   

 交叉熵為熵的一種形式,可以被解釋為機率分配之間 的相似或不相似程度>@。在類神經網路中,交叉熵與 歸一化函數結合,被用來度量類神經網路的輸出與真 實資料間的差距。假設機率分配 P x  為由獨熱編碼

RQHKRWHQFRGLQJ  構成的真實分配,Q x  為類神經 網路輸出經過歸一化函數轉換後的分配,其皆為離散 型機率分配,則交叉熵定義如下:

+  ORJe

x

p q 

¦

p x q x   

 使用交叉熵作為誤差函數並結合歸一化函數,比起誤 差平方和能更快速的修正權重,可以有效少訓練次數

>@。因此,近期的卷積類神經網路模型大多採取此策 >@。

五 激勵函數

 傳統常見於類神經網路的激勵函數以6 型函數與雙 曲正切函數被廣泛使用,如表一所示。這兩種函數 在多層倒傳遞類神經中有著飽和問題,使得整個網 路難以訓練,效果也不佳>@。.UL]KHYVN\ 等人>@

 年使用了線性整流函數 5HFWLILHG /LQHDU

8QLW5H/8 ,如表二,取得不錯的成果。不僅解決 了飽和問題,也減緩了梯度消失的影響,並且比起

表一 常見的激勵函數

 數學式 函數圖形

6 型函數 y eu 



雙曲正 切函數

u u

u u

e e

y e e







 





表二 線性整流函數

 數學式 函數圖形

線性整

流函數 y PD[  u 







 6 型函數或雙曲正切函數在運算上更簡潔,在具有 大量參數的卷積類神經網路中更具優勢。也因此,

在具有多層的卷積類神經網路上,會傾向使用線性 整流函數。

六 參數初始化

 卷積層的參數,例如核函數、偏權值,會影響到會影 響到整個類神經網路的績效。<RVLQVNL 等人>@ 表 示,卷積類神經網路中,在不同的資料集上、不同的 模型結構中,前幾層的核函數多傾向學習類似的特 徵。透過在大型資料集上訓練好的權重作為初始的核 函數,比起隨機核函數從頭開始訓練,可以得到更良 好的結果。

 全連結層的參數,有權重、偏權值。對於各層的參數 做最佳的初始化是有難度的,因此經常使用隨機亂數 作為初始值。+H 等人>@ 提出了 065$ 初始化

065$LQLWLDOL]DWLRQ ,其方法如下:

a  

W N

n

§ ·

¨ ¸

¨ ¸

© ¹  

VLJPRLG 







          

WDQK

          



















5H/8 







     

    





(5)

 洪偉嘉和侯東旭:應用卷積類神經網路於中文簽名圖形辨識之研究 



 第二代模塊與  層深度殘差網路之示意圖





 Q 為輸出節點的數量。比起其他參數初始化的方法,

065$ 初始化在線性整流函數具有較佳的結果。

 至於學習速率及世代次數等超參數之設定,則可以實 驗設計方式或使用反覆試誤法來找出適合的值。 七 涅斯捷羅夫動量

 6XWVNHYHU 等人>@提出了帶有涅斯捷羅夫動量的隨 機梯度下降能增加修正速度,其梯度下降程序如下

>@;>@:

 

 old  

m m

t t old t

new old t

v v E v x y

v

D K T T D

T T

  ˜ ’  

   

 深度殘差網路

+H 等人>@,提出了第一代的深度殘差網路 5HV1HW

Y ,5HV1HWY 是由數個模塊堆疊所構成的類神經網路,

透過數個模塊的連結,使得整體網路層數大幅增加至 

層。+H 等人>@ 對於模型進行了改善,提出了第二代的深 度殘差網路 5HV1HWY ,使得更深層  層  的網路得 以實現,並且具有更好的結果。深度殘差網路基本上是由 若干個模塊所堆疊而成,5HV1HWY 的模塊與堆疊方式與

 層深度殘差網路 如圖  所示 。

三、研究方法

影像處理的部份,本研究基於3LOORZ 來實現。卷 積類神經網路的部份,本研究基於7HQVRU)ORZ 來實 現,使用*H)RUFH*7; 單卡進行加速運算,浮點數為

 位元。

資料集的部份,本研究使用6LJ&RPS>@ 中簽名 辨識比賽所提供的 版中文中訓練組的簽名影像。資料 集網址如下:KWWSZZZLDSUWFRUJPHGLDZLNLLQGH[SKS

批量標準化

線性整流函數

線性整流函數

線性整流函數 權重

權重

權重

第二代模塊

;

;

輸出 全連結

池化

卷積模塊

卷積模塊 卷積模塊

卷積模塊

卷積模塊 卷積模塊

卷積模塊

卷積模塊

卷積模塊

卷積模塊

卷積模塊

卷積模塊

卷積模塊

卷積模塊

卷積模塊

卷積模塊

卷積模塊 ൈ

卷積模塊 ൈ

卷積模塊 ൈ

卷積模塊 ൈ

池化

卷積

輸入

批量標準化

批量標準化

(6)

 技術學刊 第三十四卷 第三期 民國一○八年

,&'$5BB6LJQDWXUHB9HULILFDWLRQB&RPSHWLWLRQB 6LJ&RP S  資料集中,所有影像均以 ELW 的 31* 圖像所構 成,掃描解析度為GSL,色彩為 5*% 的彩色影像。中 文資料集的離線簽名具有訓練組與測試組。訓練組中有

個參考作家的簽名與熟練的偽造簽名共 筆資料。

 實驗組合

實驗一為典型的訓練情境,訓練資料、驗證資料與測 試資料使用相同作家,每個資料集中有所有作家的一些真 實簽名與一些偽造簽名,如表三所示。

實驗二為考量現實情境之一,參考/LZLFNL 等人>@ 提 出在線與離線的熟練地偽造簽名比賽中的測試方式。為訓 練與驗證資料集中使用事先蒐集好一些作家的真實與偽造 簽名,在測試時使用與訓練時不同的作家,其中有真有假 的簽名下去測試模型的能力,如表四所示。考量卷積類神 經網路在分類時是根據特徵下去進行分類,若不同作家間 具有共同潛在特徵,並且與偽造簽名的特徵不同,則此種 方式是可行的。

又考量卷積類神經網路的深度會影響到績效,本研究 參考+H 等人>@ 所提出的深度殘差網路模型,考量  層、

 層與  層等  種層數。 種實驗搭配  種層數,故總 共會有 種的實驗組合。每種組合收集  筆資料,故總共  筆資料,如表五所示。

 實驗流程

整個實驗大體上可以被分為三個階段。第一階段為影 像前處理。第二階段,使用訓練集訓練資料,驗證集評估 模型,尋找適當的超參數。確定超參數後,展開第三階段,

開始正式訓練模型與測試結果,使用訓練集訓練資料,驗 證集評估類神經網路訓練過程的穩定性與好壞,模型訓練 完畢後使用測試集評估模型能力。

一 影像前處理與範例

 接著對所有的圖片進行尺寸轉換與反向,影像要能被 卷積類神經網路處理,需要將資料集的彩色影像尺寸 齊一化至uu 的陣列中。將較長的長邊或寬 邊等比縮放至 像素即可,多數的中文簽名採用橫 式寫作,故多為依據長邊將圖等比縮放至 像素。

透過3LOORZ 套件進行縮小,設定方法為 $17,$/,$6

/DQF]RVUHVDPSOLQJ ,3LOORZ 官方文件表示,在產生 31* 的縮圖時,$17,$/,$6 的品質較其他方法好。

本研究並不探討縮圖演算法對結果的影響。

 等比縮放後,我們關注有簽名的部份亮度最低,數值 也最小,但卷積類神經網路關注的是數值最大的部 份,與圖不符。為此需要將圖像反相 LQYHUWLPDJH , 使得卷積類神經網路去關注簽名的部份,不關注空白 的部份。虛擬碼如下所示:



 

i i

image image i 

表三 6LJ&RPS 中文資料中訓練組的詳細資訊

 作家編號 真實

簽名數量

熟練地偽造

簽名數量

訓練組

  

  

  

  

  

  

  

  

  

  





表四 6LJ&RPS 中文資料中測試組的詳細資訊

 作家編號 真實

簽名數量

被質疑

簽名數量

測試組

  

  

  

  

  

  

  

  

  

  





表五 實驗組合表

  層  層  層

實驗一 實驗一  層 實驗一  層 實驗一  層

實驗二 實驗二  層 實驗二  層 實驗二  層





 影像前處理的範例 如圖  所示 ,參考 6LJ&RPS

收集資料的方式,使用複寫收集簽名。簽名範圍為寬 PP 與高度 PP 的方格中,並在被複寫的紙 張底下墊 張影印紙,來確保具有柔軟的書寫表面。

最後掃描成掃描解析度為GSL,色彩為 5*% 的彩 31* 影像。

二 切割資料集

 因為有兩種不同的實驗,會有兩種不同的資料集切割 法。

(7)

 洪偉嘉和侯東旭:應用卷積類神經網路於中文簽名圖形辨識之研究 

表六 混淆矩陣

分類類別

實際類別  

真 真陽性

(WUXHSRVLWLYH73)

偽陰性

(IDOVHQHJDWLYH)1)

偽 偽陽性

(IDOVHSRVLWLYH)3)

真陰性

(WUXHQHJDWLYH71)







 左為掃描後原始資料之範例,右為影像反相處理後 之範例





 實驗一:從完成影像前處理的影像,僅對測試組中作 家的真實與偽造簽名進行分層隨機抽樣。卷積類神經 網路的訓練集由當中的 所構成,驗證集則為

,測試集為剩下的 。

 實驗二:參考/LZLFNL 等人>@ 與 +X 等人>@ 的測試 方式,將訓練組中作家的真實與偽造簽名進行分層隨 機抽樣。卷積類神經網路的訓練集由其中的  為 訓練集,剩餘的 為驗證集。測試集則由測試組的 所有簽名構成。

三 調整超參數

 超參數的調整僅僅是單純的在訓練模型,並針對驗證 集的收斂情況與損失函數的圖形進行超參數調整。模 型訓練的完畢後,透過驗證結果與損失值來評估模 型。透過反覆試誤評估,來決定模型的學習速率、世 代次數與存檔條件。

四 正式訓練模型與測試結果

 正式訓練模型的階段,步驟大部分與調整超參數的階 段相同。不同在於,每個世代訓練完成後會檢查是否 達到存檔條件,若接達成條件則儲存參數,繼續訓 練,直到達到終止條件為止。達到終止條件後,則使 用最新的參數檔來作為卷積類神經網路的參數,以此 測試模型能力。

五 模型績效評估

 透過測試集測試模型,來評估模型的泛化能力,並計 算各績效指標。績效可以透過混淆矩陣運算,給定混 淆矩陣如表六>@:

 73:模型分類為真,且實際結果也為真。

 )3:模型分類為偽,但實際結果為真。

 71:模型分類為偽,且實際結果也為偽。

 )1:模型分類為真,但實際結果為偽。

 根據上述結果,可以計算績效指標:分類錯誤率 HUURU

UDWH(55 、錯誤拒絕率 IDOVHUHMHFWLRQUDWH)55  與 錯誤驗收率 IDOVHDFFHSWDQFHUDWH)$5 ,與其他學者 之研究,會以這三個指標做比較。在此實驗中,分類 錯誤率為整體簽名分類的錯誤比例,錯誤拒絕率為真 實簽名被分類到偽造簽名的比例,錯誤驗收率為偽造 簽名被分類到真實簽名的比例。各績效指標與混淆矩 陣關係如下:

FP FN ERR TP TN FP FN



   

FRR FN

TPFN  FAR FP

FPTN 

 另外,本研究想要了解在不同層數下的「分類錯誤率」

是否有所不同,導致過度適配或是適配不足的情況,

因此使用50$129$ 分析。

 卷積類神經網路之建構

本次實驗使用的模型基本上與+H 等人>@ 所提出用 ,PDJH1HW 的深度殘差網路模型相似,如表七所示。考量 用於,PDJH1HW 圖庫上的深度殘差網路中全連結層  個 節點對應的是,PDJH1HW 圖庫的  個分類。本研究為二 元分類問題,在最後一層的部份,需要將全連結層的神經 元數量修正為。

經過調整超參數的階段,經由試誤法決定,卷積類神 經網路的相關超參數與設定如表八所示:

四、研究結果

本研究有 種實驗,搭配  種層數,共有  種實驗組 合。對每一種實驗組合重複收集 次結果,共有  筆的 結果。

(8)

 技術學刊 第三十四卷 第三期 民國一○八年

表七 本研究使用之模型

名稱 輸出的特徵

映射圖大小  層  層  層

輸入 uu   像素 u 像素 u 通道(5*%) 

卷積 uu  uu,步幅  

池化 uu  uu 最大池化,步幅  

卷積模塊u[ uu

  

   

  

ª u u º

« u u »u

« »

« u u »

¬ ¼



  

   

  

ª u u º

« u u »u

« »

« u u »

¬ ¼



  

   

  

ª u u º

« u u »u

« »

« u u »

¬ ¼



卷積模塊u[ uu

  

   

  

u u

ª º

« u u »u

« »

« u u »

¬ ¼



  

   

  

u u

ª º

« u u »u

« »

« u u »

¬ ¼



  

   

  

u u

ª º

« u u »u

« »

« u u »

¬ ¼



卷積模塊u[ uu

  

   

  

ª u u º

« u u »u

« »

« u u »

¬ ¼



  

   

  

ª u u º

« u u »u

« »

« u u »

¬ ¼



  

   

  

ª u u º

« u u »u

« »

« u u »

¬ ¼



卷積模塊u[ uu

  

   

  

u u

ª º

« u u »u

« »

« u u »

¬ ¼



  

   

  

u u

ª º

« u u »u

« »

« u u »

¬ ¼



  

   

  

u u

ª º

« u u »u

« »

« u u »

¬ ¼



池化 uu 全域平均池化

全連結   個神經元,歸一化函數輸出





表八 本研究使用之模型

卷積類神經網路模型 5HV1HWY  

預訓練法 基於遷移學習的預訓練法

激勵函數 5H/8

全連結層權重初始化方法 065$ 初始化

正則化方法 / 正則化, 

最佳化方法 帶有涅斯捷羅夫動量的隨機梯度下降

學習速率 

動量 

每批量大小 EDWFKVL]H  

浮點數精度  位元

世代數 HSRFK  



 實驗結果之描述性統計

實驗一當中,分別對 種不同層數的結果各收集  筆 資料,共 筆。實驗一的結果如表九所示,顯示  種不同 層數的模型均可以找到測試集錯誤率為 的結果。實驗二 當中,分別對  種不同層數的結果各收集  筆資料,共

 筆,結果如表十所示。 層的平均 (55 與 )$5 最低,

 層的 )55 最低。

 分類錯誤簽名統計

在實驗一中發現,在 層時「最容易」被分錯的前

三名為作家編號、、 的簽名,在  層時最容易被 分錯的前三名為作家編號、、 的簽名,在  層時 最容易被分錯的前三名為作家編號、、 的簽名。可 以發現作家編號  與  的簽名是較容易被分錯的簽名

如圖  所示 。

在實驗二中發現,在 層時「最不容易」被分錯的前 三名為作家編號、、 的簽名,在  層時最不容易 被分錯的前三名為作家編號、、 的簽名,在  層 時最不容易被分錯的前三名為作家編號、、 的簽名。

可以發現作家編號、 與  的簽名是較不容易被分錯 的簽名 如圖  所示 。

(9)

 洪偉嘉和侯東旭:應用卷積類神經網路於中文簽名圖形辨識之研究 

表九 實驗一對 種不同層數模型的結果

 5HV1HWB9 5HV1HWB9 5HV1HWB9

編號 (55 )55 )$5 (55 )55 )$5 (55 )55 )$5

平均值         

標準差         

最大值         

最小值         





表十 實驗二對 種不同層數模型的結果

 5HV1HWB9 5HV1HWB9 5HV1HWB9

編號 (55 )55 )$5 (55 )55 )$5 (55 )55 )$5

平均值         

標準差         

最大值         

最小值         







 實驗一分類錯誤統計



 實驗二分類錯誤統計













     作家編號 D 層時分類錯誤統計

次數

    













     作家編號 F 層時分類錯誤統計

次數

    















     作家編號 E 層時分類錯誤統計

次數

    













    

作家編號 D 層時分類錯誤統計

次數

    













    

作家編號 E 層時分類錯誤統計

次數

    













    

作家編號 F 層時分類錯誤統計

次數

    

(10)

 技術學刊 第三十四卷 第三期 民國一○八年

表十一 本研究與其他研究之比較

  中文

學者 方法 (55   )55   )$5  

/LZLFNLet al  

方法   

方法   

方法   

方法   

方法   

方法   

方法   

.HQQDUGet al   方法   

+XHWDO   方法   

本研究

5HV1HWB9          5HV1HWB9          5HV1HWB9         





表十二 實驗一的0DXFKO\ 球形檢定

受試者內效應 0DXFKO\ތV: 近似卡方分配 自由度 顯著性 (SVLORQE

*UHHQKRXVH*HLVVHU +X\QK)HOGW 下限

層數       





表十三 實驗一層數對分類錯誤率的50$129$

來源 類型,,, 平方和 自由度 均方 ) 顯著性

層數

假設的球形     

*UHHQKRXVH*HLVVHU     

+X\QK)HOGW     

下限     

(UURU 層數 

假設的球形     

*UHHQKRXVH*HLVVHU     

+X\QK)HOGW     

下限     





 實驗二與其他研究之比較

比較本研究之結果與其他學者之研究結果,如表十一 所示,表中列出本研究各績效指標的平均值及標準差。發 現本研究在(55 指標上表現並沒有特別差,在 )55 指標 上最差,而在)$5 指標上最好。本研究是使用深度學習的 深度殘差網路來做辨識,而其他學者是使用傳統的特徵選 取及分類器 如支持向量機、羅吉斯迴歸及隨機森林等  來做辨識。本研究會有比較好的 )$5 而有比較不好的 )55,其原因可能是深度殘差網路直接由訓練集資料來學 習特徵,而此資料庫中偽造的簽名筆數又比真實簽名筆數

多所致,即是資料不平衡所致,但目前是無法由文獻來驗 證此原因。

 模型層數對錯誤率之比較

本研究使用假設檢定來推論層數對分類錯誤率是否 有影響,以此來判斷是否有過度適配或是適配不足的問 題。

對實驗一之結果進行0DXFKO\ 球形檢定,發現不顯著

3! ,假設資料符合球形,如表十二所示。進行 50

$129$ 分析,發現層數對於分類錯誤率不具有顯著影響

3! ,如表十三所示,故不進行事後檢定。因此,沒

(11)

 洪偉嘉和侯東旭:應用卷積類神經網路於中文簽名圖形辨識之研究 

表十四 實驗二層數對分類錯誤率的50$129$

受試者內效應 0DXFKO\ތV: 近似卡方分配 自由度 顯著性 (SVLORQE

*UHHQKRXVH*HLVVHU +X\QK)HOGW 下限

層數       





表十五 實驗二層數對分類錯誤率的50$129$

來源 類型,,, 平方和 自由度 均方 ) 顯著性

層數

假設的球形     

*UHHQKRXVH*HLVVHU     

+X\QK)HOGW     

下限     

(UURU

層數 

假設的球形     

*UHHQKRXVH*HLVVHU     

+X\QK)HOGW     

下限     





有足夠證據支持層數對於分類錯誤率有顯著影響。對實驗 二之結果進行0DXFKO\ 球形檢定,發現不顯著 3! , 假設資料符合球形,如表十四所示。進行50$129$ 分 析,發現層數對於分類錯誤率不具有顯著影響 3! , 如表十五所示,故不進行事後檢定。因此,沒有足夠證據 支持層數對於分類錯誤率有顯著影響。

五、結論與建議

本研究根據不同的應用情境,提出二種不同的實驗,

使用 5HV1HWY 進行建模。結果表示,實驗一應用情境的 結果遠優於實驗二的應用情境。由實驗一的結果可知,卷 積類神經網路具有能抽出簽名中特徵與分類的能力並且能 妥善分類。但在實驗二當中的表現卻不如預期,兩組不同 的簽名所蘊含的特徵不大相同。

本研究有個發現,六種的實驗組合中,對於卷積類神 經網路整體而言,具有)$5 比 )55 低的傾向 比較  組 的平均值後的結果 。偽造的簽名不應該被接受,具有較低 )$5 是一個具有潛力的特性,但目前並不清楚是否為訓 練時偽造簽名比例偏多所導致,這並不在本研究的探討 範圍之內。

在機器學習上有個普遍的共識,在模型訓練良好的情 況下,若要使測試結果更佳,應要降低模型複雜度,反之 會導致過度適配的情況發生。若模型訓練不佳,增加模型 複雜度,可以使測試結果更佳。雖然本研究發現 種層數 對於錯誤率的變化並不顯著,似乎使用 層的網路模型,

可以較經濟且達到近似的表現,但此發現並不能推論 於所有的問題。一些研究報告指出,在深度學習當中,模



 正確率圖





型複雜度的增加對過度適配的發生並不是那麼明顯,但理 由還不清楚>@ 建議未來可以對過度配適問題做更深 入的實驗與理論探討,也可以試著去尋找不影響錯誤率的 情況下最少的層數,來縮短運算時間。

又由於本研究使用簡易型的*H)RUFH*7; 單卡

*38 進行加速運算,浮點數為  位元,因此訓練時間比 較長。在本研究的實驗一中, 層、 層及  層的 

世代訓練平均時間分別 秒、 秒、及  秒。

隨著*38 科技的進步,在使用先進型的 *38 下可以快速 地完成網路訓練,因此本研究主要探討深度學習網路的準 確率,而不在訓練時間上做比較。

本研究仍有許多可改善之處,在此提出下列幾項作為 後續研究之參考:







WUDLQLQJ YDOLGDWLRQ DFFXUDF\ 















HSRFK









參考文獻

相關文件

熟悉 MS-OFFICE

中文科 英文科 數學科 小三 能理解 文字 的段意及段落 簡淺敘述性 Recognizing key words in. a sentence

運用 Zuvio IRS 與台日比較文化觀點於日本文化相關課程之教學研究 Applying Zuvio IRS and Perspective on Cultural comparison between Taiwan and Japan to Teaching

時值知識經濟時代的來臨,台灣已加入了 WTO ( World Trade Organization,WTO ),企業面臨劇變之環境及廣闊的物料採購市 場,若能善用「知識管理」( Knowledge

A., and Revang, O., “A Strategic Framework for Analying Professional Service Firms — Developing Strategies for Sustained Performance”, Strategic Management Society

蔣松原,1998,應用 應用 應用 應用模糊理論 模糊理論 模糊理論

F., “A neural network structure for vector quantizers”, IEEE International Sympoisum, Vol. et al., “Error surfaces for multi-layer perceptrons”, IEEE Transactions on

系統精準度為 FALCON 系統學習完後之學習精確率,驗證組之平 均精度為系統經驗證組驗證後之系統精確率。上表 5-2 中 Case A、Case B 及 Case