應用卷積類神經網路於中文簽名圖形辨識之研究

(1)

技術學刊第三十四卷第三期民國一○八年 

Journal of Technology, Vol. 34, No. 3, pp. 145-157 (2019)

應用卷積類神經網路於中文簽名圖形辨識之研究

洪偉嘉

侯東旭

海華科技股份有限公司資訊暨智能工程部

雲林科技大學工業工程與管理系

摘要

生活有許多重要場合需要使用手寫簽名，當中牽涉龐大的利益，偽造簽名的問題也層出不窮。因此，建立快速、有效、科學化的簽名真偽辨識工具一直是個實際且重要的議題。現實生活中，收集專業的偽造簽名十分困難，因此根據經濟考量下提出二種不同的實驗，提供給使用者參考。實驗一是訓練時與最終測試時使用相同作家的簽名，實驗二是訓練時與測試時使用不同作家的簽名。一般來說，國際上常見的相關文獻以實驗二居多。

深度學習中的卷積類神經網路 FRQYROXWLRQDOQHXUDOQHWZRUN &11 是近年興起的影像辨識方法，以其具有較高的模型績效而聞名。本研究使用5HV1HW

Y，試驗了、、層對於種實驗的結果，每種組合收集了次的結果。

結果方面，本研究發現實驗一的平均錯誤率只有至之間，

實驗二與其他研究的績效比較之下，有比較低的錯誤驗收率。本研究發現在種層數下，分類錯誤率的差異並不明顯。因此，在實務中使用時，似乎可以尋找更少層數的模型，來減少時間與硬體的耗用。另外，本研究發現到，整體而言，模型有錯誤驗收率低於錯誤拒絕率的傾向，這表示本研究所提出的 &11 辨識系統在無法接受偽造簽名的簽名識別下具有優勢。

關鍵詞：離線簽名，深度學習，卷積類神經網路。

$678'<2)$33/,&$7,212)&2192/87,21$/1(85$/

**1(7:25.6,12))/,1(&+,1(6(6,1$785(5(&21,7,21**

:HL&KLD+XQJ 7XQJ+VX+RX

Intellectual Technology and Engineering Deaprtment AzureWavw Technologies, Inc.

New Taipei City, Taiwan 231, R.O.C.

Department of Industrial Engineering & Management National Yunlin University of Science and Technology

Yunlin, Taiwan 640, R.O.C.

Key Words: RIIOLQH VLJQDWXUH YHULILFDWLRQ GHHS OHDUQLQJ FRQYROXWLRQDO

QHXUDOQHWZRUN

通訊作者：侯東旭，HPDLOKRXWK#\XQWHFKHGXWZ

&RUUHVSRQGLQJDXWKRU7XQJ+VX+RXHPDLOKRXWK#\XQWHFKHGXWZ

(2)

 技術學刊第三十四卷第三期民國一○八年

$%675$&7

+DQGZULWWHQVLJQDWXUHVDUHUHTXLUHGRQPDQ\LPSRUWDQWRFFDVLRQVLQOLIH

$VVLJQDWXUHVDUHLPPHQVHO\UHODWHGWRKXPDQLQWHUHVWVLVVXHGZLWKIRUJHG

VLJQDWXUHV FRQVWDQWO\ DULVH ,W LV WKHUHIRUH FUXFLDO WR HVWDEOLVK D IDVW

HIIHFWLYH DQG VFLHQWLILF VLJQDWXUH YHULILFDWLRQ PHWKRG 0RVW H[LVWLQJ

PHWKRGVXVHGWRYHULI\&KLQHVHVLJQDWXUHVKDYHIDLOHGWRDFKLHYHVDWLVI\LQJ

UHVXOWV ,QFRQWUDVWWKHFRQYROXWLRQDOQHXUDOQHWZRUN&11LQGHHSOHDUQLQJ

WKDWKDVHPHUJHGLQUHFHQW\HDUVLVDPHWKRGRILPDJHUHFRJQLWLRQDQGLV

NQRZQIRULWVKLJKPRGHOSHUIRUPDQFH 7KLVVWXG\WKXVKRSHVWRDFKLHYH

JRRGUHVXOWVLQ&KLQHVHVLJQDWXUHUHFRJQLWLRQE\XVLQJ&11LQGHHSOHDUQLQJ

,QSUDFWLFHLWLVYHU\GLIILFXOWWRFROOHFWSURIHVVLRQDOO\IRUJHGVLJQDWXUHV

7KHUHIRUH EDVHG RQ HFRQRPLF FRQFHUQV WZR GLIIHUHQW H[SHULPHQWV ZHUH

SURSRVHGWRWHVWWKHSHUIRUPDQFHRIWKH&11,QWKHILUVWH[SHULPHQWWKH

VLJQDWXUHVRIWKHVDPHRZQHUVZHUHXVHGGXULQJWKHWUDLQLQJDQGWKHILQDO

WHVWZKLOHLQWKHVHFRQGH[SHULPHQWWKHVLJQDWXUHVRIGLIIHUHQWRZQHUVDUH

XVHG ,W LV ZRUWK PHQWLRQLQJ WKDW LQ PRVW RI WKH H[LVWLQJ GRFXPHQWV WKH

VHFRQGPHWKRGRIH[SHULPHQWZDVDGRSWHG

,Q WKLV VWXG\ WKH OD\HU OD\HU DQG OD\HU GHHS UHVLGXDO

FRQYROXWLRQDO QHXUDO QHWZRUNV 5HV1HWY ZHUH XVHG UHVSHFWLYHO\ WR

HVWDEOLVK WKH VLJQDWXUH UHFRJQLWLRQ V\VWHP 6LQFH WKHUHDUH WZR W\SHV RI

H[SHULPHQWVHDFKZLWKWKUHHW\SHVRIQHWZRUNFRQILJXUDWLRQVWKHUHDUHD

WRWDO RI VL[ H[SHULPHQW FRPELQDWLRQV DQG WKLUW\ UHSOLFDWLRQV IRU HDFK

FRPELQDWLRQ KDYH EHHQ FRQGXFWHG 7KHUHIRUH D WRWDO RI QHWZRUN

SHUIRUPDQFHGDWDKDYHEHHQFROOHFWHGDQGDQDO\]HG

7KH UHVXOWV VKRZHG DQ HUURU UDWH RI WKH ILUVW H[SHULPHQW DV EHWZHHQ

:KHQZHFRPSDUHGWKHSHUIRUPDQFHRIWKHVHFRQGH[SHULPHQW

ZLWKWKDWLQRWKHUVWXGLHVZHIRXQGWKDWWKHSURSRVHGPHWKRGKDGDORZHU

IDOVHDFFHSWDQFHUDWH :HDOVRIRXQGWKDWWKHFODVVLILFDWLRQHUURUUDWHVRI

WKHWKUHHW\SHVRIQHWZRUNFRQILJXUDWLRQVKRZHGQRVLJQLILFDQWGLIIHUHQFH 7KLVUHVXOWLPSOLHVWKDWLQUHDOLW\WKHXVHUFDQXVHIHZHUOD\HUVRIQHWZRUNWR

UHGXFHWLPHDQGKDUGZDUHFRQVXPSWLRQ )LQDOO\LQWKLVUHVHDUFKWKHIDOVH

DFFHSWDQFHUDWHLVORZHUWKDQWKHIDOVHUHMHFWLRQUDWHLQWKHVL[H[SHULPHQWDO

FRPELQDWLRQV ,WLPSOLHVWKDWWKHSURSRVHG&11UHFRJQLWLRQV\VWHPKDVWKH

DGYDQWDJHRIQRWDFFHSWLQJIRUJHGVLJQDWXUHUHFRJQLWLRQ

一、緒論

在科技進步的二十一世紀，生活中有許多東西都已電子化，簽名也漸漸邁向電子化。儘管科技在進步，仍有許多使用傳統紙筆簽名的場合。例如公家機關在簽署公文、

憑證，私人企業與民眾簽署房屋、汽車租賃、各式買賣契約，信用卡付款，銀行開戶等，皆是使用傳統的紙筆簽名。

對於簽名而言，一直有偽造的問題存在。時至今日，

依然有許多仿冒簽名所引起的法律爭議。我國對於紙本簽名的鑑定通常是鑑識人員憑借自身的知識與經驗進行鑑定，其鑑定流程耗工費時，每次鑑定簽名需要約一個月左右，並沒有一個有效、可靠、快速的科學化工具可以使用。

離線簽名 RIIOLQHVLJQDWXUH，指的是透過筆簽名在各式媒材上所得到的簽名，若要進行辨識，僅能依據媒材上簽名的影像進行辨識。離線簽名辨識再細分可以分為兩種任務，作家獨立與作家依賴。所謂的作家獨立任務指的

是，為每個要進行辨識的作家建立各別一套模型辨識真偽。作家依賴模型希望建立一個通用模型，不需要為了一個作家又新建立一個模型，但通常正確率也較低。

/LZLFNL 等人>@ 整理了投稿至電機電子工程師學會

,QVWLWXWHRI(OHFWULFDODQG(OHFWURQLFV(QJLQHHUV,((( 所舉辦第屆國際文件分析與辨識會議 ^WK ,QWHUQDWLRQDO

&RQIHUHQFHRQ'RFXPHQW$QDO\VLVDQG5HFRJQLWLRQ,&'$5 簽名辨識比賽,&'$5 6LJQDWXUH 9HULILFDWLRQ

&RPSHWLWLRQ6LJ&RPS 中共有種方法，其中種作家依賴模型的離線簽名辨識方法，結果顯示，中文簽名辨識的錯誤率遠高於荷蘭文的簽名。.HQQDUG 等人>@ 與 +X 等人>@ 的研究結果也顯示，其提出的方法在荷蘭文具有不錯的效果，但在中文上的成效不佳。中文簽名辨識是個碩大的挑戰，也因此探討中文的離線簽名辨識是具有價值的。深度學習是近年在學界與業界興起的風潮，深度學習與眾多研究相比，才剛發展沒有多久，仍有許多的未知數

(3)

洪偉嘉和侯東旭：應用卷積類神經網路於中文簽名圖形辨識之研究 

圖輸入或特徵映射圖與 î 核函數步幅為的卷積計算

圖 î 步幅為池化的運算範例

存在，人們也對其予以期待。卷積類神經 FRQYROXWLRQDO

QHXUDOQHWZRUN&11 是深度學習中用來辨識影像的方法，

也是目前進行影像辨識被認為較佳的方法之一。透過自動尋找影像中的特徵，並從特徵中尋找更為抽象的特徵的設計，使得卷積類神經網路在影像識別上具有優勢。目前有一些學者 +DIHPDQQ 等人 >@ 、 +DIHPDQQ 等人 >@ 、 .KDODM]DGHK 等人>@ 將卷積類神經網路應於識別手寫簽名上，但尚未有學者運用卷積類神經網路對於中文的離線簽名進行討論。因此本研究希望透過卷積類神經網路，建立一個具有良好成效的中文簽名真偽辨識系統。

二、文獻探討

 卷積類神經網路

卷積類神經網路屬於監督式學習，透過梯度下降法，

修正參數，使誤差函數最小化，主要用於處理分類問題，

被運用在許多領域。卷積類神經網路一般照卷積對象的維度，分為一維、二維、三維。原始的一維卷積類神經又被稱為時間延遲類神經，通常用於訊號或序列的分析，三維則用於動態影像或是體積型影像分析>@。二維卷積類神經網路的應用十分廣泛與多變，人臉辨識、場景標籤、影像辨識、文本分析、語音識別等>@，尤其是靜態影像辨識領域獲得重大的突破>@。本研究屬於二維卷積類神經網路中的影像辨識。

卷積類神經網路具有四個關鍵性的概念，局部連結、

共享權重、池化與多層>@。其基本結構可以被分為兩個部

份，第一個部份為卷積層與池化層，其功能在於尋找影像中的局部特徵，卷積類神經的第一部份可以由若干的卷積層與池化層組合而成。第二部份為全連結層，其結構近似於傳統的倒傳遞類神經網路，功能在於進行分類。一卷積層

在類神經網路中討論卷積時，通常不是指數學中正式的離散卷積運算>@，以下將會針對卷積在類神經網路實際應用上進行介紹。

在卷積層中，通常會透過上一層，輸入或是特徵映射圖 IHDWXUHPDS，與多個核函數 NHUQHOIXQFWLRQ 進行運算，運算完的結果稱為特徵映射圖。當中，核函數也被稱為濾波器 ILOWHU。核函數在後向傳遞運算的過程也會被修正，因此自身也可以被視為權重。數學式表達如下：

l l l l

X g

¦

X K b

其中，代表卷積運算，K^l為核函數，b^l為臨界值，上標為第O 層。輸入或特徵映射圖與 u 核函數步幅為

的卷積計算如圖所示。

二池化層

影像中特徵的相對位置，可能有些許變化、變形、扭曲等，藉由池化層將影像粗糙化，把類似的特徵合併成一個新特徵，這使得神經網路可以學習粗糙化後的特徵，來可靠地檢測圖案>@。î 步幅為的池化範例如圖所示，Iڄ 為池化方法。目前常見的池

Q x

x

x_m

x_m x_m x_m,n xm,n

x_mn

x x_n x_n

k k k

xn

N P N

核函數輸入的輸入層或特徵映射圖

T

S

xk + xk + xk

+ xk + xk + xk

xmk + xmk + xmk

+ x_mk + x_mk + x_mk

xnk + xnk + xnk

+ x_nk+ x_n-1k + x_nk

xmnk + xmnk+ xmnk

+ x_mnk + x_mnk + x_mnk

+ x_mnk + x_mn-k + xm,nk

Ix x x x Ix x x x Ix x x x

Ix x x x

x x x x x x

x x₅ x x x x

x x x x x x

(4)

化方法有最大池化法、平均池化法>@ 與 /範數池化法>@。

最大池化為取池化範圍的PuQ 個元素中的最大值作為輸出值，以數學式表達如下：

^PD[

m n

f x x x x _u

三全連結層

全連結層與傳統的全連結倒傳遞類神經相似，在卷積類神經中主要扮演著分類器的角色。卷積類神經網路是一個基於倒傳遞演算法的類神經網路，考慮一個簡單的卷積類神經模型，其可分前向傳遞與後向傳遞兩個階段。

四歸一化函數與交叉熵

過去在倒傳遞類神經網路上，經常會使用誤差平方 VTXDUHHUURUIXQFWLRQ 做為誤差函數，修正網路之權重。對於處理分類問的卷積類神經網路而言，對於輸出的結果，會透過歸一化函數又稱為 VRIWPD[ 函數進行歸一化，將輸出的每個元素轉換到 >@ 之間，

且所有元素和為>@。簡單來說，就是轉換為機率值。歸一化函數公式如下：

Ö VRIWPD[i i ^yⁱy_j j

t y e

¦

e

交叉熵為熵的一種形式，可以被解釋為機率分配之間的相似或不相似程度>@。在類神經網路中，交叉熵與歸一化函數結合，被用來度量類神經網路的輸出與真 實資料間的差距。假設機率分配 P x 為由獨熱編碼

RQHKRWHQFRGLQJ 構成的真實分配，Q x 為類神經 網路輸出經過歸一化函數轉換後的分配，其皆為離散型機率分配，則交叉熵定義如下：

+ ORJe

x

p q

¦

p x q x

使用交叉熵作為誤差函數並結合歸一化函數，比起誤差平方和能更快速的修正權重，可以有效少訓練次數

>@。因此，近期的卷積類神經網路模型大多採取此策略>@。

五激勵函數

傳統常見於類神經網路的激勵函數以6 型函數與雙曲正切函數被廣泛使用，如表一所示。這兩種函數在多層倒傳遞類神經中有著飽和問題，使得整個網路難以訓練，效果也不佳>@。.UL]KHYVN\ 等人>@

於年使用了線性整流函數 5HFWLILHG /LQHDU

8QLW5H/8，如表二，取得不錯的成果。不僅解決了飽和問題，也減緩了梯度消失的影響，並且比起

表一常見的激勵函數

數學式函數圖形

6 型函數 ^y _e^u

雙曲正切函數

u u

e e

y e e

表二線性整流函數

數學式函數圖形

線性整

流函數 y PD[ u

6 型函數或雙曲正切函數在運算上更簡潔，在具有大量參數的卷積類神經網路中更具優勢。也因此，

在具有多層的卷積類神經網路上，會傾向使用線性整流函數。

六參數初始化

卷積層的參數，例如核函數、偏權值，會影響到會影響到整個類神經網路的績效。<RVLQVNL 等人>@ 表示，卷積類神經網路中，在不同的資料集上、不同的模型結構中，前幾層的核函數多傾向學習類似的特徵。透過在大型資料集上訓練好的權重作為初始的核函數，比起隨機核函數從頭開始訓練，可以得到更良好的結果。

全連結層的參數，有權重、偏權值。對於各層的參數做最佳的初始化是有難度的，因此經常使用隨機亂數作為初始值。+H 等人>@ 提出了 065$ 初始化

065$LQLWLDOL]DWLRQ，其方法如下：

a

W N

n

§ ·

¨ ¸

© ¹

VLJPRLG

WDQK

5H/8

(5)

圖第二代模塊與層深度殘差網路之示意圖

Q 為輸出節點的數量。比起其他參數初始化的方法，

065$ 初始化在線性整流函數具有較佳的結果。

至於學習速率及世代次數等超參數之設定，則可以實驗設計方式或使用反覆試誤法來找出適合的值。七涅斯捷羅夫動量

6XWVNHYHU 等人>@提出了帶有涅斯捷羅夫動量的隨機梯度下降能增加修正速度，其梯度下降程序如下

>@；>@：

old

m m

t t old t

new old t

v v E v x y

v

D K T T D

T T

 深度殘差網路

+H 等人>@，提出了第一代的深度殘差網路 5HV1HW

Y，5HV1HWY 是由數個模塊堆疊所構成的類神經網路，

透過數個模塊的連結，使得整體網路層數大幅增加至

層。+H 等人>@ 對於模型進行了改善，提出了第二代的深度殘差網路 5HV1HWY，使得更深層層的網路得以實現，並且具有更好的結果。深度殘差網路基本上是由若干個模塊所堆疊而成，5HV1HWY 的模塊與堆疊方式與

層深度殘差網路如圖所示。

三、研究方法

影像處理的部份，本研究基於3LOORZ 來實現。卷積類神經網路的部份，本研究基於7HQVRU)ORZ 來實現，使用*H)RUFH*7; 單卡進行加速運算，浮點數為

位元。

資料集的部份，本研究使用6LJ&RPS>@ 中簽名辨識比賽所提供的版中文中訓練組的簽名影像。資料集網址如下：KWWSZZZLDSUWFRUJPHGLDZLNLLQGH[SKS

批量標準化

線性整流函數

線性整流函數權重

權重

第二代模塊

;

輸出全連結

池化

卷積模塊

卷積模塊卷積模塊

卷積模塊

卷積模塊卷積模塊

卷積模塊

卷積模塊 ൈ

池化

卷積

輸入

批量標準化

(6)

,&'$5BB6LJQDWXUHB9HULILFDWLRQB&RPSHWLWLRQB6LJ&RP S 資料集中，所有影像均以 ELW 的 31* 圖像所構成，掃描解析度為GSL，色彩為 5*% 的彩色影像。中文資料集的離線簽名具有訓練組與測試組。訓練組中有

個參考作家的簽名與熟練的偽造簽名共筆資料。

 實驗組合

實驗一為典型的訓練情境，訓練資料、驗證資料與測試資料使用相同作家，每個資料集中有所有作家的一些真實簽名與一些偽造簽名，如表三所示。

實驗二為考量現實情境之一，參考/LZLFNL 等人>@ 提出在線與離線的熟練地偽造簽名比賽中的測試方式。為訓練與驗證資料集中使用事先蒐集好一些作家的真實與偽造簽名，在測試時使用與訓練時不同的作家，其中有真有假的簽名下去測試模型的能力，如表四所示。考量卷積類神經網路在分類時是根據特徵下去進行分類，若不同作家間具有共同潛在特徵，並且與偽造簽名的特徵不同，則此種方式是可行的。

又考量卷積類神經網路的深度會影響到績效，本研究參考+H 等人>@ 所提出的深度殘差網路模型，考量層、

層與層等種層數。種實驗搭配種層數，故總共會有種的實驗組合。每種組合收集筆資料，故總共有筆資料，如表五所示。

 實驗流程

整個實驗大體上可以被分為三個階段。第一階段為影像前處理。第二階段，使用訓練集訓練資料，驗證集評估模型，尋找適當的超參數。確定超參數後，展開第三階段，

開始正式訓練模型與測試結果，使用訓練集訓練資料，驗證集評估類神經網路訓練過程的穩定性與好壞，模型訓練完畢後使用測試集評估模型能力。

一影像前處理與範例

接著對所有的圖片進行尺寸轉換與反向，影像要能被卷積類神經網路處理，需要將資料集的彩色影像尺寸齊一化至uu 的陣列中。將較長的長邊或寬邊等比縮放至像素即可，多數的中文簽名採用橫式寫作，故多為依據長邊將圖等比縮放至像素。

透過3LOORZ 套件進行縮小，設定方法為 $17,$/,$6

/DQF]RVUHVDPSOLQJ，3LOORZ 官方文件表示，在產生 31* 的縮圖時，$17,$/,$6 的品質較其他方法好。

本研究並不探討縮圖演算法對結果的影響。

等比縮放後，我們關注有簽名的部份亮度最低，數值也最小，但卷積類神經網路關注的是數值最大的部份，與圖不符。為此需要將圖像反相 LQYHUWLPDJH，使得卷積類神經網路去關注簽名的部份，不關注空白的部份。虛擬碼如下所示：

i i

image image i

表三 6LJ&RPS 中文資料中訓練組的詳細資訊

作家編號真實

簽名數量

熟練地偽造

簽名數量

訓練組

表四 6LJ&RPS 中文資料中測試組的詳細資訊

作家編號真實

簽名數量

被質疑

簽名數量

測試組

表五實驗組合表

層層層

實驗一實驗一層實驗一層實驗一層

實驗二實驗二層實驗二層實驗二層

影像前處理的範例如圖所示，參考 6LJ&RPS

收集資料的方式，使用複寫收集簽名。簽名範圍為寬度PP 與高度 PP 的方格中，並在被複寫的紙張底下墊張影印紙，來確保具有柔軟的書寫表面。

最後掃描成掃描解析度為GSL，色彩為 5*% 的彩色31* 影像。

二切割資料集

因為有兩種不同的實驗，會有兩種不同的資料集切割法。

(7)

表六混淆矩陣

分類類別

實際類別真偽

真真陽性

（WUXHSRVLWLYH73）

偽陰性

（IDOVHQHJDWLYH)1）

偽偽陽性

（IDOVHSRVLWLYH)3）

真陰性

（WUXHQHJDWLYH71）

圖左為掃描後原始資料之範例，右為影像反相處理後之範例

實驗一：從完成影像前處理的影像，僅對測試組中作家的真實與偽造簽名進行分層隨機抽樣。卷積類神經網路的訓練集由當中的所構成，驗證集則為

，測試集為剩下的。

實驗二：參考/LZLFNL 等人>@ 與 +X 等人>@ 的測試方式，將訓練組中作家的真實與偽造簽名進行分層隨機抽樣。卷積類神經網路的訓練集由其中的為訓練集，剩餘的為驗證集。測試集則由測試組的所有簽名構成。

三調整超參數

超參數的調整僅僅是單純的在訓練模型，並針對驗證集的收斂情況與損失函數的圖形進行超參數調整。模型訓練的完畢後，透過驗證結果與損失值來評估模型。透過反覆試誤評估，來決定模型的學習速率、世代次數與存檔條件。

四正式訓練模型與測試結果

正式訓練模型的階段，步驟大部分與調整超參數的階段相同。不同在於，每個世代訓練完成後會檢查是否達到存檔條件，若接達成條件則儲存參數，繼續訓練，直到達到終止條件為止。達到終止條件後，則使用最新的參數檔來作為卷積類神經網路的參數，以此測試模型能力。

五模型績效評估

透過測試集測試模型，來評估模型的泛化能力，並計算各績效指標。績效可以透過混淆矩陣運算，給定混淆矩陣如表六>@：

73：模型分類為真，且實際結果也為真。

)3：模型分類為偽，但實際結果為真。

71：模型分類為偽，且實際結果也為偽。

)1：模型分類為真，但實際結果為偽。

根據上述結果，可以計算績效指標：分類錯誤率 HUURU

UDWH(55、錯誤拒絕率 IDOVHUHMHFWLRQUDWH)55 與錯誤驗收率 IDOVHDFFHSWDQFHUDWH)$5，與其他學者之研究，會以這三個指標做比較。在此實驗中，分類錯誤率為整體簽名分類的錯誤比例，錯誤拒絕率為真實簽名被分類到偽造簽名的比例，錯誤驗收率為偽造簽名被分類到真實簽名的比例。各績效指標與混淆矩陣關係如下：

FP FN ERR TP TN FP FN

FRR FN

TPFN FAR FP

FPTN

另外，本研究想要了解在不同層數下的「分類錯誤率」

是否有所不同，導致過度適配或是適配不足的情況，

因此使用50$129$ 分析。

 卷積類神經網路之建構

本次實驗使用的模型基本上與+H 等人>@ 所提出用於,PDJH1HW 的深度殘差網路模型相似，如表七所示。考量用於,PDJH1HW 圖庫上的深度殘差網路中全連結層個節點對應的是,PDJH1HW 圖庫的個分類。本研究為二元分類問題，在最後一層的部份，需要將全連結層的神經元數量修正為。

經過調整超參數的階段，經由試誤法決定，卷積類神經網路的相關超參數與設定如表八所示：

四、研究結果

本研究有種實驗，搭配種層數，共有種實驗組合。對每一種實驗組合重複收集次結果，共有筆的結果。

(8)

表七本研究使用之模型

名稱輸出的特徵

映射圖大小層層層

輸入 uu 像素 u 像素 u 通道（5*%）

卷積 uu uu，步幅

池化 uu uu 最大池化，步幅

卷積模塊u[ uu

ª u u º

« u u »u

« »

« u u »

¬ ¼

ª u u º

« u u »u

« »

« u u »

¬ ¼

ª u u º

« u u »u

« »

« u u »

¬ ¼

卷積模塊u[ uu

u u

ª º

« u u »u

« »

« u u »

¬ ¼

u u

ª º

« u u »u

« »

« u u »

¬ ¼

u u

ª º

« u u »u

« »

« u u »

¬ ¼

卷積模塊u[ uu

ª u u º

« u u »u

« »

« u u »

¬ ¼

ª u u º

« u u »u

« »

« u u »

¬ ¼

ª u u º

« u u »u

« »

« u u »

¬ ¼

卷積模塊u[ uu

u u

ª º

« u u »u

« »

« u u »

¬ ¼

u u

ª º

« u u »u

« »

« u u »

¬ ¼

u u

ª º

« u u »u

« »

« u u »

¬ ¼

池化 uu 全域平均池化

全連結個神經元，歸一化函數輸出

表八本研究使用之模型

卷積類神經網路模型 5HV1HWY

預訓練法基於遷移學習的預訓練法

激勵函數 5H/8

全連結層權重初始化方法 065$ 初始化

正則化方法 / 正則化， 

最佳化方法帶有涅斯捷羅夫動量的隨機梯度下降

學習速率

動量

每批量大小EDWFKVL]H

浮點數精度位元

世代數HSRFK

 實驗結果之描述性統計

實驗一當中，分別對種不同層數的結果各收集筆資料，共筆。實驗一的結果如表九所示，顯示種不同層數的模型均可以找到測試集錯誤率為的結果。實驗二當中，分別對種不同層數的結果各收集筆資料，共

筆，結果如表十所示。層的平均 (55 與 )$5 最低，

而層的 )55 最低。

 分類錯誤簽名統計

在實驗一中發現，在層時「最容易」被分錯的前

三名為作家編號、、的簽名，在層時最容易被分錯的前三名為作家編號、、的簽名，在層時最容易被分錯的前三名為作家編號、、的簽名。可以發現作家編號與的簽名是較容易被分錯的簽名

如圖所示。

在實驗二中發現，在層時「最不容易」被分錯的前三名為作家編號、、的簽名，在層時最不容易被分錯的前三名為作家編號、、的簽名，在層時最不容易被分錯的前三名為作家編號、、的簽名。

可以發現作家編號、與的簽名是較不容易被分錯的簽名如圖所示。

(9)

表九實驗一對種不同層數模型的結果

5HV1HWB9 5HV1HWB9 5HV1HWB9

編號 (55 )55 )$5 (55 )55 )$5 (55 )55 )$5

平均值

標準差

最大值

最小值

表十實驗二對種不同層數模型的結果

編號 (55 )55 )$5 (55 )55 )$5 (55 )55 )$5

平均值

標準差

最大值

最小值

圖實驗一分類錯誤統計

圖實驗二分類錯誤統計

作家編號 D層時分類錯誤統計

次數

作家編號 F層時分類錯誤統計

次數

作家編號 E層時分類錯誤統計

次數

作家編號 D層時分類錯誤統計

次數

作家編號 E層時分類錯誤統計

次數

作家編號 F層時分類錯誤統計

次數

(10)

表十一本研究與其他研究之比較

中文

學者方法 (55 )55 )$5

/LZLFNLet al

方法

.HQQDUGet al 方法

+XHWDO 方法

本研究

表十二實驗一的0DXFKO\ 球形檢定

受試者內效應 0DXFKO\ތV: 近似卡方分配自由度顯著性 (SVLORQ^E

*UHHQKRXVH*HLVVHU +X\QK)HOGW 下限

層數

表十三實驗一層數對分類錯誤率的50$129$

來源類型,,, 平方和自由度均方 ) 顯著性

層數

假設的球形

*UHHQKRXVH*HLVVHU

+X\QK)HOGW

下限

(UURU層數

假設的球形

*UHHQKRXVH*HLVVHU

+X\QK)HOGW

下限

 實驗二與其他研究之比較

比較本研究之結果與其他學者之研究結果，如表十一所示，表中列出本研究各績效指標的平均值及標準差。發現本研究在(55 指標上表現並沒有特別差，在 )55 指標上最差，而在)$5 指標上最好。本研究是使用深度學習的深度殘差網路來做辨識，而其他學者是使用傳統的特徵選取及分類器如支持向量機、羅吉斯迴歸及隨機森林等來做辨識。本研究會有比較好的 )$5 而有比較不好的 )55，其原因可能是深度殘差網路直接由訓練集資料來學習特徵，而此資料庫中偽造的簽名筆數又比真實簽名筆數

多所致，即是資料不平衡所致，但目前是無法由文獻來驗證此原因。

 模型層數對錯誤率之比較

本研究使用假設檢定來推論層數對分類錯誤率是否有影響，以此來判斷是否有過度適配或是適配不足的問題。

對實驗一之結果進行0DXFKO\ 球形檢定，發現不顯著

3!，假設資料符合球形，如表十二所示。進行 50

$129$ 分析，發現層數對於分類錯誤率不具有顯著影響

3!，如表十三所示，故不進行事後檢定。因此，沒

(11)

表十四實驗二層數對分類錯誤率的50$129$

受試者內效應 0DXFKO\ތV: 近似卡方分配自由度顯著性 (SVLORQ^E

*UHHQKRXVH*HLVVHU +X\QK)HOGW 下限

層數

表十五實驗二層數對分類錯誤率的50$129$

來源類型,,, 平方和自由度均方 ) 顯著性

層數

假設的球形

*UHHQKRXVH*HLVVHU

+X\QK)HOGW

下限

(UURU

層數

假設的球形

*UHHQKRXVH*HLVVHU

+X\QK)HOGW

下限

有足夠證據支持層數對於分類錯誤率有顯著影響。對實驗二之結果進行0DXFKO\ 球形檢定，發現不顯著 3!，假設資料符合球形，如表十四所示。進行50$129$ 分析，發現層數對於分類錯誤率不具有顯著影響 3!，如表十五所示，故不進行事後檢定。因此，沒有足夠證據支持層數對於分類錯誤率有顯著影響。

五、結論與建議

本研究根據不同的應用情境，提出二種不同的實驗，

使用 5HV1HWY 進行建模。結果表示，實驗一應用情境的結果遠優於實驗二的應用情境。由實驗一的結果可知，卷積類神經網路具有能抽出簽名中特徵與分類的能力並且能妥善分類。但在實驗二當中的表現卻不如預期，兩組不同的簽名所蘊含的特徵不大相同。

本研究有個發現，六種的實驗組合中，對於卷積類神經網路整體而言，具有)$5 比 )55 低的傾向比較組的平均值後的結果。偽造的簽名不應該被接受，具有較低 )$5 是一個具有潛力的特性，但目前並不清楚是否為訓練時偽造簽名比例偏多所導致，這並不在本研究的探討範圍之內。

在機器學習上有個普遍的共識，在模型訓練良好的情況下，若要使測試結果更佳，應要降低模型複雜度，反之會導致過度適配的情況發生。若模型訓練不佳，增加模型複雜度，可以使測試結果更佳。雖然本研究發現種層數對於錯誤率的變化並不顯著，似乎使用層的網路模型，

可以較經濟且達到近似的表現，但此發現並不能推論於所有的問題。一些研究報告指出，在深度學習當中，模

圖正確率圖

型複雜度的增加對過度適配的發生並不是那麼明顯，但理由還不清楚>@ 建議未來可以對過度配適問題做更深入的實驗與理論探討，也可以試著去尋找不影響錯誤率的情況下最少的層數，來縮短運算時間。

又由於本研究使用簡易型的*H)RUFH*7; 單卡

*38 進行加速運算，浮點數為位元，因此訓練時間比較長。在本研究的實驗一中，層、層及層的

世代訓練平均時間分別秒、秒、及秒。

隨著*38 科技的進步，在使用先進型的 *38 下可以快速地完成網路訓練，因此本研究主要探討深度學習網路的準確率，而不在訓練時間上做比較。

本研究仍有許多可改善之處，在此提出下列幾項作為後續研究之參考：

WUDLQLQJ YDOLGDWLRQ DFFXUDF\

HSRFK

應用卷積類神經網路於中文簽名圖形辨識之研究