技術學刊 第三十四卷 第三期 民國一○八年
Journal of Technology, Vol. 34, No. 3, pp. 145-157 (2019)
應用卷積類神經網路於中文簽名圖形辨識之研究
洪偉嘉
侯東旭
海華科技股份有限公司資訊暨智能工程部
雲林科技大學工業工程與管理系
摘 要
生活有許多重要場合需要使用手寫簽名,當中牽涉龐大的利益,偽造簽名 的問題也層出不窮。因此,建立快速、有效、科學化的簽名真偽辨識工具一直 是個實際且重要的議題。現實生活中,收集專業的偽造簽名十分困難,因此根 據經濟考量下提出二種不同的實驗,提供給使用者參考。實驗一是訓練時與最 終測試時使用相同作家的簽名,實驗二是訓練時與測試時使用不同作家的簽 名。一般來說,國際上常見的相關文獻以實驗二居多。
深度學習中的卷積類神經網路 FRQYROXWLRQDOQHXUDOQHWZRUN &11 是近 年興起的影像辨識方法,以其具有較高的模型績效而聞名。本研究使用5HV1HW
Y,試驗了 、、 層對於 種實驗的結果,每種組合收集了 次的結 果。
結果方面,本研究發現實驗一的平均錯誤率只有 至 之間,
實驗二與其他研究的績效比較之下,有比較低的錯誤驗收率。本研究發現在 種層數下,分類錯誤率的差異並不明顯。因此,在實務中使用時,似乎可以尋 找更少層數的模型,來減少時間與硬體的耗用。另外,本研究發現到,整體而 言,模型有錯誤驗收率低於錯誤拒絕率的傾向,這表示本研究所提出的 &11 辨識系統在無法接受偽造簽名的簽名識別下具有優勢。
關鍵詞:離線簽名,深度學習,卷積類神經網路。
$678'<2)$33/,&$7,212)&2192/87,21$/1(85$/
1(7:25.6,12))/,1(&+,1(6(6,*1$785(5(&2*1,7,21
:HL&KLD+XQJ 7XQJ+VX+RX
Intellectual Technology and Engineering Deaprtment AzureWavw Technologies, Inc.
New Taipei City, Taiwan 231, R.O.C.
Department of Industrial Engineering & Management National Yunlin University of Science and Technology
Yunlin, Taiwan 640, R.O.C.
Key Words: RIIOLQH VLJQDWXUH YHULILFDWLRQ GHHS OHDUQLQJ FRQYROXWLRQDO
QHXUDOQHWZRUN
通訊作者:侯東旭,HPDLOKRXWK#\XQWHFKHGXWZ
&RUUHVSRQGLQJDXWKRU7XQJ+VX+RXHPDLOKRXWK#\XQWHFKHGXWZ
技術學刊 第三十四卷 第三期 民國一○八年
$%675$&7
+DQGZULWWHQVLJQDWXUHVDUHUHTXLUHGRQPDQ\LPSRUWDQWRFFDVLRQVLQOLIH
$VVLJQDWXUHVDUHLPPHQVHO\UHODWHGWRKXPDQLQWHUHVWVLVVXHGZLWKIRUJHG
VLJQDWXUHV FRQVWDQWO\ DULVH ,W LV WKHUHIRUH FUXFLDO WR HVWDEOLVK D IDVW
HIIHFWLYH DQG VFLHQWLILF VLJQDWXUH YHULILFDWLRQ PHWKRG 0RVW H[LVWLQJ
PHWKRGVXVHGWRYHULI\&KLQHVHVLJQDWXUHVKDYHIDLOHGWRDFKLHYHVDWLVI\LQJ
UHVXOWV ,QFRQWUDVWWKHFRQYROXWLRQDOQHXUDOQHWZRUN&11LQGHHSOHDUQLQJ
WKDWKDVHPHUJHGLQUHFHQW\HDUVLVDPHWKRGRILPDJHUHFRJQLWLRQDQGLV
NQRZQIRULWVKLJKPRGHOSHUIRUPDQFH 7KLVVWXG\WKXVKRSHVWRDFKLHYH
JRRGUHVXOWVLQ&KLQHVHVLJQDWXUHUHFRJQLWLRQE\XVLQJ&11LQGHHSOHDUQLQJ
,QSUDFWLFHLWLVYHU\GLIILFXOWWRFROOHFWSURIHVVLRQDOO\IRUJHGVLJQDWXUHV
7KHUHIRUH EDVHG RQ HFRQRPLF FRQFHUQV WZR GLIIHUHQW H[SHULPHQWV ZHUH
SURSRVHGWRWHVWWKHSHUIRUPDQFHRIWKH&11,QWKHILUVWH[SHULPHQWWKH
VLJQDWXUHVRIWKHVDPHRZQHUVZHUHXVHGGXULQJWKHWUDLQLQJDQGWKHILQDO
WHVWZKLOHLQWKHVHFRQGH[SHULPHQWWKHVLJQDWXUHVRIGLIIHUHQWRZQHUVDUH
XVHG ,W LV ZRUWK PHQWLRQLQJ WKDW LQ PRVW RI WKH H[LVWLQJ GRFXPHQWV WKH
VHFRQGPHWKRGRIH[SHULPHQWZDVDGRSWHG
,Q WKLV VWXG\ WKH OD\HU OD\HU DQG OD\HU GHHS UHVLGXDO
FRQYROXWLRQDO QHXUDO QHWZRUNV 5HV1HWY ZHUH XVHG UHVSHFWLYHO\ WR
HVWDEOLVK WKH VLJQDWXUH UHFRJQLWLRQ V\VWHP 6LQFH WKHUHDUH WZR W\SHV RI
H[SHULPHQWVHDFKZLWKWKUHHW\SHVRIQHWZRUNFRQILJXUDWLRQVWKHUHDUHD
WRWDO RI VL[ H[SHULPHQW FRPELQDWLRQV DQG WKLUW\ UHSOLFDWLRQV IRU HDFK
FRPELQDWLRQ KDYH EHHQ FRQGXFWHG 7KHUHIRUH D WRWDO RI QHWZRUN
SHUIRUPDQFHGDWDKDYHEHHQFROOHFWHGDQGDQDO\]HG
7KH UHVXOWV VKRZHG DQ HUURU UDWH RI WKH ILUVW H[SHULPHQW DV EHWZHHQ
:KHQZHFRPSDUHGWKHSHUIRUPDQFHRIWKHVHFRQGH[SHULPHQW
ZLWKWKDWLQRWKHUVWXGLHVZHIRXQGWKDWWKHSURSRVHGPHWKRGKDGDORZHU
IDOVHDFFHSWDQFHUDWH :HDOVRIRXQGWKDWWKHFODVVLILFDWLRQHUURUUDWHVRI
WKHWKUHHW\SHVRIQHWZRUNFRQILJXUDWLRQVKRZHGQRVLJQLILFDQWGLIIHUHQFH 7KLVUHVXOWLPSOLHVWKDWLQUHDOLW\WKHXVHUFDQXVHIHZHUOD\HUVRIQHWZRUNWR
UHGXFHWLPHDQGKDUGZDUHFRQVXPSWLRQ )LQDOO\LQWKLVUHVHDUFKWKHIDOVH
DFFHSWDQFHUDWHLVORZHUWKDQWKHIDOVHUHMHFWLRQUDWHLQWKHVL[H[SHULPHQWDO
FRPELQDWLRQV ,WLPSOLHVWKDWWKHSURSRVHG&11UHFRJQLWLRQV\VWHPKDVWKH
DGYDQWDJHRIQRWDFFHSWLQJIRUJHGVLJQDWXUHUHFRJQLWLRQ
一、緒 論
在科技進步的二十一世紀,生活中有許多東西都已電 子化,簽名也漸漸邁向電子化。儘管科技在進步,仍有許 多使用傳統紙筆簽名的場合。例如公家機關在簽署公文、
憑證,私人企業與民眾簽署房屋、汽車租賃、各式買賣契 約,信用卡付款,銀行開戶等,皆是使用傳統的紙筆簽名。
對於簽名而言,一直有偽造的問題存在。時至今日,
依然有許多仿冒簽名所引起的法律爭議。我國對於紙本簽 名的鑑定通常是鑑識人員憑借自身的知識與經驗進行鑑 定,其鑑定流程耗工費時,每次鑑定簽名需要約一個月左 右,並沒有一個有效、可靠、快速的科學化工具可以使用。
離線簽名 RIIOLQHVLJQDWXUH,指的是透過筆簽名在各 式媒材上所得到的簽名,若要進行辨識,僅能依據媒材上 簽名的影像進行辨識。離線簽名辨識再細分可以分為兩種 任務,作家獨立與作家依賴。所謂的作家獨立任務指的
是,為每個要進行辨識的作家建立各別一套模型辨識真 偽。作家依賴模型希望建立一個通用模型,不需要為了一 個作家又新建立一個模型,但通常正確率也較低。
/LZLFNL 等人>@ 整理了投稿至電機電子工程師學會
,QVWLWXWHRI(OHFWULFDODQG(OHFWURQLFV(QJLQHHUV,((( 所舉 辦第 屆國際文件分析與辨識會議 WK ,QWHUQDWLRQDO
&RQIHUHQFHRQ'RFXPHQW$QDO\VLVDQG5HFRJQLWLRQ,&'$5 簽名辨 識比 賽,&'$5 6LJQDWXUH 9HULILFDWLRQ
&RPSHWLWLRQ6LJ&RPS 中共有 種方法,其中 種作 家依賴模型的離線簽名辨識方法,結果顯示,中文簽名辨 識的錯誤率遠高於荷蘭文的簽名。.HQQDUG 等人>@ 與 +X 等人>@ 的研究結果也顯示,其提出的方法在荷蘭文具有 不錯的效果,但在中文上的成效不佳。中文簽名辨識是個 碩大的挑戰,也因此探討中文的離線簽名辨識是具有價值 的。深度學習是近年在學界與業界興起的風潮,深度學習 與眾多研究相比,才剛發展沒有多久,仍有許多的未知數
洪偉嘉和侯東旭:應用卷積類神經網路於中文簽名圖形辨識之研究
圖 輸入或特徵映射圖與 î 核函數步幅為 的卷積計算
圖 î 步幅為 池化的運算範例
存在,人們也對其予以期待。卷積類神經 FRQYROXWLRQDO
QHXUDOQHWZRUN&11 是深度學習中用來辨識影像的方法,
也是目前進行影像辨識被認為較佳的方法之一。透過自動 尋找影像中的特徵,並從特徵中尋找更為抽象的特徵的設 計,使得卷積類神經網路在影像識別上具有優勢。目前有 一 些 學 者 +DIHPDQQ 等 人 >@ 、 +DIHPDQQ 等 人 >@ 、 .KDODM]DGHK 等人>@ 將卷積類神經網路應於識別手寫簽名 上,但尚未有學者運用卷積類神經網路對於中文的離線簽 名進行討論。因此本研究希望透過卷積類神經網路,建立 一個具有良好成效的中文簽名真偽辨識系統。
二、文獻探討
卷積類神經網路
卷積類神經網路屬於監督式學習,透過梯度下降法,
修正參數,使誤差函數最小化,主要用於處理分類問題,
被運用在許多領域。卷積類神經網路一般照卷積對象的維 度,分為一維、二維、三維。原始的一維卷積類神經又被 稱為時間延遲類神經,通常用於訊號或序列的分析,三維 則用於動態影像或是體積型影像分析>@。二維卷積類神經 網路的應用十分廣泛與多變,人臉辨識、場景標籤、影像 辨識、文本分析、語音識別等>@,尤其是靜態影像辨識領 域獲得重大的突破>@。本研究屬於二維卷積類神經網路 中的影像辨識。
卷積類神經網路具有四個關鍵性的概念,局部連結、
共享權重、池化與多層>@。其基本結構可以被分為兩個部
份,第一個部份為卷積層與池化層,其功能在於尋找影像 中的局部特徵,卷積類神經的第一部份可以由若干的卷積 層與池化層組合而成。第二部份為全連結層,其結構近似 於傳統的倒傳遞類神經網路,功能在於進行分類。 一卷積層
在類神經網路中討論卷積時,通常不是指數學中正式 的離散卷積運算>@,以下將會針對卷積在類神經網 路實際應用上進行介紹。
在卷積層中,通常會透過上一層,輸入或是特徵映射 圖 IHDWXUHPDS,與多個核函數 NHUQHOIXQFWLRQ 進 行運算,運算完的結果稱為特徵映射圖。當中,核函 數也被稱為濾波器 ILOWHU。核函數在後向傳遞運算的 過程也會被修正,因此自身也可以被視為權重。數學 式表達如下:
l l l l
X g
¦
X K b其中, 代表卷積運算,Kl為核函數,bl為臨界值,上 標為第O 層。輸入或特徵映射圖與 u 核函數步幅為
的卷積計算 如圖 所示。
二池化層
影像中特徵的相對位置,可能有些許變化、變形、扭 曲等,藉由池化層將影像粗糙化,把類似的特徵合併 成一個新特徵,這使得神經網路可以學習粗糙化後的 特徵,來可靠地檢測圖案>@。î 步幅為 的池化 範例 如圖 所示,Iڄ 為池化方法。目前常見的池
Q x
x
xm
xm xm xm,n xm,n
xmn
x xn xn
k k k
k k k
k k k
xn
N P N
核函數 輸入的輸入層或特徵映射圖
T
S
xk + xk + xk
+ xk + xk + xk
+ xk + xk + xk
xmk + xmk + xmk
+ xmk + xmk + xmk
+ xmk + xmk + xmk
xnk + xnk + xnk
+ xnk+ xn-1k + xnk
+ xnk+ xn-1k + xnk
xmnk + xmnk+ xmnk
+ xmnk + xmnk + xmnk
+ xmnk + xmn-k + xm,nk
Ix x x x Ix x x x Ix x x x
Ix x x x
Ix x x x
Ix x x x
Ix x x x
Ix x x x
Ix x x x
x x x x x x
x x x x x x
x x x x x x
x x x x x x
x x5 x x x x
x x x x x x
技術學刊 第三十四卷 第三期 民國一○八年
化方法有最大池化法、平均池化法>@ 與 /範數池 化法>@。
最大池化為取池化範圍的PuQ 個元素中的最大值作 為輸出值,以數學式表達如下:
PD[ m n
f x x x x u
三全連結層
全連結層與傳統的全連結倒傳遞類神經相似,在卷積 類神經中主要扮演著分類器的角色。卷積類神經網路 是一個基於倒傳遞演算法的類神經網路,考慮一個簡 單的卷積類神經模型,其可分前向傳遞與後向傳遞兩 個階段。
四歸一化函數與交叉熵
過去在倒傳遞類神經網路上,經常會使用誤差平方 VTXDUHHUURUIXQFWLRQ 做為誤差函數,修正網路之權 重。對於處理分類問的卷積類神經網路而言,對於輸 出的結果,會透過歸一化函數 又稱為 VRIWPD[ 函數 進行歸一化,將輸出的每個元素轉換到 >@ 之間,
且所有元素和為>@。簡單來說,就是轉換為機率 值。歸一化函數公式如下:
Ö VRIWPD[i i yiyj j
t y e
¦
e交叉熵為熵的一種形式,可以被解釋為機率分配之間 的相似或不相似程度>@。在類神經網路中,交叉熵與 歸一化函數結合,被用來度量類神經網路的輸出與真 實資料間的差距。假設機率分配 P x 為由獨熱編碼
RQHKRWHQFRGLQJ 構成的真實分配,Q x 為類神經 網路輸出經過歸一化函數轉換後的分配,其皆為離散 型機率分配,則交叉熵定義如下:
+ ORJe
x
p q
¦
p x q x使用交叉熵作為誤差函數並結合歸一化函數,比起誤 差平方和能更快速的修正權重,可以有效少訓練次數
>@。因此,近期的卷積類神經網路模型大多採取此策 略>@。
五激勵函數
傳統常見於類神經網路的激勵函數以6 型函數與雙 曲正切函數被廣泛使用,如表一所示。這兩種函數 在多層倒傳遞類神經中有著飽和問題,使得整個網 路難以訓練,效果也不佳>@。.UL]KHYVN\ 等人>@
於 年使用了線性整流函數 5HFWLILHG /LQHDU
8QLW5H/8,如表二,取得不錯的成果。不僅解決 了飽和問題,也減緩了梯度消失的影響,並且比起
表一 常見的激勵函數
數學式 函數圖形
6 型函數 y eu
雙曲正 切函數
u u
u u
e e
y e e
表二 線性整流函數
數學式 函數圖形
線性整
流函數 y PD[ u
6 型函數或雙曲正切函數在運算上更簡潔,在具有 大量參數的卷積類神經網路中更具優勢。也因此,
在具有多層的卷積類神經網路上,會傾向使用線性 整流函數。
六參數初始化
卷積層的參數,例如核函數、偏權值,會影響到會影 響到整個類神經網路的績效。<RVLQVNL 等人>@ 表 示,卷積類神經網路中,在不同的資料集上、不同的 模型結構中,前幾層的核函數多傾向學習類似的特 徵。透過在大型資料集上訓練好的權重作為初始的核 函數,比起隨機核函數從頭開始訓練,可以得到更良 好的結果。
全連結層的參數,有權重、偏權值。對於各層的參數 做最佳的初始化是有難度的,因此經常使用隨機亂數 作為初始值。+H 等人>@ 提出了 065$ 初始化
065$LQLWLDOL]DWLRQ,其方法如下:
a
W N
n
§ ·
¨ ¸
¨ ¸
© ¹
VLJPRLG
WDQK
5H/8
洪偉嘉和侯東旭:應用卷積類神經網路於中文簽名圖形辨識之研究
圖 第二代模塊與 層深度殘差網路之示意圖
Q 為輸出節點的數量。比起其他參數初始化的方法,
065$ 初始化在線性整流函數具有較佳的結果。
至於學習速率及世代次數等超參數之設定,則可以實 驗設計方式或使用反覆試誤法來找出適合的值。 七涅斯捷羅夫動量
6XWVNHYHU 等人>@提出了帶有涅斯捷羅夫動量的隨 機梯度下降能增加修正速度,其梯度下降程序如下
>@;>@:
old
m m
t t old t
new old t
v v E v x y
v
D K T T D
T T
深度殘差網路
+H 等人>@,提出了第一代的深度殘差網路 5HV1HW
Y,5HV1HWY 是由數個模塊堆疊所構成的類神經網路,
透過數個模塊的連結,使得整體網路層數大幅增加至
層。+H 等人>@ 對於模型進行了改善,提出了第二代的深 度殘差網路 5HV1HWY,使得更深層 層 的網路得 以實現,並且具有更好的結果。深度殘差網路基本上是由 若干個模塊所堆疊而成,5HV1HWY 的模塊與堆疊方式與
層深度殘差網路 如圖 所示。
三、研究方法
影像處理的部份,本研究基於3LOORZ 來實現。卷 積類神經網路的部份,本研究基於7HQVRU)ORZ 來實 現,使用*H)RUFH*7; 單卡進行加速運算,浮點數為
位元。
資料集的部份,本研究使用6LJ&RPS>@ 中簽名 辨識比賽所提供的 版中文中訓練組的簽名影像。資料 集網址如下:KWWSZZZLDSUWFRUJPHGLDZLNLLQGH[SKS
批量標準化
線性整流函數
線性整流函數
線性整流函數 權重
權重
權重
第二代模塊
;
;
輸出 全連結
池化
卷積模塊
卷積模塊 卷積模塊
卷積模塊
卷積模塊 卷積模塊
卷積模塊
卷積模塊
卷積模塊
卷積模塊
卷積模塊
卷積模塊
卷積模塊
卷積模塊
卷積模塊
卷積模塊
卷積模塊 ൈ
卷積模塊 ൈ
卷積模塊 ൈ
卷積模塊 ൈ
池化
卷積
輸入
批量標準化
批量標準化
技術學刊 第三十四卷 第三期 民國一○八年
,&'$5BB6LJQDWXUHB9HULILFDWLRQB&RPSHWLWLRQB6LJ&RP S 資料集中,所有影像均以 ELW 的 31* 圖像所構 成,掃描解析度為GSL,色彩為 5*% 的彩色影像。中 文資料集的離線簽名具有訓練組與測試組。訓練組中有
個參考作家的簽名與熟練的偽造簽名共 筆資料。
實驗組合
實驗一為典型的訓練情境,訓練資料、驗證資料與測 試資料使用相同作家,每個資料集中有所有作家的一些真 實簽名與一些偽造簽名,如表三所示。
實驗二為考量現實情境之一,參考/LZLFNL 等人>@ 提 出在線與離線的熟練地偽造簽名比賽中的測試方式。為訓 練與驗證資料集中使用事先蒐集好一些作家的真實與偽造 簽名,在測試時使用與訓練時不同的作家,其中有真有假 的簽名下去測試模型的能力,如表四所示。考量卷積類神 經網路在分類時是根據特徵下去進行分類,若不同作家間 具有共同潛在特徵,並且與偽造簽名的特徵不同,則此種 方式是可行的。
又考量卷積類神經網路的深度會影響到績效,本研究 參考+H 等人>@ 所提出的深度殘差網路模型,考量 層、
層與 層等 種層數。 種實驗搭配 種層數,故總 共會有 種的實驗組合。每種組合收集 筆資料,故總共 有 筆資料,如表五所示。
實驗流程
整個實驗大體上可以被分為三個階段。第一階段為影 像前處理。第二階段,使用訓練集訓練資料,驗證集評估 模型,尋找適當的超參數。確定超參數後,展開第三階段,
開始正式訓練模型與測試結果,使用訓練集訓練資料,驗 證集評估類神經網路訓練過程的穩定性與好壞,模型訓練 完畢後使用測試集評估模型能力。
一影像前處理與範例
接著對所有的圖片進行尺寸轉換與反向,影像要能被 卷積類神經網路處理,需要將資料集的彩色影像尺寸 齊一化至uu 的陣列中。將較長的長邊或寬 邊等比縮放至 像素即可,多數的中文簽名採用橫 式寫作,故多為依據長邊將圖等比縮放至 像素。
透過3LOORZ 套件進行縮小,設定方法為 $17,$/,$6
/DQF]RVUHVDPSOLQJ,3LOORZ 官方文件表示,在產生 31* 的縮圖時,$17,$/,$6 的品質較其他方法好。
本研究並不探討縮圖演算法對結果的影響。
等比縮放後,我們關注有簽名的部份亮度最低,數值 也最小,但卷積類神經網路關注的是數值最大的部 份,與圖不符。為此需要將圖像反相 LQYHUWLPDJH, 使得卷積類神經網路去關注簽名的部份,不關注空白 的部份。虛擬碼如下所示:
i i
image image i
表三 6LJ&RPS 中文資料中訓練組的詳細資訊
作家編號 真實
簽名數量
熟練地偽造
簽名數量
訓練組
表四 6LJ&RPS 中文資料中測試組的詳細資訊
作家編號 真實
簽名數量
被質疑
簽名數量
測試組
表五 實驗組合表
層 層 層
實驗一 實驗一 層 實驗一 層 實驗一 層
實驗二 實驗二 層 實驗二 層 實驗二 層
影像前處理的範例 如圖 所示,參考 6LJ&RPS
收集資料的方式,使用複寫收集簽名。簽名範圍為寬 度PP 與高度 PP 的方格中,並在被複寫的紙 張底下墊 張影印紙,來確保具有柔軟的書寫表面。
最後掃描成掃描解析度為GSL,色彩為 5*% 的彩 色31* 影像。
二切割資料集
因為有兩種不同的實驗,會有兩種不同的資料集切割 法。
洪偉嘉和侯東旭:應用卷積類神經網路於中文簽名圖形辨識之研究
表六 混淆矩陣
分類類別
實際類別 真 偽
真 真陽性
(WUXHSRVLWLYH73)
偽陰性
(IDOVHQHJDWLYH)1)
偽 偽陽性
(IDOVHSRVLWLYH)3)
真陰性
(WUXHQHJDWLYH71)
圖 左為掃描後原始資料之範例,右為影像反相處理後 之範例
實驗一:從完成影像前處理的影像,僅對測試組中作 家的真實與偽造簽名進行分層隨機抽樣。卷積類神經 網路的訓練集由當中的 所構成,驗證集則為
,測試集為剩下的 。
實驗二:參考/LZLFNL 等人>@ 與 +X 等人>@ 的測試 方式,將訓練組中作家的真實與偽造簽名進行分層隨 機抽樣。卷積類神經網路的訓練集由其中的 為 訓練集,剩餘的 為驗證集。測試集則由測試組的 所有簽名構成。
三調整超參數
超參數的調整僅僅是單純的在訓練模型,並針對驗證 集的收斂情況與損失函數的圖形進行超參數調整。模 型訓練的完畢後,透過驗證結果與損失值來評估模 型。透過反覆試誤評估,來決定模型的學習速率、世 代次數與存檔條件。
四正式訓練模型與測試結果
正式訓練模型的階段,步驟大部分與調整超參數的階 段相同。不同在於,每個世代訓練完成後會檢查是否 達到存檔條件,若接達成條件則儲存參數,繼續訓 練,直到達到終止條件為止。達到終止條件後,則使 用最新的參數檔來作為卷積類神經網路的參數,以此 測試模型能力。
五模型績效評估
透過測試集測試模型,來評估模型的泛化能力,並計 算各績效指標。績效可以透過混淆矩陣運算,給定混 淆矩陣如表六>@:
73:模型分類為真,且實際結果也為真。
)3:模型分類為偽,但實際結果為真。
71:模型分類為偽,且實際結果也為偽。
)1:模型分類為真,但實際結果為偽。
根據上述結果,可以計算績效指標:分類錯誤率 HUURU
UDWH(55、錯誤拒絕率 IDOVHUHMHFWLRQUDWH)55 與 錯誤驗收率 IDOVHDFFHSWDQFHUDWH)$5,與其他學者 之研究,會以這三個指標做比較。在此實驗中,分類 錯誤率為整體簽名分類的錯誤比例,錯誤拒絕率為真 實簽名被分類到偽造簽名的比例,錯誤驗收率為偽造 簽名被分類到真實簽名的比例。各績效指標與混淆矩 陣關係如下:
FP FN ERR TP TN FP FN
FRR FN
TPFN FAR FP
FPTN
另外,本研究想要了解在不同層數下的「分類錯誤率」
是否有所不同,導致過度適配或是適配不足的情況,
因此使用50$129$ 分析。
卷積類神經網路之建構
本次實驗使用的模型基本上與+H 等人>@ 所提出用 於,PDJH1HW 的深度殘差網路模型相似,如表七所示。考量 用於,PDJH1HW 圖庫上的深度殘差網路中全連結層 個 節點對應的是,PDJH1HW 圖庫的 個分類。本研究為二 元分類問題,在最後一層的部份,需要將全連結層的神經 元數量修正為。
經過調整超參數的階段,經由試誤法決定,卷積類神 經網路的相關超參數與設定如表八所示:
四、研究結果
本研究有 種實驗,搭配 種層數,共有 種實驗組 合。對每一種實驗組合重複收集 次結果,共有 筆的 結果。
技術學刊 第三十四卷 第三期 民國一○八年
表七 本研究使用之模型
名稱 輸出的特徵
映射圖大小 層 層 層
輸入 uu 像素 u 像素 u 通道(5*%)
卷積 uu uu,步幅
池化 uu uu 最大池化,步幅
卷積模塊u[ uu
ª u u º
« u u »u
« »
« u u »
¬ ¼
ª u u º
« u u »u
« »
« u u »
¬ ¼
ª u u º
« u u »u
« »
« u u »
¬ ¼
卷積模塊u[ uu
u u
ª º
« u u »u
« »
« u u »
¬ ¼
u u
ª º
« u u »u
« »
« u u »
¬ ¼
u u
ª º
« u u »u
« »
« u u »
¬ ¼
卷積模塊u[ uu
ª u u º
« u u »u
« »
« u u »
¬ ¼
ª u u º
« u u »u
« »
« u u »
¬ ¼
ª u u º
« u u »u
« »
« u u »
¬ ¼
卷積模塊u[ uu
u u
ª º
« u u »u
« »
« u u »
¬ ¼
u u
ª º
« u u »u
« »
« u u »
¬ ¼
u u
ª º
« u u »u
« »
« u u »
¬ ¼
池化 uu 全域平均池化
全連結 個神經元,歸一化函數輸出
表八 本研究使用之模型
卷積類神經網路模型 5HV1HWY
預訓練法 基於遷移學習的預訓練法
激勵函數 5H/8
全連結層權重初始化方法 065$ 初始化
正則化方法 / 正則化,
最佳化方法 帶有涅斯捷羅夫動量的隨機梯度下降
學習速率
動量
每批量大小EDWFKVL]H
浮點數精度 位元
世代數HSRFK
實驗結果之描述性統計
實驗一當中,分別對 種不同層數的結果各收集 筆 資料,共 筆。實驗一的結果如表九所示,顯示 種不同 層數的模型均可以找到測試集錯誤率為 的結果。實驗二 當中,分別對 種不同層數的結果各收集 筆資料,共
筆,結果如表十所示。 層的平均 (55 與 )$5 最低,
而 層的 )55 最低。
分類錯誤簽名統計
在實驗一中發現,在 層時「最容易」被分錯的前
三名為作家編號、、 的簽名,在 層時最容易被 分錯的前三名為作家編號、、 的簽名,在 層時 最容易被分錯的前三名為作家編號、、 的簽名。可 以發現作家編號 與 的簽名是較容易被分錯的簽名
如圖 所示。
在實驗二中發現,在 層時「最不容易」被分錯的前 三名為作家編號、、 的簽名,在 層時最不容易 被分錯的前三名為作家編號、、 的簽名,在 層 時最不容易被分錯的前三名為作家編號、、 的簽名。
可以發現作家編號、 與 的簽名是較不容易被分錯 的簽名 如圖 所示。
洪偉嘉和侯東旭:應用卷積類神經網路於中文簽名圖形辨識之研究
表九 實驗一對 種不同層數模型的結果
5HV1HWB9 5HV1HWB9 5HV1HWB9
編號 (55 )55 )$5 (55 )55 )$5 (55 )55 )$5
平均值
標準差
最大值
最小值
表十 實驗二對 種不同層數模型的結果
5HV1HWB9 5HV1HWB9 5HV1HWB9
編號 (55 )55 )$5 (55 )55 )$5 (55 )55 )$5
平均值
標準差
最大值
最小值
圖 實驗一分類錯誤統計
圖 實驗二分類錯誤統計
作家編號 D層時分類錯誤統計
次數
作家編號 F層時分類錯誤統計
次數
作家編號 E層時分類錯誤統計
次數
作家編號 D層時分類錯誤統計
次數
作家編號 E層時分類錯誤統計
次數
作家編號 F層時分類錯誤統計
次數
技術學刊 第三十四卷 第三期 民國一○八年
表十一 本研究與其他研究之比較
中文
學者 方法 (55 )55 )$5
/LZLFNLet al
方法
方法
方法
方法
方法
方法
方法
.HQQDUGet al 方法
+XHWDO 方法
本研究
5HV1HWB9 5HV1HWB9 5HV1HWB9
表十二 實驗一的0DXFKO\ 球形檢定
受試者內效應 0DXFKO\ތV: 近似卡方分配 自由度 顯著性 (SVLORQE
*UHHQKRXVH*HLVVHU +X\QK)HOGW 下限
層數
表十三 實驗一層數對分類錯誤率的50$129$
來源 類型,,, 平方和 自由度 均方 ) 顯著性
層數
假設的球形
*UHHQKRXVH*HLVVHU
+X\QK)HOGW
下限
(UURU層數
假設的球形
*UHHQKRXVH*HLVVHU
+X\QK)HOGW
下限
實驗二與其他研究之比較
比較本研究之結果與其他學者之研究結果,如表十一 所示,表中列出本研究各績效指標的平均值及標準差。發 現本研究在(55 指標上表現並沒有特別差,在 )55 指標 上最差,而在)$5 指標上最好。本研究是使用深度學習的 深度殘差網路來做辨識,而其他學者是使用傳統的特徵選 取及分類器 如支持向量機、羅吉斯迴歸及隨機森林等 來做辨識。本研究會有比較好的 )$5 而有比較不好的 )55,其原因可能是深度殘差網路直接由訓練集資料來學 習特徵,而此資料庫中偽造的簽名筆數又比真實簽名筆數
多所致,即是資料不平衡所致,但目前是無法由文獻來驗 證此原因。
模型層數對錯誤率之比較
本研究使用假設檢定來推論層數對分類錯誤率是否 有影響,以此來判斷是否有過度適配或是適配不足的問 題。
對實驗一之結果進行0DXFKO\ 球形檢定,發現不顯著
3!,假設資料符合球形,如表十二所示。進行 50
$129$ 分析,發現層數對於分類錯誤率不具有顯著影響
3!,如表十三所示,故不進行事後檢定。因此,沒
洪偉嘉和侯東旭:應用卷積類神經網路於中文簽名圖形辨識之研究
表十四 實驗二層數對分類錯誤率的50$129$
受試者內效應 0DXFKO\ތV: 近似卡方分配 自由度 顯著性 (SVLORQE
*UHHQKRXVH*HLVVHU +X\QK)HOGW 下限
層數
表十五 實驗二層數對分類錯誤率的50$129$
來源 類型,,, 平方和 自由度 均方 ) 顯著性
層數
假設的球形
*UHHQKRXVH*HLVVHU
+X\QK)HOGW
下限
(UURU
層數
假設的球形
*UHHQKRXVH*HLVVHU
+X\QK)HOGW
下限
有足夠證據支持層數對於分類錯誤率有顯著影響。對實驗 二之結果進行0DXFKO\ 球形檢定,發現不顯著 3!, 假設資料符合球形,如表十四所示。進行50$129$ 分 析,發現層數對於分類錯誤率不具有顯著影響 3!, 如表十五所示,故不進行事後檢定。因此,沒有足夠證據 支持層數對於分類錯誤率有顯著影響。
五、結論與建議
本研究根據不同的應用情境,提出二種不同的實驗,
使用 5HV1HWY 進行建模。結果表示,實驗一應用情境的 結果遠優於實驗二的應用情境。由實驗一的結果可知,卷 積類神經網路具有能抽出簽名中特徵與分類的能力並且能 妥善分類。但在實驗二當中的表現卻不如預期,兩組不同 的簽名所蘊含的特徵不大相同。
本研究有個發現,六種的實驗組合中,對於卷積類神 經網路整體而言,具有)$5 比 )55 低的傾向 比較 組 的平均值後的結果。偽造的簽名不應該被接受,具有較低 )$5 是一個具有潛力的特性,但目前並不清楚是否為訓 練時偽造簽名比例偏多所導致,這並不在本研究的探討 範圍之內。
在機器學習上有個普遍的共識,在模型訓練良好的情 況下,若要使測試結果更佳,應要降低模型複雜度,反之 會導致過度適配的情況發生。若模型訓練不佳,增加模型 複雜度,可以使測試結果更佳。雖然本研究發現 種層數 對於錯誤率的變化並不顯著,似乎使用 層的網路模型,
可以較經濟且達到近似的表現,但此發現並不能推論 於所有的問題。一些研究報告指出,在深度學習當中,模
圖 正確率圖
型複雜度的增加對過度適配的發生並不是那麼明顯,但理 由還不清楚>@ 建議未來可以對過度配適問題做更深 入的實驗與理論探討,也可以試著去尋找不影響錯誤率的 情況下最少的層數,來縮短運算時間。
又由於本研究使用簡易型的*H)RUFH*7; 單卡
*38 進行加速運算,浮點數為 位元,因此訓練時間比 較長。在本研究的實驗一中, 層、 層及 層的
世代訓練平均時間分別 秒、 秒、及 秒。
隨著*38 科技的進步,在使用先進型的 *38 下可以快速 地完成網路訓練,因此本研究主要探討深度學習網路的準 確率,而不在訓練時間上做比較。
本研究仍有許多可改善之處,在此提出下列幾項作為 後續研究之參考:
WUDLQLQJ YDOLGDWLRQ DFFXUDF\
HSRFK