連接筆劃實驗

第四章實驗結果與討論

4.1.6 連接筆劃實驗

圖二十五、初步細線化結果

從圖二十五中，可以看到本研究成功的將影像中文字細線化，且在時間上，細線化一個字平均只花了0.0032 秒，成功的縮短了細線化所需花費的時間，但因之前作的去除重疊與本研究所提出的細線化方法，所以從圖二十五中可以看到筆劃間皆是斷開的，故進行筆劃連接使整個骨架線完整化。

4.1.6 連接筆劃實驗

將上階段之結果做筆劃連接的動作，結果如圖二十六所示，平均一個字花費0.0156 秒。

圖二十六、(a)合併完水平與垂直之結果 (b)最後合併結果

從圖二十六(a)中，可以看到經過第一次的水平與垂直筆劃合併後，較方正的字已漂亮的連結成功，但較不端正的字則尚未處理漂亮，故要進行第二階段合併，結果如圖二十六(b)所示。

從圖二十六(b)中，可以看到“夕”的末端未能連接成功，這是因為上端點（如圖二十七第四列之紅圈）向下延伸之pixel 在原圖是 0，故無法向下延伸以致於無法與下端點（如圖二十七第七列之紅圈）連接成功。而“永”是因為在去除重疊的部份無法去除乾淨，故留下了許多雜訊，以致於筆劃連接崎嶇，這些問題都是我們未來研究的重要方向。

(a) (b)

長度閥值，再利用這四個參數使用掃圖的方法抽取筆劃，雖然 PSO 需要時間訓練，但訓練過一次後即可給不同樣本使用，而[20][21]使用 gabor 濾波抽取筆劃相當耗費時間，

故在效率上本研究優於[20][21]。在細線化部份，本研究利用筆劃邊界找取細線化的方式，不需要不斷侵蝕即可得到細線化結果，故在效率上優於[18]。故本研究所提出之方法，成功的縮短了細線化時間，並有不錯之效果。

表四、本研究與文獻之比較

抽取筆劃細線化

本研究 PSO 找筆劃長度閥值本研究邊界找取

[20][21] Gabor 濾波 [18] 遮罩

4.2 影像中文字辨識演算法

本章節將介紹影像中文字辨識演算法的各步驟實驗成果，並對實驗結果進行討論。

4.2.1 訓練樣本

本研究主要是針對新聞影像文字進行辨識，故使用字型為和平圓新書的64*64 的二值影像，作為訓練樣本，先將 5401 個常用字抽取特徵並編碼及儲存如表三，實驗發現編碼重複率很低，5401 個字中只有{一，ㄚ}、{口，凸}、{工，王}、{今，令}、{正，

疋}、{沫，沬}這六組有重複，且重複的編碼都只有 2 個，故本研究所使用之擷取特徵方法有相當好的效果，再將這 5401 個編碼作為接下來辨識之訓練樣本，而詞庫則為網路上找得，並加以擴充，如加入人名、常用詞…等等，也是為了辨識之用。

4.2.2 作業環境

本研究使用於作業系統Microsoft XP Professional Version 2002 Service Pack2，處理器為Intel(R) Pentium(R) D CPU 3.40GHz，記憶體為 1.00GB RAM，此實作系統使用 java 完成。

4.2.3 訓練樣本測試效果

本實驗先使用訓練樣本作為各階段實驗時間的樣本，樣本字數為7，流程如圖十九。

在抽取影像中文字資訊的部份，共花費0.219 秒，平均一個字花費 0.031 秒。

在初步辨識部份，是先設定β=20，即是在[number - 20,number + 20]的範圍內計算漢明距離找出候選項，而候選項數是先設定為5，即 γ=5，共花費 0.234 秒，平均一個字花費0.033 秒。

在最後辨識部份，是使用 GA 辨識，而各參數為：基因數=10、交配率=0.8、突變率=0.08，終止條件為當最佳目標函數值連續 40 次不變動則訓練完畢，共花費 0.36 秒，

平均一個字花費0.051 秒。

以下將再進行不同實驗進行本方法的驗證。

4.2.3 初步辨識實驗

本實驗將使用不同的測試樣本，測試初步辨識的辨識率。

圖二十八、訓練樣本

4.2.3.1 二值化影像之不同尺寸的測試樣本：

實驗樣本為二值化影像，即不是白就是黑，不是1 就是 0，字型為和平圓新書。實驗設定：β=20、γ=5：

測試樣本一：

尺寸為 32*32 抽取資訊結果：

number= 48

code={ 1,1,1,3,3,3,1,3,3,3,1,1,1,1,1,3,3,3,1,3,3,3,1,1 } 初步辨識之候選項：

number= 48

code={1,1,1,3,3,3,1,3,3,3,1,1,1,1,1,3,3,3,1,3,3,3,1,1}

number= 104

code={1,3,5,3,5,5,3,5,5,7,5,3,1,1,7,3,7,7,7,7,7,3,1,3}

number= 84

code={5,5,5,5,3,1,1,1,5,3,5,3,3,3,3,3,1,7,1,1,5,5,5,5}

{ 壬, 玉, 三, 工, 王 }

number= 102

code={ 1,3,7,3,5,3,3,3,5,3,5,3,1,3,7,3,7,7,7,7,7,3,3,3 } 初步辨識之候選項：

code={ 5,5,5,5,3,1,1,1,5,3,5,3,3,3,3,3,1,5,1,1,5,5,5,5 } 初步辨識之候選項：

{ 刖, 圳, 那, 則, 加 } 各漢明距離為：

尺寸為 100*100 抽取資訊結果：

number= 48

code={ 1,1,1,3,3,3,1,3,3,3,1,1,1,1,1,3,3,3,1,3,3,3,1,1 } 初步辨識之候選項：

{ 去, 玉, 三, 工, 王}

各漢明距離為：

{ 8, 6, 4, 0, 0 }

測試樣本五：

尺寸為 100*100 抽取資訊結果：

number= 132

code={ 3,5,7,5,7,5,3,7,5,7,5,3,1,3,15,3,9,7,7,7,7,3,1,7 } 初步辨識之候選項：

{氧, 耆, 責, 剿, 曹}

各漢明距離為：

{ 50, 50, 50, 48, 46 }

測試樣本六：

尺寸為 100*100 抽取資訊結果：

number= 84

code={ 5,5,5,5,3,1,1,1,5,3,5,3,3,3,3,3,3,1,1,5,5,5,5,5 } 初步辨識之候選項：

{ 把, 地, 坷, 那, 加}

各漢明距離為：

{ 16, 16, 14, 12, 12}

實驗結果發現，測試樣本五的初步辨識並不正確，這是因為測試樣本的 number 與訓練樣本相差大於β，故本研究將 β 改為 30 以修正此問題，修正結果如下。

β=30、γ=5：

測試樣本一：

初步辨識之候選項：{ 玉, 壬, 三, 工, 王 } 各漢明距離為：{ 6, 6, 4, 0, 0 }

測試樣本二：

初步辨識之候選項：{ 春, 姜, 脊, 穹, 參 } 各漢明距離為：{ 24, 24, 22, 22, 14 }

測試樣本四：

初步辨識之候選項：{ 玉, 壬, 三, 工, 王 } 各漢明距離為：{ 6, 6, 4, 0, 0 }

測試樣本五：

初步辨識之候選項：{ 黍, 春, 昏, 曾, 參 } 各漢明距離為：{ 40, 38, 38, 34, 28}

測試樣本六：

初步辨識之候選項：{ 坩, 拍, 那, 加, 抑 } 各漢明距離為：{ 12, 12, 12, 12, 10 }

實驗證明將 β 修正為 30 後，有效的改善了原本的問題，並成功的增強了初步辨識的辨識率。將本研究與[15]相比後發現，本研究因不需繁雜的前置步驟，[15]必須先將影像中文字細線化，且本研究沒有複雜的編碼方式，[15]必須將經細線化後抽取之特徵點（如表一）進行分群，才能得到編碼，所以在時間上節省了相當多的時間，且從實驗中也可看出本研究所提出的方法在效果上也有相當好的表現，接下來以灰階影像進行實驗，因本研究的原理不會因影像是否為二值化而有所改變，故以灰階影像進行驗證。

4.2.3.2 灰階影像之不同尺寸的測試樣本

實驗樣本為灰階影像，即pixels 在[ 0,255 ]範圍內，0 為黑、255 為白，字型為和平圓新書。實驗設定：β=30、γ=5：

測試樣本一：

尺寸為 32*32 抽取資訊結果：

number= 48

code={ 1,1,1,3,3,3,1,3,3,3,1,1,1,1,1,3,3,3,1,3,3,3,1,1 } 初步辨識之候選項：

{ 玉, 壬, 三, 工, 王 } 各漢明距離為：

{ 6, 6, 4, 0, 0 }

測試樣本二：

尺寸為 32*32 抽取資訊結果：

number= 78

code={ 1,5,1,1,3,5,3,3,3,3,1,3,3,3,1,3,7,7,3,3,3,5,5,3 } 初步辨識之候選項：

{ 么, 日, 弦, 茁, 店 } 各漢明距離為：

{ 26, 26, 26, 26, 24 }

測試樣本三：

code={ 5,5,5,5,3,1,1,1,5,3,5,3,3,3,3,3,3,1,1,3,5,5,5,5 } 初步辨識之候選項：

{ 坩, 加, 那, 仙, 抑 } 各漢明距離為：

{ 10, 10, 10, 10, 8 }

測試樣本四：

尺寸為 100*100 抽取資訊結果：

number= 48

code={ 1,1,1,3,3,3,1,3,3,3,1,1,1,1,1,3,3,3,1,3,3,3,1,1 } 初步辨識之候選項：

{ 玉, 壬, 三, 工, 王 } 各漢明距離為：

{ 6, 6, 4, 0, 0 }

測試樣本五：

尺寸為 100*100 抽取資訊結果：

number= 108

code={ 1,3,5,3,5,5,3,7,3,5,5,3,1,3,9,3,7,7,7,7,7,5,1,3 } 初步辨識之候選項：

{ 直, 菅, 春, 宣, 參 } 各漢明距離為：

{ 24, 24, 22, 22 , 12 }

測試樣本六：

尺寸為 100*100 抽取資訊結果：

number= 86

code={ 5,5,5,5,3,1,1,1,5,3,5,3,3,3,3,3,3,5,1,3,5,5,5,5 } 初步辨識之候選項：

{ 坩, 圳, 那, 抑, 加 } 各漢明距離為：

{ 14, 14, 14, 12, 6 }

從實驗結果發現，測試樣本二辨識錯誤，這是因為圖的尺寸太小，字的複雜度又高，

導致筆劃畫素不分離（如圖二十九），故造成初步辨識錯誤，但從其他測試樣本可以發現，本研究所提出的方法，確實可以應用於灰階影像上，但在尺寸小的影像應用上，最

圖二十九、尺寸小筆劃多的畫素圖

接下來將對不同字型進行實驗，以正確定位本研究可應用範圍。

4.2.3.3 不同字型之測試樣本

在上一實驗已證實，本研究可以應用於灰階影像，故本實驗使用64*64 的灰階影像進行實驗，實驗設定：β=30、γ=5。

測試樣本字型：新細明體測試樣本一：

抽取資訊結果：

number= 48

code={ 1,1,1,3,3,3,1,3,3,3,1,1,1,1,1,3,3,3,1,3,3,3,1,1 }

初步辨識之候選項：

{ 玉, 壬, 三, 工, 王 } 各漢明距離為：

{ 6, 6, 4, 0, 0 }

測試樣本二：

抽取資訊結果：

number= 124

code={ 4,6,6,6,6,6,6,6,4,6,4,4,4,2,4,4,8,6,6,6,6,6,4,4 } 初步辨識之候選項：

{ 庫, 廁, 島, 唐, 博 } 各漢明距離為：

{ 18, 18, 16, 14, 14 }

測試樣本三：

抽取資訊結果：

number= 84

code={ 4,4,4,4,2,0,2,2,6,4,6,4,4,4,4,4,4,2,0,2,4,6,4,4 } 初步辨識之候選項：

{ 仰, 故, 肋, 皿, 如 }

抽取資訊結果：

number= 48

code={ 1,1,1,1,3,7,1,1,3,3,1,1,1,1,1,3,3,3,1,3,3,3,1,1 } 初步辨識之候選項：

{ 三, 壬, 玉, 工, 王 } 各漢明距離為：

{ 12, 10, 10, 8, 8 }

測試樣本五：

抽取資訊結果：

number= 92

code={ 1,1,3,3,5,3,5,3,3,3,5,3,3,5,7,3,5,5,7,7,1,1,1,9 } 初步辨識之候選項：

{ 丞, 釘, 恨, 麥, 家 } 各漢明距離為：

{ 38, 38, 38, 36, 36 }

測試樣本六：

抽取資訊結果：

number= 68

code={ 5,3,3,3,1,1,1,3,3,3,3,3,3,3,3,1,5,1,1,1,3,5,5,5 } 初步辨識之候選項：

{ 凡, 仙, 中, 凶, 彬 } 各漢明距離為：

{ 18, 16, 16, 14, 12 }

測試樣本字型：和平粗圓體測試樣本七：

抽取資訊結果：

number= 48

code={ 1,1,1,3,3,3,1,3,3,3,1,1,1,1,1,3,3,3,1,3,3,3,1,1 } 初步辨識之候選項：

{ 玉, 壬, 三, 工, 王 } 各漢明距離為：

{ 6, 6, 4, 0, 0 }

測試樣本八：

抽取資訊結果：

各漢明距離為：

{ 14, 10, 10, 10, 8 }

測試樣本九：

抽取資訊結果：

number= 84

code={ 5,5,5,5,5,3,1,1,5,3,3,3,3,3,3,3,3,1,1,3,5,5,5,5 } 初步辨識之候選項：

{ 仞, 佣, 坷, 抑, 他 } 各漢明距離為：

{ 12, 10, 10, 10, 10 }

從測試樣本一~九中發現，本研究所提出之方法對不同字型之簡單字體（測試樣本一、四、七）算有不錯的辨識效果，但對稍微多的筆劃字體辨識效果卻相當的差，這是因為不同字型的筆劃走向與筆劃寬度不同的關係，故訓練樣本的選擇極為重要，而此缺點也是未來研究的重要方向。

4.2.3.4 初步辨識實驗總結

從上述各實驗中可以發現，本研究雖然應用在與訓練樣本不同的字型上效果不佳，

但在同字型的樣本上效果相當的好，無論是尺寸縮放或是影像型態的不同（二值化或灰階影像）皆可正確辨識，且十分的有效率，所以本研究成功的提出了一個特徵抽取方式與初步辨識方法。

4.2.4 最終辨識實驗

本研究是使用GA 作最後辨識，實驗樣本將以訓練樣本為主，做各參數的實驗。

本章節將進行探討突變率與連續最佳解次數的實驗，實驗結果如下，以下實驗時間為辨識所花費之時間。

實驗一：突變率=0.01 且連續 10 次最佳解不變，得到辨識率為 0.081，平均一個字花費 0.00532 秒。

實驗二：突變率=0.01 且連續 20 次最佳解不變，得到辨識率為 0.270，平均一個字花費 0.01073 秒。

從實驗一、二中發現，突變率相同但訓練次數增多有效的提升了辨識率，這是因為訓練不足的關係，故提升訓練次數到可以接受的時間與辨識率。

實驗三：突變率=0.01 且連續 25 次最佳解不變，得到辨識率為 0.355，平均一個字花費 0.01292 秒。

實驗四：突變率=0.01 且連續 30 次最佳解不變，得到辨識率為 0.435，平均一個字花費 0.01508 秒。

實驗五：突變率=0.01 且連續 35 次最佳解不變，得到辨識率為 0.528，平均一個字花費 0.0172 秒。

實驗六：突變率=0.01 且連續 40 次最佳解不變，得到辨識率為 0.595，平均一個字花費 0.01906 秒。

從實驗三~六中發現，增加訓練次數對辨識率已有趨緩的趨勢，這是因為突變率太低以致於陷入區域最佳解，故提升突變率。

0.01323 秒。

4.2.5 比較

經上述實驗結果顯示，在前置步驟上，本研究不需前置步驟而[15]需先經細線化處理，而在編碼方面，本研究使用24 方位環狀擷取特徵在計算上相當簡單，而[15]是使用

在文檔中 I-Shou University Institutional Repository:Item 987654321/1202 (頁 37-0)

第四章 實驗結果與討論

4.1.6 連接筆劃實驗

第四章實驗結果與討論