文字辨識

第四章文字辨識系統

4.4 文字辨識

當文字區塊經由細線化演算法初步分類後，其只需要再比對與其拓樸近似

之標準字元，以確認文字內容。本研究使用距離轉換(distance transformation)作為文字辨識之方法，其可計算每一個文字區塊與標準字元的相似程度，並以相似度最高之字元作為辨識結果。距離轉換的計算方式繁多，例如 Euclidean 、

Manhattan、Chessboard 以及 Chamfer…等等(如圖 4.18 所示)，以顏色明暗代與中心點之距離，顏色越黑，其與中心點之距離越遠。在這幾種計算方法中，Euclidean 為較常使用之方法，其計算之精確度也較高，然而其牽涉平方以及開根號之運算，其計算量以及時間複雜度也較高，較不適合應用在本研究之系統；而

Manhattan、Chessboard 的計算速度較快，但其精確度較差，易影響相似成度的計算結果。

考慮計算的精確度與時間複雜度問題，在各種計算方法中，Chamfer distance 具有快速運算的優點，而且其精確度也近似 Euclidean distance，因此，本研究以 Chamfer distance 作為距離轉換之計算方法。而為了快速計算 Chamfer distance 影

(a) Euclidean (b) Manhattan (c) Chessboard (d) Chamfer 圖 4.18、各種距離轉換的計算結果

像，本研究採用[Fou03]所提出之演算法，其將 Chamfer mask 分解成 forward 與 backward mask，如圖 4.19 所示，其中 c1 與 c2 可由使用者自行定義，利用 forward mask 並以影像的左上角為起點，由左而右、由上而下，進行遮罩運算，再以影像的右下角為起點，使用 backward mask，由右而左、由下而上，進行遮罩運算，

如此，即可快速計算 Chamfer distance 影像，其演算法如表 4.2 所示。以字母 A 為例，將 Chamfer distance 應用在其細線化的結果，產生之 Chamfer distance map 如圖 4.20 所示。

本研究將 Chamfer distance 應用在標準字元的二值化細線影像，因此，在文字辨識時，欲辨識之文字區塊，亦會先進行細線化處理，再將其影像與各標準字

(a) forward mask (b) backward mask 圖 4.19、chamfer mask

表 4.2、chamfer distance 之演算法

1 IM ← input image array

圖 4.20、字元 A 之 Chamfer distance 影像

元的 Chamfer distance 影像，以點對點的方式，相乘並加總，即如下公式所示：

算最小值作為辨識結果。

由於某些文字外形的具重疊性，在計算相似程度時，會有多個相同或近似之最小值產生，如表 4.4 所示，以標準字型 E 為例，透過公式(4.21)，其與標準字元 E 或是 F 的計算結果皆為零，類似的情況有 L 跟 E、C 跟 G…等等。為了解決上述之問題，本研究採用雙向比對的方式，先以標準字元的 Chamfer distance 影像作為 IC，欲辨識之文字區塊的細線化影像作為 IB，代入公式(4.21)，令其計算結果為S1，再將 Chamfer distance 演算法應用在欲辨識之文字區塊，以其 Chamfer

distance 影像作為 IC，並將標準字元之細線化影像作為IB，再代入公式(4.21)，其計算結果為 S2，最後，在S1與 S2之中，選出最大值作為計算結果 S，即可解決前述之問題。以表 4.4 為例，欲辨識之文字區塊為 F 時，其與標準文字 E 的相似程度值S1 = 0，但是採用前述的雙向比對法，將 Chamfer distance 套用在文字區

表 4.4、文字辨識範例(二)

標準字元影像 Chamfer distance map 文字區塊影像相似程度值

0

塊 F，再根據公式(4.21)，計算其與標準文字 E 的相似程度值，如表 4.5 所示，相似程度值為S2 = 6，再以最大值 S2作為計算結果S，同理，文字區塊 F 與標準文 字 F 的比對值 S 仍為零，藉此雙向比對的方式，其不僅可以解決文字外形重疊之 問題，亦不會影響最後的辨識結果，以前述情況為例，最後的辨識結果，仍然為文字 F。

在文檔中自動贓車偵測系統 (頁 54-58)

第四章 文字辨識系統

4.4 文字辨識

0

0

0

第四章文字辨識系統