• 沒有找到結果。

文字辨識

在文檔中 自動贓車偵測系統 (頁 54-58)

第四章 文字辨識系統

4.4 文字辨識

當文字區塊經由細線化演算法初步分類後,其只需要再比對與其拓樸近似

之標準字元,以確認文字內容。本研究使用距離轉換(distance transformation)作為 文字辨識之方法,其可計算每一個文字區塊與標準字元的相似程度,並以相似度 最 高 之 字 元 作 為 辨 識 結 果 。 距 離 轉 換 的 計 算 方 式 繁 多 , 例 如 Euclidean 、

Manhattan、Chessboard 以及 Chamfer…等等(如圖 4.18 所示),以顏色明暗代與中 心點之距離,顏色越黑,其與中心點之距離越遠。在這幾種計算方法中,Euclidean 為較常使用之方法,其計算之精確度也較高,然而其牽涉平方以及開根號之運 算,其計算量以及時間複雜度也較高,較不適合應用在本研究之系統;而

Manhattan、Chessboard 的計算速度較快,但其精確度較差,易影響相似成度的 計算結果。

考慮計算的精確度與時間複雜度問題,在各種計算方法中,Chamfer distance 具有快速運算的優點,而且其精確度也近似 Euclidean distance,因此,本研究以 Chamfer distance 作為距離轉換之計算方法。而為了快速計算 Chamfer distance 影

(a) Euclidean (b) Manhattan (c) Chessboard (d) Chamfer 圖 4.18、各種距離轉換的計算結果

像,本研究採用[Fou03]所提出之演算法,其將 Chamfer mask 分解成 forward 與 backward mask,如圖 4.19 所示,其中 c1 與 c2 可由使用者自行定義,利用 forward mask 並以影像的左上角為起點,由左而右、由上而下,進行遮罩運算,再以影 像的右下角為起點,使用 backward mask,由右而左、由下而上,進行遮罩運算,

如此,即可快速計算 Chamfer distance 影像,其演算法如表 4.2 所示。以字母 A 為例,將 Chamfer distance 應用在其細線化的結果,產生之 Chamfer distance map 如圖 4.20 所示。

本研究將 Chamfer distance 應用在標準字元的二值化細線影像,因此,在文 字辨識時,欲辨識之文字區塊,亦會先進行細線化處理,再將其影像與各標準字

(a) forward mask (b) backward mask 圖 4.19、chamfer mask

表 4.2、chamfer distance 之演算法

1 IM ← input image array

圖 4.20、字元 A 之 Chamfer distance 影像

元的 Chamfer distance 影像,以點對點的方式,相乘並加總,即如下公式所 示:

算最小值作為辨識結果。

由於某些文字外形的具重疊性,在計算相似程度時,會有多個相同或近似之 最小值產生,如表 4.4 所示,以標準字型 E 為例,透過公式(4.21),其與標準字 元 E 或是 F 的計算結果皆為零,類似的情況有 L 跟 E、C 跟 G…等等。為了解決 上述之問題,本研究採用雙向比對的方式,先以標準字元的 Chamfer distance 影 像作為 IC,欲辨識之文字區塊的細線化影像作為 IB,代入公式(4.21),令其計算 結果為S1,再將 Chamfer distance 演算法應用在欲辨識之文字區塊,以其 Chamfer

distance 影像作為 IC,並將標準字元之細線化影像作為IB,再代入公式(4.21),其 計算結果為 S2,最後,在S1S2之中,選出最大值作為計算結果 S,即可解決 前述之問題。以表 4.4 為例,欲辨識之文字區塊為 F 時,其與標準文字 E 的相似 程度值S1 = 0,但是採用前述的雙向比對法,將 Chamfer distance 套用在文字區

表 4.4、文字辨識範例(二)

標準字元影像 Chamfer distance map 文字區塊影像 相似程度值

0

0

0

塊 F,再根據公式(4.21),計算其與標準文字 E 的相似程度值,如表 4.5 所示,相 似程度值為S2 = 6,再以最大值 S2作為計算結果S,同理,文字區塊 F 與標準文 字 F 的比對值 S 仍為零,藉此雙向比對的方式,其不僅可以解決文字外形重疊之 問題,亦不會影響最後的辨識結果,以前述情況為例,最後的辨識結果,仍然為 文字 F。

在文檔中 自動贓車偵測系統 (頁 54-58)

相關文件