3.4 字元切割
3.4.2 字元集合候選區域校正
由於雜訊或不同光源情況,抽取的字元集合候選區域可能不完整,例如:圖 3. 3 中(a)為(b)的一部分。一般較直覺的方法是使用垂直投影,來計算此區域中每 一個字元的平均高度和寬度,之後根據字元資訊復原回整個字元集合區塊,然而 此方法卻容易受大小、視角、雜訊的影響。因此我們提出一個以群組為基礎
(cluster-based)的方法計算出字元的幾何特性,並利用此資訊將整個字元集合 區塊復原,這方法對字元集合區塊的大小、視角、雜訊有強健性。
(a) (b)
(c) (d)
圖 3. 3 字元集合區塊復原的結果,(b)、(d)為(a)、(c)結果
我們利用字元集合區塊中字元的數目作為確認字元集合區塊的主要特徵。字 元集合區塊中的字元應滿足下列幾何特性:
特性一:所有字元高度相似。
特性二:所有字元寬度相似。
特性三:字元中心概略在水平方向成一直線。
基於上述幾何特性,我們發展出一套字元分析演算法(character analysis algorithm)來計算字元集合區塊中字元的個數;但在計算前,可以根據下列四個 限制將一些錯誤的字元移除:
限制一:每一個字元的面積應大於25 點(pixels)。
限制二:每一個字元寬度應大於3 點。
限制三:每一個字元高度應大於所抽取字元集合區域高度的一半。
限制四:每一個字元寬度應小於所抽取字元集合區域寬度的一半。
的字元;因此在R 中以此四個限制檢查每一個字元以找出一組候選字元集合S ,c 接著用集合S 利用分群組(clustering)方法計算字元的幾何特性以便做接下來的c 字元集合區域確認。在S 中每一個真正的字元形成同一個群組的假設下,c d 表i 示為每一個字元到第 i 群的距離和,而s 則記錄第 i 群的字元個數,根據這些定i 義和上述的三個幾何特性,計算S 中的字元特性演算法表示如下: c
字元分析演算法(CHARACTER ANALYSIS ALGORITHM):
步驟1:N表S 中的候選字元個數,將全部的c N個d 和i s 設為零。 i
出 R 中的正確字元個數N 。將c rj定義為最接近數值 /
字元集合區塊復原演算法(License-Plate Recovery Algorithm):
步驟1:根據字元分析演算法,可得到候選區域 R 中正確字元的平均寬度w、平
集合Scnew。
步驟4:將新候選字元集合Scnew經過字元分析法運算後,可得到新的正確字元集 合Sˆcnew與新的正確字元數目Ncnew。
步驟 5:將xleft、xright、ytop、ybottom分別定義為字元集合Sˆcnew裡的最左、最右、
最上、最下座標;如果|NCnew/Np− <1| 0.2,則將區域Rnew視為字元集合 區 塊 的 真 正 所 在 ; 另 外 , Rnew 的 位 置 更 改 如 下 :leftRnew =xleft ,
new
R right
right =x ,topRnew = ytop,和bottomRnew = ybottom。
圖 3. 3 顯示使用我們所提出的字元集合區塊復原演算法的兩個範例,由圖 可知,字元集合區塊被正確且完整的復原。除此之外,取像時的視角關係會造成 所抓取的字元集合區塊傾斜;而在實際應用上,傾斜字元集合區塊將造成字元的 辨識錯誤;為了解決此問題,我們使用傾斜校正程序來補償字元集合區塊的傾斜 問題,而下一節將討論我們所提出的傾除矯正演算法。