字元集合候選區域校正 - 字元切割 - 應用圖形識別於大量客製化生產流程之研究-以工業電腦業者G公司為例

3.4 字元切割

3.4.2 字元集合候選區域校正

由於雜訊或不同光源情況，抽取的字元集合候選區域可能不完整，例如：圖 3. 3 中(a)為(b)的一部分。一般較直覺的方法是使用垂直投影，來計算此區域中每一個字元的平均高度和寬度，之後根據字元資訊復原回整個字元集合區塊，然而此方法卻容易受大小、視角、雜訊的影響。因此我們提出一個以群組為基礎

（cluster-based）的方法計算出字元的幾何特性，並利用此資訊將整個字元集合區塊復原，這方法對字元集合區塊的大小、視角、雜訊有強健性。

(a) (b)

圖 3. 3 字元集合區塊復原的結果，(b)、(d)為(a)、(c)結果

我們利用字元集合區塊中字元的數目作為確認字元集合區塊的主要特徵。字元集合區塊中的字元應滿足下列幾何特性：

特性一：所有字元高度相似。

特性二：所有字元寬度相似。

特性三：字元中心概略在水平方向成一直線。

基於上述幾何特性，我們發展出一套字元分析演算法（character analysis algorithm）來計算字元集合區塊中字元的個數；但在計算前，可以根據下列四個限制將一些錯誤的字元移除：

限制一：每一個字元的面積應大於25 點（pixels）。

限制二：每一個字元寬度應大於3 點。

限制三：每一個字元高度應大於所抽取字元集合區域高度的一半。

限制四：每一個字元寬度應小於所抽取字元集合區域寬度的一半。

的字元；因此在R 中以此四個限制檢查每一個字元以找出一組候選字元集合S ，_c 接著用集合S 利用分群組（clustering）方法計算字元的幾何特性以便做接下來的_c 字元集合區域確認。在S 中每一個真正的字元形成同一個群組的假設下，_c d 表_i 示為每一個字元到第 i 群的距離和，而s 則記錄第 i 群的字元個數，根據這些定_i 義和上述的三個幾何特性，計算S 中的字元特性演算法表示如下： _c

字元分析演算法（CHARACTER ANALYSIS ALGORITHM）：

步驟1：N表S 中的候選字元個數，將全部的_c N個d 和_i s 設為零。 _i

出 R 中的正確字元個數N 。將_c r_j定義為最接近數值 /

字元集合區塊復原演算法（License-Plate Recovery Algorithm）：

步驟1：根據字元分析演算法，可得到候選區域 R 中正確字元的平均寬度w、平

集合S_c^new。

步驟4：將新候選字元集合S_c^new經過字元分析法運算後，可得到新的正確字元集合S^ˆ_c^new與新的正確字元數目N_c^new。

步驟 5：將x_left、x_right、y_top、y_bottom分別定義為字元集合S^ˆ_c^new裡的最左、最右、

最上、最下座標；如果|N_C^new/N_p− <1| 0.2，則將區域R^new視為字元集合區塊的真正所在；另外， R^new 的位置更改如下：left_R^new =x_left ，

new

R right

right =x ，top_R^new = y_top，和bottom_R^new = y_bottom。

圖 3. 3 顯示使用我們所提出的字元集合區塊復原演算法的兩個範例，由圖可知，字元集合區塊被正確且完整的復原。除此之外，取像時的視角關係會造成所抓取的字元集合區塊傾斜；而在實際應用上，傾斜字元集合區塊將造成字元的辨識錯誤；為了解決此問題，我們使用傾斜校正程序來補償字元集合區塊的傾斜問題，而下一節將討論我們所提出的傾除矯正演算法。

在文檔中應用圖形識別於大量客製化生產流程之研究-以工業電腦業者G公司為例 (頁 39-43)