線上手寫識別系統

第二章、相關領域及研究

2.2 線上手寫識別系統

(a) (b)

(c)

圖 2-1-1(a)(b)(c).以塗抹方法求取傾斜角度示意圖

2.2 線上手寫識別系統

線上手寫識別系統 (Online Handwriting Character Recognition，OLHCR)與光學識別系統在同一個時期發展，早期的手寫系統使用的是與 OCR 一樣的做法，也就是說 OCR 是針對很多個字的影像，而 OLHCR 則是針對少量文字的影像。但是在 OCR 容易解決的問題，到 OLHCR 變得複雜起來，因為人寫的字無法如同機器印刷一樣的精確，即使是同一個人連續兩次寫的同一個字，也可能存在著差異；個人的書寫習慣的不同，則造成同一個字由不同的人寫出的時候可能會有很大的不同，例如字體的間距、每個元件(Radical)的比例，

等等的差異性就如同 OCR 所遭遇到的不同字體的問題。OCR 可以藉著訓練不同的字體的數據庫(database)來解決字體的差異問題，畢竟常用的字體的數據是已經知道的資訊，不會讓 database 無限制增長下

去。但是 OLHCR 若是要針對每個人的書寫習慣來建立專屬的數據庫，平均數轉換成為 probability density functions(PDFs)，除了可以避免之前完全使用結構性描述的時候需要的人工編程來記錄這些

斜字元的時候其辨識穩定性也比較高，但是對於字元的傾斜比較嚴重以及旋轉的情況還是無法獲得有效的處理，吸收太多的變異的話甚至可能會產生排拒正確輸入的情況。

對於這種傾斜嚴重以及旋轉的情況，在前處理的時候先行根據字本身[14]、短語(word)[13][15]、書寫筆劃以及文字行[11]的幾何特性以及書寫習慣進行校正，以期得到正確的識別結果，或者減少核心需要關注的訓練樣本的數量。漢字的書寫習慣一般是由上至下，

由左至右，根據統計[14]，大部分的中文字來說，起點都是在左上角，所以對於任何輸入的軌跡，第一個步驟就是將整個字旋轉，使得它的第一筆劃的起點在左上角，如圖 2-2-1 漢字書寫起點示意圖所示。右側黑色字體表示使用者書寫的樣子，左側紅色字體表示程式校正之後的結果，大的圓點表示第一畫的起筆位置。

這個假設相當的粗略，很多漢字的第一畫的起筆位置並不在左上角，實驗結果顯示這個假設在某些角度的時候特別有效，有高達九成的校正成果，當然另外一些角度則與不校正的結果是一樣的，平均可以有 52% 的改善，因此，必須進行第二個步驟以提升整體表現。再次觀察旋轉後的資料並且比較與統計那些無法被改善的字的真正的角度與校正的角度，發現它們即使是被校正錯誤，也會落在固定的幾個角度，0°表示是正確被校正的樣本，±45°表示這些樣本校正後的誤差角度，既然樣本的數量已經獲得控制，那麼就把這些樣本也納入識別核心的訓練樣本之中，利用辨識的方式來處理這樣的誤差，就可以得到可以接受的識別率。

圖 2-2-1 漢字書寫起點示意圖

日文的漢字的書寫方向與中文相同，利用橫筆劃與豎筆劃相互垂直的特性，以及字本身的方向與文字行的方向相互垂直的特性，［11］

在決定文字行的方向之後，將 X 軸移轉至文字行的方向，Y 軸移轉至其垂直方向，然後求取文字筆劃在移轉後的各個方向的投影量。由結果中觀察發現，在文字行的方向以及其垂直方向的投影量會出現兩個比較集中的峰值，前者較長且為文字的水平筆劃的方向，後者較短且為筆劃的垂直方向，由此即可確定文字的方向。圖 2-2-2 推論求取文字行走向方法示意圖，顯示在文字行之中如何計算推論文字行方向，透過持續觀察前一個筆畫終點與下一個筆畫起點的方向與長度，

如果突然轉向近於 180°而且長度遠大於門檻值的話，就可以假設換行事件發生，並且這一行的方向就可以由第一畫起點到其他所有組成筆畫的起點的收斂方向計算出來。其他較複雜的換行偵測方式在此不作贅述。

圖 2-2-2. 推論求取文字行走向的方法示意圖

在文檔中以筆畫線段為基礎的手寫中文字旋轉偵測 (頁 14-18)

第二章、 相關領域及研究

2.2 線上手寫識別系統

2.2 線上手寫識別系統

第二章、相關領域及研究