• 沒有找到結果。

線上手寫識別系統

第二章、 相關領域及研究

2.2 線上手寫識別系統

(a) (b)

(c)

圖 2-1-1(a)(b)(c).以 塗 抹 方 法 求 取 傾 斜 角 度 示 意 圖

2.2 線上手寫識別系統

線 上 手 寫 識 別 系 統 (Online Handwriting Character Recognition,OLHCR)與光學識別系統在同一個時期發展,早期的手 寫系統使用的是與 OCR 一樣的做法,也就是說 OCR 是針對很多個字 的影像,而 OLHCR 則是針對少量文字的影像。但是在 OCR 容易解決的 問題,到 OLHCR 變得複雜起來,因為人寫的字無法如同機器印刷一樣 的精確,即使是同一個人連續兩次寫的同一個字,也可能存在著差 異;個人的書寫習慣的不同,則造成同一個字由不同的人寫出的時候 可能會有很大的不同,例如字體的間距、每個元件(Radical)的比例,

等等的差異性就如同 OCR 所遭遇到的不同字體的問題。OCR 可以藉著 訓練不同的字體的數據庫(database)來解決字體的差異問題,畢竟常 用的字體的數據是已經知道的資訊,不會讓 database 無限制增長下

5

去。但是 OLHCR 若是要針對每個人的書寫習慣來建立專屬的數據庫, 平均數轉換成為 probability density functions(PDFs),除了可以 避免之前完全使用結構性描述的時候需要的人工編程來記錄這些

斜字元的時候其辨識穩定性也比較高,但是對於字元的傾斜比較嚴重 以及旋轉的情況還是無法獲得有效的處理,吸收太多的變異的話甚至 可能會產生排拒正確輸入的情況。

對於這種傾斜嚴重以及旋轉的情況,在前處理的時候先行根據字 本身[14]、短語(word)[13][15]、書寫筆劃以及文字行[11]的幾何 特性以及書寫習慣進行校正,以期得到正確的識別結果,或者減少核 心需要關注的訓練樣本的數量。漢字的書寫習慣一般是由上至下,

由左至右,根據統計[14],大部分的中文字來說,起點都是在左上 角,所以對於任何輸入的軌跡,第一個步驟就是將整個字旋轉,使 得它的第一筆劃的起點在左上角,如圖 2-2-1 漢字書寫起點示意圖 所示。右側黑色字體表示使用者書寫的樣子,左側紅色字體表示程式 校正之後的結果,大的圓點表示第一畫的起筆位置。

這個假設相當的粗略,很多漢字的第一畫的起筆位置並不在左上 角,實驗結果顯示這個假設在某些角度的時候特別有效,有高達九成 的校正成果,當然另外一些角度則與不校正的結果是一樣的,平均可 以有 52% 的改善,因此,必須進行第二個步驟以提升整體表現。再 次觀察旋轉後的資料並且比較與統計那些無法被改善的字的真正 的角度與校正的角度,發現它們即使是被校正錯誤,也會落在固定的 幾個角度,0°表示是正確被校正的樣本,±45°表示這些樣本校正後的 誤差角度,既然樣本的數量已經獲得控制,那麼就把這些樣本也納入 識別核心的訓練樣本之中,利用辨識的方式來處理這樣的誤差,就可 以得到可以接受的識別率。

7

圖 2-2-1 漢 字 書 寫 起 點 示 意 圖

日文的漢字的書寫方向與中文相同,利用橫筆劃與豎筆劃相互垂 直的特性,以及字本身的方向與文字行的方向相互垂直的特性,[11]

在決定文字行的方向之後,將 X 軸移轉至文字行的方向,Y 軸移轉至 其垂直方向,然後求取文字筆劃在移轉後的各個方向的投影量。由結 果中觀察發現,在文字行的方向以及其垂直方向的投影量會出現兩個 比較集中的峰值,前者較長且為文字的水平筆劃的方向,後者較短且 為筆劃的垂直方向,由此即可確定文字的方向。圖 2-2-2 推論求取 文字行走向方法示意圖,顯示在文字行之中如何計算推論文字行方 向,透過持續觀察前一個筆畫終點與下一個筆畫起點的方向與長度,

如果突然轉向近於 180°而且長度遠大於門檻值的話,就可以假設換 行事件發生,並且這一行的方向就可以由第一畫起點到其他所有組成 筆畫的起點的收斂方向計算出來。其他較複雜的換行偵測方式在此不 作贅述。

圖 2-2-2. 推 論 求 取 文 字 行 走 向 的 方 法 示 意 圖

8

相關文件