可攜式多媒體助理之線上手寫辨識處理器研製(II)

(1)

可攜式多媒體助理之線上手寫辨識處理器研製(II)

On-line Hand-Writing Recognition System of a Portable

Multimedia Assistant(II)

執行單位：台灣大學電機工程研究所

計劃編號：NSC-872215E002-029

主持人：龐台銘教授

摘要為了研製一高效能、低功率的即時手寫辨識器所需之演算法及特殊硬體架構與晶片。硬體晶片之主要功能是處理手寫中英文、數字及特殊命令符號等之即時輸入與辨識中最耗時之比對演算，以減少 RISC CPU 之計算負擔，本年度我們完成了整個硬體架構的設計與模擬。 Abstr act

One high-performance, low-power and real-time “On-line Handwritten Character Recognizer” will be proposed in this project. This project involves the character recognition algorithm and special hardware architecture. The main function of the hardware chip is to handle handwritten English, numbers, and special symbols with real-time input and recognize. Because the matching is the most time-consuming, we use the hardware to reduce the load of RISC CPU. This year, we complete the hardware design and simulation. 一、計劃緣由與目的 “ 線上手寫辨識 ” 是未來的 “筆式電腦”如“可攜式多媒體助理”之主要輸入方式。雖然目前“線上手寫辨識”研究已相當成熟，然而現有的研究及產品，大多是在功能強大而無省電顧慮的“桌上型”個人電腦上發展。至於現有可攜式產品如 “個人數位助理”雖也具有“線上手寫辨識”功能，但因成本考慮，都是由其內之微處理理器純以軟體處理。由於目前可攜式系統內之微處理器限於省電要求而效能較低，其辨認能力、速度與辨認率，對簡單的應用，在加以某些書寫限制下，雖已達可接受之程度，但對未來高速度、多功能的“可攜式多媒體助理”的效能需求而言，則仍有極大的差距。而且，以一個適合一般應用之通用微處理器執行一特殊應用如“線上手寫辨識”，雖然具有低成本與高靈活度之優點，卻因未以最直接有效的系統與硬體結構處理而“事倍功半”－不符合“低功率”的設計準則：要以最有的方式及最少的電路活動量，在最短的時間內達到相同或更好的結果。本計劃的目標是，在三年內根據以往之經驗與 “ 低功率 ” 設計考慮，發展一套適用於“低功率可攜式多媒體助理”之“線上手寫辨識處理器”。研究其硬體架構、電路、VLSI 晶片、及相關演算法。所擬研製處理器之主要功能，是辨認線上手寫輸入之中英文字、注音符號、及特殊字符等，處理線上手寫輸入與辨識過程中重覆最多、最耗時之演算，包括筆輸入、切割、前處理、特徵抽取、比對分類、及文辭後處理等，以減輕主處理器之計算負擔。研究重點是如何在軟體、速度、耗電量、與晶片大小四

(2)

者之間取捨，做一適合用於“低功率可攜式多媒體助理 ” 之最佳化設計。二、研究方法及成果 (1)演算法回顧上個年度我們已經完成整個演算法，在此為了報告的完整性需要再回顧一下。我們使用的演算法為搜尋樹中的“先深後廣”搜尋法。在搜尋的過程中對搜尋樹中的每一個節點，要去比對目前節點所代表的手寫字筆劃和對應到的資料庫筆劃是否相似，且目前節點和上兩個節點所代表的筆劃的關係也要與資料庫中所對應到的關係做比對，以決定在搜尋樹中的搜尋方向。當對一個資料庫中的字比對完成後，再依所得到的比對分數做排序，選出最相似的字。 (2)架構簡介因為在搜尋的過程中會有往樹根(root)走的情形，所以要將之前比對過的每一個節點的結果記錄下來。因此將會用到許多暫存器，但是為了兼顧省電的考量，我們在兩個層次上做了特殊的設計： 1.架構層次：盡量少用耗電量大的位移暫存器(shift register)，而依實際的需求以先進後出(first in last out) 暫存器代替。 2.電路層次：因為使用到很多暫存器，為了減少不必要的寫入動作，我們使用時脈遮斷(clock gating)的技術，以達到省電的要求。整個架構的方塊圖如下： (3)手寫字儲存單元在開始執行搜尋樹的搜尋前，要先輸入手寫字的資料到這個單元的暫存器內，以供搜尋時使用。 (4)模版字儲存單元這個單元內暫存了正在和手寫字進行比對的模版字的筆畫資料。為了縮短辨識的時間，這個單元並不像手寫字儲存單元一樣，在開始搜尋前就輸入目前要比對的模版字的所有資料暫存著。因為並不是每個模版字都會比對到所有的筆畫，很多時候比對幾個筆畫後，就可以認定這個模版字和手寫字比對失敗，所以不需要浪費時間在搜尋前就存入所有的模版字資料。此外當搜尋過程中發生往樹根(root)走的情況時我們依舊要將目前對應到的模版字的筆畫資料存下來，留待搜尋樹再走到相同深度時比對之用。這樣就可大量減少對唯讀記憶體的讀取動作，以降低功率的消耗。下圖為這個單元的方塊圖，因為需要三個輸出埠(output port)，所以我們把前三組暫存器構成位移暫存器手寫字儲存單元模版字儲存單元已比對筆劃儲存單元所有節點比對結果儲存單元排序單元最長搜尋時間儲存單元欲比對筆劃選擇單元控制單元缺少筆劃計算單元比對單元計算總分數單元選擇器 INPUT VALUE

Input Stroke type register

Input Stroke relation table register

32

7 CLEAR INPUT

Input Stroke type

Input Relatin Row Selected input Stroke no. 解碼器 oe Input Stroke relation 多工器計數器計數器解碼器 we we we we we we we 解碼器 oe oe

(3)

(shift register)，以避免堆疊需要三個讀取埠 (read port) 增加電路的複雜度。 (5)已比對筆畫儲存單元因為在辨識流程的前處理部分中已經將手寫字的筆畫做過排序，所以在進行搜尋樹搜尋時，一個模版字筆畫可能對應到的手寫字筆畫範圍就可以縮小，以縮短搜尋時間。這個單元就是用來找出目前模版字筆畫可能對應到的手寫字筆畫的範圍，並儲存起來；如果範圍內的筆畫經過(7) 欲比對筆畫選擇單元選擇到則標記起來，若搜尋樹再走到相同深度時就不會重複選擇了。下圖為這個單元的方塊圖。 (6)所有節點比對結果儲存單元這個單元內儲存搜尋樹中已經比較過的每個節點的結果，以供往樹根(root)走時可以回復所有的狀態。下圖是這個單元的方塊圖，圖中將三組暫存器組成位移暫存器的原因與(4) 模版字儲存單元的原因相同。 (7)欲比對筆劃選擇單元這個單元依據已比對筆畫單元中儲存的可能對應範圍去選擇下一個要比對的手寫字筆畫。 (8)比對單元比對目前的模版字筆畫及選擇到的手寫字筆畫是否對應成功，並計算這兩個筆畫的對應分數。 (9)缺少筆劃計算單元為了在使用者漏寫筆畫時仍然能辨識出來，這個單元會計算漏寫的筆畫的重要性給予不同程度的分數。 (10)計算總分數單元當整個搜尋完成後計算(8)比對單元和(9)缺少筆劃計算單元產生的分數的合，作為手寫字對這個模版字的比對分數。 (11)控制單元這個單元的核心為一個有限狀態機(finite state machine)，並由此產生整個晶片的控制信號。 (12)最長搜尋時間儲存單元讀入一筆模版字筆畫選擇欲對應手寫字筆畫有無筆畫可供選擇回到上一個節點執行比對比對是否成功無有否是堆疊對應到的手寫字號碼比對的分數對應的狀態輸出堆疊上一筆對應到的手寫字筆畫可選擇的手寫字筆畫範圍在此節點上比對的次數輸出堆疊 mux 輸出模版字筆畫資料對應到的手寫字筆畫號碼

(4)

當手寫字的筆畫很多時其對應的搜尋樹會很大，而搜尋時間會很長，但通常並不需要搜尋完整個搜尋樹。在發展演算法時我們做過分析，當最大辨識時間在四千個時脈週期以上時，對辨識率的提升很有限，因此我們在這個單元中儲存最長搜尋時間，當搜尋時間到達此最大值時就強制宣告搜尋結束，以之前得到的最佳比對分數作為這個模版字的比對分數。 (13)排序單元當一個模版字的搜尋完成後，依據所得的分數在這個單元內做氣泡式排序(bubble sort)，以選出分數最低的十個模版字。三、結論與討論這個年度我們承接上個年度在軟體上發展的成果，以硬體實現了一個低功率的線上中文手寫辨識晶片，並達成以下幾點目標： (1)節省記憶體要將線上中文手寫辨識給硬體化，我們必須注意到硬體和軟體有著基本上的不同。首先我們必須儘量節省記憶體的使用，我們把資料庫的儲存儘量用到最少，只儲存筆劃和筆劃間的關係，而把筆劃順序這個重要的資訊藏在之中，而且用這種資料結構，可以輕易的把一個字給分成數個字根的形態來儲存。 (2)簡化辨識單元因為硬體的動作比較規則，所以在辨識時，我們必須儘量讓程式規則，這樣在硬體化時才不會太過於複雜。 (3)加速辨識速度　　在處理待辨字時，我們讓前處理的部分只作一次，亦即這次處理之後，即可以用在所有字的辨識上，不必因為特定字的辨識而作特別的處理，可以減輕軟體的負擔，並且儘量讓大量的運算在硬體方面處理。 (4)資料庫的建立容易　　在建立資庫時，只需有一套輸入字，利用一樣的方法，抽出我們所要的特徵，再加以儲存即可，另外，對於由字根所組成的字，我們也可以很輕易的由字根來產生來這個字的真正內容。四、論文與技術報告

1. Tai-Ming Parng, Wen-Chung Kao, “Integrating Statistical and Structural Approaches to Handprinted Chinese Character Recognition.” 1996

2.Tai-Ming Parng, Ho-shin Yang, “A Font-Adaptive Approach to Printed Chinese Character Recognition.” 1996

3.Chi-Wei Lee, Zen Chen, “Handwritten Chinese Character Recognition Based on Automatically Generated Stroke Structural Sequence Codes.” 1995

4.Kuo-Sen Chou, Kuo-Chin Fan, Tzu-I J.Fan, Chang-Keng Lin, “Recognition of On-Line Chinese Character by Knowledge Model Based Approach.” Proceedings of 1993 Third National Workshop on Character Recognition, R.O.C.

5.Tai-Ming Parng, Chung-Yi Chen,”A Depth-First-Search Processor for On-Line Chinese Character Recognition” The 9

th

VLSI Design/CAD Symposium,pp. 207-210,Aug.1998. 6.Chung-Yi Chen, Tai-Ming Parng,”A

Depth-First-Search Processor On-Line Chinese Character Recognition” National Taiwan University,1998. 暫存器暫存器暫存器 ... 模版字號碼比對分數比對成功旗標 < < 寫入寫入

可攜式多媒體助理之線上手寫辨識處理器研製(II)