• 沒有找到結果。

2. 相關研究

2.2. 字型分類

如 Support Vector Machine (SVM)[12]、AdaBoost、Neural Network、Locality Sensitive

Hashing (LSH)[13]等等,與前種方法不同的是,機器學習技術必須先準備好欲分類的類 別資料,使得這些演算法能有資訊學習以產生模組進行辨識、分類,而在印刷體、手寫 英文字母的印刷體具有類似的高度,如 aceon、fhHG、pg 等等即為具有類似高度的字幕,

因此投影後的直方圖在特定位置會有較多的資訊,而手寫體無法控制對齊的基準線,投 影後的直方圖就會有不同的分布情形,圖 2-7(c)(f)即可明顯看出兩者的差別。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 2-7,使用英文印刷體特性進行字體分類的範例

另一種方法則是利用連接元件的資訊,[16]中使用六種資訊搭配 Fisher's linear discriminant[17]區分地址是手寫體或印刷體,此六種資訊分別為連接元件的寬度標準 差、高度標準差、平均密度、寬高比、distinct different heights、distinct different widths),

此方法在辨識 800 組地址時有 95%的正確率。

2.2.2. 使用機器學習分類

此種分類法會先定義好要讓機器學習法使用的特徵值,而每種文獻會定義各自覺 得有意義的特徵以達到較優異的結果,如表格 2-1 即為[18]用來學習模組的特徵值,從 此表格可發現,使用機器學習法進行分類時,不一定會只使用一種特徵描述子作為最後 的特徵值結果,可能會搭配多種的描述子做為最後結果,另外在產生了特徵值後也可能 會再進行降維的動作,保留較重要的資訊並減少產生模組所需的時間。

Feature set Feature description # of features # of features selected

Structural

Region size,

connected components

18 9

Gabor filter Stroke orientation 16 4

Run-length histogram Stroke length 20 5

Crossing count histogram Stroke complexity 10 6

Bi-level co-occurrence Texture 16 2

2 x 2 gram Texture 60 5

Total 140 31

除了將多種描述子搭配作為特徵值的方法外,也有使用單一描述子做為特徵值的 方法,如[19, 20]使用 chain code[21]取得文字邊框數列後再搭配不同的方法描述此邊框 作為特徵值,chain code 是一個八方向的邊緣描述方法,將某一點選為起點並繞邊緣一 圈,利用事先定義好的八個數字代表不同方向並取得最終數列,[19]使用 chain code 搭 配 Fourier Descriptor 作為描述文字的特徵值,表格 2-2 為[20]所整理利用機器學習法進 行字體分類的正確率,這些方法所欲分類的語言都是英文,可看到準確率較高的方法都 會將方向作為參考條件之一,與前一小節的文字濾波情形類似,因此可以得知方向資訊 在字體分類有一定的必須性。

Method Proposed by

Data set size Feature Used Classifier

Used Accuracy

Zheng, et al.

[18] 4549 text blocks

Structural Features, Run length histogram, Crossing

count histogram, Gabor filter, etc

SVM 96.00%

Fisher 95.50%

K-NN 94.20%

Guo and Ma [22]

187 handwritten

words Projection profile etc HMM 92.86%

Kandan, et al.

[23]

1678 handwritten elements in 150

images

Moment feature

SVM 93.22%

NN 87.85%

Chanda, et al.

[20]

NI type (1615 printed, 1300

handwritten)

Directional features SVM

98.26%

ARI type (2408 printed, 1550

handwritten) word/character

component

96.90%

2.2.3. 小結

從前述的討論可觀察出若想快速分類印刷體及手寫體,則必須利用字體特性,因 為不需要事先將模組訓練好才能使用,然而此種分類法有一些基本限制存在,而英文詞

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

彙正好符合這些定義的限制,因此能使用此方法區分印刷體及手寫體,而這些特性是否 能套用於本研究所欲分類的中文字體,需測試後才能有明確的答案。另外前述的這些文 獻大部分都以英文作為分類語言,而中文字本身的文字結構與英文字又有所不同,相同 的取特徵方法不一定適用於中文字上,但印刷體具有工整的特性都是一樣的,因此若要 使用機器學習法則可以參考其中的部分概念,如方向等具有鑑別力的資訊,作為特徵值 的使用依據。

相關文件