字型分類

2. 相關研究

2.2. 字型分類

如 Support Vector Machine (SVM)[12]、AdaBoost、Neural Network、Locality Sensitive

‧

Hashing (LSH)[13]等等，與前種方法不同的是，機器學習技術必須先準備好欲分類的類別資料，使得這些演算法能有資訊學習以產生模組進行辨識、分類，而在印刷體、手寫英文字母的印刷體具有類似的高度，如 aceon、fhHG、pg 等等即為具有類似高度的字幕，

因此投影後的直方圖在特定位置會有較多的資訊，而手寫體無法控制對齊的基準線，投影後的直方圖就會有不同的分布情形，圖 2-7(c)(f)即可明顯看出兩者的差別。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 2-7，使用英文印刷體特性進行字體分類的範例

另一種方法則是利用連接元件的資訊，[16]中使用六種資訊搭配 Fisher's linear discriminant[17]區分地址是手寫體或印刷體，此六種資訊分別為連接元件的寬度標準差、高度標準差、平均密度、寬高比、distinct different heights、distinct different widths)，

此方法在辨識 800 組地址時有 95%的正確率。

2.2.2. 使用機器學習分類

此種分類法會先定義好要讓機器學習法使用的特徵值，而每種文獻會定義各自覺得有意義的特徵以達到較優異的結果，如表格 2-1 即為[18]用來學習模組的特徵值，從此表格可發現，使用機器學習法進行分類時，不一定會只使用一種特徵描述子作為最後的特徵值結果，可能會搭配多種的描述子做為最後結果，另外在產生了特徵值後也可能會再進行降維的動作，保留較重要的資訊並減少產生模組所需的時間。

‧

Feature set Feature description # of features # of features selected

Structural

Region size,

connected components

18 9

Gabor filter Stroke orientation 16 4

Run-length histogram Stroke length 20 5

Crossing count histogram Stroke complexity 10 6

Bi-level co-occurrence Texture 16 2

2 x 2 gram Texture 60 5

Total 140 31

除了將多種描述子搭配作為特徵值的方法外，也有使用單一描述子做為特徵值的方法，如[19, 20]使用 chain code[21]取得文字邊框數列後再搭配不同的方法描述此邊框作為特徵值，chain code 是一個八方向的邊緣描述方法，將某一點選為起點並繞邊緣一圈，利用事先定義好的八個數字代表不同方向並取得最終數列，[19]使用 chain code 搭配 Fourier Descriptor 作為描述文字的特徵值，表格 2-2 為[20]所整理利用機器學習法進行字體分類的正確率，這些方法所欲分類的語言都是英文，可看到準確率較高的方法都會將方向作為參考條件之一，與前一小節的文字濾波情形類似，因此可以得知方向資訊在字體分類有一定的必須性。

‧

Method Proposed by

Data set size Feature Used Classifier

Used Accuracy

Zheng, et al.

[18] 4549 text blocks

Structural Features, Run length histogram, Crossing

count histogram, Gabor filter, etc

SVM 96.00%

Fisher 95.50%

K-NN 94.20%

Guo and Ma [22]

187 handwritten

words Projection profile etc HMM 92.86%

Kandan, et al.

[23]

1678 handwritten elements in 150

images

Moment feature

SVM 93.22%

NN 87.85%

Chanda, et al.

[20]

NI type (1615 printed, 1300

handwritten)

Directional features SVM

98.26%

ARI type (2408 printed, 1550

handwritten) word/character

component

96.90%

2.2.3. 小結

從前述的討論可觀察出若想快速分類印刷體及手寫體，則必須利用字體特性，因為不需要事先將模組訓練好才能使用，然而此種分類法有一些基本限制存在，而英文詞

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

彙正好符合這些定義的限制，因此能使用此方法區分印刷體及手寫體，而這些特性是否能套用於本研究所欲分類的中文字體，需測試後才能有明確的答案。另外前述的這些文獻大部分都以英文作為分類語言，而中文字本身的文字結構與英文字又有所不同，相同的取特徵方法不一定適用於中文字上，但印刷體具有工整的特性都是一樣的，因此若要使用機器學習法則可以參考其中的部分概念，如方向等具有鑑別力的資訊，作為特徵值的使用依據。

在文檔中雲端筆記之混合式文字切割與辨識 - 政大學術集成 (頁 30-35)

2. 相關研究

2.2. 字型分類

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

立政治大學

立政治大學