國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
5. 整合結果
本研究將第三章及第四章的成果整合,並加入文字區域切割的方法,以取得掃描 文件中的文字資訊,此切割方法是利用清除線段資訊時所使用的輪廓演算法[24],以取 得文字的外框,不過在套用此方法前會進行一個閾值過濾,因為背景或殘餘的雜訊部分 也是具有些許能量的,透過適當的閾值能產生更好的切割結果,如圖 5-1 左為保留圖 3-11 能量大於 50 後的結果,而圖 5-1 右則為大於 100 的結果。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 5-1,套用閾值過濾圖 3-11 雜訊的結果,圖左的閾值為 50,圖右使用 100,圖中白 色點為具有文字資訊的區域,可看到圖右有部分手寫資訊被過濾
在進行初步的過濾後,將搭配前述的方法找出各文字的輪廓,圖 5-2 為利用圖 5-1 左圖取得文字方塊的結果,雖然本研究所使用的過濾方法會將部分文字資訊消除,但整 理而言大部分的文字是有被切割出來的。而有的文字會連在一起被切割是由於本研究所 提出的文字結構濾波在套用後會將筆畫寬度變寬,間接使得間隔較小的文字容易被切割 在一起,而由於本研究所主要處理的筆記文件中,相同字體的文字大部分是排在一起 的,因此筆畫寬度變寬並不會造成過多的影響,但仍舊有部分資訊受到影響,如圖 5-2 的橘色框的部分就將上方的印刷體及下方的手寫體合併成一個結果。
有了切割結果後將針對這些方塊取得各自的特徵值,然而本研究在訓練模組時是
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
以詞為單位蒐集資料的,但從結果圖可看到大部分的方塊都是以字為單位切割出的,因 此在取得了這些方塊後必須將較靠近的方塊合併在一起,並將方塊過小的雜訊消除,最 終合併結果如圖 5-3 所示,可看到排列較靠近的文字是有被合併的,且方塊過小的雜訊 也不存在於圖上。接著對這些切割後的區塊分別使用第四章測試後選擇的兩種方法進字 體分類,圖 5-4 及圖 5-6(a)為使用文字結構濾波+等比例降維後的結果,圖 5-5 及圖 5-6(b)為使用 Sobel 核心 1+角度差 15 的測試結果,表格 5-1 為套用到其他範例後的統計 結果,由範例圖及統計結果可看到使用文字結構濾波進行辨識是較為準確的,猜測是由 於文字結構濾波依據筆畫結構而給予適當的能量回饋,使得結果較為優異。
表格 5-1,使用文字結構濾波及 Sobel 進行區塊切割的字體辨識統計結果
方法 印刷體正確率 手寫體正確率 總正確率
文字結構濾波 82% 69% 76%
Sobel 核心 1 78% 45% 62%
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 5-2,利用文字輪廓進行文字切割的結果
圖 5-3,經由雜訊過濾及文字合併後的結果
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 5-4,使用文字結構濾波+等比例降維的結果,紫色方塊表示該區塊內的資訊為印刷 體,黃色方塊為手寫體
圖 5-5,使用 Sobel 核心 1+角度差距 15 的結果
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 5-6,套用本研究提出的字體分類方法於不同影像後的結果,圖 a 為使用文字結構濾 波的辨識結果,圖 b 為使用 Sobel 核心 1 的辨識結果