整合結果 - 雲端筆記之混合式文字切割與辨識

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

5. 整合結果

本研究將第三章及第四章的成果整合，並加入文字區域切割的方法，以取得掃描文件中的文字資訊，此切割方法是利用清除線段資訊時所使用的輪廓演算法[24]，以取得文字的外框，不過在套用此方法前會進行一個閾值過濾，因為背景或殘餘的雜訊部分也是具有些許能量的，透過適當的閾值能產生更好的切割結果，如圖 5-1 左為保留圖 3-11 能量大於 50 後的結果，而圖 5-1 右則為大於 100 的結果。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 5-1，套用閾值過濾圖 3-11 雜訊的結果，圖左的閾值為 50，圖右使用 100，圖中白色點為具有文字資訊的區域，可看到圖右有部分手寫資訊被過濾

在進行初步的過濾後，將搭配前述的方法找出各文字的輪廓，圖 5-2 為利用圖 5-1 左圖取得文字方塊的結果，雖然本研究所使用的過濾方法會將部分文字資訊消除，但整理而言大部分的文字是有被切割出來的。而有的文字會連在一起被切割是由於本研究所提出的文字結構濾波在套用後會將筆畫寬度變寬，間接使得間隔較小的文字容易被切割在一起，而由於本研究所主要處理的筆記文件中，相同字體的文字大部分是排在一起的，因此筆畫寬度變寬並不會造成過多的影響，但仍舊有部分資訊受到影響，如圖 5-2 的橘色框的部分就將上方的印刷體及下方的手寫體合併成一個結果。

有了切割結果後將針對這些方塊取得各自的特徵值，然而本研究在訓練模組時是

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

以詞為單位蒐集資料的，但從結果圖可看到大部分的方塊都是以字為單位切割出的，因此在取得了這些方塊後必須將較靠近的方塊合併在一起，並將方塊過小的雜訊消除，最終合併結果如圖 5-3 所示，可看到排列較靠近的文字是有被合併的，且方塊過小的雜訊也不存在於圖上。接著對這些切割後的區塊分別使用第四章測試後選擇的兩種方法進字體分類，圖 5-4 及圖 5-6(a)為使用文字結構濾波+等比例降維後的結果，圖 5-5 及圖 5-6(b)為使用 Sobel 核心 1+角度差 15 的測試結果，表格 5-1 為套用到其他範例後的統計結果，由範例圖及統計結果可看到使用文字結構濾波進行辨識是較為準確的，猜測是由於文字結構濾波依據筆畫結構而給予適當的能量回饋，使得結果較為優異。

表格 5-1，使用文字結構濾波及 Sobel 進行區塊切割的字體辨識統計結果

方法印刷體正確率手寫體正確率總正確率

文字結構濾波 82% 69% 76%

Sobel 核心 1 78% 45% 62%

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 5-2，利用文字輪廓進行文字切割的結果

圖 5-3，經由雜訊過濾及文字合併後的結果

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 5-4，使用文字結構濾波+等比例降維的結果，紫色方塊表示該區塊內的資訊為印刷體，黃色方塊為手寫體

圖 5-5，使用 Sobel 核心 1+角度差距 15 的結果

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 5-6，套用本研究提出的字體分類方法於不同影像後的結果，圖 a 為使用文字結構濾波的辨識結果，圖 b 為使用 Sobel 核心 1 的辨識結果

‧

在文檔中雲端筆記之混合式文字切割與辨識 - 政大學術集成 (頁 66-72)

整合結果

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

5. 整合結果

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學