• 沒有找到結果。

第三章 研究方法

第一節 前處理

3.1.4 反白區域偵測

名片設計中有時會有以反白字呈現的區域,無法僅以 3.1.3 提取相連元件的

方法判斷,本段利用文字行包含於矩形區域內的特性,將 3.1.3 抽取出的相連元

件做是否為反白字的偵測。

每個相連元件(connected component)以 2-nearest neighbor 方法和最近的

兩個相連元件串接,在串接相連元件之前,需先找出一個適用於整體文字區域

相連的角度值θglobal。本研究以 Epshtein[24]所提出的方法尋找 θglobal值,詳細方

法將於 3.2.1 說明。其方法主要概念為利用文字行間空白處做直線偵測。利用所

有已找出的連通元件,如圖 14(a),做 dilation 操作,此時連通元件以外的 dilation

部份即可能是文字行之間的空白處,如圖 14(b),對空白處作 Hough transform,

找出最可能的文字排列角度,設為θglobal

(a)連通元件偵測影像 (b) dilation 操作後的空白處

圖 14、以 dilation 操作找出文字間空白

Epshtein 方法的較不受同一行內字體大小變化影響,但僅能偵測出單一文 字連接角度,無法偵測兩種以上文字連接角度,如直橫混排,本階段僅需要連

接附近文字得到夠大之 text-line bounding box 區域做反白偵測,因此直接使用

Epshtein 之方法找出單一角度值 θglobal便足夠用於串接相連元件。

限制相連元件串接的角度容許範圍在 θglobal正、負 30 度以內,以搜尋

2-nearest neighbor 方法完成串接。在所有元件串接結束後,計算串接在一起的 相連元件之包覆矩形範圍(bounding box), 針對 bounding box 以下列流程作

反白字偵測。

1. 將色彩轉灰階影像使用 Otsu 於 bounding box 區域作二值化,如圖 15。

圖 15、Text-line bounding box 範圍做 Otsu 二值化之範例

2. 計算 text-line bounding box(如圖 16(a))內 Otsu 影像灰階平均值 Gavg1, 此值相當於 Otsu 影像之白色所佔百分比。由於背景 pixel 通常比前景多,

基於實驗結果,將 Gavg1>0.6 區域認為是白底黑字區域。

3. Gavg1不大於 0.6 的情況,需要做第二階段判斷,因為手機影像曝光過 度的情況不多見,但光照不足的情況卻不少,白色所佔百分比不大於 60%

可能是光照不足,也可能是文字筆劃排列緊密造成。

4. 第二階段判斷需要使用 bounding box 內部份區域,以 bounding box 最 外界限往內取寬度為 2 pixel 的矩形框(見圖 16(b)),計算矩形框內 Otsu 影

像(僅計算紅色部分)灰階平均值 Gavg2

5. 基於實驗結果,若為 Gavg2值大於 0.5,則此區為白底黑字區域,若 Gavg2 值小於等於 0.5,則此區為白底黑字區域。

(a) 虛線內部區域為 bounding box 範圍

(b)紅色線狀區域為 bounding box 內框範圍 圖 16、Bounding box 與 bounding box 內框示意圖

最後依照偵測結果,分別將二值化影像連通圖和反向影像二值化連通圖中

屬於文字的部分留下,見圖 17。

圖 17、反白字偵測結果示意圖 原始影像

白底黑字區域

黑底白字(反白字)區域

文字連通圖

相關文件