第三章 視覺元素特徵擷取
4.2 書法作品切字前處理
由(c)可看出唯有這兩位受測者的標準分數(Standard score)超過 1,初步推測這兩 位為極端值。此外,𝐷𝑖𝑗和𝐷𝑖𝑗′的相差值代表受測者意見兩極的平均題數,而 15
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
域框上邊界外框(bounding box),再將被完全包住的框與包住它的框融合,如此 一來可讓「點」筆畫或是小部件找到自己應屬的文字,如圖 4.3 所示,我們稱之 為相連通區域切割法。
圖 4.3 以三個字圖示被完全包含的框之融合方式。
在切字的過程中,我們將使用格線與上述的邊界外框等資訊交叉對照。在 3.1.4 節中曾提及楷書是「規矩方正」的字體,即使是表現不佳的作品,大部分 的字仍遵循這個原則,因此在整個切字的過程中,依循「文字的長與寬比例接近 1:1」作為判斷是否切對文字的標準,其中接近 1:1 指寬高比例介於 0.7 至 1.3 的 區間。
圖 4.4 書法作品切字流程圖。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
首先,無論哪個作品,我們以格線切割法作為切字的第一步,若切出的格子 寬高比例接近 1:1,則認定每格內皆有一個字,如圖 4.5(a);若比例並非 1:1,則 將每個格子獨立出來,作為子任務個別執行格線切割法,直到整幅作品的每個格 子的大小相近,且比例接近 1:1 為止,如圖 4.5(b)所示。
(a) (b)aaaa
圖 4.5 使用格線切割法之切字流程。(a)作品所切出的格子寬高比例接近 1:1,
因此認定每格內皆有一個字,而(b)的格子比例並非接近 1:1,因此每格各自再度 進行格線切割法,直到整體作品的格子大小相近且寬高比接近 1:1 為止。
然而,有些作品無論怎麼以格線切都無法達成接近比例 1:1 的標準,如圖 4.6(a),此時需要搭配邊界外框來完成切字作業。圖 4.6(b)為邊界外框示意圖,可 以發現到被孤立的部分大多為「點」的筆畫或是部首,而此時需要區分哪些邊界 外框是「字」、哪些是待合併的部分。首先計算所有邊界外框的面積,並且等分 成兩部分──面積較大者與面積較小者,其中面積較小者全部為等待合併的元件,
圖 4.6(c)所示;而面積較大的框之中,再挑出未和其他框交疊且寬高比例接近 1:1
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
(a) (b) (c) (d) (e)
圖 4.6 無法單以格線切割法切出所有文字的作品範例。(a)使用格線切割法結果 (b)相連通區域切割法示意圖 (c)整幅作品中邊界外框面積較小者,其中全為等待 合併的元件 (d)從邊界外框面積較大者之中,挑出未和其他框交疊且寬高比例接 近 1:1 者 (e)依序經過層層融合後成果。
在整幅作品之中,所有邊界外框面積較小者(如 4.6(c)的紅框部分)需要找尋 最適合的元件合併,為了簡化找尋最適歸屬的條件,我們先將較把握為「字」的 部分列入候補字,若經過一連串的合併後有落單的框,再找尋候補字之中最合適 者合併。
在合併元件的過程中,首先一一檢查元件自身面積是否與其他邊界外框交疊 50%以上,若有則合併成新邊界外框。在此階段,若新外框的面積與候補字相近 且寬與高比例接近 1:1 的標準,則將該外框視為候補字。
在完成融合兩兩交疊 50%以上框程序後,接著依照中文字的特性融合元件。
我們推測若邊界外框是寬大於高的矩形,則必定需要與同為寬大於高的矩形合併,
且相對位置在其上或下;反之若為高大於寬的矩形,則需要與同為高大於寬的矩 形合併,且相對位置在其左或右。因此在此階段,我們將檢查剩餘的元件,判斷
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
其周圍是否有適合合併的元件,同時判斷是否符合列入候補字的標準。
在此階段,面積過小的元件不予合併,由於如此元件極可能為「點」筆畫,
因此待以上流程完成後,再將小元件試著與鄰近的大元件(候補字)合併,找出合 併後最符合文字標準者,將之列入候補字。此動作一直持續到落單的元件皆找到 歸屬則完成切字作業,而所有的候補字成為了正確的字。
大部分研究所使用的切字方法以設定固定字寬、字高來找尋文字,然而我們 所蒐集到的樣本雖然皆為楷書作品,但風格差異大且為作者的自由創作之作,因 此以一般的方法難以切出所有文字。而我們提出的 rule-based 切字方法所分離出 的文字並非完美,平均切字成功率為 97%,若作品內文字太過擁擠,則在合併元 件過程中容易判斷錯誤。在下一小節將實際測試所有美感特徵的效果,由實驗結 果將可知道即使判斷錯誤,對辨識結果影響並非太大。