• 沒有找到結果。

第三章 視覺元素特徵擷取

3.1 整體作品

3.1.1 排版工整度

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

3.1 整體作品

大多數的書法作品是成行的,只要兩字以上便可稱作爲行,然而一行、兩行、

甚至三行以上的長篇作品都有。如此作品的結構空間必須審慎考量,已不只有單 字空間的架構須考慮,字與字之間的關係,以及行與行的之間的關係同等重要。

在此小節會以下面幾點作分析:排版工整度、字距掌握度、文字偏移程度、文字 書寫大小穩定度、筆畫風格一致度和筆畫平滑程度。

3.1.1 排版工整度

真正的書法是寫在無格線、空白的宣紙上的,因此對於還不習慣書法空間感 的人來說,會借用摺紙後的摺痕作為提示線,以免亂了章法。為了判斷一幅書法 作品是否工整,我們參考摺線的作法,試著將書法作品套上最合適、等距的格線,

我們稱此方法為「格線切割法」。我們藉由分析格線的切割狀況,判斷作品的工 整程度,倘若找出來的格線無法分隔出所有的文字,或是找不出任何格線,代表 排版不甚理想。

圖 3.1 格線示意圖

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

我們可將書法作品視為白底黑字的二值化影像,若談論到空間結構,比起黑 色文字往往更在意布白的部分,也就是行與行、列與列之間的空白區域。首先,

我們統計所有直行與縱行的黑色像素數量,如圖 3.2 所示,其中投影圖的山谷處 為布白,也就是分隔出行與列的地方,將是我們畫格線的所在。

圖 3.2 書法作品投影圖

我們所提出的方法不僅可用於找分隔列的格線,亦能用來分隔行的格線,在 此以找分隔列的格線來說明方法。首先統計完所有橫列的黑色像素數量後,抽出 所有符合判斷空白列條件的橫列編號,組成集合 𝑆 :

𝑆 = ⋃ 𝑖

𝑖 𝑠.𝑡. 𝐵𝑖<𝑇

(式 3-1)

其中 𝐵𝑖 為作品影像第 𝑖 個橫列的黑色像素總數,只要 𝐵𝑖 小於門檻值 𝑇 ,皆 視第 𝑖 個橫排為空白列,而 𝑆 為所有 𝐵𝑖 小於 𝑇 的編號 𝑖 之集合。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

𝐺 = {𝑔1, 𝑔2, … , 𝑔𝑚} = { 𝑆𝑡𝑎𝑟𝑡 + 𝑑 (𝑗 − 1) | 𝑔𝑗 ≤ 𝐼𝑚𝑎𝑔𝑒𝑆𝑖𝑧𝑒}

𝑗 = 1,2, … , 𝑚 (式 3-2)

其中 𝑔𝑗 為第 𝑗 個格線位址,共有 𝑚 個格線, 𝑆𝑡𝑎𝑟𝑡 為起始格線編號,𝑑 為 格線間的距離,𝐼𝑚𝑎𝑔𝑒𝑆𝑖𝑧𝑒 為作品影像的高度,格線示意圖如圖 3.3。

圖 3.3 找分隔「列」的格線示意圖

我們按照式子(3-1)與(3-2)分別找出集合 𝑆 與集合 𝐺 ,若集合 𝐺 為集合 𝑆 的子集(𝐺 ⊂ 𝑆),則集合 𝐺 就是我們要找的格線。然而符合 𝐺 ⊂ 𝑆 條件的集合

G 可能不只有一個,因此我們定義「切割出的區塊最多者」

,也就是格線數量最

多、格線距離最近的組合為「最佳格線」。

為了找到「最佳格線」,可能需要測試各種大小的 𝑑 才會達成目標,然而如 何快速找到最佳格線,亦為處理解析度大之書法作品的課題。若 𝑑 的值從大漸 漸往小的方向測試的話,需要花費的時間複雜度為 O(ImageSize3),因為不到最 後無法確定目前為止找到的格線是否符合最佳格線的標準,因此不如讓 𝑑 的值

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

由小到大找起,只要一找到符合標準的,就可判定 𝑑 為最佳格線的間距。

若想再加快執行速度,甚至可事先過濾絕對不可能是最佳間距的值。由於集 合 𝐺 為集合 𝑆 的子集,因此格線數量必小於等於空白列數,如此一來就可以 利用此附加條件設定尋找最佳格線的新起點,讓解析度大的影像也能有效運算。

(a) (b) (c) (d)

圖 3.4 使用格線切割法判斷排版工整度的實作結果。(a)排版非常工整的書法作品 (b)行排版佳 (c)列的排版雖然不完美,但整體作品還算整齊 (d)行與列的排版都 不甚理想,整體作品有些許凌亂。

圖 3.4 呈現的是整幅書法作品利用格線切割法找尋格線的結果,其中(a)的排 版是最理想的狀況,其行與列格線皆精準地縱橫在字與字之間。(b)和(c)找格線 的狀況雖然沒有(a)完美,但整體看起來不會令人感到不舒服,而(d)的排版就稍 嫌凌亂了。由此不難發現如(a)一般完美切割的作品,其格內僅包含一個文字;反 之諸如(b)、(c)與(d)的作品,則由兩個以上文字分享一個格子的空間。為了評估 書法作品的排版好壞,定義僅含一個字的格子為「理想格子」,非理想格子的部

相關文件