• 沒有找到結果。

應用動態式自我組織神經網路於骨架擷取之研究

N/A
N/A
Protected

Academic year: 2021

Share "應用動態式自我組織神經網路於骨架擷取之研究"

Copied!
8
0
0

加載中.... (立即查看全文)

全文

(1)應用動態式自我組織神經網路於骨架擷取之研究. Application of Dynamic Self-Organizing Map in Skeleton Extraction 張鴻德. 廖俊傑. 南台科技大學資訊工程系. 南台科技大學資訊工程系. hdchang@mail.stut.edu.tw. m93g0206@webmail.stut.edu.tw often distorts the local shapes of an observed pattern. This is an inherent defect for all thinning algorithms. Therefore, a Dynamic Self -Organizing Map (DSOM) was proposed to extract skeleton precisely. But the process speed of DSOM is too slow. In order to speed up the process speed, the methods of endpoints estimation and segmentation were proposed in this paper. Endpoints estimation process estimates the position of output neurons instead of random decision. The image segmentation process avoids the fault when DSOM used in crossing or loop pattern. In the experimental results, the tools、 alphanumeric and Chinese characters are used as test patterns. The results show that the proposed methods improve 19% of DSOM process speed.. 摘要 骨架擷取技術在許多應用領域中被廣泛 地採用。而過去傳統的細線化(thinning)所產 生的骨架,往往會多出不必要的小分支或在叉 點處產生變形,造成在特徵擷取上的不穩定。 因 此 動 態 式 自 我 組 織 神 經 網 路 (Dynamic self-organizing map,DSOM)被提出以擷取出更 為完整的骨架。但實際應用上卻發現執行的速 度較為緩慢,且其在處理具有叉點(fork)及迴 圈點(loop)的圖形時費時更久。因此,本研究 提出利用端點估測及影像分割的方法來加快 處理速度。端點估測可以使得輸出神經元一開 始便置於圖形的骨架點上,而不會落在圖形的 空白處;影像分割則讓神經元在增減時不需檢 查是否為叉點及迴圈點以節省時間。在實驗部 份則利用工具、數字、英文字母及中文字等圖 樣作為實驗對象。從實驗結果可以發現,比較 僅用 DSOM 以及加上本研究所提的方法,其 骨 架擷取 結果 相同, 但後 者速度 可以 提升 19%。. Keywords:skeleton extraction、alphanumeric recognition、thinning、self-organizing map.. 一、前言 影像的形狀分析不管在圖訊(pattern)的 辨認、形狀的形成、以及電腦視覺等應用裡, 都是最基本所要面臨的問題。在過去的研究 中,也有藉由抽出其骨架而來代表此形狀的分 析方法。而如此的方法能夠將所必要的資料大 量的精緻化,僅藉由骨架就能夠表達出此形 狀。因此在許多的應用領域裡也被廣泛地採 用,如物件模組化、影像辨識、光學字元辨識、 醫療影像的分析以及印刷電路版的檢驗[1]等 應用領域。而傳統的骨架擷取技術[2]往往會 在端點處產生許多不必要的小分支,以及在叉 點處產生變形。而這些情況容易造成特徵擷取. 關鍵詞:骨架擷取、文字辨識、細線化、自我 組織神經網路。. Abstract Skeletal shape extraction technique was widely adopted in many applications such as object modeling 、 character recognition and computer animation. The thinning process always be used in the skeleton extraction, but it 1.

(2) 事先規劃神經元連結的方向,則容易使得骨架 產生變形。因此,本研究利用影像分割的方 法,將影像劃分成若干區域,讓彼此區域相鄰 的神經元連結,以防止骨架變形。. 上的不穩定,進而影響到影像辨識及分類時的 錯誤。因此,如何擷取出一個正確的骨架,已 經是極為重要的課題。 目前一般所使用的骨架化方法為由 T.Y.Zhang及C.Y.Suen所提出的快速式平行細 線化演算法[3]。此方法最重要的特色是其速 度非常快且程式碼易於實作。然而,此種方法 對於雜訊的影響非常敏感。往往由於雜訊的干 擾,使得細化後的圖形產生一些不必要的分 支。且其和其它細化演算法一樣,在叉點處會 產生變形。而當輸入的影像過於稀疏時,此方 法也無法正確擷取出骨架。雖然後續對於此方 法的改良非常多[4][5][6],卻依然無法完全 改善其缺點。 近年來,由於類神經網路技術上的成 長,使得其被應用在各種領域裡。其中,由 T.Kohonen 所 提 出 的 自 我 組 織 映 射 圖 網 路 (Self-organizing map,SOM)[7]被應用於骨架 擷取[8]。其基本流程是學習前先行預估所需 的輸出神經元數目,再將其輸入到SOM網路裡 進行學習。在學習的過程中,這些輸出神經元 會不斷的與輸入圖形的像素點做相似性量測 (即距離比對),再由SOM網路的學習演算法做 更新,直到整個網路達到收斂的條件為止,骨 架即形成。但要如何準確的預估所需輸出神經 元的數目是極為不易的。過多的神經元會造成 網路的過度學習,使得網路的學習速度變得極 為緩慢;而不足的神經元則會使得所形成的骨 架無法完整表達輸入圖形所代表的意義。 基於上述原因,A.Datta及S.K.Parui提出 了一可動態調整輸出神經元的動態式自我組 織神經網路[9][10]。此網路可在學習過程中, 增加或刪減輸出神經元,以使得輸出神經元數 目能達到輸入圖形所需的數量。然而在實際應 用上卻發現此網路執行的速度不夠理想。因 此,本研究針對此問題提出利用端點估測以及 影像分割的方法來做改良。在實驗的部份,本 研究以工具、數字、英文字母及中文字等圖樣 作為實驗對象。從實驗結果可以發現,本研究 提出的方法可以有效的提升動態式自我組織 神經網路的速度。. (一) 前處理 1. 隨機估測 在使用SOM網路進行骨架擷取之前,我 們必需先行估算學習過程中所需輸出神經元 的數目。然而,這是一個非常困難的步驟。這 主要是因為每一張輸入圖形的大小、形狀皆不 同,因此所需的輸出神經元數目自然也就不一 樣。但是到目前為止,尚未有一個方法能完整 且正確的估測出骨架點(輸出神經元)所應在的 位置與數目。這使得應用SOM網路於骨架擷取 上,產生了重大的困難。但由於動態式神經網 路的提出,於是目前對於一般輸出神經元便採 用隨機估測的方式,也就是不管圖形的大小及 形狀,任由系統隨機估計神經元數目及其坐落 的位置。也由於這個原因,使得SOM網路的鄰 域範圍(neighborhood)必須設定得非常大。由[7] 中可以知道,SOM網路不同於其它神經網路最 大的特點,便是它具有鄰域的特性。此特性會 使得位於勝者神經元(圖1中有c符號的圓圈)鄰 域 中的輸 出神 經元往 目前 輸入的 像素 點移 動。勝者神經元能移動的距離最大,而離其愈 遠的輸出神經元能移動的距離就愈小。而鄰域 範圍會隨著學習的次數縮減,直到只剩下勝者 神經元為止,其縮減方法如圖1所示。這主要 是為了使SOM網路能符合人類大腦的特性。但 也正因為這點使得SOM網路的速度較為緩 慢。這是因為鄰域範圍愈大,神經元所需進行 的權重更新(weight adaptation)次數便愈多。因 此如欲加快SOM網路的速度,便要將鄰域範圍 縮小。然而,這在實際情況上有其困難。以圖 2為例,圖中的黑點即為輸入圖形,紅點則為 利用隨機預估所得到的輸出神經元。從圖中可 以發現,所預估的輸出神經元有很多距離像素 點(黑點)非常遠。當使用者所設定的鄰域範圍 太小時,這些點便得不到學習的機會而無法被 拉進像素點以形成骨架。傳統上,SOM網路為 了解決這個問題,便必順將鄰域範圍設定得非 常大。在[7]中便指出,最好的情況是設定整張 輸入圖片皆為鄰域範圍。然而這會使得整個網 路速度變得更慢。因此,在一般使用上,鄰域 範圍的大小便設為整張圖形的一半以上。為了 解決上述的情況,使得SOM網路的執行速度能 加快。因此,本研究提出了以端點來當作輸出 神經元的方法。. 二、系統架構 動態式自我組織神經網路是一可在學習 過程中任意增減輸出神經元的網路。首先在前 處理的部份利用端點估測的方法來偵測輸入 圖形的端點,並將這些端點當作初步的輸出神 經元,接著將其輸入DSOM網路。首先利用傳 統SOM網路的演算法進行學習,待其學習完成 之後,即利用DSOM演算法進行神經元的增 減,直到網路收斂為止。但此時仍是無分支的 骨架,所以需將神經元連結起來。然而,若不 2.

(3) 的端點無法準確估測,且會有一些不是端點的 點被誤判。雖然這並不會對整個系統造成太大 的影響,但這仍是本研究未來所要解決的問 題。. 圖 1 鄰域的縮減方式. 圖3 骨架形成所需的端點. 圖2 利用隨機估測所得的輸出神經元 2. 端點估測. (a) 輸入圖形. 以圖 3 為例,若想以最少的輸出神經元 來形成圖形的骨架,莫過於以此圖形的端點來 代表骨架點。而且利用此種方式可以保證,所 得到的輸出神經元不會落於輸入圖形的像素 點之外。因此,便可以縮小 SOM 網路的鄰域 範圍以增加網路的執行速度。本研究利用一簡 單的方法來估測端點,其流程如下: 1 讀取圖檔並二值化。 2. 由左至右,由上至下掃瞄圖形的像素點 (黑點)。將每列所找到的第一點標記為藍點, 最後一點標記為紅點。 3. 由左至右,由上至下計算步驟 2 中每列 的藍點與紅點之距離 d。if d < ε ,則此兩點 之中點即為端點。 4. 由左至右,由上至下計算步驟 2 中每行 的藍點與紅點之距離 d(歐式距離)。if d < ε , 則此兩點之中點即為端點。 5. 結果。 以上各步驟之結果如圖 4 所示,圖 5 為針 對常用的工具所做的實驗。而流程中的 ε 為一 事先決定的微小正值,此值與輸入圖形的寬度 有關,依據輸入圖形的寬度做動態的調整。由 圖 5 中可以發現,本研究所利用的方法可以估 測出大部份圖形的端點。但對於一些寬度過寬. (b) 由步驟 2 所標記的點. 3.

(4) (c) 由步驟 3、4 所得到的端點. 由圖 6 可以看出,經由 SOM 所學習完後 的骨架仍不完善。因此本研究將利用俱有增減 神經元特性的 DSOM 演算法加以修整。然而 動態式神經網路是將符合條件的舊神經元刪 除,並將新的神經元加入的動作,其動作過程 中是沒有固定方向性的。因此,如不事先規劃 增減神經元的方向,在遇到如叉點、迴圈點等 具有兩個以上方向的特殊圖形時(如 T、X、P 等),就有可能因為無法達到收斂條件,而使 得整個系統進入無窮迴圈。因此,在[9][10] 中便提出了一個偵測叉點及迴圈點的方法。然 而,此種方法在實際應用上卻相當不便且速度 不夠快。因此,本研究利用影像分割的方法 來,來為輸出神經元規劃方向,以利於 DSOM 增減神經元。. (d) 結果 圖 4 端點估測的過程. (三) 影像分割. (二) SOM. 本研究所利用的影像分割是相當簡單的 動作。其方法是依據影像中的每個像素最靠近 那個神經元,則就把該像素歸類為該神經元的 區域。而之所以如此做的主要原因是因為,神 經 元的增 減處 理是以 兩相 鄰的神 經元 間為 主。利用影像分割可以讓我們知道此二神經元 是否相連。且為了方便將影像各處的神經元連 結起來形成完整的骨架。因此,本研究即利用 影像分割的方法來達成此目的,圖7為一簡單 圖形的例子。. 當前處理完成之後,即進入SOM網路。 本研究所使用之SOM網路演算法,完全依據 [7]。其基本流程如下: 1.. 將輸入圖形的像素當成輸入向量,表示. 為 xi = [ x1 , x2 ,K , xn ] ,n 為像素個數。 2. 將前處理所偵測到之端點當成輸出神經 元並初始化其與輸入向量之鏈結值(即距 離),表示為 w j = [ w j1 , w j 2 ,K , w jn ] ,j 為輸出神 經元個數。3. N c (t ) 。 4.. 設定鄰域集合的初始大小. (四) DSOM. 針對時間 t,依序輸入輸入向量 xi ,其中. 在DSOM演算法的流程中,網路的更新 規則與SOM層很相似。但是在學習的過程中, 已存在的輸出神經元可能被刪除,而新的輸出 神經元可能被新增至網路拓樸中。當兩個輸出 神經元間距離過遠時,則在它們之間增加一新 的神經元;反之當距離過近時,則刪除其中一 個神經元。而增加或刪除輸出神經元的條件, 則以(4)、(6)式為基準,(7)式為DSOM層收斂 條件。 增加條件:. t 為一非負的整數。 5.. 計算輸入向量與輸出神經元之距離 d k 。. dk =. n. ∑. i =1. ( xi (t ) − w j (t )) 2. (1). 6. 求取步驟(5)之最小 d k ,並令其為勝者神 經元。 7. 更新勝者神經元即其鄰域的鍵結值。. wj (t + 1) = wj (t ) + α (t )( xi (t ) − wj (t )). (2). Wk (ts) − Wk +1 (ts) > σ1. 其中 α (t ) 為學習係數,初始設為 0.01,之後隨. 新神經元的鏈結值為:. 著遞迴次數 s 遞減,公式如下. α (t ) = 0.01/(1 + s /1000). (4). (Wk (ts) + Wk +1 (ts) ). (3). 2. (5). Wk (ts ) − Wk +1 (ts ) < σ 2. (6). 刪除條件:. N c (t ) 隨著 t 而縮減,其縮減方式如圖 1 所示。 8. 回到步驟 4,直到 α (t ) 或 N c (t ) 其中之 一收斂為止。圖 6 為尖嘴鉗經過 SOM 層學習 完成之後的骨架樣式。. 收斂條件:. σ 1 > Wk (ts) − Wk +1 (ts) > σ 2 ∀ k 4. (7).

(5) (a) 尖嘴鉗. (b) 剪刀 圖 5 針對各種常用工具所做的實驗. (c) 夾子. 圖 7 影像分割完後的結果. 圖 6 SOM 層學習完成後的骨架 其中 Wk 為經 SOM 層學習完後之輸出神經元, ts 為學習遞迴數。 σ 1 與 σ 2 為一事先決定之正 值,且 σ 1 > σ 2 。其設定方法請參考[9][10], DSOM 層之步驟如下所示: 1. 由左至右,由上至下決定輸出神經元之 順序,以最左上之輸出神經元為始,最右下之 輸出神經元為終。如果兩神經元所屬之子影像 區域相鄰者,則進行處理;反之則不處理。 2. 依 (4) 式決定是否需要增加神經元。 3. 所有神經元處理完畢時,進行鏈結值更 新。 4. 依 (7) 式檢查網路是否已達收斂,如收 斂則網路結束。 5. 依 (6) 式決定是否需要刪除神經元。 6. 依 (7) 式檢查網路是否已達收斂,如收 斂則網路結束。 7. 如果尚未達到收斂條件,則回到步驟 1。 8. 依鄰近區域將所有神經元相互連結 9. 結果。 圖 8 為圖 6 經過 DSOM 層學習完後之結果。. 圖 8 經過 DSOM 學習完後之結果 由圖 8 可以看出,經由 DSOM 所學習完 後的骨架已相當完善。這証明了,DSOM 可以 有效的改善 SOM 的缺陷。 (五) 後處理 雖然DSOM可以有效的改善輸出神經元 不足或過多的狀況。然而,在圖8的中間部份 可以發現,神經元之間的連結產生了錯誤。這 主要是因為該點神經元的區域,同時與3個以 5.

(6) 表 1 測試方法及所需使間之比較. 上的其它區域相連。因此,網路在處理的過程 中便將這些點連結在一起,而產生了叉點的變 形。為了解決此現象,本研究提出利用一新產 生的神經元來取代變形的神經元。其處理流程 如下: 1. 紀錄各神經元與其相連結的神經元有多 少個。 2. 找出 3 個神經元的連結點大於 2 且相互 連結者。 3. 將此 3 點合併為一新的神經元,其座標 值為此 3 點的平均值。 4. 判斷是否已無滿足連結點數大於 2 且相 互連結的 3 個神經元。 5. 如果還有的話再回到步驟 2 直到滿足步 驟 4 的條件。 圖 9 為圖 8 經過後處理之後的結果。. 圖 9 經後處理完後之結果 由圖 9 可以觀察出,經後處理之後的骨 架已經是相當完善,叉點變形的問題也已獲得 解決。. 三、實驗結果及分析 以下將針對工具、數字、英文字母以及 中文字的樣本作實驗,結果如圖 10 所示。表 1 則為利用隨機估測神經元與利用端點偵測及 影像分割兩種方式之間速度的測試。其中工具 使用最常見的尖嘴鉗、剪刀;數字則為較具代 表性的 0、5、8;英文字母則從中選出擁有叉 點及迴圈點的字母 A、F、X;中文字則挑選 「我」與「流」兩個字。 本研究所使用之軟體為 Matlab 6.5.1,硬 體 為 一 個 人 電 腦 。 CPU 為 AMD Barton 2500+,記憶體為 1GB,作業系統為 Windows XP sp1,測試影像是直接用數位相機取得,並 將其轉換成二值影像後輸入本系統中。實驗結 果如圖 10 所示。. (a) 工具的測試. 6.

(7) (c) 英文字母的測試. (b) 數字的測試. (d) 中文字的測試 圖 10 各種圖形的實驗結果 從表格 1 可以發現,本研究所提出的方 法平均可以有效的提升 DSOM 網路 19%的速 度。從圖 10 中則可以看出本研究對於大部份 的圖形,均可以正確的抽出骨架。然而從數字 「5」的骨架中可以發現,DSOM 網路仍會產 生一些小分支;而從「我」字中更可以看出, 7.

(8) Pattern Analysis and Machine Itelligence, Vol .14 , no. 9, Sept. 1992, pp.869-885.. 叉點變形的問題依然無法避免。這主要是因為 在連結神經元的過程中,由於部份神經元具有 過多相鄰的神經元以至於連結時產生錯誤。以 「我」字為例,從圖 11 中可以發現此圖形共 有三處以上的叉點變形(用圓形符號所標記的 地方,共有三處)。其中 b 與 c 處利用後處理 所提的方法可以得到適當的改善。然而,a 處 由於 d 點剛好處在兩個變形區域中,使得此處 變形的情況更為複雜。經由後處理之後,雖然 變形的區域被新神經元所取代了。然而卻也造 成了新神經元同時成了其它 5 個神經元的鄰 近神經元,而使得此處連結出現錯誤的情況。 而如何避免發生這種錯誤,即是本研究未來改 進的目標。. [3]. T.Y. Zhang and C.Y. Suen, “A fast parallel algorithm for thinning digital pictures”, Communications of the ACM archive, Vol.27, no.3, Mar.1984, pp.236-239.. [4]. Y.Y. Zhang and C.Y. Suen, “A modified parallel thinning algorithm,” IEEE 9th Int. Conf. on Pattern Recognition, Vol.2, Nov.1988, pp.1023-1025... [5]. P. Bhattacharya and X. Lu, “New parallel algorithm for thinning binary images,” in Proc. IEEE Int. Conf. on Systems, Conference Proceedings, vol.1, Oct.1991, pp.651-654.. [6]. F.Y. Shin and W.T. Wong, “Fully Parallel Thinning with Tolerance to boundary noise,” Pattern Recognition, vol. 27, No.12, pp. 1677-1695, 1998.. [7]. T. Kohonen, “The self-organizin map,”Proceedings of the IEEE, Vol.78, no.9, pp.1464-480,1990.. [8]. B. Fritzke, “Let it grow – Self-organizing feature maps with problem dependent cell structure.” Artificial Neural Networks. North-Holland, Amsterdam, vol.1. pp.403-408.. [9]. A. Datta and S.K. Parui, “Skeletons f from dot patterns: A neural network approach,” Pattern Recognition Letters, vol.18, pp.335-342, 1997.. [10]. A. Datta, S.K. Parui and B.B. Chaudhuri, “Skeletal shape extraction from dot patterns by self-organizing,” in Proc. IEEE 13th Int. Conf. on Pattern Recognition, vol.4, Aug.1996, pp.80-84.. 圖 11「我」字所產生的叉點變形. 四、結論 本研究所提出的端點偵測及影像分割的 方法,不僅可以擷取出與 DSOM 相同效果的 骨架,其速度更比單純使用 DSOM 網路要快 上 19%。然而本研究目前主要專注於速度上的 改進,因而對於叉點變形及產生分支的問題還 無法完全改善,而這也是本研究未來所要努力 的目標。. 五、參考文獻 [1]. Q.Y. Ye and P.E. Danielsson, “Inspection of printed circuit boards by connectivity preserving shrinking,” IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol.10, no.5,Sept. 1988,pp.737-742.. [2]. L. Lam, S.W. Lee and C.Y. Suen, “Thinning methodologies a comprehensive survey, ” IEEE Trans. on 8.

(9)

數據

圖 1  鄰域的縮減方式  圖2  利用隨機估測所得的輸出神經元  2.  端點估測  以圖 3 為例,若想以最少的輸出神經元 來形成圖形的骨架,莫過於以此圖形的端點來 代表骨架點。而且利用此種方式可以保證,所 得到的輸出神經元不會落於輸入圖形的像素 點之外。因此,便可以縮小 SOM 網路的鄰域 範圍以增加網路的執行速度。本研究利用一簡 單的方法來估測端點,其流程如下:  1  讀取圖檔並二值化。  2

參考文獻

相關文件

printing, engraved roller 刻花輥筒印花 printing, flatbed screen 平板絲網印花 printing, heat transfer 熱轉移印花. printing, ink-jet

• helps teachers collect learning evidence to provide timely feedback &amp; refine teaching strategies.. AaL • engages students in reflecting on &amp; monitoring their progress

Robinson Crusoe is an Englishman from the 1) t_______ of York in the seventeenth century, the youngest son of a merchant of German origin. This trip is financially successful,

fostering independent application of reading strategies Strategy 7: Provide opportunities for students to track, reflect on, and share their learning progress (destination). •

Strategy 3: Offer descriptive feedback during the learning process (enabling strategy). Where the

understanding of what students know, understand, and can do with their knowledge as a result of their educational experiences; the process culminates when assessment results are

How does drama help to develop English language skills.. In Forms 2-6, students develop their self-expression by participating in a wide range of activities

(1) Western musical terms and names of composers commonly used in the teaching of Music are included in this glossary.. (2) The Western musical terms and names of composers