第二章 文獻回顧與理論基礎
2.3 類神經網路概述
2.3.4 自組特徵映射圖網路
自組特徵映射圖網路(Self-Organizing Map, SOM)於 1980 年首先由 Teuvo Kohonen 提出,屬於非監督式學習,同時也屬於競爭式的網路架構。非監督式學 習網路在學習訓練過程中,輸入範例僅需提供輸入資料,而不提供輸出資料,網 路依照輸入資料的特性直接學習以及調整權重,以應用於新的案例,推論新案例 與哪些訓練範例屬同一聚類的應用,此類演算法多用於聚類型的類神經網路,可 降低高維度系統的複雜性。自競爭式學習的網路架構,則是輸入神經元間互相競 爭,只有唯一贏得優勝者則成為優勝單元,為該群組中最具代表性的範例。僅有 優勝單元進行權重調整,其餘神經元則不被調整。綜合以上特性,自組映射圖網 路相當適合進行辨識分類與歸納分析等處理,而在許多科學領域已有許多應用成 果,如語言學家分析語言、商業管理者對市場反應作分類處理、影像圖樣作分類 處理等。
其演算法主要方式是以特徵映射的方式,將任意維度的輸入向量,映射至較 低維度的特徵映射圖上,如一維或二維的映射圖,如圖 2-7。
圖 2-7 :二維矩陣的 SOM 架構圖
(資料來源:修改自張斐章、張麗秋,2005)
輸入網路參數與訓練範例值後,自組特徵映射圖網路即開始計算該神經元之 權重與輸入向量間的距離,距離愈近者,代表其相似程度愈高。並選取距離最短 者,為該群組中最具代表性的範例,即為優勝神經元。優勝神經元可獲得調整連 結權重的機會;而輸出層的神經元最後會根據輸入向量的「特徵」以有意義的「拓 樸結構」(Topological Structure)展現在輸出空間中。由於所產生的拓樸結構圖 可以反應輸入向量本身的特徵,因此將此網路稱作為自組特徵映射圖網路,或稱 為拓樸圖(Topology),如圖 2-8。
圖 2-8 :SOM 網路神經元間的拓樸座標
(資料來源:張斐章、張麗秋,2005)
自組特徵映射圖網路映射的過程同時也是一個聚類的過程,可視為聚類演算 法(Clustering Algorithm)的一種。它的理念在於可將一群未經標示的樣本,透 過此演算法,從中尋找某些相似的特性,然後再將這些具有相似特性的樣本聚集 成一類(張斐章、張麗秋,2005),自組特徵映射圖網路重要概念與相關名詞整 理如表 2-11。
表 2-11 :自組特徵映射圖網路重要概念與相關名詞
名稱 說明
拓樸結構
SOM 網路以特徵映射的方式,將任意維度的輸入向量,映射至較低維 度的特徵映射圖上,輸出層的神經元最後會根據輸入向量的「特徵」
以有意義的「拓樸結構」(Topological Structure)展現在輸出空間中,
通常以二維的形態排列,形狀以矩形居多。
拓樸座標 拓樸座標是指定一輸出層處理單元在拓樸結構中位置的座標。
優勝神經元 決定優勝神經元之方式是比較所有神經元的連結權重與輸入向量間的 距離,以距離最近之神經元為優勝神經元。
歐式距離
決定優勝神經元之距離運算公式有相當多選擇,包含歐幾里德基
(Euclidean Norm, 簡稱歐式距離)、加權距離、Manhattan 等。本研究 以歐式距離為主。
鄰近中心(q) 優勝神經元即為鄰近中心。以該神經元為調整中心,修正鄰近區域中 所有的神經元。
鄰近半徑(R) 控制鄰近區域大小的參數,隨著訓練次數增加,該半徑逐漸縮小。
鄰近區域 鄰近區域是指在拓樸結構中,以鄰近中心為中心點,鄰近半徑之長度 為半徑所圍繞之區域,隨著訓練次數增加,該區域逐漸縮小。
鄰近函數 控制優勝神經元與其他神經元和「鄰近半徑」之間關係式的函數。
(資料來源:本研究整理)
圖 2-9 :鄰近中心與鄰近區域遞減示意圖
(資料來源:修改自張斐章、張麗秋,2005)