第二章 文獻探討
2.2 研究方法
2.2.1 自組織映射類神經網路(SOM)
自組織映射(SOM) 網路是由 T. Kohonen 在 1980 年所提出的一種 非監督式學習(unsupervised learning)網路,至今仍是非監督式學習 網路模式的典範,圖 2-1 即為非監督式學習的例子。
SOM 網路的基本原理可溯自大腦結構的特性,大腦中具有相似 功能的腦細胞是聚集在一起的,例如人類大腦中明顯地有專司視覺、
聽覺、嗅覺等區塊,也就是腦神經細胞有「物以類聚」的特性。SOM 網路即模仿這種特性,其輸出處理單元會相互影響,當網路學習完畢 後,其輸出處理單元相鄰近者會具有相似的功能,也就是具有相近的 連結加權值。SOM 網路的架構如圖 2-2 所示,包括:
1. 輸入層:用以表現網路的輸入變數,即訓練範例的輸入向量(或 稱特徵向量),其處理單元的數目依問題而定,使用線性轉換函 數,即 f(x)=x。
2. 輸出層:用以表現網路的輸出變數,即訓練範例的聚類,其處理 單元數目依問題而定。這和反傳遞網路的隱藏層相似,不同處在 於反傳遞網路沒有「網路拓撲」(topology)以及「鄰近區域」
(neighborhood)的觀念。
3. 網路連結:每個輸出單元與輸入層處理相連連結的加權值所構成 的向量,表示一個訓練範例對映樣本點聚類之形心座標。當網路 完成學習後,其輸出處理單元相鄰近者會具有相似的連結加權 值。
S O M 網 路 的 重 要 概 念 如 下 :
1. 網路拓撲:SOM 網路與其他類神經網路模式有一點重要的差異,
它的輸出層處理單元的相對位置具有重要的意義,而一般網路模 式則否。通常它的輸出層處理單元以二維的型態排列居多,形狀 可以有矩型、三角形、圓形甚至任意形狀,而且一維、三維排列 亦可。
2. 拓撲座標:拓撲座標是指標定一輸出層處理單元在網路拓撲中位 置的座標。對於一個二維型態排列的網路拓蹼,每一個輸出層處 理單元具有一個二維拓撲座標;如採一維或三維排列,則每一個
輸出單元將具一維或三維的拓撲座標。拓撲座標與樣本空間座標
其中 R_rate=鄰近半徑縮小因子(<1.0)
Node[j*][k*]間的距離
(5) 計算輸出層輸出向量 Y。
如果 j=j*
,
k=k* 則 Y[j][k]=1 否則 Y[j][k]=0故 SOM 網路可以將樣本空間原本的多維次座標(樣本空間座標 的維次是由輸入變數的個數決定)映射至網路拓撲上以二維平面表 示,在拓撲上距離越近的樣本其某些屬性應該越相似。本研究限於無 法取得國內具公信力的信用評等機構對營造業發佈的評等結果做為 學習的目標值,因此可先採用 SOM 網路作前端處理,將廠商依信用 狀況分類後賦予適當的信用等級以供後續的 BP 網路學習。本研究以 影響廠商財務信用的財務比率做為輸入變數,利用 SOM 網路將多維 的特徵向量(即輸入變數)映射至一個二維的拓撲之後,將拓撲座標 上相對距離接近的廠商歸為同一個聚類,就可以獲得不同信用狀況的 廠商群聚。完成聚類之後再對各聚類中樣本的財務因子進行分析,即 可判斷各聚類之間的信用優劣排序並賦予對應的信用等級。