模糊集群分析

第二章文獻探討

第四節模糊集群分析

壹、集群分析之意涵

集群分析 (cluster analysis) 又稱聚類分析，是一種數值分析方法，有別於傳統以事先決定的準則為分類方法，集群分析是按照自然類別 (nature grouping)，將分布於某一計量空間的點予以分類 (黃俊英，2000)。其主要目的是根據元素之間的類似或相似程度加以分類，相似程度高的元素會被歸類為同一個集群；也就是希望集群內的元素具有高度的同質性 (homogeneity)，而集群間的元素具有高度的異質性 (heterogeneity) (林邦傑，1981；林清山，1985)。

傳統的集群分析常以「距離」 (distance) 來表示元素之間的相似度 (similarity)，而距離的定義方式頗多，如歐氏距離 (Euclidean distance)、明可夫斯基距離 (Minkowski distance)、馬氏距離 (Mahalanobis distance) 等。而依其目的之不同，又可區分為階層集群分析 (hierarchical clustering method) 和非階層集群分析 (non-hierarchical clustering method) 兩大類 (林原宏，1996；張健邦，1993；

Everitt, 1993; Johnson & Wichenn, 1992)。常見的做法，是先進行階層集群分析以決定群數，而後再進行非階層集群分析以進行分類。階層集群分析基本上可分為分裂法 (division method) 和凝聚法 (agglomerative method)，一般較常見的是凝聚法；而非階層集群分析則是以 k 平均法 (k-means) 較為常見 (Everitt, 1993)。結合集群分析和模糊理論的概念，即為模糊集群分析 (藎壚，1991；Kaufman &

Rousseeuw, 1990)。

貳、模糊集群分析

Dunn 和 Bezdek 在 1974 年時，首先提出將模糊理論應用於集群分析上。而模糊集群分析 (fuzzy cluster analysis) 即是把模糊理論的隸屬度觀點融入集群分析 (Fu, 1998; Yang & Wu, 2006)。在模糊集群分析中，元素與集合的隸屬度被用來決定

距離的計算 (Yang & Shih, 2001)。由於模糊集群分析考慮隸屬度，所以統計學上的集群分析常被稱之為硬分類 (hard classification)，而模糊集群分析則被稱之為軟分類 (soft classification) (林原宏，2007)。

根據模糊理論所進行的集群分析方法很多，常見的有目標函數法 (objective function)、α_{截矩陣法 (}α-cut) 以及最大樹法 (maximum tree method) 三種，其方法、特性與計算方式分別說明如下：

一、目標函數法 (objective function)

目標函數法是應用性很廣的方法，適用於大樣本資料，可描述每位個體的隸屬度，但它不具階層性的特質 (Bezdek, 1973, 1974, 1981; Dunn, 1974)。

目標函數是非線性最佳化 (non-linear optimality) 的數學規劃方法，Bezdek (1981) 是提出此分析方法的重要人物。其後，致力於此領域的研究者已導出多種不同的目標函數 (Kamimura & Kurano, 2001)，但基本的原理原則是不變的。目標函數的分析過程簡述如下 (林原宏，2005b)：

【步驟三】未知的各集群中心矩陣為：

ε 數多少為佳，可依指標決定。使用較廣的指標有兩個 (Bezdek, 1981)，

其說明如下：

（一）分割係數 (partition coefficient)：

∑∑

= =

（二）分割亂度 (partition entropy)：

)

【步驟二】欲進行α 截矩陣法和最大樹法的模糊關係矩陣，必須滿足：陣 (similarity matrix)。

【舉例說明】

三、最大樹法 (maximum tree method)

⎥⎥

Gath and Geva (1989) 結合模糊集群理論和最大概似估計法，提出了模糊最大概似估計 (fuzzy maximum likelihood estimation) 之二階段演算法，第一階段為

0.6 0.8

x1 x3 x4 x5 x2

起點。此外，其研究中亦提出各種衡量適當分割數目的指標。Law (1996, 1997) 和 Yen (1996) 利用模糊隸屬度函數的定義關係，建立數學教育指標系統。Perdikaris (1996) 鑑於 van Hiele 幾何認知發展模式層次的分類相當粗略，利用模糊集合隸屬度函數理論建立出van Hiele 幾何認知發展模式。Wang and Bell (1996) 以高中及大學生為研究對象，利用模糊集群進行多因子評鑑 (multifactorical evaluation)，探討有關解決物理問題所需的想像力之研究，結果發現效果良好。

在實務應用方面，張鈿富和孫慶珉 (1993) 就模糊理論及其測度運算、模糊集合概念、隸屬度函數之估計以及模糊集合與模糊測度運算之概念，來討論學習成就模糊分析之可能性。研究中比較目前國中生學習評量與模糊的學習評量效果之不同，並列舉模糊綜合學習評量、單科模糊學習評量及其逆問題，以供決策者訂定評量模式之參考。薛道隆 (1993) 利用 FCM 演算法及兩階段集群分析法 (傳統互斥集群分析)，分別對高雄市大專學生電子字典之消費市場進行市場區隔，研究結果發現在市場區隔的實證中，模糊集群分析不但能完成互斥分群的工作，且經由隸屬度提供了一些傳統互斥集群分析所無法傳達的訊息。

吳光耀 (1993) 指出在分類過程中，族群的界定常具有不確定的特性，而聚類分析法正是解決此領域問題時，主要的一種科學方法。因此，其研究分為兩部分，第一部分是建立一個雙目標數學規劃的模式，即 FCM 與 FMLP，以符合聚類分析法的需要；第二部是建立一套有系統的整合流程，範圍從抽樣到鑑識分類，來完成聚類分析法，以台灣靈芝樣本作實際上的測試，驗證了雙目標分類模式確實符合研究擬改善的目標。溫坤禮 (1994) 利用模糊集群分析對汽車做自動識別及監控，其研究中根據定義之特徵值，對汽車影像以集群分析中之貼近度法加以分類，達到自動分類之要求。其次，利用C 語言將所提出之模糊數學模式加以程式化，以驅動系統之所有行為，因此在使用上可達成系統柔軟性及具有系統參數的易更改性。

李名昌 (1994) 利用模糊聚類分析方法進行記點點數配置，期能找出適合我

國國情之記點制度，以研擬處罰措施。結果發現模糊集群分析，可以反應實際交通危害狀況，且符合法規處罰之公平性與合理性，足供我國未來修正交通違規記點制度之參考。林志聰 (1997) 針對台灣地區上市、上櫃的商業銀行及中小企業銀行的經營績效為例進行分類，以尋求最佳投資銀行。樓邦儒和賈立人 (2000) 以台灣26 個測站 30 年的氣候基本資料，應用模糊集群分析考量六項變因：最低氣候、最高氣候、相對溼度、年平均雨日數、年平均溫度與平均降雨量，建立模糊氣候分類模式，並比較台灣柯本 (Köppen, W) 氣候分類與模糊氣候分類之間的差異及適用性。

朱國明 (2001) 以新的模糊集群分析法建構市場區隔，再利用模糊產品區隔與建商資源整合觀念，發展產品分類評估模式，透過線上分析系統，以提供建商能快速的回應市場的變動，作為建設公司推案產品之規劃及評估之依據。其模糊集群演算法乃建構在Bezdek (1981) 所提出的 FCM 演算法，以所對應的距離來衡量資料點彼此間的相關性，再結合Fukuyama and Sugeno (1989) 提出選擇最適集群半徑的集群性能指標函數，以作為分群數目的決定與分群有效性的衡量。透過模式可分析不同產品組群之差異及結構狀況，此外亦可呈現市場規模大小的動態性，提供業者針對其目標市場，擬定動態產品區隔差異化的行銷策略。劉仲原、

方國定和施雅月 (2003) 在競爭性市場結構分析的研究中，納入消費者從事購買行動電話前的刪除和歸類行為現象，藉由消費者所認知的各個產品或品牌間的相似性，採用模糊集群方法中的Fuzzy C-Means 演算法，建立競爭性市場結構，並且計算消費者對於產品轉換的忠誠度，作為研擬行銷策略之參考。

上述研究為模糊集群分析應用於各領域之可行性提供了具體的例證。在教學過程中，教師若能依據學童的學習結果予以分群，將有利於教師進行補救教學。

因此，本研究使用 Bezdek (1981) 的目標函數法，選取收斂標準為10^-5、q=2，應用模糊集群分析軟體 fcut (林原宏，2003) 將學童分群，期能找出較佳的集群

在文檔中國小二年級學童數與量分年細目概念結構圖之模糊取向分析 (頁 34-44)

第二章 文獻探討

第四節 模糊集群分析

壹、集群分析之意涵

貳、模糊集群分析

∑∑

第二章文獻探討

第四節模糊集群分析