• 沒有找到結果。

第二章 文獻探討

第四節 模糊集群分析

壹、集群分析之意涵

集群分析 (cluster analysis) 又稱聚類分析,是一種數值分析方法,有別於傳統 以事先決定的準則為分類方法,集群分析是按照自然類別 (nature grouping),將分 布於某一計量空間的點予以分類 (黃俊英,2000)。其主要目的是根據元素之間的 類似或相似程度加以分類,相似程度高的元素會被歸類為同一個集群;也就是希 望集群內的元素具有高度的同質性 (homogeneity),而集群間的元素具有高度的異 質性 (heterogeneity) (林邦傑,1981;林清山,1985)。

傳 統 的 集 群 分 析 常 以 「 距 離 」 (distance) 來 表 示 元 素 之 間 的 相 似 度 (similarity),而距離的定義方式頗多,如歐氏距離 (Euclidean distance)、明可夫斯 基距離 (Minkowski distance)、馬氏距離 (Mahalanobis distance) 等。而依其目的 之不同,又可區分為階層集群分析 (hierarchical clustering method) 和非階層集群 分析 (non-hierarchical clustering method) 兩大類 (林原宏,1996;張健邦,1993;

Everitt, 1993; Johnson & Wichenn, 1992)。常見的做法,是先進行階層集群分析以 決定群數,而後再進行非階層集群分析以進行分類。階層集群分析基本上可分為 分裂法 (division method) 和凝聚法 (agglomerative method),一般較常見的是凝聚 法;而非階層集群分析則是以 k 平均法 (k-means) 較為常見 (Everitt, 1993)。結 合集群分析和模糊理論的概念,即為模糊集群分析 (藎壚,1991;Kaufman &

Rousseeuw, 1990)。

貳、模糊集群分析

Dunn 和 Bezdek 在 1974 年時,首先提出將模糊理論應用於集群分析上。而模 糊集群分析 (fuzzy cluster analysis) 即是把模糊理論的隸屬度觀點融入集群分析 (Fu, 1998; Yang & Wu, 2006)。在模糊集群分析中,元素與集合的隸屬度被用來決定

距離的計算 (Yang & Shih, 2001)。由於模糊集群分析考慮隸屬度,所以統計學上的 集群分析常被稱之為硬分類 (hard classification),而模糊集群分析則被稱之為軟分 類 (soft classification) (林原宏,2007)。

根據模糊理論所進行的集群分析方法很多,常見的有目標函數法 (objective function)、α截矩陣法 (α-cut) 以及最大樹法 (maximum tree method) 三種,其方 法、特性與計算方式分別說明如下:

一、目標函數法 (objective function)

目標函數法是應用性很廣的方法,適用於大樣本資料,可描述每位個體的隸 屬度,但它不具階層性的特質 (Bezdek, 1973, 1974, 1981; Dunn, 1974)。

目標函數是非線性最佳化 (non-linear optimality) 的數學規劃方法,Bezdek (1981) 是提出此分析方法的重要人物。其後,致力於此領域的研究者已導出多種 不同的目標函數 (Kamimura & Kurano, 2001),但基本的原理原則是不變的。目標 函數的分析過程簡述如下 (林原宏,2005b):

【步驟三】未知的各集群中心矩陣為:

ε 數多少為佳,可依指標決定。使用較廣的指標有兩個 (Bezdek, 1981),

其說明如下:

(一)分割係數 (partition coefficient):

∑∑

= =

(二)分割亂度 (partition entropy):

)

【步驟二】欲進行α 截矩陣法和最大樹法的模糊關係矩陣,必須滿足: 陣 (similarity matrix)。

【舉例說明】

1

三、最大樹法 (maximum tree method)

⎥⎥

Gath and Geva (1989) 結合模糊集群理論和最大概似估計法,提出了模糊最 大概似估計 (fuzzy maximum likelihood estimation) 之二階段演算法,第一階段為

0.6 0.8

x1 x3 x4 x5 x2

起點。此外,其研究中亦提出各種衡量適當分割數目的指標。Law (1996, 1997) 和 Yen (1996) 利用模糊隸屬度函數的定義關係,建立數學教育指標系統。Perdikaris (1996) 鑑於 van Hiele 幾何認知發展模式層次的分類相當粗略,利用模糊集合隸 屬度函數理論建立出van Hiele 幾何認知發展模式。Wang and Bell (1996) 以高中 及 大 學 生 為 研 究 對 象 , 利 用 模 糊 集 群 進 行 多 因 子 評 鑑 (multifactorical evaluation),探討有關解決物理問題所需的想像力之研究,結果發現效果良好。

在實務應用方面,張鈿富和孫慶珉 (1993) 就模糊理論及其測度運算、模糊 集合概念、隸屬度函數之估計以及模糊集合與模糊測度運算之概念,來討論學習 成就模糊分析之可能性。研究中比較目前國中生學習評量與模糊的學習評量效果 之不同,並列舉模糊綜合學習評量、單科模糊學習評量及其逆問題,以供決策者 訂定評量模式之參考。薛道隆 (1993) 利用 FCM 演算法及兩階段集群分析法 (傳 統互斥集群分析),分別對高雄市大專學生電子字典之消費市場進行市場區隔,研 究結果發現在市場區隔的實證中,模糊集群分析不但能完成互斥分群的工作,且 經由隸屬度提供了一些傳統互斥集群分析所無法傳達的訊息。

吳光耀 (1993) 指出在分類過程中,族群的界定常具有不確定的特性,而聚 類分析法正是解決此領域問題時,主要的一種科學方法。因此,其研究分為兩部 分,第一部分是建立一個雙目標數學規劃的模式,即 FCM 與 FMLP,以符合聚 類分析法的需要;第二部是建立一套有系統的整合流程,範圍從抽樣到鑑識分 類,來完成聚類分析法,以台灣靈芝樣本作實際上的測試,驗證了雙目標分類模 式確實符合研究擬改善的目標。溫坤禮 (1994) 利用模糊集群分析對汽車做自動 識別及監控,其研究中根據定義之特徵值,對汽車影像以集群分析中之貼近度法 加以分類,達到自動分類之要求。其次,利用C 語言將所提出之模糊數學模式加 以程式化,以驅動系統之所有行為,因此在使用上可達成系統柔軟性及具有系統 參數的易更改性。

李名昌 (1994) 利用模糊聚類分析方法進行記點點數配置,期能找出適合我

國國情之記點制度,以研擬處罰措施。結果發現模糊集群分析,可以反應實際交 通危害狀況,且符合法規處罰之公平性與合理性,足供我國未來修正交通違規記 點制度之參考。林志聰 (1997) 針對台灣地區上市、上櫃的商業銀行及中小企業 銀行的經營績效為例進行分類,以尋求最佳投資銀行。樓邦儒和賈立人 (2000) 以 台灣26 個測站 30 年的氣候基本資料,應用模糊集群分析考量六項變因:最低氣 候、最高氣候、相對溼度、年平均雨日數、年平均溫度與平均降雨量,建立模糊 氣候分類模式,並比較台灣柯本 (Köppen, W) 氣候分類與模糊氣候分類之間的差 異及適用性。

朱國明 (2001) 以新的模糊集群分析法建構市場區隔,再利用模糊產品區隔 與建商資源整合觀念,發展產品分類評估模式,透過線上分析系統,以提供建商 能快速的回應市場的變動,作為建設公司推案產品之規劃及評估之依據。其模糊 集群演算法乃建構在Bezdek (1981) 所提出的 FCM 演算法,以所對應的距離來衡 量資料點彼此間的相關性,再結合Fukuyama and Sugeno (1989) 提出選擇最適集 群半徑的集群性能指標函數,以作為分群數目的決定與分群有效性的衡量。透過 模式可分析不同產品組群之差異及結構狀況,此外亦可呈現市場規模大小的動態 性,提供業者針對其目標市場,擬定動態產品區隔差異化的行銷策略。劉仲原、

方國定和施雅月 (2003) 在競爭性市場結構分析的研究中,納入消費者從事購買 行動電話前的刪除和歸類行為現象,藉由消費者所認知的各個產品或品牌間的相 似性,採用模糊集群方法中的Fuzzy C-Means 演算法,建立競爭性市場結構,並 且計算消費者對於產品轉換的忠誠度,作為研擬行銷策略之參考。

上述研究為模糊集群分析應用於各領域之可行性提供了具體的例證。在教學 過程中,教師若能依據學童的學習結果予以分群,將有利於教師進行補救教學。

因此,本研究使用 Bezdek (1981) 的目標函數法,選取收斂標準為10-5q=2, 應用模糊集群分析軟體 fcut (林原宏,2003) 將學童分群,期能找出較佳的集群