η值的分析

第四章混合性叢集演算法的分析

4.4 η值的分析

在前面的章節，我們皆是固定r_η值等於0.9來做實驗分析，因此可能會錯過一些關於η值所產生的影響，因此本章將針對η值做分析討論，藉由改變不同的rη值，來產生不

同的收斂速率。在做實驗前，我們先來了解一下η值的涵義

我們分別來討論當η值收斂太慢或者太快時，會產生甚麼樣的問題。此時所探討的內容，僅限於PCM演算法會產生的問題。

I. r_η值趨近於1(η值收斂太慢)：

由方程式(6)中可以知道當η值太大時，整體typicality值會趨近於1，因此叢集會聚集在所有資料點的中心位置。如圖4-12，(a)為η值正常收斂時(rη值=0.8)，叢集會分別偵測到兩群的中心位置(b)為η值收斂太慢時(^r_η值=0.99)，叢集則會視所有的資料為同一群

(a) (b)

圖4-12：η值收斂太慢所產生的問題一 (a)rη=0.8 (b)r_η=0.99

這樣會造成叢集無法移動到精確的位置，使得辨識有些許誤差。如圖4-13，(a)為η值正常時(r_η值=0.7)，(b)為η值收斂太慢時(rη值=0.99)，可以發現兩著的叢集精準度有些微的差距。

(a) (b)

圖4-13：η值收斂太慢所產生的問題二 (a)rη=0.7 (b)r_η=0.99

II. r_η值趨近於零(η值收斂太快)：

由方程式(6)可以知道typicality會因為η值太小而造成整體偏低的現象，而由方程式 (4)可以得知typicality太小會使得資料的存在性過低，叢集不容易移動到正確的位置上，

如圖4-14。

圖4-14：η值收斂太快時叢集無法移動到正確的位置

由上面的討論，我們可以知道η值的重要性，然而這只是單純用PCM的觀點去探討而已，之後便要在混合型的叢集偵測演算法上做實驗分析，看有甚麼樣子的結果。

由於混合性叢集演算法是結合FCM和PCM的一種新的理念，不能單以PCM去解釋η 值所造成的問題，因此本次實驗目的在於探討η值對於混合性叢集演算法的影響。此次實驗我們以兩個相近的圓形做為實驗資料集，如圖4-15(a)。所引用的參數，a和b皆為 0.5，m為2，n為1.5，r_η值依序給予0.99、0.9、0.8、0.5、0.2和0.1，初始給予2個叢集，

叢集的初始位置和大小皆隨機選取，對FCM、PCM、PFCM和IPCM各做100次實驗分析。

表4-5為此次的實驗數據，數據的涵義為每次偵測到正確的叢集個數。

(a) (b)

圖4-15：η值分析實驗 (a)實驗初始圖 (b)當η值收斂太慢時PFCM容易產生的錯誤

表4-5：η值分析實驗數據

rη FCM PCM PFCM IPCM

0.99 1.76 1.15 0.3 1.45

0.9 1.76 1.23 1.54 1.25

0.8 1.76 1.23 1.5 1.16

0.5 1.76 1.08 1.5 1

0.2 1.76 1.07 1.51 0.97

0.1 1.76 1.06 1.52 0.96

由數據中我們可以看到，FCM本身沒有η值參數，故不會受影響，PCM也沒有太大的變動，PFCM的r_η值0.99和0.9時偵測效率差非常多，因為r_η值0.99時幾乎都會出現如圖4-15(b)的錯誤偵測，原因在於前一小節中我們知道當時r_η值趨近於1時，會造成叢集容易移動到所有資料點的中心，而且會有測量不精準的問題，所以容易出現誤差的情形。這樣的問題在PFCM中也會產生，叢集容易卡在所有資料的中間，雖然表面上來看

會感覺PCM的typicality所占比率只有一部分，還有FCM的membership可以加以修正，但這樣的想法是不嚴謹的，因為FCM可能會將叢集拉到其他的位置去，造成更不精準的情形，如圖4-16。

圖中我們可以看到，PFCM中的FCM因子在計算後可能已經判定了叢集的正確位置，如圖4-16(a)偵測到的左下圓形的membership為0.95，但是由於η值太大，因此在PCM 的計算中，認為此叢集應該是要往中間的位置移動，如圖4-16(b)可以注意到中間資料點的typicality值皆為0.9，這時FCM membership很容易就會被其他的資料所影響，使得整個叢集被拉到另一圓圈去，如圖 4-16(c)FCM反而認為另一邊的圓才是所要偵測的，而使得整體叢集往另一圓移動。這也就是為甚麼當r_η值為0.99時，PFCM的效率會這麼差。

而就IPCM而言，當r_η值為0.99時是偵測效率最好的時候，原因在於，η值過大只會使得

PCM的typicality較容易趨近於1，membership和typicality兩者相乘的結果，就會趨近於 FCM的membership，因此IPCM會趨近於FCM演算法，在此次實驗中FCM擁有最高的偵測效率，這也是為甚麼IPCM在r_η值愈趨近於1時，偵測效率會愈好。

(a) (b)

(c)

圖4-16：η值太大時PFCM流程圖 (a)叢集偵測到了圓 (b)因為η值太大所以叢集會跑到所有資料的中心位置 (c)叢集被另一邊的圓拉過去

再來我們以圖4-17做為資料集，針對FCM、PCM、PFCM和IPCM的偵測做分析，

圖中三個叢集較為分散，因此對於PCM來說，η值的選取會變得相當重要，不然不容易搜尋到較遠的叢集，容易產生重疊。初始給予三個叢集做分析，參數都與前者相同，而所採取的r_η值分別為：0.99、0.9、0.8、0.5、0.2和0.1。表4-6即為此次的實驗數據。

圖4-17：η值分析實驗2初始圖，三個分散的小圓

表4-6：η值分析實驗2

rη FCM PCM PFCM IPCM

0.99 1.5 0.4 0.5 1.11

0.9 1.5 0.72 0.72 0.5

0.8 1.5 0.62 0.74 0.32

0.5 1.5 0.38 0.92 0.24

0.2 1.5 0.36 1.15 0.19

0.1 1.5 0.36 1.18 0.2

由前一次實驗我們可以了解，當r_η值趨近於1時，PFCM和IPCM數據的產生原因。

PFCM所有的資料點會被視為同一群，使得叢集被拉到所有資料點的中心位置，如圖 4-18(a)。而IPCM則會趨近於FCM，擁有不錯的效率。而當r_η值慢慢變小以至於趨近於0 時，IPCM的效率迅速下降，因為r_η值趨近於0的話，會使PCM的typicality值也趨近於0，

membership和typicality相乘後會連帶的使整體的membership都趨近於0，叢集不容易移動到正確的位置上，如圖4-18(b)。而對於PFCM來說，η值如果太小的話，PCM的typicality 值趨近於0，所以PFCM只會被剩下FCM的membership所影響，所以也會比較傾向於 FCM，這也是為甚麼在此次實驗中，當PFCM在r_η值愈趨近於0時，偵測效率會較好。

(a) (b)

圖4-18：η值分析實驗結果圖 (a) PFCM當η值太大時所有的資料點會被視為同一群，使得叢集會被拉到所有資料點的中心位置 (b)IPCM當η值太小時，叢集不易移動到正確的位置

第五章：結論

叢集演算法可以幫助我們從未知的資料中，找出資料分佈的狀況與模式，其目的是在分析資料的內容，將性質相似的資料連繫在一起。然而對於shell cluster偵測的困難度也會上升，雖然可利用較傳統的FCM和PCM演算法做搜尋，但彼此仍存在著一些限制，

無法單一的使用一種演算法做廣泛的運用。

在去雜訊以及減少重複性的研究中，我們可以發現到，PFCM的偵測機率皆位於 FCM和PCM的中間，那是因為PFCM的設計概念是將membership和typicality各自取一比率相加，因此效果不會來的比某一個方法好，但也不會比另一個方法差。這樣雖然能同時解決一定的雜訊和重複問題，但是由之前的實驗可以得知，IPCM在去雜訊和解決重複偵測的問題，都比PFCM來的更好。

然而在初始叢集個數不同的實驗中，我們發現到PFCM有著降低錯誤率產生的特性，這樣的好處在於，在做資料分群時，由於一次就分好所有群的機率很低，因此會採用逐一解決的方法，先偵測到的叢集便將它從資料集中移走(remove)，然後再用剩下的資料集做偵測，直到所有的叢集都找到為止。因此如果是採用FCM或者是PCM的演算法，可能一個正確的資料叢集都沒有辦法找到，然而PFCM就會比FCM和PCM要來的更有機會，準確率也會比較好。尤其是針對shell cluster做偵測時，如果圖形過於複雜，很容易會造成偵測上的失誤，因此在演算法的選擇上就成了辨識上的關鍵，這時PFCM就會是個不錯的選擇。

在實驗的最後我們討論到η值會影響偵測的範圍，如果η值收斂太為緩慢，容易使得 typicality值趨近於1，可能會視所有資料為同一群而偵測到所有資料的中心位置，但對於IPCM來說，不會產生這樣的錯誤。而當收斂太迅速，加上初始雛形位置不夠廣時，

會使得typicality值趨近於0，使得叢集不容易移動至正確的位置造成偵測的失誤，而 PFCM則可以改進這樣的問題。

藉由本篇論文的分析，讓我們瞭解到了PFCM和IPCM的不同性質，使我們在偵測較複雜的叢集時，有著更高的效率。在未來的研究上，可以針對允許初始雛型的扭曲或變形做分析，也可以在初始一次給予多種圖形形狀做偵測，藉此近一步分析混何性叢集演算法的特性，希望在未來PFCM和IPCM這兩種混合性叢集演算法，能帶來更大的使用效益與使用空間。

參考文獻：

[1] R.O. Duda and P.E. Hart, Pattern Classification and Scene Analysis, New York: John Wiley & Sons, 1973.

[2] A.K. Jain and R.C. Dubes, Algorithms for Clustering Data. Englewood Cliffs, N.J.:

Prentice Hall, 1988.

[3] R.N.Dave and S.Bhamidipati, "Application of fuzzy shell-clustering algorithm to recognize circular shapes in digital images", Proc. Third Annual IFSA World Congress, pp. 238-241, 1989.

[4] R.N. Dave, "Fuzzy shell-clustering and application to circle detection in digital images", Int’l J. Gen. Syst., vol. 16, pp. 343-355, 1990.

[5] R. N. Dave and K. J. Patel, “Fuzzy ellipsodial-shell clustering algorithm and detection of ellipsoidal shapes,” Proc. SPIE Conf: Intelligent Robots and Computer Esion IX:

Algorithms and Techniques, vol. 1381, pp. 320-333, 1990

[6] R.N. Dave and K. Bhaswan, "Adaptive fuzzy C-shells clustering and detection of ellipses", IEEE Trans. Neural Networks, vol. 3, pp. 643-662, 1992.

[7] F. Hoeppner, "Fuzzy shell clustering algorithms in image processing: fuzzy c-rectangular and 2-rectangular shells", IEEE Trans. Fuzzy Systems, vol. 5, pp. 599-613, 1997.

[8] X.-B. Gao,W.-X. Xie, J.-Z. Liu, and J. Li, "Template based fuzzy c-shells clustering algorithm and its fast implementation", Proc. IEEE Int'l Conf. Signal Processing, pp.

1269-1272, 1996.

[9] Wang, T, "Possibilistic Shell Clustering of Template-Based Shapes", IEEE Trans. Fuzzy Systems, vol. 17, pp. 777-793, 2009

Plenum, 1981.

[11] R. Krishnapurum and J.M. Keller, "A possibilistic approach toclustering", IEEE. Trans.

Fuzzy Systems, vol. 1, pp. 98-110, 1993.

[12] N.R. Pal, K. Pal, J.M. Keller, and J.C. Bezdek, "A possibilistic fuzzy c-means", IEEE Trans. Fuzzy Systems, vol. 13, pp. 517-530, 2005.

[13] J. Zhang and Y. Leung, “Improved possibilistic C-means clustering algorithms,” IEEE Trans. Fuzzy Systems., vol. 12, pp. 209–217, 2004.

[14] I. Gath and D. Hoory, "Fuzzy clustering of elliptic ring-shaped clusters", Pattern Recognition Letters, vol. 16, pp. 727-741, 1995.

[15] N. R. Pal, K. Pal, and J. C. Bezdek, “A mixed c-means clustering model,” IEEE Int’l Conf. Fuzzy Systems, Spain, pp. 11–21, 1997.

[16] R. Krishnapurum, O. Nasraoui, and H. Frigui, "The fuzzy c spherical shells algorithm: A new approach", IEEE Trans. Neural Networks, vol. 3, pp. 663-671, 1992.

[17] I. Gath and D. Hoory, "Detection of elliptic shells using fuzzy clustering: application to MRI images", Proc. Int'l Conf. Pattern Recognition, vol. 2, pp. 251-255, 1994.

[18] X.-H. Wu and J.-J. Zhou, “Possibilistic fuzzy c-means clustering model using kernel methods,” Proc. Int’l Conf. Comput. Intell. Model., Control Autom., pp. 465–470, 2005.

[19] A. Guill’en, I. Rojas, J. Gonz’alez, H. Pomares, L.J. Herrera, O. Valenzuela, and A.

Prieto. "A Possibilistic Approach to RBFN Centers Initialization." Lecture Notes in Computer Science, vol. 3624, pp. 174–183, 2005.

[20] D. Chen, D.-W. Cui, and C.-X. Wang, "Weighted Fuzzy C-Means Clustering Based on Double Coding Genetic Algorithm," Lecture Notes in Computer Science, vol. 4113, pp.

622 – 633, 2006.

在文檔中結合模糊與可能性叢集法之基於樣板的 (頁 46-57)

第四章 混合性叢集演算法的分析

4.4 η值的分析

第五章：結論

參考文獻：

第四章混合性叢集演算法的分析