雜訊的影響(noise)

第四章混合性叢集演算法的分析

4.1 雜訊的影響(noise)

我們知道混合性叢集演算法的目的在於解決改善FCM和PCM的問題，因此本章節的研究目的在於藉由雜訊資料的偵測來分析混合性演算法所的辨識率，是否比FCM來的精確。我們利用下面資料來做分析(圖4-2)，圖4-2(a)初始圖中為三個正方形，正方形彼此交錯，而圖4-2(b)-(d)中的正方形影像跟圖4-2(a)一樣，不同在於圖4-2(b)-(d)中分別加入了50、100和150個雜訊資料點，我們便可利用對四種資料集合做偵測所產生的效率差異，來分析雜訊的影響力。此次實驗執行樣板理論的FCM、PCM、PFCM和IPCM每張圖片各100次，a和b值為0.5，m值設為2，n值設為1.5 (此處m和n分別代表FCM和PCM 的糢糊化因子)，r_η值限制為0.9，初始給予三個叢集，叢集的初始大小以及位置皆為隨

機選取。表4-1為圖4-2的實驗結果，表格中的數據為做100次實驗平均所偵測到的叢集個數。以FCM的數據為例，1.9代表做100次偵測平均一次可以偵測到1.9個叢集，然而此資料集合總共有3個叢集，因此最理想狀況每次都完全偵測，則實驗數據即為3。

(a) (b)

圖4-2：雜訊實驗圖 (a)原始影像 (b)加入50點雜訊資料 (c)加入100點雜訊資料 (d)加入 150點雜訊資料

表4-1：雜訊實驗數據

雜訊個數 FCM PCM PFCM IPCM

0 1.9 1.88 1.76 1.67

50 0.6 1.84 1.12 1.55

100 0.32 1.8 0.73 1.34

150 0.16 1.7 0.42 1.26

由實驗可知在加入雜訊資料前，四類演算法皆有相似的偵測效率。然而加入雜訊後，FCM明顯下降，PCM則沒有太大影響，然而PFCM和IPCM也有小幅度的降低。我們用圖4-3來做解釋，圖4-3(a)為含有50個雜訊的影像，且影像中的叢集為初始位置和大小，我們便以此設定來執行四種不同的演算法。圈起部分雜訊資料點的目的在於便於我們注意此群雜訊資料點對左上大正方形的影響力。

對於FCM，任意一點資料點的membership總和一定會等於1 (由(2))，因此就算此一資料點為雜訊，它也可以擁有membership值來影響叢集的移動。如圖4-3(b)所示，這群雜訊資料所擁有的membership值平均有0.5左右，雖然數量不夠多，不至於會使整個叢集做大幅度的移動，但仍會影響叢集的偵測，使得偵測的效率變差。

而相對的，PCM沒有規定typicality總和一定會等於1，所以就算影像中有雜訊，可能雜訊點擁有的typicality值也會很小，不容易影響群中心移動，如圖4-2(c)，此群雜訊所擁有的typicality值平均0.01，叢集幾乎不受他們影響。

對於混合性叢集演算法而言，PFCM它的membership求法是先個別求出FCM和PCM 的membership和typicality，然後再將兩者各取0.5比率相加，所得即為PFCM的membership 值，因此就數值涵義上來看，它不完全屬於FCM或者是PCM。當遇到雜訊時，FCM會受到雜訊影響，PCM可以使影響力降低，因此減少叢集受雜訊的影響度，如圖4-3(d)所示，這裡雜訊的membership和typicality值為0.5和0.01，因此兩者混合後整體membership 值差不多為0.25，雖然仍有小幅度的影響，由表4-1顯示PFCM的效率比FCM來的好。

而IPCM的membership求法是FCM和PCM的membership值和typicality值相乘，由於兩值都是介於0到1之間，所以相乘的結果只會變的比FCM和PCM的membership和 typicality值來得小而不會變大，因此會產生一種特性，只要其中一方判斷為不是 (membership值很小)，則IPCM演算法就會將其忽略，在此實驗中，因為PCM對於雜訊

的影響力很小，因此就算FCM給予雜訊的membership值過高，在兩者相乘後，membership 值仍會為一個很小的數，如圖4-3(e)所示，這裡雜訊的membership和typicality值為0.5和 0.01，因此在兩者混合後雜訊整體的membership值平均0.005左右，雜訊的影響力大大的降低，這也就是為甚麼在實驗數據中，IPCM的效率比PFCM來的要好。

(a) (b)

(e)

圖4-3：雜訊實驗示意圖 (a)為初始的叢集位置，資料集合含有50個雜訊 (b)-(e)分別為 FCM、PCM、PFCM和IPCM執行的情形

在文檔中結合模糊與可能性叢集法之基於樣板的 (頁 27-32)

第四章 混合性叢集演算法的分析

4.1 雜訊的影響(noise)

第四章混合性叢集演算法的分析