第四章 實驗結果
4.2 測試具有交叉的資料集合
(a) (b) (c)
圖17: 不同半徑的同心圓其主曲線的偵測。(a)同心圓資料集合、(b)第三階段分群結果、
(c)整合後個別分群主曲線所得到的結果。
4.2 測試具有交叉的資料集合
這裡我們所使用資料集合含有兩個橢圓,並且此兩橢圓互相相交產生四個交點。在 這裡我們將產生兩組這樣的資料集合,如下圖 18 的(a)跟(b)。
(a) (b) 圖 18: 相交橢圓的資料集合。(a)較窄的相交橢圓、(b)較寬的相交橢圓。
這兩組資料集合主要的不同點在於橢圓圓周的寬度,而橢圓圓周的寬度會決定兩個 橢圓其相交部份對於找到其主曲線的複雜程度。這是因為如果圓周寬度較寬的橢圓相對 於圓周寬度較窄的橢圓其在交叉的部份所包含不同橢圓的資料點較多,而且交叉的部份 較大,所以造成由 GK 演算法所得到的雛型會有較大的機會落在交叉的部份上。因此這 些落在交叉部份上的雛型會有很大的機會包含到不同橢圓的資料點,造成在階層聚合的
過程中有較多的情況造成錯誤的連結。
由下圖 19 可以看出圓周寬度較寬有較差的連結情況,其中(a)與(b)為輸入的橢圓圓 周較寬在不同的雛型個數下所得到的第二階段分群結果。而(c)與(d)為輸入的橢圓圓周 較窄在不同的雛型個數下所得到的第二階段分群結果。
(a) (b)
(c) (d)
圖 19: 不同資料集合的第二階段分群結果。(a)與(b)分別為雛型個數為 30 與 60,由圖 18(b)所得到的第二階段分群的結果。(c)與(d)分別為雛型個數為 30 與 60,由圖 18(a)所 得到的第二階段分群的結果。(a)跟(b)是在最佳化之前。
我們使用這兩組資料集合來測試是否能決定出兩個橢圓的主曲線。首先我們將先對 橢圓圓周寬度較小的圖 18(a)做實驗。實驗中各項的參數數值設定如下:修改的模糊 GK 叢集演算法的β 為 10 的 15 次方、γ 為 0.0002、收斂門檻值ε為 0.5、模糊運算子 m 為 2、
其整合個別分群的次數為 10 次,所使用的雛型個數範圍為: 20、25、30、35、40、45、
50、55、60、65、70、75、80。而模糊主曲線追蹤演算法的叢集重心點個數為 20 個、
連結門檻值為 0.02、平滑化程度α 值為 2。圖 20 是圓周寬度窄的橢圓。
(a)
(b) (c)
(d) (e)
圖 20: 橢圓圓周寬度窄的資料集合其主曲線的偵測。(a)第三階段分群結果、(b)紅色個 別分群資料集合、(c)紅色個別分群的主曲線、(d)綠色個別分群資料集合、(e)綠色個別 分群的主曲線。
而橢圓圓周較寬的各項參數數值設定與上例有所不同的為: 其整合個別分群的次 數為 15 次。圖 21 是圓周寬度寬的橢圓。
(a)
(b) (c)
(d) (e)
圖 21: 橢圓圓周寬度寬的資料集合其主曲線的偵測。(a)第三階段分群結果、(b)紅色個 別分群資料集合、(c)紅色個別分群的主曲線、(d)綠色個別分群資料集合、(e)綠色個別 分群的主曲線。
由圖 20 與圖 21 的(a)可以知道因為橢圓圓周寬度寬的資料集合有較高的困難度,
所以有較差的第三階段的分群結果。因此在取出個別分群的資料集合時會造成圖 21(b) 與(d)有少數的資料點是取到不正確的橢圓資料點,形成類似有雜訊的情況。不過我們 所利用修改的模糊主曲線追蹤演算法可以解決這種具有輕微雜訊的情況。