• 沒有找到結果。

投影指標值之探索

第四章 模擬方法與結果

第三節 投影指標值之探索

由圖 1 到圖 8 中,都可以看出當資料點透過最終投影方向之投影後,皆明顯 的分為兩群。以下就針對圖 1 到圖 8 各別所對應的投影指標,探索「投影方向所 對應的投影指標值越大,表示資料點經此方向投影之後較為密集」這個問題。因 為由肉眼並無法看出當資料投影後的密集程度,於是一維度則以變異數的大小來 代表各群中資料點的密集程度;二維度則以共變異數矩陣來代表各群中資料點的 密集程度。由表 7 來看,一維度中,當 P-index = 523.5453 時,其所對應之第一 群與第二群的變異數的值中比當 P-index = 522.3540 時所對應之第一群與第二群 的變異數的值皆來得大;二維度中,當 P-index = 142.1545 時,其所對應之第一 群的共變異數矩陣值中的 0.0239 與 0.0200 比當 P-index = 76.5406 時所對應之第 一群的共變異數矩陣值中的 0.0297 與 0.0266 來得小;但是,其所對應之第二群 的共變異數矩陣值中的 0.6396 與 0.5450 比當 P-index = 76.5406 時所對應之第二 群的共變異數矩陣值中的 0.4497 與 0.3829 來得大,且 P-index = 113.8985 時的 第二群共變異數矩陣的行列式值比 P-index = 76.5406 時的第二群共變異數矩陣 的行列式值來得大。故由表 7 可以知道,投影指標值越大,資料點經投影後並非 越來越密集。

25

26

另外投影指標值越大是否代表兩群資料能有明顯的分群。在此使用模擬資料,

將每筆模擬資料分為三組,分別是第一族群與第二族群、第一族群與第三族群、

第二族群與第三族群。利用上述投影追蹤演算法分別去求得投影指標值,目的是 想探索投影指標值的大小,是否代表兩群資料較能顯示分群,其 100 次的模擬結 果則在附錄的表 11,下表則為 100 次模擬結果的帄均數與標準差。

表 8 三種不同組合資料的投影指標值

一維度 二維度

1 和 2 1 和 3 2 和 3 1 和 2 1 和 3 2 和 3 帄均數 244.5170 674.3790 41.2992 32.6980 185.7840 1.8530 標準差 36.3411 69.1974 6.9175 9.0384 49.9621 0.6610

註:1、2、3 分別代表模擬資料之第一、二、三族群。

由上表 8 看出,無論是第一族群與第二族群、第一族群與第三族群、第二族 群與第三族群的資料在一維度的投影指標皆比二維度的投影指標來得大。雖然在 二維度上,第一族群與第三族群在這些模擬中,找到的投影指標值變化較大,但 是也都比第一族群與第二族群、第二族群與第三族群皆來得大。以一維度來看,

第一族群與第三族群的帄均投影指標約為第一族群與第二族群的帄均投影指標 的 2.8 倍;第一族群與第三族群的帄均投影指標約為第二族群與第三族群的帄均 投影指標的 16.3 倍;二維度中,第一族群與第三族群的帄均投影指標約為第一 族群與第二族群的帄均投影指標的 5.7 倍;第一族群與第三族群的帄均投影指標 約為第二族群與第三族群的帄均投影指標的 100.3 倍;(由圖 5、圖 6、圖 7、圖 8 中,其中小黑點是第一族群的資料、正方形是第二族群的資料、圓圈是第三族 群的資料)。由這四個圖可以看出,第一族群與第三族群最遠,第二族群與第三 族群最近,由表 8 得知,無論在一維度或二維度,兩族群距離遠,則投影指標相 對較大。

27

相關文件