• 沒有找到結果。

利用 k-means 分群後表現出的性質

在文檔中 國 立 中 央 大 學 (頁 52-55)

第四章 研究結果與討論

4.2 研究主題結果

4.2.1 利用 k-means 分群後表現出的性質

我們利用前置實驗中分成三群與四群的結果,取得各群的平均向量,作為研 究主題中 k-means 程式的初始中心。仿照前置實驗將研究樣本的學測成績在 Matlab 中以 k-means 分成三群與四群,由於樣本數過大,我們僅列出各群的平 均與標準差方便觀察。首先,在分成三群後,如表 4-6,觀察發現:第一群與第 二群分別在數學級分與英文級分偏低;第三群看起來各科的平均級分都不錯,標 準差除了自然之外也都略小於其它群,但暫時沒有觀察出值得我們特別注意的性 質而視為其他。研究主題中分成三群的結果可以說是與前置實驗結果一致。

表 4-6 研究樣本分三群

國文 英文 數學 社會 自然 第一群 平均 13 12 10 12 13

(236 人) 標準差 1.2 1.4 1.3 1.5 1.1 第二群 平均 12 9 12 11 13

(132 人) 標準差 1.3 1.5 1.8 1.5 1.1 第三群 平均 13 12 13 12 13

(232 人) 標準差 1.1 1.2 1.0 1.4 1.1 註:在 Matlab 中執行 k-means 分群法,將學測成績分成三群。

接著討論學測成績在 Matlab 中以 k-means 分成四群後,如表 4-7,觀察 發現:第一群與第二群還是分別為數學級分與英文級分偏低;第三群與表 4-6 的 第三群同樣是在各科表現都不錯且標準差也不大;第四群則在數學級分看出有相 對偏高的現象。

表 4-7 研究樣本分四群

國文 英文 數學 社會 自然 第一群 平均 13 12 9 12 13

(203 人) 標準差 1.2 1.3 1.2 1.5 1.1 第二群 平均 12 8 11 12 13

( 82 人) 標準差 1.3 1.6 2.0 1.5 1.2 第三群 平均 13 13 12 12 13

(175 人) 標準差 1.0 1.0 0.9 1.3 1.0 第四群 平均 12 11 14 11 13

(140 人) 標準差 1.2 1.2 1.1 1.3 1.1 註:在 Matlab 中執行 k-means 分群法,將學測成績分成四群。

如果再仔細觀察研究樣本中從分成三群到分成四群的變化,可以發現:第一 群中只有 33 個樣本變動,其中 4 個改變到第二群而有 29 個到第三群;第二 群與第三群中則分別有 54 及 86 個樣本變動,且皆被分到第四群。也就是說,

研究樣本從分成三群到分成四群只有四種變動方式,我們計算這四種變動方式樣 本的各科平均以便觀察,如表 4-8。從表中顯示出,第一群又分出一些英文較低 的樣本到第二群,而第二、三群釋放出來的樣本則在數學級分有偏高的現象。因 此,我們可以更確定第二群的特徵確實是英文級分偏低,而第四群則應該是數學 級分較高的一群。

表 4-8 研究樣本從三群到四群的變化

樣本平均 國文 英文 數學 社會 自然

第一群分至第二群 13 8 8 12 12 第一群分至第三群 13 13 11 13 14 第二群分至第四群 12 9 14 11 13 第三群分至第四群 12 11 14 11 13

最後,將研究主題結果與前置實驗結果比較:在第一群與第二群我們可以得 到一致的結果,分別代表數學偏低與英文偏低;第三群應該是集合各科表現都還 不錯的樣本;而第四群則都是由分成三群時的第二群與第三群分化出來的。由於 研究主題中 k-means 程式設定的初始中心,是來自於前置實驗的分群結果。因 此,這些相同的現象,可以說是受了初始中心的影響,另外也表示 k-means 分 群法在使用上有穩定的結果。

從 k-means 的分群結果來看,第三群在各科表現都不錯標準差也都偏小,

但是卻沒有突出的性質;第四群則在數學級分有偏高的特質,也可能在社會科有 偏低的現象。不過,對於三、四兩群,我們目前沒有特別想觀察的現象,因此不 再做更深入的討論,將此兩群視為分群後的其它。

在文檔中 國 立 中 央 大 學 (頁 52-55)

相關文件