• 沒有找到結果。

第五章 研究過程與結果

第四節 群間變異比例

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第四節 群間變異比例

由上述的顯著項比較後,想進一步了解兩演算法在檢定過程中的真實誤差,

也就是群間差異,觀察HC 與 DCG-tree 的幾何特徵顯著與否,因此,根據上述 檢定所得ANOVA table,以 x 軸為變數,y 軸為處理變異平方和除上總變異的平 方和,畫出各變數下其變異比例的折線圖,當value 愈大時,則 SSTR 較大,表 示組間變異大,反之,當value 小時,則 SSTR 較小,表示組間變異小。

一、 第一次分群

圖 16 為根據RT 資料的分群結果,對 MOM 的十個變數進行 DCG-tree 演算 法與HC 演算法,可以看到十個變數中有九個變數 HC 的變異比大於 DCG-tree 的變異比,表示HC 各群間差異大。

圖 16 以 MOM 來看,RT 在第一次分群結果下的變異比。

圖 17 為根據SS 資料集的分群結果,對 MOM 的十個變數進行 DCG-tree 演 算法與HC 演算法,可以看到十個變數中有六個變數 HC 的變異比大於 DCG-tree 的變異比,表示HC 各群間差異大。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 17 以 MOM 來看,SS 在第一次分群結果下的變異比。

圖 18 為根據RT 資料集的分群結果,對 DAD 的十個變數進行 DCG-tree 演 算法與HC 演算法,可以看到十個變數中有八個變數 HC 的變異比大於 DCG-tree 的變異比,表示HC 各群間差異大。

圖 18 以 DAD 來看,RT 在第一次分群結果下的變異比。

圖 19 為根據SS 資料集的分群結果,對 DAD 的十個變數進行 DCG-tree 演 算法與HC 演算法,可以看到十個變數中僅有五個變數,HC 的變異比大於

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

DCG-tree 的變異比,表示兩演算法之間差異不大。

圖 19 以 DAD 來看,SS 在第一次分群結果下的變異比。

將所有人進行第一次分群後,以ANOVA 檢定結果所得的變異比,來比較演 算法之間的差異,可以發現HC 變異比大於 DCG-tree 變異比的個數明顯較多,

也就是說HC 各群間差異大,推斷 HC 的分群結果,有利於我們找到高風險行為 青少年。

二、 對特殊的群聚進行第二次分群

圖 20 為根據RT 資料集的分群結果,對 MOM 的十個變數進行 DCG-tree 演 算法與HC 演算法比較,可看到十個變數中有九個變數 DCG-tree 的變異比大於 HC 的變異比。同樣方法在 SS 資料集檢測,分群計算結果如圖 21,可看到 SS 中 十個變數中有六個變數的DCG-tree 的變異比大於 HC 的變異比,兩張圖皆表示 DCG-tree 各群組間差異大。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 20 以 MOM 來看,RT 特殊群聚在分群結果下的變異比。

圖 21 以 MOM 來看,SS 特殊群聚在分群結果下的變異比。

對DAD 的十個變數進行 DCG-tree 演算法與 HC 演算法分別在兩筆資料比 較,如下圖 22 RT 資料集的分群結果及圖 23 SS 資料集的分群結果,可看到十個 變數中有五個變數DCG-tree 的變異比大於 HC 的變異比,表示兩演算法之間差 異不大。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 22 以 DAD 來看,RT 特殊群聚在分群結果下的變異比。

圖 23 以 DAD 來看,SS 特殊群聚在分群結果下的變異比。

從特殊的群聚來看變異比,只在MOM 的變數中發現 DCG-tree 的變異比較 大於HC。在 DAD 的變數中,則較難依現有資料比較兩者差異。我們將在下節 針對特殊群及非特殊群比較。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

相關文件