第五章 研究過程與結果
第三節 交互比較
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第三節 交互比較
根據上述顯著項比較過後,想進一步了解兩個演算法下的分群結構是否相 近,因此,以一個演算法的樹狀圖為基底,將另一演算法所得每個群聚給予不同 顏色標記,對應回基底的樹狀圖,並觀察樣本的分散情形。
一、 HC 中特殊的兩群
以RT 及 SS 的資料進行 HC 分群後,根據 HC 為基底的樹狀圖下,如圖 12-13 可以觀察到第四群與第五群都集中在圖的左側,這兩群的人數少且顏色較為不一 樣,在RT 為風險容忍度的表現較為特殊,在 SS 為行為情境表現特殊。因此,
分別針對這兩群樣本,再次執行HC 演算法,且設定群數不變,並對其分群結果 做檢定,比較其顯著項的多寡。從下表 15 發現在DAD 下,十個組合變數中,t-test 有兩個顯著變數,而K-W 有三個顯著變數,其顯著項的個數都相當的少。從下 表 16 可以發現在K-W 下,十個 MOM 組合變數中有一個顯著變數,十個 DAD 組合變數中有一個顯著變數,其顯著項的個數依舊相當的少。因此,無論在HC 或DCG-tree,這兩群皆有較相同的特徵,無顯著的差異,可能就是高風險行為 的一群人。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 12 RT 在 HC 的樹狀圖下,看 DCG-tree 的群聚情形。
(由左至右為第四、五、三、一、二群)
表 15 RT 特殊群聚在 HC 下的檢定結果。
RT 在 HC 下,共分兩個群聚
檢定的資料集 MOM 的組合變數 DAD 的組合變數 檢定 t-test K-W t-test K-W
顯著的變數 無 無 (2,3) (2,3,10)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 13 SS 在 HC 的樹狀圖下,看 DCG-tree 的群聚情形。
(由左至右為第四、五、三、六、一、二群)
表 16 SS 特殊群聚在 HC 下的檢定結果。
二、 DCG-tree 中特殊的三群
以RT 的資料進行 DCG-tree 演算後,根據 DCG-tree 為基底的樹狀圖如圖 14,
第二、三、四群集中在圖的右邊,由於這三群的人數少且顏色較為一致,可能是 風險容忍度較為特殊的人。因此,針對這三群樣本,再次執行DCG-tree 演算法 看是否會有組間差異,且設定群數不變,並對其分群結果做檢定,比較其顯著項 的多寡。從下表 17 可知RT 在經過二次 DCG-tree 演算法後,沒有顯著項的個數,
因此,無論在HC 或 DCG-tree,這三群皆有較相同的特徵,可能就是高風險行為 的一群人。
SS 在 HC 下,共分兩個群聚
檢定的資料集 MOM 的組合變數 DAD 的組合變數 檢定 t-test K-W t-test K-W
顯著的變數 無 (3) 無 (7)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 14 RT 在 DCG-tree 的樹狀圖下,看 HC 的群聚情形。
(由左至右為第一、四、二、三群)
表 17 RT 特殊群聚在 DCG-tree 下的檢定結果。
以SS 資料集進行 DCG-tree 後,根據 DCG-tree 為基底的樹狀圖如圖 15 下,
可以觀察到第二、三、四群集中在圖的右邊,這三群人數較少且顏色較一致,因 此,行為情境的表現較為特殊。因此,針對這三群樣本,再次執行DCG-tree,。
從下表 18 可知SS 在經過二次 DCG-tree 後,ANOVA 僅有一個顯著變數,因此,
無論在HC 或 DCG-tree,這三群皆有較相同的特徵,可能就是高風險行為的一群 人。
RT 在 DCG-tree 下,共分三個群聚
檢定的資料集 MOM 的組合變數 DAD 的組合變數
檢定 ANOVA K-W ANOVA K-W
顯著的變數 無 無 (9) (9)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 15 SS 在 HC 的樹狀圖下,看 DCG-tree 的群聚情形。
(由左至右為第一、四、二、三群)
表 18 SS 特殊群聚在 DCG-tree 下的檢定結果。
根據上述兩演算法對特殊群聚的檢定結果,不論是DCG-tree 或 HC 演算法,
顯著的變數都十分的少,代表這些特殊群聚之間差異不大。進一步比較HC 跟 DCG-tree 的顯著個數,可以發現 HC 略多於 DCG-tree,但看不出明顯差異,因 此,我們認為將特殊的群聚經過第兩次分群後,HC 的表現略佳。由上述比較可 知,HC 在特殊群聚的表現較佳。因此,RT 資料集在 HC 下,可推論第四、五群 可能為高風險行為的青少年;SS 資料集在 HC 下,可推論第四、五群可能為高 風險行為的青少年。
SS 在 DCG-tree 下,共分三個群聚
檢定的資料集 MOM 的組合變數 DAD 的組合變數 檢定 ANOVA K-W ANOVA K-W
顯著的變數 (7) (7) 無 無