• 沒有找到結果。

第五章 研究過程與結果

第一節 DCG- TREE

度分別為 0.614(RT)及 0.798(SS)。

表 4 RT 在 DCG-tree 下的群聚個數。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

表 5 SS 在 DCG-tree 下的群聚個數。

圖 4 RT 在 DCG-tree 下的分群結果。

組別 1 2 3 4 5 6

個數 452 26 35 16 1 1

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 5 SS 在 DCG-tree 下的分群結果。

二、 對大群進行二次分群

以RT 大群作為新的資料集,選用歐式距離作為距離矩陣,進行 DCG-tree 演算,從EW 數列圖中,同樣挑選了三個溫度,根據樹狀圖的結果,分成六個群 聚並對各群人數進行觀察,發現有些群聚只分到一個觀測值,也就是仍然有一個 群聚裡面只有一個觀測值的情況,因此,推估此大群仍為特徵較相近的一群,因 此,故以原始資料作為比較基準。以SS 大群作為新的資料集,選用漢明距離的 方式,進行DCG-tree 演算,根據樹狀圖的結果,發現有兩群只存在單一觀測值。

為加強 SS 資料集的數據間的差異,將其關係放大 100 倍,並使用歐式距離計算,

進行DCG-tree 演算後,根據樹狀圖的結果分了五群,其中單獨一群的觀測值,

在 100 倍的資料上有出現一群。因此,以漢明的原始資料作為比較基準。以上結 果整理於表 6-7。

SS Euclidean Hamming

100 倍 原始資料

差 異 的 變 數 有 MPersAtt 、 MShame 、 MBehcontrolSum 、 MBehMonitorSum 、 MPsycontrolSum,而在 DAD 的變數下,具有顯著差異的變數有 FShame、

FBehcontrolSum、FBehMonitorSum,其中在 MOM 和 DAD 皆有出現的有 shame、

BehcontrolSum、BehMonitorSum,因此,推測這三個變數在此分群結果下群間差

顯著的變數 (3,7,8,9,10) (3,6,7,8,9,10) (7,8,9) (7,8,9) Tukey HSD 3

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

接著以熱圖呈現其差異如圖6,x 軸為變數,y 軸為觀測值且由下而上代表 第一到第四群,但由熱圖可知第一群與其他群間差異並不大,造成檢定顯著極可 能是因為此群數量多於它群。另外編號8、9、10 的變數,因尺度較大,所以此 熱圖未一併畫出。

圖 6 (左)以 RT 在 DCG-tree 下的分群結果,看 MOM(左)和 DAD(右)群間差異。

四、 檢定以類別型資料分群後的群間差異

SS 的 DCG-tree 分群結果如下表,發現 K-W 顯著項與 ANOVA 的顯著項兩 者差異不大,針對DAD 變數下做 ANOVA 和 K-W test,皆有高達八個顯著變數,

MOM 變數下,也有七個顯著變數。從 ANOVA 結果來看,在 MOM 下,兩檢定 具 有 顯 著 的 變 數 有 MInvaFeel 、 MLoveWith 、 MDisresp 、 MShame 、 MBehcontrolSum、MBehMonitorSum、MPsycontrolSum,在 DAD 下兩檢定具顯 著 的 變 數 有 FInvaFeel 、 FLoveWith 、 FDisresp 、 FShame 、 FBehcontrolSum 、 FBehMonitorSum、FPsycontrolSum,其中 InvaFeel、LoveWith、Disresp、Shame、

BehcontrolSum、BehMonitorSum、PsycontrolSum 在 MOM 和 DAD 皆為顯著變數,

可知在此分群結果下,以這六個變數作為反應變數,其群間差異較大。進一步對 ANOVA 做 Tukey HSD,如表 10。發現例如 MShame(編號 7)中,第四群與第 一群及第三群有顯著差異,而在 DAD 可以發現在 FConsVerExp、FPersAtt、

(2,5,6,7,8,9,10) (2,5,6,7,8,9,10) (1,3,5,6,7,8,9,10) (1,2,3,5,6,7,9,10)

Tukey HSD 2

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 7(左)以 SS 在 DCG-tree 下的分群結果,看 MOM(左)和 DAD(右)群間差異。

以DCG-tree 演算法對 RT(連續型)與 SS(離散型)分群,可以發現 SS 的 顯著項較RT 來得多,而在 RT 中,皆有顯著的變數有編號 7、8、9 為主,在 SS 中,皆有顯著的變數有編號5、6、7、9、10 為主。因此變數 7 與 9 可能為主要 影響青少年風險行為原因。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

相關文件