第三章 分析方法介紹
3.3 集群分析
集群分析(cluster analysis),又稱群集分析,其目的在於將物件(包括個體、
產品、品牌、國家、城市等)加以集結成群,使得在群體內的個體的同質(homogeneity)
很高,群體之間的異質性(heterogeneity)很高。
3.3.1 集群分析的主要目的
1.對資料作簡化的工作及分類 2.將相似的個體歸為一群 3.使同一群的差異最小
3.3.2 集群分析與其他分析的區別
1.集群分析與因素分析的差別
·當我們針對個人來建立集群時,這種分析叫做Q分析(Q-Analysis)。
·當我們針對變數來建立集群時,這種分析叫做 R 分析(R-Analysis)
也即集群分析針對的是受測者,而因素分析針對的是變數 2.集群分析與區隔分析的區別
區別分析是以界定清楚的二群(或以上)來檢視什麼變數最能區分這些群,
而集群分析是將未經區別化(undifferentiated group)的一群個人、事件或物體,
重新組合成同質性的次群體。
3.3.3 集群分析的原理及步驟
集群分析的基本原理是基於以下的步驟:
1.選擇要做集群分析的樣本
2.界定衡量這些物體、事件或個人的變數利用相關分析、歐幾里得距離(Euclidean distances)及其他技術來計算個體之間的相似性;
3.選擇互斥的集群(也就是使得群內同質性、群間異質性極大化的集群)或層級 式排列的集群;
4.做集群間的比較與驗證。
集 群 分 析 分 為 非 階 層 集 群 法 ( non-hierarchical methods ) 、 階 層 集 群 法
(hierarchical methods)。 在 SPSS 中,非階層集群法由「K 平均數集群」(K-Means Cluster)程序來執行;階層集群法由「階層集群分析法」(Hierarchical)程序來執 行。此外還有二階段集群法。
1. K 平均數集群(非階層集群法)
非階層集群法是在分群的過程中,將原有的集群加以打散,並重新形成新的 集群。非階層集群法也有幾種不同的計算方法。各種方法都是先選出某些種子點
(seed point)作為集群的中心。K 平均數法(K-means method)是使用得比較普 遍的方法,其演算步驟如下:
(1)將各個事物點(個體)分割成 K 個原始集群;
(2)計算某一個事物點到各集群的平均數(重心)的距離(距離的計算通常採用 歐幾里得距離),然後將一些事物點分派到距離最近的那個集群。重心計算後得 到新事物點的那個集群的平均數,以及失去該事物點的那個集群的平均數。
(3)重複步驟 (2),直到各事物點都不必重新分派到其他的集群時為止。
2. 階層集群分析法
階層集群分析法有二種方法:集結式集群法(agglomerate hierarchical method)
及區分式集群法(divisive hierarchical method)。
(1)集結式集群法在開始時是每一個事物點自成一個集群,然後根據相似性準則,
把相近的事物點合併成集群,一直到所有的事物點都併入同一集群時為止。
(2)區分式集群法在開始時是所有的事物點形成一個集群,然後再根據相似性準
則,把事物點劃分成較不相近的兩個集群,直到所有的事物點都自成一個集群時 為止。集結式集群法使用得較為普遍。
在集結式集群法中,連鎖法(linkage)是最常用的方法。 一般而言,連鎖法 有單一連鎖法(single linkage,以最小的點際距離作為集群間的距離)、完全連鎖 法(complete linkage,以最大的點際距離作為集群間的距離)及平均連鎖法(average linkage,以平均點際距離作為集群間的距離)
表 3-1 階層集群分析法對應關係
組間均連法(Between-group linkage) 單一連鎖法 組內均連法(Within-group linkage) 單一連鎖法 單連法(Nearest neighbor) 單一連鎖法 臻連法(Farthest neighbor) 完全連鎖法 重心連法(Centroid clustering) 平均連鎖法 中位數連法(Median Clustering) 平均連鎖法 3. 二階段集群法
K-Means Cluster 程序
階層集群法 Hierarchical 程序
二階段集群法
3.3.4 因子分析與集群分析