• 沒有找到結果。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

(3) 計算相似性衡量

選定分群變數後下一步就是計算研究對象的相似性,相似性是集群分析中的 基本概念,它反映了研究對象間的親疏程度,而集群分析乃根據研究對象間的相 似性來進行分群。其中有很多種相似的衡量方法,都從不同的角度衡量了研究對 象的相似性,主分為以下兩類:距離衡量和關聯衡量。在距離衡量方面,主要用 於計量資料,常用的距離計算有歐基里德距離(Euclidean Distance)、曼哈頓距離 (Manhanttan Distance)、柴比雪夫距離(Chebychev Distance)等;而在關聯衡量方 面,主要用於計質資料,常用的衡量方式有卡方值測距(Chi-square Measure)、Phi 平方值測距(Phi-square Measure)等。

(4) 選定集群方法進行集群

選定了分群變數、計算出相似性矩陣之後,下一步就是要對研究對象進行分 群,此時主要課題是選定集群方法及確定形成的分群數。集群分析方法主要分為 層次集群法(Hierarchical Method)與非層次法(Non-Hierarchical Method)二類。

層次集群法又可分為凝聚法和分離法。凝聚法是將每個觀察值各自看成同一 群,先把距離最近的兩群合併,然後重新計算群與群之間的距離,再把距離最近 的兩群合併,每一步減少一群,一直持續同樣過程直到所有的觀察值歸為某一群 為止;而分離法與凝聚法的過程相反,一開始將所有觀察值分為一群,之後每一 步增加一群,直到每個觀察值都自成一群為止。層次集群法在集群過程中需要儲 存距離矩陣,並且在每一步的併群過程中都需要作很多計算,而非層次集群法克 服了層次集群法的這兩個缺點,適用於大樣本的集群分析,分為以下四步驟:(1)

指定要形成的集群數;(2)調整分群:計算每個觀察值到各群重心的距離,把 每個觀察值歸入距重心最近的那一群;(3)重新計算每一群的重心;(4)重複 步驟(2)~(3),直到沒有觀察值可以再調整為止,並重新形成新的集群。在 Clementine 12.0中集群分析方法有K-means、Kohonen Network 和Two Step等,由 於第四節實證分析時將使用K-means法及二階段集群分析(Two Step Cluster)兩中

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

方法分析之。

(5) 集群結果的解釋與驗證

得到集群結果後,最後還應對結果進行驗證和解釋,以保證集群分析解是可 信的。集群分析後,對集群結果進行解釋是希望對各個集群的特徵進行描述,並 根據集群特徵予以集群合適的名稱,若命名不恰當所造成的問題,正如同因素分 析命名一樣,將造成讀者閱讀的不易與誤解。通常集群分析只是研究的起點,透 過集群分析將分群結果儲存成分組變數,以進行後續的分析,同時亦可透過其他 變數,幫助描述各群的特徵,了解各變數中觀察值分布狀態,並解釋各群差異的 原因。