• 沒有找到結果。

第三章 研究設計

第二節 研究方法

地筆數,再以此銜接至集群分析(Cluster Analysis),期望能透過適當的特徵變數 投入歸納出主要開發型態,以便於分析區位、整合與政策因素對開發土地與資本

全名為歐基里德距離(Euclidean Distance),係應用畢氏定理概念,計算觀察值 在各項連續變數之差平方,再加總後取平方根即可得出兩者間的直線距離。馬氏 距離(Mahalanobis Distance)則相當於歐氏距離以分群變數之共變異數逆矩陣 S-1 進行加權後之距離,故當分群變數彼此獨立時,馬氏距離與歐氏距離將會相 等;而若分群變數之間存在相關,利用馬氏距離衡量將較為精確。曼哈頓距離

(Manhattan Distance)又稱城市區塊距離(City Block Distance),與計算直線距 離的歐氏與馬氏距離不同,其所衡量的是觀察值間的折線距離,因此被廣泛應用

(Non-hierarchical Cluster),前者又可再分出聚集法(Agglomerative Method)與 分解法(Divisive Method)兩種。在聚集法的階層集群中,首先將所有觀察值都 視為單獨的群體,接著將相似性最高的兩群合併,再重新計算相似性,重複上述 過程直到所有觀察值合為一群為止,因此觀察值一旦被分入同一群,在後續步驟 中皆必然在同一群內(如圖 3-1 左)。分解法則是將聚集法之操作過程前後顛倒,

因此已被分入不同群的觀察值,必定不會再次出現在同一群內(如圖 3-1 右)。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

第三章 研究設計

圖 3-1 階層分群概念─聚集法與分解法

然而由於階層集群法的計算較為繁複,通常在分析超過 200 筆的大量資料時 會改採非階層集群之 K 平均法(K-means)。在操作非階層集群法時,須先給定 集群數量進行初步分群並計算各群重心,再將各筆觀察值歸入距離其重心最近的 群集,待歸類完畢後再次計算重心並重新移動觀察值,重複程序直到觀察值不需 重新移動為止。由於此方法分群時會不斷重新選擇個別觀察值最適合的群集,而 能夠避開階層集群法中既定群聚關係無法改變的缺點,但其最大的問題在於最適 集群數通常無法在事前得知,故本文將採用兩階段集群分析,即先利用階層集群 法決定最適集群數,再以 K 平均法進行分群。

(四)結果解釋

實務上通常承認 3~10 群的群集數為集群分析的相對最適結果,但各項分群 變數對於群集間差異的影響在統計上是否顯著,仍須經過單因子變異數分析

(One-way ANOVA)或區別分析的檢驗(周文賢,2002:724)。若分群結果在 各項變數皆具統計上的顯著性,為了便於分析時識別,應為各個集群選擇最能彰 顯其特徵、且不易造成誤解之命名。

聚集法

A B C D

A B CD

A BCD

ABCD

分解法

A B C D

A B CD

A BCD

ABCD

此外,本文以迴歸變異數分析(ANOVA for Regression)作為模型配適度之 指標,該方法將觀察值在應變數的總變異(SST)分為可用線性關係解釋之迴歸 變異(SSR)、以及無法由線性關係解釋的殘差(SSE),即 SST=SSR+SSE,並 利用 F 檢定測試兩者之平均平方和 MSR、MSE 差異是否顯著。若檢定結果為顯 著,即代表模型配適度佳。

2. 多元共線性檢定:

在多元線性迴歸模型中,若自變數之間存在高度相關,則可能產生多元共線 性問題(Multi-Collinearity),導致模型估計不精確的情況發生。為確定迴歸模型 不存在此共線性問題,本文採用變異數膨脹因子(Variance Inflation Factor,簡稱 VIF)進行檢定。第 i 項自變數之 VIF 計算方式如下列公式:

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

第三章 研究設計

3. 係數顯著性檢定:

迴歸係數代表自變數變動一個單位時,模型預測將造成應變數之變化量,惟 該項自變數與應變數間之線性關係必須具有統計上的顯著性,估計出的係數值才 有解釋的意義。在係數顯著性檢定中,若迴歸係數之 t 檢定結果達到統計上顯著,

則拒絕係數值等於 0 之虛無假設,即該項自變數對應變數具有顯著之影響力。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

34

相關文件