• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

研究假設,概可區分獨立樣本右尾 T 檢定、配對樣本雙尾 T 檢定及變異數分析 等假設檢定方法,茲將其理論基礎分述如後。以及透過變異數分析探討在不同玻 璃型號的交易金額間的差異性,並且依多重比較方法的應用,可以深入瞭解春節 天數間的相互關係。

三、卡方獨立檢定

獨立性檢定分析主要探討變數與變數在不同種類的條件下,瞭解變數間不同 種類的關聯程度。

四、 集群分析

將一堆繁雜如山一樣多的資料分類,使用集群分析將它們變成可管理的且有 意義的群。集群分析也可以做資料簡化,目的是將整個母體或受訪樣本分成能提 供資訊的幾個小群組。

第三節 分析方法

一、敘述性統計

透過對數據資料的圖像化處理,將資料摘要變為以簡單易懂的圖表來表示,

以直觀了解整體資料分布的情況,也可以透過分析數據資料,以了解各變量內的 觀察值集中與分散的情況。

二、平均數檢定

所謂「平均數檢定」係對所觀察的現象間的平均數間之差異或整體內部各單 位間的差異,進行分析的方法,主要在於說明平均數的代表性。依其分析理論和 研究假設,概可區分獨立樣本右尾 T 檢定、配對樣本雙尾 T 檢定及變異數分析 等假設檢定方法,茲將其理論基礎分述如后。

(一)獨立樣本右尾 T 檢定

無母數統計分析(Non-parametric Statistics),或稱無母數統計分析,適用於母

或資料不符合常態分配時,可選用無母數方法中的 Kruskal-Wallis tset (又稱 H 檢 定法),檢定的變項可以是等距或等比率變項,或是次序變項,以考驗各組平均

Test Statistic:

=

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

集群分析在很多領域,如企管、心理、生物、醫學、教育、社會、人類學、

農業、地理、語言、基因、工程等科學,但他在不同領域使用名稱不一樣,如 Q 分析(Q Analysis)、分類分析(Classification)、類型學(Typology)、圖案辨識(Pattern Recognition)、數值分類(Numerical Taxonomy)等,都是集群分析的別名。下面將 舉例集群分析的應用(陳順宇,2004)。

1. 生物學家在對不同動物做有意義描述前,必須對動物不同品種做分組,依據 現代生物界的分法,人類是屬於靈長類,哺乳類,脊椎類,動物類,注意越 上面的層,其分子間的相似性越高,如人與其他靈長類動物的共同點比哺乳 類動物就來得多。此種方式的分群法為聯合法(Joining)(或稱分層樹形法 (Hierarchical Tree)。

2. 醫學方面對疾病種類做分群,或對疾病治療方法做分群,或對疾病的徵狀做 分群,都可得到很有用的分類結果。精神病治療法如能對妄想狂、精神分類 等徵狀分群作正確診斷是成功治療的主要關鍵。

3. 考古學研究者試圖利用集群分析方法對石頭工具、葬禮用具、陶瓷品等做分 類。

4. 在行銷方面,研究人員以問卷方式收集消費者資料,依購買動機將顧客分成 創新群、意見領袖群、早期大眾群、晚期大眾群與跟隨群等。

通常當你想要將一堆繁雜如山一樣多的資料分類,可使用集群分析將它們變 成可管理的且有意義的群。集群分析也可以做資料簡化,目的是將整個母體或受 訪樣本分成能提供資訊的幾個小群組,例如,如能將母體分成幾個不同態度的群 組,了解群體中幾個主要群組的態度,以這種方式研究人員可以將資料簡化,也 因次能夠以更簡潔、更容易了解的方式來描述受訪個體,且只損失了一小部分資 訊。

(二) 集群分析原理

1. 群內差異小群間差異大

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

集群分析是將個體(受訪者或變數)分成有意義群組的一種統計分析技巧,換 句話說,集群目的是依據個體間的相似性將樣本分成幾群互相沒有交集的群組,

同群組內的個體相似性高,不同群組的個體相似性低。與區別分析不一樣,集群 分析所分的群組並不是事先訂定好的,事實上此分析技巧就用來指認群組。

2. 分層法與 K 組平均法

上面對動物做分群方式是一種分層分群法(Hierarchical Clustering

Procedure),分層法也稱聯合分群法,利用某種測量個體間的相似性或距離,將 個體連在一起,而且月下層群體越大,此種分群法最典型的結果是分層樹形圖 (Hierarchical Tree)。值得注意的是分層法中事先並不知道會分成幾群。與分層法 不同的另一種分群方式是研究依據其他資訊或主觀認定,事先已決定要將群體分 成幾群,則可以使用 K 組平均法(K-means)進行分群工作。

3. 集群變數與異常點

在集群分析中選取作為分群依據的集群變數是影響分群結果重要的因素,所 謂集群變數是一組用來比較個體特徵差異的變數,集群分析是以這些變數做為比 較個體的基礎。集群分析的結果會受不適合的集群變數的影響,也會因異常點(與 其他各體有很大差異者)的影響,所謂異常點是指因此個體在某些變數指標上有 很大的數值,可以很容易找出異常點,當某筆資料被認定是異常時,必須評估其 在母體的代表性,如果是無代表性的,則可以將它去除後再進行集群分析。

對一群個體做分群工作會因採用的集群變數不同而得不同的群組,對一群學 生以性別為集群變數,可分成男女兩群;依系別分可能分成很多群;以身高為集 群變數也可能分成高、中、矮三群。

4. 集群分析的假設

與其他統計分析程序不同,經常研究指不需要任何的假設就可使用集群分 析,但他仍不失研究探索階段的好方法,因此集群分析可看成「尋找最有顯著性 的可能解」的一種方法,所以在某些情況下(如 K-Means 分群法)即使報表會產生 檢定的 P 值,但事實上此顯著性與一班統計檢定的顯著性意義並不相同。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

5. 集群分析群組數的決定

集群分析一個主要問題是如何決定分成幾群,如有方法能知道群組數的 範圍,對分群將會有很大的幫助,但此資料可能很難獲得,在分群法集群分 析,常建議以樹形圖分群步驟中距離最大改變為分界點,當作決定群組各數 的依據,但此種分群方法也有可能誤導,以最大距離改變當群組個數的依據 是必要條件而非充分條件。

(三) 集群分析資料型態

1. 由 n 個個體測量所得 p 個變數的原始資料;

2. n×n 相似矩陣(Proximity Matrix)或距離矩陣;

3. 已準備好的排序資料,例如,一群人對 n 個項目的相似性做排序。

(四) 集群分析驗證

集群分析驗證通常包括兩個部分,第一部分是集群數的決定,由同群內 量測個體間的相似性或相關性來決定母體分成多少群組,第二部分是做剖面 圖以便決定各群組的特徵,此步驟可配合區別分析對所得的群組做驗證。

集群分析的驗證(Validation)過程或剖析(Profiling)過程由幾個步驟組成,

驗證是以對各種不同的分群方法所得結果做比較,可以幾次隨機選取起始點 的方式進行,利用 K 組平均法(K-Means)對所得的群組做驗證,如果幾次所得 的群組個數及中心點與原先方法的分群結果相差不大,表示分組穩定。在剖 析過程,我們會以其他變數做為評估依據,利用 ANOVA 的 F 值檢查各群的 平均數是否有顯著差異,F 值越大表示所分組群差異性越高,也就是群集分 析越成功。當分群成功,則同群內的個體會很接近,以不同群組間的個體會 離的很遠。

(五) 分群方法

分群方法有很多種,而差別在於不同方法之距離,包括點間距離語群間 距離之計算,以下為八種分群方法:

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

2. 中心法(Centroid Method) 3. 完全聯結法(Complete Linkage) 4. K 平均數法(K-Means)

5. 最大概似法(Maximum Likelihood) 6. 單一聯結法(Single Linkage)

7. 二階段密度聯結法(Two-Stage Density Linkage) 8. 華德最小變異數法(Minimum-Variance Method)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第肆章 實證分析

相關文件