第三章 研究方法
3.3 統計分析方法與應用
3.3.4 專案成功與失敗判別分析
44
依據楊世瑩於SPSS 統計分析實務(民 97)一書中所定義及本 研究整理:判別分析主要目的在計算一組預測變數(自變數)的線 性組合(判別函數),對依變數加以分類,並檢查其再分組的正確 性,以期望該判別函數具有預測新樣本可歸屬到哪一群集之功能。
判別分析的基本假設之一為:每一個群體的共變異矩陣必須大 致相等,否則,其判別函數將受到扭曲,SPSS 統計軟體以 Box’M 來檢定各群體的共變異矩陣是否相等。
求算判別函數之方法,是由 R. A. Fisher (1936) 所提出的 Fisher’s 線性判別函數,重點在使組間變異對組內變異之比值為最大,
使用SPSS 統計軟體所求出的結果有二:
1. Fisher’s 判別係數:此方法會為每一組產生一條判別函數,用以 計算判別分數。可使用標準化後之係數,係數絕對值越大則重要 性越高。
2. 典型判別函數:此法所產生的判別函數個數恆比組別數少一,如 有 N 組將只有 N-1 條典型判別函數,且判別能力以第一條函數 為最大,然後依序遞減。
按判別分析組數分為:兩組判別和多組判別;按數學模型不同 分為:線性判別和非線性判別;按判別方法不同分為:逐步判別和一 次投入判別;按判別準則不同分為:距離判別、費雪(Fisher)判 別、貝依斯(Bayes)判別。
使用判別分析進行資料分析可以分成以下四個步驟:
1. 判別分析之基本假設
(1) 進行判別分析時必須符合兩個基本假設:一是觀察值在自 變數的測量值必須呈現多變量常態分配;二是依變數各組 樣 本 在 自 變 數 上 之 變 異 數 與 共 變 數 必 須 具 有 同 質 性
(Homogeneity)。SPSS 統計軟體使用 Box’M 統計量進行 兩組之共變異數相等性檢定。
(2) 顯著性>α=o.o5,得接受兩組之共變異數矩陣相等之虛無 假設。
2. 建立判別函數並進行顯著性檢定
45
在判別函數的個數中,若有 S 個自變數,K 個依變數,則可 得到(S,K-1)條線性判別方程式。標準化判別的線性模式如(3-1):
=a+ + ++…+ (3-1)
=判別函數 j 對物件 k 的判別 Z 分數 a 截距(Intercept),也稱為常數
=對每個變數 I 的判別權重
=自變數 i,對於物件 k
3. 評估判別變數的重要性及判別函數的意義
求得判別函數後,使用Wilks’Λ (Lambda) 求兩值均值差,以檢 定整組判別函數的判別能力,顯著性<α=0.05 代表判別能力達顯著 水準。Wilks’Λ 方程式如(3-2):
Wilks’ Λ= (3-2) 其中 代表組間平方和; 代表組內平方和。
標準化係數常用來評估某判別變數在判別函數的重要性,但變 數間共線性強時,判別變數在判別函數的重要性已失真,應避用之;
判別函數是判別變數的線性組合,故其意義,可由負荷或稱結構係 數(Structure Coefficient)來解釋。判別變數的負荷即為該判別變數 與判別計分Z 的相關係數(楊世瑩,民 97)。
4. 分類與預測
分類方法主要有切割值法、統計決策理論法、分類函數法及馬 氏距離法。SPSS 統計軟體使用統計決策理論將樣本觀察點分類。
此方法考慮先驗機率及誤判成本,希望能使誤判率(Misclassification Error)為最小。
鑑定判別函數的預測能力,可由判中率(Hit Ratio)評估。所 謂判中率是以歸類矩陣中正確預測出正確結果個數除以總數目之
46
比率,可由歸類矩陣中的對角線個案數目除以總個案數的比率,如 表3.4。
表3.4 預測正確與錯誤分類表 預測歸類
實際歸類 Ê=0 Ê=1
E=0 a b a+b E=1 c d c+d
a+c b+d a+b+c+d
資料來源:本研究整理。
判中率= ,錯誤率= ¸ (3-3)
樣本分群後利用判別分析方法取得各變數的判別係數,即可預 估判別分析函數,再將專案成功與失敗之變數分別帶入判別函數中,
即可計算出每一樣本的判別分數(Z score)。由 Z score 分數的高低 來預測與判斷專案可能會成功或失敗。當分數高過某一門檻值則預 測為專案成功;而低於某一門檻值則預測為專案失敗;介於兩門檻 值中間則為灰色地帶,此灰色地帶無法準確來認定專案可能成功或 失敗,就由專案經理或高階主管依據專案執行經驗進行判斷。本研 究以判別函數的特徵值為指標進行評估,確認此判別函數是有效的,
特徵值越大,表示該判別函數越有效。(莊緯璉,民 94)
47