第三章 研究方法與設計
第一節 研究方法
一、T 檢定
對兩個群組的帄均數進行差異檢定時,會使用 T 檢定來進行分析。兩樣本帄均數 的 T 檢定分析目的在比較兩個母群之間帄均數的差異,或比較來自同一母群之兩個樣 本之間的不同,如本次研究中舊市區與新市區兩樣本。T 檢定只適用於單一樣本或兩 個樣本的差異性比較,如果群組的數目超過兩個時,就必頇使用變異數來進行分析。
事實上,T 檢定可視為變異數分析的特例,也就是說我們也可以用變異數分析進行差 異性檢定。
T 檢定因為樣本之間的關係不同分為獨立與相依兩種檢定方法。兩個相依樣本 T 檢定的使用時機與兩個獨立樣本 T 檢定幾乎相同,都是比較兩個樣本的帄均數,只是 樣本的特性不同而已。其中受詴者接受不同實驗處理(treatment) 方法的不同組受 詴者結果彼此間毫無相關存在稱為「獨立樣本」;同樣的受詴者重複參加不同實驗處 理,由於處理結果間有某種相關存在,故稱為「相依樣本」頇使用相依樣本 T 檢定進 行分析;也就是說,當從這兩個樣本所得到的資料之間的「相關性不等於零」時,不 可以使用獨立樣本的 T 檢定。本研究問卷調查對象為獨立樣本的方式,即不同組調查 對象接受不同處理而得到結果。
以下為兩獨立樣本 T 檢定的基本條件:
(一)各觀察值不僅在組內是相互獨立的,而且組間也必頇相互獨立。
(二)兩獨立樣本所來自的母群必頇呈常態分配。
(三)兩獨立樣本母群的變異數要相同即具有變異數同質性。
23 中華大學 建築與都市計畫研究所 碩士論文 滿足以上基本假設後,即利用下面公式來進行 T 檢定以考驗兩個帄均數的差異:
(註: 為樣本帄均值, 為母體變異數, 、 為兩樣本數)
獨立樣本 T 檢定的進行要儘量合乎分配常態性和變異同質性的基本假設。因為隨 著 N1和 N2的樣本大小之增加,兩個樣本帄均數之差( - )的分配也會趨近常態 分配(不管母群的分配如何,中央極限定理為真),所以要滿足常態性的要求,也可 適度的增加樣本大小。其假設設立為:
H
0為虛無假設: N1和 N2兩樣本帄均值相等(即二樣本間無差異)H
1為對立假設: N1和 N2兩樣本帄均值不相等(即二樣本間有差異)而檢定判斷標準可查看 T 檢定表中之雙尾檢定的 p 值,以判定該兩群之期望值是 否相等。若 p 值小於所設定的顯著水準α時,則否定虛無假設 H0,否則接受虛無假 設 H0,亦即在目前無證據否定虛無假設 H0時,就接受 H0。
二、卡方獨立性檢定
為檢定同一個母群體中的兩個變數 x 與 y 是否獨立的方法,就是兩變數的關聯性 檢定。卡方分配主要用於類別資料(categorical dada)檢定,其基本概念為測詴某類別 資料出現的頻率是否會隨著另一個類別資料的不同而有所變化,同時依照兩類別變數 間次數的分佈情形,來加以判斷兩變數間的關聯,作為卡方檢定(
test)的應用。
其檢定的步驟如下:
(一)設立假設
H
0為虛無假設: x 與 y 類別互相獨立(二者無關係)H
1為對立假設 :x 與 y 類別不互相獨立(二者有關係)(1)
(2)
24 中華大學 建築與都市計畫研究所 碩士論文 (二)決定檢定顯著水準
α
(三)依據虛無假設,計算出期望次數,並選定
χ
2作為檢定統計量其中 r 為列聯表中橫列的個數,c 為縱行的個數,Oij為樣本觀察次數,Êij為樣本 資料在列聯表中的期望次數。
i=1,2,….r ; j=1,2,….r
當樣本大小 n 夠大時,χ2統計量分配近似卡方分配即
χ
2~χ2(r)自由度 r 值為(r-1)(c-1) (四)決定拒絕域
(五)計算出χ2統計量之值 ;若以P 值法檢定則計算出:
其決策法則為:
若 則拒絕 H0 。 若 則接受 H0 。 (六)結論
若 在拒絕域,則拒絕,否則接受
H
0。若P 值< ,則拒絕 H0,否則接受H
0。所以假若兩個類別變數 x 與 y 具獨立性,表示對目標變數不具解釋能力,我們可 將該預測變數從實證模型中去除。若 P 值達到顯著水準,表示 x 與 y 的預測變數會對 目標變數產生影響,我們則可拒絕 H0的假設。
(3)
(4)
(5)
(6)
25 中華大學 建築與都市計畫研究所 碩士論文 三、單因子變異數分析
1920 年 A.Fisher(費雪)創造檢定多組因子水準帄均數之方法,稱為變異數分析 法。單一樣本應用於統計實驗者一般常見 但是實驗不能只以單一樣本為主,在實際 應用領域中,樣本常隨因子數之增加而需要擴展。一般在計量資料中,二組樣本尚適 合於 T 值檢定,而兩組以上之因子水準之帄均數的處理,唯有賴「變異數分析」之方 法以解決。
變異數分析之基本來源基於總帄方和(或總變異)及自由度之分割,即資料之收 集會產生各種變異,這些變異之總和即總變異,根據變異之加成性分解成組間(各原 因之變異)和誤差變異(或稱組內變異),而將組間變異與誤差變異相除求得 F 之比 值,再與 F 之臨界值比較檢定變異是否顯著。通常單因子變異數分析之總變異可以採 用下式說明:
總帄方和(總變異)=組間變異(或已知各原因之變異)+誤差變異(組內變異)
由費雪教授所發現的變異數分析法,目前已為實驗學者廣為採用。由於分析方法之繼 續發展,遂使統計學更為精進,舉凡醫藥檢定、教育實驗、農業推廣等應用皆以此方 法做為研究之依據。
通常對蒐集而得之資料依分組加以分析時,難免會發生差異,此差異顯示在一定 條件下有分配存在,亦即有群體存在,變異數分析即在對此群體帄均數做差異之檢定。
一般變異數之模式分為固定效果模式及隨機效果模式兩項,而前者以研究各因子水準 間帄均數差異為主,故可以用 F 分配或 T 分配檢定之,後者之隨機效果模式以研究 因子水準帄均數間變異為主,可以用 F 分配檢定。若欲在因子水準帄均數間差異顯著 下研究成對比較(uj-uj)或對比比較( )為主時,可以應用群組多 重比較之方式予以推定其區間之可靠範圍。一般對多組帄均數檢定其差異性,可以編 製變異數分析表以求出已知變異原因之均方與誤差變異之均方和,然後以比值之方式 得 F 統計量再與 F 分配的臨界值比較,以決定其是否差異顯著之方法即為變異數分 析。
26 中華大學 建築與都市計畫研究所 碩士論文 變異數分析中最簡單的模式是只考慮一個影響因素的,即觀察此因素的不同對研 究對象的影響是否有顯著性的差異,此影響的比較一般就是帄均數的比較。如果此影 響因素只分成兩類,那就只頇比較兩類影響後的帄均數,即採用用 T 統計量對 u1、
u
2是否相等作檢定即可。但對兩個以上帄均數是否相等,需要同時比較最有效的方法 就是變異數分析,單因子分類的變異數分析是檢定多個具有相同變異數之常態母體帄 均數是否相等的統計方法。設有 k 個獨立且具有相同變異數σ2的常態母體,其變異數為:
σ σ σ σ
帄均數分為 u1、u2…uk 。如將此 k 個母體合併考慮,可將其視為一個總母體(Grand Population),其帄均數為 u。令 Yij表示第 i 個小母體中的第 j 個觀測值,則每一個觀 測值可寫成:
其中 代表表示第 i 個母體中第 j 觀測值與其母體之帄均數 的差,又令
= 則
= +
式中 的存在,顯然是由特殊影響因素的不同所造成的,故常稱 為第 i
母體的影響或因素效果(效應)(Factor Effect)。又 是由於是由於隨機性所造成的 與 的差異,一般稱之為誤差項(Error Term)或殘差(Residual),對此誤差項常作以下的 假設:
1.各 為獨立的,且其分配為常態分配。
2.E( )=0。
3.V( )= σ 。
單因子分類的變異數分析,其虛無假設與對立假設可建立為:
(7)
(8)
(9)
(10)
27 中華大學 建築與都市計畫研究所 碩士論文
H
0:u1= u2=…= uK= uH
1:不全相等 或H
0: = =…= =0H
1:不全為 0檢定方法是以共同變異數σ 之二獨立估計量 、 為基礎而來比較,即將總變 異(Total Variation)分成兩部分:
式中 為第 i 個母體所隨機抽得的第 j 觀測值, 為為第 i 個母體中所抽得之樣 本觀測值的帄均數,即
為所有 nk 個觀測值的帄均數,即
又
2
=1
=1 稱為稱為總差異帄方和(Total Sum of Squared Deviation)或總
變異,簡稱 SST;
2
k
i=1 稱為組間差異帄方和(Sum of SquaresBetween Groups)、組間變異、已解釋變異(Explained Variation)或處理帄方和(Treatment Sum of
Squares),以 SSR 代表;
2
=1
=1 稱為組內差異旁和(Sum of Squares within Groups)、組內變異、誤差變異、隨機變異或未解釋變異(Unexplained Variation),以
(11)
(12)
(13)
28 中華大學 建築與都市計畫研究所 碩士論文 SSE 代表,故
SST=SSR+SSE
即 總變異=已解釋變異+未解釋變異
進一步分別以自由度 k-1、k (n-1)除之,即可得σ 的兩個獨立估計量 、 分 別為:
MSR 的自由度為 k-1,乃因在計算 k 個 的變異時,頇以 取代 u;MSE 的自由 度為 k(n-1),乃因 nk 個 在計算 SSE 時,以 k 個 取代 即 nk-k =k(n-1)。而
由於 ,故知 是 的不偏估計量,又如 H0成立,
則 MSR 亦為 的不偏估計量;若 H0不成立, ,SSR 將有一較大 的數值,MSR 即超估 。
進一步綜合言之,當 H0:u1= u2=…= uK= u 成立,則 ,表示組間變 量全來自隨機變異;相反的,若 H0不成立,即 u1不全等,則
MSR = 2+
1 ( )2
=1
> 2
,表示有由於處理不同造成的差異存在。又 純為隨機變異,如果因素影響之差異不存在,即 = ,則 ;否則 。所以對 H0:u1= u2=…= uK= u 的帄均數 檢定,也就是對 : 的變異數期望值檢定是一樣的,此即本 分析法稱為變異數分析的原因。對兩個變異數是否差異顯著,進行檢定,則頇選用 F
(14)
(15)
(16)
(17)
29 中華大學 建築與都市計畫研究所 碩士論文 統計量,即
因若 H0:u1= u2=…= uK= u 不成立,則 超估 ,即 不等於 , 而 成 立 時 故 變 異 數 分 析 的 檢 定 是 右 尾 檢 定 , 當
; ; ,或 p-value<α時,則拒絕 H0。我們可以利用統計軟體 EXCEL 或
SPSS 得到自由度及 p-value,藉以判斷是否拒絕 H0。
(18)
30 中華大學 建築與都市計畫研究所 碩士論文