• 沒有找到結果。

調節複迴歸的運用

N/A
N/A
Protected

Academic year: 2021

Share "調節複迴歸的運用"

Copied!
42
0
0

加載中.... (立即查看全文)

全文

(1)

國立交通大學

管理科學系

碩 士 論 文

調節複迴歸的運用

The Application of Moderates Multiple

Regression

研 究 生:詹翔婷

指導教授:謝國文 教授

(2)

調節複迴歸的運用

The Application of Moderates Multiple Regression

研 究 生:詹翔婷 Student:Xiang-Ting Zhan

指導教授:謝國文 Advisor:Gwo-Wen Shieh

國 立 交 通 大 學

管 理 科 學 系

碩 士 論 文

A Thesis

Submitted to Department of Management Science College of Management

National Chiao Tung University in partial Fulfillment of the Requirements

for the Degree of Master

in

Management Science January 2007

Hsinchu, Taiwan, Republic of China

(3)

調節複迴歸的運用

學生:詹翔婷 指導教授:謝國文

國立交通大學管理科學系(研究所)碩士班

摘要

本研究一開始在說明調節複迴歸的型式和運用方向,並且說明了可以運用在調節複 迴歸的檢定方式,接著將就所提出來的方法(Welch T-test、WLS、MWLS)來提出一些 討論並詳細說明能運用的條件以及分布情形。 本文中最主要的就是Welch T-test 和 WLS 之間公式的推導,利用公式的推導來證 明兩個檢定式的長像是相同的,但是因為兩個的自由度不同,所以檢定值的分佈也會有 所不同。 最後在利用SAS 軟體來進行模擬分析的動作,分別利用樣本數的大小和數目的異 同,來分別做了4 組的實驗,而四組當中又將不同的變異數做各種的組合,求出在各種 情形下的3 種檢定的型一誤差,並藉此比較出在 α=0.05 的情形下,Welch T-test 優於其 他2 種檢定方法的證明,並且利用公式推倒的證明和模擬分析的研究結果來推翻了 Overton(2001)所提出的說法。

(4)

The Application of Moderates Multiple Regression

Student: Xiang-Ting Zhan Advisor: Gwo-Wen Shieh

Department ﹙Institute﹚ of Management science

National Chiao Tung University

ABSTRACT

This research is stating the modeling of Moderates Multiple Regression and application direction at the beginning, and has proved that can use it in the examination way of Moderates Multiple Regression , then will put forward the condition which can be used in some

discussions and elaboration and distribution situation on the method (Welch T-test , WLS , MWLS ) put forward.

A main one in this research is Welch T-test and WLS formula derive in the article originally, is it prove two assay type long as if the same to make use of the deriving of the formula, but because the degree of freedom of two is different, the distribution of examining definite value will be different to some extent.

Finally using the SAS software to imitate movements analyzed, utilize the similarities and differences between size and figure that samples are being counted separately, we use 4 group of experiments separately, and four group count various kinds of associations different variation, type one error that the eggplant lies in the types of 3 kinds of examination under various kinds of situations, and relatively lie in α= 0.05 situations, Welch T-test is superior to the identification of 2 kinds of other examination methods , and the result of study of utilizing identification and simulation that formulae pushed over to analyses has overthrown the statements put forward of Overton (2001 ).

(5)

誌謝

這是我待在這個學校的第三年了,在這段時間當中,發生了很多的事情,而這些雜 事也影響了我的情緒,讓我一直無法專心的定下心來寫出我的論文,也讓我在其他同學 都已經畢業工作的現在,還留在學校為我的論文加油。 但是,現在看到自己的論文終於完成了,心裡的感激卻也是滿滿的,很感謝父母在 我的人生中遇到這麼重大事情的時候,給了我全新的關懷和照顧,讓我能用最快的速度 回到人生的軌道上,也很感謝我的朋友和同學們,總是不吝於給我很多的加油打氣,甚 至是勉勵,當然,更要感謝我的指導教授 謝國文 老師,謝謝老師一直以來對我的包容 和勉勵,雖然我曾經讓老師很失望過,但是我很感激老師終究沒有放棄我,還是陪我一 起完成我人生中一個很重要的里程碑。 不管如何,我都謝謝在我生命中的每一個人,是你們造就了我,和這一切。

(6)

目錄

中文摘要……… ….Ⅰ 英文摘要……… ….Ⅱ 誌謝………..Ⅲ 目錄……… ……….Ⅳ 表目錄……… …….Ⅴ 圖目錄……… …….Ⅵ 一. 緒論……… …….1 1-1 研究背景……… ……...1 1-2 研究目的……… ……...2 1-3 研究方法……… ……...2 二. 理論模式……… ….4 2-1 兩組樣本的變異數相等…….. ……… …4 2-2 兩組樣本的變異數不相等….. ……… …6 2-3 加權最小平方法……… …...8 2-4 改善的加權最小平方法………9 2-5 welch T-Test 和 WLS 的比較………10 三.數值分析……… …..13 3-1 樣本數比為 50:50……… …..13 3-2 樣本數比為 20:20……… …..15 3-3 樣本數比為 10:20……… …..16 3-4 樣本數比為 10:50……… …..18 3-5 模擬分析之綜合比………20 3-6 範例說明……… ……...21 四結論……….25 參考文獻……….27 附錄一……….28 附錄二……….31 附錄三……….32

(7)

表目錄

表格1 當 N1=50,N2=50 時的型一誤差……….………..14 表格2 當 N1=20,N2=20 時的型一誤差……….………..15 表格3 當 N1=10,N2=20 時的型一誤差……….………..17 表格4 當 N1=10,N2=50 時的型一誤差……….………..18 表格5 虛擬訓練研究結果……….……….21

(8)

圖目錄

圖1 樣本數比 50:50………15 圖2 樣本數比 20:20………16 圖3 樣本數比 10:20………18 圖4 樣本數比 10:50………20 圖5 樣本數比 25:35………24 圖6 在不同情形下可選用的統計分析方式………25

(9)

第一章 序論

1-1 研究背景 在日常生活當中,充斥著許多的數字還有其代表的意思,像是經常會在新聞中看到 的失業率或是生活滿意度等等,這些數字都代表了我們生活的一部份,也是我們要瞭解 某些情況時,最常見也是最有效的方式,就是運用這些統計數字。 而18 世紀之後,社會科學將機率的概念運用在人類事務上,統計這個自然的學科, 也逐漸的和社會科會產生了結合,在現代,統計幾乎已經成為了社會科學研究中,不可 缺少的工具之一,無論是在經濟學,社會學,甚至是政治學的研究,都脫離不了統計這 一門技術。而在社會科學中,常見到的除了一些簡單的統計分析之外,最常見的就是迴 歸分析(Regression)了。 迴歸分析就是用來分析一對一或是多對一之間的關係,例如說政黨支持度與執政滿 意度與某候選人得票率之間的相關,或是性別、薪資與工作滿意度之間的關係,這些都 是運用統計分析來做研究的。而在管理當中,常常會提到的一個議題,就是性別的差異, 性別,到底會對結果產生多大的影響,性別的影響到底是否存在呢?這是很多人所感興 趣的部分,而這種迴歸分析方式,又稱之為調節複迴歸(Moderated multiple regression)。

調節複迴歸可以被視為是在研究相關資料間的交互作用最為普遍的分析方法。舉例 說明,我們想瞭解性別與年資是否會影響到薪水的多寡,將薪水設為Y 變數、年資為 X 變數,性別則為Z,Z=1 時為男、反之 Z=0 為女,則調節複迴歸式將寫為 ε β β β β + + + + = X Z XZ Y 0 1 2 3 ,其中β0為截距項,β 、1 β 和2 β3則分別為X、Z 和 XZ 的迴歸係數,當Z=1 時,XZ=X,當 Z=0 時,XZ=0。 想知道性別和年資的交互作用是否會影響到薪水,在抽樣時,可因為樣本性別的不 同,而將樣本分為兩組,第一組都是男生(Z=1),第二組都是女生(Z=0),由前可知 第一組的迴歸式可改寫成Y =(β02)+(β13)X +ε ,第二組改寫成 ε β β + + = X Y 0 1 ,則由這兩個公式,可以知道需要檢驗的是(β13)是否和(β1) 相等,即β3是否為 0。 有關於 MMR 的分析方法已經相當的成熟以及普遍,像是在兩組變異數相等的情形 之下,最常使用的T-Test(individual t-test),Welch(1937)針對兩組變異數不相等的情形 之下,所提出調整自由度的Welch T-test,以及 Alexander and Govern (1994)所提出的 A test (Alexander’s normalized t approximation) 、James (1951) 所提出的 J test (James’s

second-order approximation) 和 Welch (1938) 和 Aspin (1948) 所提出的 F* test (F

approximation) 都已經廣為大家所知,但是在常見的複迴歸的架構之下,經過改善過的 檢定方法可能是較為適合用來研究MMR 的,如 Welch T-test 就比 A test ,J test ,和 F* test 來的適合分析MMR,其中,F* test 在兩組樣本時,公式經過推導之後,其方程式即為 Welch T-test 的平方倍,而自由度也相等,所以可以知道 F* test 是 Welch T-test 衍生為

(10)

多組的情形。

1-2 研究目的

在Randall C. Overton 發表在 2001 年的 Moderated Multiple Regression for

Interactions Involving Categorical Variables:A Statistical Control for heterogeneous Variance Across Two Groups 當中,提出了改善過的 WLS 方法(MWLS)會優於 WLS (weighted least squares) 及 OLS (ordinary least squares) 的觀點,其中 MWLS 的權重為(N−4)/SSRES,而 WLS 權重為(N−2)/SSRES,Overton (2001)也提出了一些分析結果來加以證明他的論 點,而他所提出的分析結果也相當符合他所提出的 MWLS 優於 MLS 的論點。

但是眾所皆知的 Welch T-test 或是 F-test 已經行之有年,而且其效果已經獲得大家認 同,為什麼 Overton (2001)還會認為所謂 MWLS 會比這幾種已經被大眾認可的分析方法 來的更穩定?MWLS 是不是真的比較穩健?還是實際上的情況並非如此?因為對於 Overton (2001)的論點的懷疑,所以本研究想找出可以足以驗證或是推翻 Overton (2001)說 法的證明。 1-3 研究方法 在研究的過程中,本研究使用了大量的理論和公式推導。在第二章當中,說明了由 Welch (1937)所提出的 Welch T-test 和加權最小平方法(WLS)和改善的最小平方法 (MWLS)在一般平均數檢定和運用在迴歸方面的檢定方法。其中 Welch T-test 主要是 運用在兩組樣本變異數不相等的情形,同樣的也對自由度進行調整,而同樣的,MWLS 和WLS 也是同樣運用在兩組樣本變異數不相等的情況,但是和 Welch T-test 不同的地方 在於MWLS 和 WLS 都是利用兩組樣本變異數所構成的權重來對樣本值進行權重的調 整,但是自由度卻沒有進行調整,還是沿用最原始的自由度計算方法,而研究中也在第 二章的最後部分利用公式的推導來找出Welch T-test 和 WLS 兩個方法之間的異同,同時 找出在自由度計算公式不同的情形之下,對於分析的結果會產生什麼樣的影響。 除了公式的推導的部分之外,本文也進行了數字的模擬,期望能找出Welch T-test、 MWLS 和 WLS 在公式推導中無法看出的差異性和優劣性。由於 Overton 都是採用大樣 本 (N≥ 30),在大樣本的情形之下,比較不容易看出各種分析方法的差異和優劣,而 Overton 所得到的結果也都是印證了 MWLS 得到的結果略優於 WLS 的結果,。所以研 究中為了能得到更可靠的數據,除了第一組取了和Overton 一樣的大樣本(50:50)之 外,其餘3 組樣本都採取小樣本來做模擬(20:20;10;20;10:50),由此來分別得到 WLS、MWLS 和 Welch T-Test 的型一誤差(Type Ⅰ error Rates),其中,第一組樣本

(11)

和第二組樣本是為了比較在兩組樣本數相同的情形之下,樣本數大小的不同會不會對分 析結果造成不同的影響,而第組和第4 組則是設定在兩組樣本數不相等的情形之下,樣 本數差異的大小會不會對分析結果造成不同的影響,之後,再利用EXCEL 軟體來畫出 3 種方法得到的數值的折線圖來比較 3 種方法在設定 α=0.05 的情形下,3 種方法的折線 和0.05 的線之間有多大的差異性,並用這些差異來比較這三種分析方法在相同樣本數但 樣本數大小不同的情形,及不同樣本數且樣本數大小差異不同的四種情形中,所表現的 優劣性。

(12)

第二章

理論模式

在進行實務的探討之前,我們要先要瞭解每一種理論的運用方法和運用的時機,也 應該去找出每一種理論之間的關係,來使得每一種理論都能得到最好的運用。 在這一章節當中,將依序提出四種理論,分別是一般的T-test、Welch T-test、WLS 和 MWLS,其中一般的T-test 通常是使用在兩組樣本變異數相同的情況之下,而 Welch T-test 則是使用在兩組樣本變異數不相同的情況之下,WLS 和 MWLS 主要是應用在調節 複迴歸的情形之下。

本章節一開始將討論一般的T-test 和 Welch T-test 在做一般平均數檢定與運用在迴 歸係數檢定時的檢定公式和拒絕域,接著會介紹 WLS 與 MWLS 運用在調節複迴歸係數 檢定的情形。 一般而言,這四種理論都是運用在小樣本的情況之下,因為在大樣本的情形之下, 通常會使用Z 檢定,故不在我們的討論範圍之內。 在本章節的最後,會將Welch t-test 和 WLS 做公式上的推導,這將使於我們找出 Welch T-test 和 WLS 之間的關連性,甚至更進一步的發現兩者的檢定公式為相同的,只 是因為自由度的不同,而影響了檢定結果的不同。 2-1 兩組樣本的變異數相等 條件假設:<Ⅰ>有兩組獨立樣本,分別為第一組和第二組,其中(X1i)為第一組的 抽樣樣本值,而(X2j)為第二組的抽樣樣本值。 <Ⅱ> ~ ( , 2) 1 X1 X1 iid i N X µ σ 且 ~ ( , 2) 2 X2 X2 iid j N X µ σ 。 <Ⅲ>兩組樣本的變異數相等。 <Ⅳ>抽出的樣本數為小樣本數(≦30)。 <Ⅴ>顯著水準為α。 在以上條件成立時,則可以使用T-Test(individual t-test)來檢定µX1和µX2是否相同。 若X 為第一組的平均數,1 X 為第二組的平均數, 而2 n1n2分別為第一組與第二組的 樣本數,則 ) 1 1 ( 2 1 2 2 1 n n S X X T p ind + − = (2.1) 2 2 1 + − =n n dfind

(13)

其中 2 ) ( ) ( 2 ) 1 ( ) 1 ( 2 1 1 1 2 2 2 2 1 1 2 1 2 2 2 1 2 1 2 2 1 − + − + − = − + − + − =

=

= n n X X X X n n S n S n S n i n j j i X X P (2.2) 2 1 X S :第一組的樣本變異數 2 2 X S :第二組的樣本變異數 檢定結果:<1>為雙尾檢定時,拒絕域為 { ( 1 2 2)} 2 − + > = T t n n C α ; <2>右尾檢定時,C ={T >tα(n1+n2 −2)}; <3>而左尾檢定時,C={T <tα(n1+n2 −2)}。 以上為運用在一般的平均數檢定,而如果是檢定迴歸係數時,假設兩組樣本值分別 為(X1iY1i)和(X2jY2j),兩組的樣本數分別為n1n2。兩組的迴歸勢將分別寫 為 i i i X Y10111 11 (2.3) j j j X Y20212 22 (2.4) 若欲檢定β11與β12是否相等,則檢定式為 ) 1 1 ( ˆ ˆ 2 1 2 12 11 n n S T p ind + − = β β (2.5) 其中 2 ) ( ) ( 2 ) 1 ( ) 1 ( 2 1 1 2 2 2 2 1 2 1 1 1 2 1 2 ˆ 2 2 ˆ 1 2 2 1 12 11 − + + + − = − + − + − =

=

= n n X X MSE X X MSE n n S n S n S n j j n i i P β β (2.6) 1 MSE 為第一組的組內變異均方和,MSE2為第二組的組內變異均方和。 若是將此檢定法運用在調節複迴歸的檢定中,則假設從一母體中取出一組樣本值 (X ,k Z ,k Y )k ,其中Z 為調節變數,k Z =0 或 1。而樣本中k Z =0 的共有k n1個樣本, k Z =1 的共有n2個樣本,則迴歸式可寫為 k k k k k X Z XZ Y0123( ) +ε (2.7) 則由於Z 值的不同,可將式子(2.7)改寫為兩個式子 當Z =1 時 k k k k k k X Z XZ Y0123( ) +ε k k k k k X X X β β ε β β β β ε β β + + + + = + + + + = 0 1 2 3 ( 0 2) ( 1 3) (2.8) 當Z =0 時 k

(14)

k k k k k X Z XZ Y0123( ) +ε k k X ε β β + + = 0 1 (2.9) 從式子(2.8)和式子(2.9)中,可以知道要檢定兩個迴歸係數(β13)與β 是1 否相等,相當於檢定β3是否為0,則檢定式可寫為 ) 1 1 ( ˆ 2 1 2 3 n n S T p ind + = β (2.10) 2 P S 等同於式子(2.6) 2-2 兩組樣本的變異數不相等 條件假設:<Ⅰ>有兩組獨立樣本,分別為第一組和第二組,其中(X1i)為第一組的 抽樣樣本值,而(X2j)為第二組的抽樣樣本值。 <Ⅱ> 1 ~ ( X1, X12) iid i N X µ σ 且 2 ~ ( X2, X22) iid j N X µ σ 。 <Ⅲ>兩組樣本的變異數不相等。 <Ⅳ>抽出的樣本數為小樣本數(≦30)。 <Ⅴ>顯著水準為α。 在以上條件成立時,將使用Welch T-Test 來檢定 1 X µ 和 2 X µ 是否相同。若X 為第一1 組的平均數,X 為第二組的平均數, 而2 n1n2分別為第一組與第二組的樣本數,則 2 2 1 2 2 1 2 1 n S n S X X T X X welch + − = (2.11) 另外,由於兩組樣本的變異數並不相同所以自由度的算法也因此進行調整 ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − + − + = = 1 ) ( 1 n ) n S ( ) n S n S ( 2 2 2 2 1 2 1 2 2 2 2 1 2 2 1 2 1 n n S welch df X X X X welch 自由度 (2.12) 檢定結果:<1>為雙尾檢定時,拒絕域為 { ( )} 2 welch df t T C = > α ; <2>右尾檢定時,C ={T >tα(dfwelch)}; <3>而左尾檢定時,C={T <tα(dfwelch)}。

(15)

若是將Welch T-Test 運用迴歸式的情況之下,兩組迴歸式如式子(2.3)與式子(2.4), 則在變異數不相等的情況之下,檢定式將寫為

= = − + − − = 2 1 1 2 1 1 2 1 2 1 1 1 12 11 ) ( ) ( ˆ ˆ n j i n i i welch X X MSE X X MSE T β β (2.13) ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − + − + = = 2 ) ( 2 n ) (S ) (S 2 2 2 ˆ 1 2 2 ˆ 2 2 ˆ 2 ˆ 12 11 12 11 n S S welch dfwelch β β β β 自由度 (2.14) 若是將此檢定法運用在調節複迴歸的檢定中,則同樣將包含調節變數Z 的一組樣k 本分為Z =0 及k Z =1 兩組情形的樣本,令k Z =1 為第一組樣本,樣本數為k n1,Z =0k 為第二組樣本,樣本數為n2,則原本的迴歸式(2.7)將分別改寫為 當Z =1 k i i i i i X Z XZ Y10111 121 131( )11 =(β0121)+(β1131)X1i1i i i X1 1 * 11 * 01 β ε β + + = (2.15) 當Z =0 k j j j j j X Z XZ Y20212 222 232( )22 =β02 +β12X2j +ε2j (2.16) 若想要檢定X 與 Z 的交互作用是否存在,即檢定( * 11 β )與β12兩個迴歸係數是否相等, 則檢定式可寫為

= = − + − − = 2 1 1 2 2 2 2 1 2 1 1 1 12 * 11 ) ( ) ( ˆ ˆ n j j n i i welch X X MSE X X MSE T β β (2.16) ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − + − + = = 2 ) ( 2 n ) (S ) (S 2 2 2 ˆ 1 2 2 ˆ 2 2 ˆ 2 ˆ 12 * 11 12 * 11 n S S welch dfwelch β β β β 自由度 (2.17)

(16)

2-3 加權最小平方法(WLS,weighted least squares) 在 Overton(2001)的文章當中,特別提出了 WLS 的方法來做討論,這個方法是用來 取代 OLS 的這方法來檢定 MMR 的,Overton 特別將這個方法提出來做比較,就是為了 和之後第四節要提的 MWLS 來做一個比較。 條件假設:<Ⅰ>有一母體,且母體為常態分布 <Ⅱ>由母體抽樣出一組樣本,樣本值為(X ,k Z ,k Y )k ,其中Z 為調解k 變數,Z =1 或 0 k 在以上條件之下,先將樣本依照Z =1 或k Z =0 分為兩組。令k Z =1 為第一組樣k 本,樣本數為n1,樣本值為(X1iY1i);Z =0 為第二組樣本,樣本數為k n2,樣本值 為(X2jY2j),且兩組的樣本變異數並不相等。 已知若在迴歸式中乘上一常數 K ,則變異數將會變為K 倍,而迴歸係數的變異數2 也會變成 2 K 倍,所以為了解決分為兩組後,變異數不相等的問題,可以將兩組樣本分 別乘上權重G1G2。由於第一組的變異數為 2 1 e σ ,所以令G1= 1 1 e σ ;第二組的變異數 為 2 2 e σ ,所以G2= 2 1 e σ 。 在乘上權重之後,第一組和第二組的變異數都變為1,如此便可以解決變異數不相 等的問題,而兩組樣本值將分別改寫為(X ,1i* Y )與(1i* X ,2 J* Y2 j* )。其中X =1i* 1 1 e σ *X1i、 * 1i Y = 1 1 e σ *Y1i、 * 2 J X = 2 1 e σ *X2j、 * 2 j Y = 2 1 e σ *Y2j 因為無法得知 2 1 e σ 與 2 2 e σ 正確的數字,所以使用估計值, 2 1 1 1 ˆ 2 e n SSE σ ≅ − , 2 2 2 2 ˆ 2 e n SSE σ ≅ − 。 得到兩組加權過的樣本值之後,由於兩組樣本的變異數相等,所以再將兩組樣本值 結合起來成為一組樣本(X ,*k Y )來做檢定,則迴歸式將寫為 k* * * 3 2 * 1 0 * ( ) k k k k k k X Z X Z Y =β +β +β +β +ε 其中,當k 從 1 到n1Zk =1, (Xk*Zk)= Xk*;當 k 從n1+1到n1 +n2Zk =0, 0 ) ( * = k kZ X ,因為我們所關心的是 X 與 Z 的交互作用是否存用,即是檢定β3是否為 0, 所以檢定式為 2 ˆ 3 3 ˆ β β S TWLS = (2.18) 4 2 1 + − =n n dfWLS

(17)

拒絕域為 { ( 1 2 4)} 2 − + > = T t n n C α 2.4 改善加權最小平方法(MWLS) 條件假設:<Ⅰ>有一母體,且母體為常態分布 <Ⅱ>由母體抽樣出一組樣本,樣本值為(X ,k Z ,k Y )k ,其中Z 為調解k 變數,Z =1 或 0 k 在以上條件之下,先將樣本依照Z =1 或k Z =0 分為兩組。令k Z =1 為第一組樣k 本,樣本數為n1,樣本值為(X1iY1i);Z =0 為第二組樣本,樣本數為k n2,樣本值 為(X2jY2j),且兩組的樣本變異數並不相等。 已知若在迴歸式中乘上一常數 K ,則變異數將會變為K 倍,而迴歸係數的變異數2 也會變成 2 K 倍,所以為了解決分為兩組後,變異數不相等的問題,可以將兩組樣本分 別乘上權重G1G2。由於第一組的變異數為 2 1 e σ ,所以令G1= 1 1 e σ ;第二組的變異數 為 2 2 e σ ,所以G2= 2 1 e σ 。 在乘上權重之後,第一組和第二組的變異數都變為1,如此便可以解決變異數不相 等的問題,而兩組樣本值將分別改寫為(X ,1i* Y )與(1i* X ,2 J* Y2 j* )。其中X =1i* 1 1 e σ *X1i、 * 1i Y = 1 1 e σ *Y1i、 * 2 J X = 2 1 e σ *X2j、 * 2 j Y = 2 1 e σ *Y2j 因為無法得知 2 1 e σ 與 2 2 e σ 正確的數字,所以使用估計值,但是雖然同樣是加權,因 為考慮到不偏性的問題,所以這裡的加權係數和WLS 的有所不同,其中 2 1 1 1 ˆ 4 e n SSE σ ≅ − , 2 2 2 2 ˆ 4 e n SSE σ ≅ − 。 得到兩組加權過的樣本值之後,由於兩組樣本的變異數相等,所以再將兩組樣本值 結合起來成為一組樣本(X ,*k Y )來做檢定,則迴歸式將寫為 k* * * 3 2 * 1 0 * ( ) k k k k k k X Z X Z Y =β +β +β +β +ε 其中,當k 從 1 到n1Zk =1, * * ) (XkZk = Xk;當 k 從n1+1到n1 +n2,Zk =0, 0 ) ( * = k kZ X ,因為我們所關心的是 X 與 Z 的交互作用是否存用,即是檢定β3是否為 0, 所以檢定式為

(18)

2 ˆ 3 3 ˆ β β S TMWLS = (2.19) 4 2 1 + − =n n dfMWLS 拒絕域為 { ( 1 2 4)} 2 − + > = T t n n C α 2.5 Welch T-Test 和 WLS 的比較 在上面的討論當中,已經知道在調節複迴歸的情形之下,Welch T-Test 的檢定式為

= = − + − − = 2 1 1 2 2 2 2 1 2 1 1 1 12 * 11 ) ( ) ( ˆ ˆ n j j n i i welch X X MSE X X MSE T β β ,以及WLS 的檢定式為 2 ˆ 3 3 ˆ β β S TWLS = ,在這一 小節當中,我們將利用矩陣的形式來討論Welch T-Test 和 WLS 的異同。 若迴歸式為 Y=Xβ+E (2.20) 其中 Y= 1 2 1 .. × ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ N k Y Y Y ,X= ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ 1 .. 1 1 k X X X .. 2 1 k Z Z Z .. 2 1 4 2 1 ) ( ... ) ( ) ( × ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ N k XZ XZ XZ ,β= 1 4 3 2 1 0 × ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ β β β β ,E= 1 1 0 .. × ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ N k ε ε ε 令 XD= ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ k X X X .. 2 1 k Z Z Z .. 2 1 3 2 1 ) ( ... ) ( ) ( × ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ N k XZ XZ XZ (2.21) 令 XC=( ) N J IN XD,其中JN×N的1 矩陣,則 XC= ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − − − X X X X X X k .. 2 1 Z Z Z Z Z Z k − − − .. 2 1 3 2 1 ) ( ... ) ( ) ( × ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ − − − N k XZ XZ Z X XZ Z X XZ (2.22) 使 XC=[XC1 XC2]

(19)

X 1 C = ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − − − X X X X X X k .. 2 1 2 2 1 .. × ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ − − − N k Z Z Z Z Z Z ,X 2 C = 1 2 1 ) ( .. ) ( ) ( × ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − − − N k xz XZ Z X XZ Z X XZ (XC T XC)−1= ⎢ ⎢ ⎣ ⎡ 1 2 1 1 C T C C T C X X X X 1 2 2 2 1 − ⎥ ⎥ ⎦ ⎤ C T C C T C X X X X ⎢ ⎢ ⎣ ⎡ = − 0 ) ( 1 1 1 C T C X X ⎥ ⎦ ⎤ 0 0 +

[

( ) 1

] [

( ) 1 1 1 1 2 2 1 1 1 − − T C C C T C C T C C T C X X X W X X X X X I

]

(2.23) 其中 2 2 1 1 C T C M X X W− = (2.24) T C C T C C X X X X I M 1 1 1 1 1 1 = − ( )− (2.25) 則經由上列式子可知 ˆ ( ) 1( 1 ) 1 3 X 2M X 2 X 2M Y T C C T C − = β ) ( ) ( 2 2 2 1 1 C T C T C X M X Y M X = (2.26) 在式子(2.26)中的(XCT2M1Y)= ( ˆ ˆ ) 1 1 * 11 12 2 1 2 2 2 1 β −β + n n S SX X (2.27) 其中βˆ11* 是當Z=0 時的第一組迴歸係數,而βˆ12是當Z=1 時的第二組的迴歸係數 而( ) 2 2 1 C T C M X X = 2 1 2 2 1 1 2 1 n n S SX X + (2.28) ,則從式子(2.27)和(2.28),可以得到結論βˆ3 =βˆ12 −βˆ11* (2.29) 另外 2 3 2 2 2 1 1 1 ) ˆ ( X X S S S β = + (2.30) 所以 2 ˆ 3 3 ˆ β β S TWLS = = 2 2 * 11 12 2 1 1 1 ˆ ˆ X X S S + −β β (2.31) 而在

= = − + − − = 2 1 1 2 2 2 2 1 2 1 1 1 12 * 11 ) ( ) ( ˆ ˆ n j j n i i welch X X MSE X X MSE T β β 方面,因為經過加權,所以 1 2 1 = MSE =

(20)

= = − + − − = 2 1 1 2 2 2 1 2 1 1 12 * 11 ) ( 1 ) ( 1 ˆ ˆ n j j n i i welch X X X X T β β 2 2 12 * 11 2 1 1 1 ˆ ˆ X X S S + − = β β (2.32) 從式子(2.31)和式子(2.32),可以知道Welch T-test 和 WLS 的檢定式是一樣的, 但是因為兩者T 分佈自由度的不同,所以即使檢定式是一樣的,但是檢定的分佈卻是不 同的。另外,已將詳細的推導過程列於附錄一和附錄二當中。 相同的部分已經利用公式的推導來加以說明,分佈的不同則採用模擬分析的方式來 解讀。

(21)

第三章 數值分析

在經過之前的理論模式的探討之後,現在要利用SAS 進行實際的模擬和範例的說 明。在模擬的部分,先利用SAS 程式去找出一組亂數,再模仿 Overton 分別做 WLS、 MWLS 和 Welch T-TEST 的檢定,也就是採用型一誤差的值來比較 3 種檢定方法之間的 優劣性。 首先在取得一組亂數之後,將其分別做3 種檢定,並檢查其是否落在拒絕域中,再 將此步驟重複10 萬次,並將落在拒絕域中的次數除以重複的次數(1 萬),則我們可以 從中得到每一個檢定方法的型一誤差。 首先分別將第一組和第二組的變異數 1 X σ 和 2 X σ 比例訂為1:1、1:2、1:4,而 1 e σ 和σe2也分別訂出其比例為1:1、1:2、1:4 以及 1:8,再去做出組合。 在分析時,以樣本數作為每次分析的分隔,一共用了4 組不同的樣本數比,分別是 (50:50)、(20:20)、(10:20)以及(10:50),並以這四種不同的樣本數比去完成了表格 1、 2、3、4 的分析,其中表格 1、2、3、4 分別表示了樣本數比(50:50)、(20:20)、(10: 20)、(10:50)。 前面兩組的樣本數比,是為了比較在兩組樣本數相同的時候,取樣樣本數的大小是 否會對分析產生明顯的影響,而第三組和第四組的樣本數,就是為了比較在兩組樣本數 不同的情形之下,兩組樣本數數目的差異大小,是否會對分析結果產生明顯的影響。 同時,一開始便將βˆ1及βˆ2都先設定為0.15,以方便之後的模擬。而 SAS 的程式都 是採用矩陣模式來寫,其中也將Overton 的程式加以改寫成矩陣的寫法,以方便放在一 起作為比較,其中,程式的寫法以附在附錄三當中。 不同於Overton 都是用大樣本數來模擬,除了第一次模擬是採用 N1=50、N2=50 之外,其他組的樣本數都是採用小樣本數,因為大樣本數時,模擬的結果往往會將差異 性縮小,但是一旦縮小樣本數便會發現每一種分析之間的差異被拉大了,差異也會變的 相當的顯著,這樣會比較方便我們做出比較。 而在範例說明的部分,本文採用Overton (2001) 所使用的例子,不同的是,研究採 用了 Welch T-test 、WLS 以及 MWLS 三種分析方式來做比較。 3-1 樣本數比為 50:50 在樣本數比為50:50 的情形之下,一共做了 18 組的模擬,其中由於兩組樣本數的 相等,所以在 1 x σ 與 2 x σ 的比值也相同(1/1)的情況之下,只需要 2 1/ e e σ σ 為1/1、1/2、 1/4 和 1/8 四種組合 ,並不需要再將σe1e2的比值顛倒過來重算一次,至於其他σx1 /σx2 的比值,還是需要和σe1e2做出各種的組合來模擬,來得到完善的分析結果。

(22)

表格1

當N1=50,N2=50 時的型一誤差(Type Ⅰ Error Rates)

組別 σx1x2 σe1/σe2 WLS MWLS Welch T_TEST 1 1/1 1/1 0.0473 0.0473 0.0473 2 1/1 1/2 0.0485 0.0485 0.0483 3 1/1 1/4 0.0486 0.0486 0.0481 4 1/1 1/8 0.0514 0.0514 0.0499 5 1/2 1/1 0.0486 0.0486 0.0484 6 1/2 1/2 0.0473 0.0473 0.0473 7 1/2 1/4 0.0485 0.0485 0.0483 8 1/2 1/8 0.0486 0.0486 0.0481 9 1/2 2/1 0.0504 0.0504 0.0494 10 1/2 4/1 0.0504 0.0504 0.0496 11 1/2 8/1 0.0518 0.0518 0.0492 12 1/4 1/1 0.0504 0.0504 0.0494 13 1/4 1/2 0.0486 0.0486 0.0484 14 1/4 1/4 0.0473 0.0473 0.0473 15 1/4 1/8 0.0485 0.0485 0.0483 16 1/4 2/1 0.0504 0.0504 0.0496 17 1/4 4/1 0.0518 0.0518 0.0492 18 1/4 8/1 0.0515 0.0515 0.0486 而從得到的結果中可以發現,3 種分析方法所得出來的數字並無太大的差異性,甚 至可以說是相當的接近,特別是WLS 與 MWLS,這兩者所得的數字幾乎是一模一樣, 這代表了在樣本數大的時候,樣本數相同的情況下,權重的修正並不會對於分析造成顯 著的影響,另外在MWLS 和 T-Test 的比較中,雖然差異並不明顯,有些值也相等,但 是Welch T-Test 的型一誤差仍然小於 MWLS,其中的比較可見圖一。

(23)

0.044 0.046 0.048 0.05 0.052 0.054 1 3 5 7 9 11 13 15 17 組別 型一誤差 MWLS Welch T_TEST 圖1 樣本數 50:50 由圖一可以發現Welch T-Test 的線除了幾點和 MWLS 的重疊之外,其他的都落在 MWLS 之下,在α =0.05 的情形之下,雖然說 Welch T-Test 的結果偏低,但是較 MWLS 來說,還是為較好的。 3-2 樣本數比為 20:20 表格2

當N1=20,N2=20 時的型一誤差 Type Ⅰ Error Rates

2 1 / x x σ σ σe1e2 WLS MWLS Welch T-TEST 1 1/1 1/1 0.0499 0.0499 0.0492 2 1/1 1/2 0.0505 0.0505 0.0492 3 1/1 1/4 0.0524 0.0524 0.0501 4 1/1 1/8 0.0539 0.0539 0.0502 5 1/2 1/1 0.0479 0.0479 0.0566 6 1/2 1/2 0.0499 0.0499 0.0492 7 1/2 1/4 0.0505 0.0505 0.0492 8 1/2 1/8 0.0524 0.0524 0.0501 9 1/2 2/1 0.0508 0.0508 0.0494 10 1/2 4/1 0.053 0.053 0.0501 11 1/2 8/1 0.0544 0.0544 0.0493 12 1/4 1/1 0.0508 0.0508 0.0494

(24)

13 1/4 1/2 0.0479 0.0479 0.0466 14 1/4 1/4 0.0499 0.0499 0.0492 15 1/4 1/8 0.0505 0.0505 0.0492 16 1/4 2/1 0.053 0.053 0.0501 17 1/4 4/1 0.0544 0.0544 0.0493 18 1/4 8/1 0.0551 0.0551 0.0479 在表格3 中,我們嘗試了小樣本,但是樣本數相同的研究,同樣的,我們可以發現 WLS 和 MWLS 之間,因為樣本數的相同,兩者的數字都是一模一樣的,但是和 Welch T-Test 所得的數字就有相當明顯的差異 0.04 0.045 0.05 0.055 0.06 1 3 5 7 9 11 13 15 17 組別 型一誤差 MWLS Welch T-TEST 圖2 樣本數 20:20 在圖2 當中,一樣可以發現除了有一點 Welch T-Test 的型一誤差大於 MWLS 的之 外,其他的點都落在MWLS 之下,且在α =0.05 的情況之下,可以發現 Welch T-Test 的值都是很貼近在.05 的線上的,反之,MWLS 的點就顯的起伏和差距較大,型一誤差 的值較為不穩定了。所以可以認為在小樣本數,且樣本數相等的情形之下,Welch T-Test 的檢定結果仍然優於MWLS,至於 WLS 在樣本數相同的時候,和 MWLS 的值都是一 樣的,可以知道在樣本數相同的情形之下,權重的調整對於檢定的結果並沒有影響。 3-3 樣本數比為 10:20 表格3

(25)

組別 σx1x2 2 1/ e e σ σ WLS MWLS Welch T_TEST 1 1/1 1/1 0.055 0.0488 0.0494 2 1/1 1/2 0.0493 0.0456 0.0455 3 1/1 1/4 0.0482 0.0470 0.0467 4 1/1 1/8 0.0485 0.0488 0.0472 5 1/1 2/1 0.0599 0.0524 0.0507 6 1/1 4/1 0.0641 0.0541 0.0548 7 1/1 8/1 0.0688 0.0562 0.0501 8 1/2 1/1 0.0599 0.0524 0.0507 9 1/2 1/2 0.055 0.0488 0.0494 10 1/2 1/4 0.0493 0.0456 0.0455 11 1/2 1/8 0.0482 0.047 0.0467 12 1/2 2/1 0.0641 0.0541 0.0498 13 1/2 4/1 0.0688 0.0562 0.0501 14 1/2 8/1 0.0721 0.0592 0.0499 15 2/1 1/1 0.0493 0.0456 0.0455 16 2/1 1/2 0.0482 0.047 0.0467 17 2/1 1/4 0.0485 0.0488 0.0472 18 2/1 1/8 0.0489 0.0509 0.0474 19 2/1 2/1 0.055 0.0488 0.0494 20 2/1 4/1 0.0599 0.0524 0.0507 21 2/1 8/1 0.0641 0.0541 0.0498 22 1/4 1/1 0.0641 0.0541 0.0498 23 1/4 1/2 0.0599 0.0524 0.0507 24 1/4 1/4 0.055 0.0488 0.0494 25 1/4 1/8 0.0493 0.0456 0.0455 26 1/4 2/1 0.0688 0.0562 0.0501 27 1/4 4/1 0.0721 0.0592 0.0499 28 1/4 8/1 0.0737 0.0608 0.051 29 4/1 1/1 0.0482 0.047 0.0467 30 4/1 1/2 0.0485 0.0488 0.0472 31 4/1 1/4 0.0489 0.0509 0.0474 32 4/1 1/8 0.0505 0.0532 0.0475

(26)

33 4/1 2/1 0.0493 0.0456 0.0455 34 4/1 4/1 0.055 0.0488 0.0494 35 4/1 8/1 0.0599 0.0524 0.0507 但是在表格3 當中,我們採用了 N=10,N2=20 的小樣本來作分析,而且與表格 1 不同的是,兩者的樣本數也並不相同,我們可以發現,3 種分析方法所得的數字產生 了相當明顯的差異性,同時,我們也可以發現,隨著變異數比例的變化,數字的大小, 和數字之間的大小關係都會產生影響,其中的差異性和變化,我們可以從圖二來看。 0.04 0.045 0.05 0.055 0.06 0.065 0.07 0.075 0.08 1 4 7 10 13 16 19 22 25 28 31 34 組別 型一誤差 WLS MWLS Welch T_TEST 圖3 樣本數 10:20 從圖3 中我們可以看出 3 種檢定方法的型一誤差會呈現一種有規律的差異,每當 2 1 / e e σ σ 的比值越大的時候,三者之間的差異就越大,最大差異都是出現在 2 1 / e e σ σ =8/1 時候。另外我們可以看出雖然有幾乎重疊的點,但是還是可以比較出3 者之間數字有明 顯的差距,Welch T-Test 的型一誤差為 3 者之中最為接近 0.05 的,而 WLS 的型一誤差 為3 者中最大的,和 0.05 的差距也較為明顯,從這各圖中,我們可以認為在小樣本數時, Welch T-Test 是明顯穩定於 MWLS,且 MWLS 也是明顯穩定於 WLS 的。 3-4 樣本數比為 10:50 表格4

當N1=10,N2=50 時的 Type Ⅰ Error Rates

2 1 / x x σ σ 2 1/ e e σ σ WLS MWLS Welch T-TEST 1 1/1 1/1 0.0709 0.0513 0.0524 2 1/1 1/2 0.0659 0.0506 0.053 3 1/1 1/4 0.0596 0.0484 0.0526

(27)

4 1/1 1/8 0.058 0.0495 0.0537 5 1/1 2/1 0.0747 0.0535 0.0515 6 1/1 4/1 0.0756 0.0552 0.0518 7 1/1 8/1 0.0764 0.0554 0.0498 8 1/2 1/1 0.0747 0.0535 0.0515 9 1/2 1/2 0.0709 0.0513 0.0524 10 1/2 1/4 0.0659 0.0506 0.053 11 1/2 1/8 0.0596 0.0484 0.0526 12 1/2 2/1 0.0756 0.0552 0.0518 13 1/2 4/1 0.0764 0.0554 0.0498 14 1/2 8/1 0.0766 0.0544 0.0482 15 2/1 1/1 0.0659 0.0506 0.053 16 2/1 1/2 0.0596 0.0484 0.0526 17 2/1 1/4 0.058 0.0495 0.0537 18 2/1 1/8 0.0568 0.0533 0.0559 19 2/1 2/1 0.0709 0.0513 0.0524 20 2/1 4/1 0.0747 0.0535 0.0515 21 2/1 8/1 0.0756 0.0552 0.0518 22 1/4 1/1 0.0756 0.0552 0.0518 23 1/4 1/2 0.0747 0.0535 0.0515 24 1/4 1/4 0.0709 0.0513 0.0524 25 1/4 1/8 0.0659 0.0506 0.053 26 1/4 2/1 0.0765 0.0554 0.0498 27 1/4 4/1 0.0766 0.0544 0.0482 28 1/4 8/1 0.077 0.0541 0.0472 29 4/1 1/1 0.0596 0.0484 0.0526 30 4/1 1/2 0.058 0.0495 0.0537 31 4/1 1/4 0.0568 0.0533 0.0559 32 4/1 1/8 0.057 0.0551 0.0569 33 4/1 2/1 0.0659 0.0506 0.053 34 4/1 4/1 0.0709 0.0513 0.0524 35 4/1 8/1 0.0747 0.0535 0.0515 而在表格4 當中,我們再次嘗試了小樣本且樣本數不同的分析方法,且較之前的表

(28)

格2,兩個樣本數的大小相差更多了,我們發現 WLS 和另外兩個分析數字之間的差異 明顯的拉大了,WLS 的數字明顯的大於其他的兩個數字,而 WLS 和 Welch T-TEST 的 分析數字雖然說也有所差異,但是差異並不如與WLS 的分析那樣的明顯,由表格 4 和 表格3 的結果我們可以發現,在樣本數不同的情況之下,會對我們使用的 3 種分析方法 產生明顯的變化,特別是WLS 的分析結果,更是大大的拉開了和另外兩者的距離 0.04 0.05 0.06 0.07 0.08 1 5 9 13 17 21 25 29 33 組別 型一誤差 WLS MWLS Welch T-TEST 圖四 樣本數比 10:50 在圖4 中,我們可以發現除了 WLS 的型一誤差較為高低起伏之外,Welch T-Test 和MWLS 的型一誤差都是呈現沒有太大變化的情形,由連出來的折線圖,可以看出 Welch T-Test 和 MWLS 的直都相當的接近 0.05 的值,同時也可以看出在樣本數 10:50 的情形之下,WLS 隨著變異數比值而變化的情形相當的明顯,所以經由圖四,可以推 論在小樣本數,且樣本數比值較大的時候,WLS 的檢定方法是比較不穩健的,而 Welch T-Test 和 MWLS 當中,Welch T-Test 和 MWLS 的結果並沒有辦法分出明顯的優劣。。

3-5 模擬分析之綜合比較 從以上的四個表格中,可以知道在兩組樣本數相同的情況之下,無論是大樣本來是 小樣本的情形,Welch T-Test 的值都會較 WLS 及 MWLS 來的還要穩定;而在兩組樣本 數不同的情形之下,可以發現當兩組樣本數的數目差距不大的時候,Welch T-Test 的表 現還是會比其他的兩個檢定方法來的穩定,但是當兩組樣本數數目的差距大的時候, Welch T-Test 和 MLS 的值都會比較偏高,而 WLS 會明顯的偏高,所以可以說在小樣本 數,樣本數不相同,且樣本數數目差異大的時候,WLS 的檢定明顯較其他兩者來的差。 在Overton(2001)的研究當中,都是採用大樣本來進行研究,在其研究中提出在大

(29)

樣本,且兩組樣本數目差異大的情形下(30:150),型一誤差的結果,在其的研究當中, MWLS 的結果還是較 WLS 來的穩健,但是差異性較不明顯,經由他的研究,可以推論 在大樣本的情形之下,MWLS 的方法的確會比 WLS 來的穩定,但是因為樣本數大的影 響,方法的好壞差異並不明顯。 3-6 範例說明 研究中採用Overton (2001)所使用的虛擬研究的數據。假設現在有一種新的技能訓 練方法,而管理者想要瞭解這個新的訓練方法是不是有效果,能不能將其推行,因此決 定進行MMR 的分析。在取樣之後,將樣本分為兩組,其中第一組是經過訓練的樣本, 而第二組則沒有經過訓練,現在要將兩組來做比較,其中,樣本值X 代表天資,而 Y 代表了工作績效,而表格5 則為研究得到的數據。 表格5 虛擬訓練研究結果 第一組 第二組 組別 天資(X) 工作績效(Y) 組別 天資(X) 工作績效(Y) 1 25 66 1 37 84 2 15 45 2 26 62 3 25 71 3 28 68 4 15 45 4 29 54 5 25 71 5 23 65 6 23 63 6 15 47 7 23 58 7 20 56 8 32 77 8 17 37 9 25 66 9 21 60 10 24 65 10 28 60 11 26 66 11 23 54 12 23 61 12 22 64 13 26 65 13 21 59 14 23 58 14 33 67 15 21 55 15 21 63 16 22 57 16 31 77 17 25 69 17 27 64

(30)

18 24 62 18 31 75 19 28 70 19 16 45 20 21 57 20 15 46 21 18 54 21 28 62 22 23 60 22 22 61 23 25 66 23 16 60 24 21 59 24 26 66 25 26 67 25 32 82 26 26 60 27 25 62 28 28 65 29 32 77 30 19 47 31 34 77 32 24 70 33 17 55 34 19 53 35 21 56 在得到兩組樣本之後,利用SAS 軟體來對數據進行研究,分別採用了兩種分析方 法,其一為Welch T-Test ,而另外一個是 MWLS 分析,則分別得到的結果為 Welch T-Test 的自由度是55.995407,而TWELCH=2.069,P-value=0.0432,而 MWLS 所得到的結果為

Source DF Squares Square F Value Pr > F Model 3 252.81669 84.27223 90.75 <.0001 Error 56 52.00000 0.92857

Corrected Total 59 304.81669

Root MSE 0.96362 R-Square 0.8294 Dependent Mean 62.03619 Adj R-Sq 0.8203 Coeff Var 1.55333

Parameter Estimates Parameter Standard

(31)

Variable DF Estimate Error t Value Pr > |t| Intercept 1 24.79725 4.28918 5.78 <.0001 X 1 1.51477 0.17119 8.85 <.0001 Z 1 -8.70028 5.43893 -1.60 0.1153 XZ 1 0.45540 0.22211 2.05 0.0450 而如果使用WLS 的方法,得到的分析結果如 Analysis of Variance Sum of Mean

Source DF Squares Square F Value Pr > F Model 3 274.65795 91.55265 91.55 <.0001 Error 56 56.00000 1.00000

Corrected Total 59 330.65795

Root MSE 1.00000 R-Square 0.8306 Dependent Mean 62.03806 Adj R-Sq 0.8216 Coeff Var 1.61191

Parameter Estimates Parameter Standard

Variable DF Estimate Error t Value Pr > |t| Intercept 1 24.79725 4.31410 5.75 <.0001 X 1 1.51477 0.17219 8.80 <.0001 Z 1 -8.70028 5.44145 -1.60 0.1155

XZ 1 0.45540 0.22212 2.05 0.0450

在這三個分析當中,可以發現Welch T test 和另外兩者的 T 值略有不同,而 P-value 也是只有一點點的差異,至於MWLS 和 WLS 的結果是一樣的,三個方式分析出來的結 果是差不多的,所以可以說在這個例子當中,MWLS、WLS 和 Welch T test 並沒有很明 顯的差異。

但是在例子當中,並沒有辦法看出三個方式的優劣性,所以為了做出比較,研究中 另外做了一組樣本數為25:35 的模擬分析,將其化為折線圖來表示則為

(32)

0.04 0.045 0.05 0.055 0.06 1 4 7 10 13 16 19 22 25 28 31 34 組別 型一誤差 WLS MWLS Welch T-TEST 圖五 樣本數 25:35 從圖五中可以看出,三種分析方法中,Welch T-test 的結果是三種當中最為穩定的, 而 WLS 的結果在相較之下是比較不穩定的,所以經由模擬分析,可以證明在樣本數 25: 35 的情形之下,Welch T-test 這個分析方式的確是較為穩健的。

(33)

第四章 結論

在Welch T-Test 和 WLS 的比較當中,證明了這兩個檢定方法其實是相當的,唯一 不同的地方只在於自由度的大小,也因為自由度的些許不同,影響了分析結果的分佈情 形。 而從模擬分析當中,可以發現在不同的 2 1 / x x σ σ 比值與不同的 2 1 / e e σ σ 比值下組合所 得到的分析,以及個別所畫出的圖表,無論是大樣本數,還是小樣本數,Welch T-Test 的分析結果都明顯的優於MWLS 的結果。但這和 Overton (2001)的觀點是有所衝突的, 本文所使用的的分析方法和Overton (2001)的方法大致上都是相同的,差別只在於 Overton (2001)在選擇樣本數時,都使用大樣本數來進行研究,而本文是採用小樣本的方 式。比起大樣本數,小樣本往往能更明顯的顯示出每一個分析方法的差異性,並且一般 在管理方面要進行研究時,因為可能顧及成本或是資源的考量,而會選擇用小樣本的方 式來進行分析,也很少會有人採用大樣本的方式。 經由理論探討,和數值分析,本文的研究結果還是認為,即使Overton 為了顧及實 際資料分析,並且為了使用軟體的方便性,而提出WLS / MWLS 是較好的分析結果, 但是本研究在採用較為合理的小樣本數的模擬,以及理論模式的探討之後,所得到的結 論還是傾向於 Welch T-Test 是較好的方式,這與本文一開始所期望的相同,也證實了 Welch T-Test 的實行的確是有他的理論和正確性。 然而在大樣本時,其實經由Overton ( 2001 ) 的研究中可以發現,其實每種方法之 間的差異性不大,所以在大樣本的情況之下,為了顧及使用軟體的方便性,可以採用 MWLS 的分析方法來進行分析,但是現在許多的統計軟體其實都可以計算出 Welch T-Test 的自由度,所以沒有必要為了遷就方便幸而選擇 MWLS。另外在管理方面的研究 中,經常會有在理論時都相當的完美,但是一旦加以統計分析,卻發現結果並不如想像 中的穩健,這當中有部分的原因是由於統計分析方法選擇的錯誤,如果在選擇分析方法 的時候,能夠選擇正確而適合的方法,想必可以讓管理研究的結果更加的可信,也因此 整理出一個在不同的情形之下,應該選用的分析方法以供在研究時使用。 應該使用的方式 變異數相等 Z-test 大樣本時 變異數不等 為了軟體方便性可使用MWLS 或 Welch T-test 變異數相等 一般T-test 小樣本時 變異數不等 Welch T-test 圖六 在不同情形下可選用的統計分析方式

(34)

以上情形都是試用在兩組樣本的情形之下,但如果樣本不只兩組,則可以使用A test 、J test 和 F* test,這三種方式都是可使用在多組樣本的情形。

(35)

參考文獻

Aguinis , H., & Pierce, C. A. (1998). Heterogeneity of error variance and the assessment of moderating effects of categorical variance: A conceptual review. Organizational Research Methods, 1, 296-314.

Alexander, R. A., &DeShon, R. P. (1994). The effect of error variance heterogeneity on the power of tests for regression slope differences. Psychological Bulletin, 115, 308-314. Aspin, A. A.(1948). An examination and further development of a formula arising in the

problem of comparing two mean values. Biometrika, 35, 88-96.

Dretzka, B.J., Levin, J. R., & Serlin, R. C. (1982).Testing foe\r regression homogeneity under variance heterogeneity. Psychological Bulletin, 91, 376-383.

James, G. S. (1951). The comparison of several groups of observations when the ratios of population variance are unknown. Biometrika, 38, 324-329.

SAS Institute. (1999).SAS/STAT user’s guide (version 8). [software manual].Cary, NC: Author.

Welch, B.L. (1937). The significance of the difference between two means when the population variances are unequal. Biometrika, 29, 350-362.

(36)

附錄一 迴歸式為 Y=Xβ+E 其中 Y= 1 2 1 .. × ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ N k Y Y Y ,X= ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ 1 .. 1 1 k X X X .. 2 1 k Z Z Z .. 2 1 4 2 1 ) ( ... ) ( ) ( × ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ N k XZ XZ XZ ,β= 1 4 3 2 1 0 × ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ β β β β ,E= 1 1 0 .. × ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ N k ε ε ε 令 XD= ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ k X X X .. 2 1 k Z Z Z .. 2 1 3 2 1 ) ( ... ) ( ) ( × ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ N k XZ XZ XZ 令 XC=( ) N J IN XD,其中JN×N的1 矩陣,則 XC= ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − − − X X X X X X k .. 2 1 Z Z Z Z Z Z k − − − .. 2 1 3 2 1 ) ( ... ) ( ) ( × ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ − − − N k XZ XZ Z X XZ Z X XZ 使 XC=[X 1 C XC2] X 1 C = ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − − − X X X X X X k .. 2 1 2 2 1 .. × ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ − − − N k Z Z Z Z Z Z ,X 2 C = 1 2 1 ) ( .. ) ( ) ( × ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − − − N k xz XZ Z X XZ Z X XZ (XC T XC)−1= ⎢ ⎢ ⎣ ⎡ 1 2 1 1 C T C C T C X X X X 1 2 2 2 1 − ⎥ ⎥ ⎦ ⎤ C T C C T C X X X X ⎢ ⎢ ⎣ ⎡ = − 0 ) ( 1 1 1 C T C X X ⎥ ⎦ ⎤ 0 0 +

[

( ) 1

] [

( ) 1 1 1 1 2 2 1 1 1 − − C T C C T C C T C C T C X X X W X X X X X I

]

其中 2 2 1 1 C T C M X X W− = T C C T C C X X X X I M 1 1 1 1 1 1 ( ) − − = ) ( ) ( 1 2 2 2 2 1 1 1 1 i Z i i XZ i X i i XZ T C C T C C X X X X S X Z S Z S X Z S X − = − + − 其中βˆ =(XCTXC)−1XCY 由於我們只關心β ˆ3=

(37)

所以由之前公式可以算出 ˆ ( ) 1( 1 ) 1 3 X 2M X 2 X 2M Y T C C T C − = β 其中 2 2 2 2 2 2 2 2 2 2 1 1 2 2 2 2 2 2 2 1 1 1 1 2 2 2 ( ) [ , ] XZ Z X XZ X X YZ X Z X YZ XZ Z X YX Z X X YX Y X XZ Z X X XZ XZ Z Z X X Y X T C C T C C T C T C T C S S S S S S S S S S S S S S S S S S S S S S S S S S Y X X X X X Y X Y M X C C C C C C C C C − − + − − = − ⎥ ⎦ ⎤ − ⎢ ⎣ ⎡ − − = − = − 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 XZ Z X XZ Z X X X X Z X Z X X X C T C S S S S S S S S S S S X M X C C C C C − − + − = 2 2 2 2 2 2 1 1 1 1 1 3 ( ) ( ) ˆ C T C T C T C C T C X M X Y M X Y M X X M X = = − β 將第一組Z=0 和第二組 Z=1 帶入迴歸式當中,則可以得到 2 2 1 1Y PY P Y = + 其中 2 1 2 2 2 1 , n n n P n n n P n + = + = 2 1 2 2 2 1 2 1 2 2 1 2 2 2 2 2 2 2 2 1 2 1 2 2 1 2 2 2 2 2 2 2 2 1 1 2 2 2 2 1 2 2 2 1 2 1 1 1 1 1 ) ( X X X YZ Z X XZ Y Y Y X X Z X X X C S K X X X S K Y Y S K X S K X X S K Y Y S S S K X S S K S K n n n n X X S S S X P X P Z X P X P X C C C + − = − = = − = − + + = + = = = + + − + + = = = + =

(38)

2 2 2 2 2 1 1 1 2 2 1 2 1 2 )( ) ( Y X YX Y X Y X XY S K Y Y X S K Y Y X X S S S C + − = − + + + = 則將以上算式帶入β 的公式當中,即可得到ˆ3= β 的結果如式子(2.29) ˆ3=

(39)

附錄二 1 2( ) ) ˆ ( =X X V β σ T ⎢ ⎢ ⎢ ⎣ ⎡ g d a h e b ⎥ ⎥ ⎥ ⎦ ⎤ k f c = ⎢ ⎢ ⎢ ⎣ ⎡ 2 2 C XX XZ X S S S 2 2 C ZX Z XZ S S S ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ 2 2 2 2 C C C X ZX XX S S S k=(ae-bd)/Z Z=a(ek-fh)-b(dk-fg)+c(dh-eg) 則經由附錄一的算式,我們可以求出Z= K S SX2 X2 2 1 則 2 3 2 2 2 1 1 1 ) ˆ ( X X S S k S β = = +

(40)

附錄三 TITLE "STUDY"; PROC IML; SEED=2;TTT=RANNOR(SEED); REPNUM=10000; N1=50; BETA1=0.15; SIGSQ1=1; SIGSQX1=1; N2=50; BETA2=0.15; SIGSQ2=1; SIGSQX2=1; COUNT=0; COUNT1=0; DO I=1 TO REPNUM; X11=SQRT(SIGSQX1)#RANNOR(J(N1,1,0)); X21=SQRT(SIGSQX2)#RANNOR(J(N2,1,0)); Y1=BETA1#X11+SQRT(SIGSQ1)#RANNOR(J(N1,1,0)); Y2=BETA2#X21+SQRT(SIGSQ2)#RANNOR(J(N2,1,0)); K1=2; X1=J(N1,1,1)||X11; X2=J(N2,1,1)||X21; X1PX1=X1`*X1; X1PY1=X1`*Y1; INVX1PX1=INV(X1PX1); BETAHAT1=INVX1PX1*X1PY1; Y1HAT=X1*BETAHAT1; RESIDUAL1=Y1-Y1HAT; SSTO1=Y1`*(I(N1)-J(N1,N1,1/N1))*Y1; SSE1=RESIDUAL1`*RESIDUAL1; SSR1=SSTO1-SSE1; MSR1=SSR1/(K1-1);

(41)

MSE1=SSE1/(N1-K1); COVBETAH1=MSE1#INVX1PX1; K2=2; X2PX2=X2`*X2; X2PY2=X2`*Y2; INVX2PX2=INV(X2PX2); BETAHAT2=INVX2PX2*X2PY2; Y2HAT=X2*BETAHAT2; RESIDUAL2=Y2-Y2HAT; SSTO2=Y2`*(I(N2)-J(N2,N2,1/N2))*Y2; SSE2=RESIDUAL2`*RESIDUAL2; SSR2=SSTO2-SSE2; MSR2=SSR2/(K2-1); MSE2=SSE2/(N2-K2); COVBETAH2=MSE2#INVX2PX2; WGT1=(N1-4)/SSE1; WGT2=(N2-4)/SSE2; X3=X11-J(N1,1,(SUM(X11)+SUM(X21))/(N1+N2)); X4=X21-J(N2,1,(SUM(X11)+SUM(X21))/(N1+N2)); X5=J(N1,1,1)||X3||J(N1,1,1)||X3; X6=J(N2,1,1)||X4||J(N2,1,0)||J(N2,1,0); G=SQRT(((WGT1#I(N1))||J(N1,N2,0))//(J(N2,N1,0)||(WGT2#I(N2)))); X=G*(X5//X6); Y=G*(Y1//Y2); N=NROW(X); K=NCOL(X); XPX=X`*X; XPY=X`*Y; INVXPX=INV(XPX); BETAHAT=INVXPX*XPY; YHAT=X*BETAHAT; RESIDUAL=Y-YHAT; SSTO=Y`*(I(N)-J(N,N,1/N))*Y; SSE=RESIDUAL`*RESIDUAL;

(42)

SSR=SSTO-SSE; MSR=SSR/(K-1); MSE=SSE/(N-K); COVBETAH=MSE#INVXPX; IMLT_TEST=ABS(BETAHAT[4,1])/SQRT(VECDIAG(COVBETAH[4,4])); IMLT_PVALUE=2#(1-PROBT(IMLT_TEST,N-K)); DF=((COVBETAH1[2,2]+COVBETAH2[2,2])##2)/(((COVBETAH1[2,2]##2)/(N1-2))+((COVBETAH2[2,2]## 2)/(N2-2))); PAIRT_TEST=ABS(BETAHAT1[2,1]-BETAHAT2[2,1])/SQRT(COVBETAH1[2,2]+COVBETAH2[2,2]); PAIRT_PVALUE=2#(1-PROBT(PAIRT_TEST,DF));

IF ABS(IMLT_TEST)>TINV(0.975,N-4) THEN COUNT=COUNT+1; IF ABS(PAIRT_TEST)>TINV(0.975,DF) THEN COUNT1=COUNT1+1; END;*FOR REPNUM; EMP_ALPHA=COUNT/REPNUM; EMP_ALPHA1=COUNT1/REPNUM; PRINT EMP_ALPHA; PRINT EMP_ALPHA1; RUN; QUIT;

參考文獻

相關文件

若我們能知道有 k 個 row 的矩陣一 定能利用 elementary row operations 化為 echelon form 這個事實且利用這個事實證得有 k + 1 個 row 的矩陣一定能利用 elementary row

在前面幾節中要證明一個 integral domain 是一個 unique factorization domain, 我們都去證明這個 integral domain 中的 irreducible elements 和 prime elements 是

認可檢查設備 (approved screening device) 指警務處處長根據第39F條認可的類型的設備,而該設備是 用作顯示在任何人呼氣中酒精比例是否相當可能超過訂明限度;

「光滑的」邊界 C。現考慮相鄰的 兩個多邊形的線積分,由於共用邊 的方向是相反的,所以相鄰兩個多

MSS6.4.2 基於判定條件運用演繹法證明全等和相似三角形 MSS6.4.3 驗證三角形四心如內心、外心、垂心和形心的作圖法 MSS6.5 認識四邊形的性質

• 當我們在歸類一個問題為 問題時,等於不在乎他的複雜度是 還是 之類的,只要是多項式時間就好。.

在生活中體證禪、領悟禪的真諦,這是「禪與生活一體」的第

一九二七年深秋,弘一法師到豐子愷家裡住了一個月,在這一個月中兩人朝夕相處,每