行政院國家科學委員會專題研究計畫 成果報告
複相關分析之樣本數運算與應用
研究成果報告(精簡版)
計 畫 類 別 : 個別型 計 畫 編 號 : NSC 98-2410-H-151-009- 執 行 期 間 : 98 年 08 月 01 日至 99 年 07 月 31 日 執 行 單 位 : 國立高雄應用科技大學人力資源發展系 計 畫 主 持 人 : 龔千芬 共 同 主 持 人 : 謝國文 處 理 方 式 : 本計畫涉及專利或其他智慧財產權,2 年後可公開查詢中 華 民 國 99 年 10 月 28 日
(一)、研究動機與目的
在多元常態下之複迴歸模式分析的情況下,複相關係數已經普遍的應用於各 個不同的領域, Bobko (2001) 更在有關相關係數與迴歸的書中,列舉相關係數 在策略管理、組織行為和個人心理這些研究領域上的應用。在組織行為方面,Pell 和 Xin (1999) 在 Journal of Management 中發表員工情緒與退縮行為的關係,論 文中說明情緒的好壞與員工行為的關係,並進一步探討工作滿意度會干擾情緒與 行為之間的關係,情緒與行為的相關性可以做為管理者管理員工情緒與行為之重 要參考依據。在管理科學相關的研究中,作者強調各個變項前因與後果的相關 性,並檢測三種量表與各個前因因素的關係,說明哪一種量表最能解釋原因的變 異量。研究者主要欲了解各項變項之關係,了解各項相關性之強弱,關係是否存 在、是否顯著,可否藉由這些變項做相關性的解釋,並藉由這些關係推演為有管 理意涵之結論。這些管理研究中所關注的變項關係的強度,皆與相關係數有密不 可分的關係。然而,Bobko (2001) 強調在研究上,針對兩個以上預測變數的情況 下,複相關係數比相關係數而言是一個更佳且實用的判斷指標,所以,大部分研 究者皆使用複相關係數作為研究上的指標。在管理科學相關領域中,統計分析方 法中主要以假設檢定為主,在假設檢定分析的過程中,型 I 誤差 ( ) 與檢定力, 備受研究者重視,期望研究具有較佳的檢定力,所以,許多學者 ( Baroudi & Orlikowski, 1989; Murphy & Myors, 2004) 皆強調若要提升研究的檢定力,增加樣 本數是重要的方法之一。所以,決定樣本數需要多少的數量,是每位研究者必須 面臨的重要議題與決策。 研究過程中需要用多少的樣本,是許多研究學者非常關注的議題。用少量的 樣本將使許多結果皆不顯著,但收集大量的樣本又需耗費研究者龐大的經費與時 間,形成抉擇兩難的問題。而目前有許多學者作了許多研究,討論與建議研究者 應該運用多少樣本數,才能在有限的時間及資源下,得到一個較佳的結果。但是, 計算精確的樣本數,方法皆十分的複雜,所以針對樣本數的決定有很多的研究者 提出一些的經驗法則,但是 Green (1991) 強調樣本數之決定並非仰賴一些學者所 提出之經驗法則,研究之結果顯示不支援經驗法則所得的樣本數,並建議研究者 必須結合效應量 (effect size) 一起決定樣本數之多寡。的確,從事研究者的學者 針對樣本數的決定一直皆存在有經驗法則的問題,而這些經驗法則所決定的樣本 數,也對分析的結果存在了一些不正確的期望與推論,而造成一些是似而非的誤 解。在決定樣本的方法除了經驗法則之外,Green (1991)、Brooks 和 Barcikowski (1995),等等的學者也發展了一些計算樣本數的演算法,主要希望藉由這些方法 的提出能夠帶給後續的研究者一個較為精確的方式來決定樣本數。而本研究也根 據 Shieh 和 Kung (2007)中提出計算精確樣本數的演算法,另外,本計劃彙整了 目前有提出樣本數計算方法之相關研究,同時根據各個研究所提出的方法計算所 需的樣本數,並進一步將各個結果與本計劃的結果相互比對與驗證,期望能夠提 出較為精確的計算方式,以提供一般學者對於樣本數的正確認識,以破除一般學 者對於樣本種種不正確的經驗法則。
隨著科技的進步,電腦運算能力的增強,使得許多複雜式子得以解決,而複 相關係數分佈之運算與其結構非常複雜,致使許多研究者望之卻步。但是,仍有 一些學者,例如:Cohen (1988)、以及 Gatsonis 和 Sampson (1989) 針對檢定力 與樣本數提供一些特定參數的數值表,以提供一般學者較為便利以獲取到資訊的 一項途徑,但是對於資訊取得的便利性與資訊的全面性皆存在相關的問題。然而 近幾年來,由於電腦硬體功能的提升與電腦軟體的輔助,使得研究者可以有更多 有利的工具幫助研究進行的更順利與嚴謹,例如:Algina 和 Olejnik (2003)、 Dunlap, Xin 和 Mayer (2004)、Mandoza 和 Stafford (2001) 以及 Shieh (2006) 皆 結合 Fortran, Mathematica, SAS, 和 SPSS 等系統軟體,以提供學術研究者更有效 率的工具。但是,以上所列的那些統計或數學運算專業軟體,對於一般學者而言 皆存在有一定程度的進入障礙,所以,本計劃根據 Shieh 和 Kung (2007) 所發展 精確的軟體為基礎,該軟體使用對於一般使用者親和性高並且容易使用等等特性 的 Excel 作為發展軟體的系統,該軟體可即時運算各種情況之樣本數。本計劃主 要強調在管理層面的相關研究應用,期望本軟體能讓統計意涵能真正落實於實際 研究應用上,介紹一個有效規劃與檢測軟體工具,嘉惠後續研究學者。 綜合以上的觀點,本計劃的研究目的如下列幾點所述: (1) 說明在複相關係數之假設檢定的情況下,檢定力的相關影響因素為何,檢定 力與效應量的關係,效應量與樣本數的關係,及其它影響樣本數的因素。 (2) 彙整目前決定樣本數的經驗法則。 (3) 彙整各個研究者發展樣本數計算的各個不同方法。 (4) 發展較精確計算樣本數的演算法,並發展軟體可即時與互動的運出樣本數。 (5) 根據研究者較常用的各種不同的條件與情況,計算所需的樣本數,並將資料 彙總成圖表,可使研究者藉由圖表的展示,對於各個條件所需的樣本數有更 深一層的認識與了解。 (6) 最後,本計劃提出一個實際研究的個案,利用本計劃所發展的軟體,運用於 研究事前規劃、研究過程中即時修正、與研究後之事後檢討,此三個過程有 關效應量、判定係數(R2 )、檢定力、與樣本數之操作與運作。期望藉此個案 的操作,使一般研究者對於複相關分析的樣本數的運用與計算有更清楚的認 識與了解,並可利用此軟體於研究與教學展示上。 (二)、文獻探討 (1)、假設檢定、檢定力、與效應量 在一般社會科學或管理相關的研究中,假設檢定是研究中不可缺少的重要分 析過程。在檢定過程中需要決定 與的數值。 為型 I 誤差,意指若虛無假設 H0 為真,卻因統計檢定結果予以拒絕的機率,如表 1 所示。所以, 越小也
代表拒絕虛無假設的標準越嚴格。 為型 II 誤差,若虛無假設 H0 為假,卻因 統計檢定結果而予以接受的機率。當樣本數固定時, 小則 會大, 大則會 小 。 在 統 計 推 論 中 , 與 受 到 關 注 的 程 度 是 明 顯 不 對 等 的 (Baroudi & Orlikowski, 1989)。在一般行為科學與資訊管理的領域相關的研究專注於型 I 誤 差是否適合,利用設立較小的型 I 誤差 ( = 0.05 或 0.01) 來嚴密監控統計結 果,所以,許多研究者因此而忽略了型 II 誤差。然而,Mazen 等學者 (1987) 利 用個案與相關圖表說明型 II 誤差比型 I 誤差所引發的風險更大,故除了型 I 誤差 的重視外,更應該讓型 I 與型 II 誤差得到對等的重視。然而型 II 誤差與檢定力 (Power) 息息相關,故以下則針對檢定力進行相關的介紹。 檢定力代表對立假設為真時,而檢定結果也正確的予以接受的機率。所以, 檢定力也可以說是 (1-),如表 1 所示。Cohen (1992) 強調在用於研究資料的 統計檢定上,檢定力代表一個非常重要的資訊。Baroudi 和 Orlikowski (1989) 強 調在虛無假設為不成立時,統計檢定力成為解釋結果決定性的關鍵。 表 1 統計檢定結果分析表
What is True in the population? Treatments have no effect Treatments have an effect No Effect Correct Conclusion 1 Type II error Conclusion Reached in A Study Treatment effect Type I error Correct Conclusion 1
影響統計檢定力的三個主要因素:(a)、顯著水準 (significance level);(b)、 樣本數,以及 (c)、效應量。以下則針對此三個主要因素做詳細的說明: (a)、顯著水準 ( ):代表虛無假設之 “拒絕臨界區域”,故顯著水準越小, 則虛無假設的拒絕區域越小,拒絕標準越嚴格。顯著水準越大則增加檢定力。 Pollard (1993) 說明當不希望研究文獻充斥假的效應和不鼓勵做無意義的實驗 時,此時應關注如何避免型 I 錯誤,然而當型 I 錯誤已被控制時,Cohen (1992) 強 調在心理類研究中, 已被忽略,而且在已出版的研究中,這些研究的檢定力 介於 0.5 與 0.8 之間,這些數據代表,若研究的檢定力為 0.55,則型 II 誤差 0.45, 導致難以接受研究的結論。 (b)、樣本數:在各項條件皆不變的情況下,樣本數越大則精確度越高,會
增加拒絕 “假” 虛無假設的機會,如此,檢定力會增加。Sedlmeier 和 Gigerenzer (1989) 說明,在檢測 H0 與 H1 時,當樣本數增加時,樣本分佈標準差減少, 如此導致分佈較少重覆和增加檢定力。 (c)、效應量:代表變數間關係的重要性與強度的多寡、在母體呈現此現象的 程度、或 H0 與 H1 的真實差異。效應量的統計方式首先由 Cohen (1988) 提出, 效應量可廣泛的用於有效應的程度,大部分是以標準化的方式呈現效應程度。若 在其餘的條件皆控制的情況下,效應量越大則能夠證明此現象的程度越高,能夠 偵測與拒絕虛無假設的機率越高,則檢定力也越高。 對研究者而言, 效應量也許是最難預測的參數。Mazen 等學者 (1987) 建 議可由之前相關研究可解釋變異之比例建立效應量之索引。Cohen (1988) 為了方 便預測效應量,以順利計算檢定力,故發展可操作的定義,以應用迴歸分析方法 而言,效應量分為小、中、大三種不同之效應量依序為 0.02、0.15、0.35,以式 子(1) 轉換則母體判定係數從小到大依序為 0.0196、0.13、及 0.26。Cohen (1992) 進一步定義中效應量 (medium effect size),指的是觀察者用肉眼可以察覺變化的 程度。Sedlmeier 和 Gigerenzer (1989) 發現中效應量接近於樣本中位數,並由過 去相關文獻支援定義效應量。另外,Cohen (1988) 說明小效應量 (small effect size) 大部份出現於性格和社會心理方面的研究,因為這類研究的衡量大多有較低的信 度。大效應量 (large effect size)出現於實驗心理類的研究,這類研究大多有實驗 組與控制組,並且重視衡量過程與工具的嚴謹性。 綜合以上這三個影響因素的現象,當增加這三個影響因素的數值,同時也增 加檢定力。這三個影響因素對檢定力的關係整理如下表所示。 表 2 檢定力與顯著水準、樣本數、效應量之關係 顯著水準 (significance level) 樣本數 (sample size) 效應量 (effect size) 檢 定 力 (power) 正向關係 正向關係 正向關係 Baroudi 和 Orlikowski (1989) 提出如何提升檢定力,主要的方法包括: (a)、增加樣本數,(b)、改變抽樣方式,建議採用隨機抽樣,若無法達成隨機抽 樣,也建議採用目的取樣或盡量增加樣本同質性,而使標準誤差減小。(c)、變數 的選擇,建議選擇相關性小的變數,可以避免共線性的問題。 (d)、減少誤差, 盡量減少衡量誤差,等等的方法。另外,Murphy 和 Myors (2004) 提出兩種方 法以增加檢定力,第一種最簡單的方法為改變顯著水準,當顯著水準較為寬鬆 時,檢定力則增加,但是,此種作法對於研究本身與研究的解釋能力並不代表任 何意義。第二種方法即增加樣本數,主要增加同質性或一般性,減少抽樣誤差的 可能性所導致對結果的錯誤解釋。由上述的種種方法可以說明增加樣本數是提升 檢定力的共通方法,以下則是針對樣本數做更深入的介紹。 (2)、決定樣本數之經驗法則
對研究者而言,在研究過程中需要運用多少樣本數而能夠反應出母體的真正 現象,是許多研究者一直想要克服的難題。雖然使用較多的樣本較可以反應出真 正現實面的狀況,但是受限於時間與預算,研究者皆希望能夠以最少的資源發揮 出最大的效果,所以,在研究中要使用多少的樣本數一直是研究者最關注的議 題。Maxwell (2000) 說明在迴歸分析的情況下,如何決定樣本數。在迴歸分析下, 檢定力檢定依據 noncentral F 分配,主要有三個影響參數:分子自由度,分母自 由度,以及 noncentrality 參數。另外,分子與分母的自由度又決定於預測變數的 數目,樣本數,和效應量的類型。Brooks 和 Barcikowski (1995) 以及 Green (1991) 說明樣本數的決定主要受以下的因素所影響:(a)、預測變數的個數;(b)、效應 量;(c)、 ;(d)、檢定力。其中以效應量的認定是決定樣本數的最主要的困難 之一。除此之外,決定樣本數的相關運算十分的複雜,而致使大部份的研究者在 決定樣本數上發展了許多的經驗法則。 由於樣本數式子複雜,故許多學者便提出一些 「經驗法則」以簡馭繁。大 部份的經驗法則根據樣本數與預測變數的個數的比例,例如:Stevens (1986) 建 議樣本數與預測變數個數的比例為 15:1。Harris (1985) 以及 Wampold 和 Freund (1987) 皆指出,一般的規則樣本數與預測變數個數的比例應為 10 : 1。Green (1991) 則建議樣本數應該大於 50+8*預測變數個數。Nunnally (1978) 建議在複 迴歸的情形下,一般而言,大部份的情況需要樣本數 300 至 400 左右。另外,也 有一些學者建議不需理會預測變數與樣本數的關係,建議樣本數必須至少要 100,或甚至 200 個 (Kerlinger & Pedlhazur, 1973)。最後,在所有的經驗法則中, 以 Olejnik (1984) 的說法最為廣受運用:使用你所能取到而且你能負擔的樣本數 目。所有有關樣本數的經驗法則彙總於表 3。
表 3 樣本數決定之經驗法則
Rule Authors
N = 10p Miller & Kunce , 1973 Halinski & Feldt, 1970 N = 15p Stevens, 1992
N = 20p Tabachnick & Fidell, 1989 Halinski & Feldt, 1970 N = 30p Pedhazur & Schmelkin, 1990 N = 40p Nunnally, 1978
N = 50 + p Harris, 1985 N = 10p +50 Thorndike, 1978 N > 50 + 8p Green, 1991
N > 100 Kerlingeer & Pdhazur, 1973
N = ) 1 ( ) 1 2 ( 2 2 2 K p K K Sawyer, 1982 (K 為預測迴歸係數之膨脹因子)
N 代表樣本數,p 代表預測變數個數
部份資料來源自 Brooks & Barcikowski (1995)
由以上的論述得知,決定樣本數之經驗法則有很多學者提出相關的看法,但 是這些論點也遭到一些學者的批評與質疑 (Maxwell, 2000; Green, 1991; Gatsonis & Sampson, 1989; Brooks & Barcikowski, 1995)。例如:Nunnally (1978) 與 Kerlingeer 和 Pdhazur (1973) 僅提出一個大致數據,毫無任何根據。另外,Miller 和 Kunce (1973)、Stevens (1992)、以及 Pedhazur 和 Schmelkin (1990)等等的學 者,皆提出樣本數僅與預測變數個數有關。所以,Brooks 和 Barcikowski, (1995) 強調這些決定樣本數的經驗法則最大的問題是缺乏樣本數與效應量之間的相 關。從以上的學者對於決定樣本數的經驗法則的種種不同的看法,另外,有些學 者導出計算樣本數的公式,期望能夠利用這些公式,算出較為精確的公式。 (3)、計算樣本數之方法 決定樣本數的方法除了上述的經驗法則之外,更重要的是,有許多學者提出 計算樣本數的公式,本計畫介紹相關學者所提的算式。相關的樣本數計算方式, 如下列 (a) 至 (e) 所示。
(a)、Gatsonis 和 Sampson (1989) 參考 Lee (1972) 的演算法為基礎以計算 樣本判定係數之分布函數,並發展計算檢定力之函數如公式 (1) 所示: } ] ) 1 /[( { 1, 1 2 1 1 2 2 1 * N p p N k p N p F p p (1) 其中,k 為一 Poisson 分配,當* * N[( 1)/2]2/(12) p 為預測變數之個數,N 為樣本數 在求出檢定力之後,在假設當 , p ,,以及N 為某一特定的常數時,運用此 函數運算,得到符合最低的檢定力時,即求得該樣本數。此種方法非常的複雜, 雖然在此論文中有附相當大篇幅的資料表可供讀者查閱,但是,這些數據需要做 一些轉換,另外,這些資料以母體相關係數為主來呈現所需的樣本數,跟母體判 定係數的運算上仍有部份的差異存在。 (b)、Green (1991) 提出在迴歸模式下,樣本數的計算方式如公式 (2) 和 (3) 所示: 首先,求 L = 6.4 + 1.65 p – 0.05 p2 (2) 再求樣本數 N L/ f 2 (3) 其中, 2 2 2 1 R R f ,p 為預測變數之個數。
(c)、Brooks & Barcikowski (1995) 提出在複迴歸模式下,提出在確定預估之 樣本判定係數或決定預估樣本判定係數的縮減範圍下,計算樣本數的方式如公式 (4) 所示: )]/ 2 2 )( 1 [( 2 p R N (4) 其中,p 為預測變數之個數,R2 為預估樣本判定係數, 為樣本判定係數 可接受縮減的部份。
此研究利用 Monte Carlo 及 Turbo Pascal 6.0 計算檢定力與所需的樣本數。 Brooks & Barcikowski (1995) 以結合 Green (1991) 以及 Cohen (1988) 的不足之 處,在公式上結合效應量的觀念於樣本數的計算中,使樣本數的決定更貼近實際 的理論與應用,但是,此研究雖然要求精確,但是,公式的運算太過於複雜,又 加上以模擬的方式,更讓使用者不容易運用或查詢,另外,研究者必須預估樣本 判定係數之縮減部份更添加其不確定性。 (d) 、Maxwell (2000) 提出樣本數的決定方法如公式 (5) 所示: 1 85 . 7 2 p f N (5) 其中, 2 2 2 1 R R f ,p 為預測變數之個數。 另外,Maxwell (2000) 也依據 Cohen(1988) 效應量的定義,大致推測出在檢 定力為 0.8,預測變數為 1 時,效應量與樣本數的關係如公式 (6)、(7)、(8) 所示: 小效應量:N = 392 + p (6) 中效應量:N = 52 + p (7) 大效應量:N = 22 + p (8) (e) Cohen (2003) 提出決定樣本數的方法,如公式 (9) 所示: N = 1 2 p f L (9) 其中,L 必須依據所需檢定力的值、自由度、及 查表而得到該值。 (三)、研究方法 (1)、R2 之機率函數 (density function) 考慮複迴歸模式的情況下,有 i 個觀測樣本,反應變數 Yi,p 為解釋變數的 個數,預測變數為 Xi1 , Xi2 ,…, Xip,此迴歸模式如下所示:
i ij p j i i X Y
1 0 (10) 假設Xij為多變量常態分佈,Xij ~ N( 2 , ),0,1,…,p為未知的參數, i ~ N(0,2)。為 Y 和 X1, X2, …, Xp 之間的母體複相關係數 (population multiple correlation coefficient) , 定 義 為 Y XYX
, 而 2為 母 體 判 定 係 數 (population squared multiple correlation coefficient)。在樣本數 N > p 的情況下,Y 和 X1, X2, …, Xp 之間的樣本判定係數 (sample squared multiple correlation coefficient)為 R2。R2 的密度函數如下所示 (Anderson, 1984, p.145)。 f(r2;p,N,2) (11)
1 /2
! /2
1
/2
) 1 ( ) ( 1 ) ( 2 / 1 2 2 ( 1)/2 2 /2 1 2 ( 1)/2 2 0 N i p i N p r r i N i N p i N p i 在式子 (11) 中,其中 0 R2 1,2是母體判定係數,()為 gamma 函數。 由式子 (11) 可知,R2 密度函數是一個非常複雜的式子。而後來有許多學者 以不同的方式呈現,例如:Gatsonis 和 Sampson (1989),Ding (1996),Mendoza 和 Stafford (2001),以及 Steiger 和 Fouladi (1992)。然而,Mendoza 和 Stafford (2001),以及 Steiger 和 Fouladi (1992)皆以 Lee (1972) 所推演的式子為基準,算 出精確的結果。Lee (1972) 的式子如下所示: ) , , , (N p 2 R2 f
2 2 1 2 2 1 2 1 2 1 2 2 1 2 1 ; 2 1 , 2 1 , 2 1 1 1 2 2 1 , 2 1 R p n n F R R n p B n p n (12) 在式子 (12) 中,B(.)和 F(.)分別代表 Beta 和超幾何分配 (hypergeometric) 之 函數,n = N - 1 和 n2 = n - p = N - p - 1,其中 N 代表樣本數,p 為解釋變數的個 數。本計劃之 R2 密度函數也依據 Lee (1972) 的式子發展而成。R2 的密度函數 也可以說明以樣本數 N、解釋變數的個數 p ,母體判定係數2 ,以及樣本判定 係數 R2 以上四個參數所構成的函數。 本計劃欲利用式子 (12) 求得樣本複相關分配函數的數值之後,再利用 Simpson’s rule 進行積分,求得累積樣本判定係數分佈函數面積值。(2)、假設檢定 針 對 複 迴 歸 模 式 的 假 設 檢 定 , 由 於 檢 定 H0 :2 0 和 檢 定 H0 : 0 ... 2 1 p 相同,所以可以使用 F 檢定來進行整個模式 (Full model) 假設檢定的分析。 圖 1 檢定力計算示意圖 以圖 1 表示本研究計算檢定力之示意圖,圖 1 中有兩個分配,由於樣本判 定係數為 noncentral F 分配,所以,以左方之分配為虛無假設的情況,右邊之分 配為對立假設之情況,以檢定力之定義為當對立假設為真時,拒絕虛無假設的機 會,即為圖上陰影的部分。本研究計算的方式為,若以顯著水準為α,則在虛無 假設的情況下找出左邊的面積,最接近 1-α的切點,找出切點後,在對立假設下, 算出由切點到最右邊端點的機率,所求出之機率即為檢定力。 利用上述的方法求得檢定力後,本計劃則利用樣本數逐漸累進的方式,判斷 在此樣本數情況下計算檢定力,判斷是否可達到欲求的檢定力,所以利用反覆判 斷運算的方式求得樣本數。 (四)、關鍵要素分析 本部分將針對一般研究常遇到的問題,例如:至少需要多少的樣本數才能夠 達到檢定力大於 0.8 的問題,將相關條件情況利用 RHO-SQUARE(軟體名)加以運 算,將所得的結果彙整成圖表,藉由圖表的表達使讀者能夠對複相關分析有更深
一步的認識。 (1)、樣本數與其他關鍵因素之間的關係 本部分將針對主要影響樣本數的關鍵因素,例如:檢定力、預測變數的個數、 母體判定係數、或效應量,藉由圖與表的呈現,詳細說明各個要素與樣本數的關 係。 (a)、母體判定係數與樣本數 圖 2 則為預測變數的個數為 5、顯著水準為 0.05、雙尾檢定的情況下,不同 的母體判定係數與不同的檢定力搭配組合下,所需最少樣本數所繪製的折線圖。 從圖 2 中顯示,在預測變數為 5、顯著水準為 0.05 雙尾檢定的條件下,同樣的, 在檢定力為 0.1 時,母體判定係數越小,所需的樣本數越多,例如:在母體判 定係數為 0.1 下,檢定力為 0.1 ,所需最小樣本數為 25 ,而母體判定係數為 0.9 ,只需要 8 個樣本即可達到檢定力為 0.1 。另外,從圖 2 也呈現當欲達到 的檢定力越高時,所需要的樣本數也越高,所以,依據母體判定係數為 0.3 的 情況下,欲達到檢定力 0.7 時,至少需要 38 個樣本數,而欲達到檢定力 0.8 時,則需要 45 個樣本數。 (b)、效應量與樣本數 若以 Cohen(1988) 將效應量分為大效應量、中效應量、小效應量三種,將 這三種以母體判定係數的方式表示,則分別為母體判定係數等於 0.26、0.13、 0.0196。以下則主要以大效應量、中效應量、小效應量三種為主軸,藉由繪圖的 方式,進一步詳細的闡述樣本數與效應量之間的關係,如圖 3 所示。
圖 2 檢定力與樣本數之折線圖 ( 2 = 0.1, 0.167, 0.2, 0.3, 0.333, 0.4, 0.444, 0.5, 0.6, 0.7, 0.8, 0.9) 圖 3 檢定力與樣本數之折線圖 (小效應量, 中效應量, 大效應量) 由圖 3 中顯示,在預測變數個數為 5 的基準下,小效應量所需要的樣本數遠比 中效應量及大效應量多,以同樣達到檢定力 0.8 的情況下,小效應量需要至少 763 個樣本數,而中效應量以及大效應量同樣達要檢定力 0.8 的情況下,只分別 需要 111 及 53 個樣本數。值得注意的是,小效應量所需樣本數之成長曲線非 常的陡,與中效應量以及大效應量所需樣本數明顯成長許多,以小效應量而言, 若達到檢定力 0.2 時,即需要 202 個樣本。 (c)、預測變數個數與樣本數 預測變數個數也影響所需樣本數的多寡,Maxwell (2000)、Harris (1985)、以 及 Wampold 和 Freund (1987) 在論文中建議以預測變數個數來判斷所需要樣本 數的數量,圖 4 顯示在不同的預測變數個數下,檢定力與樣本數的關係。
圖 4 檢定力與樣本數之折線圖 (P = 3, 4, 5, 6, 7, 8, 9, 10)
由圖 4 中顯示,當預測變數個數越少時,所需的樣本數也越少,以預測變數為 3 時,所需的樣本數較少。另外,當欲達到的檢定力較小時,同樣的,所需的樣本 數也最少,故預測變數個數與檢定力皆與樣本數呈正向相關。另外,值得注意的 是,Harris (1985) 及 Wampold 和 Freund (1987) 皆建議樣本數與預測變數個數 的比例為 10 : 1 ,若以檢定力為 0.8 的基準下,當預測變數個數為 10 時,所 需的樣本數為 100;但是,根據圖 4 所顯示,當預測變數個數為 10 時,樣本 數只需 52,此結果跟 Harris (1985) 及 Wampold 和 Freund (1987) 所預測的樣 本數有蠻大的差異,在如此的情況下,使用 RHO- SQUARE 除了可得到較精確 的樣本數規劃外,更可以節省收集大量樣本所耗費的金錢與時間。 (d)、小結 在其他變數皆維持不變時,由上述分析的結果可彙總下列幾點結論及彙總如 表 4 所示。 a. 當母體判定係數越小時,所需要的樣本數越多,所以,兩者呈現反向關 係。 b. 同樣的,小效應量所需的樣本數也最多。 c. 當預測變數個數越少時,所需要的樣本數越少;若增加預測變數之個數, 則需要增加樣本數,故兩者呈現正向相關。
表 4 所需樣本數與其他關鍵要素彙總關係表(在其他條件皆維持不變下) 母體判定係數 效應量 預測變數個數 與 所 需 樣 本 數 之 關係 母 體 判 定 係 數 越 小,所需樣本數越 多 效 應 量 越 小 所 需 樣本數越多 預測變數個數少, 所需樣本數越少 反向關係 反向關係 正向關係 (五)文獻個案與探討 本研究主要針對母體複相關係數的假設檢定與樣本數決定等議題介紹相關 的應用軟體。首先介紹應用 RHO-SQUARE 的適當時機,然後再舉出相關的個案 介紹如何應用 RHO-SQUARE 於此研究中,並且配合在研究的過程中使用統計分 析的三個階段,模擬說明使用的方式,最後解釋各個結果所代表的含意。因為應 用複迴歸模式分析的相關研究相當的多,所以本章節主要針對國際已出版的管理 相關論文,利用論文中實際的研究結果,作為本研究個案演練的腳本,如此除了 可以讓讀者更瞭解如何使用 RHO-SQUARE 外,更對研究中的統計分析結果有更 深一層的體認,並進一步達到規劃與監控統計分析的效果。 (1)、 RHO-SQUARE 應用時機 Baroudi 和 Orlikowski (1989) 說明檢定力分析對於研究者而言是一個非常 有用的工具,並且建議在研究的過程中分成三個階段,使用檢定力分析。第一階 段 為 事 前 規 劃 (priori determination) 、 第 二 階 段 為 事 後 衡 量 (post hoc determination),以及第三階段為研究進行中的決定 ( determination of statistical power during a study)。
在第一階段,檢定力分析可當作一個事先規劃的工具,以預測在未來進行的 研究有較佳的檢定力。例如:在研究進行的初期,研究者使用檢定力分析,在符 合欲達成的關鍵數值條件下,決定樣本數的多寡。此一決定與規劃的過程需要重 複很多次,每一次皆依據研究者的目的與需求下,調整不同的關鍵數值組合, 使 研究者成為一個更主動積極 的角色。 第二階段則針對自己或他人已經完成的論文,在分析方法、樣本數、以及顯 著水準等等關鍵數值皆已知的情況下,利用檢定力分析,進行事後的衡量。主要 目的為利用這些已知的資料,預測相關研究的效應量,幫助未來相關研究在規劃 上提供有價值的參考資訊。 第三階段則針對無法事先決定需要多少樣本,達到欲求的檢定力時,在研究 進行時,依據現實動態發生的結果,執行當下之檢定力分析,並依據統計的結果 與外在的情況予以調整。所以,在研究過程中,必須不斷的進行檢定力分析,並 為下一個個案建立未來分析的基礎。 在以上這三個階段中,在每一個階段皆強調,研究者皆為主動且積極的針對 研究的情況,予以立即進行調整,而在這動態的調整過程中,RHO-SQUARE 則
可 以 在 這 三 個 階 段 扮 演 非 常 重 要 的 角 色 與 工 具 , 也 唯 有 利 用 及 時 反 應 RHO-SQUARE,可以使整個研究過程進行的更有效率,更重要的是,研究者可 以立即利用這些精確的資訊,作更正確的決定。
(2)、 組織行為與心理相關研究之個案
Dulebohn 和 Ferris (1999)在 Academy of Management Journal 上發表論文, 主要探討在績效評量過程中,員工所使用的策略對評量是否公平的影響。在論文 中,作者衡量之主效應為非正式的發言對衡量公平性認知的影響。作者們使用抽 樣有效樣本為食品服務部門 128 名員工,表 5 為此個案的迴歸結果。 表 5 Dulebohn 和 Ferris (1999) 之迴歸結果 結果變數 預測變數 Adjusted 2 R a S 過程公平性衡量 受管理者影響之策略 0.68 -0.2 受工作影響之策略 -0.5 績效評分 0.07 決策控制 0.13* 與管理者關係之品質 0.21** 發言機會 0.57*** *p < 0.05 **p < 0.01 ***p < 0.001 全部的研究模型採用 6 個預測變數,由表 5 中顯示,在顯著水準 0.01 下, 與管理者關係之品質與發言機會對過程公平性衡量存在正向的顯著效應,此模型 所得的 Adjusted R2為 0.68 ,由於 adjusted R2對 R2為一對一的對應關係,故本研 究未加以還原,以原作者所提供之數據,以 adjusted R2來代表 R2。以下則依據
Baroudi 和 Orlikowski (1989) 的建議分成三個階段,模擬與示範 RHO-SQUARE 的使用方法。 (a)、事前規劃 在事前規劃方面,研究者設定欲達到之檢定力程度,且符合欲達成的條件數 值條件下,決定樣本數的多寡。此一決定與規劃的過程需要重複很多次,每一次 皆依據研究者的目的與需求下,調整不同的條件數值組合。若假設 2 0 =0.55, 2 1 =0.68、右尾檢定的條件下,當預測變數個數為 6,顯著水準為 0.01,欲達到 檢定力為 0.8 時,需要最少樣本數為 220。另外,也針對欲達到不同檢定力的水 準,樣本數的決定也不同,以下則針對欲達到不同檢定力,模擬不同情況,陰影 部份為輸入之參數,非陰影的部份為結果,如表 6 顯示如下。 表 6 事前規劃模擬情況表 I ( 2 0 =0.55,12=0.68)
預測變數個數 顯著水準 檢定力 最少樣本數 之決定 6 0.01 0.8 220 6 0.01 0.85 247 6 0.01 0.9 284 從表 6 的模擬結果顯示,針對欲達成的檢定力不同,RHO-SQUARE 可以計 算符合不同條件的樣本數,在研究規劃期間若能精確的決定樣本數,則對於研究 預算的擬定、樣本的配置、與人力物力的調配,皆有很大的幫助。 值得說明的是,事前規劃階段,研究者必須針對之前從事相關研究的經驗, 決定母體判定係數( 2 0 與 2 1 )可能的數值,或是,有些學者也可以先假設相關研 究的效應量,以下的模擬情況則針對不同的效應量,欲達成檢定力為 0.8 的結果, 計算最少樣本數的結果。 表 7 事前規劃模擬情況表 II 檢定力= 0.8 效應量 預測變數個數 顯著水準 最少樣本數 之決定 大效應量 6 0.01 66 中效應量 6 0.01 138 小效應量 6 0.01 956 由表 7 可以得知在不同效應量的條件下,達到相同的檢定力下,需要最少樣 本數的結果,若要從事小效應量的研究,則需要準備至少 956 個樣本數,如此可 讓研究者能夠因應樣本數的多寡,準備相當的人力、物力、與時間。 (b)、事後衡量 此階段針對自己或他人已經完成的論文,在分析方法、樣本數、以及顯著水 準等等條件數值皆已知的情況下,利用檢定力分析,進行事後的衡量。主要的目 的為累積相關研究的效應量或是母體判定係數的經驗值,以做為下次從事相類似 研究參考用。以下則針對個案研究的結果與其它不同母體判定係數的組合進行模 擬,以計算符合條件的檢定力。 表 8 事後衡量模擬情況表 2 0 12 預測變數 個數 顯著水準 樣本數 檢定力 0.55 0.68 6 0.05 128 0.7728 0.6 0.68 6 0.05 128 0.4566 0.5 0.68 6 0.05 128 0.9392 表 8 為根據個案的資料,例如:預測變數個數為 6,顯著水準為 0.05,以及 樣本數為 128 時,搭配不同組合的母體判定係數,得到不同的檢定力,從上表的
結果顯示,當中效應量時( 2 0 =0.55,12=0.68),檢定力為 0.7728,略顯不足; 若效應量較大時( 2 0 =0.5,12=0.68),檢定力為 0.9392,為一個較佳的情況,這 些不同的搭配皆為下次研究規劃與進行時,提供重要的參考資訊。 (c)、研究進行中之決策 針對一些大型研究或分階段研究,在研究進行中,無法事先決定需要多少樣 本,依據現實動態發生的結果,當下執行檢定力分析,並依據統計的結果與外在 的情況予以調整。模擬情況如表 8 所示。 表 9 研究進行中決策模擬情況表 樣本數 = 100 2 0 12 預測變數個數 顯著水準 檢定力 決策 0.55 0.68 6 0.05 0.67 檢定力不足 繼續進行研究 樣本數 = 150 0.55 0.68 6 0.05 0.83 檢定力已達標準, 研究結果完成 在研究進行中會隨著現實情況的變化,決定研究下一步的行動,由表 9 的結 果顯示,當樣本數為 100 時,所得到檢定力不足,所以,所要採取的策略為增加 樣本數;當樣本數增加為 150 時,隨即進行檢定力分析,檢定力為 0.83,若符合 研究者的期望,則可以將研究停止進行,可以適時的縮短研究時程,動態決定研 究的進行。此階段仍需要研究者依據之前的經驗假設適當的母體判定係數。 此個案利用 RHO-SQUARE,針對以上三個階段,進行不同情況的模擬,這 三個階段是每個研究者進行研究時,必須經過的三個過程,而由上述的介紹, RHO-SQUARE 能夠即時反應,重覆計算各個不同的情況的組合,以期望在不同 的條件組合與合理的預算、人力規劃管理下,得到一個較佳的研究結果, RHO-SQUARE 能夠具有事前規劃、事後檢測、並且在過程中即時監控補救的最 佳工具。 (六)、結論 複相關係數已普遍應用於社會科學、策略管理、與心理等等各個不同的領 域,能夠熟悉複相關係數的相關的統計分析與研究技巧,對研究者而言是一項非 常重要的研究議題。關於推論過程的知識,在假設檢定的重視及可靠效應的確 認,對於研究者而言更是關鍵的研究工作項目。更進一步,為了達到欲求的檢定 力以決定樣本數,更是在研究上經常需要解決的主要問題。更重要的是,本研究 提供了一個平台,讓研究學者與學生們,能夠利用先進的電腦,透過此軟體平台,
迅速處理複相關分析的相關運算,而節省大量的研究時間與精力。另外,本軟體 更針對複相關係數,介紹一個全面性的分析工具,包括:假設檢定、檢定力、與 樣本數等等完整性的統計分析工具。期望此關於複相關係數的統計分析軟體能夠 廣泛應用於學術研究上、教學展示上、或是在心理實務應用上。 關於研究者關注的檢定力與樣本數的兩個重要議題,本研究除了針對這兩個 議題所影響的相關影響因素之外,更藉由大量的運算資料,將資料彙整,繪成關 係趨勢圖,藉此能清楚且確切的瞭解各影響要素的關係。在其他條件皆維持不變 下,在檢定力方面,顯著水準、樣本數、與效應量皆與檢定力成正向關係。這些 結果與 Murphy 和 Myors (2004)、Baroudi 和 Orlikowski (1989) 等研究結果相 符;除此之外,當母體判定係數相同時,預測變數個數則與檢定力成反向關係, 預測變數個數越多時,除非有較多的樣本數支援,不然檢定力較低。針對樣本數 方面,檢定力及預測變數個數與樣本數成正向關係,但是,樣本數與母體複相關 係數及效應量成反向關係,即可說明,當母體複相關係數較小或小效應量時,所 需要的樣本數較多。 根據上述的結果,有些結論與之前的學者所提出的結果一致,有些結果是之 前學者鮮少提及的現象,例如:樣本數決定的問題,關於研究過程中需要多少的 樣本數,此議題一直是許多學者們持續探討的焦點,Maxwell (2000)、Harris (1985)、 Wampold 和 Freund (1987)、Green (1991)、以及 Nunnally (1978) 所提 出的樣本決定的相關經驗法則,在此跟本研究所得的精確樣本數,兩者比較皆有 很大的差距,也破除關於許多決定樣本數所建立的經驗法則。 本研究根據多變量常態迴歸模式的原理,發展有關複相關係數的運算軟體, 主要針對複相關係數之判定係數模型的情況加以建構整個系統,但是,以一般階 層線性模式而言,複相關係數之部分判定係數模型的情況也為許多學者所注意與 應用,所以,本研究建議日後的學者可以遵循本架構,以複相關係數之部分判定 係數模型為主,也是一項未來的研究方向。 參考文獻
Algina, J., & Olejnik, S. (2003), “Sample size tables for correlation analysis with applications in partial correlation and multiple regression analysis,” Multivariate Behavioral Research, 38, pp. 308-323.
Anderson, T. W. (1984), An introduction to multivariate statistical analysis (2nd ed.), New York: Wiley.
Baroudi, J. J., & Orlikowski, W. J. (1989), “The problem of statistical power in MIS research,” MIS Quarterly, March, pp. 87-106.
Bobko, P. (2001), Correlation and regression: Applications for industrial organizational psychology and management (2nd ed.), Thousand Oaks, CA: Sage.
regression sample sizes. Annual meeting of the Mid-Western Educational Research Association, Chicago.
Cohen, J. (1988), Statistical power analysis for the behavioral sciences (2nd ed.), Hillsdale, NJ: Erlbaum.
Cohen, J. (1992), “A power primer,” Psychological Bulletin, 112, pp. 155-159.
Cumming, G., & Finch, S. (2001), “A primer on the understanding, use, and calculation of confidence intervals that are based on central and noncentral distributions,” Educational and Psychological Measurement, 61, pp. 532-574. Ding, C. G. (1996), “On the computation of the distribution of the square of the
sample multiple correlation coefficient,” Computational Statistics & Data Analysis, 22, pp. 345-350.
Dulebohn, J. H., & Ferris, G. R. (1999), “The role of influence tactics in perceptions of performance evaluations’ fairness,” Academy of Management Journal, 42, pp.288-303.
Dunlap, W. P., Xin, X., & Mayers, L. (2004), “Computing aspects of power for multiple regression,” Behavior Research Methods, Instruments, & Computers, 36, pp. 695-701.
Gatsonis, C., & Sampson, A. R. (1989), “Multiple correlation: Exact power and sample size calculations,” Psychological Bulletin, 106, pp. 516-524.
Green, S. B. (1991), “How many subjects does it take to do a regression analysis?” Multivariate Behavioral Research, 26, pp. 499-510.
Halinski, R. S., & Feldt, L. S. (1970). The selection of variables in multiple regression analysis. Journal of Education Measurement, 7, pp.151-157.
Harris, R. J. (1985), A primer of multivariate statistics (2nd ed.), New York: Academic Press.
Kerlinger, F. N., & Pedhazur, E. J. (1973). Multiple regression in behavioral research. New York: Holt, Rinehart, and Winston.
Lee, Y. (1972), “Tables of upper percentage point of the multiple correlation coefficient,” Biometrika, 59, pp. 175-189.
Maxwell, S. E. (2000), “Sample size and multiple regression analysis,” Psychological Methods, 5, pp. 434-458.
Mason, C. H., & Perreault, W. D. (1991), “Collinearity, Power, and interpretation of multiple regression analysis,” Journal of Marketing Research, 28, pp. 268-280. Mazen, A., Graf, L., Lellogg, C., & Hemmasi, M. (1987), “Statistical Power in
Contempary Management Research,” Academy of Management Journal, 30, pp. 369-380.
Mendoza, J. L., & Stafford, K. L. (2001), “Confidence interval, power calculation, and sample size estimation for the squared multiple correlation coefficient under the fixed and random regression models: A computer program and useful standard tables,” Educational and Psychological Measurement, 61, pp. 650-667.
Miller, D. E., & Kunce, J. T. (1973). Prediction and statistical overkill revisited.
Measurement and evaluation in guidance, 6, pp.157-163.
Murphy, K. R., & Myors, B. (2004), Statistical power analysis - a simple and general model for tradition and modern hypothesis test (2nd ed.), NJ: Erlbaum.
Nunnally, J. C. (1978), Psychomertic theory (2nd ed.), New York: McGraw-Hill.
Olejnik, S. F. (1984). Planning educational research: Determining the necessary sample size. Journal of Experimental Education, 53, pp. 40-48.
Pedhazur, E. J., & Schmelkin, L. P. (1990). Measurement, design, and analysis: an
integrated approach. Hillsdale. NJ: Lawrence Erlbaum Associates.
Pelled, L. H., & Xin, K. R. (1999), “Down and out: an investigation of the relationship between mood and employee withdrawal behavior,” Journal of Management, 6, pp. 875-895.
Sawyer, R. (1982). Sample size and accuracy of predictions made from multiple regression equations. Journal of Educational Statistics, 7, pp.91-104.
Sedlmeier, P., & Gigerenzer, G. (1989), “Do studies of statistical power have an effect on the power of studies?” Psychological Bulletin, 105, pp. 309-316.
Shieh, G. (2006), “Exact interval estimation, power calculation and sample size determination in normal correlation analysis,” Psychometrika, 71(3), pp. 529-540.
Shieh, G., & Kung, C. F. (2007), “Methodological and computational considerations for multiple correlation analysis behavior research methods,” Behavior Research Methods, 39(4), pp. 731-734.
Steiger, J. H.,& Fouladi, R. T. (1992), “R2: A computer program for interval estimation, power calculations, sample size estimation, and hypothesis testing in multiple regression,” Behavioral Research Methods, Instruments, and Computers, 24, pp. 581-582.
Stevens, J. (1986). Applied multivariate statistics for the social sciences. Hillsdale, NJ: Lawrence Erlbaum Associates.
Tabachnick, B. G., & Fidell, L. S. (1989). Using multivariate statistics (2nd ed.). New York: HarperCollins.
Thorndike, R. M. (1978). Correlational procedures for research. New York: Garner.
Wampold, B. E., & Freund, R. D. (1987), “Use of multiple regression in counseling psychology research: A flexible data-analytic strategy,” Journal of Counseling Psychology, 34, pp. 372-382.
98 年度專題研究計畫研究成果彙整表
計畫主持人:龔千芬 計畫編號: 98-2410-H-151-009-計畫名稱:複相關分析之樣本數運算與應用 量化 成果項目 實際已達成 數(被接受 或已發表) 預期總達成 數(含實際已 達成數) 本計畫實 際貢獻百 分比 單位 備 註 ( 質 化 說 明:如 數 個 計 畫 共 同 成 果、成 果 列 為 該 期 刊 之 封 面 故 事 ... 等) 期刊論文 1 0 100% 研究報告/技術報告 0 0 100% 研討會論文 0 0 100% 篇 論文著作 專書 0 0 100% 申請中件數 0 0 100% 專利 已獲得件數 0 0 100% 件 件數 0 0 100% 件 技術移轉 權利金 0 0 100% 千元 碩士生 2 0 100% 博士生 0 0 100% 博士後研究員 0 0 100% 國內 參與計畫人力 (本國籍) 專任助理 0 0 100% 人次 期刊論文 0 0 100% 研究報告/技術報告 0 0 100% 研討會論文 0 0 100% 篇 論文著作 專書 0 0 100% 章/本 申請中件數 0 0 100% 專利 已獲得件數 0 0 100% 件 件數 0 0 100% 件 技術移轉 權利金 0 0 100% 千元 碩士生 0 0 100% 博士生 0 0 100% 博士後研究員 0 0 100% 國外 參與計畫人力 (外國籍) 專任助理 0 0 100% 人次其他成果