複相關分析之運算與應用

(1)

複相關分析之運算與應用

龔千芬

1

謝國文

2

摘要

迴歸分析已廣泛運用於管理、心理、組織及策略等各領域研究中；然而，其中複相關係數分佈的結構十分複雜，許多研究者對直接相關的統計推論，如檢定力計算與所需求之樣本數等議題不熟悉，故衍生許多經驗法則，但許多文獻證明由經驗法則所得之數據並不精確。Shieh 與 Kung(2007) 在 Behavior

Research Methods中發展一精確可靠且完整之複相關係數相關功能的軟體。故 本研究除了介紹該統計分析軟體之外，也針對研究者經常遇到的統計分析：假設檢定、檢定力計算，以及樣本數等三大議題，利用該軟體之Excel介面的親和性與普及性，提供一全面性且實務性的介紹，以做為研究規劃與分析之用。另外，本研究針對研究者經常遇到的問題，利用該軟體運算出大量的資料，彙整圖表，期望研究者能藉由此圖表對於複相關分析有進一步深入的體認。最後，並配合個案詳細的說明如何運用此軟體於規劃研究決策或教學展示上。關鍵字：檢定力分析、假設檢定、樣本數、Excel、複相關分析 1_{國立高雄應用科技大學資訊管理系助理教授} 2_{國立交通大學管理科學系教授} 致謝：作者誠摯感謝主審及單位匿名審查委員之寶貴意見，顯著改進本文內容。投稿日期：2008.10.15；審查決議日期：2009.01.15；接受日期：2009.08.05 本文係由林鉦棽擔任主審

(2)

The Computation and Application of

Multiple Correlation Analysis

Chien-Feng Kung

1

_{Gwowen Shieh}

2

Abstract

Regression analysis is widely used in many areas of science, and the literature is very extensive. Classical inferences on correlation coefficients are conducted mainly under the assumption that all variables have a joint multivariate normal distribution. Although the underlying normality assumption provides a convenient and useful setup, the resulting probability density function of the multiple correlation coefficients is notoriously complicated in form. Consequently, considerable attention has been devoted to the construction of useful approximations and rules of thumb for the inferential procedures of squared multiple correlation coefficient. In general, the rules of thumb fail to incorporate effect size and have often provided inaccurate results. In view of the ultimate aim of presenting exact procedures for correlation analysis and the extensive accessibility of Microsoft Excel software, the associated computer routines for hypothesis testing, power calculation, and sample size determination are developed. The statistical methods and available programs of multiple correlation analysis described in this article purport to enhance pedagogical presentation in academic curriculum and practical application in research. Summary tables, figures and related discussions are provided to demonstrate the impact of each of the factors and how they work as whole in multiple correlation analysis. Moreover, a numerical illustration with real data is described to exemplify the usage of the versatile package for management research.

Keywords: power analysis, hypothesis testing, sample size, Excel, multiple correlation analysis

1_{Assistant Professor, Department of Information Management, National Kaoshiung}

University of Applied Science

(3)

壹、研究動機與目的

在多元常態複迴歸模式分析時，複相關係數已經普遍地應用於各個不同的領域，Bobko(2001) 在有關相關係數與迴歸的書中，列舉相關係數在策略管理、組織行為和個人心理這些研究領域上的應用。在策略管理方面， Miller(1988)根據 Porter 所提出的企業策略（包括創新差異、成本領導及集中化）對企業績效的關係。在組織行為研究方面，Deci、Connell與Ryan(1989)主要探討管理者與人相處之傾向，其中研究主題包括管理者支援下屬自我決定、控制下屬行為、下屬的知覺、情感與員工滿意度的相關性。研究結果說明，管理者對下屬的態度會影響下屬之工作情緒，並且會影響員工的工作滿意度。 Pelled與Xin(1999)在Journal of Management發表員工情緒與退縮行為的關係， 以及探討工作滿意度會干擾情緒與行為之間的關係，而情緒與行為的相關性可以做為管理者管理員工情緒與行為之重要參考依據。從以上橫跨策略、管理及組織行為與心理的眾多研究中，大多數的研究皆致力於說明各變項之關係，瞭解各項相關性之強弱，關係是否存在、是否顯著，可否藉由這些變項做相關性的解釋，再由這些關係推演為有管理意涵之結論。這些管理研究中所關注的變項關係的強度，皆與相關係數有密不可分的關係。然而，Bobko(2001)強調，在研究上，針對兩個以上預測變數的情況下，複相關係數較相關係數而言，是一個更佳的判斷指標，所以，大部分研究者皆使用複相關係數做為研究上的指標。根據複相關係數的強弱能有效解釋預測變數與反應變數相關性強度，因此在管理學術界，複相關係數普遍應用的情況下，如何使用複相關係數是研究者必須具備的研究知識。然而，在大多數學者對複相關係數皆不熟悉的情況下，如何讓研究者更有效率及以正確的方式瞭解並運用複相關係數，是當今研究者與學術界必須進行的重要課題。雖然研究者普遍應用複相關係數，但仍對此並不熟悉，主要的原因為複相關係數分佈運算與其結構相當的複雜，使許多研究者望之卻步。為解決運算複雜的難題，有些學者提出簡化的演算法，例如：Ding(1996) 、 Mendoza 與 Stafford(2001)，以及 Steiger與 Fouladi(1992)。雖然以上的學者提出演算法以解

(4)

決運算結構複雜的問題，但是這些想法與運算結構對於一般的研究者仍然有極高的障礙存在。除此之外，複相關係數所衍生的應用，例如：假設檢定、檢定力分析與樣本數決定，皆因為複相關係數結構與運算的困難度高，導致在使用上窒礙難行，故許多學者也因應此一困境提出瞭解決的方式，例如：Cohen (1988)以及 Gatsonis與 Sampson(1989)針對檢定力與樣本數提供一些特定參數的數值表，讓一般學者較為便利獲取資訊。另外，在樣本數決定上，Harris (1985)、 Wampold與 Freund(1987)等學者提出決定樣本數經驗法則，以簡化運算的過程。雖然以上的學者致力於發展較為精簡的演算法、特定參數數值表與樣本數決定經驗法則，但仍有許多學者對於這些方法提出質疑，例如：Cohen (1988)發展不同參數的參照表，目前雖為大多數學者所引用，但是資料的取得性不便，而且參數的組合有所限制。Green(1991)強調，樣本數之決定並非仰賴一些學者所提出之經驗法則，研究結果亦顯示不支援經驗法則所得的樣本數。由於受限於複相關係數之複雜，故本研究藉由先進的資訊科技，發展複相關係數的應用軟體，以解決複雜運算之困境。隨著科技的進步，電腦運算能力增強，使得許多複雜運算得以解決。近幾年來，由於電腦硬體功能的提升與電腦軟體的輔助，使得研究者可以有更多先進工具幫助研究進行得更順利與嚴謹，例如：Algina 與 Olejnik(2003) 、 Dunlap、 Xin與 Myers(2004)、 Mendoza與 Stafford(2001)，以及 Shieh(2006)皆結合Fortran、 Mathematica、 SAS與 SPSS等系統軟體，提供學術研究者有效率的工具。但以上所列的統計或數學運算專業軟體，對於一般學者而言，仍存在一定程度的進入障礙，所以，本研究欲利用親和性高並且容易使用的Excel軟體，將複雜運算的複相關係數分佈即時呈現，並可執行假設檢定、檢定力分析與樣本數分析的各種數據組合。除了軟體開發之外，如何應用軟體，並讓使用者對複相關分析有正確的認識，是本研究另一項重要的主題。本研究也強調使用本研究所開發的軟體於管理相關研究上，Baroudi 與 Orlikowski(1989)在 MIS Quarterly中，建議使用統計分析以規劃與監控整個研 究過程，主要可以分為事前規劃、事後衡量與研究進行中的決策，期望從事研究的過程是在有完整規劃、嚴密監控與累積經驗中反覆進行，此三個階段皆需要從事大量的統計分析，利用本研究所提供的軟體可應用於這三個階段，即時

(5)

回應各種研究者所需要的參數組合，並藉由個案的方式，實際模擬如何應用軟體於這三個研究階段，期望介紹此軟體能讓統計意涵能真正落實於實際研究應用上，提供一個有效規劃與檢測軟體的研究工具，嘉惠後續研究學者。本研究根據統計理論發展電腦軟體，期望對後續進行研究者提供研究的便利性。因此，本研究之目的包括下列幾點：一、介紹複相關係數之假設檢定、檢定力分析，以及樣本數等基本概念，包括目前相關研究的發展與影響要素所具備之特質。二、配合複相關係數分佈的理論根據，針對顯著性假設檢定的推論、檢定力的計算，簡述演化過程。三、介紹一套電腦輔助軟體及其功能介紹。四、針對樣本數、效應量、預測變數個數與檢定力之間的各項組合，彙整實際執行的數據，藉著圖與表提出說明在研究上會遇到的一些情況，讓研究者有更深刻的體會。五、提供實際研究個案，說明如何應用軟體於研究中。本研究的論文結構包含下列章節，除了第一部分的研究動機與目的之外，其餘分別為第二部分的文獻探討，主要針對複相關係數之假設檢定、檢定力分析，以及樣本數相關文獻的探討與整理，並分析影響因素的特質與相關性；第三部分為研究方法，主要針對複相關係數分佈的統計理論，簡述推演過程、運算函數為何、檢定力的計算方法，另外也介紹系統軟體之相關發展與功能；第四部分為關鍵要素分析，主要針對樣本數、效應量、預測變數個數與檢定力之間各項組合，彙整執行後所得到的結果，針對圖與表格所顯示的現象，進行解釋；第五部分以個案論文為例，說明如何應用軟體於研究規劃、研究事後衡量與研究進行中，並且針對所得到的數據加以解釋；第六部分則提出結論。

貳、文獻探討

文獻探討主要針對複相關係數之相關文獻進行討論，包括兩個主題：一為假設檢定；二為系統軟體相關文獻。其中，假設檢定包括檢定力、樣本數、非無效應之假設檢定。

(6)

一、假設檢定

在一般社會科學或管理相關的研究中，假設檢定是研究中不可缺少的重要分析過程。在檢定過程中，需要決定α與 β的數值。 α為型 I誤差，意指若虛無 假設H0為真，卻因統計檢定結果予以拒絕的機率，α愈小代表拒絕虛無假設的標準愈嚴格。β為型 II誤差，意指若虛無假設 H0為假，卻因統計檢定結果而予以接受的機率。在一般行為科學與資訊管理的領域相關的研究專注於型I誤差是否適合，利用設立較小的型I誤差（α=.05或 α=.01）監控統計結果，所以，許多研究者因而忽略型II誤差。然而，Mazen、Graf、Lellogg與Hemmasi(1987) 利用個案與相關圖表說明型II誤差比型 I誤差所引發的風險更大，故除了型 I誤差的重視外，更應該讓型I與型II誤差得到對等的重視。但是，基於型II誤差與檢定力(power)息息相關，因此以下將針對檢定力進行相關的介紹。（一）檢定力檢定力代表對立假設為真時，而檢定結果也正確地予以接受的機率。所以，檢定力也可以說是(1－β)。Cohen(1988)強調，在用於研究資料的統計檢定 上，檢定力代表一個非常重要的資訊。Baroudi與 Orlikowski(1989)強調，在虛無假設為不成立時，統計檢定力成為解釋結果正確程度的關鍵指標。影響統計檢定力的三個主要因素：1.顯著水準 (significance level)、 2.樣本數(sample size)，以及 3.效應量 (effect size)。以下將針對此三個主要因素與檢定力的關係做說明： 1.顯著水準 (α)代表虛無假設之「拒絕臨界區域」，故顯著水準愈小，則虛無假設的拒絕區域愈小，拒絕標準愈嚴格；顯著水準愈大則增加檢定力。 2.樣本數：在各項條件皆不變的情況下，樣本數愈大則精確度愈高，會增加拒絕「假」虛無假設的機會，如此，檢定力會增加。Sedlmeier與 Gigerenzer (1989)說明，在檢測H0與H1時，當樣本數增加時，抽樣分佈標準差減少，可增加檢定力。 3.效應量代表變數間關係的重要性與強度的多寡、在母體呈現變數間關係

(7)

的程度或H0與H1的真實差異。效應量的統計方式首先由Cohen(1988)提出，效應量可廣泛地用於有效應的程度，大部分是以標準化的方式呈現效應程度。若在其餘的條件皆控制的情況下，效應量愈大則能夠證明此現象的程度愈高，能夠偵測與拒絕虛無假設的機率愈高，則檢定力也愈高。對研究者而言，效應量也許是最難預測的參數。Mazen等人 (1987)建議，由之前相關研究可解釋變異之比例建立效應量之索引。Cohen(1988)為了方便預測效應量，以順利計算檢定力，故發展可操作的定義，以應用迴歸分析方法而言，效應量分為小、中、大三種不同之效應量，依序為.02、.15、.35，轉換為母體判定係數從小到大依序為.0196、 .13及 .26。 Cohen(1992)進一步定義中效應量(medium effect size) ，指的是觀察者用肉眼可以察覺變化的程度。 Sedlmeier與 Gigerenzer(1989)發現，效應量接近於樣本中位數，並由過去相關文獻支援定義效應量。另外，Cohen(1988)說明小效應量(small effect size)大部分出現於性格和社會心理方面的研究，因為這類研究的衡量大多有較低的信度，而大效應量(large effect size)出現於實驗心理類的研究，這類研究大多有實驗組與控制組，並且重視衡量過程與工具的嚴謹性。綜合以上三個影響因素的現象，當增加這三個影響因素的數值，同時也增加檢定力。這三個影響因素對檢定力的關係整理如表1所示。表 1 檢定力與顯著水準、樣本數、效應量之關係顯著水準樣本數效應量檢定力正向關係正向關係正向關係 Baroudi 與 Orlikowski(1989) 提出提升檢定力的方法，包括： 1. 增加樣本數；2.改變抽樣方式，建議採用隨機抽樣，若無法達成隨機抽樣，也建議採用目的取樣或盡量增加樣本同質性，而使標準誤差減小；3.變數的選擇，建議選擇相關性小的變數，可以避免共線性的問題；4.減少誤差，盡量減少衡量誤差等方法。另外，Murphy與 Myors(2004)也提出兩種方法以增加檢定力，第一種最簡單的方法為改變顯著水準，當顯著水準較為寬鬆時，檢定力則增加，但此種作法對於研究本身與研究的解釋能力並不代表任何意義；第二種方法即增加

(8)

樣本數，主要增加同質性或一般性，降低抽樣誤差的可能性，並且減少對結果產生錯誤的解釋。（二）樣本數對研究者而言，在研究過程中需要運用多少樣本數而能夠反映出母體的真正現象，是許多研究者一直想要克服的難題。雖然使用較多的樣本較可以反映出真正現實面的狀況，但是受限於時間與預算，研究者皆希望能夠以最少的資源發揮出最大的效果，所以，在研究進行中，樣本數的決定一直是研究者最關注的議題。Maxwell(2000) 說明，在迴歸分析的情況下，樣本數決定的方法為：在迴歸分析下，在滿足檢定力的條件下，樣本數的決定可以依據 noncentral F 分配，主要有三個影響參數：分子自由度、分母自由度，以及 noncentrality參數。另外，分子與分母的自由度又決定於預測變數的數目 (p)、樣本數(N)和效應量的類型。由於計算樣本數的運算式複雜，故許多學者便提出一些「經驗法則」以簡馭繁，例如：Harris(1985) 以及 Wampold 與 Freund (1987)皆指出，一般的規則 N與 p的比例應為 10： 1。 Green(1991)指出，若效應量為.075時，則一般較合理的法則，最小的樣本數應為： N 104 p= + (1) Nunnally(1978)建議，在迴歸分析中，至少需要300～ 400份樣本數才足夠應付一般變數數量的研究。以上各個學者皆持不同的論點，雖然這些經驗法則提供學者一個較為簡單判斷樣本數的方法，但是這些方法仍遭遇一些學者的質疑與批評。Green(1991)強調，一般經驗法則所得到的樣本數較大，並且所得的研究結果不支持經驗法則所得的樣本數。Cohen(1988)出版有關檢定力分析的書中，彙整了各種不同分析方法的檢定力與所需的樣本數，主要可以藉此與一般之經驗法則相互比較，進而判斷其適切性。本研究發展一套軟體，藉由這套軟體可以即時計算出檢定力與樣本數，為研究者提供一個既快速及彈性、破除一般似是而非的經驗法則、較精確決定樣本數的方式，並可以增加研究者進行研究的效率與可信度。

(9)

（三）非無效應假設檢定針對樣本複判定係數相關研究中，以Steiger與 Fouladi(1992)的論文提供較全面性的探討，在此論文中，作者不僅提供樣本判定係數之機率函數分佈圖與累積機率函數分佈圖，也提供計算檢定力分析與樣本數等功能，但是，以上這些功能皆基於H0：ρ = 0下所發展的功能，而H2 0：ρ = ρ (2 20 2 0 0 ρ > )並不包括於相關的電腦軟體功能中。然而，Wilcox(1980)及 Fowler(1985)皆表示，當_{ρ 為非}2 零或是某一常數的情況下，可以代表某些特別的意義。另外，在假設檢定中，尤其在H0：ρ ≦2 ρ 及H20 0： 2 ρ ≧ 2 0 ρ 情況下，檢定力分析對於確認重要研究結果提供了重要的判斷基礎。故本研究可在H0： ρ ≦2 ρ 、 H20 0： 2 ρ ≧ 2 0 ρ 及 H0： 2 ρ = 2 0 ρ ( 2 0 ρ ≠0)的情況下，提供全面性假設檢定、檢定力計算，並且提供精確樣本數，成為研究者在研究規劃階段重要的依據。表2為本研究整理相關文獻之彙總表。表 2 複相關係數相關文獻彙總表檢定力樣本數假設檢定 Shieh (2006) Dunlap等人 (2004) Maxwell (2004) Maxwell (2000) Algina與Olejnik (2003) Cumming與Finch (2001) Mendoza與Stafford (2001) Borkowski、Welsh與Zhang (2001) Rothstein、Borenstein、Cohen與Pollack (1990) Baroudi與Orlikowski (1989) Gatsonis與Sampson (1989) Mason與Perreault (1991) Shieh (2006) Kelley與Maxwell (2003) Algina與Olejnik (2003) Mendoza與Stafford (2001) Maxwell (2004) Maxwell (2000) Green (1991) Gatsonis與Sampson (1989)

二、系統軟體相關文獻

隨著科技的日益進步，電腦硬體也有迅速的進展，電腦處理速度加快、可

(10)

儲存的容量加大、體積也大幅度的縮小，許多之前研究無法處理的複雜運算，現在由於電腦運算能力大幅提升，使之前的不可能變成可能，所以，近幾年來，利用電腦軟體來解決一些研究上所面臨的統計問題，相關研究也愈來愈多，逐漸形成一股潮流。針對R2_{相關議題而發展的電腦軟體有Algina與Olejnik} (2003) 、 Dunlap 等人 (2004) 、 Mendoza 與 Stafford(2001) 以及 Shieh(2006) 等學者皆結合Fortran、 Mathematica、 SAS和 SPSS等系統軟體，以提供學術研究者更有效率的工具；Dunlap等人 (2004)更利用 Fortran發展電腦軟體計算檢定力。在這些研究中，作者們專注於探討檢定力的運算，並利用程式所產生的結果說明，作者所提供的程式比之前的相關研究更為精確。Mendoza與Stafford(2001) 利用Mathematica所提供的函數，對樣本判定係數分佈計算區間估計、檢定力和樣本數。由上述兩個相關的研究中，一個使用Fortran 語言，另一個使用 Mathematica軟體，這兩種語言皆是針對科學與數理方面專業的軟體，若沒有使用該軟體的經驗，則很難在短時間內知道如何使用，對於另外領域的研究者則障礙更大，所以，在Mendoza與 Stafford(2001)此篇的研究中，在附錄中教導使用者如何使用Mathematica並說明如何運用相關的指令。在驅使使用者使用軟體的過程中，軟體界面的容易使用性和即時反應是促使使用者願意使用軟體的重要影響因素，而Excel是兼具種種優勢的試算軟體，所以，近來有許多研究者利用Excel來發展軟體，以達到教化與說服使用者的目的，例如： Alf與 Graf(2002)利用 Excel發展樣本判定係數 (R2_{)分佈並以最大概式法提出新的估計} 值的想法，作者們欲利用Excel的圖形，提供讀者一個較佳的說明。 Cumming 與Finch(2001)藉由 Excel之圖形，為教導讀者信賴區間的相關概念，提供了一個最佳的說明。由於檢定力、樣本數及區間估計是每個研究者及研究皆會遇到的例行性的問題，本研究欲利用Excel的親和性，為每位研究者介紹一套容易使用且可以經常使用的軟體。

參、研究方法

研究方法主要介紹本論文所依據的理論架構，進而推演出計算複相關係數的相關議題，故此一部分包括四個主題：一、介紹R2_{之機率函數的相關假設及}

(11)

主要理論依據；二、說明如何推演複相關係數之假設檢定；三、說明本系統軟體發展之相關議題，並說明驗證本軟體之過程；最後則簡述本軟體之功能。

一、

R

2

之機率函數(density function)

考慮複迴歸模式的情況下，第i個觀測樣本，反應變數為 Yi_，_{p為解釋變數} 的個數，預測變數為Xi1_{, X}i2_{,…, X}ip_{，此迴歸模式如下所示：} p i 0 j ij i j 1 Y X = = β +

∑

β + ε (2) 而Xi = (Xi1, …, Xip)T有一p維度多變量常態分佈Np(μ, Σ)，β ,0 β ,…,1 β 為未p 知的參數，ε ~ N(0,_i σ )，i = 1, …, N。2 ρ 為Y和X1, X2, …, Xp之間的母體複相關係數 (population multiple correlation coefficient) ，而 _{ρ 為母體判定係數}2

(population coefficient of determination or population squared multiple correlation coefficient)。_{ρ 之定義如下所示：}2 2 T 2 T 1 1/ ( 1 1) ρ = β Σβ σ + β Σβ (3) 以及 β1 = (β1, …, βp)T 在樣本數N > p的情況下，Y和X1, X2, …, Xp之間的樣本判定係數(sample coefficient of determination or sample squared multiple correlation coefficient)為 R2_。_R2_{的密度函數如下所示}_{(Anderson, 1984: 145)：} f(r2_{; p, N, ρ}2₎

(

)

(

)

(

)

[

]

(

)

( N 1)/2 2 2 i 2 2 p/2 i 1 2 ( N p 1)/2 i 0 N 1 / 2 i ( ) 1 (r ) (1 r ) N 1 / 2 i! p / 2 i N p 1 / 2 − _{+ −} _{− −} ∞ = Γ ⎡_⎣ − + ⎤ ρ_⎦ − ρ − = ∑ Γ ⎡_⎣ − ⎤ Γ_⎦ + Γ ⎡_⎣ − + ⎤_⎦ (4) 在公式(4)中，其中0≤r2_≤1，_{ρ 是母體判定係數， ( )}2 _{Γ α 為gamma函數。由公} 式(4)可知， R2_{密度函數是一個非常複雜的式子。而後來有許多學者以不同的} 方式呈現，例如：Gatsonis與 Sampson(1989)、 Ding(1996)、 Mendoza與 Stafford (2001) ，以及 Steiger 與 Fouladi(1992) 。然而， Mendoza 與 Stafford(2001) ，以及 Steiger與Fouladi(1992)皆以Lee(1972)所推演的公式為基準，算出精確的結果。

(12)

Lee(1972)的運算公式如下所示： 2 2 f (N,p, ,R )ρ

(

) ( ) (

)

1 ₁ ₁ ₁ n p 1 n 2 1 2 ₂ 2 ₂ 2 ₂ 2 2 1 1 1 1 1 B p, n2 1 R 1 R F n, n, p; R 2 2 2 2 2 − − − ⎧ ⎛ ⎞⎫ ⎛ ⎞ =_⎨ _⎜ _⎟_⎬ − ρ − _⎜ ρ _⎟ ⎝ ⎠ ⎝ ⎠ ⎩ ⎭ (5) 在公式(5)中， B(.)和 F(.)分別代表 Beta和超幾何分配 (hypergeometric)之函數，n = N − 1和n2 = n − p = N − p − 1，其中N代表樣本數，p為解釋變數的個數，依據定義B(.)和F(.)公式如下： a b (a) (b) Beta( , ) 2 2 (a b) Γ Γ = Γ + 和 k k 0 (a k) (b k) (c) x F(a,b;c; x) (a) (b) (c k) k! ∞ = Γ + Γ + Γ = ⋅ Γ Γ Γ +

∑

. 本研究之R2_{密度函數也依據}_{Lee(1972)的式子發展而成，而 R}2_{的密度函數} 也可以說明以樣本數(N)、解釋變數的個數 (p)、母體判定係數 (_{ρ )，以及樣本}2 判定係數(R2_{)以上四個參數所構成的函數。利用上述的公式(5)求得樣本複相關} 分配函數的數值之後，再利用Simpson’s rule進行積分，求得樣本判定係數累積函數分佈。

二、假設檢定

針對複迴歸模式的假設檢定，由於檢定H0：ρ = 和檢定 H2 0 0：β = β = 1 2 ... p 0 = β = 相同，所以可以使用 F檢定來進行整個模式 (full model)假設檢定的分析。以圖1表示本研究計算檢定力之示意圖，圖1有兩個分配，所以，以左方之分配為虛無假設的情況，右邊之分配為對立假設之情況，以檢定力之定義為當對立假設為真時，拒絕虛無假設的機會，即為圖中陰影的部分。本研究計算的方式為：若以顯著水準為α，則在虛無假設的情況下找出左邊的面積，最接近 1−α的切點，找出切點後，在對立假設下，算出由切點到最右邊端點的機率，所求出之機率即為檢定力。在檢定H :₀ ρ = ρ (≠ 0)時，雖然觀念一樣，但無法2 2₀ 以F檢定來進行。若α =P(R2> |C 2 2 0) ρ = ρ ，則 Power value =_P(R2_{> |}_C 2 2 1 ρ = ρ ) (6) 其中C 為在 2 2 0 ρ = ρ 下，R2_之_{100 (1}_{× − α}_)%_{百分數。}

(13)

由以上計算檢定力的算式顯示，可由圖1之示意圖表示，使檢定力計算更容易瞭解。圖 1 檢定力計算示意圖

三、介紹系統軟體與功能

本研究為了因應複雜的 R 分佈運算而介紹一軟體，命名為 RHO-2 SQUARE。此軟體以Microsoft Excel內建之VBA語言，發展RHO-SQUARE。此軟體選擇Excel來發展的主要原因為：（一） Excel為目前最普遍的試算軟體，最多人使用，而且進入障礙也最低，只要稍具電腦基礎的人士皆會操作 Excel；（二） Excel具有高度親和的介面，而且又具有高度彈性、即時反應等特點，接受度較高。雖然Excel 具有高度親和性介面、接受度高的優點，但是，Excel的函數庫中僅包括少部分一般實務面較常運用的函數，對於數學或統計研究較複雜的函數皆不支援，所以，此軟體除了少部分的函數（例如： Beta function 以及Inverse F distribution），Excel本身之函數庫有支援外，其他剩下的部分皆根據Lee(1972)的演算法，自行加以建構與發展新的函數，更加深程式撰寫與開發的困難度與複雜度。

在軟體的精確度上，雖然McCullough與Wilson(2005)提出Excel雖具有親和性與方便等優勢，但相較於一些專業之統計與數學軟體，例如：SAS 或

(14)

參考文獻

Alf, E. F., & Graf, R. G. (2002). A new maximum likelihood estimator for the population squared multiple correlation. Journal of Educational and Behavior

Statistics, 27, 223-235.

Algina, J., & Olejnik, S. (2003). Sample size tables for correlation analysis with applications in partial correlation and multiple regression analysis.

Multivariate Behavioral Research, 38, 308-323.

Anderson, T. W. (1984). An introduction to multivariate statistical analysis (2nd ed.). New York: Wiley.

Baroudi, J. J., & Orlikowski, W. J. (1989). The problem of statistical power in MIS research. MIS Quarterly, March, 87-106.

Bobko, P. (2001). Correlation and regression: Applications for industrial

organizational psychology and management (2nd ed.). Thousand Oaks, CA:

Sage.

Borkowski, S. C., Welsh, M. J., & Zhang, M. (2001). An analysis of statistical power in behavioral accounting research. Behavioral Research in Accounting, 13, 63-84.

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Erlbaum.

Cohen, J. (1992). A power primer. Psychological Bulletin, 112, 155-159.

Cumming, G., & Finch, S. (2001). A primer on the understanding, use, and calculation of confidence intervals that are based on central and noncentral distributions. Educational and Psychological Measurement, 61, 532-574. Deci, E. L., Connell, J. P., & Ryan, R. M. (1989). Self-determination in a work

organization. Journal of Applied Psychology, 74, 580-590.

Ding, C. G. (1996). On the computation of the distribution of the square of the sample multiple correlation coefficient. Computational Statistics & Data

(15)

Analysis, 22, 345-350.

Dulebohn, J. H., & Ferris, G. R. (1999). The role of influence tactics in perceptions of performance evaluations’ fairness. Academy of Management

Journal, 42, 288-303.

Dunlap, W. P., Xin, X., & Myers, L. (2004). Computing aspects of power for multiple regression. Behavior Research Methods, Instruments, & Computers, 36, 695-701.

Fowler, R. L. (1985). Testing for substantive significance in applied research by specifying nonzero effect null hypotheses. Journal of Applied Psychology, 70, 215-218.

Gatsonis, C., & Sampson, A. R. (1989). Multiple correlation: Exact power and sample size calculations. Psychological Bulletin, 106, 516-524.

Green, S. B. (1991). How many subjects does it take to do a regression analysis?

Multivariate Behavioral Research, 26, 499-510.

Harris, R. J. (1985). A primer of multivariate statistics (2nd ed.). New York: Academic Press.

Kelly, K., & Maxwell, S. E. (2003). Sample size for multiple regression: Obtaining regression coefficients that are accurate, not simply significant. Psychological

Methods, 8, 305-321.

Lee, Y. (1972). Tables of upper percentage point of the multiple correlation coefficient. Biometrika, 59, 175-189.

Maxwell, S. E. (2000). Sample size and multiple regression analysis.

Psychological Methods, 5, 434-458.

Maxwell, S. E. (2004). The persistence of underpowered studies in psychological research: Causes, consequences, and remedies. Psychological Methods, 9, 147-163.

Mason, C. H., & Perreault, W. D. (1991). Collinearity, power, and interpretation of multiple regression analysis. Journal of Marketing Research, 28, 268-280. Mazen, A., Graf, L., Lellogg, C., & Hemmasi, M. (1987). Statistical power in

(16)

contempary management research. Academy of Management Journal, 30, 369-380.

McCullough, B. D., & Wilson, B. (2005). On the accuracy of statistical procedures in Microsoft Excel 2003. Computational Statistics and Data Analysis, 49, 1244-1252.

Mendoza, J. L., & Stafford, K. L. (2001). Confidence interval, power calculation, and sample size estimation for the squared multiple correlation coefficient under the fixed and random regression models: A computer program and useful standard tables. Educational and Psychological Measurement, 61, 650-667.

Miller, D. (1988). Relating Porter’s business strategies to environment and structure: Analysis and performance implications. Academy of Management

Journal, 31, 280-308.

Murphy, K. R., & Myors, B. (2004). Statistical power analysis: A simple and

general model for tradition and modern hypothesis test (2nd ed.). Mahwah,

NJ: Erlbaum.

Nunnally, J. C. (1978). Psychomertic theory (2nd ed.). New York: McGraw-Hill. Pelled, L. H., & Xin, K. R. (1999). Down and out: An investigation of the

relationship between mood and employee withdrawal behavior. Journal of

Management, 6, 875-895.

Rothstein, H. R., Borenstein, M., Cohen, J., & Pollack, S. (1990). Statistical power analysis for multiple regression/correlation: A computer program.

Educational and Psychological Measurement, 50, 819-830.

Sedlmeier, P., & Gigerenzer, G. (1989). Do studies of statistical power have an effect on the power of studies? Psychological Bulletin, 105, 309-316.

Shieh, G. (2006). Exact interval estimation, power calculation and sample size determination in normal correlation analysis. Psychometrika, 71(3), 529-540. Shieh, G., & Kung, C. F. (2007). Methodological and computational considerations

(17)

Research Methods, 39(4), 731-734.

Steiger, J. H., & Fouladi, R. T. (1992). R2_{: A computer program for interval} estimation, power calculations, sample size estimation, and hypothesis testing in multiple regression. Behavioral Research Methods, Instruments, and

Computers, 24, 581-582.

Wampold, B. E., & Freund, R. D. (1987). Use of multiple regression in counseling psychology research: A flexible data-analytic strategy. Journal of Counseling

Psychology, 34, 372-382.

Wilcox, R. R. (1980). Some exact sample sizes for comparing the squared multiple correlation coefficient to a standard. Educational and Psychological

複相關分析之運算與應用