複相關分析之運算與應用
龔千芬
1謝國文
2摘 要
迴 歸 分 析 已 廣 泛 運 用 於 管 理 、 心 理 、 組 織 及 策 略 等 各 領 域 研 究 中 ; 然 而 , 其中複 相關 係數分 佈的 結構十 分複 雜,許 多研 究者對 直接 相關的 統計 推論, 如 檢定力 計算 與所需 求之 樣本數 等議 題不熟 悉, 故衍生 許多 經驗法 則, 但許多 文 獻 證 明 由 經 驗 法 則 所 得 之 數 據 並 不 精 確 。Shieh 與 Kung(2007) 在 BehaviorResearch Methods中 發 展 一 精 確 可 靠 且 完 整 之 複 相 關 係 數 相 關 功 能 的 軟 體 。 故 本研究 除了 介紹該 統計 分析軟 體之 外,也 針對 研究者 經常 遇到的 統計 分析: 假 設 檢 定 、 檢 定 力 計 算 , 以 及 樣 本 數 等 三 大 議 題 , 利 用 該 軟 體 之Excel介 面 的 親 和性與 普及 性,提 供一 全面性 且實 務性的 介紹 ,以做 為研 究規劃 與分 析之用 。 另 外 , 本 研 究 針 對 研 究 者 經 常 遇 到 的 問 題 , 利 用 該 軟 體 運 算 出 大 量 的 資料,彙 整圖表,期望研究者能藉由此圖表對於複相關分析有進一步深入的體認。最 後, 並配合 個案 詳細的 說明 如何運 用此 軟體於 規劃 研究決 策或 教學展 示上 。 關 鍵字 : 檢定力分 析、 假設檢 定、 樣本數 、Excel、複相關分析 1 國立高雄應用科技大學資訊管理系助理教授 2 國立交通大學管理科學系教授 致 謝 : 作者誠摯感謝主審及單位匿名審查委員之寶貴意見,顯著改進本文內容。 投 稿 日 期 :2008.10.15;審查決議日期:2009.01.15;接受日期:2009.08.05 本 文 係 由 林 鉦 棽 擔 任 主 審
The Computation and Application of
Multiple Correlation Analysis
Chien-Feng Kung
1Gwowen Shieh
2Abstract
Regression analysis is widely used in many areas of science, and the literature is very extensive. Classical inferences on correlation coefficients are conducted mainly under the assumption that all variables have a joint multivariate normal distribution. Although the underlying normality assumption provides a convenient and useful setup, the resulting probability density function of the multiple correlation coefficients is notoriously complicated in form. Consequently, considerable attention has been devoted to the construction of useful approximations and rules of thumb for the inferential procedures of squared multiple correlation coefficient. In general, the rules of thumb fail to incorporate effect size and have often provided inaccurate results. In view of the ultimate aim of presenting exact procedures for correlation analysis and the extensive accessibility of Microsoft Excel software, the associated computer routines for hypothesis testing, power calculation, and sample size determination are developed. The statistical methods and available programs of multiple correlation analysis described in this article purport to enhance pedagogical presentation in academic curriculum and practical application in research. Summary tables, figures and related discussions are provided to demonstrate the impact of each of the factors and how they work as whole in multiple correlation analysis. Moreover, a numerical illustration with real data is described to exemplify the usage of the versatile package for management research.
Keywords: power analysis, hypothesis testing, sample size, Excel, multiple correlation analysis
1 Assistant Professor, Department of Information Management, National Kaoshiung
University of Applied Science
壹、研究動機與目的
在 多 元 常 態 複 迴 歸 模 式 分 析 時 , 複 相 關 係 數 已 經 普 遍 地 應 用 於 各 個 不 同 的 領 域 ,Bobko(2001) 在 有 關 相 關 係 數 與 迴 歸 的 書 中 , 列 舉 相 關 係 數 在 策 略 管 理 、 組 織 行 為 和 個 人 心 理 這 些 研 究 領 域 上 的 應 用 。 在 策 略 管 理 方 面 , Miller(1988)根 據 Porter 所 提 出 的 企 業 策 略 ( 包 括 創 新 差 異 、 成 本 領 導 及 集 中 化 ) 對 企 業 績 效 的 關 係 。 在 組 織 行 為 研 究 方 面 ,Deci、Connell與Ryan(1989)主 要探討 管理 者與人 相處 之傾向 ,其 中研究 主題 包括管 理者 支援下 屬自 我決定 、 控制下 屬行 為、下 屬的 知覺、 情感 與員工 滿意 度的相 關性 。研究 結果 說明, 管 理 者 對 下 屬 的 態 度 會 影 響 下 屬 之 工 作 情 緒 , 並 且 會 影 響 員 工 的 工 作 滿 意 度 。 Pelled與Xin(1999)在Journal of Management發表員工情緒與退縮行為的關係, 以及探 討工 作滿意 度會 干擾情 緒與 行為之 間的 關係, 而情 緒與行 為的 相關性 可 以做為 管理 者管理 員工 情緒與 行為 之重要 參考 依據。 從以 上橫跨 策略 、管理 及 組織行 為與 心理的 眾多 研究中 ,大 多數的 研究 皆致力 於說 明各變 項之 關係, 瞭 解各項 相關 性之強 弱, 關係是 否存 在、是 否顯 著,可 否藉 由這些 變項 做相關 性 的解釋 ,再 由這些 關係 推演為 有管 理意涵 之結 論。這 些管 理研究 中所 關注的 變 項 關 係 的 強 度 , 皆 與 相 關 係 數 有 密 不 可 分 的 關 係 。 然 而 ,Bobko(2001)強 調 , 在研究 上, 針對兩 個以 上預測 變數 的情況 下, 複相關 係數 較相關 係數 而言, 是 一個更 佳的 判斷指 標, 所以, 大部 分研究 者皆 使用複 相關 係數做 為研 究上的 指 標。根 據複 相關係 數的 強弱能 有效 解釋預 測變 數與反 應變 數相關 性強 度,因 此 在管理 學術 界,複 相關 係數普 遍應 用的情 況下 ,如何 使用 複相關 係數 是研究 者 必須具 備的 研究知 識。 然而, 在大 多數學 者對 複相關 係數 皆不熟 悉的 情況下 , 如何讓 研究 者更有 效率 及以正 確的 方式瞭 解並 運用複 相關 係數, 是當 今研究 者 與學術 界必 須進行 的重 要課題 。 雖 然 研 究 者 普 遍 應 用 複 相 關 係 數 , 但 仍 對 此 並 不 熟 悉 , 主 要 的 原 因 為 複 相 關係數 分佈 運算與 其結 構相當 的複 雜,使 許多 研究者 望之 卻步。 為解 決運算 複 雜 的 難 題 , 有 些 學 者 提 出 簡 化 的 演 算 法 , 例 如 :Ding(1996) 、 Mendoza 與 Stafford(2001), 以 及 Steiger與 Fouladi(1992)。 雖 然 以 上 的 學 者 提 出 演 算 法 以 解決運算 結構 複雜的 問題 ,但是 這些 想法與 運算 結構對 於一 般的研 究者 仍然有 極 高的障 礙存 在。除 此之 外,複 相關 係數所 衍生 的應用 ,例 如:假 設檢 定、檢 定 力分析 與樣 本數決 定, 皆因為 複相 關係數 結構 與運算 的困 難度高 ,導 致在使 用 上 窒 礙 難 行 , 故 許 多 學 者 也 因 應 此 一 困 境 提 出 瞭 解 決 的 方 式 , 例 如 :Cohen (1988)以 及 Gatsonis與 Sampson(1989)針 對 檢 定 力 與 樣 本 數 提 供 一 些 特 定 參 數 的 數 值 表 , 讓 一 般 學 者 較 為 便 利 獲 取 資 訊 。 另 外 , 在 樣 本 數 決 定 上 ,Harris (1985)、 Wampold與 Freund(1987)等 學 者 提 出 決 定 樣 本 數 經 驗 法 則 , 以 簡 化 運 算的過 程。 雖然以 上的 學者致 力於 發展較 為精 簡的演 算法 、特定 參數 數值表 與 樣 本 數 決 定 經 驗 法 則 , 但 仍 有 許 多 學 者 對 於 這 些 方 法 提 出 質 疑 , 例 如 :Cohen (1988)發展不同參 數的 參照表 ,目 前雖為 大多 數學者 所引 用,但 是資 料的取 得 性 不 便 , 而 且 參 數 的 組 合 有 所 限 制 。Green(1991)強 調 , 樣 本 數 之 決 定 並 非 仰 賴 一 些 學 者 所 提 出 之 經 驗 法 則 , 研 究 結 果 亦 顯 示 不 支 援 經 驗 法 則 所 得 的 樣 本 數。由 於受 限於複 相關 係數之 複雜 ,故本 研究 藉由先 進的 資訊科 技, 發展複 相 關係數 的應 用軟體 ,以 解決複 雜運 算之困 境。 隨 著 科 技 的 進 步 , 電 腦 運 算 能 力 增 強 , 使 得 許 多 複 雜 運 算 得 以 解 決 。 近 幾 年來, 由於 電腦硬 體功 能的提 升與 電腦軟 體的 輔助, 使得 研究者 可以 有更多 先 進 工 具 幫 助 研 究 進 行 得 更 順 利 與 嚴 謹 , 例 如 :Algina 與 Olejnik(2003) 、 Dunlap、 Xin與 Myers(2004)、 Mendoza與 Stafford(2001), 以 及 Shieh(2006)皆 結 合Fortran、 Mathematica、 SAS與 SPSS等 系 統 軟 體 , 提 供 學 術 研 究 者 有 效 率 的 工具。 但以 上所列 的統 計或數 學運 算專業 軟體 ,對於 一般 學者而 言, 仍存在 一 定 程 度 的 進 入 障 礙 , 所 以 , 本 研 究 欲 利 用 親 和 性 高 並 且 容 易 使 用 的Excel軟 體,將 複雜 運算的 複相 關係數 分佈 即時呈 現, 並可執 行假 設檢定 、檢 定力分 析 與樣本 數分 析的各 種數 據組合 。除 了軟體 開發 之外, 如何 應用軟 體, 並讓使 用 者對複 相關 分析有 正確 的認識 ,是 本研究 另一 項重要 的主 題。 本 研 究 也 強 調 使 用 本 研 究 所 開 發 的 軟 體 於 管 理 相 關 研 究 上 ,Baroudi 與 Orlikowski(1989)在 MIS Quarterly中 , 建 議 使 用 統 計 分 析 以 規 劃 與 監 控 整 個 研 究過程 ,主 要可以 分為 事前規 劃、 事後衡 量與 研究進 行中 的決策 ,期 望從事 研 究的過 程是 在有完 整規 劃、嚴 密監 控與累 積經 驗中反 覆進 行,此 三個 階段皆 需 要從事 大量 的統計 分析 ,利用 本研 究所提 供的 軟體可 應用 於這三 個階 段,即 時
回應各 種研 究者所 需要 的參數 組合 ,並藉 由個 案的方 式, 實際模 擬如 何應用 軟 體於這 三個 研究階 段, 期望介 紹此 軟體能 讓統 計意涵 能真 正落實 於實 際研究 應 用上, 提供 一個有 效規 劃與檢 測軟 體的研 究工 具,嘉 惠後 續研究 學者 。 本 研 究 根 據 統 計 理 論 發 展 電 腦 軟 體 , 期 望 對 後 續 進 行 研 究 者 提 供 研 究 的 便 利性。 因此 ,本研 究之 目的包 括下 列幾點 : 一 、 介 紹 複 相 關 係 數 之 假 設 檢 定 、 檢 定 力 分 析 , 以 及 樣 本 數 等 基 本 概 念 , 包括目 前相 關研究 的發 展與影 響要 素所具 備之 特質。 二 、 配 合 複 相 關 係 數 分 佈 的 理 論 根 據 , 針 對 顯 著 性 假 設 檢 定 的 推 論 、 檢 定 力的計 算, 簡述演 化過 程。 三、介 紹一 套電腦 輔助 軟體及 其功 能介紹 。 四 、 針 對 樣 本 數 、 效 應 量 、 預 測 變 數 個 數 與 檢 定 力 之 間 的 各 項 組 合 , 彙 整 實際執 行的 數據, 藉著 圖與表 提出 說明在 研究 上會遇 到的 一些情 況, 讓研究 者 有更深 刻的 體會。 五、提 供實 際研究 個案 ,說明 如何 應用軟 體於 研究中 。 本 研 究 的 論 文 結 構 包 含 下 列 章 節 , 除 了 第 一 部 分 的 研 究 動 機 與 目 的 之 外 , 其餘分 別為 第二部 分的 文獻探 討, 主要針 對複 相關係 數之 假設檢 定、 檢定力 分 析,以 及樣 本數相 關文 獻的探 討與 整理, 並分 析影響 因素 的特質 與相 關性; 第 三部分 為研 究方法 ,主 要針對 複相 關係數 分佈 的統計 理論 ,簡述 推演 過程、 運 算函數 為何 、檢定 力的 計算方 法, 另外也 介紹 系統軟 體之 相關發 展與 功能; 第 四部分 為關 鍵要素 分析 ,主要 針對 樣本數 、效 應量、 預測 變數個 數與 檢定力 之 間各項 組合 ,彙整 執行 後所得 到的 結果, 針對 圖與表 格所 顯示的 現象 ,進行 解 釋;第 五部 分以個 案論 文為例 ,說 明如何 應用 軟體於 研究 規劃、 研究 事後衡 量 與研究 進行 中,並 且針 對所得 到的 數據加 以解 釋;第 六部 分則提 出結 論。
貳、文獻探討
文 獻 探 討 主 要 針 對 複 相 關 係 數 之 相 關 文 獻 進 行 討 論 , 包 括 兩 個 主 題 : 一 為 假設檢 定; 二為系 統軟 體相關 文獻 。其中 ,假 設檢定 包括 檢定力 、樣 本數、 非 無效應 之假 設檢定 。一、假設檢定
在 一 般 社 會 科 學 或 管 理 相 關 的 研 究 中 , 假 設 檢 定 是 研 究 中 不 可 缺 少 的 重 要 分 析 過 程 。 在 檢 定 過 程 中 , 需 要 決 定α與 β的 數 值 。 α為 型 I誤 差 , 意 指 若 虛 無 假 設H0為 真 , 卻 因 統 計 檢 定 結 果 予 以 拒 絕 的 機 率 ,α愈小代表拒絕虛無假設的 標 準 愈 嚴 格 。β為 型 II誤 差 , 意 指 若 虛 無 假 設 H0為 假 , 卻 因 統 計 檢 定 結 果 而 予 以 接 受 的 機 率 。 在 一 般 行 為 科 學 與 資 訊 管 理 的 領 域 相 關 的 研 究 專 注 於 型I誤 差 是 否 適 合 , 利 用 設 立 較 小 的 型I誤 差 (α=.05或 α=.01) 監 控 統 計 結 果 , 所 以 , 許 多 研 究 者 因 而 忽 略 型II誤差。然而,Mazen、Graf、Lellogg與Hemmasi(1987) 利 用 個 案 與 相 關 圖 表 說 明 型II誤 差 比 型 I誤 差 所 引 發 的 風 險 更 大 , 故 除 了 型 I誤 差 的 重 視 外 , 更 應 該 讓 型I與型II誤差得到對等的重視。但是,基於型II誤差與 檢定力(power)息息相關,因此以下將針對檢定力進行相關的介紹。 ( 一) 檢定力 檢 定 力 代 表 對 立 假 設 為 真 時 , 而 檢 定 結 果 也 正 確 地 予 以 接 受 的 機 率 。 所 以, 檢定 力 也可 以說 是(1-β)。Cohen(1988)強調,在用於研究資料的統計檢定 上 , 檢 定 力 代 表 一 個 非 常 重 要 的 資 訊 。Baroudi與 Orlikowski(1989)強 調 , 在 虛 無假設 為不 成立時 ,統 計檢定 力成 為解釋 結果 正確程 度的 關鍵指 標。 影 響 統 計 檢 定 力 的 三 個 主 要 因 素 :1.顯 著 水 準 (significance level)、 2.樣 本 數(sample size), 以 及 3.效 應 量 (effect size)。 以 下 將 針 對 此 三 個 主 要 因 素 與 檢 定力的 關係 做說明 : 1.顯 著 水 準 (α)代表虛無假設之「拒絕臨界區域」,故顯著水準愈小,則虛 無假設 的拒 絕區域 愈小 ,拒絕 標準 愈嚴格 ;顯 著水準 愈大 則增加 檢定 力。 2.樣本 數 : 在各 項 條 件 皆不 變 的 情 況下 , 樣 本 數愈 大 則 精 確度 愈 高 , 會增 加 拒 絕 「 假 」 虛 無 假 設 的 機 會 , 如 此 , 檢 定 力 會 增 加 。Sedlmeier與 Gigerenzer (1989)說明,在檢測H0與H1時 , 當 樣 本 數 增 加 時 , 抽 樣 分 佈 標 準 差 減 少 , 可 增 加檢定 力。 3.效應 量 代 表變 數 間 關 係的 重 要 性 與強 度 的 多 寡、 在 母 體 呈現 變 數 間 關係的 程 度 或H0與H1的 真 實 差 異 。 效 應 量 的 統 計 方 式 首 先 由Cohen(1988)提 出 , 效 應量可 廣泛 地用於 有效 應的程 度, 大部分 是以 標準化 的方 式呈現 效應 程度。 若 在其餘 的條 件皆控 制的 情況下 ,效 應量愈 大則 能夠證 明此 現象的 程度 愈高, 能 夠偵測 與拒 絕虛無 假設 的機率 愈高 ,則檢 定力 也愈高 。 對 研 究 者 而 言 , 效 應 量 也 許 是 最 難 預 測 的 參 數 。Mazen等 人 (1987)建 議 , 由 之 前 相 關 研 究 可 解 釋 變 異 之 比 例 建 立 效 應 量 之 索 引 。Cohen(1988)為 了 方 便 預測效 應量 ,以順 利計 算檢定 力, 故發展 可操 作的定 義, 以應用 迴歸 分析方 法 而 言 , 效 應 量 分 為 小 、 中 、 大 三 種 不 同 之 效 應 量 , 依 序 為.02、.15、.35,轉換 為 母 體 判 定 係 數 從 小 到 大 依 序 為.0196、 .13及 .26。 Cohen(1992)進 一 步 定 義 中 效 應 量(medium effect size) , 指 的 是 觀 察 者 用 肉 眼 可 以 察 覺 變 化 的 程 度 。 Sedlmeier與 Gigerenzer(1989)發 現 , 效 應 量 接 近 於 樣 本 中 位 數 , 並 由 過 去 相 關 文獻支 援定 義效應 量。 另外,Cohen(1988)說明小效應量(small effect size)大部 分 出 現 於 性 格 和 社 會 心 理 方 面 的 研 究 , 因 為 這 類 研 究 的 衡 量 大 多 有 較 低 的 信 度 , 而 大 效 應 量(large effect size)出 現 於 實 驗 心 理 類 的 研 究 , 這 類 研 究 大 多 有 實驗組 與控 制組, 並且 重視衡 量過 程與工 具的 嚴謹性 。 綜 合 以 上 三 個 影 響 因 素 的 現 象 , 當 增 加 這 三 個 影 響 因 素 的 數 值 , 同 時 也 增 加檢定 力。 這三個 影響 因素對 檢定 力的關 係整 理如表1所示。 表 1 檢定力與顯著水準、樣本數、效應量之關係 顯 著水 準 樣 本數 效 應量 檢 定 力 正 向 關 係 正 向 關 係 正 向 關 係 Baroudi 與 Orlikowski(1989) 提 出 提 升 檢 定 力 的 方 法 , 包 括 : 1. 增 加 樣 本 數 ;2.改變抽樣方式,建議採用隨機抽樣,若無法達成隨機抽樣,也建議採用 目 的 取 樣 或 盡 量 增 加 樣 本 同 質 性 , 而 使 標 準 誤 差 減 小 ;3.變數的選擇,建議選 擇 相 關 性 小 的 變 數 , 可 以 避 免 共 線 性 的 問 題 ;4.減少誤差,盡量減少衡量誤差 等 方 法 。 另 外 ,Murphy與 Myors(2004)也 提 出 兩 種 方 法 以 增 加 檢 定 力 , 第 一 種 最簡單 的方 法為改 變顯 著水準 ,當 顯著水 準較 為寬鬆 時, 檢定力 則增 加,但 此 種作法 對於 研究本 身與 研究的 解釋 能力並 不代 表任何 意義 ;第二 種方 法即增 加
樣本數 ,主 要增加 同質 性或一 般性 ,降低 抽樣 誤差的 可能 性,並 且減 少對結 果 產生錯 誤的 解釋。 ( 二) 樣本數 對 研 究 者 而 言 , 在 研 究 過 程 中 需 要 運 用 多 少 樣 本 數 而 能 夠 反 映 出 母 體 的 真 正現象 ,是 許多研 究者 一直想 要克 服的難 題。 雖然使 用較 多的樣 本較 可以反 映 出真正 現實 面的狀 況, 但是受 限於 時間與 預算 ,研究 者皆 希望能 夠以 最少的 資 源發揮 出最 大的效 果, 所以, 在研 究進行 中, 樣本數 的決 定一直 是研 究者最 關 注 的 議 題 。Maxwell(2000) 說 明 , 在 迴 歸 分 析 的 情 況 下 , 樣 本 數 決 定 的 方 法 為 : 在 迴 歸 分 析 下 , 在 滿 足 檢 定 力 的 條 件 下 , 樣 本 數 的 決 定 可 以 依 據 noncentral F 分 配 , 主 要 有 三 個 影 響 參 數 : 分 子 自 由 度 、 分 母 自 由 度 , 以 及 noncentrality參 數 。 另 外 , 分 子 與 分 母 的 自 由 度 又 決 定 於 預 測 變 數 的 數 目 (p)、 樣 本 數(N)和 效 應 量 的 類 型 。 由 於 計 算 樣 本 數 的 運 算 式 複 雜 , 故 許 多 學 者 便 提 出 一 些 「 經 驗 法 則 」 以 簡 馭 繁 , 例 如 :Harris(1985) 以 及 Wampold 與 Freund (1987)皆 指 出 , 一 般 的 規 則 N與 p的 比 例 應 為 10: 1。 Green(1991)指 出 , 若 效 應 量為.075時,則一般較合理的法則,最小的樣本數應為: N 104 p= + (1) Nunnally(1978)建 議 , 在 迴 歸 分 析 中 , 至 少 需 要300~ 400份 樣 本 數 才 足 夠 應付一 般變 數數量 的研 究。以 上各 個學者 皆持 不同的 論點 ,雖然 這些 經驗法 則 提供學 者一 個較為 簡單 判斷樣 本數 的方法 ,但 是這些 方法 仍遭遇 一些 學者的 質 疑 與 批 評 。Green(1991)強 調 , 一 般 經 驗 法 則 所 得 到 的 樣 本 數 較 大 , 並 且 所 得 的 研 究 結 果 不 支 持 經 驗 法 則 所 得 的 樣 本 數 。Cohen(1988)出 版 有 關 檢 定 力 分 析 的書中 ,彙 整了各 種不 同分析 方法 的檢定 力與 所需的 樣本 數,主 要可 以藉此 與 一般之 經驗 法則相 互比 較,進 而判 斷其適 切性 。本研 究發 展一套 軟體 ,藉由 這 套軟體 可以 即時計 算出 檢定力 與樣 本數, 為研 究者提 供一 個既快 速及 彈性、 破 除一般 似是 而非的 經驗 法則、 較精 確決定 樣本 數的方 式, 並可以 增加 研究者 進 行研究 的效 率與可 信度 。
( 三) 非無效 應假 設檢定 針 對 樣 本 複 判 定 係 數 相 關 研 究 中 , 以Steiger與 Fouladi(1992)的 論 文 提 供 較 全面性 的探 討,在 此論 文中, 作者 不僅提 供樣 本判定 係數 之機率 函數 分佈圖 與 累積機 率函 數分佈 圖, 也提供 計算 檢定力 分析 與樣本 數等 功能, 但是 ,以上 這 些 功 能 皆 基 於H0:ρ = 0下所發展的功能,而H2 0:ρ = ρ (2 20 2 0 0 ρ > )並不包括於相 關 的 電 腦 軟 體 功 能 中 。 然 而 ,Wilcox(1980)及 Fowler(1985)皆 表 示 , 當ρ 為 非2 零或是 某一 常數的 情況 下,可 以代 表某些 特別 的意義 。另 外,在 假設 檢定中 , 尤 其 在H0:ρ ≦2 ρ 及H20 0: 2 ρ ≧ 2 0 ρ 情況 下,檢 定 力分析 對 於確認 重 要研究結果 提 供 了 重 要 的 判 斷 基 礎 。 故 本 研 究 可 在H0: ρ ≦2 ρ 、 H20 0: 2 ρ ≧ 2 0 ρ 及 H0: 2 ρ = 2 0 ρ ( 2 0 ρ ≠0)的情況下,提供全面性假設檢定、檢定力計算,並且提供精確樣 本 數 , 成 為 研 究 者 在 研 究 規 劃 階 段 重 要 的 依 據 。 表2為 本 研 究 整 理 相 關 文 獻之 彙總表 。 表 2 複相關係數相關文獻彙總表 檢 定力 樣 本數 假 設 檢 定 Shieh (2006) Dunlap等人 (2004) Maxwell (2004) Maxwell (2000) Algina與Olejnik (2003) Cumming與Finch (2001) Mendoza與Stafford (2001) Borkowski、Welsh與Zhang (2001) Rothstein、Borenstein、Cohen與Pollack (1990) Baroudi與Orlikowski (1989) Gatsonis與Sampson (1989) Mason與Perreault (1991) Shieh (2006) Kelley與Maxwell (2003) Algina與Olejnik (2003) Mendoza與Stafford (2001) Maxwell (2004) Maxwell (2000) Green (1991) Gatsonis與Sampson (1989)
二、系統軟體相關文獻
隨 著 科 技 的 日 益 進 步 , 電 腦 硬 體 也 有 迅 速 的 進 展 , 電 腦 處 理 速 度 加 快 、 可儲存的 容量 加大、 體積 也大幅 度的 縮小, 許多 之前研 究無 法處理 的複 雜運算 , 現 在 由 於 電 腦 運 算 能 力 大 幅 提 升 , 使 之 前 的 不 可 能 變 成 可 能 , 所 以 , 近 幾 年 來 , 利 用 電 腦 軟 體 來 解 決 一 些 研 究 上 所 面 臨 的 統 計 問 題 , 相 關 研 究 也 愈 來 愈 多 , 逐 漸 形 成 一 股 潮 流 。 針 對R2相 關 議 題 而 發 展 的 電 腦 軟 體 有Algina與Olejnik (2003) 、 Dunlap 等 人 (2004) 、 Mendoza 與 Stafford(2001) 以 及 Shieh(2006) 等 學 者 皆 結 合Fortran、 Mathematica、 SAS和 SPSS等 系 統 軟 體 , 以 提 供 學 術 研 究 者 更 有 效 率 的 工 具 ;Dunlap等 人 (2004)更 利 用 Fortran發 展 電 腦 軟 體 計 算 檢 定 力 。 在 這 些 研 究 中 , 作 者 們 專 注 於 探 討 檢 定 力 的 運 算 , 並 利 用 程 式 所 產 生 的 結 果 說 明 , 作 者 所 提 供 的 程 式 比 之 前 的 相 關 研 究 更 為 精 確 。Mendoza與Stafford(2001) 利 用Mathematica所 提 供 的 函 數 , 對 樣 本 判 定 係 數 分 佈 計 算 區 間 估 計 、 檢 定 力 和 樣 本 數 。 由 上 述 兩 個 相 關 的 研 究 中 , 一 個 使 用Fortran 語 言 , 另 一 個 使 用 Mathematica軟 體 , 這 兩 種 語 言 皆 是 針 對 科 學 與 數 理 方 面 專 業 的 軟 體 , 若 沒 有 使用該 軟體 的經驗 ,則 很難在 短時 間內知 道如 何使用 ,對 於另外 領域 的研究 者 則 障 礙 更 大 , 所 以 , 在Mendoza與 Stafford(2001)此 篇的 研 究中 , 在 附 錄中 教 導 使 用 者 如 何 使 用Mathematica並 說 明 如 何 運 用 相 關 的 指 令 。 在 驅 使 使 用 者 使 用 軟體的 過程 中,軟 體界 面的容 易使 用性和 即時 反應是 促使 使用者 願意 使用軟 體 的 重 要 影 響 因 素 , 而Excel是 兼 具 種 種 優 勢 的 試 算 軟 體 , 所 以 , 近 來 有 許 多 研 究 者 利 用Excel來 發 展 軟 體 , 以 達 到 教 化 與 說 服 使 用 者 的 目 的 , 例 如 : Alf與 Graf(2002)利 用 Excel發 展 樣 本 判 定 係 數 (R2)分 佈 並 以 最 大 概 式 法 提 出 新 的 估 計 值 的 想 法 , 作 者 們 欲 利 用Excel的 圖 形 , 提 供 讀 者 一 個 較 佳 的 說 明 。 Cumming 與Finch(2001)藉 由 Excel之 圖 形 , 為 教 導 讀 者 信 賴 區 間 的 相 關 概 念 , 提 供 了 一 個最佳 的說 明。由 於檢 定力、 樣本 數及區 間估 計是每 個研 究者及 研究 皆會遇 到 的 例 行 性 的 問 題 , 本 研 究 欲 利 用Excel的 親 和 性 , 為 每 位 研 究 者 介 紹 一 套 容 易 使用且 可以 經常使 用的 軟體。
參、研究方法
研 究 方 法 主 要 介 紹 本 論 文 所 依 據 的 理 論 架 構 , 進 而 推 演 出 計 算 複 相 關 係 數 的相 關議 題 ,故 此一 部 分包 括四 個 主題 :一 、 介紹R2之 機 率函 數的 相 關假 設及主要理 論依 據;二 、說 明如何 推演 複相關 係數 之假設 檢定 ;三、 說明 本系統 軟 體發展 之相 關議題 ,並 說明驗 證本 軟體之 過程 ;最後 則簡 述本軟 體之 功能。
一、
R
2之機率函數(density function)
考 慮 複 迴 歸 模 式 的 情 況 下 , 第i個 觀 測 樣 本 , 反 應 變 數 為 Yi,p為 解釋 變 數 的個數 ,預 測變數 為Xi1 , Xi2 ,…, Xip,此迴 歸模式 如下 所示: p i 0 j ij i j 1 Y X = = β +∑
β + ε (2) 而Xi = (Xi1, …, Xip)T有一p維度多變量常態分佈Np(μ, Σ),β ,0 β ,…,1 β 為未p 知的參 數,ε ~ N(0,i σ ),i = 1, …, N。2 ρ 為Y和X1, X2, …, Xp之間的 母體 複相關 係 數 (population multiple correlation coefficient) , 而 ρ 為 母 體 判 定 係 數2(population coefficient of determination or population squared multiple correlation coefficient)。ρ 之定義如下所示: 2 2 T 2 T 1 1/ ( 1 1) ρ = β Σβ σ + β Σβ (3) 以及 β1 = (β1, …, βp)T 在 樣 本 數N > p的情況下,Y和X1, X2, …, Xp之 間 的 樣本 判 定 係 數(sample coefficient of determination or sample squared multiple correlation coefficient)為 R2。R2的密 度函數 如下 所示(Anderson, 1984: 145): f(r2; p, N, ρ2)
(
)
(
)
(
)
[
]
(
)
( N 1)/2 2 2 i 2 2 p/2 i 1 2 ( N p 1)/2 i 0 N 1 / 2 i ( ) 1 (r ) (1 r ) N 1 / 2 i! p / 2 i N p 1 / 2 − + − − − ∞ = Γ ⎡⎣ − + ⎤ ρ⎦ − ρ − = ∑ Γ ⎡⎣ − ⎤ Γ⎦ + Γ ⎡⎣ − + ⎤⎦ (4) 在 公 式(4)中,其中0≤r2≤1,ρ 是母體判定係數, ( )2 Γ α 為gamma函數。由公 式(4)可 知 , R2密 度 函 數 是 一 個 非 常 複 雜 的 式 子 。 而 後 來 有 許 多 學 者 以 不 同 的 方 式 呈 現 , 例 如 :Gatsonis與 Sampson(1989)、 Ding(1996)、 Mendoza與 Stafford (2001) , 以 及 Steiger 與 Fouladi(1992) 。 然 而 , Mendoza 與 Stafford(2001) , 以 及 Steiger與Fouladi(1992)皆以Lee(1972)所推演的公式為基準,算出精確的結果。Lee(1972)的運算公式如下所示: 2 2 f (N,p, ,R )ρ
(
) ( ) (
)
1 1 1 1 n p 1 n 2 1 2 2 2 2 2 2 2 2 1 1 1 1 1 B p, n2 1 R 1 R F n, n, p; R 2 2 2 2 2 − − − ⎧ ⎛ ⎞⎫ ⎛ ⎞ =⎨ ⎜ ⎟⎬ − ρ − ⎜ ρ ⎟ ⎝ ⎠ ⎝ ⎠ ⎩ ⎭ (5) 在 公 式(5)中 , B(.)和 F(.)分 別 代 表 Beta和 超 幾 何 分 配 (hypergeometric)之 函 數,n = N − 1和n2 = n − p = N − p − 1,其中N代表樣本數,p為解釋變數的個 數,依 據定 義B(.)和F(.)公式如下: a b (a) (b) Beta( , ) 2 2 (a b) Γ Γ = Γ + 和 k k 0 (a k) (b k) (c) x F(a,b;c; x) (a) (b) (c k) k! ∞ = Γ + Γ + Γ = ⋅ Γ Γ Γ +∑
. 本 研 究 之R2密 度 函 數 也 依 據Lee(1972)的 式 子 發 展 而 成 , 而 R2的 密 度 函 數 也 可 以 說 明 以 樣 本 數(N)、 解 釋 變 數 的 個 數 (p)、 母 體 判 定 係 數 (ρ ),以及樣本2 判 定 係 數(R2)以上四個參數所構成的函數。利用上述的公式(5)求得樣本複相關 分 配 函 數 的 數 值 之 後 , 再 利 用Simpson’s rule進 行 積 分 , 求 得 樣 本 判 定 係 數 累 積函數 分佈 。二、假設檢定
針 對 複 迴 歸 模 式 的 假 設 檢 定 , 由 於 檢 定H0:ρ = 和 檢 定 H2 0 0:β = β = 1 2 ... p 0 = β = 相 同 , 所 以 可 以 使 用 F檢 定 來 進 行 整 個 模 式 (full model)假 設 檢 定 的 分 析。以 圖1表示本研究計算檢定力之示意圖,圖1有兩個分配,所以,以左方之 分配為 虛無 假設的 情況 ,右邊 之分 配為對 立假 設之情 況, 以檢定 力之 定義為 當 對立假 設為 真時, 拒絕 虛無假 設的 機會, 即為 圖中陰 影的 部分。 本研 究計算 的 方 式 為 : 若 以 顯 著 水 準 為α,則在虛無假設的情況下找出左邊的面積,最接近 1−α的切點,找出切點後,在對立假設下,算出由切點到最右邊端點的機率, 所求出 之機 率即為 檢定 力。在 檢定H :0 ρ = ρ (≠ 0)時,雖然觀念一樣,但無法2 20 以F檢定來進行。 若α =P(R2> |C 2 2 0) ρ = ρ ,則 Power value =P(R2> |C 2 2 1 ρ = ρ ) (6) 其中C 為在 2 2 0 ρ = ρ 下,R2之100 (1× − α)%百分數 。由 以 上 計 算 檢 定 力 的 算 式 顯 示 , 可 由 圖1之 示 意 圖 表 示 , 使 檢 定 力 計 算 更 容易瞭 解。 圖 1 檢定力計算示意圖
三、介紹系統軟體與功能
本 研 究 為 了 因 應 複 雜 的 R 分 佈 運 算 而 介 紹 一 軟 體 , 命 名 為 RHO-2 SQUARE。此軟體以Microsoft Excel內建之VBA語言,發展RHO-SQUARE。此 軟 體 選 擇Excel來 發 展 的 主 要 原 因 為 :( 一 ) Excel為 目 前 最 普 遍 的 試 算 軟 體 , 最 多 人 使 用 , 而 且 進 入 障 礙 也 最 低 , 只 要 稍 具 電 腦 基 礎 的 人 士 皆 會 操 作 Excel;( 二 ) Excel具 有 高 度 親 和 的 介 面 , 而 且 又 具 有 高 度 彈 性 、 即 時 反 應 等 特 點 , 接 受 度 較 高 。 雖 然Excel 具 有 高 度 親 和 性 介 面 、 接 受 度 高 的 優 點 , 但 是 ,Excel的 函 數 庫 中 僅 包 括 少 部 分 一 般 實 務 面 較 常 運 用 的 函 數 , 對 於 數 學 或 統 計 研 究 較 複 雜 的 函 數 皆 不 支 援 , 所 以 , 此 軟 體 除 了 少 部 分 的 函 數 ( 例 如 : Beta function 以及Inverse F distribution),Excel本身之函數庫有支援外,其他 剩 下 的 部 分 皆 根 據Lee(1972)的 演 算 法 , 自 行 加 以 建 構 與 發 展 新 的 函 數 , 更 加 深程式 撰寫 與開發 的困 難度與 複雜 度。在 軟 體 的 精 確 度 上 , 雖 然McCullough與Wilson(2005)提出Excel雖 具 有親 和 性 與 方 便 等 優 勢 , 但 相 較 於 一 些 專 業 之 統 計 與 數 學 軟 體 , 例 如 :SAS 或
參考文獻
Alf, E. F., & Graf, R. G. (2002). A new maximum likelihood estimator for the population squared multiple correlation. Journal of Educational and Behavior
Statistics, 27, 223-235.
Algina, J., & Olejnik, S. (2003). Sample size tables for correlation analysis with applications in partial correlation and multiple regression analysis.
Multivariate Behavioral Research, 38, 308-323.
Anderson, T. W. (1984). An introduction to multivariate statistical analysis (2nd ed.). New York: Wiley.
Baroudi, J. J., & Orlikowski, W. J. (1989). The problem of statistical power in MIS research. MIS Quarterly, March, 87-106.
Bobko, P. (2001). Correlation and regression: Applications for industrial
organizational psychology and management (2nd ed.). Thousand Oaks, CA:
Sage.
Borkowski, S. C., Welsh, M. J., & Zhang, M. (2001). An analysis of statistical power in behavioral accounting research. Behavioral Research in Accounting, 13, 63-84.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Erlbaum.
Cohen, J. (1992). A power primer. Psychological Bulletin, 112, 155-159.
Cumming, G., & Finch, S. (2001). A primer on the understanding, use, and calculation of confidence intervals that are based on central and noncentral distributions. Educational and Psychological Measurement, 61, 532-574. Deci, E. L., Connell, J. P., & Ryan, R. M. (1989). Self-determination in a work
organization. Journal of Applied Psychology, 74, 580-590.
Ding, C. G. (1996). On the computation of the distribution of the square of the sample multiple correlation coefficient. Computational Statistics & Data
Analysis, 22, 345-350.
Dulebohn, J. H., & Ferris, G. R. (1999). The role of influence tactics in perceptions of performance evaluations’ fairness. Academy of Management
Journal, 42, 288-303.
Dunlap, W. P., Xin, X., & Myers, L. (2004). Computing aspects of power for multiple regression. Behavior Research Methods, Instruments, & Computers, 36, 695-701.
Fowler, R. L. (1985). Testing for substantive significance in applied research by specifying nonzero effect null hypotheses. Journal of Applied Psychology, 70, 215-218.
Gatsonis, C., & Sampson, A. R. (1989). Multiple correlation: Exact power and sample size calculations. Psychological Bulletin, 106, 516-524.
Green, S. B. (1991). How many subjects does it take to do a regression analysis?
Multivariate Behavioral Research, 26, 499-510.
Harris, R. J. (1985). A primer of multivariate statistics (2nd ed.). New York: Academic Press.
Kelly, K., & Maxwell, S. E. (2003). Sample size for multiple regression: Obtaining regression coefficients that are accurate, not simply significant. Psychological
Methods, 8, 305-321.
Lee, Y. (1972). Tables of upper percentage point of the multiple correlation coefficient. Biometrika, 59, 175-189.
Maxwell, S. E. (2000). Sample size and multiple regression analysis.
Psychological Methods, 5, 434-458.
Maxwell, S. E. (2004). The persistence of underpowered studies in psychological research: Causes, consequences, and remedies. Psychological Methods, 9, 147-163.
Mason, C. H., & Perreault, W. D. (1991). Collinearity, power, and interpretation of multiple regression analysis. Journal of Marketing Research, 28, 268-280. Mazen, A., Graf, L., Lellogg, C., & Hemmasi, M. (1987). Statistical power in
contempary management research. Academy of Management Journal, 30, 369-380.
McCullough, B. D., & Wilson, B. (2005). On the accuracy of statistical procedures in Microsoft Excel 2003. Computational Statistics and Data Analysis, 49, 1244-1252.
Mendoza, J. L., & Stafford, K. L. (2001). Confidence interval, power calculation, and sample size estimation for the squared multiple correlation coefficient under the fixed and random regression models: A computer program and useful standard tables. Educational and Psychological Measurement, 61, 650-667.
Miller, D. (1988). Relating Porter’s business strategies to environment and structure: Analysis and performance implications. Academy of Management
Journal, 31, 280-308.
Murphy, K. R., & Myors, B. (2004). Statistical power analysis: A simple and
general model for tradition and modern hypothesis test (2nd ed.). Mahwah,
NJ: Erlbaum.
Nunnally, J. C. (1978). Psychomertic theory (2nd ed.). New York: McGraw-Hill. Pelled, L. H., & Xin, K. R. (1999). Down and out: An investigation of the
relationship between mood and employee withdrawal behavior. Journal of
Management, 6, 875-895.
Rothstein, H. R., Borenstein, M., Cohen, J., & Pollack, S. (1990). Statistical power analysis for multiple regression/correlation: A computer program.
Educational and Psychological Measurement, 50, 819-830.
Sedlmeier, P., & Gigerenzer, G. (1989). Do studies of statistical power have an effect on the power of studies? Psychological Bulletin, 105, 309-316.
Shieh, G. (2006). Exact interval estimation, power calculation and sample size determination in normal correlation analysis. Psychometrika, 71(3), 529-540. Shieh, G., & Kung, C. F. (2007). Methodological and computational considerations
Research Methods, 39(4), 731-734.
Steiger, J. H., & Fouladi, R. T. (1992). R2: A computer program for interval estimation, power calculations, sample size estimation, and hypothesis testing in multiple regression. Behavioral Research Methods, Instruments, and
Computers, 24, 581-582.
Wampold, B. E., & Freund, R. D. (1987). Use of multiple regression in counseling psychology research: A flexible data-analytic strategy. Journal of Counseling
Psychology, 34, 372-382.
Wilcox, R. R. (1980). Some exact sample sizes for comparing the squared multiple correlation coefficient to a standard. Educational and Psychological