五、 關鍵要素分析
5.1 檢定力與其他關鍵因素之間的關係
5.1.2 效應量及檢定力
圖 5 顯示在樣本數為 50,顯著水準為 0.05,預測變數個數為 5,
雙尾檢定時,效應量與檢定力之間的關係。
圖 5 預測變數個數與檢定力之折線圖 (small, medium, large effect size)
由圖 5 中顯示,在樣本數為 50 的情況下,中效應量及小效應量不管 預測變數的個數,檢定力皆很低皆小於 0.5 ,以大效應量而言,在預 測變數個數小於 5 的情況下,檢定力大於 0.8 ,並且與中效應量及小 效應量產生相當大的差距。另外,從圖 5 也顯示,隨著預測變數個數 的增加,檢定力也隨之遞減。
5.1.3 、 顯著水準 (α ) 及檢定力
當樣本數為 50、預測變數個數為 5、及雙尾檢定時,圖 6 則顯示 不同之顯著水準與檢定力之間的關係。
圖 6 母體判定係數與檢定力之折線圖 (alpha = 0.1, 0.05, 0.01)
由圖 6 中顯示,當樣本數、預測變數個數、以及母體判定係數皆維持 不變時,顯著水準越小,則檢定力也越小;相反的,顯著水準越大則 所得的檢定力也越大,所以,當顯著水準為 0.05 時,檢定力大於顯 著水準為 0.01 的檢定力。所以由此推論,一般假設檢定時,若顯著 水準越小,則拒絕虛無假設的機會也越小,而在此情況下所得的檢定 力也越小。
5.1.4 、 樣本數與檢定力
圖 7 表示在樣本數為 150,顯著水準為 0.05,及雙尾檢定下,可 以顯現出預測變數及母體判定係數對於檢定力的關係,進一步的說 明,及代表圖 4 與圖 7 僅在於樣本數的不同,圖 4 為樣本數為 50 的情況,而圖 7 則將樣本數增加為 150 的情況。兩者的大致成長的趨 勢是類似的,同樣為當其他條件維持不變下,預測變數的個數較小時,
則檢定力較高,而且母體判定係數也與檢定力呈現正相關的趨勢。兩 者最大的差異即為當樣本數增加時,檢定力也隨之增加,當樣本數為 50,預測變數的個數為 3,母體判定係數為 0.1 時,檢定力為 0.329,
同樣的條件當樣本數增加為 150 時,則檢定力增加為 0.885。更值得注 意的是,當樣本數增加為 150 時,在中效應量的情況下,檢定力大都 大於 0.8,相反的,當樣本數為 50 時,在中效應量的情況下,檢定力 全部低於 0.5,所以,由兩者的比較可以得到結論是,增加樣本數也會 使檢定力增加。
5.1.5、小結
綜合以上分析的結果,在此小結中彙總與整理。此部分針對檢定力與 其他因素之間,綜合以上的結果,如下列幾點所述。
(1) 預測變數個數與檢定力呈反向的關係,即預測變數個數越少,
則檢定力越大。
(2) 顯著水準與檢定力呈正向關係,顯著水準越大則檢定力也越
圖 7 母體判定係數與檢定力之折線圖 (P = 3, 4, 5, 6, 7, 8, 9, 10, 15, 20)
5.2、 樣本數與其他關鍵因素之間的關係
本節將針對主要影響樣本數的關鍵因素,例如:檢定力、預測變 數的個數、母體判定係數、或效應量,藉由圖與表的呈現,詳細的說 明各個要素與樣本數的關係。
5.2.1、母體判定係數與樣本數
表 12 整理當預測變數的個數為 5、顯著水準為 0.05、雙尾檢定的 情況下,不同的母體判定係數與不同的檢定力搭配組合下,所需最少 樣本數的結果彙總表。
表 12 母體判定係數、檢定力與樣本數資料彙總表
ρ2\power 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.75 0.8 0.85 0.9 0.95 0.99 0.0196 99 202 286 366 446 534 635 694 763 847 958 1135 1503 0.1 25 43 58 72 87 103 122 133 145 161 181 214 282 0.13 20 34 45 56 67 79 93 101 111 122 138 162 213 0.2 15 23 30 37 43 51 59 64 70 77 87 102 133 0.26 13 19 24 29 33 39 45 48 53 58 65 76 99
0.3 12 17 21 25 29 33 38 41 45 49 55 64 83 0.4 11 14 16 19 22 25 28 30 32 35 39 45 58 0.5 10 12 14 15 17 19 22 23 25 27 29 34 43 0.6 9 11 12 13 14 16 17 18 20 21 23 26 33 0.7 8 10 11 11 12 13 14 15 16 17 18 20 25 0.8 8 9 9 10 11 11 12 12 13 14 15 16 19 0.9 8 8 9 9 9 10 10 10 11 11 11 12 14
圖 8 則為根據表 12 相同的條件所繪製的折線圖。從圖 8 中顯示,在
預測變數為 5、顯著水準為 0.05 雙尾檢定的固定條件下,同樣在檢 定力為 0.1 下,母體判定係數越小,所需的樣本數越多,例如:在母 體判定係數為 0.1 下,檢定力為 0.1 ,所需最小樣本數為 25 ,而母 體判定係數為 0.9 ,只需要 8 個樣本即可達到檢定力為 0.1 。另外,
從圖 8 也呈現當欲達到的檢定力越高時,所需要的樣本數也越高,所 以,依據母體判定係數為 0.3 的情況下,欲達到檢定力 0.7 時,至少 需要 38 個樣本數,而欲達到檢定力 0.8 時,則需要 45 個樣本數。
若以 Cohen(1988) 將效應量分為大效應量、中效應量、小效應量 三種,將這三種以母體判定係數的方式表示,則分別為母體判定係數 等於 0.26、0.13、0.0196。以下則主要以大效應量、中效應量、小效 應量三種為主軸,藉由繪圖的方式,進一步詳細的闡述樣本數與效應 量之間的關係,如圖 9 所示。
圖 8 檢定力與樣本數之折線圖 ( ρ2 = 0.0196, 0.1, 0.13, 0.2, 0.26, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9)
圖 9 檢定力與樣本數之折線圖 (小效應量, 中效應量, 大效應量)
由圖 9 中顯示,在預測變數個數為 5 的基準下,小效應量所需要的 樣本數遠比中效應量及大效應量多,以同樣達到檢定力 0.8 的情況 下,小效應量需要至少 763 個樣本數,而中效應量以及大效應量同樣 達要檢定力 0.8 的情況下,只分別需要 111 及 53 個樣本數。值得注 意的是,小效應量所需樣本數之成長曲線非常的陡,與中效應量以及 大效應量所需樣本數明顯成長許多,以小效應量而言,若達到檢定力 0.2 時,即需要 202 個樣本。
5.2.2、預測變數個數與樣本數
預測變數也嚴重的影響所需樣本數的多寡,Maxwell (2000)、Harris (1985)、以及 Wampold 和 Freund (1987) 也在論文中建議以預測變數 的個數來判斷所需要的樣本數的數量,表 13 與圖 9 也顯示在不同的 預測變數個數下,檢定力與樣本數的關係。
表 13 預測變數個數、檢定力與樣本數資料彙總表
p\power 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.75 0.8 0.85 0.9 0.95 0.99 3 9 12 15 18 21 25 29 31 34 37 42 49 65 4 10 14 17 20 24 27 32 34 37 41 45 53 69 5 12 16 19 23 26 30 34 37 40 44 49 57 73 6 13 17 21 24 28 32 37 39 43 46 52 60 77 7 14 19 23 26 30 34 39 42 45 49 54 63 81 8 15 20 24 28 32 36 41 44 47 51 57 66 84 9 17 22 26 30 34 38 43 46 50 54 59 68 87 10 18 23 27 31 35 40 45 48 52 56 62 71 90
圖 10 檢定力與樣本數之折線圖 (P = 3, 4, 5, 6, 7, 8, 9, 10)
由圖 10 中顯示,當預測變數個數越小時,所需的樣本數也最少,故 以預測變數為 3 時,所需的樣本數最少。另外,當欲達到的檢定力較 小時,同樣的,所需的樣本數也最少,故預測變數個數與檢定力皆與 樣本數呈正向相關。另外,值得注意的是,Harris (1985) 及 Wampold 和 Freund (1987) 皆建議樣本數與預測變數個數的比例為 10 : 1 ,若 以檢定力為 0.8 的基準下,當預測變數個數為 10 時,所需的樣本數 為 100;但是,根據圖 9 所顯示,當預測變數個數為 10 時,樣本數 只需 52,此結果跟 Harris (1985) 及 Wampold 和 Freund (1987) 所預 測的樣本數有蠻大的差異,在如此的情況下,使用 RHO- SQUARE 除 了可得到較精確的樣本數規劃外,更可以節省收集大量樣本所耗費的 金錢與時間。
5.2.3、小結
由上述分析的結果可彙總下列幾點結論。
(1) 當母體判定係數越小時,所需要的樣本數越多,所以,兩者 呈現反向關係。
(2) 同樣的,小效應量所需的樣本數也最多。
(3) 當預測變數個數越少時,所需要的樣本數越少;若增加預測 變數之個數,則需要增加樣本數,故兩者呈現正向相關。
表 14 所需樣本數與其他關鍵要素彙總關係表
母體判定係數 效應量 預測變數個數
與所需樣本數之關 係
母 體 判 定 係 數 越 小,所需樣本數越 多
小效應量所需樣本 數越多
預測變數個數少,
所需樣本數越少
反向關係 反向關係 正向關係
5.3 信賴區間
本節主要針對兩個議題:(1)、在不同預測變數個數下信賴區間的 分佈情況,(2)、在不同信賴區間下,應具備多少樣本數。
5.3.1、預測變數個數與信賴區間
表 15 與 圖 11 顯示在樣本數為 50,顯著水準為 0.05 (左邊信賴 係數為 0.025,右邊信賴係數為 0.025) 不同的樣本判定係數與不同預 測變數個數搭配組合所得的信賴區間上界與下界的結果。
表 15 預測變數個數、樣本判定係數與母體判定係數信賴區間資料彙總表
P R2 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 3 RU 0.255 0.3819 0.4854 0.5764 0.6589 0.7353 0.8069 0.8744 0.9386
RL 0 0.0078 0.0673 0.1496 0.2506 0.3686 0.5026 0.6525 0.8182 4 RU 0.2335 0.3662 0.4732 0.5667 0.6514 0.7297 0.8028 0.8719 0.9374 RL 0 0 0.0507 0.1328 0.2346 0.3543 0.4908 0.6439 0.8135 5 RU 0.2108 0.3497 0.4603 0.5566 0.6436 0.7238 0.7986 0.8692 0.9361 RL 0 0 0.0337 0.1153 0.218 0.3394 0.4784 0.6348 0.8086 6 RU 0.1865 0.3323 0.4469 0.5461 0.6354 0.7176 0.7942 0.8664 0.9348 RL 0 0 0.0162 0.09717 0.2006 0.3237 0.4654 0.6253 0.8034 7 RU 0.1606 0.3139 0.4327 0.535 0.6269 0.7112 0.7897 0.8635 0.9334 RL 0 0 0 0.0783 0.1824 0.3074 0.4518 0.6153 0.7979 8 RU 0.1328 0.2945 0.4178 0.5234 0.6179 0.7044 0.7849 0.8604 0.9319 RL 0 0 0 0.0588 0.1635 0.2902 0.4375 0.6048 0.7922 9 RU 0.1031 0.2739 0.4022 0.5112 0.6085 0.6974 0.7799 0.8573 0.9304 RL 0 0 0 0.0384 0.1436 0.2722 0.4224 0.5937 0.7861 10 RU 0.0713 0.2522 0.3856 0.4984 0.5986 0.6899 0.7746 0.8539 0.9288 RL 0 0 0 0.0172 0.1229 0.2532 0.4065 0.5819 0.7996 RU: Upper ρ2 confidence limit
RL: Lower ρ2 confidence limit
圖 11 樣本判定係數與母體判定係數信賴區間關係圖 (P = 3, 5, 7, 9) 與 (Upper, Lower bound)
由圖 11 顯示,在信賴區間上界方面,若預測變數個數越少,則所得 的母體判定係數的信賴區間上界越高,同樣的,在下界部分,若預測 變數個數越少,則所得的母體判定係數的信賴區間下界也較高,所以,
不管是信賴區間的上界或下界,所得的母體判定係數的信賴區間的界 限,隨著預測變數的增加而往下遞減。例如:當預測變數個數為 3 時,
樣本判定係數為 0.5 時,母體判定係數信賴區間的上界為 0.6589,下 界為 0.2506,皆高於預測變數個數為 5 時,母體判定係數信賴區間的 上界為 0.6436 與下界 0.2180。另外,從圖 11 中,隨著樣本判定係 數的增加,母體判定係數之信賴區間的範圍也逐漸縮小。
5.3.2、樣本數與信賴區間
在不同的區域範圍下,需要多少樣本數,也是大多研究者關心的 重要議題。此處的區域範圍為 [ρ2- 0.05, ρ2+ 0.05],[ρ2- 0.1, ρ2+ 0.1],[ρ2- 0.15, ρ2+ 0.15],範圍依序由小到大。由圖 12 中顯示,
在預測變數個數為 5 ,信賴水準為 0.05 的條件下,區間範圍越小者,
需要越多的樣本數支持,反之,區間範圍越大者,需要較少的樣本數。
所以,以圖 12 而言,[ρ2- 0.05, ρ2+ 0.05] 範圍是三者之中最小的 需要最多的樣本數,在母體判定係數為 0.5 時,需要 771 個樣本數,
而 [ρ2- 0.15, ρ2+ 0.15] 此範圍是三者之中最大的,在母體判定係 數為 0.5 時,只需要 88 個樣本數,不同的區間範圍需要的樣本數也 存在很大的差異。另外,值得注意的是,三種不同範圍的需求樣本曲 線,皆在母體判定係數為 0.3 及 0.5 之間,所需的樣本數是最多的,
然後,在隨著母體判定係數的增加,需求的樣本數再逐漸遞減。更進 一步,從圖 13 中更可以清楚發現,圖中有四種不同的母體判定係數,
共有 0.167、0.3、0.5、以及 0.7,其中以 0.167 為最小,從圖 13 中 發現,母體判定係數為 0.167 時所需的樣本數不是最多的,令人注意 的是,當母體判定係數為 0.3 時所需的樣本數最多,如此的曲線型態 與假設檢定時的樣本數需求曲線是不同的,如此的現象實在令人值得 多加注意,及再進一步探討其中差異之處。
5.3.3、小結
針對信賴區間的範圍與預測變數個數及樣本數之分析結果,如下列幾 點所述。
(1) 隨著預測變數個數的增加,預估之信賴區間之上界與下界,也隨 之往下移動。
(2) 當信賴區間越大時,所需要的樣本數也越少。
(3) 隨著母體判定係數的增加,所需的樣本數遞減,但是,值得注意
的是,在母體判定係數為 0.3 ~ 0.5 之間,所需樣本數突然增加為 最多。
圖 12 母體判定係數之信賴曲線與樣本數之關係圖 ( 區域範圍± 0.05, 0.1, 0.15)
圖 13 區間範圍與樣本數的關係圖 (ρ2 = 0.167, 0.3, 0.5, 0.7)
六 、 文獻個案與探討
本研究主要針對母體複相關係數的基本分佈、假設檢定、區間估 計、與樣本數等議題發展的軟體。首先介紹應用 RHO-SQUARE 的適
本研究主要針對母體複相關係數的基本分佈、假設檢定、區間估 計、與樣本數等議題發展的軟體。首先介紹應用 RHO-SQUARE 的適