• 沒有找到結果。

李克尺度資料平均數區間檢定之初探

N/A
N/A
Protected

Academic year: 2021

Share "李克尺度資料平均數區間檢定之初探"

Copied!
6
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會補助專題研究計畫成果報告

※※※※※※※※※※※※※※※※※※※※※※※※※

※ ※

※ 李克尺度資料平均數區間檢定之初探

※ ※

※※※※※※※※※※※※※※※※※※※※※※※※※

計畫類別:

個別型計畫

整合型計畫

計畫編號:N S C 9 0 - 2 4 1 6 - H - 0 0 9 - 0 0 8

執行期間:9 0 年 8 月 1 日 至 9 1 年 7 月 3 1 日

計畫主持人:丁 承

本成果報告包括以下應繳交之附件:

□赴國外出差或研習心得報告一份

□赴大陸地區出差或研習心得報告一份

□出席國際學術會議心得報告及發表之論文各一份

□國際合作研究計畫國外研究報告書一份

執行單位:國立交通大學經營管理研究所

91

10

11

(2)

行 政 院 國 家 科 學 委 員 會 專 題 研 究 計 畫 成 果 報 告

李克尺度資料平均數區間檢定之初探

Inter val Testing About Means for the Liker t-scale Data

計畫編號:NSC 90-2416-H-009-008

執行期限:90 年 8 月 1 日至 91 年 7 月 31 日

主持人:丁 承 國立交通大學經營管理研究所

一、 中文摘要 在行為科學研究中常使用李克尺度 (Likert scale) 來量測觀點、認知、滿意度 等,若欲檢視某變量平均值是否為「無意 見」(中立),區間假設應是較合理的表達 方式,本研究以單一母體單變量平均數之 檢定為對象,提出二項分配供作母體分 配,並發展大樣本下基於常態理論與非中 心性卡方分配之近似檢定法,我們以蒙地 卡羅模擬評估該檢定法的有效性,結果顯 示,該法之檢定力與二項母體分配下之模 擬檢定力相當接近,且小樣本時亦然!再 者,該法之使用十分簡易。針對李克尺度 資料關於平均數為「無意見」的區間檢定, 我們強烈推薦所提之檢定方法。 關鍵詞:李克尺度、區間檢定、二項分配、 非中心性卡方分配、檢定力、蒙地卡羅模 擬 Abstr act

In behavior research, the Likert scale is often used to measure perception, opinion, satisfaction, etc. To examine if the average satisfaction for a variate is neutral, the interval hypothesis should be more reasonable. In this study, the binomial distribution is proposed to serve as a population distribution. A test for the interval hypothesis under the binomial population has been developed. The test is based on large-sample normal approxima-tion, and requires the evaluation of the noncentral chi-square distribution. Monte

Carlo simulation was used to evaluate the effectiveness of the test. The results indicated that the power of the test and the simulated power under the binomial population are very close, even for small samples. In addition, the test, illustrated with examples, is easy to perform. The test is strongly recommended for interval testing about means regarding neutrality for the Likert-scale data.

Keywor ds: Likert Scale, Interval Testing,

Binomial Distribution, Noncentral Chi-square Distribution, Power, Monte Carlo Simulation 二、緣由與目的 在行為科學研究中常使用李克尺度 (Likert scale) 來量測觀點、認知、滿意度 等,並以統計方法進行後續推論[3]。舉例 而言,針對某一特定服務項目,若以七分 尺度量測其滿意度,吾人通常以 1、2、3、 4、5、6、7 分別表示「非常不滿意」、「不 滿意」、「稍不滿意」、「無意見」、「稍滿意」、 「滿意」及「非常滿意」。就某一特定族群, 平均而言,對該項目是否滿意常是吾人關 心的第一點,若以µ表滿意度之母體平均 值,則待檢定之假設在傳統上的表達方式 為 H0µ = 4 vs. H1:µ ≠ 4。然而,由於李 克尺度係順序尺度,屬間斷性質,故以 「H0µ = 4」表達「無意見」並無法反映 不確定性,吾人可將所示之單點假設修訂 為一區間型態,即 H04−δ ≤ µ ≤ 4+δ(δ> 0) (例如:3.8 ≤ µ ≤ 4.2) [4]以反映「無意見」 之無差異區域 (indifference zone),該表達

(3)

方式似較具說服力。另一方面,由於李克 尺度下之母體分配非常態,僅能於樣本數 大時藉助中央極限定理採常態檢定,然相 關之檢定問題在文獻上似未見具體的著 墨,故擬於本研究中提出初步的探討,並 藉供應用參考。 三、結果與討論 由於李克尺度最常採用七分尺度和五 分尺度[e.g., 1],亦有採用九分尺度者,故 所涉及之檢定問題應一併考量。設隨機變 數 X 代表某項目之滿意度,並以李克尺度 進行量測。在從事統計檢定前,母體分配 應先行設定,雖然二項分配通常係扮演抽 樣分配的角色,但在此卻能適當地擔任 X 之母體分配,設 k 為李克尺度之尺度分級 數,則 X 之母體分配可設為 b(k−1,p) + 1。 若 k = 7 (七分尺度),則母體分配可設為 b(6, p) + 1;若 k = 5 (五分尺度),則設為 b(4, p) + 1;若k = 9 (九分尺度),則為 b(8, p) + 1, 分配型態隨 p 值不同而變化。 我們將分別就七分尺度、五分尺度及 九分尺度進行檢定之探討,並歸納檢定通 則。 (一) 七分尺度 在 七 分 尺 度 下 , 由 於 E(X) = µ = 6p+1,Var(X) = σ2 = 6p(1p),故單點假設 H01µ = 4 與區間假設 H024−δ ≤ µ ≤ 4+δ 可藉 p 分別表達如下:H01:p = 0.5 及 H02: 0.5−δ/6 ≤ p ≤ 0.5+δ/6。以下將分別探討檢 定方式及其檢定力。鑒於區間假設之檢定 方式係植基於單點假設檢定之特性,故先 探討單點檢定,再論區間檢定。 1. 單點檢定 欲檢定 H01µ = 4 vs. H11:µ = µ1 ≠ 4, 當樣本數大時,可藉由中央極限定理,採 檢定統計量 Z =(X−4)/ 6×0.5×0.5/n= n X 4)/ 6 0.25/ ( − × = (X−4)/ 1.5/nZ2=n(X−4)2/1.5。當 H01為真,Z ~N(0,1), Z2~

x

12,故在顯著水準α下,檢定之臨界值 可採用

x

12,α(表自由度為 1 之卡方分配的第 100(1−α)百分位數),若 z2 ≥

x

12,α,則拒絕 H01;另一方面,當 H11 為真,p = p1 = (µ1−1)/6, X ~ N (µ1, 6p1(1−p1)/n). => (X−4)/ 6×0.25/n ~ N((µ1−4)/ 6×0.25/n, p1(1−p1)/0.25). => (X−4)/ (1.5/n)(4p1(1−p1)) ~N ((µ1 −4)/ 6p1(1−p1)/n, 1). => n(X−4)2/1.5 ~ 4p1(1−p1) 2 , 1θ

x

, θ = n (µ1 − 4)2/6p1(1−p1) [e.g., 4]. 因 此 , 當 H01 為 真 , 2

x

檢 定 之 檢 定 力 (power) = Pr(Z2≥

x

12,α| H01) = Pr (n(X−4)2/ 1.5 ≥

x

12,α| H01) = α;而當 H11為真, power = Pr (Z2≥

x

12,α| H11) = Pr (4p1(1−p1) 2 , 1θ

x

x

12,α) = Pr (

x

12,θ

x

12,α/4p1(1−p1)), θ = n (µ1−4)2/6p1(1−p1). (1) 檢定力可採式(1)求算,與常態母體下逕以 非中心性卡方分配求取有些許差異,而係 非中心性卡方分配之調整式! 以上論點係當樣本數大時之結果,但 樣本數究應多大方可適用則可以蒙地卡羅 模擬 (Monte Carlo simulation) 進行檢視。 在母體分配為 b(6,p) + 1 的前提假設下,我 們就不同樣本數 (檢視 n =10, 20, 30, 50, 100),針對不同母體平均數 (取至所對應 之檢定力值接近 1.0),以二項分配隨機數 值產生器抽取樣本,重複執行 5000 次,可 得樣本平均數 X 之估計抽樣分配,接著取 在µ = 4 下X 模擬抽樣分配之第 2.5 及第 97.5 百分位數 (顯著水準 α 設為 0.05) 作 為檢定臨界值,分別以 crit1 及 crit2 表之, 檢定力可以下式近似之:

(4)

power = # {xi≤ crit1 或xi≥ crit2}/5000. (2) 由於在常態母體下之小樣本檢定係採用 t = n(X−4)/S,S2=

= − − n i i X n X 1 2 1 / ) ( (服 從自由度 n−1 之t 分配),故在模擬時亦同 時求取 t 檢定之檢定力近似值 (以power∧ t 表之)以資比較。 模擬結果顯示,以基於常態理論之(1) 式所得之檢定力與二項母體下之模擬檢定 力相當接近,縱使當樣本數小至 n = 10 亦 然!但power∧ tn≤30 時呈明顯低估之態 勢 (樣本數 ≥ 50 時方近似於power ),檢定∧ 力函數係以µ = 4 為中心呈現對稱型態,當 µ = 4 時,模擬檢定力十分靠近α = 0.05。 因此,在二項母體分配下, H01:µ = 4 vs. H11:µ ≠ 4 之檢定可採上述基於常態理論 之

x

2檢定獲充分支持,臨界值係基於中心 性

x

12,檢定力則利用式(1)所示調整方式求 取。由於方法簡易,故在相關的推論上(如 樣本數之決定)甚具應用價值,該項優點可 延伸至區間檢定。至於 t 檢定,因樣本數 小 (≤ 30) 時檢定力被低估,故不建議使 用。 2. 區間檢定 欲檢定 H024−δ ≤ µ ≤ 4+δ (即 0.5 − δ /6 ≤p≤ 0.5 + δ/6) (0 < δ) vs. H12µ < 4−δ or µ > 4+δ,仍採 Z2 = n(X−4)2/1.5作為檢 定統計量,如前所述,當樣本數大時,Z2 ~ 4p(1p)

x

12,θ , p = (µ − 1)/6, θ = n (µ − 4)2 /6p(1p)。由於檢定之臨界值是在µ = 4 ± δ 下(即 H02的兩個端點)求取 ([4], [5]),而當 µ = 4 ± δ (即 p = 0.5 ± δ/6)時,Z2 ~ 4 p’(1p’)

x

12,θ'θ ’= nδ2 /[6p’(1 p’)],p’= 0.5 + δ/6,故在顯著水準α下,檢定之臨界值 c = 4p’(1p’)

x

12,α,θ' (

x

12,α,θ'表自由度為 1 且 非中心性參數為θ ’之非中心性卡方分配的 第 100(1−α)百分位數),若 z2≥ c,則拒絕 H02。當 H02為真,該檢定之檢定力≤ α;當 H12為真 (此時µ=µ1, p = p1= (µ1− 1)/6,, µ1, p1∈H12),檢定力 power = Pr (

x

12,θ≥ c/4p1(1−p1)), θ = n (µ1−4)2/6p1(1−p1). (3) 接著仍就不同樣本數,以蒙地卡羅法 模擬母體分配為 b(6, p)+1 假設下上述區間 檢定之檢定力。檢定係以

X

為基礎,在顯 著水準 α = 0.05 及重複次數 5000 之下, 檢定下臨界值(crit1)與上臨界值 (crit2) 之 決定係滿足以下條件: #{xi≤crit1 或xi≥crit2 |µ=4± δ}/5000≈0.05. 而檢定力仍以式(2)近似之。我們針對δ = 0.1, 0.2, 0.3, 0.4, 及 0.5 進行模擬分析,發 現區間檢定之模擬檢定力與利用式(3)所 求得之檢定力皆十分接近,縱使當樣本數 小至 n = 10 亦然!因此,在母體分配為二 項分配下,H024−δ ≤ µ ≤ 4+δ 之檢定可 採 基 於 常 態 理 論 之

x

2 檢 定 亦 獲 強 力 支 持,與單點檢定之差異僅在於臨界值 c 係 求自於非中心性

x

12,θ'之調整式。 蒙地卡羅模擬係利用統計套裝軟體 SAS [6]執行,二項分配隨機數值產生器利 用軟體中之 RANBIN 函數,非中心性卡方 分配之計算則藉助 PROBCHI 及 CINV 二 函數。SAS 程式及所得結果限於篇幅不做 列式,但歡迎來函索取。 (二) 五分尺度 在五分尺度下,X 之母體分配設為 b(4,p)+1,故 E(X) = µ = 4p+1,Var(X) = 4p(1p),當樣本數大時,區間假設 H02 3−δ ≤ µ ≤ 3+δ (0.5−δ/4 ≤ p ≤ 0.5+δ/4) vs. H12µ < 3−δ or µ > 3+δ 之檢定可採統計量 Z =(X−3)/ 4×0.5×0.5/n= n(X−3)或 Z2=n(X−3)2,此時,p = (µ −1)/4, X ~ N (µ, 4p(1p)/n). => n(X−3)~ N ( n (µ−3), 4p (1p)).

(5)

=> n (X−3)/ 4p(1− p) ~N ( n (µ −3)/ 4p(1− p), 1). => Z2 = n(X−3)2 ~ 4p (1p)

x

12,θ, θ = n (µ − 3)2 / 4p(1p). 當 µ = 3 ± δ (即p = 0.5 ± δ/4) 時,Z2 ~ 4p’(1 p’)

x

12,θ'θ ’= nδ2 /[4p’(1 p’)],p’= 0.5 + δ/4,故在顯著水準α下,檢定之臨界 值 c = 4p’(1 p’)

x

12,α,θ',若 z2 c,則拒 絕 H02。當 H02為真,檢定力≤ α;當 H12 為真 (此時µ = µ1, p = p1= (µ1 − 1)/4, µ1, p1∈H12),檢定力 power = Pr (

x

12,θ≥ c/4p1(1−p1)), θ = n (µ1−3)2/4p1(1−p1). (三) 九分尺度 在九分尺度下,E(X) =µ = 8p+1,Var(X) = 8p(1p),區間假設為 H025−δ ≤ µ ≤5+δ (0.5−δ/8 ≤p≤ 0.5+δ/8) vs. H12µ < 5−δ or µ > 5+δ 。 檢 定 統 計 量 採 Z = n X 5)/ 8 0.25/ ( − × = (X−5)/ 2/nZ2 =n(X−5)2 /2。此時,p = (µ−1)/8, X ~ N (µ, 8p(1p)/n). => (X−5)/ 8×0.25/n ~ N((µ−5)/ 8×0.25/n,p(1p)/0.25). => (X−5)/ (2/n)(4p(1− p)) ~N ((µ−5)/ 8p(1− p)/n, 1). => n(X−5)2 /2 ~ 4p(1p)

x

12,θ, θ = n (µ − 5)2/8p(1p). 當 µ = 5 ± δ (即p = 0.5 ± δ/8) 時,Z2 ~ 4p’(1 p’)

x

12,θ'θ ’= nδ2 /[8p’(1 p’)],p’= 0.5 + δ/8,故在顯著水準α下,檢定之臨界 值 c = 4p’(1 p’)

x

12,α,θ',若 z2≥ c,則拒 絕 H02。當 H02為真,檢定力≤ α;當 H12 為真(此時µ = µ1, p = p1= (µ1 − 1)/8, µ1, p1∈H12),檢定力 power = Pr (

x

12,θ≥ c/4p1(1−p1)), θ = n (µ1−5)2/8p1(1−p1). 我們仿照七分尺度所進行之蒙地卡羅 模擬方式,對五分尺度以及九分尺度從事 分析,在母體具二項分配的前提假設下, 無論樣本數大小,模擬檢定力與基於常態 理論所得者十分接近,故結論與七分尺度 所獲者相同。 (四) 區間檢定之通則 綜合以上討論,針對李克尺度資料, 單一母體單變量平均數為「無意見」的區 間檢定通則可歸納如下: 設 k 為李克尺度之尺度分級數,母體 分配設為二項分配 b(k−1,p) + 1,故平均數 µ= (k−1)p + 1,而 p = (µ−1)/(k−1),區間假 設型態為 H0:(k+1)/2 − δ ≤ µ ≤ (k+1)/2 +δ (δ> 0),亦可藉p 表達成 H0:0.5 − δ/(k−1) ≤p ≤ 0.5 + δ/(k−1)。欲檢定 H0,可採檢定 統計量 Z2 = n[X−(k+1)/2]2 /[0.25(k−1)], 其抽樣分配為 4p(1p)

x

12,θ, θ = n [µ − (k+1)/2]2 /[(k−1)p(1p)]. 在顯著水準α下,檢定之臨界值 c = 4p’ (1−p’)

x

12,α,θ'θ ’= nδ2 /[(k−1) p’ (1p’)], p’ = 0.5 + δ/(k−1),若 z2≥ c,則拒絕 H0。無 論樣本大小,該檢定之有效性已經蒙地卡 羅模擬檢驗通過,且該法之使用十分簡易 (見下節之操作範例),針對上述型態之區 間假設,我們強烈推薦該檢定法。 值得注意的是,該檢定法亦適用於五 分、七分和九分以外之其他李克尺度資料。 (五) 範例 本小節舉例說明上述區間假設之檢定 操作方式。在李克七分尺度下,已知顯著

(6)

水準α= 0.05,樣本數為 30,現擬檢定 H0: 3.8 ≤ µ ≤ 4.2 (δ = 0.2)。此例k = 7, 檢定統 計量 Z2 =30(X−4)2 /1.5,p’ = 0.5 + 0.2/6 = 0.5333 , 非 中 心 性 參 數θ ’= 30*(0.2)2 / (6*0.5333*0.4667) = 0.8036,

x

12,0.05,0.8036= 6.4725,故檢定之臨界值 c = 4*0.5333* 0.4667* 6.4725 = 6.44。因此,所採用之檢 定為:若 z2 = 30 (x−4)2/1.5 ≥ 6.44,則拒絕 H0。針對不同 δ 值與樣本數,其對應之檢 定臨界值彙總於表 1,該表顯示,在樣本 數固定下,臨界值隨 δ 之增加而增大;在 δ(>0)固定下,臨界值亦隨樣本數之增加而 增大。至於檢定之樣本數如何決定可參考 Ding [2] 所提示的方法,利用 iteration 的 方式求取。 表 1 李克七分尺度下不同 δ 值與樣本數 n 之區間檢定臨界值彙總表 n \δ 0 0.1 0.2 0.3 0.4 0.5 10 3.84 4.09 4.80 5.85 7.10 8.49 20 3.84 4.34 5.67 7.47 9.55 11.89 30 3.84 4.58 6.44 8.87 11.69 14.88 50 3.84 5.04 7.82 11.35 15.52 20.33 100 3.84 6.08 10.72 16.70 23.97 32.54 註: 1. 虛無假設為 H0:3.8 ≤ µ ≤ 4.2。 2. 顯著水準採 0.05。 3. δ = 0 時相當於單點檢定。 (六) 研究限制與後續研究建議 母體分配設定為二項分配係本研究之 研究限制,應用時須先檢測該前題假設是 否成立。另反映不確定性之 δ 值須事先給 定,如何客觀決定 δ 值是有趣的後續研究 課題。後續研究亦可延伸至不同母體間比 較之區間檢定,而針對不同母體分配應如 何進行檢定及針對任意平均數之區間檢定 法亦有待進一步思考。 四、計畫成果自評 研究成果在應用上具參考價值,擬投 稿學術期刊發表。 五、參考文獻

[1] Collins, W. C., Raju, N. S., and Edwads, J. E. (2000), “Assessing Differential Functioning in a Satisfaction Scale,” Journal of Applied Psychology, 85, 451-461.

[2] Ding, C. G. (1999), “An Efficient Algo-rithm for Computing Quantiles of the Noncentral Chi-Squared Distri- bution,” Computational Statistics & Data Analysis, 29, 253-259.

[3] Judd, C. M., Smith, E. R., and Kidder, L. H. (1991), Research Methods in Social Relations (6th ed.), Orlando, FL: Holt Rinehart and Winston.

[4] Lehmann, E. L. (1986), Testing Statis-tical Hypotheses (2nd ed.), New York: Wiley.

[5] Roussas, G. G. (1973), A First Course in Mathematical Statistics, Reading, MA: Addison-Wesley.

[6] SAS Institute Inc. (1990), SAS Language: Reference (Version 6, First edition), Cary, NC: Author.

參考文獻

相關文件

能從裝配圖機械中,判 斷其內部構造及其尺度。.

其外徑尺寸精度能達公差十級 以內,長度尺寸精度能達公差 十二級以內,表面粗糙度能達 6.3a

In this process, we use the following facts: Law of Large Numbers, Central Limit Theorem, and the Approximation of Binomial Distribution by Normal Distribution or Poisson

 1932 年提出李克特量表( Likert Scale ),是一種 心理測量量表,通常用於問卷設計,為目前最受調查 研究者廣泛使用的測量方法.

蘇黎世聯邦理工學院的科學團隊,使用了 19 種反應溫度及降雨的變數,作為 檢視全球

87 Eivind Almaas and Albert-László Barabási (2006), “Power laws in biological networks”, in Power Laws, Scale-Free Networks and Genome Biology, Ed. Karev (Eurekah.com and

• But Monte Carlo simulation can be modified to price American options with small biases..

本研究依據受試者網路人際程度的不同,將受試者網路人際程度各題項所得的分