第三章 研究方法
第四節 資料分析
壹、預試資料分析:
本研究資料分析主要之分析方法包括:在量的分析方面,首先探討本測驗工 具試題的難度、鑑別度以及信度,並且採用效標關聯效度,探討基本能力測驗的
評量結果與該學期社會學習領域學期末總成績之關聯性。在質的分析方面,包含 對目前國小社會學習領域教材進行主概念分析及施測教師的對測驗題本及試題 之檢核。作為試題修正之依據。
一、第一次預試
本研究第一次預試對象為95學年度第一學期彰化縣某三所國民小學之六年 級學生共109位受試者,有效樣本(N)為109份,最大值為24,最小值為6,平均 數為17.27,標準差(SD)為4.32。整份試卷Cronbach α係數為0.7759;在效度的 分析上採用效標關聯效度,以94學年度第二學期社會學習領域期末成績為效標,
進行效度分析,採用Pearson積差相關(product-moment correlation)來計算,兩 者相關係數為0.641,p<.01,達顯著相關,顯示兩者之間有顯著相關。
為避免編製的基本學力測驗有利於某一版本,預試施測時特別挑選3所不同 版本的學校進行施測,期望收到更完善的資料進行試題修正與分析。研究以翰 林、康軒及南一三種市佔率最高的版本教科書為變項,進行獨立樣本單因子變異 數分析(one-way ANOVA),分析後所得之變異數分析摘要表(summary of analysis of variance)如表3-4-1。由摘要表的結果得知,使用翰林、南一及康軒之三種版 本教科書進行學習的國小高年級學生,在本測驗之表現並無顯著差異情形,表示 本研究編製之基本學力測驗試卷並不會特別有利於使用某一版本的國小高年級 學生。
表3-4-1 教材版本變異數分析摘要表
變異來源 SS df MS F值 p-value 組間 50.501 2 25.251 1.362 0.261 組內 1964.783 106 18.536
全體 2015.284 108
***p<.001 **p<.01 *p<.05 二、第一次預試資料分析:
本研究在預試後運用SPSS電腦統計套裝軟體來分析預試試卷的各種測驗試 題特性,由其結果初步判斷預試試卷之品質,並根據客觀測驗之編製原則逐條審
視找出試題不佳之部分來修正預試試卷,作為正式施測之試卷。茲將預試試題之 分析結果如表3-4-2,茲說明如下:
表 3-4-2 第一次預試資料
PH PL P D 信度α
試題 通過率 通過率 R/N PH-PL 去除本題後 t 檢定 是否需 要修改 item1 0.79 0.28 0.6239 0.52 0.7635 5.252*** 否 item2 0.91 0.72 0.8440 0.18 0.7766 1.938 是 item3 0.85 0.17 0.6055 0.68 0.7551 7.925*** 否 item4 0.38 0.38 0.3945 0.00 0.7974 0.017 是 item5 0.94 0.34 0.7064 0.60 0.7583 6.276*** 否 item6 0.62 0.34 0.4771 0.28 0.7760 2.468* 否 item7 0.74 0.31 0.5780 0.43 0.7677 4.055*** 否 item8 0.94 0.38 0.7982 0.56 0.7548 5.807*** 否 item9 0.87 0.59 0.7706 0.28 0.7732 2.702* 否 item10 0.60 0.52 0.5688 0.09 0.7877 0.751 是 item11 0.81 0.31 0.6422 0.50 0.7642 4.869*** 否 item12 0.55 0.38 0.4404 0.17 0.7834 1.455 是 item13 0.98 0.66 0.8807 0.33 0.7641 3.551** 否 item14 0.92 0.34 0.6972 0.58 0.7585 5.976*** 否 item15 0.94 0.52 0.8073 0.43 0.7622 4.273*** 否 item16 0.58 0.24 0.4495 0.34 0.7756 3.245** 否 item17 0.87 0.24 0.6239 0.63 0.7607 6.7*** 否 item18 0.91 0.59 0.7982 0.32 0.7656 3.147** 否 item19 0.68 0.24 0.5046 0.44 0.7661 4.13*** 否 item20 1.00 0.72 0.9083 0.28 0.7650 3.266** 否 item21 0.96 0.55 0.8257 0.41 0.7648 4.205*** 否 item22 0.98 0.52 0.7890 0.46 0.7620 4.817*** 否 item23 0.87 0.41 0.6881 0.45 0.7679 4.356*** 否 item24 1.00 0.90 0.9633 0.10 0.7724 1.797 是 item25 1.00 0.62 0.8807 0.38 0.7656 4.137*** 否
***p<.001 **p<.01 *p<.05
(一) 預試試題修正之原則:
一般測驗專家均建議試題難易度約為 0.5 者為佳。但是實際選題時有些 困難。所以有學者主張以 0.4 到 0.8 之間的難易度範圍作為選擇題的挑選標 準(Chase,1978,p.140)。鑑別度的數值一般可接受的最低標準至少要 0.25 以上,低於此一標準即可視為鑑別度不佳或品質不良的試題(Noll,Scannel &
Craig,1979,p.210)。此外參考 Ebel & Frisbie(1991)、Chase (1978)及 余民寧(1997)對鑑別度的看法,並考慮其受猜測度之影響及本測驗目的為 基本能力之測驗故通過率會較高,故以高低分組來進行獨立樣本t 檢定,未 達顯著者進行刪除與修改。當鑑別度 D<0.2 時,且t-test 未達顯著,並參 酌雙向細目表及客觀測驗的編製原則逐題審視,進行修正與刪除。
根據以上對於難易度及鑑別度的標準,本研究預試試題修正的標準如下:
1. 鑑別度 D 過低(<0.25)之試題。
2. 難易度 P 過高(>0.8)或過低(<0.35)之試題。
3. 經 t 檢定後,未達顯著差異水準(p>0.05)之試題。
(二) 試題修正:
依據上述修正標準,預試試題第 2、4、10、12、24 題未全部符合上述 三項標準,應加以修正,參酌雙向細目表及其他社會領域教師之意見,修正 原因分析及修正結果如表 3-3-9。
而第 13 題、第 20 題與第 25 題之難度分別為 0.82、0.86、0.81,雖然 均超過 0.8,但其 t 檢定 p 值均<.01,已達顯著水準,若刪除則降低整體 試卷之信度,故未作修正。
表3-4-3 第一次預試試題修正一覽表
題號 原題目說明 修正後之試題
2 有一位考古學家挖掘出一件約 1000 年前的鐵製 器具,按照上文的說明所表示,這一件鐵器最有 可能是下列哪一個文化的器物?
①長濱文化
有一位考古學家挖掘出 一處遺址,發現以下器 物:製作精細的石器、
類似酒壺的陶容
表3-4-3 第一次預試試題修正一覽表
難度 0.81>0.8,鑑別度 0.18<0.25,鑑別度過 低,t 檢定未達顯著水準。
表3-4-3 第一次預試試題修正一覽表(續1)
整份試卷Cronbach α係數為0.8342。針對各試題進行獨立樣本t檢定與鑑別度分 析,分析結果如表3-4-4,施測結果呈正偏態(如圖3-4-1),在一份成就測驗上,
屬於正常的情形。
本研究在效度的分析上採用效標關聯效度,以94學年度第2學期社會學習領 域期末成績為效標,進行效度分析,採用Pearson 積差相關來計算,兩者相關係 數為0.699,p<0.01,達顯著相關,顯示兩者之間有顯著相關。
表 3-4-4 第二次預試資料
PH PL P D 信度α
試題 通過率 通過率 R/N PH-PL 去除本題後 t 檢定 是否需 要修改 item1 0.63 0.07 0.3762 0.56 0.8293 5.157*** 否 item2 0.89 0.48 0.7327 0.41 0.8320 3.519** 否 item3 1.00 0.56 0.7228 0.44 0.8319 4.561*** 否 item4 0.85 0.26 0.5149 0.59 0.8306 5.356*** 否 item5 0.89 0.22 0.5941 0.67 0.8224 6.523*** 否 item6 0.85 0.22 0.5842 0.63 0.8266 5.871*** 否 item7 1.00 0.22 0.6040 0.78 0.8210 9.539*** 否 item8 1.00 0.48 0.7129 0.52 0.8286 5.292*** 否 item9 0.81 0.41 0.6931 0.40 0.8321 3.317** 否 item10 0.74 0.44 0.5644 0.30 0.8363 2.280* 否 item11 0.93 0.37 0.6832 0.56 0.8272 5.157*** 否 item12 0.89 0.48 0.7228 0.41 0.8316 3.519** 否 item13 0.96 0.70 0.8911 0.26 0.8305 2.675* 否 item14 0.96 0.33 0.6535 0.63 0.8256 6.322*** 否 item15 0.93 0.48 0.7327 0.44 0.8287 4.017*** 否 item16 0.59 0.15 0.2772 0.44 0.8293 3.738*** 否 item17 0.78 0.19 0.4257 0.59 0.8280 5.311*** 否 item18 1.00 0.48 0.8218 0.52 0.8286 5.292*** 否 item19 0.85 0.22 0.5149 0.63 0.8263 5.871*** 否 item20 1.00 0.74 0.9208 0.26 0.8317 3.017** 否 item21 1.00 0.44 0.7525 0.56 0.8251 5.701*** 否 item22 0.96 0.67 0.8614 0.30 0.8306 2.975** 否 item23 1.00 0.37 0.7228 0.63 0.8238 6.648*** 否 item24 1.00 0.56 0.7921 0.48 0.8263 4.561*** 否 item25 0.96 0.44 0.8119 0.48 0.8270 4.596*** 否
***p<.001 **p<.01 *p<.05
TOTAL
25.0 22.5 20.0 17.5 15.0 12.5 10.0 7.5 5.0
TOTAL
次數
30
20
10
0
標準差 = 5.01 平均數 = 16.7 N = 101.00
圖3-4-1 第二次預試分布圖
根據前述試題修正標準,第二次預試之試題除試題16以外,均屬優良試題。
而試題16之難度雖然過低為0.2272,但其鑑別度0.44與t檢定p<0.001仍屬優良 試題,因此,整份試題可做為正式之研究工具。正式施測試卷如附錄三。