第四章 研究成果與討論
第二節 準教學實驗設計
一、描述統計
實驗進行後,將蒐集到學生前測與後測成績的原始資料進行編碼(coding)後 進行描述統計量的分析,結果如表 16 所示:
54
表 16 實驗組與控制組描述統計
組別
前測 後測
平均數 標準差 偏態 峰度 平均數 標準差 偏態 峰度 實驗組
選擇題 5.47 1.775 -0.814 1.131 6.33 1.975 -1.647 3.330 填充題 10.80 4.805 -0.361 -0.100 17.20 5.046 -0.052 -0.895 繪圖題 0.56 0.758 0.954 -0.589 1.53 1.108 -2.068 4.663 控制組
選擇題 5.16 1.823 -0.623 0.451 6.12 1.741 -1.329 2.653 填充題 11.08 4.397 -0.406 0.133 18.08 4.079 0.610 -0.905 繪圖題 0.53 0.796 1.187 0.108 0.80 0.877 -2.429 8.128
由表 16 可以看出在實驗組學生在選擇題前測平均得分為 5.47 分,標準差 為 1.775,而控制組學生前測平均得分為 5.16 分,標準差為 1.823,兩組學生在 平均得分上相差不大,實驗組學生略高於控制組學生且變異情形也不大,控制 組學生變異稍大於實驗組。在選擇題後測成績上實驗組學生的後測平均得分為 6.33 分,標準差為 1.975,而控制組學生前測平均得分為 6.12 分,標準差為 1.741,兩組學生在平均得分上相差不大,實驗組學生仍略高於控制組而變異情 形為實驗組學生大於控制組,因此在選擇題上可以看出兩組學生的平均得分有 增加。實驗組學生分數在前後測中都略高於控制組學生,但是有無顯著差異仍 待進一步推論統計的驗證。
表 16 可以看出在實驗組學生在填充題前測平均得分為 10.8 分,標準差為 4.805,而控制組學生前測平均得分為 11.08 分,標準差為 4.397,兩組學生在平 均得分上相差不大,控制組學生略高於實驗組學生且變異情形也不大,實驗組
55
學生變異稍大於控制組。在填充題後測成績上實驗組學生的後測平均得分為 17.20 分,標準差為 5.046,而控制組學生前測平均得分為 18.08 分,標準差為 4.079,兩組學生在平均得分上相差不大,控制組學生仍略高於實驗組而變異情 形為實驗組學生大於控制組。因此在填充題上可以看出兩組學生的平均得分有 增加,控制組學生分數在前後測中都略高於實驗組,但是否有顯著差仍待進一 步推論統計的驗證。再者,在填充題上兩者學生的變異情形都高於選擇題及繪 圖題,。
表 16 可以看出在實驗組學生在繪圖題前測平均得分為 0.56 分,標準差為 0.758,而控制組學生前測平均得分為 0.53 分,標準差為 0.796,兩組學生在平 均得分上相差只有些微 0.03 分,實驗組學生略高於控制組學生且兩組學生變異 情形雷同且變異不大,控制組學生變異稍大於實驗組學生。在繪圖題後測成績 上實驗組學生的後測平均得分為 1.53 分,標準差為 1.108,而控制組學生前測 平均得分為 0.8 分,標準差為 0.877,兩組學生在平均得分上相差較大,實驗組 學生明顯高於控制組而變異情形為實驗組學生略大於控制組。因此在繪圖題上 可以看出兩組學生的平均得分皆有增加的趨勢,實驗組學生分數在前後測中都 略高於控制組學生,但是否有顯著差仍待進一步推論統計的驗證。再者,在繪 圖題上兩者學生的變異情形都小於選擇題及填充題。
從偏態與峰度的面向來討論,依照表 17 的檢驗標準,在選擇題上,實驗組 學生的前後測成績在偏態皆為負偏態即大多數學生成績偏向高分。在峰度上皆 為高狹峰即集中在眾數附近的分數較多,分散於兩側較少,控制組學生亦同。
在填充題上,實驗組學生的前後測成績在偏態皆為負偏態即大多數學生成績偏 向高分,但後測成績接近對稱。在峰度上皆為接近低闊峰即集中在眾數附近的 分數較少,分散於兩側較多,控制組學生在偏態上前測成績屬於負偏態,但後 測成績則為正偏態接近對稱,而在峰度上前測成績接近對稱,後測成績則為低 闊峰。在繪圖題上,實驗組學生的前測成績在偏態上屬於正偏態即大多屬學生
56
屬於低分群,在後測成績則為負偏態即在低分群為少數偏離值。在峰度上前測 成績屬於低闊峰學生分數不集中在眾數,在後測成績上則為高狹峰即大多數學 生成績集中於眾數而非分散,控制組學生在偏態上和實驗組學生相同,在峰度 上前測成績接近對稱,而後測成績也為高狹峰,由於兩組學生在繪圖題前測成 績上都屬於正偏態即可能有地板效應,而峰度上雖然不同但差異不大(接近 0)且 大多屬於低分群。
表 17 偏態與峰度的檢驗標準
偏態 判斷準則 峰度 判斷準則
正偏態 >0 高狹峰 >0 負偏態 <0 低闊峰 <0
對稱 =0 常態峰 =0
二、二因子混合設計變異數分析(two-way ANVOVA mixed design)
上述描述統計討論後,本研究進一步進行推論統計的部分,在進行二因子 混合設計變異數分析前,先對兩組學生在三類題型(選擇題、填充題與繪圖題) 在前測成績上是否同質來做檢驗以確保適用於後續分析。因此以兩組學生在天 氣系統三類題型的前測成績作為檢定的變項,而以組別為分組變數進行獨立樣 本 T 檢定,如摘要表(表 18)所示,兩組學生在變異數相等的 Levene 檢定中選擇 題(Levene=0.22,p=0.881>0.05)、填充題(Levene=0.532, p=0.467> 0.05)、繪圖題 (Levene=0.072,p=0.789>0.05)並未顯著,表示三類型題樣本的離散情形並無明顯 差異,未違反 T 檢定中變異數同質性的假設。由 T 值與顯著性發現兩組學生在 選擇題(t(169)=1.137,n.s.)、填充題(t(169)=-0.391,n.s.)與繪圖題(t(169)=0.186,n.s.)上考 驗結果未達顯著,表示兩組學生在三類題型的前測成績上並無明顯差異,因此 可以推論兩組學生有相同的起點行為,可進一步進行後續統計分析。
57
表 18 實驗組與控制組前測成績獨立樣本 T 檢定分析摘要表
接著進行二因子混合設計變異數分析,分別就三類題型(選擇題、填充題、
繪圖題),考驗實驗組學生和控制組學生在天氣系統測驗中得分的改變情形並就 統計結果討論之,先探討兩因子間的交互作用,若顯著則可探討單純主要效 果,若不顯著則探討主要效果(圖 16)。
進行相依樣本變異數分析時通常需進行 Mauchly 球形假設的檢定,即相依 樣本在依變項上的得分兩兩配對相差的差,其變異必須同質,但由於本研究受 試者內因子只有兩組即前測與後測因此不會有變異不同質的問題,故以下分析 時可不必進行球形檢定與後續修正。
前測成績
變異數相等的 Levene 檢定 平均數相等的 t 檢定 F 檢定 顯著性 T 檢定 自由度 顯著性 選擇題 0.22 0.881 1.137 169 0.257 填充題 0.532 0.467 -0.391 169 0.696 繪圖題 0.072 0.789 0.186 169 0.852
58
(一) 選擇題
以天氣系統測驗選擇題前後測成績為受試者內因子,不同教學方式即組別 作為受試者間因子進行二因子混合設計共變數分析,分析結果如表 19 所示,交 互作用(interaction effect)F(1,169)= 0.157,P=0.693>0.05,未達顯著,因此無須進 行單純主要效果分析,但須進一步就兩個獨變項之主要效果(main effect)是否顯 著加以探究。
兩個獨變項主要效果(main effect)的分析,受試者間設計獨變項(教學方式) 並未達到顯著,F(1,169)=1.116,P=0.292>0.05,顯示不同的教學方式與學生在天 氣系統測驗選擇題上的前後測成績並沒有關係;然而受試者內設計的兩個相依 樣本平均數差異達顯著水準 F(1,169)=50.063,P<0.001,表示在不同測量的時段 (前測、後測)下,兩組學生在天氣系統測驗選擇題上的成績確有所不同。可推 斷實驗組學生與控制組學生在經過不論哪一種教學方式後選擇題成績都有顯著 地差異,而由表 16 描述統計量的平均數中看出其變化的趨勢為分數進步。
二因子混合實驗 設計
交互作用
單純主要效果
主要效果 顯著
不顯著
圖 16 二因子混合設計決策圖
59
若從剖面圖來觀察兩個獨變項的交互作用(interaction effect),亦可發現教學 方式與前後測的線段上無明顯的交叉或非平行線段;而從剖面圖來判斷主要效 果發現受試者內因子(前後測)在兩組平均數上有差異即有主要效果(main effect),而受試者間因子(教學方式)在兩組平均數上差異不大即主要效果(main effect)不顯著(圖 17)。
進一步探討教學方式在選擇題成績沒有顯著差異的原因,首先分析資料組 成進行對變異數分析的基本假設做檢定,由表 20 發現,對選擇題的前測成績與 後測成績進行 Kolmogorov-Smirnov 檢定,當 K-S 統計量達顯著水準時,即 P<0.05,達顯著,表示獨立樣本違反常態分配的假設並不符合常態分配,選擇 題成績在前後測皆不符合常態分配。搭配表 16 描述統計量的結果討論,從選擇 題成績在偏態與峰度的上可以看出兩組學生大多屬於右偏態與高闊峰,表示學 生在選擇題得答分皆偏高且離散程度較少,因此可能出現天花板效應(ceiling effect),學生的分數無法突破高端,這可能和試題本身的難度(通過率)與鑑別度 有關,因此未來需做進一步的項目分析來探討原因。另一方面從測量工具面討 論,選擇題的題型來自於書商的題庫光碟,測驗的內容較符合現有教科書式的 授課方式,故出題的內容較偏向傳統講授式教學法的內容,可能無法實際測驗 出本研究欲探討空間思考的能力,因此表面效度不彰。
針對選擇題的前測與後測題目進行逐題的試題項目分析以量性方式檢驗試 題的適當性,以下依據「題目通過率」、「題目高低分組獨立樣本 T 檢定」、「修 正後題目與總分之相關」、「刪除該題後的信度值」做討論,其中前三項討論較 為重要。「題目通過率」中,若該題大於 75%或小於 25%,則為不良指標;「題 目高低分組獨立樣本 T 檢定」,總分前 25%受試者的得分為高分組,而後 25%
受試者的得分為低分組,比較高分組與低分組在每個題目的得分是否有差異,
若顯著性高於 0.05 則未達顯著水準,應列為不良指標;「修正後題目與總分之 相關」上若該題目與總分的相關係數小於 0.300,則列為不良指標。從分析的結
60
果來看(表 21、22),其中第 4 題、第 7 題與第 8 題的不良指標都在 2 個以上,
因此可能為不適當的題目會影響到實驗結果,但僅有第 4 題在前後測中不良指 標都未達標準,因此其他題目仍具有測驗力。
因此可能為不適當的題目會影響到實驗結果,但僅有第 4 題在前後測中不良指 標都未達標準,因此其他題目仍具有測驗力。