• 沒有找到結果。

第三章   科學學習經驗、探究相關好奇心與科學活動的投入對探究能力的影響

第三節  研究方法

以下本節分別就研究對象、探究實作能力評量設計、測量工具以及資料分析 等項度加以論述。用以說明本研究之研究進行概要;並於下列段落分別詳述之。

研究對象與抽樣方法

本研究的抽樣方式係採取二階段的分層隨機抽樣的抽樣設計,分別從臺灣北 區的三所城市(包含台北市、新北市以及基隆市)之 78 所高級中學進行參與學生 的抽樣。第一階段,係從民國101 學年度之基本學力測驗考試百分等級 (Percentile Rank,簡稱 PR 值)分布中,依各校之 PR 值排序後分為 7 個階層;並分別從每一 階層中抽取一至兩校,以求每一階層所抽樣的班級及人數相當且符合理論推估之 預測人數。在第二階段的抽樣中,再從每個受試學校的 11 年級中選取三到四個 班級進行施測。藉由上述的抽樣設計可以透過母群人數比的加權方式,有效地將 本研究的研究結果推估至整個全國高中學生的母群,以消彌抽樣誤差的存在。

藉由上述的抽樣設計共有1,099 名 11 年級的學生參與本研究的施測。其中,

由於本研究的施測資料包含兩個部分,其一為將進行結構方程模式估計之背景問 卷;另一為將以試題反應理論估計之多媒體導向探究能力評量的作答。由於兩份 資料均需轉化成潛在變項以相互比對,故將剔除在背景問卷或多媒體導向探究能

62

力評量兩份資料中有一缺漏的學生。因此,最後進行本研究資料分析的樣本人數 為1,090 位來自臺灣北區的 11 年級學生。

多媒體導向探究能力評量設計 (一) 試題設計(試題內容)

本研究之探究實作能力評量係根據 Kuo 等人 (2015)所發展的科學探究能力 之多媒體導向探究能力評量 (multimedia-based assessment of scientific inquiry abilities,簡稱 MASIA)。該評量發展主要是用以測量中學生探究能力,其中涵蓋 四個探究能力─提出問題、設計實驗、分析資料以及形成解釋四項探究能力;而 其學科內容橫跨四大領域─物理、化學、生物與地科四個學科。除了MASIA 已 具有良好之信度與效度是本研究選取該評量之26 個任務共 101 個試題作為題庫 的原因之一。此外,更重要的因素為,此種多媒體導向的電腦化測驗不僅可以提 供有效的測驗管理與資料處理外,更可以真實的評測到學生所習得之複雜能力,

例如:問題解決能力與探究能力。

MASIA 的多媒體試題主要是以提供豐富的情境任務為主,透過靜態的圖片、

照片與動態的動畫、影片等視覺化的表徵來取代大量的文字描述;並以模擬實驗 的互動操作來讓學生充分的展現其探究實作的能力,藉此呈現學生日常生活周遭 可能遇見的問題情境 (Kuo et al., 2015)。圖 3-3-1 即呈現一試題範例,首先試題 題幹提供月蝕現象的真實情境之描述,並要求學生透過改變模擬相機之光圈大小 與快門速度,來找出影響照片明亮程度的關係並藉此回答相關子題。

63

圖3-3-1 MASIA 之試題範例 (二) 題本設計

為能有效地進行試題的管理與作答的收集,本研究的評量試題採取平衡不完 全區塊設計 (Balanced Incomplete Block,簡稱 BIB),如表 3-3-1 所示。即是將試 題分成不同的複本測驗進行施測,再由等化的過程將測驗成績放置於同ㄧ個量尺 上,以方便進行比較受試者的能力並達到個別受試者能力估計的目的。

首先,將MASIA 題庫中的 26 個任務中的 101 個試題分成六個不同的題群,

即為表中區塊A、區塊 B、區塊 C、區塊 D、區塊 E 以及區塊 F。其中,區塊 A 係以其試題情境的難易程度與當前國中課程內容較為相近者,故無高中學生進行 施測;而區塊F 則是其試題情境的難易程度與當前高中課程內容較為相近者,故 可僅有高中學生進行施測。在區分好六個試題群組後,其次,將適合高中學生進 行作答的區塊B 至區塊 F 之五個題群,依前後區塊方式組合成一個施測的題本。

最終,得到本次測驗之六個題本。而每次進行施測時,則所有受是學生以隨機指

64

派的方式接受一個題本的測驗。

透過BIB 的設計,具有三個優點提供本研究之施測試題的管理與學生作答的 收集。第一,透過不同題本間作為連結之題群重疊設計可以提供試題參數的估計 (Gonzalez & Rutkowski, 2010);第二,藉由不同題本的設計,學生至多只需在 80 分鐘內回答一個題本約40 個試題而毋須回答整個題庫的 101 題,可以節省施測 時間卻具有同等效果;第三,以前後區塊的方式組合題本,讓每一區塊可以同時 出現在題本前後位置,可達到控制試題位置所可能導致的效應存在。例如:可以 避免練習效應而導致後面試題變簡單;或是疲勞效應導致後面試題變難。

表3-3-1 平衡不完全區塊之題本設計

題本編號 題群編號 施測學生人數 11 年級

1 A a B 0

2 B C 219

3 C D 213

4 D E 218

5 E A 0

6 E F a 220

7 F B 220

總數 1090

備註:a題群A 係以其試題情境的難易程度與當前國中課程內容較為相近者,

故無高中學生進行施測;而題群F 則是其試題情境的難易程度與當前高中課程 內容較為相近者,故可僅有高中學生進行施測。

測量工具

本研究的施測流程如下,每名受試學生在進入 MASIA 之線上平台進行探究 能力測驗的作答之前,會被要求先填寫 21 題的背景資料以及科學相關問卷 (見 表3-3-2)。其中除了基本的背景資料外,主要用以搜集受試學生的個人資料;包 括19 題的科學相關問卷(包含探究活動相關的好奇心予科學活動相關投入狀態等 問卷試題),主要是藉這些問卷試題作為測量指標用以搜集本研究所假設之理論

65

模型中的各個潛在變項。此外,由於MASIA 的線上評量之特點,因此受試學生 的探究能力表現可能會受其自身電腦經驗的影響(Scheuermann & Björnsson, 2009)。故本研究另外增加兩題(使用電腦頻率與使用行為)來蒐集學生的電腦經驗;

並做為控制變項以避免可能的干擾效果產生,而影響所估計之各個潛在變項間的 關係。

透過試題反應理論 (item response theory,簡稱 IRT)的估計方式,將受試學生 之背景資料做為背景變項,來校正所估計的學生能力 (M. O. Martin & Mullis, 2012; Mislevy, Johnson, & Muraki, 1992; OECD, 2012);並將問卷所指涉的構念做 為理論模型之潛在變項,來估計這些潛在變項與學生探究實作能力的結構關係。

以下各段落分別描述這些測量工具及其代表之潛在變項。

(一) 探究能力

101 題的 MASIA 主要是設計來評量學生之提出問題、設計實驗、分析資料以 及形成解釋的能力。平均每個題本約46 題 (範圍在 43 題至 50 題之間);每個學 生給予80 分鐘的時間完成其所被指派之題本。雖然每個題本包含所欲量測的探 究能力之題數與內容均不盡相同,但透過平衡不完全區塊(BIB)的題本設計後,

透過試題反應理論 (IRT)的等化過程,可以有效估計所有受試學生的探究能力,

以五個似真值 (plausible values,簡稱 PVs)表示之。

在搜集學生在MASIA 的作答資料後,所有的題本分給八位研究者進行閱卷,

其中包括一次的評分訓練及兩輪的閱卷,取得大於85%的評分者同意度,再進行 後續的閱卷流程。最終,將學生的作答得分以IRT 的估計後,取得代表學生探究 能力的五個似真值。本研究並分別以這五個似真值放入結構方程模式估計中來指 涉學生的探究能力。

(二) 正式科學學習經驗

本研究以一個試題來取得學生科學實驗課的經驗。這個題目主要是用以反映 學生的正式科學學習經驗,其中學生將會被要求以0 次、一周一次、一個月一次 及一學期一次,來回答她/他們在學校中上科學實驗課的頻率。

66

(三) 非正式科學學習經驗

本研究以四個試題來測量學生的非正式科學學習經驗。其中,學生被要求回 答她/他們科學類博物館的次數以及參加科學營隊的次數;以 0 次、一次、兩次 及三次以上表之。其次,學生也被問及平均每週觀看科學性電視節目以及閱讀科 學課外讀物的時間;以1 小時以下、1~2 小時、2~3 小時及 3 小時以上表之。

(四) 科學活動相關的投入

本研究以九個試題來量測學生在實驗課中科學探究活動的參與狀態。主要是 要求學生回答她/他們對參與提出研究問題、配置藥品、領取器材、紀錄數據、參 與討論、動手做實驗、觀察實驗結果以及指揮實驗進行的活動的程度。學生將以 從未(計 1 分)、偶爾(計 2 分)、常常(計 3 分)與總是(計 4 分)的程度來進行自陳其 參與這些活動的程度。

(五) 探究相關的好奇心

本研究以五個試題來檢測學生探究相關的好奇心。藉由所提供的五個陳述讓 學生分別針對從未(計 1 分)、偶爾(計 2 分)、常常(計 3 分)與總是(計 4 分)的程度 來評定她/他們自己在從事科學性的活動時的好奇程度。分別為「我會想知道我提 出的問題是否可行」、「我會想知道實驗為什麼這樣設計」、「我會想知道如何解釋 實驗結果」、「我會想知道實驗結果與預測不符的原因」以及「我會想知道實驗數 據的意義」。

(六) 電腦經驗

本研究以兩個試題來量測學生的電腦經驗。首先,學生先以從未(計 1 分)、

好幾個星期一次(計 2 分)、每星期一次(計 3 分)、每星期 2~3 次(計 4 分)和每天 (計 5 分)的標準來自陳其在校外使用電腦的頻率。其次,她/他們回答是否除了使 用社群網站、線上遊戲以及文書處理三項行為之外,最常使用電腦從事的行為是 網頁瀏覽。本題的計分方式係採是非方式計分,是表1 分;否表 0 分。

67

Infor3 每週平均觀看多少小時的科學性電視節目(如 Discovery 流言終結 者、動物絕技大公開…或Animal World 目睹氣候變遷、傑考溫蠻野

68

作為結構方程模式中重要變項之觀察指標,上述所有試題的峰度指數之絕對 值小於10 以及其偏態指數之絕對值小於 3,均通過常態分佈的考驗 (Kline, 2011)。

因此,根據 Bollen (1989)的建議顯示本研究所搜集之資料適合以最大概似法 (maximum likelihood estimation,簡稱 MLE)的估計法,來估計結構方程中的各參

因此,根據 Bollen (1989)的建議顯示本研究所搜集之資料適合以最大概似法 (maximum likelihood estimation,簡稱 MLE)的估計法,來估計結構方程中的各參

相關文件