第貳章 文獻探討
本 章 分 成 四 節 , 第 一 節 介 紹 國 際 教 育 成 就 調 查 委 員 會 成 立 的 目 的 與 演 進,第二節敘述 第三次國際數學與科學教育成就研究後續調查,第三節為學 生特質與學習成就的相關研究 ,第四節為文化差異相關研究。
第一節 國際教育成就調查委員會成立的目的與演進
國際教科文組織( UNESCO)會議在 1950 年代時常討論各國教育相關的議 題,鑑於當時各國比較教育仍多為描述性研究,與會歐美學者認為有需要對 各國教育進行量化的比較研究,因此國際教育成就調查委員會在學者們的推 動下,於 1959 正式成立(Husen,1975) ,這是一個獨立的、國際合作研究機 構,主要進行與學校有關的國際合作研究,也接受 IEA 會員委託執行特定的 研究案,至 2002 年共舉辦過 20 個大規模的跨國研究(詳見附錄一) ,參與合 作的國家可藉此 研究來分析探討個別國家裡面的教育 政策或特定主題,使各 國對其本身教育 體制、各國教育特色、各國文化差異進一步理解,更可藉由 週 期 性 參 與 國 際 評 量 來 對 國 家 長 時 間 努 力 改 革 的 政 策 成 效 進 行 評 估 (IEA, 2003;Postlethwaite & Wiley, 1992;戴曉霞,1995) 。
IEA 是一個非營利性的學術法人組織,目前由 58 個國家或代表國家的單
位組成,比利時提供其法人的身份,享有捐款和募款免稅的優惠,IEA 的執
行秘書處設在荷蘭阿姆斯特丹,負責規劃合作研究案與財務管理,實際進行
研究時則視需求分別與各單位合作,包括 與加拿大國家統計局(Statistics
Canada) 、德國資料處理中心(Data Processing Center,簡稱 DPC) 、美國 教育測驗服務局(Educational Testing Service,簡稱 ETS) 、美國波士頓 學院國際研究中心(International Study Center, Boston College,簡稱 ISC) 、英國國家教育研究基金會( the National Foundation for Educational Research )及各種國際合作中心等研究機構共同進行各種計畫(詳見附錄 二) 。
IEA 成立之初(1959-1967 年)即舉辦的第一次國際數學教育成就調查
(First International Mathematics Study) ,有 12 個國家,約五千所學校 參 與 ; 研 究 結 果 顯 示 國 家 之 間 的 差 異 直 接 與 各 國 對 主 題 的 強 調 程 度 有 關
(Walker, 1976) 。第一次國際科學教育成就調查即是包含在 1966 年 IEA 開 始執行六個大型調查計畫(包括科學、閱讀、文學、英語、法語、公民教育) , 為教育提供了三個方面的實驗證據:(1)說明社會經濟和教學因素與學校、
國家之間、和學生之間成就差異的關係,對不同開發程度國家的多樣分析,
促進我們對學校資源和教學法與社會經濟結構間交互影響的瞭解;從 IEA 研 究結果顯示非學術上的因素對學生、學校、國家之間有相當比例的影響; (2)
工業國家長期以來對學校組織結構有困擾,藉由 IEA 的研究結果提供有關教 育體制衍生的偏差訊息給制訂政策者,使得學校組織結構問題得到答案; (3)
IEA 的 調 查 設 計 包 含 了 變 數 和 統 計 分 析 , 可 以 確 認 和 評 估 較 重 要 的 影 響 因
素,這在解釋成就差異上扮演策略性的角色( Husen,1975) 。其中科學成就調
查結果顯示,學生家庭背景對學生的科學成就具有 11%的預測能力;具體提
供學校對學習成就影響的資料,擺脫以往不證自明的說法;各國男生的科學
成 就 比 女 生 好 , 約 有 2 % 的 變 異 量 , 也 引 起 重 視 社 會 上 兩 性 不 平 等 的 議 題
(Comber & Keeves, 1973;Walker, 1976) 。
由於沒有單一因素可以完整解釋學生成就的高低,教育系統中的每個步 驟,包括課程、家庭和學校資源充裕性和適當性、學生學習動機、教學的有 效性、父母親的教育程度、老師素質和學校行政支援等都與學生的成就有關,
IEA 於 1980-1989 年再進行第二次國際性的數學和科學學習成就調查(Second International Mathematics Study ,簡稱 SIMS 和 Second International Science Study,簡稱 SISS) ,希望定期進行國際評量,來瞭解各國學生數學 和科學成就成長情形 ( Postlethwaite & Wiley, 1992 ;Rosier & Keeves, 1991;Schmidt et al., 1999)。IEA 為了收集有效的各國學生成就資料,
從發展評量的架構著手,除提供各國分析比較的參考之外,在比較教育研究 發展上,對檢驗資料和分析資料的理論發展幫助極 大 (Keeves, 1992)。
歷經三十年來從事國際性測驗的經驗,IEA 自 1990 年開始推動「第三次
國 際 數 學 與 科 學 教 育 成 就 研 究 」 (Third International Mathematics and
Science Study, 簡稱 TIMSS 或 TIMSS 1995),重點在比較各國學生的數學和
科學成就及其影響因素(Robitaille et al.,1993)。自 1990 至 1993 年先
進 行 課 程 分 析 、 調 查 項 目 及 測 驗 工 具 發 展 、 取 樣 設 計 、 試 測 等 研 究 工 作 ,
1994-1995 年正式進行調查工作,共 有 41 個國家參與這個調查,延續以往 IEA
抽樣對象分 9 歲群(包含國小三年級和四年級) 、13 歲群(包含國中一年級
和二年級)、和高中最後一年學生等三個族群進行調查,超過 50 萬名學生參
加測驗,但是成績分成五個年級進行統計比較:國小三年級和四年級、國中
一年級和二年級、高中三年級,但是有些國家沒依照國際規定進行抽測與輸
入資料,或出席率不足,因此未列入排名(Beaton et al.,1996 ) 。
TIMSS 研究有三個重點工作:(1)深度分析數學和科學課程;(2)根據教 師自我報告資料來研究教學實施情形;(3)評量學生對課程的精熟情 形以及學 生 的 學 習 態 度 , 在 這 個 測 驗 中 每 個 國 家 可 以 決 定 他 們 自 己 所 希 望 強 調 的 目 標,但是對許多參與的國家而言,他們感興趣的是希望測驗結果能夠反應出 該國的科學素養(Robitaille, 1993)。
緊接著 TIMSS 1995 調查之後,由於很多國家希望能夠追蹤 1995 年 9 歲 群學生成長至 13 歲時的成就,以便瞭解其國家學生從小學到國中成長期間對 科學和數學學習態度和成就是否改變,或是定期評估他們 13 歲群學生的學習 成就,於是 IEA 開始推動 1999 年對 13 歲群舉行後續調查,稱為 TIMSS-REPEAT
(簡寫成 TIMSS-R) ,或稱為 TIMSS 1999(Martin et al.,2000a) 。IEA 在每 次調查中加入前一次調查測驗使用過但未公開的試題,作為前後兩次測驗比 對分析用,這些試題稱為「趨勢試題」 ,也因此 IEA 開始進行〝趨勢研究〞 。 TIMSS 1999 趨勢分析結果,23 個趨勢研究國家學生整體平均科學成就分數在 TIMSS 1995 是 518 分,在 TIMSS 1999 是 521 分,雖然提高 3 分,但在統計 上沒有顯著差異;但有些國家的平均科學成就分數提高,有些則降低(Martin et al.,2000a) 。
繼 TIMSS 1999 調查之後,IEA 認為趨勢研究對各國教育長期監控具有極 高的意義,因此以 TIMSS 1995 和 1999 的經驗,規劃未來持續進行趨勢調查,
目 前 正 在 進 行 的 調 查 稱 為 「 國 際 數 學 與 科 學 教 育 成 就 趨 勢 調 查 2003 」
(Trends in Mathematics and Science Study 2003 ,簡稱 TIMSS 2003) ,
13 歲群有 51 個國家或地方參與,其中有 37 個國家曾參加 TIMSS 1999 調查,
有 21 個國家參加 TIMSS 1995、1999 和 2003 的三次調查;9 歲群有 27 個國 家或地方參與,有 16 個國家曾參加 TIMSS 1995 調查(IEA, 2003) 。TIMSS 趨勢調查的特色包括採用相同的調查模式進行抽樣和施測程序,採用試題反 應理論(Item Response Theory,簡稱 IRT)來估算學生成績,調查工具中 採用趨勢試題與問卷題目作為定錨,以便與過去的調查結果進行比對,比對 的結果呈現的是 TIMSS 1995 和 2003、TIMSS 1999 和 2003 之間的差異。預計 2004 年 12 月國際調查結果將出爐(TIMSS 2003 Survey Operations Manual, 2002) 。
IEA 除了進行數學和科學成就調查研究之外,也受委託進行教室環境、
作文、閱讀能力、資訊能力、教學實施、公民素養、學前教育等方面的研究,
建立龐大的資料庫與出版研究成果,提供給教育決策者與研究人員豐富且寶 貴的參考資料(IEA, 2003) 。
第二節 第三次國際數學與科學教育成就研究後續調查
一、 組織分工
IEA 執行 TIMSS 1999 時的分工情形與合作單位有(TIMSS -R Main Survey Operations Manual, 1998;Martin et al., 2000b):(一)IEA 秘書處; (二)
美國波士頓學院國際研究中心; (三)加拿大國家統計局;(四)德國漢堡的
資料處理中心;(五)各國國家研究協調人。分述如下:
(一) IEA 秘書處
由於各國家參與調查所使用的語言不同,各國需先翻譯調查工具,為了 確認測驗題本及問卷翻譯之後與原英文版的測驗題本及問卷一致, IEA 由秘 書處辦理測驗工具確認與修改工作,並監督美國波士頓學院國際研究中心和 各分工單位執行進度、調查過程的品質和公布國際調查結果(TIMSS-R Main Survey Operations Manual, 1998;Martin et al., 2000b) 。
(二) 美國波士頓學院國際研究中心
美國波士頓學院國際研究中心接受 IEA 委託負責協調各分工單位來執行 調查,定期召開國家研究協調人(National Research Coordinator,簡稱 NRC)會議,組織測驗工具發展小組發展測驗架構、收集和開發試題,在 1998 年先舉辦試測(Field Test)來檢核新開發的調查工具的有效性與適用性,然 後進行修正調查工具使其更能符合目標。完成實測調查工具編製與各國完成 工具翻譯後,各國舉行正式測驗(Main Survey) ,國際研究中心需監督各國 的 執 行 進 度 , 分 析 國 際 調 查 結 果 和 撰 寫 國 際 報 告 ( TIMSS-R Main Survey Operations Manual, 1998;Martin et al., 2000b) 。
(三) 加拿大國家統計局
加拿大國家統計局負責執行和協助各國進行抽樣工作,首先由各國將受
測年級的全體學校資料送至加拿大國家統計局,根據 各國國家研究協調人提
供的分層抽樣因素和排除受測學校類型或區域來制訂抽樣計劃。然後由加拿
大統計局依據分層隨機抽樣,抽出受測學校名單與候補學校名單交給各國國
家研究協調人 。各國再根據統計局規定的抽樣方法和 W3S ( Within School Sampling Software)電腦軟體進行學校內的班級抽樣或學生抽樣,並建立學 生 追 蹤 表 和 教 師 追 蹤 表 , 作 為 施 測 名 單 和 記 錄 學 生 、 老 師 是 否 完 成 調 查 用
(TIMSS-R Main Survey Operations Manual, 1998;Martin et al., 2000b) 。
調查執行後,各國將各校教師和學生參與調查的紀錄資料表和 W3S 電腦 資 料 檔 交 回 給 加 拿 大 國 家 統 計 局 , 由 其 檢 視 各 國 抽 樣 過 程 是 否 符 合 國 際 要 求,並計算各個學校和學生的各項抽樣因素加權值,作為估算學生測驗成績 用(TIMSS-R Main Survey Operations Manual, 1998) 。
(四) 德國漢堡的資料處理中心
德國漢堡的資料處理中心負責開發紀錄各國班級或學生抽樣的 W3S 電腦 軟體,與測驗後各國需將學生測驗和問卷、教師問卷、學校問卷等資料輸入 電腦的 DEM(Data Entry Mangager)軟體。資料處理中心收到各國的調查資料 後,開始檢查各國數據,包括各國調查工具中的國際選項處理、重複輸入和 資料間不一致的問題,經與各國聯繫修正資料後,將資料送至美國波士頓學 院 國 際 研 究 中 心 確 認 , 然 後 配 合 各 項 因 素 加 權 值 開 始 分 析 ( TIMSS-R Main Survey Operations Manual, 1998;Martin et al., 2000b) 。
(五) 國家研究協調人
各國國家研究協調人負責在其國家申請經費參加調查研究,並定期參加
由美國波士頓學院國際研究中心召開之國家研究協調人會議;與加拿大統計
局配合,共同制訂抽樣計畫;聯繫受測學校收集班級資料,進行學校內受測
班級抽樣;非英語系國家需翻譯調查工具,待經過 IEA 秘書處確認後才可印 製測驗調查工具;配合國際調查時程執行調查,確保各個受測班級的出席率 需達到 90%;完成調查之後將所有調查資料輸入電腦,送交德國資料處理中 心,協助資料處理中心修正資料;對國際報告提供修正意見(TIMSS-R Main Survey Operations Manual, 1998;Martin et al., 2000b) 。
二、 調查架構
TIMSS 1999 的研究目的是想要追蹤在 TIMSS 1995 是國小四年級的學生 到了 1999 年升上國中二年級時的學習成就表現,因此重複進行 TIMSS 1995 研究調查,而 TIMSS 1999 研究的主要概念是源自於 TIMSS 1995 課程的模型,
如圖一(Robitaille, 1993)所示。TIMSS 1995 的研究重點是想要提供一個 由許多課程縮減出來的課程架構,讓各國用這個課程來檢驗他們自己國家的 課 程 , 探 討 課 程 因 素 對 學 生 成 就 的 影 響 情 形 , TIMSS 課 程 包 括 三 種 層 次
(Robitaille, 1993;Robitaille & Garden, 1996;Martin,et al., 2000) :
(1) 規劃的課程(intended curriculum)——是由國家或教育主管單
位所制訂的課程內容,用來說明社會希望教的和學習的目標是什
麼,這些目標通常反映著社會文化、理想、期望、價值觀和社會
資源;規劃課程時自然也受限於當時的學校形式、教學分配、財
力、師資等各方面的因素(Robitaille, 1993)。有些國家規劃的
課程包括很詳細的目標、內容主題、時間分配、教法與評量方式
等 , 有 些 國 家 只 是 一 些 建 議 與 指 引 , 並 無 強 制 規 範 ( Rosier &
Keeves, 1991) 。一般來說,我們可以從課程標準或課程大綱(指 引) 、教科書、教學指引等得知規劃的課程的內容。
圖一 TIMSS 認為主要影響學生成就的三方面課程模式(譯自 Robitaille, 1993,第 26 頁) 。
(2) 執行的課程(implemented curric ulum)—— 是在教室中實際教 學的主題和教學的過程。教室中的教學通常由老師所決定,除了 規劃的課程指引老師之外,老師的行為可能常被他自己所受的教 育、訓練和經驗所影響。另外學校的特質、組織的結構、教師之 間交互作用、社區資源、家長參與和師生之間的交互作用都會影 響執行的課程,而執行的課程成果即是學生達到的課程( Rosier &
Keeves, 1991;Robitaille, 1993)。
(3) 達到的課程(attained curriculum)——學生實際上學習到的課 達到的
課程
個人背景
規劃的 課程
執行的 課程
當地社區
社會理想
程,也就是學生在知識、情意、技能方面學習的成果。雖 然學生 成就與規劃的課程、執行的課程有關,但是在大部分的情況下學 生個別的特質,包括能力、態度、興趣、努力等對學生成就影響 更大。這些學生個人特質的養成與其家庭和社會背景有極密切的 關係,因此要探討學生成就因素時,對其家庭背景、周圍親友、
社 會 背 景 應 該 要 一 併 考 慮 ( Robitaille, 1993 ; Robitaille &
Garden, 1996;Martin,et al., 2000b) 。
TIMSS 1995 的測驗架構希望從學習內容(content)來瞭解學生在學習 數學和科學過程中所得到哪些學科知識和概念,從期待 表 現 (performance expectations)來瞭解學生是否能夠理解與運用已經學過的知識和技能,從 觀點與立場(perspectives)來瞭解學生學習習慣、態度或看法,以及學生 對未來的期望。在此架構下制訂完整的架構細目,用以架構發展測驗和問卷 內容,來研究學生成就和學生自己的特性、教材、老師的教學方法、教室和 學校資源等關係。TIMSS 1999 採用 TIMSS 1995 的測驗架構,然後稍做修改,
評量架構主要分類如表一所示。針對這些因素,TIMSS 測驗發展了不同的工 具,調查三個不同層次的課程,說明如下(Martin,et al., 2000b;Garden &
Smith, 2000):
(1) 課程問卷:由各國國家研究協調人負責填寫,主要調查各國規劃 的課程,包括入學年齡、有無統一的課程標準,各國各年級數學 和科學授課占上課時間的百分比、課程主題強調的情形等。
(2) 學生問卷、教師問卷、學校問卷:用來收集執行的課程方面的資
料,包括教室中實際上被教的東西與教學進行方式。由學生填寫 學生問卷、受測學生的數學和科學老師填寫教師問卷、校長填寫 學校問卷,提供關於教學主題、教師教學方法、行政支援等相關 訊息。
(3) 學生成就測驗和學生問卷:藉由全國性抽測學生數學和科學成就 結 果 來 檢 視 達 到 的 課 程 。 學 生 成 就 測 驗 是 由 各 國 專 家 共 同 發 展 的,涵蓋範圍廣泛的數學和科學學科主題與外在表現主題。學生 問卷中同時提供有關學生態度、經驗、信念、期望、家庭等有關 學習資料,對研究達到的課程和學生所形成的特性提供了重要的 資訊。
表 一 TIMSS 1999 評 量 架 構 主 要 分 類 ( 譯 自 TIMSS 1999 International Science Report,第 346 頁) 。
學科 內容 期待表現 觀點與立場
l 科學 l 地球科學 l 理解的 l 態度
l 生命科學 l 建立理論、分析、解決
問題 l 生涯事業
l 自然科學 l 使用工具、例行程序及 科學過程
l
參與
l 科學、技術和數學 l 探究自然世界 l 增加興趣 l 科學和技術的歷史 l 溝通的 l 安全l 環境和資源議題 l 心智習慣
l 科學本質
l 科學和其他的學科
三、 成就測驗設計
TIMSS 1995 在發展調查工具時,由美國波士頓學院的國際研究中心負責 組織調查工具開發審查小組,根據測驗架構發展成就測驗的內容架構問卷,
由參與的國家對每一學科概念內容填寫其國家課程的涵蓋情形,原則上所選 定的主題概念在各國課程涵蓋率約達到 70%,再由各國和調查工具開發小組 開發和蒐集試題,然後編製試測的調查工具,進行試測檢核新開發試題的難 易度與適用性。調查工具開發小組根據各國試測結果來選定試題,編製成實 測的調查工具。
TIMSS 1995 完成測驗之後,將大約三分之二的試題公開,而其餘約三分 之一的試題保留沒有公開,成為未來趨勢研究使用的趨勢試題。因此 TIMSS 1999 測驗發展的一個重要部份,便是由一群國際數學和科學教育家發展了 300 多題與 TIMSS 1995 已經公開的測驗試題具有相似內容、格式、和難易度 的替代試題。最後有 114 題數學和 98 題科學試題被選用在 TIMSS 1999 測驗 中當做替代試題(附錄三和附錄四)。TIMSS 1999 測驗數學方面的內容涵蓋 分數與數感、測量、資料呈現分析與機率、幾何、代數等領域計有 162 題(不 計子題);科學方面的內容涵蓋地球科學、生命科學、物理、化學、環境與 資源議題、科學探究與科學本質等領域計有 146 題科學試題(不計子題)
(Garden & Smith, 2000)。
TIMSS 1999 全部的試題共有 308 題(不計子題),分成 26 個群組,用英
文字母 A 到 Z 來標示群組編號,這 26 個群組試題又可以分成五類:(1) 核心
群組;(2) 重點群組;(3) 數學和科學固定群組;(4) 數學自由反應群組;
(5) 科學自由反應群組(詳見附錄五) 。這五類群組的劃分是依照所需的測驗 時間和主題來設計,最後由這五類群組交互編製成八本測驗題本,每一題本 所含的群組與群組的順序詳見附錄六。配合抽樣的設計,每個受測班級以測 驗題本一至測驗題本八循序分派給學生填答,每位學生只需要作答一份測驗 題本(Martin, et al., 2000b;TIMSS-R Main Survey Operations Manual, 1998) 。
答題的型態可分為選擇題(單選) 、填充題和問答題,其中填充題和問答 題等非選擇題測驗部分稱為自由反應試題 。計算得分時,選擇題每題之得分 為一分;自由反應試題需經由人工閱卷來判讀學生的得分,有些自由反應試 題得分為一分,但有些自由反應試題題目含有子題或需要回答超過一個以上 的答案,得分是二分。自由反應試題得分計分方式是利用兩位數字〝XX〞的 評分碼來表示,因此各種正確或合理的答案可得滿分或部分得分。其中第一 碼等於〝1〞時表示該題得分為一分,即 1X(X=1,2,3,…9) ,包括 10、11、
12、13、14、…19 等正確的評分碼。當第一碼等於〝2〞時表示該題得分為
二分,即 2X(X=1,2,3,…9) ,包括 20、21、22、23、24、…29 等正確的評
分碼。當第一碼等於〝7〞時,7X(X=1,2,3,…8)評分碼表示該題答案錯誤
得分為 0,錯誤答案類型包括 70、71、72、73、74、…78 等答案。79 用來表
示非評分標準指引所標示的其他不正確答案(包含刪掉/擦掉,塗鴉,難以辨
認或無效的嘗試)。評分碼 99 用來表示空白沒有作答。TIMSS 測驗提供每一
自由反應試題閱卷之標準評分碼以及空白評分碼,各國於閱卷過程中可以視
其需要增加評分碼及其標準,然後將增訂部分之資料送交 DPC 和 ISC。試題
和評分碼的設計與開發,需經過試測來收集各國學生對各個試題的答案,修
正試題和評分碼後,才完成測驗試題與閱卷的評分標準的開發(Martin, et al., 2000b) 。
四、 問卷內容
TIMSS 的問卷設計源自美國數學和科學機會調查計畫(The Survey of Mathematics and Science Opportunities ,簡稱 SMSO) ,這個計畫希望找 出可能影響學生學習成就的所有因素,同時藉由調查資料來建構一個學生教 育經驗模式。TIMSS 在發展調查工具時即是參考 SMSO 調查的結果,因此問卷 內容包含非常廣泛,可以用來研究學生、教師和學校特性,進而可以利用從 學生、教師和學校收集到的資料,來解釋造成不同國家學生的數學和科學成 就差異的原因(Martin, et al., 2000b) 。
所以 TIMSS 針對教育制度、學校、教室、和學生四個教育層次分別發展 問卷。先根據過去的研究成果為基礎,從建立與問卷目的有關的概念架構或 模式開始,然後在不同國家進行試測與訪談,由收集到的資料不斷修改原來 設計的問卷架構,最後得到圖二的問卷概念架構。也就是由四個 TIMSS 研究 的核心問題所架構: (1)學生應該學什麼? (2) 誰負責教學活動? (3)如何組 織教學活動? (4) 學生學到什麼?(Martin & Kelly, 1996) 。
TIMSS 1999 的問卷發展主要是保留 TIMSS 1995 分析中被認為最有價值
的部份,然後再根據各國專家提供的意見進行修訂問卷。因此 TIMSS 1999
也是採用課程、學校、教師、學生四種問卷來收集各國的教育制度等背景資
料(Martin et al., 2000b) 。其中各國可根據其需要來決定是否調查「國際 選項」部分。四種問卷之主要內容如下(Mullis, et al., 2001;TIMSS-R Main Survey Operations Manual, 1998):
(一) 課程問卷:
l 指出是否有國家級和地區級的課程標準以及課程是否 修訂中。
l 提供關於課程的資訊。
l 提供學習成就標準資訊。
l 指出用來支持與 檢測國家課程落實的步驟 l 提供是否有國家 級考試的資訊。
l 指出在那一個年級學科首先由 專門教師教 授。
l 指出 4、6 和 8 年級課程標準中的教學時數。
l 指出課程的組織結構。
l 提供是否設計不同能力水準的學生課程的資訊。
l 指出課程強調的 方法和程序。
l 指出 8 年級使用電腦的政策。
l 指出學生學過科 學各領域主題的百分比。
l 指出學生學過數學各領域主題的百分比。
(二) 學校問卷:
l 指出學校的位置。
l 說明學校的教職員比例。
l 說明一般情形下學生由同一教師授課的年限。
l 指出學校是否有 促進教師合作和合作的政策。
l 指出校長花在各種事務的時間 。 l 指出學校各種決 策的負責人。
l 指出學校中個人 或團體對課程決策的影響力。
l 指出是否有學校級的數學和科學課程標準、教材存在。
l 指出學校的各項設備資源是否影響教學。
l 提供學生人數和 出席、班級大小等資料。
l 提供學生和教師可使用的電腦 數量、是否使 用網際網路的資訊。
圖二 TIMSS 的問卷架構(譯自 Martin & Kelly, 1996,第 5 之 10 頁)。
l 說明學校常見學 生不良行為的 頻率。
l 依照學校行事曆說明受測年級教學總日數和每週時數。
l 說明學校是否對 不同數學和科學能力學生 有特別課程與措施。
l 學生入學條件。【國際選項】
l 說明學校期望父母參加的活動類型。【國際選項】
(三) 教師問卷:
l 性別、年齡範圍和教學年資。
l 每週教學時數、每週花費在管理與諮商學生的時數。。
課程分析
規劃的課程
參與國問卷
TIMSS 調查 成果
達到的課程
教師問卷內容目標
執行的課程
學校問卷教師問卷
教學措施 指 定 課 程 剖 析 學校和教師
問卷
教師問卷
背景
主題信念
參與國問卷 和 國際教科文組
織資料
學校問卷
學生問卷 體制
學生 教室 學校
學生應該 學什麼?
誰負責教? 如何組織教 學活動?
學生學到 什麼?
l 非上班時間從事教學或學校相關活動的時間。
l 每週教學活動總時數的時數。
l 指出和同事合作與討論的頻率 。 l 指出對一些教學相關事務的決 定權。
l 指出對學生擅長 技巧的信念。
l 指出對學科本質與應該如何教的信念。
l 指出對課程標準、教學指引、 考試細目熟悉程度。
l 提供對 TIMSS 1999 數學或科學主題 領域的熟悉度。
l 學歷與在職進修情形。
l 說明是否想改變 職業、社會和 學生是否推 崇他們的工作、家中 藏書。 【國際選項】
l 指出在受測班級任教學科、授課時間、使用教科書情形。
l 指出在受測班級使用計算機和電腦、網際網路的頻率。
l 指出準備課程的資源。
l 要求學生在上課時進行各種不同活動的頻率。
l 花費在與教學有關活動的時間。
l 在受測班級教學的主題。
l 影響教學活動的 因素。
l 對受測班級指定家庭作業的頻率、數量、類型、回收處理方式。
l 指出如何評量學生學習成就。
(四) 學生問卷:
l 提供個人基本資料包括年齡、性別、使用 語言、居住時間。
l 指出在非上課時間參加可能影響學習成就活動的資訊 。 l 指出在上學期間每天花在家庭作業和休閒活動的時間。
l 提供父母親關於教育程度、出生地資訊。
l 提供期望自己教 育程度資訊。
l 指出家中藏書、相關於學習的設備資訊。
l 提供學生認為母親對學習和休閒活動的重 視程度的看法。
l 提供班級的上課 情形、上課中常見活動的 頻率。
l 提供學生認為同儕對學習和休閒活動的重 視程度的看法。
l 提供學生自己對學習和休閒活動的重視程 度的看法。
l 提供學生自評在 數學和科學的 表現與勝任 情形。
l 指出認為學好數學和科學的原因。
l 提供學生自評對 數學和科學的 喜好程度與看法。
l 指出使用電腦和網際網路學習數學和科學 情形。
l 提供學生自評要學好數學和科學的理由。
l 指出數學和科學 教師如何開始一個新主題的學習。
l 提供學生家庭人口資訊。【國際選項】
l 在校外從事各種 文化活動或遊戲休閒的頻率。【國際選項】
l 提供學校中學生 問題行為的頻率。【國際選項】
l 提供學生對應用 科學幫助環境議題的信念 。【國際選項】
l 指出在職業上對 科學領域的偏愛。【國際選項】
五、 參與國家
TIMSS 1999 共有 38 個國家參加調查,其中有 26 個國家曾參加 TIMSS 1995 的 13 歲群調查,在這 26 個國家中有 18 個國家在 1995 年參加 9 歲群的調查。
因為以色列、南非和泰國等三個國家,在 1995 年的抽樣過程不合規定,1995 年成績不被列入國際比較範圍(Beaton et al., 1996),因此在 1999 年分析 各國趨勢比較時,只有 23 個國家可以進行比較。參加 TIMSS 1995 調查的國 家、受測學生年級、受測學生平均年齡詳見附錄七。
六、 研究對象與抽樣設計
(一) 研究對象
為了能夠進行趨勢分析,TIMSS 1999 受測學生的界定與 TIMSS 1995 相
同,即是「在測驗時,包含最多 13 歲群的在學學生的年級」 ,結果包括 7 年 級至 9 年級的學生。
TIMSS 1999 調查研究是延續 TIMSS 1995 的調查,為了使同時參加 TIMSS 1995 和 TIMSS 1999 研究的 26 個國家,除了有機會與各國學生的學習成就比 較之外,更可藉由兩次 TIMSS 調查來看他們自己國家在 1995 年時是國小四年 級的學生,升上國中二年級之後的數學和科學成就趨勢變化。所 以 TIMSS 1999 選定研究的學生為 TIMSS 1995 中的第二母群(Population 2) ,受測學生的 年級界定與 TIMSS 1995 相同,即是「在測驗時,包含最多 13 歲群的在學學 生的年級」 。決定受測年級需要靠各國的國家研究協調人結合各國教育體系的 訊息來判斷,決定各國的受測學生應該是哪一個或哪二個年級。大多數國家 選定八年級為受測對象,全部受測學生之平均年齡為 14.4 歲 (Martin et al., 2000a) 。
TIMSS 1999 調查研究的對象除了學生之外,尚有受測學生的數學和科學 任課教師,以及學校校長或相關人員,他們分別需要填寫教師問卷和學校問 卷 , 用 來 了 解 不 同 的 教 學 安 排 與 學 生 成 就 相 關 的 訊 息 ( Martin et al., 2000b) 。
(二) 抽樣單位與抽樣人數
一個研究調查結果的正確程度全賴抽樣設計的品質與抽樣實施的過程,
由於 TIMSS 1999 的分析重點在於學生的累積學習和影響學習的教學特性,因
此探討的對象包含了學生、班級、學校等,而這些就成了抽樣單位(sampling
unit)。TIMSS 1999 的抽樣設計要求各階層抽樣時,都必須符合抽樣的正確 性和調查品質的要求(Foy & Joncas, 2000;Martin et al., 2000b)。
調查資料的信度來自於可信的學生特質之評估,因此 TIMSS 1999 希望 每一個國家都能選出足夠且具有代表性的受測學生,所以對樣本母群參數和 抽 樣 變 數 提 出 正 確 的 加 權 評 估 。 由 於 利 用 分 層 抽 樣 會 產 生 群 集 效 應 (clustering effect),為了降低這個效應,在 TIMSS 1999 抽樣的標準中,
要求每一個探討的變數至少要有 400 個有效的學生作答資料,這樣才能使分 層抽樣產生的誤差,不會大於用簡單隨機抽樣所產生的誤差(Foy & Joncas, 2000)。
TIMSS 1999 為了避免抽樣的精確性因為班級內群集效應而下降,事 先要 分析抽測學校數和班級人數的資料,可以利用下列公式進行評估班級的群集 效應,即班級內的相關 ( intraclass correlation) ,當相關係數越小時,
顯示班級內的群集效應越小,所需抽測的學校數也就越少。
A= MCS
a MCS
MCS IC
a ( 1 + × ( − 1 )) + ( 2 ÷ 15 )
其中 A:抽測學校數
a :有效的抽樣人數(TIMSS 1999 要求需 400 人)
IC:班級內相關係數
MCS:最小群集大小,即每校平均班級人數
根據上述公式,TIMSS 1999 抽樣設計製成如附錄八的表格,供各國在決
定抽樣的學校數和班級平均人數時使用,可以預估受測學生人數。藉由 TIMSS
1995 的經驗得知,受測班級人數在 15 人以上時,班級內的相關係數在 0.1 到 0.3 之間時,其所需抽測的學校數是相同的。因此 TIMSS 1999 抽樣時選定 班級內群集的相關係數為 0.3,並將學校的班級平均人數少於 20 人的學校排 除於抽測名單,每個國家原則上抽測 150 校,每校一班,這樣可以從抽測學 校 數 和 班 級 人 數 預 估 受 測 學 生 人 數 , 而 且 誤 差 在 ± 5 % 以 內(Foy & Joncas, 2000;Martin et al., 2000b)。
(三) 分層抽樣
TIMSS 1999 的抽樣設計是沿用 TIMSS 1995 的方法(Foy & Joncas, 2000;
Martin et al., 2000b),目的希望能使抽樣結果兼顧各國間的差異與各種族
群的分布,使樣本更具有代表性。為了提高抽樣效率和信度,在發展調查工
具時,就一併設計抽樣方法。TIMSS 1999 抽樣設計採用三階分層群集抽樣設
計(Foy & Joncas, 2000),第一階抽樣單位是學校,首先由各國選定分層的
變 數 , 再 由 加 拿 大 統 計 局 根 據 各 國 的 分 層 變 數 , 利 用 機 率 等 比 例
(probabilities- proportional-to-size,簡稱 PPS)系統抽樣方法來抽取受
測學校和候補學校(附錄九是 PPS 系統抽樣的範例) 。例如採用地理上分區作
為一個外顯的(explicit)分層變數,先將所有學校依地理位置分成不同的學
校群,各學校群再依據內隱的(implicit) 分層變數來排序,考量學校的不均
勻分布,利用等比例方法抽樣。這種系統抽樣方式的優點在於操作方便,且
容易監控執行過程是否恰當,如果被抽到的受測學校無法施測時,改由候補
學校受測;因此抽取受測學校時,大部分受測學校的第一順位和第二順位候
補學校名單也同時抽取出來。
第二階抽樣單位是受測學校內的班級(Foy & Joncas, 2000;Martin et al., 2000b)。每一個國家都是根據加拿大國家統計局提供的受測學校名單進
行班級抽樣工作,這個階段是採用亂數隨機抽樣,通常是在每一個受測學校 抽出一個受測班級,但是有些國家也許會因為一個班級學生人數太少而需要 抽 出 兩 班 以 上 的 學 生 來 受 測 , 也 就 是 利 用 兩 班 以 上 組 成 一 班 所 謂 的 虛 擬 班 級。有些國家的學生並不是所有課程都在同一班一起上課,因此 TIMSS 1999 界定班級時,是以所有在同一個數學課程班級上課的學生為一個班級。如果 這個數學班級學生成員來自不同年級時,只有屬於受測年級的學生需要接受 調查。如果受測學校無法界定出班級時,只好從受測年級中的所有學生隨機 抽樣出受測學生。所有教過受測班級或受測學生的數學和科學課程的教師,
必須填答教師問卷。
第三階抽樣單位是受測班級內的學生(Foy & Joncas, 2000;Martin et al., 2000b)。基本上被抽到的受測班級內的所有學生都應接受測驗,但是有
些國家的受測班級內的人數過多,必需再從該班進行部分抽樣,以亂數隨機 選取適當的人數參加測驗。所以第三階段的抽樣並不是每一個國家都需要使 用。
(四) 抽樣過程與排除受測的條件
由於每一個國家可以依據正式測驗實施時所需的經費、複雜度、困難度、
地理因素與特小型學校等各種相關考量,而在不同的抽樣階段決定排除受測
的學校、班級、或學生名單,各階段的排除受測名單與受測學生母群的關係
如圖三。但是每一個國家排除受測的比例不可以超過該受測年級學生總人數
的 5%。
圖三 不同階段的排除受測名單與受測學生母群的關係(譯自 Foy & Joncas, 2000,第 33 頁)。
依照國際的時程規定,各國要正確估算排除學校的比例與班級的學生平 均人數,並將各種抽樣相關表格寄至加拿大國家統計局,再由加拿大國家統 計局依照 PPS 方式,將試測與實測受測學校與候補學校名單抽選出來。在確 立試測與實測的受測學校與候補學校之後,各國再根據 TIMSS 1999 所提供的 抽樣手冊和 W3S 電腦軟體進行班級和學生的隨機抽樣,然後再向各個學校收 集受測學生個人相關資料,製作測驗紀錄表格與標籤。
學 校 內 排 除 受 測 學 生 的 條 件 主 要 有 三 項 ( TIMSS-R Main Survey Operations Manual, 1998) :(1) 學習遲緩的學生:此類學生是指經由校長 或其它合格教職員工的“專業 ”意見認定為學習遲緩的學生,或是經由心理 醫師認定為學習遲緩的學生;此類學生包括了情緒性或心智上不能照著一般 的測驗說明去作答的學生。學業成績不良或管教上有問題的學生不可以用學
國際希望的受測學生母群
各國希望的受測學生母群 國家級的排除受測學校
各國界定的受測學生母群 學校級的排除受測學校
各國有效的受測學生母群 受測班級的排除受測學生
習遲緩這個原因將之排除在外;(2) 身體功能缺陷者:由於身體上的缺陷,
致使無法與其他人依照規定同時進行 TIMSS 1999 測驗者。若肢體雖然殘障但 可以回答測驗問題者,仍須被包含在測驗之內;(3) 母語有困難者:學生實 質上無法讀或寫本測驗的語言,或是在考試狀態下無法克服語言障礙。尤其 是學生學習測驗所使用的語言的時間未逾一年者。
(五) 抽樣過程「小學校」問題
利用 PPS 抽樣過程中,最棘手的問題是抽到學生人數少的小學校造成的 問 題 , 包 括 學 生 需 不 成 比 例 的 抽 樣 加 權 和 會 減 少 全 體 學 生 抽 樣 人 數 。 因 此 TIMSS 1999 界定學校受測年級的平均班級人數如果少於 20 位學生,就是小 學校。TIMSS 1999 在補救小學校引起的問題時有兩個過程: (1)如果學校受 測年級的平均班級人數少於 10 人,被定義為極小學校。如果所有極小學校的 受測年級學生人數少於全國受測年級人數的 2%,而且全國的總排除受測率低 於 5%時,就將所有極小學校排除在受測學校名單中; (2)如果所有小學校的 受測年級學生人數超過全國受測年級人數的 10% 時,就需要將小學校單獨分 層抽樣,使所有的學校有相等的機率被抽到(Foy, 1998)。
(六) 抽測出席率問題
因為有些被抽到的學校可能拒絕接受調查,因此可以採用加拿大統計局
提供之該校的候補學校進行測驗,但因不是每一所學校都有候補學校,為了
確 保 整 個 測 驗 結 果 的 人 數 , 因 此 要 求 每 一 受 測 班 級 的 學 生 出 席 率 不 得 低 於
90%,如果班級學生出席率低於 90%,該班缺席學生就必須進行補測。而各國
全體被抽測學生的班級出席率經加權換算後,要求要達到 75%,否則該國成 績無法列入國際比較(TIMSS-R Main Survey Operations Manual, 1998)。
七、 施測與資料處理
(一) TIMSS 1999 施測過程
參與 TIMSS 1999 測驗的 38 國家各有不同的學年時間,因此南半球國家 是在 1998 年 9 月至 11 月期間施測,而北半球國家是在 1999 年 2 月至 5 月期 間施測(TIMSS-R Main Survey Operations Manual, 1998)。
TIMSS 1999 有 一 完 整 的 標 準 化 施 測 程 序 ( TIMSS-R Main Survey
Operations Manual, 1998),目的在確保每個國家測驗過程的品質。為了確
保測驗過程的品質,美國國際研究中心發展國際品質控制觀察員和國家品質
控制觀察員兩種角色,負責在各國檢測施測是否符合標準化的程序。各國的
國家研究協調人負責執行測驗調查和收集資料,並依照 TIMSS 1999 調查執行
手冊規定的標準化程序聯絡受測學校、安排測驗。受測學校聯絡人根據學校
聯絡人手冊上的指引負責接收、保管和寄回所有測驗材料,並與監試人員一
起安排測驗之相關工作。監試人員為正式施測人員,依照監試人員手冊規定
執行標準化施測程序,分發和回收試題本與問卷,記錄測驗過程學生出缺席
情形和是否有特殊事件發生。 如果每班學生的出席率低於 90%,則受測學校
聯絡人必須在原訂測驗日期後儘快安排補測。
(二) TIMSS 1999 施測後之自由反應試題評分與資料輸入
大約有三分之一的試題是自由反應試題,在資料輸入電腦之前,需先由 評 分 者 將 學 生 答 案 轉 換 成 兩 位 數 字 的 評 分 碼 。 為 了 確 保 評 分 者 評 分 的 一 致 性,評分者評分之前需要接受講習訓練,同時有 25%的試題被要求由第二位 評分者複閱(TIMSS -R Main Survey Operations Manual, 1998)。
TIMSS 1999 提供每個參加國家資料輸入軟體(DEM)與手冊,使每個國 家將學生成就測驗、學生問卷、教師問卷、學校問卷等的回答選項資料輸入 在電腦檔案中。藉由 DEM 軟體程式,各國送資料至國際料處理中心前,即已 經先將資料經過標準化格式處理。再由國際料處理中心負責資料的清理與訂 正程序,多次與各國國家研究中心連絡和檢討資料,以確保建立高品質的國 際 資 料 庫 , 使 所 有 資 料 可 以 進 行 有 效 的 比 較 分 析( TIMSS-R Main Survey Operations Manual, 1998)。
(三) TIMSS 1999 資料的加權處理
為了要解釋抽樣設計造成在選擇樣本時的不同機率,TIMSS 1999 從三個
步 驟 計 算 了 每 位 受 測 學 生 的 在 整 個 抽 樣 過 程 的 抽 樣 權 重 ( sampling
weight):第一個步驟計算學校權重,第二個步驟計算班級權重,第三個步
驟計算學生權重。計算過程中,每個步驟分別考量是否因為學校、班級、學
生沒有參加受測而需調整權重,統計上分析資料時必須使用適當的抽樣調查
加權,才能正確的反映出抽樣母群資料(Martin et al., 2000b)。TIMSS 1999
每位受測學生的整體抽樣權重標示在公布的資料檔案中(Gonzalez & Miles,
2001)。
TIMSS 1999 試題內容與題數都很多,但是整個測驗中每位學生只作答一 部分試題(作答一個題本),每位學生對整體數學和科學成就測驗成績評估 是靠 IRT 按照量尺化方法( scaling methods),藉由考慮每位受測學生平均 答對率和每個試題的難度和鑑別度能力,來計算該生在數學和科學成就測驗 各內容領域可能的得分,用似真值( plausible value)來作為學生成就的指 標(Gonzalez & Miles, 2001)。這種方法常見於跨國比較平均成就的研究當 中,TIMSS 1995 和 TIMSS 1999 都是採用這個方法來計分,全部國家平均成 績是以 500 為基準,標準差是 100,然後利用加權方式估算學生成就得分,
由於估算本身即具有不確定性與誤差,TIMSS 依照慣例為每位學生在數學和 科學各個內容領域產生五個估計的似真值,為受測學生成績,同時使用變異 數將抽樣誤差一併算進來。
第三節 學生特質與科學 學習成就 的相關研究
一、 Centra and Potter 的教與學模式
Centra and Potter (1980)認為父母、同儕、教師、學校、學生本身對
學生的學習成就都有影響,因此提出一個教與學模式來描述這些影響學生學
習的變數關係(圖四)。 Centra 和 Potter 教與學模式指出六組影響學生學
習成就的變數:教師特質、教學表現、學校特質、校內情形、學生特質、學
生行為。其中學生特質包含社會地位、種族、父母影響、性向、先備知識、
圖四 Centra and Potter 的教與學模式 ,圖中箭頭代表因果的關係,教師 與校內情形之間是一種相關,但不是因果關係(譯自 Centra and Potter, 1980,第 274 頁) 。
價值觀和態度、期望、認知、學習風格等因素;學生學習成果的特質包含基 本技巧、認知結果和非認知測驗結果。Centra 和 Potter 的教與學模式是一 個由許多研究成果結集的概念模式,其文章內容主要在探討學校和教師對學 生成就的影響,沒有探討學生特質部分,但 Centra 和 Potter 認為這個模式
教 師 特 質 1. 資格 2. 經驗 3. 性向 4. 學科知識 5. 教學知識 6. 價值觀和態度 7. 期望
8. 社會地位
學 校 或 教 育 措 施 1. 學校大小 2. 財政資源、薪水 3. 師生比例 4. 教職員比例 5. 專業人員服務
6. 設備(實驗室、圖書等)
7. 平均班級人數 8. 學校位置 9. 學生社會地位 10. 種族組成
校 內 情 形 1. 行政組織
a. 教職員比例 b. 學位管制、權威 c. 回饋機制 2. 教學組織
a. 追蹤 b. 協同教學 c. 開放或傳統 3. 學生同儕影響 4. 班級人數 5. 上學時間 6. 環境或氣氛
教 學 表 現
(行為)
學 生 學 習 成 果 1. 基本技巧 2. 認知結果 3. 非認知測驗 學 生 特 質
1. 社會地位、種族、父母影響 2. 性向、先備知識
3. 價值觀和態度 4. 期望
5. 認知和學習風格
學 生 行 為
除了預測許多學生特質變數之間的因果關係之外,也提供機會讓其他研究來 檢視這個模式的適切性。
Lee (1987) 探討民國 67 年的國小自然科新課程成效時,修 改 Centra 和 Potter 教與學模式,在教師特質方面增加「在職進修」和在學生特質增加「性 別」二 個變數(圖五) ,來分析台灣國小學生科學成就最具有預測力的因素。
結果發現科學先備知識對科學成就的預測力最強,對國小三年級至五年級學 生科學成就分別有 10-15%解釋力,其次是數學和國語二項成績有 20-30%解 釋力,學生背景因素有 9-13%的解釋力,父親的教育程度分別有 4-5%解釋 力,性別對科學成就的解釋力低於百分之一,而且男生成績稍微優於女生。
綜合來說學生家庭背景因素、學校國語和數學成績、和科學先備知識三項對 科學成就約具有 38-53%的預測能力。
二、 社會地位、種族、父母與學習成就
有很多探討學生學習成就的研究發現,家庭社經地位與家長職業與學生 成就有關係(Srivastava, 1974;Walberg, 1986; Parker & Asher, 1987;
Lee, 1987;Elliott et al., 1999;Burns & Darling, 2002; Richardson
& Kring,1997; House, 2000) 。IEA 從第一次國際調查以來一直注意著社會 經濟、家庭背景和學生成就之間的關係,由於無法直接用問卷來調查學生家 庭收入,在 IEA 第一次和第二次調查時曾將職業分成四類來調查家長職業,
希望藉由家長職業來瞭解學生家庭經濟地位。然而職業類別太多,各國職業
分級制度不同,很難用簡易的問卷選項來歸類,甚至有些國家不願意被問及
家長職業,因此用家長職業來說明家庭經濟狀況有執行上和解釋資料上的困 難(Keeves & Saha, 1992) 。
圖 五 Lee (1987) 的 教 與 學 模 式 , 圖 中
*為 其 探 討 的 變 數 ( 譯 自 Lee, 1987,第 4 頁 ) 。
教 師 特 質 1. 資格 2. 經驗 3. 性向 4. 學科知識 5. 教學知識 6. 價值觀和態度 7. 期望
8. 社會地位 9. 在職進修*
學 校 特 質 1. 學校大小* 2. 財政資源、薪水 3. 師生比例 4. 教職員比例 5. 專業人員服務
6. 設備(實驗室、圖書等) 7. 平均班級人數
8. 學校位置 9. 學生社會地位 10.種族組成
校 內 情 形 1. 行政組織
甲、教職員比例 乙 、 學 位 管 制 、 權 威 丙、回饋機制 2. 教學組織
甲、追蹤 乙、協同教學 丙、開放或傳統 3. 學生同儕影響 4. 班級人數 5. 學校教育時間 6. 環境或氣氛
教 學 表 現
(行為)
學 生 行 為
學 生 學 習 成 果 1. 基本技巧 2. 認知結果* 3. 非認知測驗 學 生 特 質
1. 社會地位*、種族、父母影響* 2. 性向、先備知識*
3. 價值觀和態度 4. 期望
5. 認知、學習風格 6. 性別*