• 沒有找到結果。

PISA 數學素養評量之介紹

第二章 文獻探討

第二節 PISA 數學素養評量之介紹

PISA (the Programme for International Student Assessment) 稱為「國際學生能 力評量計劃」,是「經濟合作暨發展組織」(Organization for Economic Co-operation and Development, OECD) 於 1997 年開始籌劃的一項大型國際性學生能力評量計 畫,自 2000 年開始施測,每三年一次,包括三個方面:閱讀素養、數學素養、

和科學素養。每次調查以一個領域為主進行深度了解,另二個領域為輔。截至目 前為止,PISA 計畫總共完成了五次針對不同主題的世界性大範圍調查: 2000 年

(43 個國家/地區參加)、2009 年(65 個國家/地區參加),以「閱讀素養」為 主軸;2003 年(41 個國家/地區參加)、2012 年(67 個國家/地區參加),以「數 學素養」為主軸;和 2006 年(57 個國家/地區參加),以「科學素養」為主軸。

每一個 國家約有 4500~ 10000 名學 生接受測驗 。

PISA 2012 的調查主軸 是數學素養,與以往 調查一樣,同 時包括閱讀 及科學 兩素養,也兼顧 數學學習相關 資訊的蒐 集,比如學生學 習態度、學 校、家庭 以及社會等背 景脈絡。PISA 2012 共有 65 個國家 或地區參與,超 過 51 萬名學 生進行兩小時的 紙筆式評量,其中 32 個國家額 外參加數位文 本閱讀 與數位數學素 養的評量、 44 個國家參加 數位問題解決 素養評量。

壹、目的與特色

PISA 目的是針對 15 歲的學童進行大範圍的跨國評量,以了解學生參與社會 所需的關鍵知能。以國際比較方式,提供國家整體教育成效評鑑資訊,作為各國 制定教育政策的参考,並反映出該國學童在「閱讀素養」、「數學素養」與「科 學素養」上的能力。其特色是採取素養而非成就取向,以貼近真實的情境,評量 學生重要知能的應用與溝通及是否有能力足以應付未來的世界。

12

貳、試題類型

PISA 試題類型可分為三類,包括選擇式反應試題、封閉式建構反應題及開 放式建構反應題,其中封閉式建構反應題主要是要求學生回答較明確的語詞或句 子,通常學生只需運用回憶的能力,或至多推測的能力。而開放式建構反應題則 要求學生提出自己的觀點以及支持理由和證據,並需依據文本內容或既有知識與 經驗提出批判或說明。

叁、評量模型

而PISA用以評量數學素養的模型,稱為三維度架構,其包含:

一、

情境與脈絡(Contexts):

試題的情境脈絡應該是包含15歲小孩(學生)世界的一部分,且情境脈絡 應該包羅萬象的,如學生個人生活(Personal)、教育/職業的(Occupational)、

社會性的(Societal)、科學性的(Scientific)。

表 2-2-1

PISA 2012 數學素養評量各情境脈絡的比例

個人 職業 社會 科學 合計

20-30% 20-30% 20-30% 20-30% 100%

二、

數學內容知識(Mathematical content knowledge):

包含四個部份,變化和關係(Change and relationships)、空間和形狀(Space and shape)、量(Quantity)、不確定性(Uncertainty)。PISA 明確地與傳統學 校課程要素區隔, 採現象學取向(phenomenological approach)組織數學內容

(content)(周玉秀,2006)。這四項內容領域說明如下:

13

(一)數量

數量是生活中常遇到的最基本與最普遍的數學觀念。數量主要包括測量、計 數、指標、相對大小、趨勢和模式。例如:數的概念、數字的運算、心算、估計 和評估。

(二)空間與形狀

包括生活中看得見的各種現象,像圖形、位置與方位、物體的性質、動態幾 何圖形、以及影像的編碼與解碼。如真實城市和該城市的地圖(照片)間的差異,

以及三維物體的二維表徵、全球定位系統(GPS)等都屬於空間與形狀。

(三)改變與關係

改變與關係的重點在於自然界裡各種暫時性和永久性的關係如何以數學模 式描述,例如生長、四季循環、潮起潮落、失業的循環、天氣改變、有機體的改 變等。例如:函數、代數與符號的使用、以及表格和圖形的呈現。

(四)不確定性(與資料分析)

包括理解生活中各種造成變異的成因、具有量化和解釋變異的能力、測量時 所隱含的不確定性的知識以及機率統計的問題。例如:選舉結果、天氣預測、經 濟模型的變動。

這四個數學內容形成的領域廣泛,一方面可確保試題散佈於課程之中,同時 又可避免太過明確而違反真實情境問題解決的憂慮。 PISA 2012的數學架構

(OECD, 2010)強調各領域的背景知識都需要滿足:

1.與數學有關,使得學生在解決問題的過程中,能做到數學素養定義中提及 的「辨識」、「做」與「運用」數學。

2.能反應出學生能應用數學於情境中的理解程度,例如學生是否能做有實徵 根據的判斷,是否為具積極性、投入性及反思能力的公民。

3.適合15歲學生,包括OECD會員國或夥伴國裡所有的15歲學生。

PISA 2012 數學試題在各內容領域所佔的百分比如表 2-2-2所示。

14

表 2-2-2

PISA 2012數學素養評量各內容領域的比例

改變與關係 空間與形狀 數量 不確定性

(與資料分析)

合計

25-30% 25-30% 20-25% 20-25% 100%

三、數學歷程及內蘊的數學力(Mathematical processes and the underlying mathematical capabilities):

數學歷程最主要步驟有轉化(translation)、解題(solution)及建模(modeling)三項,

而關鍵程序為:問題的描述、數學模式的建立、答案的解釋與預測三大項,如下 圖:

2-2-1

數學建模循環

首先探索問題情境,並從觀察、互動、尋找資訊、找出問題的限制或難處理 解給定的資訊,並從問題的互動中察覺的資訊;其次為利用圖、表、符號重新呈 現問題,然後確認問題中變項間的關聯、建立模式並審慎評估資訊;再為目標進 行策劃,包括釐清目標、設定子目標、擬定完成目標的策略,接著執行擬定的計 劃;最後監控目標完成前的每個程序、以及程序的檢測與除錯,反思不同觀點所 得的結果、檢查假設是否符合、評估其他可行的方法。

15

內蘊的數學力則包括情境與數學間的溝通(Communication)、問題數學化

(Mathematising)、使用及轉換表徵(Representation)、推理和論述(Reasoning and argument)、發展策略(Devising strategies)、使用符號、形式及術語與運算

(Using symbolic, formal, and technical language and operations)、使用數學輔助工 具(Using mathematical tools)。PISA 2012 數學試題在各歷程所佔的百分比如表 2-2-3所示。

表 2-2-3

PISA 2012 數學素養評量各歷程的比例

轉化 解題 建模 合計

40-50% 40-50% 10-20% 100%

四、數學素養的試題類型

PISA 數學試題使用四種題型:選擇題、多重是非題、封閉式問答題以及開 放式問答題,其中選擇題、多重是非題+封閉式問答題、開放式問答題的比例各 約為1/3。

(一) 選擇題

每個選擇題有四~五個選項,只有一個正確答案。

(二) 多重是非題

多重是非題包括由二~四題是非題所組成的,通常必須全對才能得分。選擇 題與多重是非題可以用來測量數學的理解歷程,然而卻無法讓學生進一步解釋和 提出支持或反對的論點,因此,PISA除選擇題外還有問答題。

(三) 封閉式問答題

封閉式問答題通常會先要求學生從「是」或「否」兩個正反面的立場中圈選 出合理的答案,再要求提供計算或數學論證來支持自己所選擇的答案。

16

(四) 開放式問答題

開放式問答題的主要目的在於讓學生自己建構答案,由作答者提出自己的觀 點以及支持的理由和論證。開放式問答題由數學領域專家進行人工閱卷,根據學 生的作答反應進行評分。評分時,依據學生理解的程度,評判為滿分、部分分數、

或零分,不會因為書寫表達能力不好而扣分。

肆、技術分析

以下將簡要說明PISA實施時幾個重要之技術層面(OECD, 2005)。

一、試題研發、測驗設計與背景問卷之發展 (一) 試題研發

PISA 試題研發過程包含初始準備(initial preparation)、審題會議(item paneling)、認知訪談(cognitive interview)、國際的審題會議、預試(pilot testing)。

且為了讓考試工作能順利進行,有幾項工作需事先注意:(1)建立明確的施測流 程;(2)受試者指導手冊;(3)監考人員指導手冊;(4)閱卷。

而在 PISA 認知試題的發展是由一套一系列廣泛的指導方針來引導,而這個 指導方針在計劃開始時所擬定好的,並且在 PISA2006 年科學專家小組第一次會 議中所被認可的。而指導方針包含了發展的概要、試題需求的詳述。

在 PISA2000 與 2003 年是使用兩位數的編碼來區別,在每個試題必須要有對於反 應的編碼,在每個編碼的原則包含了試題反應類別(包含全對、部分答對),在 每個得分編碼都必須是不同的。

(二) 測驗設計

PISA 2003 評量以數學科為主,因此,測驗包含 7 個區塊的數學試題,M1~M7;

2 個區塊的閱讀試題,R1 與 R2;2 個區塊的科學試題,S1 與 S2;2 個區塊的問 題解決試題,PS1 與 PS2。每個試題區塊作答時間為 30 分鐘,則每個題本作答時

17

間為 120 分鐘。

PISA 2006 年測驗試題包含 13 個試題區塊(7 個試題區塊為科學 S1-S7、2 個試題區塊為閱讀 R1、R2 與 4 個試題區塊為數學 M1-M4)。閱讀試題區塊(R1、

R2)取自 2003 年之試題區塊,數學試題區塊(M1-M4)則為 2003 年之試題中挑 選出 167 題試題組合而成,而 108 題科學認知試題中,有 22 題試題挑選自 2003 年,且分配至 7 個科學試題區塊中。

(三) 背景問卷

PISA 研發之背景變項問卷包含:學生問卷、學校問卷及提供參與國選擇的 ICT(Information communication technology)熟悉問卷、父母問卷及全國性的問 卷。所有問卷發展初期皆有經過預試的階段,一開始選擇澳洲先進行小樣本的抽 測,讓學生對問卷內容進行自由討論,然後根據學生們的意見進行內容修訂,接 著選擇日語系的日本、德語系的德國、法語系的加拿大及英語系的澳洲進行較大 規模的預試,針對收集到的問卷預試資料進行分析,對學生們提出的問題或不適 宜的題目進行增修刪補,以提高問卷試題的品質。

二、測驗資料量尺化

PISA 使用 MRCML 模 式 進 行 測 驗 資 料 分 析,針 對 各 項 度 之 次 級 量 尺 進 行 估 計,而使 用軟 體 為 ConQuest(Wu, Adams, & Wilson, 1998),多點計分試 題使用 PCM。個別受試者能力估計使用最大概似估計法(maximum likelihood estimation, MLE)估計受試者能力表現;群體能力估計使用可能值的方法。

三、信度研究

測驗信度的檢測乃是測驗評量中重要的ㄧ環,PISA 針對 5 個量尺:數學、

閱讀、科學、學習興趣與學習自信,使用可能值與 WLEs 之分析方式進行信度檢 測,結果發現數學與閱讀之數據呈現 WLEs 法之信度較高,其餘三者以可能值分 析法較高,但國際性的試題信度檢測皆在 0.8 以上。另外 PISA 針對 CR 試題提供 三個評估信度的觀點,分別為同質性分析(homogeneity analysis)、變異數成分分

18

析(variance component analyses)、各國之間的信度研究(inter-country reliability

析(variance component analyses)、各國之間的信度研究(inter-country reliability

相關文件