• 沒有找到結果。

第一章 緒論

第一節 研究動機

本研究主要是以實徵資料來了解與分析九十五至九十七年度國中基本學力 測驗中自然與生活科技考科題目的差異試題功能(Differential Item Functioning,

簡稱DIF)。本章共分為四節,第一節說明研究者之研究動機,第二節列舉本研究 所要研究的目的,第三節依研究目的來擬定待答問題,第四節為本研究專有名詞 的解釋,分別說明如下。

第一節 研究動機

在現代社會中,不論身處在學校、政府機關或是各種公司行號的環境中;不 論是學生的升學或是求職者進入職場、亦或是上班族的升遷,都需要經由各種不 同型式的測驗來決定,因此測驗已經變成生活中的一部份。測驗的目的不論是入 學檢測、性向了解、資格檢定或人才篩選,皆需要以測驗來做一個公平的決定,

然而測驗的題目本身如果涉及到一些其他干擾因素,如:性別、城鄉差距、種族、

文化背景、家庭社經地位…等,而導致分數或表現有所落差,將會對受試者產生 不公平的影響。因此如何排除與測驗內容不相關的因素,讓測驗結果真正能符合 受試者的能力,是非常重要的課題。

自民國九十年起開辦的國民中學學生基本學力測驗(以下簡稱國中基測),

每年實施兩次測驗,關係著近三十萬個國中考生的升學權益。國中基測的目的,

在於評量學生能力表現及發展潛能,期能在「維持制度公平的前提下,消除入學 考試對於國民中學教育的不利影響,進而充分發展學生的潛能」,其命題方向在 於評量學生未來學習與生活有幫助的基礎、核心與重要的知識與能力,而課程綱 要及各領域的能力指標就是國中基測的命題依據(教育部,2007)。因此如何能 讓每位考生考出真正的能力,讓他們都能「適得其校」,則顯得非常重要。

過去針對國中基測的相關報導及研究,大多著重在分析各區域之間學生整體 學業成績表現的差異,亦或是探討各種教育資源的分配不公導致成績表現不理想 等話題,但試題本身卻很少被研究,如果試題本身就已經呈現不公平的現象,而 此種不公平的測驗結果又會影響學生未來升學學校的安置,將會對參加國中基測 的學生影響深遠。因此,測驗試題的「公平性」是一個需要重視的重要課題。

「男生數學和自然科表現較好,女生語文和社會科表現較佳」,這是一般人 對男女性別能力差異的刻版印象,然而真是如此嗎?「性別平等」議題近來備受 重視,男女生學習成就差距為國際間教育界所關注,一些國際性的學生學習成就 調查研究,如PISA(Programme for International Student Assessment)和TIMSS

(Trends in Mathematics and Science Study),都特別針對男女生差異結果分析原因 並做相關的研究報告,而國內性別學習差異研究則較受到忽略(盧雪梅,2007)。

國中基測是提供全體國中生公平、公正且具有公信力的入學評量基準,究竟國中 基測中各領域的學習成就是否真如大家所說的「男女有別」?因此,本研究將「性 別差異」列為欲探討的課題之一。

根據94年國中第一次基測的成績顯示,來自都會與非都會的考生,成績差距 仍然沒有獲得改善,九年一貫政策對縮小城鄉學生的學習差距,看不出明顯的效 果,此一現象值得重視。儘管基測考題中間偏易,但近三年的第一次國中基測,

每年都有三成以上,也就是約有十萬名考生考不到一百分,而這些分數低的學 生,大都集中在花東、苗栗、南投等區域,顯示基測成績的城鄉差距仍未見明顯 改善(張錦弘、孫蓉華,2005)。政府近年來開始將「照顧學習弱勢族群學生」

之議題,納入教育優先區計畫考量,期能平衡城鄉教育差距,實現「教育機會均 等」與「社會正義原則」的精神(教育部,2004)。另外,教育部也積極開辦攜 手計畫課後扶助方案,希望能有效解決地區性教育問題,平衡城鄉教育差距(教 育部,2009)。雖然政府已經開始重視城鄉差距問題,但在國中基測的成績表現 上,仍舊呈現出國民教育發展城鄉差距過大的嚴重性。究竟城鄉差距有多大?國

中基測試題是否真的較有利於都會地區學生?本研究將「區域差異」列為另一欲 探討的課題。

測驗結果攸關著考生的權益,因此測驗對不同背景應試群體的公平性是測驗 發展機構關切的焦點之一,這也是差異試題功能(DIF)研究受重視的原因(盧 雪梅,2007)。有關國中基測的DIF實徵分析研究目前為止並沒有很多,惟見曾建 銘(2004)對90年度第1次國中基測數學科進行性別DIF檢定,曾建銘(2005)對 93年度第1次國中基測數學科進行區域DIF檢定,余民寧和謝進昌(2006)對91年 度第1和第2次國中基測五考科試題進行區域DIF檢定,王嘉寧(2007)對90至95 年度國中基測社會科之地理試題進行區域DIF檢定,盧雪梅(2007)針對90至94 年國中基測國文科和英語科進行性別差異與差異試題功能(DIF)分析,盧雪梅、

毛國楠(2008a)針對90至94年國中基測數學科進行性別差異與差異試題功能

(DIF)分析,盧雪梅、毛國楠(2008b)針對90至94年國中基測自然科進行性別 差異和差異試題功能(DIF)分析,及盧雪梅(2009)針對90至94年國中基測社 會科進行性別差異與差異試題功能(DIF)分析,而且國內針對國中基測DIF實徵 分析研究的試題領域幾乎都以數學、語文為主,自然科方面則較缺少相關研究。

因此,本研究將以95至97年度國中基測中自然科題目來進行DIF實徵分析研究。

歐、美國家針對測驗試題「公平性」的議題,最早從1960年代初期就開始探 討,當時大眾提倡機會均等,對於弱勢團體逐漸重視,加上社會婦女權的解放及 種族平等運動的興起,因此對於測驗試題是否會對特定族群不公平而無法表現出 應有能力的問題開始注意(Cole,1993),但剛開始以試題偏誤(item bias)來定 義,在字面上容易給人偏頗負面的不良觀感,因此有學者提出以「差異試題功能」

(differential item functioning,以下簡稱DIF)一詞來代替(Holland & Thayer, 1988),表示雖然試題發揮了不同的功能,但不一定單指負面消極的功能。關於 DIF的定義,先前被認為:「在某個試題上,如果多數族群和少數族群的平均表現 有所不同的話,該試題便具有DIF現象」(余民寧,1993)。但這並未考量到能力

相同與否的問題,可能這兩個群體之間的能力本來就有所不同,才造成在試題上 表現有所差異(Lord, 1980),如果只是因能力不同所造成的表現差異,只能稱之 為「impact」(Dorans & Holland,1993)。余民寧(1993)曾提及,目前能被大多 數學者接受的DIF定義方式為:「來自不同的族群或團體,但能力相同的個人,在 作答某試題上的機率卻有所不同,則該試題便具有DIF現象。」如果測驗題目具 有DIF現象,表示同一試題於兩團體或族群當中展現出不同的功能(functioning), 可能是因不同性別、種族或是地區性教學差異、生活經驗不同、資源分配不公等 等因素所造成的(余民寧、謝進昌,2006),若經由DIF的統計分析發現有DIF問 題的存在,表示DIF試題可能對於某一群體有不公平的現象,因此要進一步就試 題質的部份來分析,若發現此問題確實有偏誤現象,則以後應避免出類似問題(曾 建銘,2005),基於上述理由,本研究欲針對國中基測自然科考題中出現性別DIF 及區域DIF現象的試題,就質與量的方面進行題目內容檢視與作答反應之選項統 計分析,來探討該試題發生DIF的原因及試題是否真有試題偏誤的現象。

近年來,針對中學生數學與科學學習成就的國際評比研究引起了廣泛的注 意.目前在中學生科學學習成就的國際比較研究中,以國際數學暨科學趨勢研究

(TIMSS)與國際學生評量計畫(PISA)最受注目。TIMSS為國際教育學習成就 調查委員會(The International Association for the Evaluation of Education

Achievement,IEA)每四年舉辦一次之大型國際教育評比,測驗的命題內容,以 TIMSS 2007中施測的國二學生為例,科學命題內容分為:生物、化學、物理、地 球科學等四類。而PISA是一項以年齡為導向的調查研究,採取素養(literacy)的 觀點設計測驗,測驗的內容主要分為三個領域:閱讀素養、數學素養及科學素養。

在科學素養方面,所測量的科學概念包括科學日常生活、健康、環境和科技各方 面的應用。由此可知,國際上開始重視科學領域的學習發展,而台灣的學子也不 負眾望,在國際評比上皆有優異的表現。在我國的九年一貫課程中,國中科學教 育屬於「自然與生活科技領域」的範疇,學習領域主要內涵為:物質與能、生命

世界、地球環境、生態保育、資訊科技等的學習、注重科學及科學研究知能,培 養尊重生命、愛護環境的情操及善用科技與運用資訊等能力,並能實踐於日常生 活中。學習領域之教材內容要項共分成五大課題,分別為:自然界的組成與特性、

自然界的作用、演化與延續、生活與環境、永續發展,十三個主題分別為:地球 的環境、地球上的生物、物質的組成與特性、改變與平衡、交互作用、構造與功 能、生命的延續、地球的歷史、生活科技、環境保護、生態保育、科學與人文、

創造與文明(教育部,2006)。

以往對於DIF的研究大部分都只在於個別試題的DIF估計,如果DIF的量值達 到顯著水準,該試題便被認為應該刪除或避免出現類似題目;但DIF只是統計上 的測量結果,並不是非得刪除該試題不可(Angoff, 1933);相反的,有DIF現象 的試題可能表示著某些課程或教學上所需要的改變(Harris & Carlton, 1993; Lane,

以往對於DIF的研究大部分都只在於個別試題的DIF估計,如果DIF的量值達 到顯著水準,該試題便被認為應該刪除或避免出現類似題目;但DIF只是統計上 的測量結果,並不是非得刪除該試題不可(Angoff, 1933);相反的,有DIF現象 的試題可能表示著某些課程或教學上所需要的改變(Harris & Carlton, 1993; Lane,