• 沒有找到結果。

由於傳統評量的缺失、學習理論的變革、和政治及社會力量的推動,致使傳統的評量逐 漸為人所詬病。又因受到 Howard Gardner 多元智慧理論(theory of multiple intelligences)的 影響,導致評量產生「典範轉移」(paradigm shift)(郭俊賢、陳淑惠譯,民 89)。評量產生

「典範轉移」後,一般教育理論傾向支持多元化評量,其支持的原因,依照 Cunningham(1998)

的歸納有四個原因:(1)對傳統客觀化測驗所產生的負面效果的不滿;(2)對現有心理計量 理論的不滿;(3)學習的社會建構主義模式的影響;(4)基於學校應能促進正向的社會變遷 的信念(引自楊銀興,n.d.)。

楊銀興(n.d.)綜合各家學者們的觀點,認為新式評量產生的原因是由多種因素交錯複雜 運作的結果。提出之後風起雲湧,引起教育界的廣大重視,具體加以歸納可以分成下列幾項:

(1)對傳統式評量引發負面效果的不滿,認為會窄化課程,僵化教師的教學方法;(2)對傳 統心理計量模式的不滿,認為知識視整體的,不可加以分割;(3)認知及建構主義對人類認 知歷程的了解,認為學習是個體主動加以建構的,而不是被動的接受;(4)政治及社會力量 的推動,認為應提高學校教育的績效,並提升學生學業的水準;(5)基於社會公平正義的信 念,反對傳統式評量對弱勢族群學生造成不公的現象;(6)教育目標的改變,終生學習理念 的興起,認為應培養學生問題解決的能力及高層次思考的能力;(7)對學生成績報告方式的 不滿,認為傳統式評量無法充分顯示學生真正的能力。

以下研究者就(1)評量重點的改變;(2)教學評量的原則之改變;以及(3)評量形式 的改變,來說明改變中的科學教育評量實務:

1.評量重點的改變

當整個評量的典範發生轉移之時,科學教育的評量重點必然也跟著改變。下表 1 展示了 美國科學教育標準裡的評量強調重點之改變:

表 1:評量強調重點的改變(NRC, 1996)

較不重視 較重視

 評量容易測量的事項。  評量最有價值的事項。

 評量抽象的知識。  評量豐富的、具結構性的知識。

 評量科學知識。  評量科學的理解和推理。

 以評量得知學生未知的事項。  以評量得知學生已了解的事項。

 只評量成就。  評量成就與學習機會。

 由教師作期末評量。  學生隨時隨地評量自己及他人的工作。

 只由測量專家開發外在評量。  教師參與外在評量的開發。

2.教學評量的原則之改變

鑑於當今學習理論的發展、科學教育本質的改變以及評量典範的轉移,國內外科學課程 標準中的評量標準也對這些趨勢做出了呼應,以下針對美國與本國的部分加以說明如下:

美國科學教育標準中有關科學教學標準(Science Teaching Standards)有五項上位標準,

這五項標準中,均各列有數項教師應做事項,其中第三項為有關教師評量的能力:

(1)使用不同方法,有系統地收集有關學生了解的情形和學生能力的資料。

(2)分析評量的資料以便指引教學。

(3)指導學生自我評鑑。

(4)使用學生的資料、教學觀察,和學生互動以增進教學能力。

(5)使用學生的資料、教學觀察,和學生互動以記錄學生的成效,並找機會學習在學生、

教師、家長、行政各方面的應付能力(NRC, 1996)。

此外,美國國家科學教育標準(NRC, 1996)亦對評量原則有深入而嚴謹的規定,如以 下五個評量標準:

A.評量標準 A

a.評量必須與它的設計目的一致。

b.評量必須被慎重地設計。

c.評量必須明確的陳述其目的。

d.做決定與資料間之關係必須清楚。

e.評量過程的內涵必須一致。

B.評量標準 B

a.學習成就與學習科學機會都必須評量。

b.學習成就資料的收集,焦點在對學生的學習來說是最重要的科學內容。

c.學習機會資料的收集,焦點在最有影響力的指標。

d.學習機會評量與學生成就評量應並重。

C.評量標準 C

a.評量的技術品質需與基於評量的解釋之判斷和作用良好配合。

b.聲稱要測量的特徵須確實的測量 c.評量工作必須有真實性。

d.同一學生在兩個以上相同的成就評量工作表現須相似。

e.學生應有適當機會去測量其成就。

f.不同時間所做的評量工作和模式,應能提供相當穩定的資料,以產生同一決定。

D.評量標準 D

a.評量實務必須公平。

b.評量工作必須檢討下列的使用:固定形式的語句、觀念;對特定族群之觀點或經驗預 設其回應;可能侮辱特定組群之言語;可能引起學生對欲達成的工作分心的其他事項。

c.大規模的評量必須使用統計技術,以確定次群組間的潛在偏見。

d.評量工作必須適當的修改,以適應特別學生之需求,如肢體障礙、學習障礙或語文障 礙等。

e.評量工作必須考慮多種情境,以適合於不同興趣和經驗的學生,且不可預設特定性別、

人種或族群的觀點或經驗。

E.評量標準 E

a.從學生成就與學習機會評量所做之推測必須健全。

b.當從學生成就與學習科學機會之評量資料做出推測時,推測所依據的假設必須清楚的敘 述。

我國九年一貫課程自然與生活科技領域實施要點(教育部,民 89)也對教學評量的原則

Doran, Chan 和 Tamir(1998)等學者指出過去教育評量的形式深受行為主義學習理論

(behaviorist learning theory)的影響。而行為主義有三個主要理論:複雜的學習可以分解成分 離不相連的訊息;學生的學習是將不同的感知和經驗做連結;知識是分離的事實和基本的技 巧之累積。行為主義造成科學教育的教和學都以教科書為主,強調學生記憶不相關連的科學 知識。因此,評量的形式則為選選題、是非題、填充題。學生的學習著重在「對」的答案的 定義而不是發展探究的技能和概念的理解。

然而科學教育的目的除了讓學生獲得科學知識、概念與方法,更強調教學的過程要培養 學生問題解決(problem solving)、高層思考(high-order thinking)、創造思考(creative thinking)

與做決定的能力(decision making),這種教學目標上的轉移擴增,使用傳統以紙筆試、測驗 題為主的評量方式顯然是有所不足,有待設計更多元的教學評估方式(黃鴻博,1996)。

另外,Doran, Chan 和 Tamir(1998)等學者也指出教育者傳統上廣為使用的紙筆測驗,典 型上包括選擇題、是非題、簡答題和短文問題。通常這些評量主要是用於課程或教學單元結 束時,測量全部的學生對於事實和概念之理解。然而,在這些測驗或評量形式上所出的問題

僅能測出低層次的認知技能。所以,在近來的評量改革,採用各種不同的評量工具來測量較 高層次認知技能,如問題解決、探究、傳達、以及人際溝通間的技巧。不同的評量形式可以 被使用於整個教學過程之中以增進學生的學習。大部分的這些方法有一個共同的好處,那就 是,當教師在進行科學課程中,欲測量學生的進步時,就可以使用這些資料以調整教學或提 供個別學生的協助,這些資料的收集也可以幫助教師在未來的科學課程中調整教學策略。教 師可以選擇最適合的教學策略來幫助學生學習新概念,教師也可以使用最適合的評量形式和 技巧以測量學生是否精熟新技能和理解。正如沒有一種教學策略可以適用於每一種學習情 境,所以也沒有任何一種單一的評量形式可以測量出學生學習的每一種面向。下圖 5 的多面 向評量系統是由學生書面形式、教師參與形式及實作形式三種評量類型所組成的。

學生書寫形式 教師參與形式 實作形式

圖 5:多面向評量系統

(Reynolds et al., 1996,引自 Doran, Chan & Tamir, 1998)

九年一貫課程「自然與生活科技」領域亦強調教學評量不宜侷限於同一種方式。其型式 可運用如觀察、口頭詢問、實驗報告、成品展示、專案報告、紙筆測驗、操作、設計實驗等 多種方式,以能夠藉此瞭解學生的學習情況來調適教學為目的,例如,教學目標若為培養學 生的問題解決能力,則可採用成品展示或工作報告的評量方式,而非純以紙筆測驗的方式做 評量(教育部,民 89)。