• 沒有找到結果。

由多元評量的觀念看傳統評量的角色與功能

N/A
N/A
Protected

Academic year: 2021

Share "由多元評量的觀念看傳統評量的角色與功能"

Copied!
5
0
0

加載中.... (立即查看全文)

全文

(1)

由多元評量的觀念看傳統評蠶的角色與功能

林世曹

盟立盔灣師範大學

教育I~\盟與蜻導學系

首先從縛統評麗的定位來看,多元許暈、男頸評量,成變;最評蠱,基本上都是現在許 囊中梧當璽要的讓勢。有待 11.更甚至三寫了對照的需要,經償提傳統評蠶定住在紙筆式的潮驗, 主要至更權化到可以電腦化閱戀的選擇題,也就是說大部分是以選擇聽作為多元評蠱的一餾 對無義準,從事科學研究很喜歡唱道輯方法,問路本身無法很順利彰顯功能接特啦,總是 要有一個對照,所以傳統評童在這角色上扮演得相當不錯。今天我會是從一般評麓的觀點、 一般教學的觀點來看評羹。教學蕃本棋式大家都知道它的!聽序,教學目標先發生,起點行 爵的測讓再發生,冉來是教學活動的發覺,最後才是教學許章,用以是目標先發生,評量 是根嫌目標來決定,所以雖是教學岳標引導立決定許麓, 。不葷的攀實是教學評 最卻最喜歡影響了教學活動,甚至教學自標,學報上道是不對的,但在卻發生了,因此在從 事諜報教學或部實培實上,一定要記住這個事實趕不正確的 o 雖然不對,很多老師是如何 學會的事師資培菁舉校老師沒教,任教老師卻自己自然認然學會了。尤其在閩中教番以後 老鄧經常會高接擺一個問題 r 如果你不告訴我嬰考什麼,我怎麼知道要教什麼? J 我覺 得混賭輸是有灑輯上的問題。罰為若不苟的話,豈不是就不用教了嗎?小學嘉定不用教了, 間為沒有考試。問題發生的關鐘點在彈藥呢?在 1993 年 G itomer(l 993)的一篇「實作評量與 教育棋盤」的文章中就提到單鐘開紹,我稱它為多元評蠶與傳鏡評黨所鑽過的一個點, Gitomer 引用兩個餅子 (Chase&Simon,

1973)

:好的閱讀者純較正常、投璋的辨認文章中的字; 另井一個偶子,下棋高手能誌手更能精確的記懼棋子在棋盤中的位子。這爾個例子告訴 我們的幾個觀念及他們所發生的幾值問題:文字辨認能力與棋盤記憊的能力或技能;另外 商個可能是我們較關心的,閱讀能力及棋藝怎能力,前面需輛車質上更是當他下棋下得很好或 閱讀磁力很強時,所必然發生的特穗,叫 emergent

properties

(未科特徵) ,作者的黨思主是 說,用評麓的觀點來看,這吉護自蠱學生的文字辨認與棋盤記憶的能力,我們就會把活爵繡視 鵝閱讀能力及模與能力的代理混議(proxy me在sures) 。國Jlt訓練文字辨認及棋盤記憶的能力 並不意味替你的體議或棋英能力是能問時被培讓出來的。但這皆未必,國為代理測量與能 力培攘的完艷領域之間的關餅、自當並不明確。各位若類推這個體係﹒目:饅頭來看盟內大裂 的考試,其實令天我們發生的問題是在大盤考試或聯招裡頭,事實上是大蠶使用代理、測量 的概悉, {且自為道控代理測蠶遲早續對外公告,事貨上對憊代埋頭f聾的能力的轉官價一再發 生,相對的失掉蜀中教育真正要培養的能力,斯 PJ 評蠶本身是無過的,是後來的使用發生 一 67

(2)

中發民過八十九年六月

1lt

23] 期 科學教育丹刊 了問題 a 另外,盟內有些特別現象,尤其在聯考一再發生一峰不躍發生的事情,聯考賽規 :所有試題的用字用語不能超出課本之範擂,英文科是不可以用時這餾字,思為它沒有 出現在課本,所以出題用 fly ~護個字便去是握過範圈。事實上還是在棋行整個入學考試計量擎的 一體很大的弊端 o 代理制麓的公佈慶大家便於訓練代理湖麓,續成大家在部 i 練文字辨認、

棋盤記體之能力,悶不是培養閱讀及模贊能力 o

結果

一般的!咱

育目標層次

芳玄

皮特定的

短期

長期

評量期間

教育脈絡中多元評聾的西向(摘自 Gitomer,

1993)

接聲,說世仿殼聽教授所說的定位問題,在多元野黨的觀點中,事實上是把評量的觀 念擴大謂不是多元許麓毒草念出現之後排擠另外…些乎乎在相當有歷史的評蠶方式,所以我錯 用 Smith 在 1976 年提品的一個摸式, j鑫模式臨許釁從之三餾蔚向東看,道三欄面向分別從審 鐘頭閥、明確程度及教育盟標肩攻。所謂教育臼標層次是指:它有多接近教育目標的程度, 此…模式是否好,我不知道,不搗它至少符合我的需要. )所以它不是公認的定位,是我接 受的定位 o 當中所說評靈期間的長妞,若是傅饒的評麓,紙筆鞠輯或選擇體通常待閱較短, 若是實作評量盤比較長的詩聞;若從明獵程度來藹,是要看評量所提f共之訊息,明確程度 有多大,種定用寫作能力觀諱:東頭,若只是檢測他寫作中的主詢、是檢湖地寫作中的主詢、 動詞,是否能配合來使賠之能力, i這項鵲暈的訊息是非常明確的. f呈著覺著寫作中作品產

(3)

è 多元梓葷的觀念看傳統評量的角色與功能 生的溝通的訊息是否有效,這就不是很明確,比較一般性。關鷗課教授斯提的實作言學盤中, 大部分之目標較一般或完整一點,若能教育目標層次來看,其實罷替它與真正教育居標有 多接話,分別是分成行為、結果、成效的三個層次來看, i隨著從讀及寫道兩個能力來看, 行為的層次很可能會去測蠶蝕的編碼之速度,目為它與讀寫在嚮切觀餘,它是一種行為, 其蠻有點類似代理報寰的概念;若能結果層次來看,就是醬醋讀的水運豈有多高;若能成效 觀點來者說不單純了,說教育的自擇嚷著,要評的是輯底遲到哪擱層次,例如:連到高中 以上的水準'有多少人譯過高中的程度,有點類似教會指標的觀念,我們關家續有一些教 育指標來了解攝入能力的品質如惘,是鸝於這個層次。若道樣看,傳統許聾的定位就會比 較清楚,它就會落在此一模式在下角的位露,多元許蓋章大多數可能會在右醋,上面一點, 較偏向結果,跟傳統評聾的位子不太一樣。基本上這是我對宙的結位。 接下來,從多元許聾的觀點比較由來,主要使許黨所用問題的性實來疇,概與1 鶴教授 也許論到傳統許蠱所面對的問題, ;Ì遷常比較結構、比較明確的,通常 t位最比較沒有線件的, 另外一個說竟是它所涉及輯的知識通常是非常有限的。多元評聾的開瓏,性質,通常是比較非 結構,問題的解釋有條件限錯,另外涉及對比較大的時題是多元碎葷的解答是會廣泛潛及 到各贖知識,特定的主題的知識領城, j這是一般我們在看多元許盤及傳統評麓的比較時, 在追問題的性質上來署。給各位一個例子,這髓棚子是改自 GMAT' 這漿管理學科研究所的 入學考試出現道樣的一儷聽自「文件影印一頁的價格是 4 元,一份有 x 冀的艾件,若要影 印 x 份,請問多少錢? J 各位會覺得閣態的是,這與管理有何鞠 f系,還涉及到它在管理上 性向棋盤時所用之代理瀾蠶觀念楚什麼?多元評葷的問題會是如下 r 影印部門想要更新 影印設備,以提昇營運效率,請問應做些什麼? J 這兩鋪問題以本黨來薯, ~愛者較接近管 理的觀念,前者則比較間接 e 在比較多元許最與搏統評盤時,能問題的世質來看這輛個問 題其實是非常不一樣。不一樣就可能代表它可能在用途盾的上不覓得一碟。、 最後,從傳統評靈揮一錯較小的問題,其實也是較被忽略的問題,關棟教授也聽到師 大旗驗統計這門課之教釀,或是評量還1驗之教學,事實上比較強諧的都份一麗是湖驗的技 稱,以制驗為單位的投 f耘,始終稍微被怨、略的是命聽這部份,也就是如何把試題寫出來。 問島事實上把試題寫出來後,兢較接近多元許蠢的觀念所以特別把這部份跳出來看看搏 繞評量在目前發展的情況及其所作的勢力,傳統評蠶對試題的意義,華本上是聽為任何一 體許靈上所用錯的試題,不一定只是選擇題,它覺真有刺數及引導的作用,能引導舉生作 答的一種棋蠶單位,的於引起學生的反應,而基本上是體設違反應是建立在學生的心理鐘 構,問我們對此心理連構是感興趣,比如說,劉道個知諧、棋道爾能力或測他的動機,涉 一 69 一

(4)

科學教實男子才 第 231 緝 令乏善民鸝八十九年六另 及到湖蠶蠶化之功能,是一種數撞詮釋之權觀,學生是被剩激物, N[J 試題研引導, 在今個被動的情形下,學生的行嗎反應聲用來詮釋心理的聽構。其次是要報告傳統研攪對 試闊的一個評最基準'當然間的必須是吻合,評量試閥的凹的是要清楚界定;另外J必須要 把評盤試輯之測量誤差將之最小龍,這是因為激量本身舟、須要在減低誤差的可能性, 元音字撞在觀點上轉擻有點出入的一點;另井評蠶試聽聽型 f皂、須適合於許暈目妞, 彈題是繼續在發展,諾不是躊躇多咒語量出來接諾持止,能不可否認,許童尤其是轉緩, 它的瞥餾研究基體,雖然已使用將活 100 年,但其研究籬館對現在還沒有一錯共議攏的結 果出來,遍是非常經驗性,跟著教學一直在走。因此它所出現的各式各樣題型,縛軾的美麗 擇關組君也是有一個題幹,自[J閥間,有四個選項,其中一個丟在正確的,另外三個是聽答潑頂, 所謂誘答主義項是具有誘惑力,學生會去選它,剛剛陳教攪所構的是事實,那三個誘答是發現 最難出的,研究很早就告訴我們,任的人可以寫品一個誘答就很了 若有揖錯位真誘答有誘答王起攏,路已經是非嘗不容易,斯拉接寫出三蝠,總更是要放讓一體 自攤躍環在裡頭,所以各{立一定很容裝了解,建什麼以上皆鼻、以上音是很容器出現,說 為繹不出第三值了。所以確賞這是個很大的盟難。另外轉統題盟主要有三種題嫂,分 :在組幹上出現一個 ,即每個選目 ,或試題幹上站現一個來完成語句題型, ,其中一個是最佳的,造廠傳統的選擇題,但傳統的潛擇 題之外有很多變形。事實上這峙蠻形也是國應它所受到之限制,比如說,選擇關受到織大 的一餾撓戰是:它釋是濟至1 一盤零零星事碎的知識,有時難強可以現j至2 零碎的技攏, ,無以選擇題是否有輯來作高層次思考的興蟻,答案是正冉的' ,甚至在 90 年以後偕們譯大量研究這些東醋,所以包括題望在肉,能如說增 列擺噴的概念。事實上選擇聽另外一餾接說評的是:它可低揖 j高的,所以從事數學教育的 人都很聰明,你這樣來,我就i這樣對付你,他出了 10 ,我說四個都寫不出來, 10 棚,第…個是 0.5 .第二個是 1 ·第三個是肘,第問個是 2. 你要我寫 100 {固我都寫的出 來,做問題是答稟會這麼湊巧嗎?總不這樣間,他說你辦出答案最接近上面哪一鶴, ,在做傳統許麓的人漿非常巧惡的,器爵數學聽經常考試考生會幫譜來傲,說 ,所 j兵{寄:考的不豈是他解題的能力,哥是驗黨的能力,能看看老輯出題能力好 ,出的好不好,所以老師說譯以這種東西。重要的總聽其實是選擇題目前的發展,其 中一個是多單是非題,還有一個是多葉選擇題,在大專聯帶出現過,還有一種是脈絡依賴 ,實陳上是類似傳統的髓粗,這個部分在選擇題中是很大的突破,尤其大約是在 90 年 稜 o 在 90 年代以前,傳說心理計處觀點認為題主且在彼此是內部相依的,題臣之間會草棚依

(5)

也多元梓寰的觀;全看傳統評葷的角色與功能 賴,即若混組答對他會得萬分,著答錯他就會全軍覆沒,分數會比較容易兩輝先的現象。

但在 90 年以後,飽們把計分的技衛改變,他們使用題束的觀念,事實上在 90 年代以後,

心理計麓的觀點和學科專家的題組觀念叉開始結合在…錯,間為傳統許畫畫學者對於題組的 觀念搗以非常萬的期許在高層次思考的評蠱,傳綻許3數學者均認路透退題紐約使用聽可以 設計出相當理想的評童工具,以瀏暈高層次思考的能力。

參考文獻

l.

Gitomer

,

D. H.

,

(1993)薔

Performance

as草的 sment

and educational measuremen

t.

In:

民.

E.

Bennett

&

W. C. Ward (Eds.) Construction versus choice in cognitive measurement. Hillsdale

,

New Jersey.

2.Haladyna

,

T. M.

(1

999). Developing and validating

mult自Dle-choice

test items. Mahwah

,

New

Jersey.

棋盤策略盟

設計者:聽昭站

在一張方格紙中,放了一攏的棋子,每一顆棋子放在一個小方播中,並依下列攪則拿

掉棋子:

每次移動跨雄一小路,將一顆棋子橫向或直向跨起相鄰且容棋子的一儡小方格,而進 入下一餾沒有棋手的小方格,即這個方格必績是按有棋子,否則不被允許,隨即把被跨越 誦的棋子拿掉 e

如果在方格級之中兜附近分別鑼鼓如下形式的棋子,哪學形式鐘過若干次取走棋子後,

劉殼後會僅剩下一顆棋子在棋盤上?【把辦得艷的臨出絮,並,在(l 3)~(16) 中,就能辦謂

的,學一餅,寫出你的步驟】 訂)有何,心得? (2)若不能鉤,請說明曙曲。

(取材白:盟立臺灣師範大學料學教育中心舉辦之金先地握自露中學生剝奪競賽超自)

7] 一

參考文獻

相關文件

在 第一講的開始, 我們就明確地指出: 線性代數是研究線性空間, 即向量空間、 模和其上 的線性變換以及與之相關的問題的數學學科。 這一講中,

基本概念 有效教學 差異化教學 多元化評量 適性輔導... A-5-3教學活動中融入學習策略的指導

釋舌相品第六 釋三假品第七 釋勸學品第八 釋集散品第九上 釋集散品第九下 釋行相品第十 釋幻品第十一 釋義品第十二..

由於教科書必須考量市場接受度,前述各地區教科書中對於數學文化元素不同的詮釋方式

3.8.2 學校自評多以教師和學生的觀感作為成效 指標,流於主觀,學校及科組仍未能完全掌握運

通過是次觀課與 評課活動,明白 到有需要擬定清 晰、可量度的評 估準則,才能幫 助學生了解是否

課程詮釋與學習評估 (修訂)

在強化道德的懲戒功能的時候,客觀上,也減低了對信徒的吸 引力。這是一方面。然而,若換一個角度論之,五種姓理論在 心性論方面也有足於啟示後學者,最突出的是將眾生本身的根