第二章 文獻探討
第四節 命題技巧與規範
編擬試題是測驗編製的主要核心,一份測驗是否具有良好的特徵,例如:信 度、效度、難易適中、高鑑別度等,試題編製品質的好壞占了絕大部分。編製試 題時,除了應遵守命題的一般原則外,也應該遵守特殊題型的命題原則內容,如
此才能編製出品質優良的試題,以下就命題技巧方面來個別討論(余民寧,2002):
壹、測驗編製計劃
一個完整的測驗編製計劃可以涵蓋整個教學歷程,它不但可以提供授課教師 遵照教學目標進行教學的依據,也可以做為測驗試題的參考,來達到評量教學所 預期的成果。一份優良的成就測驗編製計劃應該包含下列這三大項目:
一、 先確立測驗的目的和目標
不同的測驗會有不同的特性和編製過程。一般而言,測驗可以分為四類:
(一) 形成性測驗(formative test)。
用來瞭解在教師的教學過程中,學生的學習情形,是一種在師生間進行 即時性教學回饋的方式。
(二) 總結性測驗(summative test)。
用來評量教師教學完成時,學生的成就表現,以確定學生的學習是否臻 於精熟,或達到教師所預期的教學目標。
(三) 診斷性測驗(diagnostic test)。
用來診斷學生在學習過程中所遭遇的學習困難或產生的迷思概念,是補 強教學的主要依據。
(四) 預備性測驗(placement test)。
用來評量學生的起點行為,以便將學生安置在適當的教學計畫中。
二、設計雙向細目表
依據測驗的目的與教學的目標需求,用教學目標為當作縱軸,以教學內容或 單元為橫軸,畫出一個二向度的分類表,將平均分配好試題比重或題數在表中的 每個細目裡,並盡量使試題的取材能夠充分涵蓋所謂評量的教學目標和教材內容 的範圍,來做為編製整份成就測驗試題的依據,這樣一個二向度分類表就是雙向 細目表(two-way specification table)。一份完整的雙向細目表,需要事先明確條列
教學目標和教材內容,來建構一個具有兩個向度的列表。其中,認知教學目標在 1999 年由 Bloom 的學生 Lorin Anderson 和同僚出版了 Bloom 分類法的修訂 版,考慮到影響教學的更廣泛因素,經過修訂的分類法試圖修正原本的分類方 式,修訂後分類法中的「認知歷程」向度,與 Bloom 原分類法一樣有六種技能,
從最簡單到最複雜依序為:記憶、理解、應用、分析、評鑑、創造。
(一)記憶(remember):主要是長期記憶中儲存的相關資訊。
(二)理解(understand):從教育材料找出涵義的能力。
(三)應用(apply):在類似情境或新情境中,可以實際運用的能力。
(四)分析(analyze):將一個概念拆解成許多部分,並說明每部分與整體之 關係,學生透過辨別、組織和歸納進行分析。
(五)評鑑(evaluate):原先 Bloom 分類法是歸納在最高的一層,經過修訂 後成為第五層,包括檢查和批判兩種技能。
(六)創造(create):原分類法中沒有,在新的分類中則是最高的一層,這項 技能組合已知的知識片段來產生新的事物,完成創造任務的技巧包括產 生、計畫和製作。
與 1956 年版本不同的地方是,新版本做了「what(有關什麼)」和「how(如 何解決)」的區分。「知道什麼」屬於知識向度,知識向度主要分為四大類:事實 知識、概念知識、程序知識和後設認知知識。事實知識包括獨立的片段資訊,如 辭彙的定義、有關特定細節的知識等。概念知識由資訊系統構成,如分類和類別 的資訊。程序知識包括運算法則、學科相關技能與規則、技術、方法,以及何時 運用的知識。後設認知知識是有關思考的知識,以及如何有效操控思考過程的資 訊。
三、選擇測驗的題型及題數
試題是構成測驗的主要元素之一,試題的好壞自然會影響整份測驗的品質,
測驗的試題類型,才能順利編製所期望的優良試題。試題類型很多,常見的題型 主要分為兩大類:客觀測驗(objective test)與論文測驗(essay)。客觀測驗可細分為 選擇題型、補充題型、選擇題型包括是非題、配合題、選擇題等三種,補充題型 包括填充題、簡答題等兩種。論文測驗則包括申論題、限制反應題等兩類。計分 較為客觀的是選擇題,而且考試範圍可涵蓋較廣泛,並可以測驗到多元知識。所 以大部分的考試還是以選擇題為主要採用題型。而題數的多寡要考慮到很多因 素,例如測驗時間、試題難度或是學生能力等。
四、編擬測驗試題
編擬試題不但要講求命題技巧、試題難度,而且必須兼顧雙向細目表。根 據雙向細目表中每個單元的題數與配分來作為命題依據,而且試題的難易度不 可偏離測驗目的與教學目標,試題的編寫也不應該違反命題原則。
五、審查與修改測驗試題
針對題目的性質是否符合測量的內容進行評估,除了審查是否符合教學目 標、教學內容等,此外需檢查試題的格式、問題敘述的品質、其他可能影響因素 以及試題是否能夠適當反應試題所要測量的教學目標。一般而言,為了解試題的 是否合適,可以利用檢核表來審查試題公平性、試題格式以及是否符合命題原則 等,也可以藉由專家意見來審視題目的優劣。
六、編輯測驗試題
測驗試題的編排、語意的完整性與明確性,將影響學生作答的效率與評量 結果,命題者應審慎編輯測驗試題,來提高測驗的信度與效度。難度方面,大 多以難易適中的試題為主,但也要包含少許簡單和困難的試題,讓不同能力程 度的學生作答有所差異,來提升鑑別度。試題的排列方式可以選擇下列三種進 行編輯:
(一)將簡單試題排列在整份試卷前面,較困難試題排列在後面。
(三)依照認知目標的六個層次順序來排列試題或是依所需要測量的能力 指標來排列試題。
貳、選擇題的命題技巧
選擇題是當今測驗題型中,被認為最基本、使用最廣、影響最深遠的一種,
選擇型試題(selection-type item),尤其是配合電腦的使用,使得閱卷、計分、試 題與測驗分析結果均相當快速與正確,並且容易蒐集分析資料來了解學生作答的 行為,因此,受到大眾的喜愛與採用。選擇題是在每個問題的後面列舉幾個答案,
由學生將所需要的答案選擇出其由兩部分構成:一為題幹(Stern),另一為選項 (Option)。題幹的敘述方法主要有兩種,一是採用直接問句,另一是採用不完全 的敘述句。以下先說明選擇題的命題原則(余民寧,2002):
一個有效的選擇題,不僅僅能夠呈現重要的問題來詢問學生,更能夠讓學生 清楚了解該問題的意思是什麼。因此它可以讓已達精熟學習的學生答對,可以使 尚未達到精熟學習的學生答錯,以發揮選擇題試題特有的「多選一」區辨功能。
一、選擇題的教重要的命題原則有下列幾點:
(一) 試題設計應該要能夠測量到重要學習成果。
(二) 每道試題選項數目應保持一致。
(三) 題幹敘述應該清楚表達題意,避免過短或過長。
(四) 選項的敘述宜力求簡短,必要或相同的敘述字詞應放在題幹中。
(五) 盡量在題幹中以肯定句的敘述問題。
(六) 試題必須確定只能有一個清楚表達的正確答案。
(七) 錯誤選項應盡量避免使用「以上皆非」和「以上皆是」。
二、選擇題的命題原則有:
選擇題試題可以測量出各種不同程度的學習成果,如:記憶、理解、應用、
分析、評鑑、創造等認知能力,同時也可以適用於各種不同學科範疇的教材內容,
以作為測量認知能力的一種測驗。選擇題主要具備有下列幾項優點:
(一)比起是非題或填充題,選擇題題意結構串較清楚明確。
(二)信度比是非題高,猜測因素減少許多。
(三)配合電腦閱卷,可以迅速、正確的計分。
(四)試題難度可藉由調整選項的同質性而來控制。
但是,選擇題亦有下列幾項使用上與編製上的限制:
(一)選擇題命題較不容易,尤其是具備有誘答選項之設計。
(二)較難測驗到組織與表達的能力。
(三)命題技巧不良時,容易使題目只測量到知識的記憶等低層次能力。
(四)測量的能力限於文字操作。所以數學與自然科學等實際解決問題的能 力,較不適合於採用選擇題來命題。
參、多點計分
傳統的認知測驗中主要以二點計分為主,二點計分試題順序理論( ordering theory),最早是由 Airasian & Bart(1973)提出,又稱為 OT 理論,竹谷誠(1980)
考慮兼顧相依程度之試題順序,提出二點計分試題關聯結構理論(item relational structure),簡稱 IRS 理論。二點計分是指受試者的作答反應只有對或錯二種情 況。常見的測驗題型包含單選題、是非題都是屬於二點計分的題型。
余民寧(2009)認為多點計分往往都是適用在心理測驗資料的分析,因心理測 驗大多是測量受試者的某種潛在特質 (如:人格、態度、性向等),其作答並沒有 所謂的「標準答案」,所以受試者沒有必要進行猜題,因此,在此種作答情形下,
三參數對數型模式中的 c 參數是不存在的,所以此類模型是根據一參數對數型 模式所發展而來,可作為分析李克特量表所屬的各種測量工具,可以改進社會科 學研究的測量精確度,對於社會、行為科學及教育研究的量化方法學而言,具有 著實的貢獻。
劉湘川(2007)提出多點計分有助於異質試題的分析比較,透過多點計分規 格化的轉換,具有二點計分考慮到作答者的反應程度,更可以呈現試題難易程度 的分析比較,解決了在二點計分底下無法呈現試題難易區別的問題。