命題技巧與規範

第二章文獻探討

第四節命題技巧與規範

編擬試題是測驗編製的主要核心，一份測驗是否具有良好的特徵，例如：信度、效度、難易適中、高鑑別度等，試題編製品質的好壞占了絕大部分。編製試題時，除了應遵守命題的一般原則外，也應該遵守特殊題型的命題原則內容，如

此才能編製出品質優良的試題，以下就命題技巧方面來個別討論(余民寧，2002)：

壹、測驗編製計劃

一個完整的測驗編製計劃可以涵蓋整個教學歷程，它不但可以提供授課教師遵照教學目標進行教學的依據，也可以做為測驗試題的參考，來達到評量教學所預期的成果。一份優良的成就測驗編製計劃應該包含下列這三大項目：

一、先確立測驗的目的和目標

不同的測驗會有不同的特性和編製過程。一般而言，測驗可以分為四類：

（一）形成性測驗(formative test)。

用來瞭解在教師的教學過程中，學生的學習情形，是一種在師生間進行即時性教學回饋的方式。

（二）總結性測驗(summative test)。

用來評量教師教學完成時，學生的成就表現，以確定學生的學習是否臻於精熟，或達到教師所預期的教學目標。

（三）診斷性測驗(diagnostic test)。

用來診斷學生在學習過程中所遭遇的學習困難或產生的迷思概念，是補強教學的主要依據。

（四）預備性測驗(placement test)。

用來評量學生的起點行為，以便將學生安置在適當的教學計畫中。

二、設計雙向細目表

依據測驗的目的與教學的目標需求，用教學目標為當作縱軸，以教學內容或單元為橫軸，畫出一個二向度的分類表，將平均分配好試題比重或題數在表中的每個細目裡，並盡量使試題的取材能夠充分涵蓋所謂評量的教學目標和教材內容的範圍，來做為編製整份成就測驗試題的依據，這樣一個二向度分類表就是雙向細目表(two-way specification table)。一份完整的雙向細目表，需要事先明確條列

教學目標和教材內容，來建構一個具有兩個向度的列表。其中，認知教學目標在 1999 年由 Bloom 的學生 Lorin Anderson 和同僚出版了 Bloom 分類法的修訂版，考慮到影響教學的更廣泛因素，經過修訂的分類法試圖修正原本的分類方式，修訂後分類法中的「認知歷程」向度，與 Bloom 原分類法一樣有六種技能，

從最簡單到最複雜依序為：記憶、理解、應用、分析、評鑑、創造。

（一）記憶（remember）：主要是長期記憶中儲存的相關資訊。

（二）理解（understand）：從教育材料找出涵義的能力。

（三）應用（apply）：在類似情境或新情境中，可以實際運用的能力。

（四）分析（analyze）：將一個概念拆解成許多部分，並說明每部分與整體之關係，學生透過辨別、組織和歸納進行分析。

（五）評鑑（evaluate）：原先 Bloom 分類法是歸納在最高的一層，經過修訂後成為第五層，包括檢查和批判兩種技能。

（六）創造（create）：原分類法中沒有，在新的分類中則是最高的一層，這項技能組合已知的知識片段來產生新的事物，完成創造任務的技巧包括產生、計畫和製作。

與 1956 年版本不同的地方是，新版本做了「what(有關什麼)」和「how(如何解決)」的區分。「知道什麼」屬於知識向度，知識向度主要分為四大類：事實知識、概念知識、程序知識和後設認知知識。事實知識包括獨立的片段資訊，如辭彙的定義、有關特定細節的知識等。概念知識由資訊系統構成，如分類和類別的資訊。程序知識包括運算法則、學科相關技能與規則、技術、方法，以及何時運用的知識。後設認知知識是有關思考的知識，以及如何有效操控思考過程的資訊。

三、選擇測驗的題型及題數

試題是構成測驗的主要元素之一，試題的好壞自然會影響整份測驗的品質，

測驗的試題類型，才能順利編製所期望的優良試題。試題類型很多，常見的題型主要分為兩大類：客觀測驗(objective test)與論文測驗(essay)。客觀測驗可細分為選擇題型、補充題型、選擇題型包括是非題、配合題、選擇題等三種，補充題型包括填充題、簡答題等兩種。論文測驗則包括申論題、限制反應題等兩類。計分較為客觀的是選擇題，而且考試範圍可涵蓋較廣泛，並可以測驗到多元知識。所以大部分的考試還是以選擇題為主要採用題型。而題數的多寡要考慮到很多因素，例如測驗時間、試題難度或是學生能力等。

四、編擬測驗試題

編擬試題不但要講求命題技巧、試題難度，而且必須兼顧雙向細目表。根據雙向細目表中每個單元的題數與配分來作為命題依據，而且試題的難易度不可偏離測驗目的與教學目標，試題的編寫也不應該違反命題原則。

五、審查與修改測驗試題

針對題目的性質是否符合測量的內容進行評估，除了審查是否符合教學目標、教學內容等，此外需檢查試題的格式、問題敘述的品質、其他可能影響因素以及試題是否能夠適當反應試題所要測量的教學目標。一般而言，為了解試題的是否合適，可以利用檢核表來審查試題公平性、試題格式以及是否符合命題原則等，也可以藉由專家意見來審視題目的優劣。

六、編輯測驗試題

測驗試題的編排、語意的完整性與明確性，將影響學生作答的效率與評量結果，命題者應審慎編輯測驗試題，來提高測驗的信度與效度。難度方面，大多以難易適中的試題為主，但也要包含少許簡單和困難的試題，讓不同能力程度的學生作答有所差異，來提升鑑別度。試題的排列方式可以選擇下列三種進行編輯：

（一）將簡單試題排列在整份試卷前面，較困難試題排列在後面。

（三）依照認知目標的六個層次順序來排列試題或是依所需要測量的能力指標來排列試題。

貳、選擇題的命題技巧

選擇題是當今測驗題型中，被認為最基本、使用最廣、影響最深遠的一種，

選擇型試題（selection-type item），尤其是配合電腦的使用，使得閱卷、計分、試題與測驗分析結果均相當快速與正確，並且容易蒐集分析資料來了解學生作答的行為，因此，受到大眾的喜愛與採用。選擇題是在每個問題的後面列舉幾個答案，

由學生將所需要的答案選擇出其由兩部分構成：一為題幹(Stern)，另一為選項 (Option)。題幹的敘述方法主要有兩種，一是採用直接問句，另一是採用不完全的敘述句。以下先說明選擇題的命題原則(余民寧，2002)：

一個有效的選擇題，不僅僅能夠呈現重要的問題來詢問學生，更能夠讓學生清楚了解該問題的意思是什麼。因此它可以讓已達精熟學習的學生答對，可以使尚未達到精熟學習的學生答錯，以發揮選擇題試題特有的「多選一」區辨功能。

一、選擇題的教重要的命題原則有下列幾點：

（一）試題設計應該要能夠測量到重要學習成果。

（二）每道試題選項數目應保持一致。

（三）題幹敘述應該清楚表達題意，避免過短或過長。

（四）選項的敘述宜力求簡短，必要或相同的敘述字詞應放在題幹中。

（五）盡量在題幹中以肯定句的敘述問題。

（六）試題必須確定只能有一個清楚表達的正確答案。

（七）錯誤選項應盡量避免使用「以上皆非」和「以上皆是」。

二、選擇題的命題原則有：

選擇題試題可以測量出各種不同程度的學習成果，如：記憶、理解、應用、

分析、評鑑、創造等認知能力，同時也可以適用於各種不同學科範疇的教材內容，

以作為測量認知能力的一種測驗。選擇題主要具備有下列幾項優點：

（一）比起是非題或填充題，選擇題題意結構串較清楚明確。

（二）信度比是非題高，猜測因素減少許多。

（三）配合電腦閱卷，可以迅速、正確的計分。

（四）試題難度可藉由調整選項的同質性而來控制。

但是，選擇題亦有下列幾項使用上與編製上的限制：

（一）選擇題命題較不容易，尤其是具備有誘答選項之設計。

（二）較難測驗到組織與表達的能力。

（三）命題技巧不良時，容易使題目只測量到知識的記憶等低層次能力。

（四）測量的能力限於文字操作。所以數學與自然科學等實際解決問題的能力，較不適合於採用選擇題來命題。

參、多點計分

傳統的認知測驗中主要以二點計分為主，二點計分試題順序理論（ ordering theory），最早是由 Airasian & Bart（1973）提出，又稱為 OT 理論，竹谷誠（1980）

考慮兼顧相依程度之試題順序，提出二點計分試題關聯結構理論（item relational structure），簡稱 IRS 理論。二點計分是指受試者的作答反應只有對或錯二種情況。常見的測驗題型包含單選題、是非題都是屬於二點計分的題型。

余民寧(2009)認為多點計分往往都是適用在心理測驗資料的分析，因心理測驗大多是測量受試者的某種潛在特質 (如：人格、態度、性向等)，其作答並沒有所謂的「標準答案」，所以受試者沒有必要進行猜題，因此，在此種作答情形下，

三參數對數型模式中的 c 參數是不存在的，所以此類模型是根據一參數對數型模式所發展而來，可作為分析李克特量表所屬的各種測量工具，可以改進社會科學研究的測量精確度，對於社會、行為科學及教育研究的量化方法學而言，具有著實的貢獻。

劉湘川（2007）提出多點計分有助於異質試題的分析比較，透過多點計分規格化的轉換，具有二點計分考慮到作答者的反應程度，更可以呈現試題難易程度的分析比較，解決了在二點計分底下無法呈現試題難易區別的問題。

在文檔中多點計分S-P表分析法之應用 -以國小四年級自然科評量為例- (頁 24-31)

第二章 文獻探討

第四節 命題技巧與規範

壹、測驗編製計劃

貳、選擇題的命題技巧

參、多點計分

第二章文獻探討

第四節命題技巧與規範