國立臺中教育大學 100 學年度研究所碩士班招生考試
測驗與評量試題
適用學系:教育測驗統計研究所 測驗與評量組
一、選擇題(每題 2.25 分,共 45 分)
1. 請問課程編製人員在安排課本每一單元內容時,他們最初的主要考量應該為何? (A) 課本每一單元實際包含哪些內容 (B) 課本每一單元應該包含哪些內容 (C) 九年一貫課程綱要 (D) 國內外各種版本的課本內容 2. 請問評量編製人員在安排練習和作業內容時,他們最初的主要考量應該為何? (A) 課本每一單元實際包含哪些內容 (B) 課本每一單元應該包含哪些內容 (C) 九年一貫課程綱要 (D) 國內外各種版本的課本內容 3. 在國際上,教育界普遍公認教學評量應該包含學科、學習、公平、公開、推論、一 致等六大項標準。請問學科標準的主要考量為何? (A) 所有與評量有關的資訊和結果都應該讓學生、家長和教師知道 (B) 透過各種評量方法,讓各種不同的學生,都有適當的表現機會 (C) 各種評量方法都必須提升學生的學習效率 (D) 評量內容和學科內容必須具有相當高的一致性 4. 在國際上,教育界普遍公認教學評量應該包含學科、學習、公平、公開、推論、一 致等六大項標準。請問推論標準的主要考量為何? (A) 透過各種評量方法,讓各種不同的學生,都有適當的表現機會 (B) 所有與評量有關的資訊和結果都應該讓學生、家長和教師知道 (C) 各種評量方法都必須提升推論學生學習成就和課程效度的精確性 (D) 各種評量過程之間,以及其他相關評量系統之間必須具有相當高的一致性 5. 在國際上,教育界普遍公認教學評量應該包含學科、學習、公平、公開、推論、一 致等六大項標準。請問公平標準的主要考量為何? (A) 透過各種評量方法,讓各種不同的學生,都有適當的表現機會 (B) 所有與評量有關的資訊和結果都應該讓學生、家長和教師知道 (C) 各種評量方法都必須提升推論學生學習成就和課程效度的精確性 (D) 各種評量過程之間,以及其他相關評量系統之間必須具有相當高的一致性6. 請問「在家考試」(take-home)是屬於下列哪一種評量方式? (A) 紙筆測驗 (B) 學習檔案 (C) 申論題考試 (D) 選擇題測驗 7. 請問「檔案評量」(portfolios)是屬於下列哪一種評量方式? (A) 紙筆測驗 (B) 非紙筆測驗 (C) 人格測驗 (D) 性向測驗 8. 請問「開書考試」(open-book)是屬於下列哪一種評量方式? (A) 真實評量 (B) 動態評量 (C) 紙筆測驗 (D) 非紙筆測驗 9. 請問「適性測驗」(Adaptive test)是屬於下列哪一種評量方式? (A) 實作評量 (B) 檔案評量 (C) 真實評量 (D) 動態評量 10. 請問下列哪一項最符合「檔案評量」(portfolios)的特徵? (A) 過程 (B) 作品 (C) 速度 (D) 反省 11. 請問下列哪一項最符合「實作評量」(performance)的特徵? (A) 正確 (B) 作品 (C) 演出 (D) 速度 12. 請問當評量編製人員探索課本每一單元實際包含哪些內容時,常用下列何種方法? (A) 因素分析 (B) 知識結構分析 (C) 項目分析
13. 對教材做知識結構分析時,下列何者不是必要過程? (A) 知識結構的各個節點(概念)之間的連線必須藉助統計方法來建立 (B) 知識結構的各個節點(概念)之間的連線必須符合教材內容的邏輯結構 (C) 知識結構的各個節點(概念)之間的連線必須形成樹狀結構 (D) 知識結構的各個節點(概念)所形成樹狀結構可以有不同數量的分枝或階層 14. 對教材做知識結構分析時,下列何者是必要過程? (A) 知識結構的各個節點(概念)之間的連線必須藉助統計方法來建立 (B) 知識結構的各個節點(概念)之間的連線必須符合教材內容的邏輯結構 (C) 知識結構的各個節點(概念)之間的連線必須形成樹狀結構 (D) 知識結構的各個節點(概念)所形成樹狀結構可以有不同數量的分枝或階層 15. 下列何者最不適合做為雙向細目表每一格數字的決定依據? (A) 教學時數的分布 (B) 教材內容的分布 (C) 命題教師的看法 (D) 考生的反應 16. 在編製測驗時,當雙向細目表每一格的數字決定後,接下來應該做下列何者? (A) 就每一格的試題編寫關聯行為 (B) 就每一格的關聯行為編寫試題 (C) 就每一格的關聯行為編寫具體行為 (D) 就每一格的具體行為編寫關聯行為 17. 題組試題之測驗題型若使用三參數單維度之試題反應理論分析時,會產生以下何種 情形? (A) 低估能力參數的估計精準度 (B) 高估能力參數的估計精準度 (C) 可獲得較高的試題參數估計精準度 (D) 以上皆非
18.下列哪一種測驗分析軟體適合用來分析三參數題組模式(three-parameter testlet model, 3PTM)?
(A) BILOG-MG (B) MUTILOG (C) CONQUEST (D) SCORIGHT
19. 下列何者不是試題反應理論(item response theory, IRT)在測驗分析上的功能? (A) 發展測驗的量尺 (B) 估計受試者潛在特質 (C) 篩選試題與修改試題 (D) 了解試題特徵對受試者能力估計的影響 20. 下列敘述何者錯誤? (A) 測量誤差會隨著能力的不同而異 (B) 當試題的難度愈難愈能提供較高的測量精準度 (C) 在古典測驗理論中,測量精準度是以信度來表示 (D) 測驗訊息量愈高表示試題對該能力點的測量精準度愈高
二、名詞解釋(每題 5 分,共 25 分)
1. 動態評量(dynamic assessment) 2. 量尺不確定性(scale uncertainty)3. 局部試題依賴(local item dependence, LID)
4. 建構式反應測驗題(constructed response items, CR items)
5. 定錨不等組設計(non-equivalent groups with anchor test design, NEAT)
三、問答題(每題 10 分,共 30 分)
請先閱讀以下的文章,然後根據文章的內容回答以下問題。
多 向 度 試 題 反 應 理 論
目前常見的多向度試題反應理論(multidimensional item response theory, MIRT)大 多是單向度試題反應模式(unidimensional item response theory, UIRT)的衍生模式。較 常 見 的 多 向 度 試 題 反 應 理 論 模 式 , 分 別 為 多 向 度 隨 機 係 數 多 項 logit 模 式 (
multidimensional random coefficients multinomial logit model,
MRCMLM)、多向度 二 參 數 模 式 ( multidimensional two parameters model, M2PL)、 多 向 度三 參數 模 式 (multidimensional three parameters model, M3PL)。以下將介紹多向度隨機係數多項 logit 模式(MRCMLM)。多向度隨機係數多項洛基模式是由 Adams、Wilson 與 Wang﹙1997﹚等人所提出, MRCMLM 為 Rasch 模式的衍生模式,是一個混合的 co-efficients 模型(mixed co-efficients model),試題參數是由未知的參數ξ所描述,而受試者的潛在變數θ,是一個隨機變項。
∑
= ′ + ′ ′ + ′ = = i 1 ) exp( ) exp( ) , , ; 1 ( K k ik ik ik ik ik | P ξ a θ b ξ a θ b θ ξ B A X ) X ,..., X , X ( 1 2 ′ = i i iKi ik X ,k=0,1,...,Ki:受試者反應型態。) ξ ,..., ξ , ξ ( 1 2 p = ′ ξ :試題參數向量( p 個參數)。 ) θ ,..., θ , θ ( 1 2 D = ′ θ :受試者的能力向量( D 個向度)。 ) ,..., ,... , , ,... , ( 2 1 21 22 2 1 12 11 a aK a a a K anKn a A′= :整份測驗的設計矩陣。 ) ,..., 1 and ,..., 1 ( i ik i= n k = K a :第 i 題中第k個反應類別的設計向量,每個向量長度為 p 。 ) ,..., , ( 1′ ′2 ′ ′ = B B Bn B :整份測驗的計分矩陣。 ) ,..., , ( 1 2 ′ = i i iD i b b b B :第 i 題的計分子矩陣。 ) ,..., , ( 1 2 ′ = ik ik ikD ik b b b b :在 D 個向度中,第 i 題回答第k個反應類別的計分向量。 MRCMLM 模式較複雜,可適用於單向度二元計分和多點計分之題目,也可適用題 間(between-item)多向度測驗架構與題內(within-item)多向度測驗架構。 1. 請舉例說明何謂題間多向度與題內多向度測驗。 2. 若 一 測 驗 題 目 屬 於 單 向 度 多 點 計 分 試 題 , 其 設 計 矩 陣 與 計 分 矩 陣 分 別 為 − − − − − − = = 1 0 0 0 1 1 0 0 1 1 1 0 a a a a A 14 13 12 11 ,