• 沒有找到結果。

測驗與評量

N/A
N/A
Protected

Academic year: 2021

Share "測驗與評量"

Copied!
11
0
0

加載中.... (立即查看全文)

全文

(1)

國立台中教育大學九十五學年度研究所碩士班招生考試

測驗與評量 科試題

選擇題,共 50 題,每題 2 分,共計 100 分。 ※ 說明:以下題目為單選題,但不代表有唯一的標準答案,請詳細比較各個選項後, 選出一個相對的最佳答案。 1. 測驗工具的評定指標中,若以折半信度係數為例,這個評定指標是為了要確認該工具 的哪一項特質? (A) 一致性 (B) 真實性 (C) 可信性 (D) 有效性 (E) 經濟性 2. 若甲的測驗成績以 T 分數表示,則甲的得分為 60,而乙在相同測驗中的得分若以 Z 分數表示則為 1.5,丙的 T 分數則為 50,以下何者較正確? (A) 甲的分數最高 (B) 甲比乙的分數低 (C) 乙比丙的分數高 (D) 甲與乙的分數相等 (E) 乙與丙的分數相等 3. 若以 X = T + E 來說明古典測驗理論的核心架構,其中 X 代表觀察結果,T 代表真實 能力,E 代表誤差,以下答案中,相對之下,何者較正確? (A) X 大於 T (B) T 大於 E (C) X 大於 E (D) T 與 E 相關係數為 0 (E) X 與 T 相關係數為 0 4. 一份新的量化測驗工具的研究發展過程中,若研究者利用因素分析(factor analysis)的 統計方法以確認該份測驗工具的品質,則該研究者是想要呈現該測驗工具的何種指 標? (A) 表面效度 (B) 構念效度 (C) 內容效度 (D) 外在效度 (E) 效標關聯效度 測統測驗與評量組 用

(2)

5. 量化測驗工具的研究發展過程中,最後的階段通常是要能夠提供一套具代表性的常模 (norm)以供測驗工具的後續使用者使用,以下的作為中,何者比較容易達到這個目 的? (A) 增加受測的人數 (B) 增加測驗的題數 (C) 增加測驗的難度 (D) 減低測驗的難度 (E) 增加測驗的鑑別度 6. 某次研究的研究對象中,因為嚴重的城鄕差距,所以造成受測者有一部分是文化素養 的弱勢族群,以下的測驗中,何者的測驗結果比較不會受到這個因素的影響? (A) 瑞文氏(Raven)測驗 (B) 魏氏(Wechsler)測驗 (C) 中華兒童智力量表 (D) 畢保德(Peabody)測驗 (E) 兒童認知能力測驗(陳英豪等編) 7. 關於適性化(adaptive)測驗特性的描述,以下的組合中,相對之下,何者比較正確? 甲:適性化測驗可以是速度測驗 乙:適性化測驗的施測時間固定 丙:適性化測驗可包含有標準答案的選擇題 丁:適性化測驗需要更多預試(pre-test)過程 (A) 甲、乙 (B) 乙、丁 (C) 丙、丁 (D) 甲、乙、丙 (E) 甲、丙、丁 8. 關於實作評量(performance assessment)的設計原則的描述,以下的組合中,相對之下, 何者比較正確? 甲:需要標準答案 乙:用來檢測複雜的認知能力 丙:不要超出教科書的範圍 丁:與真實生活有關 (A) 甲、乙 (B) 丙、丁 (C) 乙、丁 (D) 甲、乙、丙 (E) 甲、丙、丁

(3)

9. 關於檔案評量(portfolio assessment)的描述中,以下的組合中,相對之下,何者比較正 確? 甲:為形成性評量 乙:缺點是測驗時間長 丙:提供施測者與受測者間溝通交流的機會 (A) 甲 (B) 乙 (C) 丙 (D) 乙、丙 (E) 甲、乙、丙 10. 相對之下,以下何種評量工具的設計原則,最不可能符合總結性(summative)評量 的設計原則? (A) 駕照考試 (B) 全民英檢 (C) 動態評量 (D) 基本學力測驗 (E) 學術性向測驗 11. 下列有關古典測驗理論的敘述哪些是正確的? (A) 誤差分數與真實分數成正比 (B) 真實分數佔實得分數比率就是信度係數 (C) 不同測驗的誤差分數是具有中高程度相關 (D) 是對心理特質直接評量 12. 下列關於測驗與評量的敘述何者是正確的? (A) 評量的目的就是要進行評鑑 (B) 評量就是將資料量化的過程 (C) 雙向細目表較適用於測驗內容較明確具體的教學評量 (D) 每種測驗的信度係數屬性都是相關係數 13. 從學習評量的時機而言,哪一類的評量是教師在教學過程中實施,其目的在幫助教 師了解教學是否有效率的進行,並促進學生了解自己在學習上的進步情形及缺點: (A) 診斷性評量 (B) 形成性評量 (C) 總結性評量 (D) 安置性評量

(4)

14. 藉有系統的收集學生的各類作品,以呈現學生在一個或數個學科領域的努力、進步 與成就,是屬於下列哪一種評量方式? (A) 檔案評量 (B) 實作評量 (C) 動態評量 (D) 真實評量 15. 試題偏差通常是指試題受到哪一種因素影響而造成不公平現象? (A) 性別 (B) 受試者之社經地位 (C) 智力 (D) 種族 16. 教師資格檢定考試是屬於: (A) 標準參照評量 (B) 常模參照評量 (C) 安置性評量 (D) 總結性評量 17. 選出對「測驗偏差(biased)」敘述正確的選項: (A) 陳老師給全班每位選修教育測驗與評量的學生各加總分五分 (B) 張老師認為根據許多學術研究報告指出,男生的數理成績普遍優於女生十個百 分點,所以考試成績為班上最優秀的前十位男生再加五分 (C) 一份語文理解能力測驗在外籍新娘與非外籍新娘子女的得分有顯著差異 (D) 基本常識測驗內容出現多題的客家語言文化,造成福佬文化體系生長的考生得 分偏低 18. 當在選用測驗工具時,下列哪一因素可以不需要將之納入審度信度係數大小的項 目? (A) 信度係數考驗方法 (B) 此次接受測試團體的異質程度 (C) 題目的難易程度 (D) 題目間的同質性 19. 測驗的穩定係數不受哪一因素影響? (A) 受試者的年齡 (B) 兩次施測間隔時間的長短 (C) 測驗結果欲推論的時間長短 (D) 測驗題數的多寡。 20. 不會產生月暈效應的評量方式是哪一項? (A) 檢核表 (B) 自陳式量表 (C) 教師提名 (D) 晤談

(5)

◎請根據下述內容和表格中的資料,回答第 21 題至 25 題:

以下是擷取自試題反應理論軟體 OPLM 分析所得的部分結果,其中 RDS1、RDS2 和 RDS3 分為三份測驗,其中 RDS 2 為最容易的測驗,RDS3 為最難的測驗。某研究者 以共同組別設計(common group design) 等化試題參數,其原始的能力估計值和等化前後 的試題參數如以下兩個表格所示。而等化的公式可表示如下兩個式子: ) ˆ ˆ ( Hard Matched Hard * Hard = i − θ −θ i b b ) ˆ ˆ ( Easy Matched Easy * Easy = i − θ −θ i b b

The ability estimates ability θˆ j Student RDS 1 (matched) RDS 2 (easy) RDS 3 (hard) 1 -1.456 -2.493 -8.098 2 -1.456 -0.391 -3.097 3 .032 -1.611 -8.098 4 -.882 .110 -1.086 5 -2.248 .110 -1.086 6 -.882 .589 -3.097 7 -.405 2.306 -1.782 8 -.405 .589 -1.086 9 -.405 1.076 -1.782 10 -.882 1.076 -1.086 11 2.195 1.076 -.025 12 2.195 1.616 1.813 13 .464 .110 -.025 14 2.195 2.306 1.813 15 2.195 3.563 1.073 16 3.527 3.563 1.813 Mean .236375 .8496875 -1.48975 SD 1.642281 1.586109 2.925219

The items estimates after equated

i b before equated * i b after equated Item RDS 1 (matched) RDS 2 (easy) RDS 3 (hard) RDS 2 (easy) RDS 3 (hard) 1 -2.280 -1.123 -7.002 A -5.276 2 -.290 -1.123 -.210 -1.736 1.516 3 .082 -2.638 -.661 -3.251 1.065 4 .492 .204 -.661 -.409 1.065 5 -.644 -.174 .803 -.787 2.529 6 .082 .556 -.661 -.057 1.065 7 .082 .899 -.210 .286 1.516 8 .492 .899 1.326 .286 3.053 9 .082 1.250 .279 B 2.005 10 1.900 1.250 6.998 .637 8.724 Mean -.000200 .000000 -.000002 -.6133125 1.726125 SD .990871 1.208459 3.191894 1.208459 3.191894

(6)

21. RDS 3 難度參數等化前 biHard 和等化後 bi*Hard 的關係式為何? (A) bi*Hard =biHard+1.726125 (B) bi*Hard =biHard −1.726125 (C) 48975bi*Hard =biHard +1. (D) bi*Hard =biHard −1.48975

22. RDS 1 難度參數等化前 biEasy 和等化後 bi*Easy 的關係式為何?

(A) bi*Easy =biEasy +.6133125 (B) bi*Easy =biEasy −.6133125 (C) bi*Easy =biEasy +.8496875 (D) bi*Easy =biEasy −.8496875

23. 此研究者在第二個表格中,在 “b after equated” 該欄中,漏填寫了 A 值,則 A 值i* 應該為何? (A) -1.536 (B) -1.736 (C) -1.356 (D) -1.239 24. 此研究者在第二個表格中,在 “b after equated” 該欄中,漏填寫了 B 值,則 B 值應i* 該為何? (A) .914 (B) .814 (C) .637 (D) .539 25. 關於此等化研究之敘述,下列何者較為正確? (A) OPLM 軟體主要是分析三參數模式的資料 (B) 同一群受試者接受 RDS1、RDS2 和 RDS3 三份測驗 (C) 難度愈高的測驗等化後的誤差愈大 (D) 中等難度的試題進行等化的效果最佳 ◎請根據下述內容及其結果,回答第 26 題至 30 題: 下表是某研究生針對 10 題數學測驗的測驗資料,採 Rasch 模式 ( ) 1 1 ) ( i j b j i e P + = θ θ ,

並以條件最大概似估計法(conditional maximum likelihood estimation)進行參數估計,並繪 出測驗訊息曲線(test information curve)。

Items Parameter b i 1 .66 2 .33 3 1.33 4 1.07 5 .49 6 .49 7 .05 8 -.91 9 -1.02

(7)

.0 .5 1.0 1.5 2.0 2.5 -4 -3 -2 -1 0 1 2 3 4 ability test information 26. 這份測驗對於哪個能力值的受試者能提供較大的試題訊息? (A) -1.50 (B) -1.00 (C) .50 (D) 2.50 27. 能力值θj =.05的受試者,在第 7 題的答對機率是: (A) .20 (B) .50 (C) .75 (D) .90 28. 當θj =.05時,其在第 7 題的試題訊息(item information)是: (A) .25 (B) .55 (C) .75 (D) .95 29. 對於能力值θj =1.2的受試者,哪個試題能提供較大的試題訊息? (A) 第 1 題 (B) 第 3 題 (C) 第 5 題 (D) 第 7 題 30. 就理論上而言,任意 10 個題目在 Rasch 模式 ( ) 1 1 ) ( i j b j i e P + = θ θ 下,所得到的測驗 訊息量最大值是 (A) 1.50 (B) 2.00 (C) 2.50 (D) 3.00 ◎請根據以下 BILOG-MG 之程式碼,回答第 31 題至 35 題: >COMMENTS This is an example.

>GLOBAL DFNAME='TEST.DAT', NPARM=3, SAVE; >SAVE PARM='TEST.PAR', SCORE='TEST.SCO'; >LENGTH NITEMS=35;

>INPUT NTOTAL=35, NALT=4, NIDCHAR=3, KFNAME='TEST.KEY'; >ITEMS INAMES=(MATH01(1)MATH35);

>TEST1 TNAME='PRETEST', INUMBER=(1(1)35); (3A1,1X,35A1)

>CALIB NQPT=30, CYCLES=50, NEWTON=50, CRIT=0.001, ACCEL=0.0, CHI=35, PLOT=1;

(8)

31. 由本程式碼可以看出,此次分析的試題有幾題? (A) 4 (B) 30 (C) 35 (D) 50 32. 指令 NALT=4 代表什麼意思? (A) 本測驗試題為四選一之選擇題 (B) 受試學生的代碼為四碼 (C) 本試驗有四個題本進行等化 (D) 以四參數模式進行估計 33. 指令 NPARM=3 代表什麼意思? (A) 受試學生的代碼為三碼 (B) 以三參數模式進行估計 (C) 本測驗有三個題本進行等化 (D) 本測驗試題為三選一之選擇題 34. 指令 RSCTYPE=4 代表估計分數的何種意義? (A) 不做任何調整 (B) 使用線性轉換 (C) 使用 EAP 估計 (D) 使用 NEWTON 估計 35. 指令 CRIT=0.001 代表參數估計的何種意義? (A) 迭代收斂值為 0.001 (B) 平均標準差為 0.001 (C) 信賴區間為 99.9% (D) 精準度為 99.9% ◎表一及表二為 BILOG-MG 分析試題的結果,請根據表中內容回答第 36 題至 40 題: 表一

(9)

36. 根據表一,哪一個試題的鑑別度最佳? (A) 第 1 題 (B) 第 4 題 (C) 第 6 題 (D) 第 7 題 37. 根據表一,哪一個試題的難度最高? (A) 第 1 題 (B) 第 4 題 (C) 第 6 題 (D) 第 7 題 38. 根據表二,第二題的鑑別度為何? (A) 2.035 (B) 1.000 (C) 0.710 (D) 0.168 39. 根據表二,哪一個試題的難度最高? (A) 第 1 題 (B) 第 2 題 (C) 第 4 題 (D) 第 5 題 40.根據表二,哪一個試題的猜測度最高? (A) 第 1 題 (B) 第 2 題 (C) 第 4 題 (D) 第 5 題 ◎請根據下述內容,回答第 41 題至 45 題: 下圖為一簡單之兩層概念圖,其中頂點 a,b,c,d,e,f,g 均代表概念,且有向邊表示上下 位關係。圖中可以發現有向邊有交錯現象。一般而言,過多的交錯邊,往往降低概念圖 之可讀性,同時無法充分發揮概念圖作為教材地位,抑或學習診斷測驗藍圖之功性。因 此,本題之目的在探討減少交錯邊的問題。 首先,令函數 f(u)表示頂點 u 由所在層的左邊數過來時的順序,例如:f(a)=1,f(c)=3。 又假設 d(u)表示由頂點 u 出發到上層頂點的有向邊之數目,例如:d(g)=2。另外,以Nu 表示頂點 u 的上層頂點中與頂點 u 間存在有向邊連結的頂點所成的集合,例如:

{ }

, g N = c d 。現以 BC(u)表示頂點 u 之重心,其定義如下:

( )

( )

1 BC ( ) u v N u f v d u ∈ =

。 表二

(10)

41. 試求 d(e)之值: (A) 0 (B) 1 (C) 2 (D) 3 42. 試求N 之集合: e (A)

{ }

a (B)

{ }

b (C)

{ }

e (D)

{ }

a b, 43. 試求 BC(e)之值: (A) 1 (B) 1.5 (C) 2 (D) 2.5 44. 若根據重心值的大小,由小到大,由左至右,重新排序 e,f,g,h 之位置時,則其順序 為何?

(A) fegh (B) efhg (C) fehg (D) ehfg

45. 根據重心值重排 d,e,f,g 之順序後,此時之整個重排後概念圖的交錯邊總數為何? (A) 0 (B) 1 (C) 2 (D) 3 ◎請根據下述內容,回答第 46 題至 50 題: 承上題,現在考慮三層的概念圖,如下圖所示:本題之目的,同樣依據各頂點之重 心值大小,來進行減少交錯邊的問題。請根據下列程序,進行頂點重排。 (一)固定最上層頂點 a,b,c,d 之順序,然後根據重心值之大小,來排列中間層頂 點 e,f,g,h 之順序。 (二)中間層頂點之順序排好後,固定著,然後根據重心值之大小,來排列最底 層頂點 i,j,k,l 之順序。

a b c d

e f g h

(11)

46. 試求 d(j)之值: (A) 0 (B) 1 (C) 2 (D) 3 47. 試求N 之集合: j (A)

{ }

e (B)

{ }

f (C)

{ }

e f, (D)

{

a b e f, , ,

}

48. 試求 BC(j)之值: (A) 1 (B) 1.5 (C) 2 (D) 2.5 49. 若根據重心值的大小,由小到大,由左至右,重新排序 i,j,k,l 之位置時,則其順序 為何?

(A) ijkl (B) kjil (C) jilk (D) jikl

50. 根據上述程序重排概念圖之順序後,此時之整個重排後概念圖的交錯邊總數為何?

(A) 0 (B) 1 (C) 2 (D) 3

a b c d

e f g h

參考文獻

相關文件

過程評量 成果評量 總結性評量 報告書撰寫 參閱課本 P25 成果發表...

In order to achieve the core competencies of the twelve-year compulsory education curriculum and to further develop test items for science literacy assessment, it is

(二) 依【管道一】複選鑑定,數學及自然性向測驗成績兩科均達平均數正 2 個標準 差或 PR97,且數理實作評量成績達參加複選學生平均數負

複選通過標準:國語文性向測驗成績達平均數正 2 個標準差或 PR97 以上,外 語文性向測驗成績達平均數正 1.5 個標準差或 PR93

(二) 依【管道一】複選鑑定,數學及自然性向測驗成績兩科均達平均數正 2 個標準 差或 PR97

趣 趣、 、 、 、學習風格 學習風格 學習風格 學習風格等的不同,並有不同的學習需要。2.

就學與就業之職能 治療暨實習、職業 輔導評量學暨實 習、職業復健暨實 習、職能評估與職 業復健暨實習、職 業輔導評量專題研 究、職業輔導評量

測驗 自評 + 問卷 晉階