資優國語文線上測驗編製研究
全文
(2)
(3) 謝辭 在臺中教育大學兩年的生活即將接近尾聲,能順利完成學業,首先要感謝的 是指導教授:許天維教授,在每個研究階段提供協助、建議及鼓勵,讓我得以順 利完成學業。在此向許天維教授致上無限的感激。 另外,感謝論文口試委員郭伯臣所長及辛俊德教授,謝謝你們細心的指正及 建議。 在兩年的研究中,更要感謝郭伯臣老師及于曉平老師的指導,智為學長、育 隆學長、孟君、筱倩學姊的幫忙,及敏嫻、淑瑜同學的協助。 有你們的經驗協助及鼓勵,使我得以順利完成論文,真心的感謝你們。. 陳淑勤 謹致 中華民國一百年七月.
(4)
(5) 中文摘要 本研究旨在發展一個電腦化國文成就測驗線上題庫系統,除可提供評估受試 者能力的參考,也可作為預測臺中市公立國中語文資優鑑定表現的另一種工具。 研究進行分為兩個階段,第一階段對臺中市公立國中語文資優鑑定歷屆試題進行 質的分析,即參考「九年一貫課綱能力指標」與「基測國文科試題結構分析表」, 整理相關文獻資料,建立「國中語文資優鑑定測驗試題雙向細目表」,最後歸納 出國中語文資優鑑定的命題原則,以之命題並進行組卷。透過施測後所得之試題 參數、受試者能力值做為建置題庫的依據,並發展成線上測驗系統。 研究結果顯示在歷屆資優鑑定試題的命題原則探討部分,在學習內容-教學 目標方面,歷年資優鑑定試題以「認識文化常識」層次比重最高,試題所佔比例 達 19%;在認知能力方面,歷年資優鑑定試題著重於「理解」的認知能力部分, 試題所佔比例達 53.4%。題庫信度達 0.9。此外依據臺中市語文資優鑑定測驗所公 佈的成績,計算出受試者於預試所得之分數與實際參加資優鑑定測驗結果的相 關,結果可發現預試所得之分數與實際參加資優鑑定結果達高度正相關,顯示此 份題庫具有良好的預測力。. 關鍵詞:臺中市公立國中資優鑑定、國文科、試題反應理論. I.
(6) Abstract This research aimed to develop an online testing system of Chinese achievement. This system not only showed levels of testers’ Chinese abilities, but also be a predictor of Chinese gifted identification in Taichung City public junior high. Research was divided into two parts, the first part aimed to analyze the every previous exam of Taichung City public junior high Chinese gifted identification. First, information was reference to “Grade1-9 Curriculum Course Outline Capability Index” and “Analysis of Based Structure of National Chinese Test”, and was used to build up “two-way breakdown of tests of Chinese gifted identification”. In the second part, I summed up the principle of question developing in junior high Chinese gifted identification, and used it to make new test questions. Later, I developed an online testing system of Chinese achievement by referring to the data from testing and the testers’ Chinese abilities. The results showed that on the learning content of principle of question developing in junior high Chinese gifted identification, the highest proportion in questions---19%, was “understanding of culture knowledge”; the proportion on the cognitive ability in questions was 53.4%. And the credibility is 0.9. Besides, according to the grades which were published by Taichung Chinese gifted identification test institution, I figured out that the grades testers got from online testing system had highly positive correlation with the grades in gifted identification tests. It showed that this online testing system had good ability in prediction.. Key words: Taichung City public junior high Chinese gifted identification, Chinese, item response theory (IRT). II.
(7) 目錄 中文摘要 ......................................................................................................................... I ABSTRACT ................................................................................................................... II 目錄 ...............................................................................................................................III 表目錄 .......................................................................................................................... IV 圖目錄 ............................................................................................................................V 第一章 緒論 .................................................................................................................1 第一節 研究動機 ......................................................................................................1 第二節 研究目的 ......................................................................................................2 第二章 文獻探討 .........................................................................................................3 第一節 試題編製 ......................................................................................................3 第二節 試題反應理論 ............................................................................................10 第三章 研究方法 .......................................................................................................13 第一節 研究流程 ....................................................................................................13 第二節 研究步驟 ....................................................................................................15 第三節 研究對象 ....................................................................................................20 第四節 研究工具 ....................................................................................................20 第五節 研究限制 ....................................................................................................21 第四章 研究結果 .......................................................................................................23 第一節 歷屆資優鑑定試題的命題原則探討 ........................................................23 第二節 信度與試題參數分析 ................................................................................30 第三節 試題與資優測驗結果相關分析 ................................................................43 第四節 測驗系統建置 ............................................................................................44 第五章 結論與建議 ...................................................................................................49 第一節 研究結論 ....................................................................................................49 第二節 研究建議 ....................................................................................................50 參考文獻 .......................................................................................................................51 附錄一 2001 年版 BLOOM 認知領域教育目標之認知歷程向度內容 .................53 附錄二 試題內容分析表 ...........................................................................................55. III.
(8) 表目錄 表 2-1 基測國文科試題結構分析表 ..........................................................................5 表 2-2 內容檢核表.......................................................................................................7 表 2-3 題幹檢核表.......................................................................................................8 表 2-4 選項檢核表.......................................................................................................8 表 2-5 修審試題檢核表...............................................................................................9 表 3-1 國語科雙向細目表...........................................................................................16 表 4-1 教學目標一-認識字形之歷屆試題範例 ....................................................23 表 4-2 教學目標二-認識字音之歷屆試題範例 ....................................................24 表 4-3 教學目標三-認識詞義之歷屆試題範例 ....................................................24 表 4-4 教學目標四-認識句義之歷屆試題範例 ....................................................25 表 4-5 教學目標五-認識段義之歷屆試題範例 ....................................................25 表 4-6 教學目標七-認識修辭之歷屆試題範例 ....................................................26 表 4-7 教學目標八-認識語法之歷屆試題範例 ......................................................26 表 4-8 教學目標九-認識文化常識之歷屆試題範例 ............................................26 表 4-9 教學目標十-認識寫作格式之歷屆試題範例 ............................................27 表 4-10 教學目標十一-認識應用文之歷屆試題範例 ..........................................27 表 4-11 歷屆試題對應雙向細目表題數分配...........................................................28 表 4-12 歷屆試題對應雙向細目表各細格命題比例與調整後命題題數 ..............29 表 4-13 試題刪除後整體信度 ..................................................................................30 表 4-15 第一次刪題後之試題參數表 ......................................................................33 表 4-16 待修審試題之選項分析統計 ......................................................................34 表 4-17 刪除第 27 題後之試題參數表 ....................................................................42 表 4-18 預試所得之分數與實際參加資優鑑定測驗分數的相關 ..........................43. IV.
(9) 圖目錄 圖 3-1 研究流程圖.....................................................................................................14 圖 3-2 雙向細目表試題化流程圖.............................................................................18 圖 4-1 適性測驗系統功能圖.....................................................................................44 圖 4-2 系統登入畫面.................................................................................................45 圖 4-3 點選施測單元畫面.........................................................................................46 圖 4-4 電腦化測驗畫面.............................................................................................46 圖 4-5 學生成果查詢畫面.........................................................................................47. V.
(10) VI.
(11) 第一章 第一節. 緒論 研究動機. 臺中市公立國中資優鑑定主要評量對象為國一學生,觀察是否具備資賦優異 特質的重要測驗。近年來坊間出現針對國一學生施行資優鑑定的相關測驗,使學 生能透過這些測驗內容做好應試國中資優鑑定的準備。然而相關測驗的編製各個 出版商的測驗皆有各自己依據,並未能符合資優鑑定的真實情境,題型以及考試 範圍也相差甚遠,且坊間的測驗部份試題內容及題型與教科書試題相似,每回測 驗試題難易度不一,且試題內容不夠多元…等情況,故無法有效預測資優鑑定的 表現;另外,許多家長與學生往往對於國中資優鑑定測驗不甚瞭解或過於積極, 而常會利用坊間出版的模擬考題進行反覆練習,恐使學生倍感壓力或易產生倦怠 感而影響學習態度與評量的成效,因此若能使模擬考試的出題較貼近國中資優鑑 定測驗,並以更有效率的方式施行模擬考,應更能提升模擬考的成效,也使學生 更瞭解國中資優鑑定測驗的內容,減少學生對於測驗的恐懼。 近年來,許多大型考試,如 TOEFL、GRE、…等,採行電腦化測驗,足以瞭 解電腦化測驗之發展日益受到重視,且透過電腦化測驗可以蒐集到的資訊較傳統 多元,並能在學生測驗後,立即呈現測驗結果,供學生與教師瞭解學生之學習狀 況。 因此本研究擬編製電腦化國文成就測驗線上題庫系統,測驗的題數、題型、 考試時間都以資優鑑定的方式進行,透過以試題反應理論為基礎之題庫建置程序 編製試題,除可提供評估受試者能力的參考,也可作為預測臺中市公立國中語文 資優鑑定表現的另一種工具。. 1.
(12) 第二節. 研究目的. 根據上述的研究動機,本研究的目的在於建置一個電腦化國文成就測驗線上 題庫系統,由於本研究是針對國中語文資優鑑定的初探研究,故題庫的試題採用 分析歷屆語文資優鑑定試題,並依據分析之雙向細目表進行命題。為使題庫試題 能符合國中語文資優鑑定命題方向,本研究透過分析國中語文資優鑑定的命題原 則與分析試題品質兩種方式,挑選試題組卷施測,使其對國中語文資優鑑定成績 有較好的預測度外,也可作為日後題庫編製的參考。最後進一步發展成線上測驗 系統,使學生能更有效率地做好應試資優鑑定的準備,並改善傳統紙筆測驗需人 力批改試卷、無法立即給予學生測驗結果、…等缺點。 綜合以上所述,本研究具體的目的如下: 一、建置國文成就測驗題庫及線上測驗系統。 二、以臺中市公立國中語文資優鑑定為校標,評估國文成就測驗題庫之成效。. 2.
(13) 第二章. 文獻探討. 本研究的目的在於發展電腦化國文成就測驗線上題庫系統,針對臺中市公立 國中語文資優鑑定歷屆試題進行質的分析,以「九年一貫課綱能力指標」與「基 測國文科試題結構分析表」(鄭圓鈴,2008),整理相關文獻資料,建立「國中 語文資優鑑定測驗試題雙向細目表」,最後歸納出國中語文資優鑑定的命題原則 來命題並進行組卷。最後電腦化測驗是以試題反應理論為基礎的測驗模式,故在 本章當中分別以國中語文資優鑑定測驗的試題編製、試題反應理論進行探討。. 第一節. 試題編製. 本研究為了能有效分析編製題庫的效度,依據內容關聯效度分析,說明試題 的適合性與代表性。首先歸納歷屆國中語文資優鑑定測驗試題內容的提問重點, 再依據「Bloom 教育目標分類之認知歷程向度」的架構(葉連祺、林淑萍,2003), 並參考「九年一貫課綱能力指標」與「基測國文科試題結構分析表」(鄭圓鈴, 2008)編製「國中語文資優鑑定測驗試題雙向細目表」。以下分別介紹 Bloom 教 育目標分類、九年一貫能力指標、基測國文科試題結構分析表與試題命題原則。. 壹、Bloom 教育目標分類 新版 Bloom 教育目標的分類分為「知識向度」(knowledge dimension)和「認 知歷程向度」(cognitive process dimension)二個部份(Anderson & Krathwohl, 2001)。「知識向度」主要協助教師區分教什麼(what to teach),「認知歷程向 度」旨在促進學生保留(retention)和遷移(transfer)所學習到的知識(葉連祺、 林淑萍,2003)。本研究中主要參考「認知歷程向度」作為編製雙向細目表中認 知向度的依據,故僅針對「認知歷程向度」進行探討。 「認知歷程向度」主要分成六類,分為記憶、瞭解、應用、分析、評鑑和創 造,其中記憶和學習保留有密切的關連,其餘五個和學習遷移較為相關。這些分 類的觀點是基於建構主義者學習(constructivist learning),也就是有意義的學習. 3.
(14) (meaningful learning)的看法,而認知歷程向度的目的在於提供描述學生在建構 主義者學習理念下的認知活動範疇,以幫助學生進行有意義的學習。且六個類別 可再進行分類,如附錄一說明(葉連祺、林淑萍,2003)。. 貳、九年一貫能力指標 教育部於 2002 年公佈「國民中小學九年一貫課程暫行綱要」、2003 年公佈 「國民中小學九年一貫課程綱要」,綱要中表示為培養國民應具備之十大基本能 力,國民教育階段之課程應以個體發展、社會文化及自然環境等三個面向,提供 語文、健康與體育、社會、藝術與人文、數學、自然與生活科技及綜合活動等七 大學習領域(教育部,2003)。 各學習領域制訂有分段能力指標,其中在國語文學習領域規劃有六大主題 軸,分別為第一軸「注音符號應用能力」、第二軸「聆聽能力」、第三軸「說 話能力」、第四軸「識字與寫字能力」、第五軸「閱讀能力」、第六軸「寫作能 力」。而各主題軸配合學習領域的規劃,分別有其對應的分段能力指標,各領域 的學習階段,是依照學習心理的連續性發展原則劃分,其中國語文學習領域共分 為三個階段,第一學習階段為一至三年級、第二學習階段為四至六年級、第三學 習階段為七至九年級,至國中三年級結束(教育部,2003)。. 叁、基測國文科試題結構分析表 「基測試題結構分析表」依據 90~95 年基測 577 題試題的評量重點,歸納為 十一類教學目標。再依據各項教學目標試題的提問重點,歸納為三十六項評量指 標,最後根據評量指標的動詞描述,分類該指標所欲評量的認知能力,如表 2-1 (鄭圓鈴,2008)。. 4.
(15) 表 2-1 基測國文科試題結構分析表 教學目標 能認識字形 能認識讀音. 能認識詞義. 能認識句義. 能認識段義. 能認識文化 常識 能認識修辭 法 能認識語法. 能認識寫作 格式. 評量目標 確認正確字形 回憶形近字形 確認正確讀音 回憶形近字讀音 回憶破音字讀音 確認詞語涵義 詮釋詞語涵義 比較詞語涵義 分類詞語涵義 詮釋句子涵義 推論句子要點 比較句子關係 舉例句子特定觀點 摘要段落要旨 推論段落觀點 推論段落標題 摘要段落內容 解釋段落寫作模式 推論文化常識 推論文學常識 推論書體及六書常識 推論工具書常識 舉例修辭法 分類複詞 分類詞性 分類句法結構 分類簡句 實行適切語詞 實行適切句子 實行適切段落. 認識應用文 格式. 實行應用文格式. 能認識短文 閱讀(題組). 現代文閱讀 古文閱讀 韻文閱讀. 評. 量. 細. 目. 詞語、句子、段落 詞語、句子、段落. 成語涵義、成語關係、文化詞涵義 字義、詞義、圖形涵義 多義詞、數字詞 聲音新詞 句義、語序、其他 觀點、語氣、邏輯. 現代文、文言文、韻文、圖表 現代文、文言文、韻文 現代文、韻文、應用文 人物、典籍、節慶習俗 格律、風格. 認知 能力 記憶 記憶 記憶 記憶 記憶 記憶 理解 理解 理解 理解 理解 理解 理解 理解 理解 理解 理解 理解 理解 理解 理解 理解. 譬喻、映襯、借代、轉化、設問、雙關、 理解 對偶、層遞、回文、諧音 合義複詞、衍聲複詞、偏義複詞、其他 理解 詞性、詞性活用、詞語結構 理解 理解 判斷句、有無句、敘事句、表態句 理解 成語、詞語、連接詞、數量詞、其他 應用 應用 重組、標點符號 應用 書信、柬帖、對聯、題辭、稱謂語. 應用. 詮釋詞語涵義、詮釋句子涵義、摘要短 理解 文內容、推論短文觀點、解釋短文模式、 理解 其他 理解. 5.
(16) 肆、試題命題原則 在命題要點方面,命題時以國文內容之嚴謹性與完整性為主,命題人員命題 時,會盡量遵循下列要點:(Haladyna, 1999;劉湘川、許天維、胡豐榮、郭伯臣, 2003) 1. 試題應明定目標,也就是說試題應落在確定的內容領域或確定的心智活動:如 記憶、理解、批判思考或問題解決等。 2. 試題的心智活動應聚焦於一個向度而不是一連串。 3. 試題設計:不宜過度刁鑽的解法或是極為淺易的常識。 4. 試題應先排題幹,再排圖示:後排選項,且應區隔。 5. 橫列選項應依序呈直式編排而非橫式編排。 6. 應有一致性編輯與校對風格。 7. 為特定應試生群體的公平性宜淺化試題的詞彙。 8. 注意語文語法、標點符號、大小寫與拼音。儘量採用中文標準符號,英文標準 符號。 9. 減少閱讀量且勿用爭議的題幹或是未完句。 10. 題幹應清楚的表達提問的內容。 11. 核心概念在題幹出現,而不是在選項。 12. 題幹宜避免無關的修飾語與冗長的贅語。 13. 使用肯定句避免否定用語或除此以外的用語。 14. 確認選項只有一個正確,並根據選項數目變化正確答案的位置。 15. 選項以邏輯或數量順序排列。 16. 選項間的內容要互為獨立不宜有重疊的現象。 17. 選項陳述保持同質性,且選項的文字長度保持一致性。 18. 避免使用「以上皆非」、 「以上皆是」、 「不知道」 。. 6.
(17) 19. 選項採用正面陳述,避免負面陳述。 20. 避免提供正確答案的線索,且勿使用限定指示詞,諸如總是、從不、完全與絕 對。 21. 選項中的用字與題幹的用字宜一致或類似。 22. 避免選項文法或寫法的不一致或引人注目的選項,而暗示應試生正確答案的線 索。 23. 避免成對或是成組暗示應試生錯誤答案。 24. 避免明顯荒謬的選項暗示應試生錯誤答案。 25. 以應試生的迷誤概念作為選項以提高誘答力。 26. 避免使用幽默選項。 命題者除了遵循上述命題要點外,於命題後可利用命題檢核表檢核試題,可 分為三方面來進行,一為內容檢核表(表 2-2),二為題幹檢核表(表 2-3),三 為選項檢核表(表 2-4);亦或命題者之間可交互檢核試題,以確認試題無誤。. 表 2-2 內容檢核表 1 2 3 4 5 6 7 8. 內 容 試題內容是否能達成該題欲評量之目標? 試題用詞是否簡短清晰? 試題所使用的術語或名詞是否以應試生所學習的領域為主? 試題是否聚焦於單一向度,避免涉及太多概念? 試題是否避免包含某一族群所特別熟悉的訊息? 試題的英文原文或翻譯是否正確? 試題是否提供答題所需之完整資訊? 試題是否避免含有暗示答案的線索?. 7. 是. 否.
(18) 表 2-3 題幹檢核表 1 2 3 4 5 6. 題 幹 部 分 題幹是否為完整句且清楚表達提問的內容? 題幹中之關鍵詞或否定詞是否加上底線? 附圖或表是否置於題幹之後、選項之前? 在各選項中共同文字是否置於題幹內? 題幹是否避免使用雙重否定? 題幹是否完整敘述欲評量的主要概念?. 是. 否. 是. 否. 表 2-4 選項檢核表 1 2 3 4 5 6 7 8 9 10 11. 選 項 部 分 選擇正確選項是否基於應試生具備該題欲評量目標上之能力? 答錯正確選項是否基於應試生不具備該題評量目標上之能力? 選項的用詞是否與題幹一致? 選項是否符合題幹問法的邏輯? 選項之表達方式是否保持一致? 選項是否只有一個為正確答案? 選項間的內容是否避免重疊的現象? 選項內容是否按邏輯順序排列? 錯誤選項是否具有誘答力? 選項是否避免使用「以上皆是」、 「以上皆非」的用語? 正確答案是公認的且不具爭議性的?. 試題尚需經由學者專家與命題者共同修審題,檢視試題是否合格。若不合格 則予以淘汰,而試題之合格與否則採委員多數決,若試題經修改後可使用的話, 則將修改後之試題納為題庫試題,在過程中應參考修審試題檢核表(如表 2-5)。 修審題作業時,分成兩方面來進行,一為題幹部分:另一為選項部分。首先 在題幹方面,修審題人員會參考下列要點:仔細修審題幹,並確保題意之清晰、 標點符號之共通性與邏輯之嚴謹性,以增加可讀性。 其次,在選項方面,修審題人員對於沒有誘答之選項會加以修審,修審作業 猶如畫龍點睛,一個不留神很可能使得本來題幹很不錯的題目變成作廢題。因此. 8.
(19) 修審選項時會參考下列要點並在匠心獨運於設計選項,增加誘答的同時,亦必須 適時檢閱有無答案或檢閱命題者所填之答案有無錯誤。 根據修審後之題本與答案進行組卷,再請專人確認是否有錯誤,確保試題完 整與正確性,最後即可進行預試。. 表 2-5 修審試題檢核表 檢. 核. 項. 目. 1 試題之表達方式應切合該題之評量目標 2 答對問題應反應具備該題評量目標上所描述的能力 3 答錯問題應反應不具備該題評量目標上所描述的能力 4. 語意宜清楚以簡短清晰的用詞陳述試題題幹,並避免使用非專業領域所 慣用的術語或名詞. 5 6 7 8 9 10 11. 附圖或表應置於題幹之後且符號應一致. 12. 答對問題之機會應避免受到評量目標以外之其他因素影響. 13. 盡可能將選項共同字放在題幹中. 14. 選項間避免存在邏輯上的連貫. 15. 選項之表達方式宜維持一致. 16. 避免提供選擇正確答案或刪除不正確答案之線索. 17. 錯誤選項應具有「誘答力」. 18. 問句的提出應在顯著位置不可隱約在題幹之中. 19. 題幹的內容應簡潔扼要,不可累贅. 20. 題幹問法應合乎中文語法,不可倒裝敘述問句. 21. 題幹敘述應完整,不可看到選項才知道要問什麼. 22. 選項內容應與題幹內容相互呼應,不可南猿北轍. 試題應單純化避免內容過於繁雜或提一個問題以上 每個題幹不應中斷要保持完整 盡可能以正面肯定用詞來敘述試題題幹,若一定要用否定詞宜加底線 題幹與選項之文法應保持一致 題幹與選項之邏輯要連貫 專有名詞之英譯應正確且與慣用者相符. 9. 是. 否.
(20) 第二節. 試題反應理論. 試題反應理論(item response theory, IRT)是為了改進古典測驗理論的缺失 而產生,它的主要概念在探討受試者的答對機率受到受試者的能力(abilities)或 潛在特質(latent traits)及試題參數(難度、鑑別度、猜測度)影響的關係。以 下就 IRT 的基本假設、特性及參數模式來探討。. 壹、IRT 基本假設 在 IRT 中,可依據受試者的表現,經數學模式的運算,推測受試者的能力, 此數學模式稱之為試題特徵函數(item characteristic function, ICF),若將受試者 的表現與能力的關係繪製成一條連續性遞增的函數,稱為試題特徵曲線(item characteristic curve, ICC),其涵義為:答對某一試題的機率,是由受試者能力和 試題特性所共同決定的。因此試題反應理論具有下列幾個基本假設,當假測都成 立 時 , 試 題 反 應 模 式 才 能 被用 來 分 析 測 驗 資 料 ( Embretson & Reise, 2000; Hambleton, 1989; Hambleton & Swaminathan, 1985; Hambleton, Swaminathan & Rogers, 1991; Lord, 1980)。 一、單向度 單向度即是該測驗所測量到的單一主要能力或單一主要潛在特質。但實際情 況中,受試者常會受到考試焦慮、硬是技巧、…等因素影響,故試題反應理論中 對測驗必須具有單向度的假設,認為只要該測驗具有能影響測驗結果的「單一主 要成分或因素」即可。 二、局部獨立性 在試題反應模式中,受試者的能力因素,是唯一影響考生在測驗試題上做反 應的因素,故有相同能力水準的受試者,在各個題目上的答對機率是互相獨立 的。當單向度的假設不成立時,此假設也不成立,因為不同試題的答對機率恐怕. 10.
(21) 會受到其他能力的共同影響。若局部獨立的條件滿足了,則某個受試者得分情形 出現的機率,可用受試者各試題答對或答錯各試題機率的乘積表示。 三、非速度測驗 進行測驗時,不是在速度限制下完成的,也就是受試者的成績不受時間長度 影響結果。 四、知道-正確假設 當受試者知道某一試題的正確答案,且他將會對答該試題,排除了人為疏失 的因素。. 貳、IRT 的特性 一、能力參數不變性 IRT 在估計受試者能力時同時考量了試題參數的影響,因此受試者的能力估 計值不會受到試題參數所影響。施測不同試題時,得到的試題參數雖然不同,但 若測驗的是同一種能力,則受試者的能力並不會改變。此外,如果使用 IRT 中的 Rasch 模式,則所估計出來的受試者能力值具有等距量尺的特性,亦即其能力量 尺可以作加減乘除的運算(陳柏熹,2006)。 二、試題參數不變性 試題參數是指試題的難度、鑑別度、猜測度…等用來描述試題特性的指標。 在 IRT 中,試題參數的估計不會受到受試者能力所影響,因為 IRT 在估計能力時 已經同時考量了試題參數的影響,只要受試者的人數夠多,程度值不會過度集 中,就能夠估計出穩定的試題參數(陳柏熹,2006)。. 11.
(22) 叁、單向度試題反應理論-三參數對數模式 常用的單向度試題反應模式有三種,依模式所採用的參數個數來命名,分別 為單參數對數模式(one-parameter logistic model, 1PL)(Rasch, 1986)、二參數 對數模式(two-parameter logistic model, 2PL)及三參數對數模式(three-parameter logistic model, 3PL)(Birnbaum, 1968; Lord, 1980),都僅適用於二元化的反應資 料。本研究採用試題反應理論三參數模式分析試題,以下僅針對三參數對數模式 進行說明。 在 IRT 的 3PL 模式下,假定測驗會發生猜題之現象,故假設受試者 j 之能力 為 θ j ,其作答試題 i 通過的機率如公式 2-1(Birnbaum, 1968;Lord, 1980): P ( X ij = 1 | θ j , bi , ai , ci ) = ci +. (1 − ci ) 1 + exp[− ai (θ j − bi )]. (2-1). 其中,Xij 為受試者 j 在試題 i 的作答反應,答對記為 1,答錯記為 0;ai 為試 題 i 之試題鑑別度參數,0<ai;bi 為試題 i 之試題難度參數, − ∞ < bi < ∞ ;ci 為 試題 i 之試題猜測度參數, 0 ≤ ci < 1 。. 12.
(23) 第三章. 研究方法. 本研究的目的在於編製國文成就測驗題庫,並發展線上電腦化測驗系統,學 生將能由此系統進行模擬測驗與測驗結果分析。本章依研究目的分別以第一節研 究流程、第二節研究步驟、第三節研究對象、第四節研究工具、第五節研究限制 等五小節說明。. 第一節. 研究流程. 本研究首先設定研究主題,再探討與研究主題相關之文獻,並蒐集歷屆相關 試題,進而分析歷屆試題、編製試題預試。最後進行試題參數估計與修審題,蒐 集學生參加資優鑑定之分數,進行相關分析,並撰寫研究結果。研究流程圖如圖 3-1:. 13.
(24) 確定研究主題 文獻蒐集與探討 蒐集歷年鑑定測驗試題 訂定雙向細目表 分析歷年鑑定測驗試題的 命題原則 依據歷年鑑定測驗試題命題原 則,進行命題 進行預試 估計試題參數、受試者能力值 依照刪題原則進行試題篩選 試題修整與審訂. 蒐集學生實際參加資優鑑定測 驗分數. 建置電腦化國文成就測驗線上 題庫系統. 計算預試分數與實際參加資優 鑑定測驗分數的相關. 圖 3-1 研究流程圖. 14.
(25) 第二節. 研究步驟. 根據圖 3-1 的研究流程,以下依次說明各步驟之內容:. 壹、蒐集歷年鑑定考試試題 本研究是針對 92~94 年歷屆考題進行分析,其中 94 年考題又分為資優班學 生入學鑑定國文科成就測驗與語文資優班甄試國文科試題,共四回考題。將歷屆 試題進行分析,據以瞭解各年度試題之內容,作為命題的依據。. 貳、訂定雙向細目表 本研究中,依據「Bloom 教育目標分類之認知歷程向度」(葉連祺、林淑萍, 2003),參考「九年一貫課綱能力指標」與「基測國文科試題結構分析表」(鄭 圓鈴,2008),整理相關文獻資料,建立「國中語文資優鑑定測驗試題雙向細目 表」。並邀請二位臺中教育大學專家學者及三位具有語文資優教學經驗之教師, 共同研討檢核。在認知能力向度中,由於資優測驗受限於紙筆測驗,經由專家討 論後,將認知向度修改為記憶、理解、應用、分析四個。另外,學習內容向度分 為教學目標與評量指標,將內容修改為 11 個教學目標,教學目標再分類為 42 個 評量指標,如表 3-1。藉以分析歷屆語文資優鑑定測驗試題的命題方向,作為本 研究分析試題的工具。. 15.
(26) 表 3-1 國語科雙向細目表 學 習 內 容 認 知 能 力 教學目標 評量指標 記憶 理解 應用 分析 1-1 確認正確字形 ※ 1.認識字形 1-2 回憶形近字形 ※ 2-1 確認正確字音 ※ 2.認識字音 2-2 回憶形近字音 ※ 2-3 回憶破音字音 ※ 3-1 確認語詞涵義(成語) ※ 3-2 解釋語詞涵義 ※ 3.認識詞義 3-3 比較語詞涵義 ※ 3-4 分類語詞涵義 ※ 4-1 解釋句子涵義 ※ 4-2 推論句子要點 ※ 4.認識句義 4-3 比較句子關係 ※ 4-4 舉例句子觀點 ※ 5-1 摘要段落要旨 ※ 5-2 推論段落觀點 ※ ※ 5-3 推論段落標題 ※ 5.認識段義 5-4 摘要(總結)段落內容 ※ 5-5 解釋段落歷程(結構組織) ※ ※ ※ 5-6 推論表達方法 6-1 理解詞意 ※ 6-2 理解句義 ※ ※ ※ 6.題組-認識篇 6-3 推論觀點 章義(古今散 6-4 推論標題 ※ 文、古今韻文、 6-5 摘要(總結)內容 ※ 應用文) 6-6 解釋歷程(結構組織) ※ ※ 6-7 理解修辭 ※ 6-8 理解語法 ※ 7.認識修辭 7-1 舉例修辭 ※ 8-1 分類複詞 ※ 8-2 分類詞性 ※ 8-3 分類句法結構(判斷句、有 8.認識語法 ※ 無句、敘事句、表態句) 8-4 分類基本句(陳述句、疑問 ※ 句、祈使句、感嘆句). 16.
(27) 表 3-1. (續). 9-1 推論文化常識 9-2 推論文學常識 9.認識文化常識 9-3 推論書體 9-4 推論六書常識 9-5 推論工具書 10-1 實行適切語詞 10-2 實行適切句子 10.認識寫作格式 10-3 實行適切段落 10-4 實行適切標點 11.認識應用文 11-1 實行應用文. ※. ※ ※ ※ ※ ※ ※ ※ ※ ※ ※. 註:標記※為評量指標中之試題能對應到認知能力向度的內容. 叁、分析歷屆資優鑑定考試試題的命題原則 命題原則是透過對歷屆試題進行質的分析,在依據分析結果進行命題。本研 究針對 92~94 年歷屆考題共四回試題,將試題分類至已訂定之雙向細目表中的認 知能力向度與學習內容向度,據以瞭解各年度試題雙向細目表中各細格出題比 例,作為命題的依據。 透過歷屆試題分析,瞭解各年度試題雙向細目表中各細格出題比例後,計算 各細格所需命題的題數,且結合學科專家意見茲將各細格命題題數進行調整。. 肆、進行命題與預試 首先,確立命題題數分配後,進行編製試題,並邀請二位臺中教育大學專家 學者及三位具有語文資優教學經驗之教師,依據命題檢核表(如表 2-5)檢核試 題,其流程如圖 3-2。完成製作試題內容分析表(如附錄二),最後將試題編製 成紙筆試卷,共計有 50 題,以進行預試紙筆測驗。. 17.
(28) 圖 3-2 雙向細目表試題化流程圖. 伍、估計試題參數、受試者能力值 本研究藉由估計試題參數與受試者能力以瞭解試題特性,分析試題特性對於 題庫資料是相當重要的一環,藉由測量模式或一般性描述統計分析試題各項參數 的穩定性可以提高測驗的品質,以確實瞭解學生學習成就表現的結果。本研究使 用 BILOG-MG(Zimowski, Muraki, Mislevy & Book, 2003)進行試題參數以及受 試者能力值之估計,估計之參數提供未來試題入庫後使用。. 陸、依照刪題原則進行試題篩選 利用上述步驟所估計之參數,依照臺灣學生學習成就評量資料庫(Taiwan Assessment of Student Achievement, TASA)對於不良試題篩選之標準進行檢測。 本研究中,先刪除古典鑑別度為負的試題,再針對不良試題進行標記後,學科專 家判定該題是否刪除,亦或者將試題修審後入庫,本研究不良試題標記標準如下:. 18.
(29) 一、依據古典測驗理論(classical test theory, CTT)訂定標準如下: (一)試題通過率低於 0.25, PCTT < 25% ; (二)試題鑑別度指數介於 0 ~ 0.2 之間,0<C.T.T.的鑑別度<0.2。 試題鑑別度指數使用點二系列相關,如公式 3-1: rj =. (μ j − μ x ). Pj. σx. 1 − Pj. (3-1). 其中,rj 指第 j 題鑑別度; μj 指 μ 答對第 j 題之受試者之測驗總分的平均數; μx 指所有受試者之測驗總分的平均數; σx 指 σ 所有受試者之測驗總分的標準差。 二、依據試題反應理論(item response theory, IRT)訂定標準如下: (一)試題鑑別度參數介於 0 ~ 0.4 之間,0<a<0.4; (二)試題難度參數小於或等於-3,b≦-3; (三)試題難度參數大於或等於 3,b≧3; (四)試題猜測度參數大於或等於 0.25,c≧0.25。. 柒、試題修整與審訂 所有試題均經由命題、修題、並透過命題者以及學科專家會議進行修審題, 且每道試題皆經過臺中縣市 5 所國中與 3 間補習班具有報考資優鑑定資格的國一 學生實際施測,經過上述刪題原則進行試題篩選後,符合標準的試題則成為正式 測驗試題,不良試題則再透過命題者以及學科專家會議進行刪題或修審題。. 19.
(30) 捌、建置國中語文資優鑑定測驗題庫 本研究建置題庫依據試題反應理論編製的程式,主要有「建立測驗雙向細目 表」、「根據命題原則設計試題」、「修整與審查試題」、「預試與試題分析」、 「篩選試題」、「將試題內容與試題參數輸入電腦資料庫」等幾個步驟(Wainer, Dorans, Flaugher, Green, Mislevy, Steinberg, & Thissen, 1990)建立國中語文資優鑑 定測驗題庫。 此外,本研究依據臺中市語文資優鑑定測驗所公佈的成績,計算出受試者於 預試所得之分數與實際參加資優鑑定測驗分數的相關。. 第三節. 研究對象. 紙筆測驗採方便抽樣,對象為 99 學年度臺中縣市 5 所國中與 3 間補習班具 有報考資優鑑定資格的國一學生,共 310 位學生,有效樣本總計 309 位學生。施 測時間為民國 99 年 10 月 20 日至 11 月 10 日止。. 第四節. 研究工具. 壹、雙向細目表 根據第二章文獻探討,針對國文科試題的編制,建立了本研究試題命題的雙 向細目表,在認知能力向度方面規劃為「記憶」、「理解」、「應用」、「分析」 四方面;在內容向度方面,則分為 11 個教學目標,再將教學目標細分成 42 個評 量指標。. 20.
(31) 貳、各項統計分析軟體 一、SPSS 10.0 統計分析軟體 統計套裝軟體 SPSS 可用於大量資料的統計分析,本研究用以分析測驗的信 度及相關係數。 二、BILOG-MG 軟體 BILOG-MG 軟體可用以估計出試題的參數值,如難度、鑑別度、猜測度及受 試者的能力值,也可提供測驗的訊息量、信度指數與測驗訊息曲線圖(Zimowski, Muraki, Mislevy, & Bock, 2003)。. 第五節. 研究限制. 壹、研究試題方面 本研究的命題原則為分析民國 92~94 年歷屆語文資優鑑定考試試題所得,但 僅有三年度的試題,且與近年命題趨勢可能有差異,試題內容不夠多元與完整, 可能有推論上的限制。. 貳、研究對象取樣的限制 本研究基於研究者個人的時間、環境考量,施測對象以臺中縣市五所國中、 三間補習班之國一學生為主,藉由施測取得的能力值作為建置題庫的依據,可能 會因取樣範圍的影響,造成結果推論上的限制。另外,受試者對本研究測驗的作 答心態與作答情形難以如同正式資優鑑定考試時的謹慎、認真,都可能影響研究 結果。. 21.
(32) 22.
(33) 第四章. 研究結果. 本章根據前述的研究動機、研究目的及研究步驟,針對臺中市公立國中語文 資優鑑定歷屆試題的命題原則進行分析、比較,另外探討試題信度,並進行實際 施測,評估本研究所編製國文成就測驗題庫之成效,最後建立電腦化國文成就測 驗線上題庫系統。. 第一節. 歷屆資優鑑定試題的命題原則探討. 本研究依據臺中市公立國中語文資優鑑定歷屆試題進行分析,將試題對應到 至已訂定之雙向細目表中的認知能力向度與評量指標向度,據以瞭解各年度試題 雙向細目表與各細格出題比例,作為命題的依據。以下就分析結果:雙向細目表 之歷屆試題範例、分析歷屆資優鑑定考試試題的命題原則依序說明。. 壹、雙向細目表 本研究依據臺中市公立國中語文資優鑑定歷屆試題進行分析,並邀請二位臺 中教育大學專家學者及三位具有語文資優教學經驗之教師,共同研討檢核。將教 學目標分為 11 類以及評量指標分類成 42 個,並將各細目從歷屆試題中挑選範例 說明,如表 4-1 至表 4-10。題幹後加註範例試題之來源,前兩碼為測驗年度 (92~94);中間兩碼為同年度不同類型之考試,01 表示為國民中學資優班學生 入學鑑定國文科成就測驗,02 表示為國民中學語文資優班甄試國文科試題;最後 兩碼為題號。 表 4-1 教學目標一-認識字形之歷屆試題範例 評量指標. 歷. 屆. 試. 題. 範. 例. 1-1 確認正確 下列哪一個成語用字完全正確?(940207) 字形 (A)如雷灌耳 (B)含心茹苦 (C)兢兢業業. (D)形銷骨立. 好整以 、應接不 、名聞 邇。空格中依序應填入?(940204) 1-2 回憶形近 (A)暇、暇、遐 (B)暇、遐、遐 字形 (C)遐、暇、暇 (D)暇、遐、暇. 23.
(34) 表 4-2 教學目標二-認識字音之歷屆試題範例 評量指標. 歷. 屆. 試. 題. 範. 例. 下列「」中的字音哪一個不正確?(940202) 2-1 確認正確 (A)「塑」膠:ㄕㄨㄛˋ (B)乾「涸」:ㄏㄜˊ 字音 (C)「緘」默:ㄐㄧㄢ (D)「瞥」見:ㄆㄧㄝ 下列哪一組字音完全相同?(940201) 2-2 回憶形近 (A)紊、醞、蘊 (B)曠、獷、礦 字音 (C)賑、稹、酖 (D)沗、殄、腆. 表 4-3 教學目標三-認識詞義之歷屆試題範例 評量指標. 歷. 屆. 試. 題. 範. 例. 下列哪一個成語不是用來形容貧窮?(940213) 3-1 確認語詞 (A)人定勝天;聽天由命 (B)海市蜃樓;鏡花雪月 涵義(成語) (C)千真萬確;子虛烏有 (D)口誅筆伐;口碑載道 下列何句與「勤學」無關?(940208) (A)成功是一分天才加上九十九分的努力 3-2 解釋語詞 (B)學如逆水行舟,不進則退 涵義 (C)水能載舟,亦能覆舟 (D)業精於勤,荒於嬉 語言的詞義會因時間而產生變化,下列各組的語詞何者古今詞義仍相 同?(930123) (A)「煙花」三月下揚州—「煙花」女子 3-3 比較語詞 (B)大江東去,浪淘盡,千古「風流」人物—他生性風流,緋聞不斷 涵義 (C) 「戰戰兢兢」如臨深淵,如履薄冰—球賽時,所有選手都「戰戰兢 兢」地參賽 (D)自此冀之南,漢之陰,無「壟斷」焉—這家大企業「壟斷」了全 臺的油品市場 (甲)滿山「丹」楓(乙) 「白」頭搔更短(丙) 「白」瞪著眼(丁)往 3-4 分類語詞 來無「白」丁(戊)「黛」青的山色,上述「」中的字哪幾個是用來形 涵義 容顏色的?(930121) (A)甲乙丁 (B)丙丁戊 (C)甲乙戊 (D)乙丙丁. 24.
(35) 表 4-4 教學目標四-認識句義之歷屆試題範例 評量指標. 歷. 屆. 試. 題. 範. 例. 蕭伯納說: 「人生有最大的兩齣悲劇:一是萬念俱灰,另一是躊躇滿志。」 4-1 解釋句子 這句話是提醒人應該:(940134) 涵義 (A)天生我材必有用 (B)滿招損,謙受益 (C)勝不驕,敗不餒 (D)不爭眼前義氣,只爭千秋利益 臺灣諺語: 「食果子,拜樹頭;食米飯,拜鋤頭」 ,意思和下列何者相近? 4-2 推論句子 (940233) 要點 (A)飲水思源 (B)一舉兩得 (C)以食為天 (D)愛屋及烏. 表 4-5 教學目標五-認識段義之歷屆試題範例 評量指標. 5-1 摘要段落 要旨. 歷. 屆. 試. 題. 範. 例. 吳晟〈負荷〉 :下班之後,便是黃昏了。偶而野望一望絢麗的晚霞,卻不 在逗留。因為你們仰向阿爸的小臉,透露更多的期待。加班之後,便是 深夜了。偶而也望一望燦爛的星空,卻不再沉迷。因為你們熟睡的小臉, 比星空更迷人。作者說他不再迷戀晚霞和星空,原因為何?(940209) (A)孩子期待他的早歸 (C)風寒露重擔心受涼. (B)工作疲倦到無心欣賞 (D)家庭生計的壓力太大. 「人總是容易看到別人臉上的一抹灰,而不見自己滿面的油汙。」(藍 5-2 推論段落 蔭鼎反省與感謝)請選出語文上含意最相近者?(940219) 觀點 (A)嚴以律己 (B)寬以待人 (C)嚴以責人 (D)愛人如己 「融入身體裡面有限的水中,才想起故鄉是浩瀚的大海/當年以海浪的方式 5-3 推論段落 /一波一波的/移民到陸地上」 〈蘇紹連〉這首詩的題目應該是: (940157) 標題 (A)珍珠 (B)海帶 (C)鹽 (D)魚 「飄浮在高空的斑斕巨物/哪怕是針尖大小的批評/它也受不了。」此 5-4 摘要(總 則描寫的對象,應是下列何物?(940158) 結)段落內容 (A)氣球 (B)風箏 (C)雲朵 (D)飛機 時間在呈現方式上有過去、現在、未來三種型式。下列選項,何者運用 了透過想像延伸到未來的描寫?(940115) 5-5 解釋段落 (A)問君能有幾多愁?恰似一江春水向東流。 歷程(結構組 (B)君問歸期未有期,巴山夜雨漲秋池,何當共剪西窗燭,卻話巴山夜雨時。 織) (C)黃河遠上白雲間,一片孤城萬仞山。 (D)陽光好亮,透葉隙叮叮噹噹擲下一大把金幣。. 25.
(36) 表 4-6 教學目標七-認識修辭之歷屆試題範例 評量指標. 7-1 舉例修辭. 歷. 屆. 試. 題. 範. 例. 「老闆送給每位員工一個足以撐死一頭猪的漢堡,看得眾人都呆了。」 這句話所使用的修辭技巧同於?(940125) (A)不經一事,不長一智 (B)寧為雞首,毋為牛後 (C)去惡,如農夫務去草焉 (D)左邊的鞋印才下午,右邊的鞋印已黃昏了。. 表 4-7 教學目標八-認識語法之歷屆試題範例 評量指標. 歷. 屆. 試. 題. 範. 例. 8-1 分類複詞. 日常語文中「老虎」 「老鼠」的「老」字,其實和年齡無關,請檢視下 列各句,找出「老」字其實指年紀大者?(930134) (A)媽媽「老」想中樂透大獎(B)白樂天詩力求「老嫗」能解 (C)「老遠」跑來看你怎能丟下(D)伯母是製作芋粿的「老手」. 8-2 分類詞性. 下列「」中的字哪一個當動詞用?(940222) (A)「綠」樹村邊合 (B)春風又「綠」江南岸 (C)「綠」肥紅瘦 (D)苔痕上皆「綠」. 表 4-8 教學目標九-認識文化常識之歷屆試題範例 評量指標. 歷. 屆. 試. 題. 範. 例. 請找出下列人物謎語的配對,何者有錯誤?(940216) (A)酒後撈名月,謫仙歸天庭—杜甫 9-1 推論文化 (B)三絕詩書畫,一官歸去來—鄭燮 常識 (C)兩表酬三顧,一對足千秋—諸葛亮 (D)一句莫須有,含恨風波亭—嶽飛 下列不屬於孟子所謂「君子有三樂」的選項是:(940109) 9-2 推論文學 (A)父母俱存,兄弟無故 (B)得天下英才而教育之 常識 (C)仰不愧於天,俯不怍於人 (D)王天下 9-3 推論書體. 中國書法各種字體的描述有所謂: 「 如立, 如趨, 如奔」,請選出 上文 中書法字體的正確排列順序(920146) (A)行/隸/草 (B)楷/篆/行(C)草/行/隸(D)楷/行/草. 關於漢字的敘述,下列何者正確?(930110) 9-4 推論六書 (A)商朝的金文是發現最早漢字(B)漢字以象形字佔最多 常識 (C)說文解字是針對六書而整理(D)刃、甘屬象形,集、苗屬形聲字. 26.
(37) 表 4-9 教學目標十-認識寫作格式之歷屆試題範例 評量指標. 歷. 屆. 試. 題. 範. 例. 曹慶先生排除萬難成立「創世基金會」已收容貧苦無依的植物人,這種 10-1 實行適切 的 襟懷令人由衷景仰!空格中不宜填入:(940210) 語詞 (A)獨善其身 (B)仁民愛物 (C)悲天憫人 (D)推己及人 下列哪句話在寫作題目為「珍惜時間」的文章時不適合採用?(930128) (A)拋棄時間的人,時間也將拋棄他 10-2 實行適切 (B)花有重開日,人無再少年 句子 (C)三延四拖,你就是時間的小偷 (D)有心栽花花不發,無心插柳柳成蔭 「一個孩子的好壞,並不是取決於特權 成績或家庭 因為一個孩子的 10-4 實行適切 存在,本來就有他寶貴的價值呀 」請為句中的 填入適切的標點符號。 標點 (920125) (A),,! (B)、,! (C)、;! (D)、,。. 表 4-10 教學目標十一-認識應用文之歷屆試題範例 評量指標. 歷. 屆. 試. 題. 範. 例. 下列對話中,何者稱呼用與使用錯誤(920145) (A)「祝寶號生意興隆。」「多賴大家照顧小店。」 11-1 實行應用 (B)「明天郊遊,令弟能去嗎?」「家弟有事,無法前去」 文 (C)「麻煩老師多教導小兒。」「也請貴家長多費心」 (D)「請尊夫人一同參加。」「內人不克參加」。. 貳、分析歷屆資優鑑定考試試題的命題原則 本研究進行試題認知向度分析時,參考了「Bloom 教育目標分類之認知歷程 向度」的架構(葉連祺、林淑萍,2003),將認知向度修改為記憶、理解、應用、 分析四個;另外,內容向度參考「九年一貫課綱能力指標」與「基測國文科試題 結構分析表」(鄭圓鈴,2008),分為教學目標與評量指標。並將歷屆試題分類 至已訂定之雙向細目表中的認知能力向度與內容向度,如表 4-11 為分析歷屆試題 之雙向細目表題數分配。. 27.
(38) 表 4-11 歷屆試題對應雙向細目表題數分配 教學 目標 1.認識字形 2.認識字音. 3.認識詞義. 4.認識句義. 5.認識段義. 6.題組-認 識篇章義 (古今散 文、古今韻 文、應用文) 7.認識修辭 8.認識語法. 9.認識文化 常識. 10.認識寫 作格式 11.認識應 用文. 92 年 93 年 94 年資優 94 年語資 評量 記 理 應 分 記 理 應 分 記 理 應 分 記 理 應 分 指標 憶 解 用 析 憶 解 用 析 憶 解 用 析 憶 解 用 析 1-1 1 0 0 0 3 0 0 0 4 0 0 0 3 0 0 0 1-2 1 0 0 0 0 0 0 0 2 0 0 0 1 0 0 0 2-1 2 0 0 0 2 0 0 0 2 0 0 0 3 0 0 0 2-2 1 0 0 0 2 0 0 0 2 0 0 0 2 0 0 0 2-3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3-1 2 0 0 0 6 0 0 0 11 0 0 0 6 0 0 0 3-2 0 3 0 0 0 1 0 0 0 3 0 0 0 2 0 0 3-3 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 3-4 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 4-1 0 3 0 0 0 2 0 0 0 5 0 0 0 0 0 0 4-2 0 2 0 0 0 2 0 0 0 1 0 0 0 1 0 0 4-3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4-4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5-1 0 1 0 0 0 1 0 0 0 1 0 0 0 3 0 0 5-2 0 1 0 6 0 0 0 6 0 0 0 1 0 1 0 1 5-3 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 5-4 0 2 0 0 0 0 0 0 0 1 0 0 0 0 0 0 5-5 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 5-6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6-1 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 6-2 0 0 0 0 0 0 0 0 0 0 0 0 0 6 0 0 6-3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6-4 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 6-5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6-6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6-7 0 0 0 0 0 0 0 0 0 1 0 0 0 4 0 0 6-8 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7-1 0 5 0 0 0 1 0 0 0 2 0 0 0 1 0 0 8-1 0 2 0 0 0 1 0 0 0 0 0 0 0 0 0 0 8-2 0 3 0 0 0 1 0 0 0 1 0 0 0 2 0 0 8-3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 8-4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 9-1 2 6 0 0 0 4 0 0 0 18 0 0 0 2 0 0 9-2 0 0 0 0 0 6 0 0 0 1 0 0 0 0 0 0 9-3 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 9-4 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 9-5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 10-1 0 0 3 0 0 0 2 0 0 0 0 0 0 0 8 0 10-2 0 0 3 0 0 0 2 0 0 0 0 0 0 0 1 0 10-3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 10-4 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 11-1. 0. 0. 2. 0. 0. 0. 3. 28. 0. 0. 0. 1. 0. 0. 0. 1. 0.
(39) 表 4-12 歷屆試題對應雙向細目表各細格命題比例與調整後命題題數 教學 目標 1.認識字形 2.認識字音. 3.認識詞義. 4.認識句義. 5.認識段義. 6. 題 組 - 認 識 篇章義(古今 散文、古今韻 文、應用文) 7.認識修辭 8.認識語法. 9. 認 識 文 化 常 識. 10.認識寫作格 式 11.認識應用文 總和. 評量 命題比例 指標 記憶 理解 應用 分析 1-1 5.1% 0.0% 0.0% 0.0% 1-2 1.8% 0.0% 0.0% 0.0% 2-1 4.2% 0.0% 0.0% 0.0% 2-2 3.3% 0.0% 0.0% 0.0% 2-3 0.0% 0.0% 0.0% 0.0% 3-1 11.5% 0.0% 0.0% 0.0% 3-2 0.0% 4.1% 0.0% 0.0% 3-3 0.0% 1.0% 0.0% 0.0% 3-4 0.0% 0.5% 0.0% 0.0% 4-1 0.0% 4.4% 0.0% 0.0% 4-2 0.0% 2.8% 0.0% 0.0% 4-3 0.0% 0.0% 0.0% 0.0% 4-4 0.0% 0.0% 0.0% 0.0% 5-1 0.0% 2.9% 0.0% 0.0% 5-2 0.0% 1.0% 0.0% 6.6% 5-3 0.0% 0.8% 0.0% 0.0% 5-4 0.0% 1.3% 0.0% 0.0% 5-5 0.0% 0.9% 0.0% 0.0% 5-6 0.0% 0.0% 0.0% 0.0% 6-1 0.0% 1.0% 0.0% 0.0% 6-2 0.0% 3.0% 0.0% 0.0% 6-3 0.0% 0.0% 0.0% 0.0% 6-4 0.0% 0.4% 0.0% 0.0% 6-5 0.0% 0.0% 0.0% 0.0% 6-6 0.0% 0.0% 0.0% 0.0% 6-7 0.0% 2.4% 0.0% 0.0% 6-8 0.0% 0.0% 0.0% 0.0% 7-1 0.0% 4.1% 0.0% 0.0% 8-1 0.0% 1.4% 0.0% 0.0% 8-2 0.0% 3.3% 0.0% 0.0% 8-3 0.0% 0.0% 0.0% 0.0% 8-4 0.0% 0.0% 0.0% 0.0% 9-1 0.9% 13.2% 0.0% 0.0% 9-2 0.0% 3.4% 0.0% 0.0% 9-3 0.0% 0.5% 0.0% 0.0% 9-4 0.0% 1.0% 0.0% 0.0% 9-5 0.0% 0.0% 0.0% 0.0% 10-1 0.0% 0.0% 6.4% 0.0% 10-2 0.0% 0.0% 2.9% 0.0% 10-3 0.0% 0.0% 0.0% 0.0% 10-4 0.0% 0.0% 1.0% 0.0% 11-1 0.0% 0.0% 3.3% 0.0% 26.8% 53.4% 13.5% 6.6%. 29. 總和 6.9% 7.5%. 17.1%. 7.3%. 13.5%. 6.8%. 4.1% 4.7%. 19.0%. 10.2% 3.3%. 調整後命題題數 記憶 理解 應用 分析 2 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 3 1 0 0 0 2 0 0 0 1 0 0 1 0 0 0 0 2 0 0 0 1 0 0 0 2 0 0 0 1 0 0 0 3 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 2 0 0 0 1 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 3 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 2 0 0 1 0 0 0 0 1 0 0 0 1 0 10 34 5 1.
(40) 透過歷屆試題對應雙向細目表命題題數分配分析,將四回歷屆考題依比例計 算細格命題的題數,如表 4-12。另外,因應近年鑑定考試試題數減少,且結合學 科專家意見,將細格命題題數進行調整,最後依照表 4-12 題數分配進行命題。. 第二節. 信度與試題參數分析. 本研究藉由信度與試題參數估計瞭解試題特性,本節中,分別呈現信度分析 與試題參數分析之結果。. 壹、信度分析 本研究以 SPSS 軟體來分析信度,可得到 α 係數為 0.9,顯示此份試卷有良好 的信度。此外進行刪除試題後整體信度分析,並將其結果呈現如表 4-13。 表 4-13 試題刪除後整體信度 題號 刪除後之信度 題號 刪除後之信度 題號 刪除後之信度 題號 刪除後之信度 1. 0.901. 14. 0.902. 27. 0.897. 40. 0.897. 2. 0.897. 15. 0.902. 28. 0.897. 41. 0.902. 3. 0.897. 16. 0.896. 29. 0.897. 42. 0.904. 4. 0.898. 17. 0.897. 30. 0.901. 43. 0.901. 5. 0.904. 18. 0.896. 31. 0.896. 44. 0.904. 6. 0.901. 19. 0.903. 32. 0.902. 45. 0.900. 7. 0.896. 20. 0.901. 33. 0.896. 46. 0.901. 8. 0.897. 21. 0.901. 34. 0.897. 47. 0.902. 9. 0.901. 22. 0.902. 35. 0.898. 48. 0.903. 10. 0.902. 23. 0.902. 36. 0.898. 49. 0.896. 11. 0.901. 24. 0.898. 37. 0.896. 50. 0.898. 12. 0.902. 25. 0.896. 38. 0.896. 13. 0.902. 26. 0.898. 39. 0.896. 貳、試題參數分析 本研究係將預試後收集到的學生作答反應,以 BILOG-MG 估計試題參數, 採用試題反應理論三參數模式分析。表 4-14 為未刪題前之試題參數,分別呈現 IRT 之鑑別度、難度與猜測度,並列出古典測驗的通過率與鑑別度來評鑑試題。. 30.
(41) 表 4-14 刪題前之試題參數表 受測 答對 CTT 人數 人數 通過率 鑑別度 1 309 106 34.3 0.396 2 309 63 20.4 0.195 3 309 27 8.7 -0.137* 4 309 132 42.7 0.323 5 309 32 10.4 -0.022* 6 309 60 19.4 0.301 7 309 187 60.5 0.399 8 309 226 73.1 0.303 9 309 201 65 0.287 10 309 90 29.1 0.274 11 309 216 69.9 0.326 12 309 88 28.5 0.155 13 309 181 58.6 0.228 14 309 172 55.7 0.265 15 309 158 51.1 0.175 16 309 189 61.2 0.349 17 309 69 22.3 0.154 18 309 180 58.3 0.37 19 309 54 17.5 -0.017* 20 309 241 78 0.475 21 309 257 83.2 0.38 22 309 127 41.1 0.245 23 309 228 73.8 0.47 24 309 151 48.9 0.442 25 309 273 88.3 0.467 26 309 164 53.1 0.235 27 309 114 36.9 0.029 28 309 109 35.3 0.145 29 309 115 37.2 0.239 30 309 170 55 0.405 31 309 259 83.8 0.489 32 309 164 53.1 0.224 33 309 222 71.8 0.368 34 309 112 36.2 0.172 35 309 189 61.2 0.396 36 309 133 43 0.203 37 309 223 72.2 0.524 38 309 192 62.1 0.491 39 309 193 62.5 0.534 40 309 151 48.9 0.397 41 309 249 80.6 0.414 42 309 44 14.2 0.036 43 309 224 72.5 0.398 44 309 176 57 0.253 45 309 280 90.6 0.472 46 309 277 89.6 0.445 47 309 193 62.5 0.379 48 309 237 76.7 0.319 49 309 240 77.7 0.489 50 309 163 52.8 0.434 註:標記*為鑑別度為負的試題參數 題號. 31. 鑑別度 1.254 0.685 0.000 0.848 0.799 1.103 0.847 0.528 0.573 0.812 0.538 0.980 0.508 0.456 0.458 0.613 1.258 0.663 1.062 0.993 0.759 1.182 0.898 1.084 1.203 0.569 0.486 0.621 0.888 1.077 1.246 0.664 0.673 0.730 0.847 1.459 1.408 1.224 1.485 1.026 0.811 1.076 0.705 0.465 1.591 1.413 0.691 0.574 0.947 1.402. IRT 難度 0.888 2.275 0.000 0.905 3.518 1.539 0.066 -0.820 -0.112 1.449 -0.669 1.948 0.332 0.291 1.042 -0.053 1.834 0.017 2.702 -0.908 -1.376 1.154 -0.678 0.441 -1.450 0.721 3.262 1.873 1.282 0.359 -1.033 0.795 -0.676 1.618 0.022 1.093 -0.337 -0.002 -0.031 0.520 -1.132 2.074 -0.788 0.153 -1.601 -1.426 -0.203 -1.114 -0.859 0.426. 猜測度 0.121 0.119 0.200 0.194 0.099 0.083 0.209 0.213 0.248 0.135 0.183 0.215 0.247 0.186 0.262 0.190 0.163 0.157 0.156 0.153 0.179 0.261 0.172 0.159 0.197 0.254 0.307 0.224 0.211 0.223 0.227 0.284 0.183 0.226 0.204 0.289 0.231 0.196 0.177 0.184 0.181 0.112 0.143 0.176 0.160 0.233 0.157 0.182 0.180 0.219.
(42) 在表 4-14 中,試題 3、5、19 題古典鑑別度為負數,故先將此三題試題刪除 後再進行一次試題參數估計,如表 4-15。 表 4-15 為刪除古典鑑別度為負的試題之參數估計結果,惠與學科專家進行修 審題,以下針對不良試題分別由 CTT 與 IRT 之參數估計結果進行討論,判定該 題是否刪除,亦或者將試題修審後入庫。 一、古典測驗理論 (一)通過率方面 此份試題通過率小於 0.25 時,則標記為不良試題。在試題 2、6、17、42 題 中,試題之通過率皆小於 0.25。 (二)鑑別度方面 當試題之古典鑑別度小於 0.2 時,則標記為不良試題。在試題 2、12、15、 17、27、28、34、36、42 題中,試題之古典鑑別度皆小於 0.2。 二、試題反應理論 (一)鑑別度 當試題之 IRT 鑑別度介於 0~0.4 之間時,則標記為不良試題。本測驗中,所 有試題之鑑別度皆大於 0.4,故無試題需要修審即可入庫。 (二)難度 當試題之 IRT 難度大於 3 或小於-3 時,則標記為不良試題。在試題 27 題中, 試題之難度大於 3。 (三)猜測度 當試題之 IRT 猜測度大於 0.3 時,則標記為不良試題。在試題 27 題中,試題 之猜測度大於 0.3。. 32.
(43) 表 4-15 第一次刪題後之試題參數表 受測 人數 1 309 2 309 3 309 4 309 5 309 6 309 7 309 8 309 9 309 10 309 11 309 12 309 13 309 14 309 15 309 16 309 17 309 18 309 19 309 20 309 21 309 22 309 23 309 24 309 25 309 26 309 27 309 28 309 29 309 30 309 31 309 32 309 33 309 34 309 35 309 36 309 37 309 38 309 39 309 40 309 41 309 42 309 43 309 44 309 45 309 46 309 47 309 48 309 49 309 50 309 註:標記*為不良試題 題號. 答對 人數 106 63. CTT 通過率 鑑別度 34.3 0.398 20.4* 0.189*. 鑑別度 1.262 0.693. IRT 難度 0.887 2.259. 猜測度 0.122 0.120. 132. 42.7. 0.327. 0.852. 0.904. 0.195. 60 187 226 201 90 216 88 181 172 158 189 69 180. 19.4* 60.5 73.1 65 29.1 69.9 28.5 58.6 55.7 51.1 61.2 22.3* 58.3. 0.306 0.401 0.304 0.281 0.276 0.331 0.148* 0.234 0.265 0.176* 0.348 0.142* 0.376. 1.128 0.849 0.528 0.567 0.806 0.542 0.951 0.513 0.457 0.454 0.611 1.272 0.666. 1.526 0.068 -0.821 -0.119 1.453 -0.663 1.960 0.335 0.291 1.041 -0.055 1.833 0.019. 0.083 0.209 0.213 0.246 0.135 0.183 0.213 0.248 0.186 0.261 0.190 0.164 0.158. 241 257 127 228 151 273 164 114 109 115 170 259 164 222 112 189 133 223 192 193 151 249 44 224 176 280 277 193 237 240 163. 78 83.2 41.1 73.8 48.9 88.3 53.1 36.9 35.3 37.2 55 83.8 53.1 71.8 36.2 61.2 43 72.2 62.1 62.5 48.9 80.6 14.2* 72.5 57 90.6 89.6 62.5 76.7 77.7 52.8. 0.479 0.391 0.236 0.478 0.441 0.479 0.237 0.024* 0.15* 0.237 0.409 0.502 0.223 0.371 0.174* 0.397 0.195* 0.53 0.497 0.538 0.399 0.416 0.032* 0.403 0.257 0.473 0.452 0.381 0.321 0.485 0.432. 0.993 0.759 1.181 0.897 1.083 1.203 0.571 0.472 0.621 0.880 1.076 1.246 0.672 0.674 0.721 0.841 1.470 1.409 1.222 1.480 1.027 0.813 1.094 0.705 0.467 1.589 1.411 0.687 0.574 0.945 1.387. -0.909 -1.377 1.155 -0.679 0.442 -1.451 0.724 3.277* 1.872 1.285 0.359 -1.034 0.799 -0.675 1.623 0.019 1.092 -0.336 -0.002 -0.032 0.520 -1.131 2.055 -0.788 0.154 -1.603 -1.428 -0.206 -1.114 -0.861 0.426. 0.153 0.179 0.262 0.172 0.159 0.197 0.255 0.304* 0.224 0.210 0.223 0.227 0.286 0.184 0.225 0.203 0.289 0.232 0.196 0.177 0.184 0.181 0.112 0.143 0.176 0.160 0.233 0.156 0.182 0.180 0.219. 33.
(44) 從上述古典測驗理論與試題反應理論兩方面標記不良試題中,可以發現需要 惠與學科專家進行修審題之題目有:2、6、12、15、17、27、28、34、36、42 題。 並將待修審之試題進行選項分析統計,將各個選項與未作答個數進行統計並計算 其百分比,如表 4-16。待修審之試題經由學科專家討論後,以下分別針對這些題 目進行說明。 表 4-16 待修審試題之選項分析統計 題號. 正確選項. A. B. C. D. 未作答. 2. A. 20.39%. 30.74%. 23.62%. 24.60%. 0.65%. 6. D. 10.03%. 60.52%. 10.03%. 19.42%. 0.00%. 12. A. 28.48%. 25.57%. 27.83%. 18.12%. 0.00%. 15. C. 4.21%. 3.88%. 51.13%. 40.78%. 0.00%. 17. B. 15.53%. 22.33%. 40.45%. 20.71%. 0.97%. 27. A. 36.89%. 12.62%. 11.65%. 38.51%. 0.32%. 28. A. 35.28%. 20.39%. 21.04%. 22.65%. 0.65%. 34. B. 23.62%. 36.25%. 26.86%. 12.62%. 0.65%. 36. B. 20.06%. 43.04%. 20.71%. 15.21%. 0.97%. 42. B. 5.83%. 14.24%. 52.43%. 26.86%. 0.65%. 34.
(45) 一、第 2 題 此題之古典通過率為 20.4%,古典鑑別度為 0.189,皆屬於不良試題之標準, 另外,選項分析結果發現:除了正確答案之外的三個選項,學生作答的比率皆高 於正確選項 A。學科專家建議,寫出正確字型為學生常忽略之錯誤,故該試題不 予修改。試題如下:. 試題 02. 下列「 」中的注音寫成國字後,何者兩兩相同? (A)草「ㄐㄧㄢ」人命/「ㄐㄧㄢ」芒花 (B)「ㄅㄞˋ」官野史/封侯「ㄅㄞˋ」相 (C)令人「ㄘㄜˋ」目/纏綿悱「ㄘㄜˋ」 (D)相形見「ㄔㄨˋ」/罷「ㄔㄨˋ」百家 CTT. 試題 參數. 通過率. 鑑別度. 20.4*. 0.189*. 選項. A. B. 百分比. 20.39%. 30.74%. IRT 難度. 猜測度. 2.259. 0.120. C. D. k. 23.62%. 24.60%. 0.65%. 鑑別度 0.693 選項分析. 二、第 6 題 此題之古典通過率為 19.4%,屬於不良試題之標準,另外,選項分析結果發 現:選項 B 學生作答的比率高於正確答案選項 D。學科專家建議,選項 B 雖較有 誘答力,但「結」結巴巴之字音學生容易讀錯,故該試題不予修改。試題如下:. 試題 06. 下列文句「 」中的字,何者讀音相同? (A)對於我「嘔」心瀝血的創作,你卻不屑一顧,是存心「嘔」我嗎? (B)在發表實驗「結」論時,他講話「結」結巴巴的,沒人聽得懂。 (C)本來是想製造「噱」頭,結果卻令人發「噱」。 (D)「磨」坊裡的石「磨」已經老舊不堪使用。 CTT. 試題 參數. 通過率. 鑑別度. 19.4*. 0.306. 選項. A. B. 百分比. 10.03%. 60.52%. IRT 難度. 猜測度. 1.526. 0.083. C. D. k. 10.03%. 19.42%. 10.03%. 鑑別度 1.128 選項分析. 35.
(46) 三、第 12 題 此題之古典鑑別度為 0.148,屬於不良試題之標準,另外,選項分析結果發 現:選項 A、B、C 作答機率較為平均。學科專家建議將該試題題幹之語法稍作 修改,使題意更為明確。試題如下: 試題 12 修改前. 「這件事的真相已經昭然若揭了,你再講這些,不過是 ,一點 用處也沒有!」上述缺空中,宜填入下列哪一句諺語? (A)此地無銀三百兩 (B)半瓶子醋響叮噹 (C)偷雞不著蝕把米 (D)煮熟的鴨子飛了. 試題 12 修改後. 「這件事已經真相大白了,你再講這些,不過是 ,一點用處也 沒有!」上述缺空中,宜填入下列哪一句諺語? (A)此地無銀三百兩 (B)半瓶子醋響叮噹 (C)偷雞不著蝕把米 (D)煮熟的鴨子飛了 CTT. 試題 參數. 通過率. 鑑別度. 28.5. 0.148*. 選項. A. B. 百分比. 28.48%. 25.57%. IRT 難度. 猜測度. 1.960. 0.213. C. D. k. 27.83%. 18.12%. 0.00%. 鑑別度 0.951 選項分析. 36.
(47) 四、第 15 題 此題之古典鑑別度為 0.176,屬於不良試題之標準,另外,選項分析結果發現:選 項 D 之學生作答比率較高。學科專家建議將正確選項 C 之語法稍作修改使得選項 C 與 D 之語意較為清楚。試題如下:. 試題 15 修改前. 八八風災後,看著新聞上小林村滅村的報導,怡禎不免感嘆:「我們往往只 利用山林,很少考慮與自然共生存。」下列何者與怡禎這句話的涵義接近? (A)物競天擇,適者生存。 (B)自然的滅亡是與我們無關的。 (C)人在開發自然的時候,也應服從自然的法則。 (D)人們總是毫不猶豫的把大自然破壞得體無完膚。. 試題 15 修改後. 八八風災後,看著新聞上小林村滅村的報導,怡禎不免感嘆:「我們往往只 利用山林,很少考慮與自然共生存。」怡禎這句話的涵義接近下列何者? (A)物競天擇,適者生存。 (B)自然的滅亡是與我們無關的。 (C)人在開發自然的時候,也應該學習尊重自然。 (D)人們總是毫不猶豫的把大自然破壞得體無完膚。 CTT. 試題 參數. 通過率. 鑑別度. 51.1. 0.176*. 選項. A. B. 百分比. 4.21%. 3.88%. IRT 難度. 猜測度. 1.041. 0.261. C. D. k. 51.13%. 40.78%. 0.00%. 鑑別度 0.454 選項分析. 37.
(48) 五、第 17 題 此題之古典通過率為 22.3%,古典鑑別度為 0.142,皆屬於不良試題之標準,另外, 選項分析結果發現:選項 C 學生作答的比率高於正確答案選項 B。學科專家建議, 選項 B 之推測語氣可能較為困難,故將題幹中「大約大去之期不遠矣!」與選項 B 之內容對調。試題如下:. 試題 17 修改前. 試題 17 修改後. 「大約大去之期不遠矣!」此句是推測語氣。下列何者也是? (A)人若能知足,雖貧不苦。 (B)應是母慈重,使爾悲不任。 (C)飽食終日,無所用心,難矣哉! (D)要不是我粗心大意,要得滿分並不難。 「應是母慈重,使爾悲不任。」此句是推測語氣。下列何者也是? (A)人若能知足,雖貧不苦。 (B)大約大去之期不遠矣! (C)飽食終日,無所用心,難矣哉! (D)要不是我粗心大意,要得滿分並不難。 CTT. 試題 參數. 通過率. 鑑別度. 22.3*. 0.142*. 選項. A. B. 百分比. 15.53%. 22.33%. IRT 難度. 猜測度. 1.833. 0.164. C. D. k. 40.45%. 20.71%. 0.97%. 鑑別度 1.272 選項分析. 38.
(49) 六、第 27 題 此題之古典鑑別度為 0.024 試題較無鑑別度,無法區分出高分群與低分群的 學生;IRT 之難度為 3.277,試題難度偏高;IRT 之猜測度為 0.304,學生猜測情 形過高;另外,選項分析結果發現:選項 D 學生作答的比率高於正確答案選項 A。 因各項標顯示出該試題為不良試題,故學科專家建議將此試題予以刪除。試題如 下:. 試題 27. 「水田是鏡子/照映著藍天/照映著白雲/照映著青山/照映著綠樹 農夫在插秧/插在綠樹上/插在青山上/插在白雲上/插在藍天上」(詹冰 插秧)試評鑑這首詩的寫作特色為何? (A)具有濃厚的鄉土氣息和生活情趣。 (B)詩人把注意力集中在農夫辛勤的工作上。 (C)聽覺摹寫和整體意象相結合,極富詩情。 (D)全篇單純的以字來組合,彷如幽靜的水墨畫。 CTT. 試題 參數. 通過率. 鑑別度. 36.9. 0.024*. 選項. A. B. 百分比. 36.89%. 12.62%. IRT 難度. 猜測度. 3.277*. 0.304*. C. D. k. 11.65%. 38.51%. 0.32%. 鑑別度 0.472 選項分析. 39.
(50) 七、第 28 題 此題之古典鑑別度為 0.15,屬於不良試題之標準,但選項分析結果發現:非 正確答案之選項,學生作答的比率未高於正確選項 A。因此,學科專家建議,該 試題不予修改。試題如下:. 試題 28. 下列四組詞語的修辭方式,何組不完全相同? (A)一落千丈、鴉雀無聲、大動干戈 (B)物換星移、梵宇僧樓、金科玉律 (C)星羅棋布、揮金似土、新鶯出穀 (D)紅顏薄命、繁弦急管、付之祝融 CTT. 試題 參數. 通過率. 鑑別度. 35.3. 0.15*. 選項. A. B. 百分比. 35.28%. 20.39%. IRT 難度. 猜測度. 1.872. 0.224. C. D. k. 21.04%. 22.65%. 0.65%. 鑑別度 0.621 選項分析. 八、第 34 題 此題之古典鑑別度為 0.174,屬於不良試題之標準,但選項分析結果發現: 非正確答案之選項,學生作答的比率未高於正確選項 B。因此,學科專家建議, 該試題不予修改。試題如下:. 試題 34. 赴京趕考的全連,投宿於城外的寺廟,因平日缺乏運動,腳力不佳,需耗費 6 個小時 25 分鐘才能抵達考場,禮部頒布應試時間在未時一刻,請問他最晚 幾時得出發? (A)寅時 (B)卯時 (C)辰時 (D)巳時 CTT. 試題 參數. 通過率. 鑑別度. 36.2. 0.174*. 選項. A. B. 百分比. 23.62%. 36.25%. IRT 難度. 猜測度. 1.623. 0.225. C. D. k. 26.86%. 12.62%. 0.65%. 鑑別度 0.721 選項分析. 40.
(51) 九、第 36 題 此題之古典鑑別度為 0.195,屬於不良試題之標準,但選項分析結果發現: 非正確答案之選項,學生作答的比率未高於正確選項 B;且學科專家發現題幹中 「燈謎的謎底」可能造成學生讀題之混淆,故將該試題之幹稍作修改。試題如下: 試題 36 修改前. 下列燈謎的謎底何者是會意字? (A)日 (B)武. (C)捲. (D)佯. 試題 36 修改後. 下列何者屬於會意字? (A)日 (B)武. (C)捲. (D)佯. CTT. 試題 參數. 通過率. 鑑別度. 43. 0.195*. 選項. A. B. 百分比. 20.06%. 43.04%. IRT 難度. 猜測度. 1.092. 0.289. C. D. k. 20.71%. 15.21%. 0.97%. 鑑別度 1.470 選項分析. 十、第 42 題 此題之古典通過率為 14.2%,古典鑑別度為 0.032,皆屬於不良試題之標準, 另外,選項分析結果發現:選項 C 學生作答的比率高於正確答案選項 B。故學科 專家建議,選項 C 可能為較難之詞彙,將該選項予以修改。試題如下: 試題 42 修改前. 花媽一家搬遷至新居,若要寄上賀卡聊表心意,則下列何者不恰當? (A)美輪美奐 (B)宜室宜家 (C)孟母遺風 (D)良禽擇木. 試題 42 修改後. 花媽一家搬遷至新居,若要寄上賀卡聊表心意,則下列何者不恰當? (A)美輪美奐 (B)宜室宜家 (C)喬遷誌喜 (D)良禽擇木 CTT. 試題 參數. 通過率. 鑑別度. 14.2*. 0.032*. 選項. A. B. 百分比. 5.83%. 14.24%. IRT 難度. 猜測度. 2.055. 0.112. C. D. k. 52.43%. 26.86%. 0.65%. 鑑別度 1.094 選項分析. 經由學者專家修審試題後,將第 27 題進行刪除,表 4-17 為最後刪題後之試 題參數表。. 41.
(52) 表 4-17 刪除第 27 題後之試題參數表 題號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50. 受測 人數 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309 309. 答對 人數 106 63. CTT 通過率 鑑別度 34.3 0.401 20.4 0.19. 鑑別度 1.268 0.690. IRT 難度 0.887 2.271. 猜測度 0.122 0.120. 132. 42.7. 0.324. 0.840. 0.909. 0.194. 60 187 226 201 90 216 88 181 172 158 189 69 180. 19.4 60.5 73.1 65 29.1 69.9 28.5 58.6 55.7 51.1 61.2 22.3 58.3. 0.308 0.399 0.308 0.282 0.273 0.329 0.154 0.241 0.266 0.176 0.344 0.143 0.376. 1.140 0.844 0.529 0.568 0.799 0.540 0.946 0.514 0.456 0.455 0.609 1.284 0.665. 1.525 0.066 -0.819 -0.117 1.463 -0.666 1.967 0.336 0.293 1.046 -0.055 1.832 0.020. 0.084 0.209 0.214 0.246 0.135 0.183 0.213 0.248 0.186 0.261 0.190 0.164 0.158. 241 257 127 228 151 273 164 114 109 115 170 259 164 222 112 189 133 223 192 193 151 249 44 224 176 280 277 193 237 240 163. 78 83.2 41.1 73.8 48.9 88.3 53.1. 0.477 0.385 0.239 0.478 0.44 0.472 0.239. 0.992 0.756 1.189 0.899 1.076 1.201 0.576. -0.909 -1.379 1.156 -0.676 0.443 -1.451 0.730. 0.153 0.179 0.262 0.173 0.159 0.197 0.257. 35.3 37.2 55 83.8 53.1 71.8 36.2 61.2 43 72.2 62.1 62.5 48.9 80.6 14.2 72.5 57 90.6 89.6 62.5 76.7 77.7 52.8. 0.155 0.238 0.409 0.501 0.226 0.371 0.179 0.4 0.194 0.527 0.503 0.545 0.397 0.419 0.03 0.401 0.257 0.474 0.456 0.382 0.32 0.482 0.429. 0.620 0.879 1.074 1.242 0.666 0.672 0.725 0.843 1.443 1.406 1.224 1.482 1.023 0.815 0.928 0.705 0.466 1.592 1.417 0.688 0.573 0.943 1.371. 1.872 1.288 0.361 -1.036 0.798 -0.677 1.620 0.021 1.099 -0.336 -0.001 -0.032 0.521 -1.128 2.020 -0.788 0.155 -1.602 -1.425 -0.205 -1.113 -0.863 0.426. 0.224 0.210 0.223 0.226 0.284 0.183 0.226 0.204 0.289 0.232 0.196 0.177 0.184 0.182 0.100 0.143 0.176 0.159 0.234 0.156 0.182 0.180 0.218. 42.
相關文件
Authorized by the State Education Ministry, International College of Traditional Chinese Medicine (ICTCM) was established in 1992 within TUTCM.. It is in TUTCM where
DVDs, Podcasts, language teaching software, video games, and even foreign- language music and music videos can provide positive and fun associations with the language for
• The stimulation of domestic demand aims to changes the Chinese economy from the one aimed at encouraging investments to one where demand and domestic consumption plays a
historical anthropology in a Chinese city”, in Thomas David DuBois and Jan Kiely (eds.), Fieldwork in Modern Chinese History: A Research Guide, Routledge, 2020,
To this end, we introduce a new discrepancy measure for assessing the dimensionality assumptions applicable to multidimensional (as well as unidimensional) models in the context of
Using a one-factor higher-order item response theory (HO-IRT) model formulation, it is pos- ited that an examinee’s performance in each domain is accounted for by a
The left panel shows boxplots showing the 100 posterior predictive p values (PPP-values) for each observed raw score across the 100 simulated data sets generated from
Yuen Shi-chun ( 阮 仕 春 ) , Research and Development Officer (Musical Instrument) of the Hong Kong Chinese Orchestra, is the foremost innovator in the construction