• 沒有找到結果。

S-P表分析法在高年級國語文大型測驗評量上的應用

N/A
N/A
Protected

Academic year: 2021

Share "S-P表分析法在高年級國語文大型測驗評量上的應用"

Copied!
117
0
0

加載中.... (立即查看全文)

全文

(1)國立臺中教育大學教育測驗統計研究所 國民小學教師在職進修教學碩士學位班碩士論文. 指導教授:許天維 博士. S-P 表分析法在高年級國語文 大型測驗評量上的應用. 研究生:楊麗薇. 中. 華. 民. 國. 一. ○. 二. 撰. 年. 六. 月.

(2) 謝. 辭. 首先,感謝指導教授許天維老師循循善誘的教導,以及感謝鄭百成學 長在軟體程式的鼎力相助和研究經驗的傳承,才得以完成論文。其次,感 謝陳進春教授和胡豐榮教授在論文口試時,提供寶貴的意見,使得論文架 構與內容更加完善。 此外,感謝測統所的彰化幫同學:曉霞、湘瑩、靜如和宗憲,院長幫 同學:勇成、育柏、蕙鈞和婉婷,以及班代建宏和班上其他同學,在您們 的協助下,彼此間的切磋琢磨,讓我在學業方面能順利的更上一層樓。 還要感謝星際總部的成員:宜翠、唯羚、青樺、怡宸和志維帶來許多 歡笑;感謝明正加油團:雪梅、惠玲、英雀、秋月、文莉、月霞、文茹和 麗美溫馨的鼓舞著我完成自己的夢想。 最後,感謝魔法媽媽秋純和保母姊姊玅稜的支持,感謝兒子們浚騰和 浚又的善解人意,以及特別感謝老公文鴻的體諒,使我無後顧之憂,才能 專心於學業與論文。 我要將這份榮耀獻給生命中最重要的貴人,謝謝!. 楊麗薇. 謹致. 一0二年六月. I.

(3) 摘 要 國內對於佐藤隆博 (Takahiro Sato) S-P 表(Student-Problem Chart)分 析法是一種經常使用的分析模式,然而誤用或濫用情況頗為嚴重。尤其佐 藤隆博的差異係數(Disparity Coefficient)計算只能應用於一百人以下的 樣本,對於大型測驗的分析研究,則另覓方式使用。本研究目的係在探討 許天維教授發展出來,以 Manhattan 量尺為基礎的部分給分 S-P 表分析法 (Partial Credit S-P Chart Analysis)的原理,在大型國語文評量結果分析的 應用。以參加臺南市某私立學校 102 學年度國小學科能力評量的一千多位 學生為對象,針對其國語學科綜合測驗題型的作答表現資料進行分析。取 得試題的編製特性、學生答題反應的學習類型以及學生在國語文綜合測驗 的理解狀況。研究結果臚列於下: 一、部分給分 S-P 表分析法可應用於大型測驗結果分析,確實計算出此次 測驗的差異係數為 0.5492。 二、試題 Cronbach α 一致性檢驗的信度為 0.662。 三、試題的平均難度為 0.67,題目難度適中。 四、學生作答反應結果分析,可有效提供教師在教學上之應用。 根據本研究結果與發現,本研究方法對於日後大樣本施測評量時,提 供一個嶄新的模式。最後,研究者針對未來研究上提出建議,以作為後續 研究者與教師評量實務之參考。. 關鍵字:部分給分 S-P 表分析法、差異係數、注意係數、選項特徵曲線. I.

(4) Abstract The main purpose focuses on the modified Disparity Coefficent formula for S-P Chart Analysis, as sample volumn in a large-scale assessment are more than one hundred over Takahiro Sato’s Db(M) value. The research applies Partial Credit S-P Chart Analysis bases on Manhattan Scoring to correct quickly the degree of separation between S and P curves, in order to confirm the suitability of the entire assessment. Then, taking more than one thousand students, participated a Mandarin attainment assessment of a private school in Tainan City, for the object and analyzing the assessment by Item Characteristic Curve and S-P Chart Analysis method, to get valuable references about the assessment characteristics and students’ answer responses and to obtain students’ learning styles and comprehensions in Mandarin comprehensive assessment. The results of this study are as follows. 1. The Disparity Coefficient value bases on Partial Credit S-P Chart Analysis formula is 0.5492. 2. The Consistency Reliablity Coefficient of questions is 0.662. 3. The average Difficulty of the questions is 0.67. 4. The results of students’ performance analysis offer teachers to apply in teaching effectively. According to the results and findings, the research methods applied for the evaluation of large sample volume, provides a new mode. Finally, the research put forward suggestions for reference.. Keywords : Partial Credit S-P Chart Analysis, Disparity Coefficient, Caution Index, Item Characteristic Curve. II.

(5) 目 錄 第一章 緒論........................................................................ 1. 第一節 研究動機.................................................... 1. 第二節 研究目的.................................................... 3. 第三節 研究限制.................................................... 4. 第四節 名詞釋義.................................................... 5. 第二章 文獻探討............................................................... 6. 第一節 九年一貫語文領域(國語文)課程.............. 6. 第二節 試題編製與分析理論 .............................. 15. 第三節 S-P 表理論與相關研究............................. 34. 第三章 研究方法.............................................................. 47 第一節 研究架構.................................................... 47. 第二節 研究對象.................................................... 48. 第三節 研究工具.................................................... 49. 第四節 資料處理與分析........................................ 50. 第四章 結果與討論......................................................... 51 第一節 正式試卷試題特性的分析........................ 51. 第二節 S-P 表分析結果的探討............................. 55 第三節 學生答題情形分析.................................... 58. 第五章 結論與建議......................................................... 85 第一節 結論............................................................ 85. 第二節 建議............................................................ 88. III.

(6) 參考文獻................................................................................. 89. 一、中文部分............................................................................. 89 二、英文部分............................................................................. 92 三、日文部分............................................................................. 95. IV.

(7) 附錄一 Bloom2001 年版認知歷程向度分類簡表……........... 94 附錄二 正式試卷...................................................................... 95. 附錄三 試題檢核表.................................................................. 100 附錄四 試題正確選項特徵曲線圖.......................................... 101 附錄五 試題特徵曲線圖.......................................................... 104. V.

(8) 表 目 錄 表 2-2-1 難度等級評定表. ......................………................ 26. 表 2-2-2 鑑別度評鑑標準表 ..............…………………….. 27. 表 2-3-1 DB(M)表 ....................................…………….......... 35. 表 2-3-2 S-P 原始資料表....................................................... 39 表 2-3-3 將學生總分排序後的 S-P 表................................... 40 表 2-3-4 再將試題答對人數進行排序後的 S-P 表............... 41 表 2-3-5 將學生總分與試題答對人數排序後的 S-P 表,實 線為 S 曲線,虛線為 P 曲線 …………………… 42 表 3-3-1 國語文綜合測驗雙向細目表(1)…………………. 49 表 4-1-1 正式試卷試題難度和鑑別度一覽表 .................... 51 表 4-1-2 正式試卷試題難度等級分布表.............................. 52 表 4-1-3 正式試卷試題鑑別度等級分布表 ........................ 52 表 4-1-4 正式試卷試題的信度分析...................................... 53 表 4-1-5 國語文綜合測驗雙向細目表(2)............................. 54 表 4-2-1 學生注意係數表 .................................................... 56 表 4-2-2 問題注意係數表 .................................................... 57 表 4-3-1 A 型之正答選項特徵曲線統計表.......................... 58 表 4-3-2 B 型之正答選項特徵曲線統計表........................... 59 表 4-3-3 C 型之正答選項特徵曲線統計表........................... 60 表 4-3-4 D 型之正答選項特徵曲線統計表 ........................ 61 表 4-3-5 E 型之正答選項特徵曲線統計表 ......................... 62 表 4-3-6 a 型之誘答選項特徵曲線統計表 ......................... 63 表 4-3-7 b 型之誘答選項特徵曲線統計表........................... 64 表 4-3-8 c 型之誘答選項特徵曲線統計表........................... 65 表 4-3-9 試題診斷分析統計表 VI. .......................................... 66.

(9) 圖 目 錄 圖 2-2-1 選項特徵曲線圖 ………………………………… 29 圖 2-2-2 選項特徵曲線圖 ....……………………………… 29 圖 2-2-3 選項特徵曲線圖 ....……………………………… 30 圖 2-2-4 選項特徵曲線圖 ....……………………………… 30 圖 2-3-1 學生診斷分布圖..………………………………… 43 圖 2-3-2 試題診斷分析圖..………………………………… 43 圖 4-2-1 S-P 表圖形 .........………………………………… 55 圖 4-3-1 試題 14 之正確選項特徵曲線圖………………… 58 圖 4-3-2 試題 1 之正確選項特徵曲線圖 …………………. 59 圖 4-3-3 試題 15 之正確選項特徵曲線圖………………… 60 圖 4-3-4 試題 3 之正確選項特徵曲線圖 ………………… 61 圖 4-3-5 試題 7 之正確選項特徵曲線圖 ………………… 62 圖 4-3-6 試題 11 之選項特徵曲線圖……………………… 63 圖 4-3-7 試題 9 之選項特徵曲線圖 ……………………… 64 圖 4-3-8 試題 5 之選項特徵曲線圖 ……………………… 65. VII.

(10) 第一章 緒論 本研究主要在擴展佐藤隆博的S-P表分析法的理論,應用於研究樣本數 大於一千筆時,透過電腦應用軟體程式來探究國小高年級學生在國語文綜 合測驗的理解情形和作答情況,且以試題特徵曲線(Item Characteristic Curve, ICC)和 S-P 表分析法,來取得試題編製與試卷特性、學生答題反應 與學習類型、以及學生在國語文綜合測驗的理解情形和迷思概念,以作為 日後進行教學時的參考。本章節將說明研究動機、研究目的、研究限制及 名詞釋義。. 第一節 研究動機 當代作家說過:「語文就像半徑,隨便找個點當作圓心,就可畫出一 個國家的文化大圓。語文程度越強,半徑越大,也就能畫出越大的國家文 化。」語文教育非常重要,它是學習各門學問的基礎,增進兒童語文表達 能力,可以培養兒童優雅情操及創造思考情趣,自從九年一貫課程綱要實 施以來,國小國語文教學時數縮減,國小高年級國語課程縮減成五到六節 課而已;近年來,國人莫不認為學童的語文能力低落,有需要加強的急迫 性,在國內有「臺灣學生學習成就評量資料庫」(Taiwan Assessment of Student Achievement, 簡稱 TASA ),世界各國也認為閱讀能力影響國力的 強弱,都非常重視閱讀教育,紛紛推動各項閱讀運動,舉辦各項國際性的 評量測驗,如PISA(The Programme for International Student Assessment, 國 際評量計畫)和PIRLS(Progress in International Reading Literacy Study, 促進 國際閱讀素養研究)等。 國語文能力的提升與補救是身為國小第一線教師之首要目標,若缺乏 準確的參考數據,僅進行盲目的提升,唯恐結果適得其反,然而對於學生 學習的評量,往往較多集中在成就性的評量,因為教師最關心學生學會了 多少;但從另一角度來看,診斷性的評量能使人進一步了解學生那些地方 1.

(11) 不會,可提供教學評鑑回饋或補救教學之參考。. 2.

(12) 第二節 研究目的 本研究主要目的係在利用部分給分S-P表分析法來進行國語文大型測 驗結果的分析,並獲得可供參考的差異係數、學生注意係數(Caution Index for Students, CS)和試題注意係數(Caution Index for Items, CP)等數據的應 用。一般而言,佐藤隆博的S-P表分析法的差異係數計算只能應用於100人 以下的樣本,對於大型測驗的分析研究,則付之闕如。透過國內學者許天 維教授採用Manhattan Scoring概念來推導部分給分差異係數公式並修正 S-P表分析法的理論公式,實際應用於樣本人數1132筆的臺南市某私立學校 102學年度國小學科能力評量的大型測驗上,針對學生的國語科綜合測驗 題作答表現進行資料分析探究,提出更準確的解釋,可作為日後適用於數 十人的班級內、數百人的學年間或超過千人的大樣本施測評量,以量化指 標判斷試題編製的良窳、改進命題與教學,提供進行差異化教學、補救教 學以及親師溝通時的參考及學習輔導的依據。 本研究欲探討的問題臚列於下: 一、 分析國小高年級國語科綜合測驗的試題與試卷特性。 二、 部分給分S-P表分析法在大型國語文評量結果分析的應用。 三、 應用S-P表中的注意係數(Caution Index),進行試題診斷分析及學生學 習診斷分析。 四、 探討國小高年級學生對國語文綜合測驗的理解情形。. 3.

(13) 第三節 研究限制 一、 研究內容 研究內容 為達成研究目的,本研究測驗試題主要根據國民中小學九年一貫課程 綱要國語文學習領域,參照十大基本能力指標和Bloom 2001年版理論架 構,依照試題編製原則來編製測驗工具,著重綜合應用能力之評量。. 二、 研究對象 研究對象 本研究以參加臺南市某私立學校102學年度國小學科能力評量的1132 位學童作為研究對象;因此有地域性及廣博性的限制,其結果的呈現主要 是提供給台南區教師作為教學之參考。. 三、 研究方法 本研究採用選擇題的題型,透過部份給分S-P表分析和TestGraf98軟體 來探究高年級學生在國語文綜合測驗的的理解情形。. 4.

(14) 第四節 名詞釋義 茲將本研究所提之重要名詞詮釋如下:. 一、 S-P表分析法 表分析法 S-P表分析法,為日本學者Takahiro Sato 於1970年代所創,利用「圖 形化」的方法分析學生在試題上的作答反應。該方法分析每位學生及每個 試題的作答反應組型,獲得每位學生的學習診斷資料,並藉由學生在試題 上的作答、反應,利用圖形化分析,以提供教師了解學生學習並改進教學 之參考。. 二、 國小高年級學生 國小高年級學生即就讀於國民小學階段五、六年級學生。本研究的國 小高年級學生係指101學年度在台南區國小六年級就讀的學生。. 三、 國語文 依教育部99年度(99.9.23)國民中小學課程綱要審議委員會決議:為求 課程名稱與指標內文用字之一致,以及國內國民習以「國語」稱呼國內共 通語,僅對外籍人士、國外機構等說明時,才採用「華語」之原則,爰再 修訂國語文課程綱要之部分文字如下表:「中國文字、漢字」統一改稱「國 字」;「中國語文、中文、華語文」統一改稱「國語文」;「華語」改稱 「國語」;「古今中外及鄉土(台灣)文學」改稱「國內外具代表的文學」。. 5.

(15) 第二章 文獻探討 本章將探討本研究目的所涉及之相關理論,其探討的內容包含九年一 貫語文領域(國語文)課程、試題編制與分析理論、S-P表理論與相關研究之 相關文獻,共分三節,茲分述如下。. 第一節 九年一貫語文領域(國語文 九年一貫語文領域 國語文)課程 國語文 課程 處於日新月異的二十一世紀全球世界村中,基於國家展望的需求與社 會發展的期待下,教育部進行國民教育階段的課程與教學革新,並於八十 七年九月公布「國民教育階段九年一貫課程綱要」,並於九十學年度正式 實施。九年一貫的課程設計是以學生為主體,以生活經驗為重心,以知識 的完整面為教育的主軸,以終身學習為教育的目標,以培養現代國民生活 所需的基本能力。九年一貫課程綱要的課程目標明訂:九年一貫課程之基 本能力可界定為結合生活經驗,並經由學習所形成之適應現代社會生活所 需能力。九年一貫課程中所要培養的十大基本能力,所指之能力是「處理 生活事物的行為特質」,這些「行為特質」正是未來個人發展的基礎。在 我國九年一貫課程計畫中,所需具備的十大基本能力包含橫跨認知、情意 和技能等層面,其內含包括:了解自我與發展潛能、欣賞表現與創新、生 涯規劃與終身學習、表達溝通與分享、尊重關懷與分享、文化學習與國際 瞭解、規劃組織與實踐、運用科技與資訊、主動探索與研究與獨立思考與 解決問題等能力(成露茜,1999)。. 一、 九年一貫國語文基本理論 旨在培養學生正確理解和靈活應用本國語文字的能力。使學生具備良 好的聽、說、讀、寫、作等基本能力,並能使用語文,充分表情達意,陶 冶性情,啟發心智,解決問題。培養學生有效應用國語文,從事思考、理 解、推理、協調、討論、欣賞、創作,融入生活經驗,擴展多元視野,面 6.

(16) 對國際思潮。激發學生廣泛閱讀的興趣,提升欣賞文學作品的能力,以體 認本國文化的精髓。引導學生學習利用工具書,結合資訊網路,藉以增進 語文學習的廣度和深度,培養學生自學的能力。 李玉梅(2003)認為基本理念包含兩種內涵: (一)培養語文和自學能力:除了重視聽說讀寫作等語文基本能力,並期待 能在生活應用上靈活應用。此外,還強調自學能力的養成,透過工具 書和網路科技的運用,強化學習的效果。 (二)激發學生熱愛語文學習:興趣是刺激學生學習的主要動力,當對語文 學習燃起濃厚興趣,才能夠持續努力。 九年一貫課程目標以九年一貫基本理念為基礎,主要是描述國語文和 十大基本能力的對照情形。. 二、 九年一貫國語文課程目標 (一)應用語言文字,激發個人潛能,發展學習空間。 (二)培養語文創作之興趣,並提昇欣賞評價文學作品之能力。 (三)具備語文學習的自學能力,奠定終身學習之基礎。 (四)應用語言文字表情達意,分享經驗,溝通見解。 (五)透過語文互動,因應環境,適當應對進退。 (六)透過語文學習,體認中華文化,並認識不同族群及外國之文化習俗。 (七)應用語言文字研擬計劃,及有效執行。 (八)結合語文與科技資訊,提昇學習效果,擴充學習領域。 (九)培養探索語文的興趣,並養成主動學習語文的態度。 (十)應用語文獨立思考,解決問題。 課程目標主要是描寫國語文課程目標和十大基本能力指標的對照關 係,馮永敏(2003)指出基本理念和課程目標兩部分有以下三個特性: (一)闡述國語文的學科特質:語文領域的特質是教學生學習語言文字,它 是表述工具和學習工具。 7.

(17) (二)揭示國語文的教學目標:學習語文的目的就是掌握語言文字工具進行 口頭或書面的交際和思維。 (三)具備國語文的育人功能:語文工具除了具有工具性的目標,還具有傳 情達意的特色,並能發揮陶冶和塑造人的品質、情操的隱性功能。. 三、九年一貫能力指標六項內涵 分段能力指標是實施語文課程的準則,作為能力參照標準,用以衡量 學生學習後目標達成的程度,並且作為後續課程評估的依據,為課程建立 標準化綱要的立意。從十項語文課程目標,再衍生出國語文六大能力指 標,「注音符號運用能力」、「聆聽能力」、「說話能力」、「識字與寫 字能力」、「閱讀能力」、「寫作能力」。此六項分段能力指標,須在四 個學習階段內一一完成。馮永敏(2003)認為九年一貫國語文課程以培養學 力為導向,構成螺旋上升、綜合學習的體系,國語文分段能力指標是相互 聯繫的,具有整體性、連續性、階段性和發展性等。而九年一貫的最大特 色,除了以領域涵蓋科目之外,教學主題轉向實踐各項分段能力指標,分 段能力指標成為主要學習重點(林于弘,2006)。分段能力指標先標舉主要 學習重點,其下之文字敘述,則為能力指標之學習內涵,供教材編選及教 學參考,得以靈活應用分段能力指標。第一個數字(1-6)代表能力指標項目 序號;第二個數字(1-4)代表階段序號;第三個數字代表能力指標內涵序 號;第四個數字則為分項說明序號,部分無分項說明者,則無此序號。例 如:(1-1-1-1)即表示注音符號運用能力,第一階段,指標內涵第一項,以 及該項下之第一分項說明序號;(1-1-3)即表示注音符號運用能力,第一階 段,指標內涵第三項。本研究探討高年級國語文評量表現,在國語文第三 階段各項能力指標以下進一步陳述及分析(教育部,2008)。 (一 一)注音 注音 注音符號是民國二年,教育部召開讀音統一會,所議定的「注音字 母」。民國二十四年教育部頒布「注音符號印刷體式」,共計聲母二十一 8.

(18) 個、韻母十六個,另外訂有四個聲調,加上輕聲,共有五個聲調。 九年一貫國語文課程綱要中,注音符號相關指標如下: 1.注音符號運用能力 1-3-1能運用注音符號,理解字詞音義,提升閱讀效能。 1-3-2能瞭解注音符號中語調的變化,並應用於朗讀文學作品。 1-3-3能運用注音符號,擴充自學能力,提升語文學習效能。 1-3-3-1能運用注音符號使用電子媒體(如:數位化字辭典等),提升自我 學效能。 1-3-3-2能運用注音輸入的方法,處理資料,提升語文學習效能。 有關於「注音符號」在第二階段的指標內涵中,一共可以歸納為以下 三項:理解字詞音義、感受語調的變化和應用注音符號於各種媒體(吳佩 儒,2009)。 (二 二)聆聽 聆聽 九年一貫國語文課程綱要中,聆聽相關指標如下: 2.聆聽能力 2-3-1能培養良好的聆聽態度。 2-3-1-1能養成耐心聆聽的態度。 2-3-1-2能仔細聆聽對方的說明,主動參與溝通和協調。 2-3-2能確實把握聆聽的方法。 2-3-2-1能在聆聽過程中,有系統的歸納他人發表之內容。 2-3-2-2能在聆聽不同媒材時,從中獲取有用的資訊。 2-3-2-3能在聆聽過程中,以表情或肢體動作適切回應。 2-3-2-4能簡要歸納所聆聽的內容。 2-3-2-5能結合科技與資訊,提升聆聽學習的效果。 2-3-2-6能具備聆聽不同媒材的能力。 2-3-2-7能正確記取聆聽內容的細節與要點。 9.

(19) 2-3-2-8能從聆聽中,思考如何解決問題。 2-3-3能學習說話者的表達技巧。 2-3-3-1能主動學習說話者的表達技巧。 (三 三)說話 說話 九年一貫國語文課程綱要中,說話相關指標如下: 3.說話能力 3-3-1能充分表達意見。 3-3-1-1能和他人交換意見,口述見聞,或當眾作簡要演說。 3-3-2能合適的表達語言。 3-3-2-1能具體詳細的講述一件事情。 3-3-2-2能簡要作讀書報告。 3-3-3能表現良好的言談。 3-3-3-1能正確、流利且帶有感情的與人交談。 3-3-3-2能從言論中判斷是非,並合理應對。 3-3-3-3能有條理有系統的說話。 3-3-3-4能利用電子科技,統整訊息的內容,作詳細報告。 3-3-3-5能利用播音器材練習良好的語言表達。 3-3-4能把握說話重點,充分溝通。 3-3-4-1能即席演說,提出自己的見解與經驗。 3-3-4-2能在討論或會議中說出重點,充分溝通。 3-3-4-3能在辯論中精要的說出有利己方的意見。 (四 四)識字與寫字 識字與寫字 九年一貫國語文課程綱要中,識字與寫字相關指標如下: 4.識字與寫字能力 4-3-1能認識常用國字2,200-2,700字。 4-3-1-1能利用簡易的六書原則,輔助認字,理解字義。 10.

(20) 4-3-1-2能利用生字造詞。 4-3-1-3能利用新詞造句。 4-3-2會查字辭典,並能利用字辭典,分辨字義。 4-3-2-1會使用數位化字辭典。 4-3-3能概略瞭解筆畫、偏旁變化及結構原理。 4-3-3-1能流暢寫出美觀的基本筆畫。 4-3-3-2能應用筆畫、偏旁變化和間架結構原理寫字。 4-3-3-3能用正確、美觀的硬筆字書寫各科作業。 4-3-4能掌握楷書的筆畫、形體結構和書寫方法,並練習用硬筆、毛筆寫 字。 4-3-4-1能掌握楷書偏旁組合時變化的搭配要領。 4-3-4-2能掌握楷書組合時筆畫的變化。 4-3-5能欣賞楷書名家碑帖,並辨識各種書體(篆、隸、楷、行)的特色。 4-3-5-1能欣賞楷書名家(歐、顏、柳、褚等)碑帖。 4-3-5-2能辨識各種書體(篆、隸、楷、行)的特色。 4-3-5-3能概略欣賞行書的字形結構。 4-3-5-4能知道古今書法名家相關的故事。 4-3-5-5能就近欣賞名勝古蹟的書法之美。 (五 五)閱讀 閱讀 九年一貫國語文課程綱要中,閱讀相關指標如下: 5.閱讀能力 5-3-1能掌握文章要點,並熟習字詞句型。 5-3-1-1熟習活用生字語詞的形音義,並能分辨語體文及文言文中詞語的 差別。 5-3-2能調整讀書方法,提升閱讀的速度和效能。 5-3-2-1能養成主動閱讀課外讀物的習慣。 11.

(21) 5-3-3能認識文章的各種表述方式。 5-3-3-1能瞭解文章的主旨、取材及結構。 5-3-3-2能認識文章的各種表述方式(如:敘述、描寫、抒情、說明、議論 等)。 5-3-3-3能理解簡易的文法及修辭。 5-3-4能認識不同的文類及題材的作品,擴充閱讀範圍。 5-3-4-1能認識不同的文類(如:詩歌、散文、小說、戲劇等)。 5-3-4-2能主動閱讀不同文類的文學作品。 5-3-4-3能主動閱讀不同題材的文學作品。 5-3-4-4能將閱讀材料與實際生活經驗相結合。 5-3-5能運用不同的閱讀策略,增進閱讀的能力。 5-3-5-1能運用組織結構的知識(如:順序、因果、對比關係)閱讀。 5-3-5-2能用心精讀,記取細節,深究內容,開展思路。 5-3-6能熟練利用工具書,養成自我解決問題的能力。 5-3-6-1能利用圖書館檢索資料,增進自學的能力。 5-3-6-2學習資料剪輯、摘要和整理的能力。 5-3-7能配合語言情境閱讀,並瞭解不同語言情境中字詞的正確使用。 5-3-7-1能配合語言情境,欣賞不同語言情境中詞句與語態在溝通和表達 上的效果。 5-3-8能共同討論閱讀的內容,並分享心得。 5-3-8-1能理解作品中對周遭人、事、物的尊重與關懷。 5-3-8-2能在閱讀過程中,培養參與團體的精神,增進人際互動。 5-3-8-3能主動記下個人感想及心得,並對作品內容摘要整理。 5-3-9能結合電腦科技,提高語文與資訊互動學習和應用能力。 5-3-9-1能利用電腦和其他科技產品,提升語文認知和應用能力。 5-3-10能思考並體會文章中解決問題的過程。 12.

(22) 5-3-10-1能夠思考和批判文章的內容。 (六 六)寫作 寫作 九年一貫國語文課程綱要中,閱讀相關指標如下: 6.寫作能力 6-3-1能正確流暢的遣詞造句、安排段落、組織成篇。 6-3-1-1能應用各種句型,安排段落、組織成篇。 6-3-2能知道寫作的步驟,逐步豐富內容,進行寫作。 6-3-2-1能知道寫作的步驟,如:從蒐集材料到審題、立意、選材及安排 段落、組織成篇。 6-3-2-2能練習利用不同的途徑和方式,蒐集各類寫作的材料。 6-3-2-3能練習從審題、立意、選材、安排段落及組織等步驟,習寫作文。 6-3-3能培養觀察與思考的寫作習慣。 6-3-3-1能養成觀察周圍事物,並寫下重點的習慣。 6-3-4能練習不同表述方式的寫作。 6-3-4-1能學習敘述、描寫、說明、議論、抒情等表述方式,練習寫作。 6-3-4-2能配合學校活動,練習寫作應用文(如:會議紀錄、讀書心得、通 知、公告、參觀報告、生活公約、短篇演講稿等)。 6-3-4-3能應用改寫、續寫、擴寫、縮寫等方式寫作。 6-3-4-4能配合閱讀教學,練習撰寫心得、摘要等。 6-3-5能具備自己修改作文的能力,並主動和他人交換寫作心得。 6-3-5-1能經由共同討論作品的優缺點,以及刊物編輯等方式,主動交換 寫作的經驗。 6-3-6能把握修辭的特性,並加以練習及運用。 6-3-6-1能理解簡單的修辭技巧,並練習應用在實際寫作。 6-3-7能練習使用電腦編輯作品,分享寫作經驗和樂趣。 6-3-7-1能利用電腦編輯班刊或自己的作品集。 13.

(23) 6-3-7-2能透過網路,與他人分享寫作經驗和樂趣。 6-3-8能發揮想像力,嘗試創作,並欣賞自己的作品。 6-3-8-1能在寫作中,發揮豐富的想像力。 6-3-8-2能嘗試創作(如:童詩、童話等),並欣賞自己的作品。. 14.

(24) 第二節 試題編製 試題編製與分析理論 教學評量是教師的重要工作之一,也是教師進行教學檢討時可思考的 一環,國內對於學生學科能力的評量,除了傳統的紙筆測驗外,目前國內 很重視多元評量的觀念,如實作評量(Performance Assessment)、動態評量 (Dynamic Assessment)、檔案評量(Portfolio Assessment)等,然而傳統的紙 筆測驗仍是大型評量中的主流方式。雖然目前學校多數使用審定本教科書 且出版社提供題庫光碟供學校教師使用,但是教師自編測驗還是教師常用 的教學評量工具。事實上,教學與評量是一體兩面,缺一不可,每位教師 都必須了解並熟悉測驗編製的原理原則與技術,以便編製出優良的成就測 驗,當作為教學評量的工具,教師編製測驗的過程中,也可以幫助教師釐 清所要教學目標;另一方面藉由教師編製測驗的實施,更可以了解學生的 潛能、學習困難與學習成就,當作為改進教材教法和補救教學的依據(劉湘 川、蔡良庭,2005)。本章節將對測驗編製的技術、單選題的命題原則,以 及試題分析來加以探討。. 一、 測驗編製的技術 測驗的編製方法會因測驗的種類差異而不同,亦會隨著測驗目的的差 異而不同。經歷近百年的發展,測驗編製的原理原則與技術,已經十分純 熟,歸納國內外眾多學者專家們的意見,一份優良的成就測驗編製計畫必 須包括五大步驟(余民寧,2000): (一 一)準備編製測驗計畫 準備編製測驗計畫 一份周詳的成就測驗編製計畫是可以涵蓋整個教學歷程,它不僅可以 提供教師當作為遵照教學目標進行教學的指南,更可以當作為設計測驗試 題的藍圖,用以測量教學所預期的學習成果。因此,一份周詳而具體可行 的成就測驗編製計畫必須包括下列三大項目: 1. 確定測驗的目的與目標 15.

(25) 教學基本模式是先發生教學目標,評量是根據教學目標來決定。教學 目標依據Bloom(1956)、Krathwohl(1964)以及Simpson(1972)分為:認知的 領域(Cognitve Domain)、情意的領域(Affective Domain)、和動作技能的領 域(Psychomotor Domain) 三大領域,測驗的編製計畫會因為測驗目的不 同,而會有不相同的考量,因此教師在開始準備成就測驗編製計畫時,必 須先確定所欲進行測驗的目的,才能作為編製測驗的依據,譬如說:一份 安置性測驗,其試題的難度比較低,必須包含每一項必要的起點行為,以 便將學生安置在適當的教學計畫中;一份診斷性測驗或形成性測驗,其試 題難度不需要太高,試題必須包含學生常犯的錯誤,以及找出易造成錯誤 的原因,避免長期累積學習困難,進而增加實施補救教學措施的負擔;一 份總結性測驗,在教學結束後實施,用以評量學生的學習結果,其試題編 製必須反應教學目標,且試題難度的分佈範圍應該較廣,而評量結果主要 是用來確定是否達成教育目標。 2. 設計雙向細目表 雙向細目表(Two-Way Specification Table)表示測驗的架構藍圖,它描 述了一份測驗中所應該包含的教學內容以及所應評量到的能力,並依據 Bloom2001版(鄭圓鈴,2006)的認知歷程向度,可從記憶、理解、應用、分 析、評鑑與創造等六個層次來編擬試題,用以測量學生們的學習結果。教 師依測驗的目的及教學目標的需求列出內容大綱,以教材內容為橫軸,並 以教學目標為縱軸,畫出一個二向度的分類表,根據教學時數長短與教材 內容的重要性來決定內容比重,而且平均分配好試題的比重或題數於表中 的每個細目裡,並且儘量使試題的取材能夠充分包涵所要評量的教學目標 和教材內容範圍,也可以幫助命題者釐清教學目標和教材內容之間的關 係,用以確保測驗能反映教材的內容,並能夠真正評量到預期的學習結 果,以作為編擬測驗試題的參考藍圖。這樣的一個二向度的分類表稱為「雙 向細目表」。雙向細目表是測驗編製的藍圖,教師自編測驗若能根據雙向 16.

(26) 細目表的計畫來編擬試題,則該測驗便能充分而且完整地充當教學評量的 優良工具,對於聯結「評量」與「教學」的目的,貢獻匪淺。然而在雙向 細目表的使用上,有些基本原則,教師必須確實遵守: (1) 有教學過的教材內容範圍,才可以拿來當作命題的範圍:沒有教學過的 教材內容範圍,不能有試題被命題出來,因為這些試題並能不反映出學 生學習的效果,若以此作為評量學生學習結果好壞的依據,是一種非常 不公平、不客觀的做法。 (2) 寫在雙向細目表中的題目數量,教師應參考教材性質與其所能測量到的 能力目標,來訂定題目的數目,但是一旦確定題數後,就必須要有適當 的試題來測量這些教學目標或教材內容,如此,才能使所編製的成就測 驗成為一份客 觀並且優良的評量工具。 (3) 教師可以針對自己的命題和評分的習慣性,來選定雙向細目表中所陳述 的測驗題型,並加以變化或增減所預擬定的試題題數。 3. 選定測驗的題型 決定好雙向細目表中題目的評量目標和題數後,就要開始選擇適當的 題型來評量能力。試題的類型有很多種類型,由於分類方法不同,一般來 說,可以分成兩大類: (1) 為「選擇型試題」(或是慣稱為客觀測驗) 包括五種題型:選擇題、是 非題、配合題、填充題和解釋性習題。 (2) 另一為「補充型試題」(或是慣稱為論文測驗)包括下列三種題型:簡答 題、限制反應題和申論題(Gronlund, 1993)。 由於這兩類測驗試題所發揮的測量功能大都不同,教師必須事先決定 編製的試題類型,才能使編製的試題發揮應有的測驗功能。 (二 二)編擬測驗試題 編擬測驗試題 編擬試題是測驗編製的核心,一份測驗是否具有良好的特徵(如:信 度、效度、鑑別度等),試題的編擬佔了絕大部分的因素。然而編擬高品質 17.

(27) 的試題並不是一件容易的事,教師必須參考測驗編製計畫的雙向細目表為 藍圖,並且要充分了解各類型試題的優缺點與命題原則,精熟文字的表達 技巧與了解學生的特性及程度,以靈活生動的創造力來撰寫試題,希望能 編擬出預試用的測驗試題。但是無論何種類型的試題,一般命題的原則如 下:(郭生玉,1990) 1. 試題要依據雙向細目表編擬,且試題均勻分佈具有代表性的內容。 2. 試題的文字要簡明扼要,不易使人混淆,但是題意要清楚明確。 3. 敘述扼要,直接切入關鍵點。 4. 使用字彙要適合受試者。 5. 試題答案是公認的正確答案,盡量避免爭議性。 6. 試題要表達清楚,讓學生容易於了解其任務。 7. 每個試題必須獨立存在,內容不要相互重疊。 8. 減少提供正確答案線索的機會。 (三 三)試題與測驗的審查 試題與測驗的審查 教師依據雙向細目表來編製一份成就測驗,所編擬的試題通常會多過 於表中所預定的題數。因此,必須對所編擬的試題進行審查,以便將題數 剪輯成所要的題數,再彙整編成正式的成就測驗試題。試題和測驗的審查 工作主要可分成邏輯審查( Logical Review )和實證審查( Empirical Review) 兩種。 1.「 「邏輯審查」 邏輯審查」又稱作「 又稱作「形式審查」 形式審查」(Facial Review) 目的在以邏輯的方式審查測驗試題,主要是在審查測驗試題是否具有 適當性和一致性,以確保測驗試題都能測量到所需要測量的教學目標。 2.「 「實證審查」 實證審查」又稱作「 又稱作「客觀審查」 客觀審查」(Objective Review) 目的在以實證的方法來審查測驗試題,主要是在審查教學敏感度和試 題功能的分析,透過這些分析,我們可以獲得到很多客觀的量化數據,當 作是判定試題品質良窳與挑選試題編輯成就測驗的參考。 18.

(28) 一般而言,標準化成就測驗的編製由測驗專家編擬好測驗試題後,透 過預試的方式進行實證的試題審查,用以確保測驗試題都具有良好的品質 特徵。 (四 四)試題與測驗的分析 試題與測驗的分析 這個步驟主要是配合上述實證的審查而產生,一般而言,教師自編成 就測驗是可以不必經過嚴謹的試題分析與測驗分析就可以使用,但是標準 化成就測驗就必須經過嚴謹的試題分析和測驗分析之後才能使用。 1. 試題分析: 試題分析:主要是在分析下列指標 (1) 難度指標(Difficulty Index)的分析。 (2) 鑑別度指標(Discrimination Index)的分析。 (3) 誘答力(Distraction)的分析(僅選擇題適用)。 2. 測驗分析: 測驗分析:主要是在分析下列指標 (1) 信度係數(Reliability Coefficient)的分析。 (2) 效度係數(Validity Coefficient )的分析。 (五 五)測驗的編輯 測驗的編輯 在編擬好測驗的試題之後,經過初步的試題形式審查與客觀審查,便 可以進行新測驗編輯的工作。測驗的編輯(Test Editing)是依據測驗的目 的,將優良試題收錄編製成一整份的測驗卷之意。所以,在編製一份測驗 卷時,教師可以考慮下列四個項目來進行。( Ory & Ryan, 1993)。 1. 測驗的長度 測驗的長度指測驗題數的多寡。在經過審查和分析後,教師可以考慮 測驗的目的、信度高低、試題類型、學生能力、學生年齡、作答時間,六 個因素,適當彈性調整測驗所需的長度。 2. 試題的難度 取決於進行測驗的性質而決定。如果是常模參照測驗,為了發揮測驗 的區別功能,常常傾向於使用難易度適中的試題,並刪除太容易或者太難 19.

(29) 的試題,而且大部分的題目最好在中等難度(0.5)左右,也就是說一個題目 大約有一半的學生可以答對。而效標參照測驗是設計來測驗一個人所可能 或無法完成的學習工作,所以決定試題的難度因素是學習材料和學習涵蓋 的範圍。 3. 試題的排列 在選好一定的測驗長度與試題難度後,必需決定如何對試題來做最佳 的安排,教師可以根據試題由易而難、依據教材內容或相同試題類型、依 據測驗能力或教學目標四種排列方式或者混合數種方式,來進行試題的編 排。 4. 編製測驗指導語 最後,教師在編妥試題的排列順序之後,接著要撰寫指導語,一份測 驗才算是編製完成,指導語是引導受試者作答的說明,因此指導語務必要 清楚且明確,受試者才能正確無誤的作答。. 二、 單選選擇題的命題原則 本研究中的試題編製的流程和原則中所編製的測驗試題,就是採用單 選選擇題的題型。選擇題是目前新法測驗中,公認是為最基本,使用最廣 泛、影響最為深遠的一種選擇型試題(Selection-Type Item)。近年來在配合 電腦的使用,讓選擇題測驗的試題、閱卷、計分與測驗結果等方面在分析 上的快速與正確性皆有很明顯的提升,因此廣泛受到喜愛與採用。 選擇題是由三個部分所構成,分別是題幹(Stem)、誘答選項(Distractors) 與正確答案(Key)(或統稱為選項),選擇題的編擬在使具備欲測能力的學 生,能夠選出正確的選項,不因為具誘答的錯誤選項所困惑,並讓一無所 知或一知半解的學生,選擇錯誤的誘答選項。在實際進行試題的編製,設 計題幹和選項時,必須依照雙向細目表的規劃,通常一題單選選擇題試題 是否撰寫良好,其關鍵因素不在於正確答案或較佳答案的選項是否編擬良 好,反而是在於誘答選項是否撰寫的有誘答力、有創意及有區別力,試題 20.

(30) 的誘答選項若是編擬不良,則注定會讓該單選選擇題會喪失多選一的區辨 功能。以下分別就題幹和選項分別敘述其編製原則,並分析單選選擇題的 優、缺點。 (一 一) 題幹部分 單選選擇題提供答案的資訊就在於題幹部分,所以對於題幹的命題原 則,主要有以下幾項要點(陳淑美,1989;郭生玉,1990;王文中、呂金燮 等,2004): 1. 題幹可以為直接問句或不完全的敘述句,一般而言還是以直接問句較 佳。題幹的敘述應力求明確、直接而且能顯示題意且包含足夠的答題訊 息。不需再額外附加說明,就能使受試者清楚了解題目的意思,讓試題 可以測量 到重要的學習結果。 2. 每個題目應只提出一個明確的問題,測量一個重要的學習結果,題幹要 清楚表達題意,避免過長或過短,過分強調閱讀能力或太過冗長,將影 響受試者作答的情況或測不出原先欲測的能力,最後將影響到測驗的信 度和效度。 3. 題幹應盡量用正面的敘述,最好避免使用否定句,如用否定句,則需特 別強調否定字。通常用正面方式敘述的選擇題,比較能測量出學習的重 要結果,而且對受試者而言,也能加強其對事物正面的看法。反面敘述 的方式則著重受試者辨認錯誤選項的能力,難以推知受試者的真正能 力。因此,在使用否定字詞時,應當將此部份劃底線或加粗,以免受試 者忽略題幹真正的涵義。 4. 題幹應力求完整性,免被選項分隔為兩部分或兩個段落,而且在各選項 重覆出現的文字,必須放在題幹內。因為完整的題幹將會有助受試者對 試題有完整的概念,而且容易掌握題意,如果將題幹分成兩部分,將會 增加作答的困難程度,使測驗的信度與效度降低。若測驗某「詞語」的 定義,則該「詞語」也必須放在題幹內。 21.

(31) 5. 無論哪種類型的題目,每一道試題必須要有一個確定而不會引起爭論的 答案。理想上,每個試題都應有一個完全正確的答案,正確答案題目只 可提供一個正確的選項而且應該避免提供正確答案的暗示性線索,而題 目的最佳答案必須經由大多數測驗專家所共同認定。 6. 試題中的內容取向,應避免使用過度特定或過於一般的材料。因此試題 的文句需重新組織,避免直接抄原來材料或課本內容。 7. 題幹中應該避免提供選擇正確答案的線索或是提供刪除不正確答案的 線索。 (二 二)選項部分 選項部分 單選選擇題是讓受試者從題目中的幾個選項,選擇一個正確或者最適 當的選項來當作答案,因此命題者當在考量這些選項所要放的內容時,還 需要特別的注意,因為受試者是根據這些選項來作答的,以下是在命題選 項時,所需要特別注意原則(郭生玉,1990;陳英豪、吳裕益,1994;王文 中、呂金燮等,1999): 1. 同一測驗所有的選擇題必須要有相同的選項數(以三個至五個較佳),然 而選項數的多寡,還需配合受試者的年齡大小與身心成熟程度,一般情 況會以四個選項為主,過多的選項會增加試題的困難度,會使得學生猜 題的比例增加。 2. 誘答選項應似是而非、具誘答性用以吸引未具備應有知識的學生們選 答。錯誤選項與題幹相關之間應有相當的似真性、邏輯性與合理性,最 好是混有常見的錯誤或錯誤,以發揮應有的誘答功能。 3. 「以上皆是」、「以上皆非」的選項不適用最佳答案題目的選擇題,僅 適用於對、錯明確區分的正確答案題目。在試題的設計上,若選項有「以 上皆是」,那就需要要特別小心,一定要每個選項都完全正確,不能有 任何一個選項有絲毫的疑問,以免讓受試者無法判斷正確選項為何,因 而降低測驗的效度。如果使用「以上皆非」為答案的選擇題,只能測試 22.

(32) 受試者辨識不正確選項的能力,不能保證受試者一定會具備知道正確答 案的能力,因此在編製試題上還是少用「以上皆是」「以上皆非」的選 項,除非選項數目真的不夠。 4. 選項之間應相互獨立避免重疊現象,而且最好按選項的選擇順序排列 之。如果選項間有重疊的現象,將會導致受試者無法作答,而選項間若 是有一些次序關係或其他的特殊關係存在時,例如:都是數字,那最好 能由小排到大或由大排到小,才不會造成受試者作答時的困擾。 5. 正確選項在內容或形式上不可以特別突出,應該變化正確答案的長度以 排除提供線索的可能,並且以隨機方式變化正確答案的位置且平均分配 於試卷中。同一試題的所有選項,應該在內容或形式上具有相類似的共 通點,不然會造成某一些選項成為不具誘答力的選項而且標準答案必須 是正確的答案或是最佳答案。 6. 盡可能將選項按照邏輯次序(數字)或時序(日期)的方式來排列,如無法 用邏輯次序或時序排列,可以按筆劃來決定排列位置,或者使用「隨機 字母表」來決定選項的排列。各位置出現正確選項的次數要大致上相 等,而且須隨機排列,以避免猜測因素的影響。 7. 避免提供暗示線索的答案,例如:「所有」、「總是」、「絕不」等字 詞,常常暗示受試者選項為錯誤選項;而「可能」、「或許」、「有時」 等字詞則常為正確的選項。這些具有暗示線索的選項,最好少用以避免 降低測驗的效度。 8. 每一個選項最好各佔一列為原則,以方便受試者閱讀和比較各選項間的 差異。其次,選項的代號最好能和選項內容有所差異。. 三、 試題分析 試題分析在整個測驗編製過程中,扮演著非常重要的角色。一份好的 測驗,是由良好品質的試題所組合成,而每道試題品質的良莠,就必須藉 由試題分析來獲取相關的訊息。因此試題分析的功能,即是在於了解題目 23.

(33) 的品質,修改或刪除品質不佳的試題,進一步改善試題的品質,以達到提 昇測驗品質的目的。 (一 一) 試題分析分法 試題分析可以從不同的角度來分析了解,以下由主觀性的試題評鑑和 客觀性的試題評鑑兩個角度來評鑑試題的好壞(劉修全,2011): 1. 主觀性的試題評鑑 主觀性的評鑑可由出題者或其他學科專家,依個人的專業背景能力和 個人的出題經驗來主觀的判定試題的優劣,但因為判定的結果為主觀認 定,所以每個人的評斷結果可能不同。 2. 客觀性的試題評鑑 將測驗後的結果來做分析,將分析後的結果數據化,再依這些數據來 評斷試題的優劣。 (二 二) 傳統試題分析法 質的分析(Qualitative Analysis)和量的分析(Quantitative Analysis)為傳 統試題分析的兩大類,前者就試題的形式與內容,主觀的從取材適切性與 編擬試題的技術兩方面進行評鑑;後者則是根據試題實際施測後,經由收 集受試者的答題情況,基於試題預試的結果,來分析試題優劣的指標如難 易度、鑑別度、猜測度、受試者答題的選項分析等,當作選擇或修改試題 的依據。從測驗理論的觀點來看,所有的試題均須經過質與量的分析,才 能獲知何者為優良試題。 1. 試題之質的分析 每一份不同的測驗均有不同的目的與適用的範圍,因此在編製試題 時,必須要針對這些特別目的來編寫適合的試題,所以試題必須能符合課 程的內容,並且依據所要達成的教學目標,就受試者行為變化的不同加以 評量,這些都可以由有效命題原則、試題的內容審查等方式來進行(余民 寧,1997)。並且利用雙向細目表來檢視,可以暸解試題是否符合課程內容 24.

(34) 與教學目標,知道在各教學單元中所佔試題的比例是否適當;而且試題檢 核表則是用來逐題檢視試題的品質,檢查試題是否符合命題原則,以達到 對試題品質的要求。 2. 試題之量的分析 為避免測驗中出現過難或鑑別度過低等問題的試題,所有的試題逐一 分析其難易度、鑑別度與選項誘答力分析,以作為選擇試題或修改試題的 依據(余民寧,2002),三大統計特徵分述於下: (1) 難度分析(Difficulty) 難度分析 難度分析是針對某一個試題,答對的人數百分比(Number Correct Ratio),難度指數最高可能為1,代表全部所有學生都答對,最低也可能為 0,代表全部所有學生都答錯,所以難度指數可以表示試題的難易度,指 數越大,表示試題越簡單,指數越小,表示試題越困難。如果難度指數接 近0或1時,試題的鑑別度越低,因為此試題難以區分學生的個別差異,所 以也無法影響成績分布的離差,可以修改此試題或刪除之。難易度的計算 方式有下列兩種: a. 難易度最簡單的分析方法就是計算全體受試者答對每個試題的人數佔 總人數的百分比。其計算公式如下所示:. 其中. :表示單一試題難度指數 :表示單一試題答對該題人數 N. :表示全體受試者. b. 以答對該試題的百分比來表示,因為試題分析時,常是難度指標與鑑別 度指標一起來計算,故常常以下列公式計算:. 25.

(35) 其中. :高分組(全體受試者當中分數最高的 27%)答對該試題的百分比 : 低分組(全體受試者當中分數最低的 27%)答對該試題的百分比 專家建議一般測驗挑選測驗難度值約為 0.5,此時測驗的鑑別度可達. 最大。但實際的選擇題上要達到每一試題難度直接近 0.5 是有些困難。因 此,Chase(1978)主張以 0.4 至 0.8 之間的難度值範圍當作為選擇題挑選之 標準較為適當。 表2-2-1 難度值. 難度等級評定表 難度等級. 備註. 極困難. 鑑別度低. 困難 難易適中. 鑑別度高. 容易 極容易. 鑑別度低. (2) 鑑別度分析(Discrimination) 鑑別度分析 鑑別度是在區別該試題是否具有區別學生能力高低的功能,鑑別度最 高值為1,即表示高分組的同學對該試題全部都答對而低分組同學全部答 錯,也可能為-1,即低分組的同學對該試題全部都答對而高分組同學全部 都答錯,若鑑別度指數為負的試題應淘汰,因為試題可能有包含語意不清 甚至題目出錯,導致高分組學生看不懂試題或是會錯意而答錯,而低分組 同學可能用猜測方式,碰巧猜對,使得最後的試題分析結果為低分組同學 答對的比高分組同學多。其計算公式如下:. 其中. 表示單一試題鑑別度指數 表示所有高分組答對單一試題的百分比 表示所有低分組答對單一試題的百分比 26.

(36) Ebel & Frisbie(1991)提出幾個鑑別度指數的依據做為參考,如下鑑別 度評鑑標準。 表2-2-2. 鑑別度評鑑標準表. 鑑別度指數. 說明 非常好的試題. 0.30~0.39. 適當的試題,也許可再改進. 0.20~0.29. 勉強可以用的試題,通常需改進 拙劣的試題,需要刪除. (3) 誘答力分析(Distraction) 誘答力分析 主要用於多選題型的試題,用來分析不正確的選項是否具有誘答功 能。誘答力是指受試者在一份試卷中,依據低分組和高分組在每個試題選 項上選答的次數分配,再加以分析與判斷,如果高分組的選答正確選項 者,多於低分組的答對人數,而選答其餘不正確選項者,是低分組的答對 人數多於高分組的答對人數,則表示該試題具有較高的誘答力。藉由選項 誘答力的分析,可以順帶檢查是否題目有模糊不清,弄錯重點,猜測等現 象,並且可以協助教師改進編製試題的技巧及調整教學策略。 以選擇題的類型而言,選擇型試題提供三至四個不正確的選項,用來 吸引知識不夠完整或僅有部分知識的學生去隨機猜測不正確的選項,以發 揮選擇題特有的「誘答」功能,增加試題的鑑別功能。 由郭生玉(1985)提出兩個判斷原則: a. 至少有一位低分組學生選擇任何一個不正確選項。 b. 選擇不正確選項的低分組學生人數應該比高分組學生人數還多。 由余民寧(2002)提出四項指標: a. 每個不正確選項都至少有一個低分組受試者選答。 b. 低分組應比高分組有更多人選擇不正確答案。 27.

(37) c. 誘答選項的人數百分比不應高過正確選項。 d. 每個誘答選項的誘答力應相當。. 四、 選項特徵曲線 (一 一) 理論基礎 有別於以往傳統的試題分析方法,比較接近現代的分析方法就是試題 反應理論(Item Response Theory,IRT),加拿大學者Ramsay結合核平滑無參 數估算法與高低試題鑑別指數,發展出了誘答選項與正確選項均可分析的 核平滑法無參數試題特徵曲線估算法(Kernel Smoothing Approaches To Nonparametric Curve Estimation),並發表於Psychometrika(1991)期刊上。核 平滑(Kernel Smoothing)就是指被估計的受試者加以排序後的試題選項和 函數是否被選(不選是0,選則是1) ,而成為二元變數(Binary Variable)之間 的關係。此方法並無事先假設任何適當的模式,完全是由受試者實際作答 的資料來加以進行分析,是一種無參數(Nonparameter)的試題反應理論(楊 志強,2004; Ramsay, 1991)。 TestGraf98就是Ramsay根據上述理論發展出來的軟體,它是以受試者 在某一試題之選答率為縱軸,並以受試者的能力為橫軸,事先並無先假設 其依循某一特定的試題反應模式,完全是根據受試者的作答資料,配合核 平滑化的方式,得到一條平滑可估計之選項特徵曲線(Option Characteristic Curve, OCC)。選項特徵曲線的特性是利用圖形化的方式來記錄數據與比較 資料,相對於單純的數字或繁冗的文字敘述表現更來得清楚且詳盡。選項 特徵曲線對於診斷試題能夠提供有效的幫助,它能決定是否提供比較具誘 答力的選項或是修改題意不清的試題選項。以下就舉幾個例子來說明選項 特徵曲線的功能,以圖2-2-1為例,說明選項特徵曲線的意義與解釋方式(楊 志強、楊志堅,2003)。. 28.

(38) 圖2-2-1 選項特徵曲線 正確選項是D,正確選項具有良好的鑑別度,能力愈高者則通過率愈 高,能力愈低者通過率則愈低。就其他錯誤的選項A、B、C 也具有誘答 力,能力愈高的受試者不會去選擇錯誤選項,而能力愈低的受試者則選擇 該錯誤選項的比例就愈高。. 圖2-2-2 選項特徵曲線 如圖2-2-2顯示,正確選項是B,正確選項在能力介於50%至75%之間 的受試者鑑別度不佳。錯誤選項A對於能力低於75%的受試者具有誘答 力,其餘錯誤選項誘答力比較不好。. 29.

(39) 圖2-2-3 選項特徵曲線 如圖2-2-3顯示,正確選項是D,正確選項在能力低於25%以下的受試 者稍具鑑別力,對於能力值在75%以上的受試者則不具鑑別力。所有誘答 選項僅對能力低於25%以下的受試者具有誘答力。整體而言,這個試題過 於簡單,對於中高能力的受試者則較不具有鑑別度。. 圖2-2-4 選項特徵曲線 如圖2-2-4顯示,正確選項是D,能力愈高的受試者通過率愈高,但是 圖中發現能力愈低的受試者通過率則沒有越低,另外,錯誤選項A、B、C 曲線相類似。整體而言,試題鑑別力不佳,錯誤選項建議可以修改,鑑別 度亦可能因此提升。 30.

(40) (二 二) 正確選項特徵曲線形狀 根據許天維(1995)「數學試題分析法」中提出將正確選項特徵曲線依 照其形狀,可歸納為A、B、C、D、E等五種類型,每種類型代表不同的試 題特性,A型呈現嚴格遞增凹向下之曲線;B型呈現嚴格遞增凹向上之曲 線;C型呈現無水平嚴格遞增直線;D型呈現嚴格遞增S型曲線;E型呈現 嚴格遞增反S型曲線。 (三 三) 誘答選項特徵曲線形狀 林育柔(2002)認為測驗的試題選項特徵曲線分析結果,可將其誘答選 項特徵曲線歸納為a、b、c、d等四種類型,每種類型代表著不同的誘答特 性,a型有一個誘答選項特徵曲線和正確答案選項特徵曲線呈現著對稱關 係;b型有二個誘答選項之選項特徵曲線近似;c型有三個誘答選項之選線 特徵曲線近似且互相纏繞;d型的誘答選項之選線特徵曲線反而對高能力 受試者具有高誘答力。. 五、 試題選項特徵曲線的相關研究 本研究利用試題選項特徵曲線來進行試題分析,其相關研究如下: 研究者. 吳逸珊(2009) 吳逸珊. 研究對象. 國中三年級學生. 研究目的. 如何改進命題技術以提升測驗的品質. 研究方法. 試題選項特徵曲線分析法. 研究結果. 1.高能力者對於各項學習內容的答題表象多為優良,能統整知 識並解決包含兩個情境以上的問題。 2.中上能力者在指數律、圓的表現上普通;其餘皆有優良或不 錯的表現,大致上有正確解決問題的能力。 3.中下能力者在指數律、圓的表現上有待加強;其餘單元表現 普通,具備基礎學習概念,但無法善用並逐項解決問題。 4.低能力者:各題的回答情況不理想,教師宜進行補救教學。 31.

(41) 研究者. 許騰峰(2009) 許騰峰. 研究對象. 國中三年級學生. 研究目的. 分析「2008 年台南市市長盃國民中學數學競賽第一階段試題」. 研究方法. 試題選項特徵曲線分析法. 研究結果. 1. A、B 兩卷皆能清楚區分中、低分組受試者的試題。 2. A、B 兩卷大部分試題的錯誤選項具有良好的誘答力,僅 2 題試題違反兩項以上之誘答力指標。 3. A、B 兩卷學生成績分布大致接近常態分佈。. 研究者. 許浩瀚(2007) 許浩瀚. 研究對象. 國小六年級學生. 研究目的. 了解此份數學能力診斷評量在古典測驗理論與試題反應理論 試題分析之各項指數表現,比較兩種模式各項參數間之關係。. 研究方法. 古典測驗理論、試題選項特徵曲線分析法. 研究結果. 1.測驗信度對能力中等的學生來說表現比較佳。 2.古典測驗理論的難度中等偏易而且鑑別度良好。 3.選項特徵曲線的類型分布表現良好。. 研究者. 莊正國(2006) 莊正國. 研究對象. 國中二年級學生. 研究目的. 探討根據能力指標自編的「國二段考試題」的試卷與試題特性。. 研究方法. 試題選項特徵曲線分析法、質的分析與量的分析. 研究結果. 1.難度適中、符合命題中低難度的要求,試題評鑑為非常優良。 2.同時效標關聯效度達顯著正相關,能預測學生在學成績。 3.題目對低分組具有誘答力,正確選項的曲線皆是漸近上揚。 32.

(42) 研究者. 林育柔(2002) 林育柔. 研究對象. 國小四年級學生. 研究目的. 以自編「國小中年級面積概念測驗」的試題,分析國小中年級 學生對面積概念的了解情形。. 研究方法. 試題選項特徵曲線分析法. 研究結果. 1.測驗具良好的信度和效度,準確地估計受試者的能力值。 2.一般受試者們對面積基本概念的理解較弱。 3.高能力的受試者對面積的保留概念和測量概念較好。. 研究者. 林子幼(2001) 林子幼. 研究對象. 國小三年級學生. 研究目的. 數學科正整數乘法概念的測驗進行試卷統計分析與試題統計 分析。. 研究方法. 試題選項特徵曲線分析法. 研究結果. 1.從試題的選項特徵來分析試題的難度,等組型和比較型的乘 法問題較簡單,直積型的乘法問題較困難。 2.從學生在不同時期可能表現出的乘法運思中,可以發現有些 學生上處於合成運思期,無法處理單位量的轉換問題。. 資料來源:研究者整理 從以上試題選項特徵曲線來進行試題分析的相關研究中,可以發現研 究者使用的研究方法是值得被使用的分析方式。. 33.

(43) 第三節 S-P表理論與 表理論與相關研究 表理論與相關研究 一、S-P 表的意義 S-P表又稱為學生問題表,是由佐藤隆博於1975 年提出。根據作答反 應資料所得之診斷資料可以知道學生的學習成效及試題是否恰當,這種方 法適用於小樣本數的班級人數之形成性評量(Takeya,1980; Tatsuoka, 1984) 之測驗資料分析。 S-P 表是在分析學生及試題作答反應組型(Item Response Pattern)的注 意係數(含學生及試題注意係數),以及整份測驗的差異係數和同質性係 數。這些指標都是用來協助教師診斷學生表現、測驗品質的有效工具,以 作為改進教學、命題與輔導學生之參考(游森期、余民寧,2006)。S-P 表 所關心的是學生在測驗上的作答反應組型,嘗試以幾個指標化數據,做為 診斷或判讀該反應組型是否為不尋常或異常的一種測驗分析方法。 (一) 二元計分(Dichotomous)分析法差異係數 分析法差異係數 二元計分 教師經過全對者給 1 分全錯者給 0 分的評分後,得到一個 N × n 的 S-P 原表. ,其中. 0 分且. 意指第 i 位學生答對第 j 題時得 1 分否則得 。透過佐藤隆博 S-P 表分析理論,若令. 第 i 位學生的總分為. 且第 j 題全體學生的計分為. , 並 將 S-P 原 表 更 換 排 序 , 使 得. 且. 可得新的 S-P 分析表。再根據佐藤隆博的 S-P 表分析理 論(佐藤隆博,1975;藤原秀雄,1980),由 S 曲線與 P 曲線的乖離(Dinero & Blixt, 1998),可求得差異係數近似值公式為: D∗ =. C 4 NnP (1 − P ) D B ( M ). 其中,C:SP 兩曲線包含 1, 0 個數的總合且 34.

(44) P=. 1 n 1 n xi• = ∑ ∑ x• j Nn i =1 Nn j =1. 而 M = [ Nn + 0.5] , [ ⋅ ] 係指Gauss整數值符號,表示若M為整數且 時,則. 。 M 對應DB(M)表的數值如表2-3-1所示:. 表 2-3-1 M 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28. DB(M) .278 .285 .291 .296 .302 .307 .312 .317 .321 .326 .330 .334 .337 .341 .344 .347 .350 .353. M 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46. DB(M) .355 .358 .360 .362 .364 .366 .367 .369 .370 .372 .373 .375 .377 .378 .380 .381 .382 .383. M 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64. DB(M)表 DB(M) .384 .385 .386 .387 .388 .389 .390 .391 .392 .393 .394 .395 .396 .397 .398 .399 .400 .401. M 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82. DB(M) .402 .403 .404 .404 .405 .405 .406 .407 .408 .408 .409 .409 .410 .410 .411 .411 .412 .412. M 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100. DB(M) .413 .413 .414 .414 .415 .415 .416 .416 .417 .417 .418 .418 .419 .419 .419 .420 .420 .420. 資料來源:佐藤隆博,1975. (二 二) 部份給分差異係數的推導 原始得分矩陣資料為. ;. 示第i個學生在第j題試題的得分, 為 排序,使得. 。. 表. 。現在,若令第i位學生的總分. 且第j題全體學生的計分為 且. ,並將S-P 原表更換 ,則可以獲得新的S-P分. 析表。透過部份給分S-P表分析理論,可修正差異係數近似值公式為:. 35.

(45) N. n. ∑x + ∑x i•. ∗. D =. 其中,. i =1. N. •j. n. ∑∑ a b. −2. j =1. ij ij. i =1 j =1. 4 NnP (1 − P ) DB ( M ). a ij = max {min {1, x i • − j + 1},0}. P=. ,. { {. } },且. bij = max min 1, x • j − i + 1 ,0. 1 N 1 n x = x• j ∑ i• Nn ∑ Nn i =1 j =1. , [ ⋅ ] 係 指 Gauss 整 數 值 符 號 , 表 示 若 M 為 整 數 且. 而. 時,則. 。而M對應到DB(M)的數值如表1所示。(俞克. 斌、許天維,2012) (三 三)學生注意係數 學生注意係數(CS)與試題注意係數 與試題注意係數(CP) 學生注意係數 與試題注意係數 注意係數是 S-P 表針對「個別」學生與試題所使用的另一類係數,可 分為學生注意係數與試題注意係數兩種。主要是用來作為判斷學生或試題 在反應組型中是否有異常現象的指標(Dinero, & Blixt, 1988; Chen, Lai, & Liu, 2005; Lin, & Chen, 2006a; Lin, & Chen, 2006b),教師可利用這些指標瞭 解學生或試題的狀況與問題所在。試題注意係數可以用來檢視試題適當 性,也可以藉由受測者注意係數,將受測者學習成果區分成不同的學習類 型(Lin, & Liu,2010; Yih, & Lin, 2010)。S-P 表不但可以使用於學習中的形成 性評量,對於已經完成的課程進行診斷性評量,更能發揮其改進效用(余民 寧,2009)。 透過佐藤隆博 S-P 表分析理論,可得第 位學生的注意係數定義為 n. ∑ (x CS k = 1 −. kj )( x • j ) − ( x k • )( x ). j =1. m. ∑ (x. • j ) − ( x k • )( x ). j =1. 其中, x =. 1 n ∑ x• j 且 m = x k • (Harnisch & Linn, 1982; McArthur, 1983; n j =1. Chen, Lai & Liu, 2005;Chen, Lai & Jhan, 2007)。同理,亦可得第 k 題的注 意係數定義為 36.

(46) N. ∑ (x CPk = 1 −. ik. )( xi • ) − ( x•k )( x ). i =1. m. ∑ (x. i• ). − ( x •k )( x ). i =1. 其中, x =. 1 N ∑ xi• 且 m = x•k (Harnisch & Linn, 1982; McArthur, 1983; N i =1. Chen, Lai & Liu, 2005;Chen, Lai & Jhan, 2007)。 所謂的注意係數是指 S-P 表中實際反應組型與完美反應組型間的差 異,佔完美反應組型之最大差異的一種比值(余民寧,1997),它的數學涵 義可以下列公式來表示: 注意係數 =. [實際反應組型 ]與[完美反應組型 ]間的差異 [完美反應組型 ]的最大差異. 最大差異旨在給定此組型之平均值時,最為不規則之狀態,這種定義 方法以 S-P 表之邊際次數(即各個學生的總分或試題之答對人數)為基準變 量來表示(余民寧,1997),因此上述公式可表示如下:. 注意係數 =. 完美反應組型與  實際反應組型與  基準變量之共變數 − 基準變量之共變數     完美反應組型與  隨機反應組型與  基準變量之共變數 − 基準變量之共變數    . 上述[隨機反應組型與基準變量之共變數]一項,在計算時會有差異產 生,因此,以期望值來表示較為適當,而在此種情況下其期望值為 0(余民 寧,1997)。所以上述公式可以表示如下: 注意係數 = 1 −. 實際反應組型與基準變 量之共變數 完美反應組型與基準變 量之共變數. (四 四) S-P表差異係數判斷標準 表差異係數判斷標準 佐藤隆博認為在正常的情況下,差異係數 D* 會介於0到1之間(佐藤 隆博,1975;1985)。在大多數的實例中,當D* <0.4時,係指教師授課與 學習者反應間具高密切性(宮地功,1977;勘久保広一,1988);形成性測 驗是以D* = 0.4前後而標準學力測驗是以D* = 0.5左右為標準值;標準學力 測驗或形成性測驗以D* >0.6,形成性非選擇測驗以D* >0. 5,顯示教師應 37.

(47) 該注意學習者對測驗表徵含有異質因素,應檢討對學習者的指導過程,並 適當的修改(佐藤隆博,1985;勘久保広一,1988)。 造成S曲線與P曲線之間過度分離的原因(陳騰祥,1986),計有下列九 項: 1. 教學不夠徹底,不夠清楚。 2. 學習目標和學習內容與測驗內容不符,或測驗內容的編制未能反映教學 的內容。 3. 命題順序及試題間前後關係編排不當,以及試題內容、表達敘述與提示 等不適當。 4. 教學時間與實施測驗時間相隔太久。 5. 學生練習次數不夠,學習未達精熟程度。 6. 中、下程度學生在學習上有不穩定。 7. 學習動機或意願低落。 8. 學生的心理或生理發生較大的變化。 9. 評分不連貫,評分標準不一,評分重點不明確或甚至評分錯誤。 (五 五)S-P表注意係數判斷標準 表注意係數判斷標準 S-P表注意係數比照佐藤隆博所提出判斷的標準(佐藤隆博,1985;Dai, Cheng, Sung & Ho, 2005)。一般注意係數的值均為正值,當為完美反應組 型時,注意係數為0;注意係數越大時,表示反應組型為不尋常或者有異 常之情況嚴重;反之,注意係數越小,表示不尋常之現象較不嚴重,在容 許的誤差範圍之內,提出下列判斷標準。 1. 當注意係數(CS或CP)介於0至0.5之間時,表示該學生或試題之反應 組型的異常情況並不嚴重,屬於正常程度。 2. 當注意係數在0.5至0.75之間,則表示異常情況已稍為嚴重,教師應 該加以注意。 3. 當注意係數大於0.75時,則表示異常情況非常嚴重,教師應更加特 別注意。 38.

(48) 二、S-P表製作步驟 表製作步驟 (一) 假設有 N(i=1,2,…,N)位學生在 n(j=1,2,…,n)個二元計分試題上的作答 反應資料矩陣。 (二) 將學生總分從高到低,由上到下排列。 (三). 將試題答對學生人數從高到低,再由左而右排列,如以下範例(余民 寧, 2002): 表 2-3-2. 學生. S-P 原始資料表 試題號碼. 總分. 編號. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 1. 0. 1. 1. 0. 0. 0. 1. 0. 1. 1. 5. 2. 0. 1. 1. 1. 1. 1. 0. 0. 1. 0. 6. 3. 0. 1. 0. 0. 0. 0. 1. 0. 1. 0. 3. 4. 1. 1. 1. 1. 0. 1. 1. 0. 1. 0. 7. 5. 1. 1. 1. 1. 1. 1. 1. 0. 1. 1. 9. 6. 1. 1. 0. 1. 1. 0. 0. 0. 0. 1. 5. 7. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 10. 8. 1. 0. 0. 0. 0. 0. 1. 0. 0. 0. 2. 9. 0. 1. 1. 1. 1. 1. 1. 1. 1. 0. 8. 10. 0. 1. 1. 0. 0. 1. 1. 0. 1. 1. 6. 11. 1. 1. 0. 0. 1. 0. 0. 1. 0. 0. 4. 12. 0. 0. 1. 0. 0. 0. 0. 0. 0. 0. 1. 13. 0. 1. 1. 1. 0. 1. 0. 1. 0. 0. 5. 14. 1. 1. 1. 1. 0. 0. 1. 0. 0. 0. 5. 15. 1. 0. 1. 1. 0. 0. 1. 0. 0. 0. 4. 8. 12. 11. 9. 6. 7. 10. 4. 8. 5. 80. 答對 人數. 39.

(49) 表2-3-3. 將學生總分排序後的S-P表 試題號碼. 學生. 總分 編號. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 7. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 10. 5. 1. 1. 1. 1. 1. 1. 1. 0. 1. 1. 9. 9. 0. 1. 1. 1. 1. 1. 1. 1. 1. 0. 8. 4. 1. 1. 1. 1. 0. 1. 1. 0. 1. 0. 7. 2. 0. 1. 1. 1. 1. 1. 0. 0. 1. 0. 6. 10. 0. 1. 1. 0. 0. 1. 1. 0. 1. 1. 6. 1. 0. 1. 1. 0. 0. 0. 1. 0. 1. 1. 5. 6. 1. 1. 0. 1. 1. 0. 0. 0. 0. 1. 5. 13. 0. 1. 1. 1. 0. 1. 0. 1. 0. 0. 5. 14. 1. 1. 1. 1. 0. 0. 1. 0. 0. 0. 5. 11. 1. 1. 0. 0. 1. 0. 0. 1. 0. 0. 4. 15. 1. 0. 1. 1. 0. 0. 1. 0. 0. 0. 4. 3. 0. 1. 0. 0. 0. 0. 1. 0. 1. 0. 3. 8. 1. 0. 0. 0. 0. 0. 1. 0. 0. 0. 2. 12. 0. 0. 1. 0. 0. 0. 0. 0. 0. 0. 1. 8. 12. 11. 9. 6. 7. 10. 4. 8. 5. 答對 人數. 40.

(50) 表2-3-4. 再將試題答對人數進行排序後的S-P表 試題號碼. 學生. 總分 編號. 2. 3. 7. 4. 1. 9. 6. 5. 10. 8. 7. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 10. 5. 1. 1. 1. 1. 1. 1. 1. 1. 1. 0. 9. 9. 1. 1. 1. 1. 0. 1. 1. 1. 0. 1. 8. 4. 1. 1. 1. 1. 1. 1. 1. 0. 0. 0. 7. 2. 1. 1. 0. 1. 0. 1. 1. 1. 0. 0. 6. 10. 1. 1. 1. 0. 0. 1. 1. 0. 1. 0. 6. 1. 1. 1. 1. 0. 0. 1. 0. 0. 1. 0. 5. 6. 1. 0. 0. 1. 1. 0. 0. 1. 1. 0. 5. 13. 1. 1. 0. 1. 0. 0. 1. 0. 0. 1. 5. 14. 1. 1. 1. 1. 1. 0. 0. 0. 0. 0. 5. 11. 1. 0. 0. 0. 1. 0. 0. 1. 0. 1. 4. 15. 0. 1. 1. 1. 1. 0. 0. 0. 0. 0. 4. 3. 1. 0. 1. 0. 0. 1. 0. 0. 0. 0. 3. 8. 0. 0. 1. 0. 1. 0. 0. 0. 0. 0. 2. 12. 0. 1. 0. 0. 0. 0. 0. 0. 0. 0. 1. 12. 11. 10. 9. 8. 8. 7. 6. 5. 4. 80. 答對 人數. 41.

(51) 表2-3-5. 將學生總分與試題答對人數排序後的S-P表 試題號碼. 學生. 總分 編號. 2. 3. 7. 4. 1. 9. 6. 5. 10. 8. 7. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 10. 5. 1. 1. 1. 1. 1. 1. 1. 1. 1. 0. 9. 9. 1. 1. 1. 1. 0. 1. 1. 1. 0. 1. 8. 4. 1. 1. 1. 1. 1. 1. 1. 0. 0. 0. 7. 2. 1. 1. 0. 1. 0. 1. 1. 1. 0. 0. 6. 10. 1. 1. 1. 0. 0. 1. 1. 0. 1. 0. 6. 1. 1. 1. 1. 0. 0. 1. 0. 0. 1. 0. 5. 6. 1. 0. 0. 1. 1. 0. 0. 1. 1. 0. 5. 13. 1. 1. 0. 1. 0. 0. 1. 0. 0. 1. 5. 14. 1. 1. 1. 1. 1. 0. 0. 0. 0. 0. 5. 11. 1. 0. 0. 0. 1. 0. 0. 1. 0. 1. 4. 15. 0. 1. 1. 1. 1. 0. 0. 0. 0. 0. 4. 3. 1. 0. 1. 0. 0. 1. 0. 0. 0. 0. 3. 8. 0. 0. 1. 0. 1. 0. 0. 0. 0. 0. 2. 12. 0. 1. 0. 0. 0. 0. 0. 0. 0. 0. 1. 12. 11. 10. 9. 8. 8. 7. 6. 5. 4. 80. 答對 人數. 註:實線為S曲線,虛線為P曲線. 42.

參考文獻

Outline

相關文件

For a polytomous item measuring the first-order latent trait, the item response function can be the generalized partial credit model (Muraki, 1992), the partial credit model

一 寫作評講(詩歌) 運用三至五個評講重點賞析同儕創作的詩歌 二 寫作評講(短文) 運用寫作評量表評鑑同儕創作的文章. 三

評定量表 (rating scale) :指用以評定等級的工具,按評定結果可以看出學生 在某種特質上的等級,當中有各種形式如數字評定量表 (numerical rating scal e) 、圖示評定量表

Keywords: time management, the analysis of the factor, the analysis of the reliability and the validity... 第一章

Intelligent assessment technologies supports web based learning environment to provide students adaptive learning suggestions, give teachers hints to modify learning

In the table boldface line was the S curve means students and dotted line was the P curve means problem.

將基本學力測驗的各科量尺分數加總的分數即為該考生在該次基測的總 分。國民中學學生基本學力測驗自民國九十年至九十五年止基測的總分為 300 分,國文科滿分為 60

股市預測在人工智慧領域是一個重要的議題。我們的研究使用混合式的 AI 以預測 S&amp;P 500 芭拉價值指標和 S&amp;P 500 芭拉成長股之間的價值溢價;S&amp;P 600 小