研究工具

第三章研究方法

第五節研究工具

壹、語料庫

本研究使用所建置之詞類指標分析的文本資料來源為廖晨惠（2010）之國科會｢閱讀研究議題八：以 LSA 為基礎之電腦化閱讀認知測驗及 AutoTutor 建置｣計畫（編號：NSC100-2420-H-142-001-MY3）所建置的國小兒童語料庫，一共收錄經授權的 945 篇國小各版本跨領域、科目之課文，以及國語日報等文本。本研究主要擷取兒童語料庫中，國小一至六年級的國語、自然與社會三個科目共 790 篇的課文進行分析。

貳、中研院斷詞系統

很(ADV)好(Vi)的(T)傳達者(N) 很(ADV)好的(ADJ)傳達者(N)

(Vi) (Vt) (T) (N) (ADJ) (ADJ) (T) (N)

動動腦(Vi)仔細(Vi)觀察(Vt) 動動腦(Vi)仔細(ADV)觀察(Vt)

叁、MATLAB 撰寫程式

本研究使用 MATLAB 做為指標程式編寫工具來計算兒童語料庫中國語、自然、社會等科目詞類指標分數。

肆、BIOLOG-MG 軟體

本研究使用 BIOLOG-MG 軟體來計算中高年級文本理解測驗試題的 IRT 參數及學生能力值等。

伍、SPSS 統計分析軟體

本研究量化資料使用 SPSS for Window 進行分析，統計方法包括題本信度分析、描述性統計、皮爾遜績差相關（Pearson product-moment correlation）、回歸分析與獨立樣本 t 檢定等。

陸、中高年級文本理解測驗

本測驗題本主要由郭伯臣、廖晨惠、楊裕貿、白鎧誌、陳文蘭、蔡筱倩、蔡亞韋、黃勇媜、陳建宏、李湘瑩、葉靜如等 11 人所組成之研究團隊編製而成（郭伯臣、廖晨惠、楊裕貿、白鎧誌、陳文蘭、蔡筱倩、蔡亞韋、黃勇媜、陳建宏、

李湘瑩、葉靜如，2013）。其中測驗為模仿 PIRLS 的閱讀理解層次而命題，相關概況如下所述：

一、文本的選擇：本測驗文本選擇取材自民國 78 年國立編譯館之國語科四、六年級教科書共八篇課文，其中四年級課文 4 篇、六年級課文 4 篇，文體中記敘文與非記敘文各占 4 篇。根據文本指標計算出結果，按照年級、文章長短及文體等篩選出測驗文章。

二、試題的編製：本研究之測驗題本依照國際閱讀素養研究 PIRLS 中閱讀理解層次所編製試題針對國小四年級學童進行國際性閱讀評量設定的閱讀能力中的四項理解層次，包含：直接提取、直接推論、詮釋整合以及檢合評估，如表 3-5-2 所示。題本共計 8 篇 44 題，為四選一的單選題，試題類型及題數分布如表 3-5-3 所示。

表 3-5-2 PIRLS 閱讀理解層次及層次子項目

三、試題的效度與信度分析：一份測驗評量是否命題得當有賴於信度和效度的檢

34 583.00 0.73 0.84 0.48 35 470.00 0.59 0.84 0.56 36 372.00 0.47 0.85 0.50 37 368.00 0.46 0.84 0.58 38 156.00 0.20 0.85 0.14 39 340.00 0.43 0.85 0.60 40 363.00 0.46 0.85 0.27 41 276.00 0.35 0.85 0.31 42 235.00 0.30 0.85 0.28 43 314.00 0.39 0.85 0.39 44 145.00 0.18 0.85 0.14

四、試題分析：本測驗題本之試題分析依據古典測驗理論（Classical Test Theory，

簡稱 CTT）與試題反應理論（Item Respons Theory，簡稱 IRT）兩種計算測驗所得之分數來探討難度與鑑別度。

(一)古典測驗理論（CTT）

CTT 是以整份測驗的觀點，來解釋測驗分數的涵義，為最早的測驗理論，它對學生或受試者的測驗分數的看法，是以各試題得分加總之後的總分做為代表。

主要目的在估計測驗實得分數與真實分數的關聯程度，又稱作「真實分數理論」

（true score theory），因為它的理論來源都是建立在以「真實分數模式」（true score model）為名的數學模式基礎上，（余民寧，2002）。如表 3-5-4 所示，當難度 P 值若為 0.5 時，表示試題的難度適中，P 值在 0.3 以下表示試題偏難，P 值在 0.7 以上則表示試題較簡單。本測驗題本的難度低於 0.3 的試題有 3 題，占所有題數的 7%；試題難度值在 0.3~0.7 的試題有 30 題，占所有題數的 68%；試題難度在 0.7 以上的題數有 11 題，占所有題數的 25%；整份試題的平均難度為 0.58，表示試題難度適中。

試題的鑑別度 D 值介於-1~1 之間，鑑別度 D 值的平均值越高，則測驗的信度也會愈高。本測驗試題的鑑別度 D 值低於 0.2 的題數有 4 題，占所有題數的 9%；

鑑別度 D 值在 0.2~0.4 的題數有 14 題，占所有題數的 32%；鑑別度 D 值在 0.4 以上的題數有 26 題，占所有題數的 59%；鑑別度 D 值在 0.4 以上，表示試題非常優良，因此本測驗試題具有良好的鑑別度。

(二)試題反應理論（IRT）

28 0.71356 0.76391 0.21626 29 0.21624 0.70681 0.20869 30 0.90853 0.65163 0.22960 31 -0.06223 0.53954 0.19200 32 2.20394 0.58942 0.16638 33 0.12296 1.04127 0.23149 34 -0.81491 0.67356 0.17722 35 -0.10136 0.67100 0.1425 36 0.77730 0.77210 0.21695 37 0.60847 0.86451 0.17478 38 2.42318 1.06137 0.16334 39 0.77304 0.91574 0.17648 40 1.77574 0.35787 0.25586 41 1.82996 0.61873 0.21532 42 1.9624 0.88445 0.21759 43 1.48594 0.49095 0.19087 44 3.31140 0.59739 0.14204 五、學生能力分析：

旨在分析四、六年級學生在中高年級文本理解測驗通過率表現是否有達顯著性差異，以獨立樣本 t 檢定考驗之。學生測驗通過率的計算方式，分別使用 CTT 與 IRT 兩種方法。

從表 3-5-7 及表 3-5-8 可知，中年級文本通過率、高年級文本通過率及全部年級文本通過率等三項皆達統計上的顯著水準（P＜.05），表示六年級學生無論在中年級文本、高年級文本或全部年級文本的通過率皆優於四年級。在閱讀發展理論中，兒童的閱讀發展雖然有不同階段的分野，但基本上是隨著年齡的增加而發展得越好(林寶貴、錡寶香，2000）。由表 3-5-7 和表 3-5-8 顯示不同年級受試學生在不同文本理解測驗中的得分表現，皆是隨著年級的上升而增加，可見本測驗所考驗之不同年級學生與測得的中高年級文本理解測驗之能力與閱讀發展理論預期的方向一致。

表 3-5-7 不同年級學生對不同題本文章測驗表現-CTT

表 3-5-9 不同年級學生在直接提取層次上通過率的相關

表 3-5-12 不同年級受試學生在檢驗評估層次上通過率的相關

三、皮爾遜積差相關（Pearson product-moment correlation）

本研究探討詞類指標與閱讀理解之相關、閱讀理解層次與學生能力的相關、

在文檔中兒童文本詞類指標分析系統建置與應用 (頁 41-51)

第三章 研究方法

第五節 研究工具