研究工具

第三章研究方法

第三節研究工具

壹、兒童語料庫

本研究使用之語料庫來源為廖晨惠（2010）國科會｢閱讀研究議題八：以 LSA 為基礎之電腦化閱讀認知測驗及 AutoTutor 建置｣計畫（編號： NSC 100-2420-H-142-001-MY3）所建置的兒童語料庫，共收錄 1208 篇兒童文本，其中包含經出版商授權之國小 N、H、K 三版本之國語、自然與生活科技、社會、

藝術與人文、健康與體育等五大領域教科書文章，另外也收錄國語日報及兒童課外讀物共 334 篇文本。本研究挑選國小一至六年級各領域之教科書文本共 874 篇，

作為文本特徵各因素預測文本年級分析之用。

貳、斷詞系統

本研究使用中央研究院數位典藏國家型科技計畫建置之中文斷詞系統，完成兒童語料庫文本之第一階段斷詞（中研院中文斷詞系統， http://ckipsvr.iis.sinica.edu.tw/)。斷詞系統的內部處理採用中央研究院資訊科學所詞庫小組所編列的中研院平衡語料庫詞類標記集之簡化詞類，故在初次斷詞後根據詞類標記集的定義轉換為精簡詞類。在檢視精簡詞類後的文本內容，發現部分詞類標記與現代漢語詞類區分規則不甚相符，故修改其中部分斷詞規則，完成本次兒童語料庫文本的二次斷詞，二次斷詞修改規則詳見黃勇媜（2013）。

參、電腦工具

研究資料使用 MATLAB 撰寫程式、SPSS 統計套裝軟體發展指標分數及分析資料。

一、MATLAB 程式撰寫工具

本研究使用 MATLAB 程式撰寫工具進行指標的建置，並據此計算兒童語料庫中各年級各科目之各因素指標值。

二、IBM SPSS Statistics 統計套裝軟體

本研究量化資料採用 SPSS 統計套裝軟體進行統計分析，使用的統計方法包括題本描述性統計、信度分析、因素分析、皮爾森積差相關與迴歸分析。

三、BILOG-MG 試題分析軟體

本研究使用 BILOG-MG 中的單參數 Rasch 模式估計新編中高年級文本理解測驗之試題參數。

肆、新編中高年級文本理解測驗

新編中高年級文本理解測驗主要是由郭伯臣、廖晨惠、楊裕貿、白鎧誌、陳文蘭、蔡筱倩、蔡亞韋、黃勇媜、陳建宏、李湘瑩、葉靜如，倪雅真、張琇涵等 13 人所組成之中文文本分析研究團隊共同編制而成。本測驗含四份複本測驗各 8 篇閱讀文本，共計 32 篇閱讀測驗的文本，其中八篇為改編至由本研究團隊 2013 年所發展之中高年級文本閱讀測驗（郭伯臣、廖晨惠、楊裕貿、白鎧誌、陳文蘭、

蔡筱倩、…、葉靜如，2013），並新增了 24 篇閱讀測驗的文本。測驗的命題為仿照 PIRLS 的閱讀理解層次所命題，相關概況如下：

一、文本的選擇

本測驗文本選擇取材自民國 78 年國立編譯館之國語科四、六年級教科書共 32 篇課文，其中四年級課文 16 篇、六年級課文 16 篇。根據文本指標值計算結果，

按照年級、題材、文章長短篩選出測驗文章。

二、試題的編製

本研究測驗題本依照針對國小四年級學童進行之國際閱讀素養研究PIRLS所定義的四項閱讀理解層次編製試題，包含：直接提取、直接推論、詮釋整合及檢驗評估（柯華葳、詹益綾、張建妤、游婷雅，2008）。施測題本共計四份複本測驗共32篇192題試題，預試後刪除3題鑑別度不良試題，正式施測題本內包含三十二篇測驗文本及189題試題，其中直接提取61題、直接推論55題、詮釋整合42題

及檢驗評估31題，共計189題，每題皆為四選一的單選題，試題類型及題數分布如表3-4-1所示。

表 3-4-1

測驗試題閱讀理解層次試題類型及題數分布

直接提取直接推論詮釋整合檢驗評估總和

題數

A 卷 15 13 11 7 46

B 卷 15 13 11 8 47

C 卷 15 14 11 8 48

D 卷 16 15 9 8 48

總和 61 55 42 31 189

三、試題的效度與信度分析

本測驗題本邀請了三位臺中教育大學教授與八位平均年資達十年以上之現職國小教師共同編審，具有良好的專家效度。此外，測驗題本以 Cronbach α 為信度依據，四份分測驗的 α 值詳如表 3-4-2，各測驗 α 平均值為 0.859＞0.7，顯示本測驗信度頗高，試題具穩定和一致性。

表 3-4-2

各分測驗受試人數、題數分布及其信度

A 卷 B 卷 C 卷 D 卷總和人數四年級 79 77 79 72 307

六年級 85 85 88 82 340

總和 164 162 167 154 647

題數 46 47 48 48 189

Cronbach α 0.827 0.861 0.85 0.897 0.859

四、試題分析

本測驗題本之試題分析依據古典測驗理論（Classical Test Theory，簡稱 CTT）

與試題反應理論（Item Response Theory，簡稱 IRT）之單參數 Rasch 模式兩種方式估計試題之難度、鑑別度及通過率。

（一）古典測驗理論

古典測驗理論又稱為真分數理論，主要是以整份測驗的觀點解釋測驗分數的涵義。古典測驗理論假設受試者具有某種潛在特質，此特質須藉著受試者在無數次測驗上的平均實得分數之來表示受試者的潛在特質之不偏估計值，即所謂「真實分數」，而單一測量所得的實得分數與真實分數間的差距即稱為「誤差」（余民寧，2011）。其公式如下：

e t

X   （公式 3-1）

其中，X 代表實得分數， t 代表真實分數，e 代表誤差分數。

古典測驗理論的題目通過率即為答對某題的人數百分比，通常以 P 表示之。當通過率 P 值為 0.5 時，表示試題的難度適中，P 值在 0.3 以下表示試題偏難，P 值在 0.7 以上則表示試題較簡單。本測驗全部試題的平均難度為 0.67，

表示試題難度適中。

試題的鑑別度為高分組的通過率減去低分組的通過率，通常以 D 表示，

鑑別度 D 值的平均值越高，則測驗的信度也會愈高。本測驗試題的鑑別度 D 值低於 0.2 的題數有 25 題，占所有題數的 13%；鑑別度 D 值在 0.2~0.4 的題

在文檔中中文兒童文本特徵分析 (頁 38-42)

第三章 研究方法

第三節 研究工具