研究工具

第三章研究方法

第四節研究工具

壹、兒童語料庫

本研究使用之文本資料來源為廖晨惠(2010)國科會｢閱讀研究議題八：以 LSA 為基礎之電腦化閱讀認知測驗及 AutoTutor 建置｣計畫(編號：

100-2420-H-142-001-MY3)所建置的國小語料庫，挑選國小一至六年級課文中國

3 (A) (Vi)(N)(T)

此系統採用機率式無語境規律的模型(Probabilistic Context-free Grammar)為基本剖析架構並加入結構中詞彙搭配關係機率解決結構歧義。在結構決定之後，

估的方法，從無數的剖析歧義結構中找到最佳結構。

1. 中心語主導原則

中文句子的語法結構常常有歧義的現象。如果只是表達詞和詞的語法結構，不足以解決中文這種相當程度的歧義現象。因此為了解決這種歧義性，採取中心語主導原則 ( Head-Driven Principle )。中心語主導原則是指每一個句子或詞組結構皆有一中心語（Head），詞組結構由中心語及論元(argument)或附加成分(adjunct) 組成，並由中心語決定詞組的詞類，例如:句子（S）和述詞詞組（VP）的中心語皆為述詞（V）；名詞詞組（NP）的中心語為名詞（N）；介詞詞組（PP）的中心語為介詞（P）；方位詞詞組（GP）的中心語為方位詞（Ng）；對等連接詞的中心語為連接詞（C）。在剖析中文句子的時候，藉由中心語指導原則，不但可以決定每一個中心語的詞組類型，並且利用中心語和其他成分所記載的語法和語意訊息，將句子中詞和詞之間的語法和語意的限制關係清楚的表達出來。

2. 詞組結構：

S：表示結構樹為句子（S）；以述詞為中心語；此外當主詞和述詞的賓語或補語的型式為句子或子句的時候，詞組結構標記為 S，不為 NP。

VP：述詞詞組；中心語為述詞（V）。 NP：名詞詞組；中心語為名詞（N）。

GP：方位詞詞組；中心語為方位詞（Ng）；所帶論元角色為 DUMMY。

PP：介詞詞組；中心語為介詞（P）；所帶論元角色亦為 DUMMY。

XP：連接詞詞組；中心語為連接詞（C）；X 代表一個變數，XP 的真正詞類由連接成分決定，例如：連接成分為述詞詞組（VP），則為述詞詞組（VP），連接成分為名詞詞組，則為名詞詞組（NP）。DM：定量詞詞組(陳鳳儀、蔡碧芳、陳克健、黃居仁，1999)。

肆、中高年級閱讀文本理解測驗

本測驗題本 24 篇主要由郭伯臣、廖晨惠、楊裕貿、陳文蘭、陳建宏、蔡筱倩、

蔡亞韋、黃勇媜、倪雅真、張琇涵等 10 人所編製而成並結合「中高年級文本理解測驗」之八篇文章，詳細內容參閱「中高年級文本理解測驗技術報告」（郭伯臣等，2013）及碩士論文「兒童文本詞類指標分析系統建置與應用」（陳建宏，

2013），共 32 篇。測驗模仿 PIRLS 的閱讀理解層次而命題，相關概況如下所述：

一、文本的選擇：本測驗文本選擇取材自民國 78 年國立編譯館之國語科四、

六年級教科書，根據文本指標計算出結果，按照年級、文章長短及文體等選出文章，其中四年級記敘文 13 篇與非記敘文 3 篇、六年級記敘文與非記敘文各占 8 篇是 16 篇，總共 32 篇文章。

二、試題的編製：本研究之測驗題本依照國際閱讀素養研究 PIRLS 中四項閱讀理解層次所編製，包含：提取訊息、推論分析、詮釋整合以及比較評估。

測驗題本總共 32 篇 192 題，組卷成 A、B、C、D 四份題本來進行施測，每一份題本各有四年級文章四篇、六年級的記敘文及非記敘文各兩篇共八篇，文章的題目依照四項閱讀理解層次的順序由易到難編排，為四選一的單選題，預試試題類型、題數分布及信度分析如表 3-4 所示。

表 3-4

預試題本各層次的題數及信度

直接提取直接推論詮釋整合比較評估總題數信度題本 A 16 13 11 8 48 0.878 題本 B 16 14 10 8 48 0.892 題本 C 15 14 11 8 48 0.839 題本 D 16 15 9 8 48 0.818

合計 63 56 41 32 192

三、正式題本的編制：本測驗經預試後，以 Tester 3.0 分析其難度和鑑別度，通過率超過 90%的題目及鑑別度低於 0.2 的題目進行刪題或修題，參考每一題作答選項的百分比，對於沒有誘答力的選項進行修改，讓試題達到更完善，

正式施測試題類型、題數分布及信度分析如表 3-5 所示，正式施測後以 IRT 單參進行分析發現有 3 題不良試題，刪除這三題，總題數為 189 題。

表 3-5

正式施測題本各層次的題數及信度

直接提取直接推論詮釋整合比較評估總題數信度題本 A 15 13 11 7 46 0.819 題本 B 15 13 11 8 47 0.853 題本 C 15 14 11 8 48 0.850 題本 D 16 15 9 8 48 0.897

合計 61 55 42 31 189

四、效度與信度分析：評量工具是否優良適當，可透過信度與效度的檢驗，作為改善修正的依據。本測驗題本採專家效度，邀請三位臺中教育大學教授、八位平均年資達10年以上現職國小教師及一位研究生共同編審，具有良好的內容效度。本測驗各題本預試信度係數Cronbach α值均達 0.8以上，正式施測刪除3題不良試題後，其信度也達0.8以上，表示信度高，具有穩定性及一致性的特性。

五、試題分析：信度與效度是偵測試題品質優劣的二項重要特徵，而試題可藉由分析而提高品質。本測驗依「古典測驗理論」以及「 Rasch Model」兩種方式來做試題分析，依這兩種測驗理論所得的測驗通過率分析探討指標文本分數對於閱讀理解各層次通過率的預測度：

（一）古典測驗理論(Classical test theory, CTT) 1. 古典測驗理論的假定

古典測驗理論又稱為古典真分數理論，其假定在界定觀察分數、真分數及誤差分數三者間的關係。

X(觀察分數)=T(真分數)+E(誤差分數) (公式 9) 2. 古典測驗的題目分析

(1) 難度

題目難度就是答對某題目人數的百分比，也就是題目通過率，

難度常以 P 表示之，其中 Pⁱ是答對題目 i 的百分比，N 是所有 受試人數，nⁱ是答對題目 i 的人數，如(公式 10)所示：

P_i



nⁱ (公式 10)

P 值介於 0 與 1 之間，P 值越高題目越容易，P 值越低題目越難，

P=0.5 表示一半的人通過。

(2) 鑑別力

高分組的受試者答對某題的機會比低分組的受試者答對某題的機會高，表示該題能鑑別出受試者的能力差異。鑑別力是高分 組的通過率減去低分組的通過率，以 D 表示：

D=P^H-P^L (公式 11)

D 值範圍介於-1 與 1 之間，D 值越大表示鑑別力越好，D 值大 於 0.4 表示該題優良，有很好的鑑別力，D 值介於 0.3~0.39 表示 題目良好，D 值介於 0.2~0.3 之間表示題目尚可，D 值小於 0.2 的題目表是鑑別力不好，需要修題或刪題(王寶墉，1995)。

（二） Rasch Model 理論

試題反應理論(Item Respose Theory, IRT) 的單參數對數形模式，假定猜測參 數 c=0 及鑑別力參數 a=1，為三參數對數模式的特例，相通於 George Rasch (1960) 所建構的模式，因此又有「Rasch 模式」之稱。Rasch 模式不同於古典測驗理論，

對於測驗的解釋是同時包含了能力與難度。答對和答錯的比率取決於能力和難度，當能力大於難度時，答對機率就大於答錯機率。這表示我們將 Rasch 能力值取代原始分數當作報告分數，也就是不受測量工具的影響，即是客觀的測量。

1. 單參數對數形模式(one-parameter logistic model)：這個模式的數學公式如下所示：

)

bi：試題難度(difficulty)參數。

e：底為 2.718 的指數。 3.0、Bilog-MG 和 SPSS for windows18 進行資料的分析。

一、 MATLAB 程式撰寫工具

本研究使用 MATLAB 程式撰寫工具來建置句子結構相似度及最小編輯距離指標，以計算文本在指標上分析的特徵值。

二、 Tester for windows3.0 試題分析軟體

文本的閱讀理解測驗的作答結果以 Tester for windows3.0 來分析試題的信度、難度、鑑別度及通過率。

在文檔中兒童文本句子相似度指標及可讀性公式建置與應用 (頁 70-77)

第三章 研究方法

第四節 研究工具

壹、 兒童語料庫

肆、 中高年級閱讀文本理解測驗



第三章研究方法

第四節研究工具

壹、兒童語料庫

肆、中高年級閱讀文本理解測驗