閱讀理解測驗的適切性分析

第四章研究結果分析與討論

第一節閱讀理解測驗的適切性分析

壹、項目分析

測驗分析最根本的工作就是項目分析，透過項目分析進行試題適切性的評

估，並根據分析中的各種統計數據作指標的判斷，將不適合的題目予以修改或刪除，各項資料經整理後如表 4-1。

一、難易度分析

根據表4-1之項目分析摘要，本測驗各題難度介於.203~ .905之間，平均難度為.655。如以一般成就測驗的觀點來看此份試題，這是一份難易均分的考題，

特別是每一項閱讀理解能力的題目分布在五篇文章中，而且難易互見：字義理解能力的通過率是.37 ~ .82，文本理解能力是.425~ .905，推論理解能力是.203 ~ .87，摘要能力是.355 ~ .85，顯見每一項能力難易的試題均有。

二、鑑別度分析

本研究以鑑別度指數來探討試題的鑑別能力。本測驗的鑑別度介於.22~.59

，依照美國測驗學者Ebel 和Frisbie(1991)所提出的鑑別度評鑑標準，本測驗全部試題之鑑別度均達.20的標準，更有62.5％的試題屬於優良試題。

三、臨界值（t 值）

本研究以高、低分組的各題平均數作獨立樣本 t 檢定，得到臨界值 t 值。本測驗全部題目均達.001 的顯著水準，此證明全部的試題均有很好的鑑別力。

表 4-1 「國小四年級學童中文閱讀理解測驗」項目分析表

貳、信度研究

信度是指測驗結果的穩定性或一致性。考驗信度的方法很多，因本測驗試題之特性，排除複本信度（因無複本）、折半信度（因每一項閱讀理解能力之題數僅 10 題），所以只檢測內部一致性信度和重測信度。

一、內部一致性信度

內部一致性信度是指運用統計方法估計各試題之間同質性的程度。本測驗在內部一致性信度方面是採用Cronbach α 來分析。根據學者 Devellis（1991）提出，

α 係數介於.60 至.65 之間最好不要；α 係數介於.70 至.80 之間相當好；α 係數介於.80 至.90 之間非常好。經由Cronbach α 分析，本測驗工具之 α 係數為.85，表示有非常好的信度，亦即代表本測驗具有相當不錯的內部一致性。

二、重測信度

重測信度是指受試者在不同時間得分的一致性（consistence），因而又稱「穩定係數」（coefficient of stability）。本測驗重測信度是以彰化縣新民國小 56 位四年級學童為樣本，間隔兩星期施測相同測驗，將二次測驗所得結果，用統計方法 Pearson 積差相關求取兩者的相關，來代表測驗的重測信度。本測驗間隔兩周之重測信度為.86，已達到.001 的顯著水準，代表本測驗具有不錯的穩定性。

參、效度研究

效度是指一個測驗能夠真正測量到他所想要測量的特質之程度。本測驗的效度研究，將分成內容效度、效標關聯之同時效度、構念效度、表面效度這四個面向來討論。

一、內容效度

內容效度在評量該測驗的試題是否能適切的測量其所欲測的構念範圍。「國小四年級學童中文閱讀理解測驗」以評量國小四年級學童閱讀理解能力為目的，

根據閱讀理解的理論、閱讀理解的層次、兒童閱讀理解能力的發展階段，本測驗將閱讀理解能力定義為字義理解、文本理解、推論理解、摘取要旨這四種能力的總合。為了檢測這四種閱讀理解能力，研究者依據各能力的表現特徵設計了幾種

題目類型，以確保每一試題與所界定的構念有適度的相關。並且建立雙向細目表作為編題時的參考，以求每項能力的試題能平均出現。

本測驗試題首先由研究者與任教於國小四年級的三位級任教師，參考雙向細目表及各能力之題目類型，共同草擬 40 題試題，最後再經過教育測驗專家及有經驗的教師共同檢視，提供有關研究工具的修改建議，以避免研究者過於主觀的看法，提高研究工具的內容效度。

二、效標關聯之同時效度

效標關聯效度主要目的在驗證本測驗與外在效標間的相關程度。本測驗的效標樣本為 507 人，以受試者四上的國語、數學學期成績之T 分數作為效標，再以其相關係數作為效標關聯效度之證據，參見表 4-2。

表4-2 「國小四年級學童中文閱讀理解測驗」與國語、數學T分數相關表測驗總分國語T 分數數學 T 分數測驗總分－ .612^*** .562^***

國語分數－ .789^***

數學分數－

***p＜0.001

從表 4-2 相關係數來看，同時效標樣本 507 人的閱讀理解測驗總分與國語科 T 分數的相關為.612，閱讀理解測驗總分與數學科 T 分數的相關為.562，其相關係數皆達.001 的顯著水準，證明本測驗具備良好的效標關聯效度。

三、構念效度

所謂構念效度，就是指測驗能夠測量到理論上的構念或特質的程度（郭生玉，1987）。在檢驗以構念為中心的效度時，必須明確定義該構念，並且瞭解該構念的發展過程，再以外在行為表現求其相關程度（葛樹人，1996）。本測驗以測驗總分為效標，求各理解能力之間以及與總分之相關來檢驗測驗內部凝聚性，

參見表 4-3。

表 4-3 各項閱讀理解能力之交互相關矩陣

測驗總分字義理解文本理解推論理解摘取要旨測驗總分－ .848^*** .848^*** .831^*** .754^***

字義理解－ .623^*** .630^*** .503^***

文本理解－ .640^*** .494^***

推論理解－ .496^***

摘取要旨－

***p＜0.001

由表4-3各項閱讀理解能力之交互相關矩陣來看，本測驗所要測量的文本理解、字義理解、推論理解、摘取要旨這四種能力雖分屬五篇不同的文章，而且以不同的文字敘述出現，複雜程度也不相同，但都屬於閱讀理解的心智運作過程，

所以各項能力之間以及與總分的相關都是正相關，且相關係數介於.494~.848之間（p＜0.001），相關非常顯著。所以，本測驗所評量的四項能力皆符合閱讀理解能力之構念，是一具有良好構念效度的測驗。

四、表面效度

表面效度是指測驗給人的第一個印象好像是測量什麼東西。雖然它不是真正的效度，但它對一個測驗來說，仍然是很重要。因為具有表面效度，可使受試者感到有親切感，並願意合作，因此也會間接影響測驗的信效度（郭生玉，1991）。

「國小四年級學童中文閱讀理解測驗」爲追求受試者對試題能有友善反應，所以在排版、印刷及裝訂方面都力求精緻。如排版部分為增加閱讀的便利性，將題本的文字編成兩欄，以使文章和題目可以同時出現在同一面上，受試者作答時就可以不用前後翻頁了。答案紙形式正式，印有簡單扼要的答題說明，讓受試者覺得這是一份很受重視的測驗。所以，本測驗具有良好的表面效度，受試者感到很有親切感，

自然樂意合作。

在文檔中國小四年級學童中文閱讀理解測驗編製與其相關研究 (頁 71-76)

第四章 研究結果分析與討論

第一節 閱讀理解測驗的適切性分析

壹、項目分析

貳、信度研究

參、效度研究

第四章研究結果分析與討論

第一節閱讀理解測驗的適切性分析