• 沒有找到結果。

第三章 研究設計與實施

第四節 認知診斷模式建構與評估

本研究問題之一為找出適配用於 PIRLS 2011學生作答反應資料的認知診斷 模式,以下將對Q矩陣及預計使用的認知診斷模式做介紹,包含DINA、DINO、

G-DINA以及HO-DINA。

壹、認知診斷模式

認知診斷模式(cognitive diagnostic models, CDMs)近年來受到許多研究者使 用,與傳統的測驗理論不同的是,古典測驗理論(Classical Test Theory, CTT)和試 題反應理論(Item Response Theory, IRT)之目的是去估算出受試者在某潛在變項的 位置,藉以比較受試者間的高低(涂金堂,2003),但當我們的測驗目標不是比 較受試者間的能力高低,而是關切受試者在學習的過程中有哪些屬性尚未精熟 時,探討學生潛在結構與作答關係的認知診斷模式就可派上用場(甘媛源、余嘉 元,2009)。認知診斷模式透過屬性概念,去了解受試者對屬性是否精熟、認知 的過程為何和解決問題的策略為何(涂金堂,2003;de la Torre, 2011),對於補 救教學或是想要瞭解學生的作答過程、策略的教師、研究人員等人,可以從認知

下面以一個43的矩陣為例:

參、DINA模式(deterministic input, noisy ”and” gate model)

許多認知診斷模式的起源,都是來自 DINA 模式,其假設當受測者完全具備 Templin & Willse, 2009),也就是DINA模式假定精熟試題j之屬性的受試者,其答 對機率會大於不精熟試題j之屬性的受試者。

肆、DINO模式(Deterministic Inputs, Noisy “or” Gate Model)

伍、G-DINA模式(Generalized DINA)

de la Torre(2008)提出G-DINA模式,其為DINA的一般化模式,公式如下:

   

當只有j0* ...

12 kj

j 不為0時, jk jkk'為0時,也就是交互影響為0時,此時就 變成DINA模式,所以DINA模式是G-DINA模式的特例。

陸、HO-DINA模式(higher-order DINA model)

de la Torre 和 Douglas (2004)將DINA模型延伸,將屬性的機率分布加入IRT

第三章 研究設計與實施

本章節將研究設計與實施以五節說明,依序為研究架構、研究對象、研究工 具、認知診斷模式建構與評估及資料分析。

第一節 研究架構

本研究針對 PIRLS 2011 閱讀理解測驗題本十三之試題,首先依據相關文獻 及專家學者對試題進行編碼,並形成一認知模型,使試題能與屬性連結,再製作 認知診斷模式所需的Q矩陣,最後將受試者在題本十三的試題作答反應及Q矩陣 輸入程式內,以得到各種認知診斷模式的參數估計值。

根據上述結果,評估DINA、DINO、G-DINA及HO-DINA模式與測驗資料的 適配度,找出最適配的認知診斷模式,再以此模式之診斷結果分析與比較臺灣、

香港及新加坡的學生在各認知屬性的精熟情形,以及讀者個人因素對認知屬性表 現的影響,本研究架構圖請見圖3-1。

圖3-1 研究架構圖

為完成本研究之目的,首先研讀相關文獻藉以擬定研究主題,確定研究主題 後再進行相關文獻蒐集做為理論基礎,從IEA所提供的PIRLS 2011資料庫中擷取 資料與題本,並參考PIRLS 2011所訂定的評量架構與專家意見,訂定學生作答時 所需之認知屬性以製作Q矩陣,將PIRLS 2011三國(地區)的學生作答反應及Q 矩陣以Ox程式進行認知診斷分析,最後根據結果提出結論與建議。研究流程如圖 3-2所示。

圖3-2 研究流程圖 擬定研究主題並確立研究目的

訂定 PIRLS 2011 題目屬性及 Q 矩陣

提出結論與建議 評估適配之認知診斷模式

撰寫研究報告

擬定研究主題並確立研究目的

蒐集相關文獻

依據結果進行相關的分析

自 PIRLS 2011 資料庫擷取閱讀理解測驗 作答資料及學生問卷

第二節 研究對象

PIRLS 2011 的參與國家遍及五大洲,共有 49 個國家或地區參與,本研究所 使用的樣本是臺灣、香港及新加坡的四年級學生資料,選擇香港及新加坡的原因 為臺灣、香港及新加坡皆處於亞洲,且同為受到華人文化影響的國家,故選擇此 三地的學生資料做為研究對象。

PIRLS 2011 所使用的題本共有 13 本,而其有釋出的文章有「飛吧!老鷹,

飛吧!(Fly Eagle Fly)」、「敵人餡餅(Enemy Pie)」、「發現一日健行的樂趣(Day Hiking)」、「巨牙之謎(The Giant Tooth Mystery)」,前兩篇為故事體,編號分別為 L2 及 L5,後兩篇為說明文,編號分別為 I2 及 I5。「飛吧!老鷹,飛吧!」及「發 現一日健行的樂趣」為題本 10 所使用之文章,「敵人餡餅」、「巨牙之謎」為題本 13 所使用之文章。研究者檢視兩題本的內容維度及認知維度的分布情況,並與 PIRLS 2011 預定的目標及十三本題本的題數比例比較,以避免題本內容分布與預 設內容分布及題數比例相差太多,影響研究結果,兩題本與預設內容的比較見表 3-1、3-2。從表 3-1 和表 3-2 可觀察到,以題本十和題本十三與 PIRLS 2011 的預 設比例以及實際 13 本題本的出題比例相比,題本十三與實際題本狀況較為相似,

因此研究者選擇作答題本十三的學生做為研究樣本。題本十三的人數和可能分數 (plausible value, pv)的平均值見表 3-3。

表 3-1

表 3-3

各國(地區)作答題本十三的學生人數及學生的能力值平均

國家(地區) 男生 女生 總人數 PV 值平均

臺灣 405 459 864 547.22

香港 363 426 789 566.66

新加坡 682 667 1349 568.31

第三節 研究工具

壹、PIRLS 2011國際資料庫

每次 PIRLS 施測過後,除了提供該年度閱讀素養測驗的報告外,也會釋出該 年度的國際資料庫,使對 PIRLS 有興趣的研究人員能夠下載、分析,PIRLS 提供 SAS 及 SPSS 兩種版本的資料檔,也附有使用指南(user guide),供想要分析的 研究人員知悉變項的名稱、編碼、詳細內容……等相關訊息,方便研究人員從眾 多資料中迅速找到需要的部分以分析。

本研究採用 PIRLS 2011 所釋出之資料庫。資料庫內除了 PIRLS 的資料外,

也有 prePIRLS 的資料,本研究僅使用 PIRLS 的部分,內容包含了 PIRLS2011 測 驗後得到的學生成就資料(PIRLS 2011 student achievement data files)、經由學生問 卷(student questionnaire)得到的學生背景資料(PIRLS 2011 student background data files)、經由閱讀學習調查(即家庭問卷)得到的家庭背景資料(PIRLS 2011 home background data files) 、 經 由 國 語 文 教 學 調 查 ( 即 教 師 問 卷 ) 得 到 的 (teacher questionnaire)教師背景資料(PIRLS 2011 teacher background data files)、經由學校問 卷得到的學校背景資料(PIRLS 2011 school background data files)、國家/地區內信 度(PIRLS 2011 within-country scoring reliability data files)、師生連結資料(PIRLS 2011 student–teacher linkage files),經蒐集文獻後,除了學生成就資料外,決定自 前述資料中選取學生背景資料做為背景變項。

本研究之背景變項包含讀者個人因素及國家因素,國家因素為臺灣、香港及 新加坡三個學生所在的地區。讀者個人因素包含了學生的性別及影響其閱讀素養 的變項,資料來自學生問卷,分別為「閱讀行為」、「閱讀興趣」、「閱讀自信」、「

閱讀動機」四項。下面以學生問卷中的 R5 做為範例說明題目計分方式,請見圖 3-3

圖 3-3 學生問卷題目 R5

由圖 3-3 可以發現,在 R5「想想你在學校與閱讀有關課堂中所做的事。請選 擇你對下列每種說法的同意程度。」中,有 a-g 共 7 個小題,選擇非常同意的回

答為 1,有點同意為 2,有點不同意為 3,非常不同意為 4,而本研究將正向回答 記為高分,因此會將部分題目轉向,轉向處理的題目包含 R2、R3、R4、R5、R6、

R7、R8 及 R9。

本研究將與「閱讀行為」有關聯的題目,包含 R1、R4、R5、R6 的學生回答轉 換成分數並加總,題目 R1 為「平常有上學的日子,你每天大概花多少時間在課 後閱讀?」,題目 R4 為「你多常從你的學校圖書館或公共圖書館借書?」,題 目 R5 為「想想你在學校與閱讀有關課堂中所做的事。請選擇你對下列每個說法 的同意程度。」、題目 R6 為「在學校裡,這些事情多常發生?」。每個問題的 最高得分為 3 分,最低得分為 0 分,R1、R4、R5 及 R6 內共有 11 個小題,總分 為 33 分,其中 R1 及 R5 的第 4 題為反向題,須反向記分。區分高中低分組的方 式參考 IEA(2012)在「PIRLS 2011 International Results in Reading」所使用的方式,

在 11 個小題中,將至少選擇 6 項最高分及 5 項次高分,也就是得分 28 分以上的 學生定為高閱讀行為組;低閱讀型為組則是 6 項最低分,5 項次低分,也就是 5 分以下的學生;其餘則是中閱讀行為組,得分在 6 分到 27 分之間。

「閱讀興趣」的題目包含 R2 和 R7,題目 R2 為「在課後,你多常做以下的事 情?」,題目 R7 為「你對閱讀有什麼看法?請選擇你對下列每個說法的同意程 度。」,共有 9 個小題,總分為 27 分,其中 R7 的第 1、4 題為反向題,須反向 記分。在 9 個小題中,將至少選擇 5 項最高分及 4 項次高分,也就是得分 23 分 以上的學生定為高閱讀興趣組;低閱讀興趣組則是 5 項最低分,4 項次低分,也 就是 4 分以下的學生;其餘則是中閱讀興趣組,得分在 5 分到 22 分之間。

「閱讀自信」的題目包含 R8,題目 R8 為「你的閱讀能力有多好?請選擇你對 下列每個說法的同意程度。」,共有 7 個小題,總分為 21 分,其中第 3、5、7 題為反向題,須反向記分。在 7 個小題中,將至少選擇 4 項最高分及 3 項次高分,

也就是得分 18 分以上的學生定為高閱讀自信組;低閱讀自信則是 4 項最低分,3 項次低分,也就是 3 分以下的學生;其餘則是中閱讀自信組,得分在 4 分到 17

分之間。

「閱讀動機」的題目包含 R9,題目 R9 為「你會因為以下的理由閱讀嗎?請選 擇你對下列每個說法的同意程 度。」,共有 6 個小題,總分為 18 分。在 6 個小 題中,將至少選擇 3 項最高分及 3 項次高分,也就是得分 15 分以上的學生定為 高閱讀動機組;低閱讀動機組則是 3 項最低分,3 項次低分,也就是 3 分以下的 學生;其餘則是中閱讀興趣組,得分在 4 分到 14 分之間。

貳、Ox 軟體

Ox 是一個目標指向的統計系統,其核心是一個有效率的矩陣語言,矩陣可以 直接表示及運算。這是一個相輔相成的綜合統計資料庫。它的特色式運算速度 快、可延伸的資料庫及設計良好的語法與編輯器,使得程式很容易撰寫、維護及 繪製圖形。本研究使用 de la Torre(2010)以 Ox 軟體撰寫之 DINA、DINO、G-DINA 及 HO-DINA 模型程式,配合 Q 矩陣設定,估計 PIRLS 2011 測驗資料之診斷結 果。

參、SPSS 統計套裝軟體

SPSS(Statistical Package for Social Science)是一套在社會科學領域研究資料 時常被使用的統計套裝軟體,其操作介面為圖形介面的視窗環境,具備下拉式功 能表及對話方塊,操作簡單易上手,不需會撰寫程式亦可進行分析。本研究使用 IBM SPSS Statistics 20,對以 Ox 程式所產出之認知診斷相關數值進行資料分析及 統計檢定。

第四節 認知診斷模式建構與評估

本研究應用認知診斷模式進行測驗資料分析,認知屬性的確定及 Q 矩陣的設 計對於認知診斷模式是相當重要的。本節依據模式分析過程,依序說明。

壹、認知屬性與試題對應關係

本研究之認知屬性編製是參考「PIRLS 2011 報告-臺灣四年級學生閱讀素

本研究之認知屬性編製是參考「PIRLS 2011 報告-臺灣四年級學生閱讀素