認知診斷模式建構與評估

第三章研究設計與實施

第四節認知診斷模式建構與評估

本研究問題之一為找出適配用於 PIRLS 2011學生作答反應資料的認知診斷模式，以下將對Q矩陣及預計使用的認知診斷模式做介紹，包含DINA、DINO、

G-DINA以及HO-DINA。

壹、認知診斷模式

認知診斷模式(cognitive diagnostic models, CDMs)近年來受到許多研究者使用，與傳統的測驗理論不同的是，古典測驗理論(Classical Test Theory, CTT)和試題反應理論(Item Response Theory, IRT)之目的是去估算出受試者在某潛在變項的位置，藉以比較受試者間的高低（涂金堂，2003），但當我們的測驗目標不是比較受試者間的能力高低，而是關切受試者在學習的過程中有哪些屬性尚未精熟時，探討學生潛在結構與作答關係的認知診斷模式就可派上用場（甘媛源、余嘉元，2009）。認知診斷模式透過屬性概念，去了解受試者對屬性是否精熟、認知的過程為何和解決問題的策略為何（涂金堂，2003；de la Torre, 2011），對於補救教學或是想要瞭解學生的作答過程、策略的教師、研究人員等人，可以從認知

下面以一個43的矩陣為例：

參、DINA模式(deterministic input, noisy ”and” gate model)

許多認知診斷模式的起源，都是來自 DINA 模式，其假設當受測者完全具備 Templin & Willse, 2009)，也就是DINA模式假定精熟試題j之屬性的受試者，其答對機率會大於不精熟試題j之屬性的受試者。

肆、DINO模式(Deterministic Inputs, Noisy “or” Gate Model)

伍、G-DINA模式(Generalized DINA)

de la Torre(2008)提出G-DINA模式，其為DINA的一般化模式，公式如下：

   

當只有_j₀與 * ...

12 k_j

j 不為0時， _jk和 _jkk_'為0時，也就是交互影響為0時，此時就變成DINA模式，所以DINA模式是G-DINA模式的特例。

陸、HO-DINA模式(higher-order DINA model)

de la Torre 和 Douglas (2004)將DINA模型延伸，將屬性的機率分布加入IRT

第三章研究設計與實施

本章節將研究設計與實施以五節說明，依序為研究架構、研究對象、研究工具、認知診斷模式建構與評估及資料分析。

第一節研究架構

本研究針對 PIRLS 2011 閱讀理解測驗題本十三之試題，首先依據相關文獻及專家學者對試題進行編碼，並形成一認知模型，使試題能與屬性連結，再製作認知診斷模式所需的Q矩陣，最後將受試者在題本十三的試題作答反應及Q矩陣輸入程式內，以得到各種認知診斷模式的參數估計值。

根據上述結果，評估DINA、DINO、G-DINA及HO-DINA模式與測驗資料的適配度，找出最適配的認知診斷模式，再以此模式之診斷結果分析與比較臺灣、

香港及新加坡的學生在各認知屬性的精熟情形，以及讀者個人因素對認知屬性表現的影響，本研究架構圖請見圖3-1。

圖3-1 研究架構圖

為完成本研究之目的，首先研讀相關文獻藉以擬定研究主題，確定研究主題後再進行相關文獻蒐集做為理論基礎，從IEA所提供的PIRLS 2011資料庫中擷取資料與題本，並參考PIRLS 2011所訂定的評量架構與專家意見，訂定學生作答時所需之認知屬性以製作Q矩陣，將PIRLS 2011三國（地區）的學生作答反應及Q 矩陣以Ox程式進行認知診斷分析，最後根據結果提出結論與建議。研究流程如圖 3-2所示。

圖3-2 研究流程圖 擬定研究主題並確立研究目的

訂定 PIRLS 2011 題目屬性及 Q 矩陣

提出結論與建議評估適配之認知診斷模式

撰寫研究報告

擬定研究主題並確立研究目的

蒐集相關文獻

依據結果進行相關的分析

自 PIRLS 2011 資料庫擷取閱讀理解測驗作答資料及學生問卷

第二節研究對象

PIRLS 2011 的參與國家遍及五大洲，共有 49 個國家或地區參與，本研究所使用的樣本是臺灣、香港及新加坡的四年級學生資料，選擇香港及新加坡的原因為臺灣、香港及新加坡皆處於亞洲，且同為受到華人文化影響的國家，故選擇此三地的學生資料做為研究對象。

PIRLS 2011 所使用的題本共有 13 本，而其有釋出的文章有「飛吧！老鷹，

飛吧！(Fly Eagle Fly)」、「敵人餡餅(Enemy Pie)」、「發現一日健行的樂趣(Day Hiking)」、「巨牙之謎(The Giant Tooth Mystery)」，前兩篇為故事體，編號分別為 L2 及 L5，後兩篇為說明文，編號分別為 I2 及 I5。「飛吧！老鷹，飛吧！」及「發現一日健行的樂趣」為題本 10 所使用之文章，「敵人餡餅」、「巨牙之謎」為題本 13 所使用之文章。研究者檢視兩題本的內容維度及認知維度的分布情況，並與 PIRLS 2011 預定的目標及十三本題本的題數比例比較，以避免題本內容分布與預設內容分布及題數比例相差太多，影響研究結果，兩題本與預設內容的比較見表 3-1、3-2。從表 3-1 和表 3-2 可觀察到，以題本十和題本十三與 PIRLS 2011 的預設比例以及實際 13 本題本的出題比例相比，題本十三與實際題本狀況較為相似，

因此研究者選擇作答題本十三的學生做為研究樣本。題本十三的人數和可能分數 (plausible value, pv)的平均值見表 3-3。

表 3-1

表 3-3

各國(地區)作答題本十三的學生人數及學生的能力值平均

國家(地區) 男生女生總人數 PV 值平均

臺灣 405 459 864 547.22

香港 363 426 789 566.66

新加坡 682 667 1349 568.31

第三節研究工具

壹、PIRLS 2011國際資料庫

每次 PIRLS 施測過後，除了提供該年度閱讀素養測驗的報告外，也會釋出該年度的國際資料庫，使對 PIRLS 有興趣的研究人員能夠下載、分析，PIRLS 提供 SAS 及 SPSS 兩種版本的資料檔，也附有使用指南（user guide），供想要分析的研究人員知悉變項的名稱、編碼、詳細內容……等相關訊息，方便研究人員從眾多資料中迅速找到需要的部分以分析。

本研究採用 PIRLS 2011 所釋出之資料庫。資料庫內除了 PIRLS 的資料外，

也有 prePIRLS 的資料，本研究僅使用 PIRLS 的部分，內容包含了 PIRLS2011 測驗後得到的學生成就資料(PIRLS 2011 student achievement data files)、經由學生問卷(student questionnaire)得到的學生背景資料(PIRLS 2011 student background data files)、經由閱讀學習調查(即家庭問卷)得到的家庭背景資料(PIRLS 2011 home background data files) 、經由國語文教學調查 ( 即教師問卷 ) 得到的 (teacher questionnaire)教師背景資料(PIRLS 2011 teacher background data files)、經由學校問卷得到的學校背景資料(PIRLS 2011 school background data files)、國家/地區內信度(PIRLS 2011 within-country scoring reliability data files)、師生連結資料(PIRLS 2011 student–teacher linkage files)，經蒐集文獻後，除了學生成就資料外，決定自前述資料中選取學生背景資料做為背景變項。

本研究之背景變項包含讀者個人因素及國家因素，國家因素為臺灣、香港及新加坡三個學生所在的地區。讀者個人因素包含了學生的性別及影響其閱讀素養的變項，資料來自學生問卷，分別為｢閱讀行為｣、｢閱讀興趣｣、｢閱讀自信｣、｢

閱讀動機｣四項。下面以學生問卷中的 R5 做為範例說明題目計分方式，請見圖 3-3

圖 3-3 學生問卷題目 R5

由圖 3-3 可以發現，在 R5「想想你在學校與閱讀有關課堂中所做的事。請選擇你對下列每種說法的同意程度。」中，有 a-g 共 7 個小題，選擇非常同意的回

答為 1，有點同意為 2，有點不同意為 3，非常不同意為 4，而本研究將正向回答記為高分，因此會將部分題目轉向，轉向處理的題目包含 R2、R3、R4、R5、R6、

R7、R8 及 R9。

本研究將與｢閱讀行為｣有關聯的題目，包含 R1、R4、R5、R6 的學生回答轉換成分數並加總，題目 R1 為「平常有上學的日子，你每天大概花多少時間在課後閱讀？」，題目 R4 為「你多常從你的學校圖書館或公共圖書館借書？」，題目 R5 為「想想你在學校與閱讀有關課堂中所做的事。請選擇你對下列每個說法的同意程度。」、題目 R6 為「在學校裡，這些事情多常發生？」。每個問題的最高得分為 3 分，最低得分為 0 分，R1、R4、R5 及 R6 內共有 11 個小題，總分為 33 分，其中 R1 及 R5 的第 4 題為反向題，須反向記分。區分高中低分組的方式參考 IEA(2012)在「PIRLS 2011 International Results in Reading」所使用的方式，

在 11 個小題中，將至少選擇 6 項最高分及 5 項次高分，也就是得分 28 分以上的學生定為高閱讀行為組；低閱讀型為組則是 6 項最低分，5 項次低分，也就是 5 分以下的學生；其餘則是中閱讀行為組，得分在 6 分到 27 分之間。

｢閱讀興趣｣的題目包含 R2 和 R7，題目 R2 為「在課後，你多常做以下的事情？」，題目 R7 為「你對閱讀有什麼看法？請選擇你對下列每個說法的同意程度。」，共有 9 個小題，總分為 27 分，其中 R7 的第 1、4 題為反向題，須反向記分。在 9 個小題中，將至少選擇 5 項最高分及 4 項次高分，也就是得分 23 分以上的學生定為高閱讀興趣組；低閱讀興趣組則是 5 項最低分，4 項次低分，也就是 4 分以下的學生；其餘則是中閱讀興趣組，得分在 5 分到 22 分之間。

｢閱讀自信｣的題目包含 R8，題目 R8 為「你的閱讀能力有多好？請選擇你對下列每個說法的同意程度。」，共有 7 個小題，總分為 21 分，其中第 3、5、7 題為反向題，須反向記分。在 7 個小題中，將至少選擇 4 項最高分及 3 項次高分，

也就是得分 18 分以上的學生定為高閱讀自信組；低閱讀自信則是 4 項最低分，3 項次低分，也就是 3 分以下的學生；其餘則是中閱讀自信組，得分在 4 分到 17

分之間。

｢閱讀動機｣的題目包含 R9，題目 R9 為「你會因為以下的理由閱讀嗎？請選擇你對下列每個說法的同意程度。」，共有 6 個小題，總分為 18 分。在 6 個小題中，將至少選擇 3 項最高分及 3 項次高分，也就是得分 15 分以上的學生定為高閱讀動機組；低閱讀動機組則是 3 項最低分，3 項次低分，也就是 3 分以下的學生；其餘則是中閱讀興趣組，得分在 4 分到 14 分之間。

貳、Ox 軟體

Ox 是一個目標指向的統計系統，其核心是一個有效率的矩陣語言，矩陣可以直接表示及運算。這是一個相輔相成的綜合統計資料庫。它的特色式運算速度快、可延伸的資料庫及設計良好的語法與編輯器，使得程式很容易撰寫、維護及繪製圖形。本研究使用 de la Torre(2010)以 Ox 軟體撰寫之 DINA、DINO、G-DINA 及 HO-DINA 模型程式，配合 Q 矩陣設定，估計 PIRLS 2011 測驗資料之診斷結果。

參、SPSS 統計套裝軟體

SPSS（Statistical Package for Social Science）是一套在社會科學領域研究資料時常被使用的統計套裝軟體，其操作介面為圖形介面的視窗環境，具備下拉式功能表及對話方塊，操作簡單易上手，不需會撰寫程式亦可進行分析。本研究使用 IBM SPSS Statistics 20，對以 Ox 程式所產出之認知診斷相關數值進行資料分析及統計檢定。

第四節認知診斷模式建構與評估

本研究應用認知診斷模式進行測驗資料分析，認知屬性的確定及 Q 矩陣的設計對於認知診斷模式是相當重要的。本節依據模式分析過程，依序說明。

壹、認知屬性與試題對應關係

本研究之認知屬性編製是參考「PIRLS 2011 報告-臺灣四年級學生閱讀素

在文檔中以認知診斷模式分析臺灣、香港、新加坡學生在PIRLS 2011的閱讀表現 (頁 36-56)

第三章 研究設計與實施

第四節 認知診斷模式建構與評估

壹、認知診斷模式

參、DINA模式(deterministic input, noisy ”and” gate model)

肆、DINO模式(Deterministic Inputs, Noisy “or” Gate Model)

伍、G-DINA模式(Generalized DINA)

   

陸、HO-DINA模式(higher-order DINA model)

第三章 研究設計與實施

第一節 研究架構

第二節 研究對象

第三節 研究工具

壹、PIRLS 2011國際資料庫

貳、Ox 軟體

參、SPSS 統計套裝軟體

第四節 認知診斷模式建構與評估

壹、認知屬性與試題對應關係

第三章研究設計與實施

第四節認知診斷模式建構與評估

第三章研究設計與實施

第一節研究架構

第二節研究對象

第三節研究工具

第四節認知診斷模式建構與評估