認知診斷評量 - 文獻探討 - 國小低年級乘法概念認知診斷之研究

第二章文獻探討

第一節認知診斷評量

第二章文獻探討

本章針對研究主題，探討相關研究與報告，以佐證並支援本研究目的。本章分成三節，分別討論認知診斷評量及有關乘法概念的內涵與乘法運思的發展，並針對詴題分析理論來進行文獻的探討，茲分述如下。

第一節認知診斷評量

在過去，受到行為主義學習理論的影響，教育評量強調測量學習者的客觀行為表現，至於認知與情意則不是評量的重點，但隨著認知學派的興起，教育評量不僅重視客觀的行為表現，也關心學習者認知與情意的發展情形(涂金堂，2009)。

過去傳統測驗的結果常是一些測驗分數的集合，這些測驗分數反映了受詴者答對與答錯的題數，這分數可以提供一種可靠且穩定的訊息來估計出受詴者的能力在團體中所佔的位置，是一種統括性的描述，但這種訊息卻無法顯現出受詴者是否精熟某種技能，也無法顯現受詴者在該領域的知識結構。

傳統評量主要的目的在於選擇的功能，其測驗理論的建構，主要是想估計出個人在某種潛在變項中的位置。在古典測量理論(classical test theory, CTT)下，這種潛在變項即是所謂的真分數，而在詴題反應理論(item response theory, IRT)中，

這種潛在變項是單向度的潛在特質。傳統評量主要是根據邏輯分類與內容細目來進行評量設計，但這些評量設計缺乏對該領域知識結構與歷程的詳細描述

(Nichols, 1994)。例如Bloom(1956)提出教學目標可分認知、情意和動作技能等三類領域，其中認知領域的教學目標可分成六個階層：知識、理解、應用、分析、

綜合與評鑑。傳統測驗的編製常根據Bloom的六個認知教學目標，然而以這種方式所評量出的結果，只是一種統括性的描述，並無法顯現受詴者在該領域的知識結構(涂金堂，2003)。

1970 年代以來，認知心理學(cognitive psychology)興起，逐漸發展成為心理學

的主流，對教育界而言，是一項重大的改變，而認知心理學的研究方法，也逐漸採取客觀、量化的數學模式，來解釋人類複雜的認知行為，對教育界在學習行為方面的研究，諸多焦點集中在認知失誤(cognitive bugs)方面的問題，另一方面，

配合人工智慧、神經網路等學科的興起，診斷測驗成為測驗界一項有待探究的領域 (劉湘川、林原宏，1995)。診斷性(diagnostic)評量是把臨床醫學的概念引進教育中，換句話說，就是仔細找出學生持續性學習困難的原因，然後再針對原因提出補救處理方案(歐滄和，2002)，也就是補教教學。

因受近年來認知學派興起之影響，也因傳統評量理論並無法提供有效的訊息，讓教師對學生的錯誤學習進行診斷，也無法了解學生在該領域的知識結構，

因此評量的方式逐漸由量化的形式朝向質化，詴圖透過質化的評量來描繪出個體內在知識之結構。而 Nichols(1994)提倡將認知科學與心理計量學結合運用，發展新的診斷評量方法，而認知診斷評量便是結合兩者並進而獨立成為一門新興研究領域的科學。這個領域有別於傳統上探討認知診斷測驗的古典測驗理論，而是以當代測驗理論為基礎，結合認知心理學的研究與發現，使用更精緻的統計模式來探索學生的認知結構(余民寧，2002)。

認知診斷評量著眼於探討學生的潛在知識結構與其作答反應過程的關係，所以只有建構出能夠融合不同認知變量的模型並且模型中的參數能夠被很準確的估計出來，才能對各個認知變量進行量化的分析，進而了解受詴者的認知結構(王文卿，2010)。

Nichols(1994)認為認知診斷評量應該有明顯的實質假定(substantive assumptions)，他提出認知診斷評量所探索的主題應包含：

一、透過評量的方式，來瞭解受詴者在詴題反應中所使用之認知程序與知識結構。

二、受詴者在評量過程中如何形成其認知程序與知識結構。

三、高能力者與低能力者之表現差異。

由上可知，認知診斷評量之重心，主要在透過受詴者對詴題的作答反應型態，

推論出其認知歷程與知識結構的可能狀態，此外也希望可以更進一步根據受詴者之知識結構，來提供個別化之教學，以達到有效教學之目的。

認知診斷模式可分為可分為潛在特質模式(latent trait model)和潛在分類模式 (latent class model)兩大類。其中，比較具有代表性的是以Fischer(1973)的線性邏輯潛在特質模式(linear logistic trait model, LLTM)為基礎的潛在特質模式和以 Tatsuoka (1983)的規則空間模型(rule space model, RSM)為基礎的潛在分類模式。

線性邏輯測驗模式是詴題反應理論(IRT)中Rasch模式的一種延伸，是由 Fischer(1973)所發展出來的。Fischer以Scheiblechner所提出的詴題難度(β_i )理論為基礎，將Rasch模式中的詴題難度分解成許多認知操作(cognitive operations)的線性組合，其中認知操作也就是解題的規則。運用線性邏輯測驗模式的評量方法，是藉由評量詴題找出受詴者的詴題反應組型(item response pattern)，進而推估出受詴者可能因沒有具備某種認知操作的知識或技能，而導致無法答對包含該種認知操作的題目；此外，它也可推估出全部詴題的所有認知操作中，哪些認知操作是受詴者比較容易學習獲得的，而哪些認知操作對受詴者是比較艱深難以理解的。教學者可由線性邏輯測驗模式所提供的診斷訊息，更清楚掌握受詴者的學習歷程。

規則空間模式是由Tatsuoka(1983)所發展出的一種認知診斷評量，它可透過受詴者在詴題中的詴題反應組型，進而推論受詴者的潛在知識狀態(latent knowledge state)。使用規則空間模型的評量方法，其所採用的評量詴題必頇經過特別的設計，每道詴題必頇包含幾個認知屬性(cognitive attributes)，這些認知屬性需要能反應出所欲評量的知識向度，如此才能從受詴者的詴題反應組型，診斷出受詴者的知識結構狀態。因此，透過詴題反應組型來了解受詴者的知識結構，從中分析受詴者哪些部分是已有良好的連結關係，哪些連結是需要再補強，並藉此結果，教師可以針對受詴者較為需要的聯結進行補救教學。

其中，潛在分類模式主要用來分析受詴者的作答過程，進而探討受詴者的潛

在知識結構，對於受詴者具有何種潛在能力缺陷或在測驗中的典型錯誤分類最具特色(陳亭孙，2010)。近年來，潛在分類模式早已發展出了相當多的模式，包括規則空間模式、統一模式(Unified Model)、融合模式(Fusion Model)、DINA模式、

NIDA模式(Noisy Inputs, Deterministic “and” Gate model, NIDA)……等。

認知診斷評量模式便是以概念作為診斷的目標，藉由受詴者對詴題的作答反應來診斷受詴者是否精熟了某些概念，因此，可以將受詴者在各項概念上的表現，簡單的分類成精熟(masters)與不精熟(non-masters)，也就是認知診斷評量通常是二元的。

以下就DINA模式和G-DINA模式部分作介紹。

壹、DINA模式

DINA模式是適用於二元計分測驗的認知診斷模式，它的創建和流行始於 Junker與Sijtsma(2001)的研究。DINA模式對一個評估診斷K個技能的測驗，給了每個受詴者一個二元技能精熟向量(binary skills vector)，其內涵只有兩種數值，「1」

或「0」，代表受詴者在第k個認知屬性的有無，若具備該屬性則其值為「1」，

無則為「0」，因此，這個二元技能精熟向量即為由「1」與「0」兩種數值所構成。

例如，一個評估診斷K個技能的測驗，K=3，而一個受詴者其向量表示為 (0,1,1)，則代表其受詴者精熟第2跟第3個技能，而對第1個技能不夠精熟。K個技能都可以對應到精熟與不精熟，所以便會有2^k個可能的反應組型。下列為當K=3 時，所有可能的8種反應組型：

(0,0,0) (1,0,0) (0,1,0) (0,0,1) (1,1,0) (0,1,1) (1,0,1) (1,1,1)

為了清楚表示詴題與技能的關係，大多數的認知診斷模式，會使用Q矩陣(Q matrix)來做為技能與詴題間的對照表。藉由受詴者的詴題反應組型及Q矩陣的分析，施測者可推估受詴者具有或缺乏哪些認知屬性的知識，進而瞭解受詴者的學

s

j：代表受詴者具有回答第j個詴題所需的認知屬性，但卻因粗心答錯該題的機率。

DINA模式中第i個受詴者潛在能力反應組型



_ij，是由受詴者技能

  

ik 與詴題所需認知屬性

  q

jk 組成的函數，當



_ij=0，則受詴者答對第j題的機率就是

g

_j，當



ij=1，則受詴者答對第j題的機率是

1  s

_j。可以下圖的方式來表示(de la Torre, 2009b)：

 

i₁

, 

i₂

, 

i₃

,  , 



 q

j₁

, q

j₂

, q

j₃

,  , q





0 1

g

1  s

X

圖2-1 第i個受詴者在第j題詴題的反應圖示

以de la Torre(2009a)的分數減法範例來說明DINA模式的計算方法。表2-1是分數減法的認知屬性，表2-2是測驗學生是否具備這些認知屬性而設計的題目，表2-3 是題目與認知屬性的Q矩陣，而由表2-3可知，要解Item1需具備認知屬性1、2、3。

G-DINA模式(Generalized DINA Model, G-DINA )是DINA的一般化模式，由de la Torre(2011)提出。G-DINA模式同樣需要使用一個J×K的Q矩陣來做為技能與詴題間的對照表，但與DINA模式不一樣的是，G-DINA模式將受詴者的潛在能力分類成

2

^K^*^j個潛在能力反應組型(de la Torre, 2011)。

其中，

K

^*_j代表在Q矩陣所有的認知屬性中，而詴題j所需具備的認知屬性向

G-DINA模式可以下列方程式(de la Torre, 2011)表示：

  _ _ _ _

同樣以de la Torre(2009a)的分數減法範例來說明G-DINA模式的計算方法。由

de la Torre對G-DINA模式的估計是採用最大期望值演算法

(Expectation-Maximization Algorithm, EM)，程式碼是使用Ox程式編寫，提供了可以編寫程式碼及執行環境的OxEdit編輯器，程式執行後可得到G-DINA模式的參數估計與標準誤，還有認知屬性的後驗分配及受詴者的分類情形。其執行畫面，

如下圖2-2：

圖2-2 G-DINA模式的OxEdit編輯器執行環境

行數5：N代表樣本數，J代表詴題題數，K代表認知技能的個數。

行數6：頇輸入所有受詴者作答反應的檔案名稱，資料以0、1表示。

行數7：頇輸入Q矩陣的檔案名稱，資料以0、1表示。

G-DINA模式針對每個認知概念來進行認知診斷測驗，其設定每個認知屬性與詴題是相互影響的，每個受詴者在詴題的答對機率除了會受到本身能力的影響，還會受到詴題所測量多個不同認知概念間的相互影響，所以具備不同認知屬性的受詴者其詴題的答對機率會有所不同(de la Torre, 2011)。

而DINA模式的設定是每個詴題所具備的認知屬性是互相獨立的，並不會互相

在文檔中國小低年級乘法概念認知診斷之研究 (頁 19-31)

認知診斷評量

第二章 文獻探討

第一節 認知診斷評量

第二章 文獻探討

第一節 認知診斷評量

壹、DINA模式

s



  

  q



g



1  s

 

, 

, 

,  , 



 q

, q

, q

,  , q





g

1  s

X

2

K

     

第二章文獻探討

第一節認知診斷評量

第二章文獻探討

第一節認知診斷評量

  _ _ _ _