結合知識結構之認知診斷適性測驗演算法

第三章研究方法

第一節結合知識結構之認知診斷適性測驗演算法

根據Cheng (2009)的研究顯示，在 DINA 模式下，以 PWKL 法與 HKL 法作為認知診斷測驗的選題法有較佳的診斷辨識率。KSAT 選題法是依知識結構來選題，利用結構的連接關係獲得更多的訊息。故本研究將PWKL 法、HKL 法與 SHE 法結合知識結構方法進行適性測驗選題，是分別以PWKL 法及 HKL 法全域搜尋選題及 SHE 法選擇後驗分布較集中試題之優點，再加入 KSAT 方法的判斷準則獲得更多訊息來進行診斷，期望融入知識結構所提供的訊息能獲得更佳的診斷精準度，本研究將此選題法稱為PWKL_KSAT 法、HKL_KSAT 法、SHE_KSAT 法。

本研究結合知識結構之選題法是分別以PWKL 法、HKL 法與 SHE 法等來選題，將選出的試題皆依照知識結構來判定其下位試題是否精熟，若選出之試題答對，則認定其下位試題已精熟，無需再測，若選出之試題答錯，則表示尚未精熟此試題，其下位試題仍需測量。然而，因PWKL 法、HKL 法與 SHE 法並非依照 KSAT 選題法來選題，有可能選到在知識結構中為下位的試題，依照順序理論，

若選到下位試題且答錯，則判定其上位試題未精熟；若下位試題答對，其上位試題狀態無法得知，故不做任何判斷。

綜合上述，本研究結合知識結構之選題法的判斷準則為：若選到試題答對，

則預測其下位未施測之試題也精熟；若選到試題答錯，則預測其上位未施測之試題未精熟，若其上位試題為先前其他試題的預測題並預測答對的情況下，需將此預測題判斷為未精熟，因依照順序理論，下位試題答錯，其上位試題必未精熟。

以圖2-2 為例，假設第一題選到試題 C 且答對，則預測其下位試題 F、G、H、

本研究是以試題的概似函數（likelihood function）作為訊息函數來控制閾值的大小，公式如下

由於在DINA 模式估計下，隨著施測題數的增加，最後估計會越來越精準，

因此無需再加入更多訊息來提升診斷辨識率，而且加入的訊息若預測錯誤，則會導致估計誤差變大，反而降低診斷辨識率，故本研究知識結構的閾值隨著試題增加而遞減。

在本研究各個模擬實驗中，受試者樣本皆為同一群受試者，因此，隨著Q 矩陣平均測量的屬性數越多，受試者的平均通過率會相對地越低。然而在題庫試題為較難的情況下，兩試題間違反順序的機率在每個試題皆相差不多，以致於其知識結構會比較弱，若在選題的時候閾值降低的幅度是固定的情況下，納入預測試題的數量會隨著知識結構越弱而越少，而降低結合知識結構選題法所帶來的效益，因此，閾值的變動幅度，應隨著題庫試題平均通過率而有所不同。

以平均測量1.2、3.6 個屬性的 Q 矩陣為例，平均測量 1.2 個屬性的 Q 矩陣平均通過率為0.4481，平均測量 3.6 個屬性的 Q 矩陣平均通過率為 0.2601，若在這兩種Q 矩陣設計中將 p 值皆設為相同時，在施測題數為 12 題的情況下，診斷辨 識率如表3-1 所示，表 3-1 僅呈現 PWKL 法與 PWKL_KSAT 法的結果。在平均測量 1.2 個屬性的 Q 矩陣中，當 p=0.01 時，結合知識結構選題法的成效會比當 p=0.001 來的好；反之，在平均測量 3.6 個屬性的 Q 矩陣中，當 p=0.01 時，結合 知識結構選題法的成效反而沒有比當 p=0.001 來的好，由此可知，在平均測量 1.2 個屬性的Q 矩陣下，閾值降低的幅度要比平均測量 3.6 個屬性的 Q 矩陣來的快，

結合知識結構選題法表現才會比較好。因此，閾值的變動幅度，應隨著題庫平均通過率越低而設定越小。

表3-1 固定 p 值下結合知識結構選題法之診斷辨識率

Q 矩陣 Q_1.2 Q_3.6

PWKL 0.9757 0.9488 平均屬性辨識率

PWKL_KSAT 0.9758 0.9532 PWKL 0.8681 0.7832 p=0.01

整體屬性辨識率

PWKL_KSAT 0.8682 0.7989 PWKL 0.9771 0.9470 平均屬性辨識率

PWKL_KSAT 0.9608 0.9539 PWKL 0.8792 0.7793 p=0.001

整體屬性辨識率

PWKL_KSAT 0.7968 0.7997 本研究在各個Q 矩陣設計中，p 值的設定如表 3-2 所示。因此建議 p 值設定

確定性的試題移除。

在文檔中不同認知診斷適性測驗演算法結合知識結構之成效比較 (頁 25-30)

第三章 研究方法

第一節 結合知識結構之認知診斷適性測驗演算法

第三章研究方法

第一節結合知識結構之認知診斷適性測驗演算法