• 沒有找到結果。

第二章 文獻探討

2.1 評量相關的理論與研究

2.1.1 測驗理論

教 與 學 是 一 體 的 兩 面 , 教 學 者 透 過 各 種 教 學 媒 體 , 運 用 適 當 的 教 學 技 巧 並 採 取 有 效 的 教 學 評 量 方 法 與 學 習 者 產 生 互 動 。 在 施 教 者 與 受 教 者 的 一 連 串 互 動 過 程 中 , 測 驗 是 主 要 的 回 饋 機 制 ( 歐 滄 和 , 2002[16])。 教 育 部 於 2001 年 實 施 的 「 國 中 基 本 學 力 測 驗 」 是 放 棄 過 去 聯 考 制 度 由 古 典 測 驗 理 論 出 發 的 編 製 基 礎 , 以 現 代 測 驗 理 論 為 測 驗 基 礎 發 展 一 個 標 準 化 的 測 驗 評 量 模 式 , 準 確 掌 握 試 題 的 難 易 度 、 鑑 別 度 、 猜 測 度 等 重 要 參 數 , 再 以 這 些 參 數 為 基 礎 , 配 合 測 驗 目 標 進 行 組 卷 、 施 測 , 推 估 學 生 能 力 。 以 下 將 測 驗 理 論 做 一 概 述 整 理,其 對 於 本 研 究 結 果 的 資 料 分 析 與 討 論 有 一 更 清 晰 的 概 念 。

2.1.1.1 古典測驗理論[17]

古 典 測 驗 理 論 依 據 弱 勢 假 設 (weak assumption)而 建 立 起 來 。 主 要 是 以 真 實 分 數 模 式 (true score model) 為 骨 幹 , 觀 察 分 數 等 於 真 實 分 數 與 誤 差 分 數 之 和 (X=T+E)。

其 理 論 模 式 的 發 展 已 有 相 當 規 模 , 而 且 所 採 用 的 計 算 公 式 簡 單 明 瞭 、 淺 顯 易 懂,(X=T+E)。因 此,廣 為 測 驗 學 界 使 用 可 說 是 流 通 最 廣 的 理 論 依 據 。 目 前 廣 泛 使 用 在 大 多 數 的 教 育 與 心 理 測 驗 資 料,以 及 社 會 科 學 資 料 的 分 析 。

但 是 古 典 測 驗 理 論 是 一 種 樣 本 依 賴 的 指 標 。 忽 略 受 試 者 能 力 的 個 別 差 異 (X=T+E) 。 也 就 是 說 , 忽 視 受 試 者 的 試 題 反 應 組 型 (item response pattern) , 認 為 原 始 得 分 相 同 的 受 試 者 , 其 能 力 必 定 一 樣 。 此 外 , 對 於 非 複 本 (nonparallel)但 功 能 相 同 的 測 驗 所 測 得 的 分 數 間 , 無 法 提 供 有 意 義 的 比 較,有 意 義 的 比 較 僅 侷 限 於 相 同 測 驗 的 前 後 測 分 數 或 複 本 測 驗 分 數 之 間 。

信 度 的 假 設 , 建 立 在 複 本 (parallel forms) 測 量 的 概 念 假 設 上 , 但 是 這 種 假 設 往 往 不 存 在 於 實 際 測 驗 情 境 裡 。 由 於 古 典 測 驗 理 論 有 其 缺 點 , 因 此 產 生 了 現 代 測 驗 理 論 。

2.1.1.2 現代測驗理論

現 代 測 驗 理 論 依 據 強 勢 假 設 (strong assumptions) 而 來 。 主 要 是 以 試 題 反 應 理 論 (item response theory, IRT)為 架 構 。 有 別 於 古 典 測 驗 理 論 , 而 具 備 以 下 幾 項 特 點 (Lord, 1980[18]):

1. 必 須 有 大 樣 本 。

2. 試 題 屬 性 並 不 會 受 樣 本 影 響 。 3. 能 提 供 個 別 差 異 的 測 量 誤 差 指 標 。

4. 對 於 不 同 受 試 者 間 的 分 數 , 可 進 行 有 意 義 的 比 較 。

5. 由 於 反 應 組 型 不 同 縱 使 分 數 相 同 的 受 試 者,往 往 給 予 不 同 的 能 力 評 估 。

試 題 反 應 理 論 中 有 四 個 共 同 假 設 ( 余 民 寧 , 2001[19]), 首 先 是 測 驗 中 的 各 個 試 題 都 測 量 到 同 一 種 共 同 的 能 力 這 便 是 單 向 度 的 假 設 。 其 次 是 局 部 獨 立 性 , 表 示 當 影 響 測 驗 表 現 的 能 力 被 固 定 不 變 時 , 考 生 在 不 同 試 題 上 的 反 應 間 沒 有 任 何 關 係 存 在 。 第 三 是 考 試 成 績 不 理 想 , 是 由 於 能 力 不 足 所 引

起 , 而 不 是 由 於 時 間 不 夠 答 完 所 有 試 題 所 致 。 第 四 是 如 果 考 生 知 道 某 一 試 題 的 正 確 答 案 , 他 必 然 會 答 對 該 試 題 。

此 外 , 試 題 反 應 理 論 建 立 在 兩 個 基 本 概 念 上 : 一 是 學 生 在 某 一 試 題 上 的 表 現 情 形 , 因 能 力 (abilities)的 高 低 而 有 不 同 的 反 應 。 其 次 是 這 種 潛 在 特 質 可 透 過 一 條 連 續 遞 增 的 函 數 來 表 示 , 這 個 函 數 便 叫 作 試 題 特 徵 曲 線

( item characteristic curve, ICC)。 其 實 , 能 力 不 同 的 考 生 得 分 點 連 接 起 來 所 構 成 的 曲 線 , 便 是 能 力 不 同 的 考 生 在 某 一 測 驗 試 題 上 的 試 題 特 徵 曲 線 , 把 試 卷 中 各 試 題 的 試 題 特 徵 曲 線 加 總 起 來 , 便 構 成 所 謂 的 試 卷 特 徵 曲 線 ( test characteristic curve, 簡 寫 為 TCC)( 余 民 寧 , 2001[19])。

當 鑑 別 度 為 1、 猜 測 度 為 0, 主 要 探 討 試 題 難 度 與 學 生 能 力 的 關 係 時 , 事 屬 於 一 個 參 數 對 數 形 模 式 又 為 Rasch 模 式 。 二 個 參 數 對 數 形 模 式 主 要 探 討 試 題 難 度、 鑑 別 度 與 學 生 能 力 的 關 係 ,此 時 的 猜 測 度 為 0。而 三 個 參 數 對 數 形 模 式 則 是 對 試 題 的 難 度 、 鑑 別 度 、 猜 測 度 與 能 力 推 估 有 一 數 學 式 代 表 其 間 的 關 係 。

試 題 難 度 是 在 正 確 反 應 機 率 為 0.5 時 能 力 量 尺 (ability scale)上 的 點 (如 圖 2)。 試 題 難 度 值 愈 大 ,表 示 該 試 題 是 屬 於 較 困 難 的 題 目。 而 試 題 特 徵 曲 線 愈 陡 (steeper)的 試 題 具 有 較 高 的 鑑 別 度 , 表 示 它 的 效 能 越 好 , 能 有 效 區 別 不 同 能 力 的 人 ( 余 民 寧 , 2001[20])。

圖 2 試題特徵曲線

試題特徵曲線

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

能力值

答對機率

數列1 數列2 數列3 數列4

-2.19 -1.75 -1.31 -0.87 -0.44 0.00 0.44 0.88 1.32 1.75

相關文件