• 沒有找到結果。

第三章 研究方法

第四節 研究工具

本研究所使用之研究工具有:成語題目預試試卷、成語電腦適性測驗、成語 傳統紙筆試卷及使用成語電腦適性測驗滿意度調查問卷。

壹、 成語題目預試試卷

成語題目預試試卷之題目來源為研究者本身所整理的一至六年級翰林版國語 課本中的成語及坊間可收集到的成語題庫等資料來作為試題來源之參考,所設計 而成的成語題庫試卷。其中剔除較為艱深冷門不常見的成語內容,以常用常見能 應用的成語為主要挑選內容。所選試題如有題目敘述不清、誘答選項不佳等情形,

則進行逐題修正。修正後,共選擇五十題。

貳、 成語電腦適性測驗

成語電腦適性測驗為根據研究目的、文獻探討等設計而成的。內容由預試的 五十題成語題目中刪除及修改為二十八題,並作金字塔階層的適性排列,施測介 面以 Flash 作為呈現的方式。

參、 成語傳統紙筆試卷

內容等同於成語電腦適性測驗,只是沒有作金字塔階層的適性排列,但二十 八題的排列順序,則是按照難度由易而難來排列,越前面的試題越簡單,越後面 的試題則越困難。

肆、 使用成語電腦適性測驗滿意度調查問卷

此滿意度之問卷,主要是針對研究者所開發的成語電腦適性測驗做滿意度的 調查,與專家討論後,主要內容有:學生是否喜歡做成語電腦適性測驗、學生是 否喜歡做成語紙筆測驗試卷、學生是否對成語電腦適性測驗感到有趣、學生是否 有受到成語電腦適性測驗之歡迎動畫的吸引、學生是否覺得成語電腦適性測驗的 整體版面設計美觀、學生是否覺得成語電腦適性測驗的題目文字清楚明確、學生 是否覺得成語電腦適性測驗用滑鼠點選答案很方便、學生是否覺得成語電腦適性 測驗的題目動畫很搭配、學生是否覺得成語電腦適性測驗做起來很新奇、學生之 後是否還會想再做其它類似的電腦適性測驗等。

第五節 資料分析

本研究的資料分析,是針對成語題目預試試卷、成語電腦適性測驗、成語傳 統紙筆試卷及使用成語電腦適性測驗滿意度調查問卷所獲得的資料進行統計分 析。

壹、以 Tester 2.0 做成語題目預試試卷之題目難度及鑑別度的分析。

貳、以 Spss 12.0 做成語電腦適性測驗及成語傳統紙筆試卷的皮爾森積差相關 的分析。

參、以 Spss 12.0 做使用成語電腦適性測驗滿意度調查問卷的次數分配表分析。

第六節 研究流程

本研究之「研究流程圖」如圖 3-2 所示,首先進行成語題目的預試,針對預試 結果作難度分析及鑑別度分析,依其分析結果,將題目排列成金字塔階層的出題 順序,結合 Flash 開發建立一個成語電腦適性測驗,將開發而成的成語電腦適性測 驗,立意抽取五所學校做施測,再觀察其與傳統測驗效能的相關性及使用者對其 施測後的滿意程度。

圖 3-2:研究流程圖 建立成語電腦適性測驗

成語題目預試

難度分析 鑑別度分析

成語電腦適性測驗施測

運作效能和使用滿意度情形

研究時間進度表的甘特圖如表 3-1 所示。第一階段的準備工作,預定於民國九 十六年九月至十月間完成;第二階段的資料收集,預定於民國九十六年九月至十 二月間完成;第三階段、第四階段的編製題庫,預定於民國九十七年一月至四月 間完成;第五階段的進行施測,預定於民國九十七年五月完成;第六階段的資料 處理,預定於民國九十七年六月完成;第七階段的準備並提出報告,則是一直持 續直至完成。

表 3-1:研究時間進度表

第一階段 第二階段 第三階段 第四階段 第五階段 第六階段 第七階段

日期

活動項目 96 年 9.10 月 96 年 11.12 月 97 年 1.2 月 96 年 3.4 月 97 年 5 月 97 年 6 月 97 年 7 月

準備 工作 收集 資料 編製 題庫 進行 施測 資料 處理 準 備 並 提 出 報 告

第四章 結果與討論

本研究旨在發展一個「成語電腦適性測驗」,以提供教師一個電腦網路輔助測 驗的環境,並能針對學生提供量身訂做的適性測驗。因此,如何將一些零散的成 語題目,篩選排列成符合學生能力的適性題庫,也是本章所要呈現的研究結果。

其次,測驗效能與架構是否充實完備,便關係著本研究的成敗,故開發題庫結合 多媒體的 Flash 介面實為一重要的工作。最後,則是有關 Flash 題庫測驗的效能評 估與使用情形,以了解本開發測驗之功能。故本章分為「題庫建置」、「測驗開發」

與「效能評估」這三方面加以說明並討論。

第一節 成語電腦適性測驗建置過程與結果

首先,題庫測驗的建置,必須要有具代表性的成語題目來提供使用者線上施 測。因此,本節旨在呈現題庫建置的過程,並進一步利用 Tester 2.0 的軟體來進行 篩選分析,最後再與適性測驗整合,成為符合學生能力的適性測驗題庫。

壹、 預試題庫建置過程

從文獻上可知,試題品質的良窳決定題庫建置品質的優與劣。因此,在建立 題庫的試題方面,研究者以本身所整理的一至六年級翰林版國語課本中的成語及 坊間可收集到的成語題庫等資料來作為試題來源之參考,且為對試題及適合施測 的年級有更精確的掌握,本研究有先進行預試,茲將過程與結果說明如下:

本研究最初所建立的題庫是依國小一至六年級學生而建立,測驗內容為成 語。故在建立紙筆題庫時,試題來源參考包括研究者所整理的一至六年級翰林版 國語課本中的成語及坊間可收集的成語題庫等。

由於本研究一開始設定的對象為國小一至六年級的學生,故根據一至六年級 翰林版國語課本中的成語及坊間可收集的成語題庫等試題中,剔除較為艱深冷門 不常見的成語內容,以常用常見能應用的成語為主要挑選內容。所選試題如有題 目敘述不清、誘答選項不佳等情形,則進行逐題修正。修正後,共選擇五十題。

貳、 紙筆題庫預試結果分析

分為以下「受試樣本」、「分析軟體」及「分析結果」等三部分,說明如下:

一、 受試樣本

紙筆題庫預試的樣本為研究者立意抽取,高雄縣鳳山市文山國民小學人文藝 術暨雙語實驗學校一至六年級,每個年級各抽取一班,共選取一年五班,計 33 名;

二年一班,計 35 名;三年三班,計 28 名;四年三班,計 31 名、五年三班,計 31 名及六年四班,計 31 名,共計六個班級,189 名學生。每班皆做相同的試卷,施 測時間為一節課,計四十分鐘。

二、 分析軟體

本預試所使用的分析軟體為-TESTER for Windows 程式 2.0 版(版權所有

©2002 年,余民寧教授 國立政治大學教育學系)。 簡介如下:

TESTER for Windows 程式 2.0 版主要用來執行古典測驗理論下的試題分析、

測驗分析、和學生問題表分析等各種方法,以落實各種實證指標的建立工作。

本程式使用的最大容量範圍限制:學生數在 10000 人以內、試題數在 250 題 以內、5 個選項以內的單選之選擇型試題、且每題的輸入資料格式必須是數值型

(numerical)的作答反應資料(例如:即使選項為 A、B、C、D 的文字格式,也 必須轉成 1、2、3、4 的數學格式來輸入)。此外,本程式的 S-P 表繪圖功能,僅 限於學生數在 60 人、試題數在 50 題以內的資料,才能啟動使用。

三、 分析結果

(一) 年級分析

在測驗初步建立之後,製成五十題的預試測驗如附錄一。研究者立意抽取高 雄縣鳳山市文山國民小學人文藝術暨雙語實驗學校共六個班級,189 名學生為預試 對象,本預試分析結果作為適性題庫題目修改及刪除的依據。

預試結果採用 Tester 2.0 軟體進行試題難度、鑑別度、優劣率等相關的分析。

茲將分析結果整理如表 4-1 所示:

表 4-1:國小成語測驗題庫分析一覽表

良質試題

(A 和 B)

劣質試題

(A'和 B') 試題良質率

一年級 16 34 32%

二年級 21 29 42%

三年級 25 25 50%

四年級 29 21 58%

五年級 35 15 70%

六年級 36 14 72%

由 Tester 2.0 軟體執行後的報表中,被標註為 A 和 B 的題目,我們歸類為良質 試題,表示可以藉由這些題目測出學生的能力;反之被標註 A'和 B'的題目,我們 歸類為劣質試題,表示這些題目無法測出學生的成語能力。其中的試題良質率為 良質試題佔全部試題的百分比。所以由表 4-1 可知這份試卷,施測於一年級時,約 有 32%的良質試題;施測於二年級時,約有 42%的良質試題;施測於三年級時,

約有 50%的良質試題;施測於四年級時,約有 58%的良質試題;施測於五年級時,

約有 70%的良質試題;施測於六年級時,約有 72%的良質試題。

良質試題率,隨著年級的增加而增加,代表這份試卷對於中低年級的小朋友 來說,有些試題可能過難還未學過,以致於缺乏鑑別度。但對於高年級的小朋友,

這份試卷都約有七成的良質率,所以這份試卷對於高年級的小朋友來說是較具有 鑑別度的。因此本研究的正式施測對象便設定為以國小高年級的五、六年級小朋 友為主。

(二) 試題分析

五、六年級預試利用 Tester 2.0 的施測結果分析整理表如附錄二及附錄三。其 中內部一致性係數和差異係數整理如表 4-2 所示:

表 4-2:五、六年級預試之內部一致性係數和差異係數整理表

內部一致性係數 差異係數

五年級 0.85 0.38

六年級 0.91 0.35

信度係數在 .70 至 .93 之間,斂聚效度及區辨效度在文獻上是相當肯定的。

所以這份試卷施測於五、六年級上是具有顯著性的。差異係數> .40 及< .60 是最好 的(余民寧,2002)。不過施測結果出來的差異係數分離程度較小,代表學生的學 習成就差異過於明顯,而造成此一現象最大的原因,便是試題有待修改的空間,

因為 Tester 2.0 的分析結果,也能顯示出試題的難度及鑑別度,因此有些鑑別度< .20 的題目,便需要加以修改或刪除。

參、 Flash 題庫與適性測驗的整合

依據 Tester 2.0 對五、六年級預試施測的分析,首先扣除劣質試題(A'和 B')

及鑑別度低於 .20 的題目,再修改題意不清或調整較缺乏誘答力的選項,最後按

及鑑別度低於 .20 的題目,再修改題意不清或調整較缺乏誘答力的選項,最後按

相關文件