• 沒有找到結果。

第五章 結論與建議

第一節 主要發現

如前言所述,本研究乃是結合編擬題庫、工具發展、效能及滿意度評估的研 究。茲分述主要成果如下:

壹、 在編擬題庫方面

在編擬題庫方面,本研究是屬於電腦測驗的第三代-連續性測驗。連續性測 驗是根據受試者前一題的表現來決定往後的測驗流程。測驗內容則是依據「金字 塔式」分支結構的適性測驗。金字塔式測驗具有充分運用貝氏策略、便於新增鑑 別力及猜測參數和適用於團體測驗的優點。最後研究者再利用 Tester 2.0 軟體,分 析出各題目之難度、鑑別度,依照金字塔式的分支排列成「成語電腦適性測驗」

之題庫。

貳、 在工具發展方面

研究者將「成語電腦適性測驗」開發過程分為「測驗規劃」、「測驗設計」、「測 驗建置」、「測驗運行與支援」等四個階段,茲依序說明四個階段的研究成果。

一、 測驗規劃

在測驗規劃方面,研究者首先從文獻探討的方式提出「成語電腦適性測驗」

之架構初稿,並透過成語題目的預試,篩選修改成正式施測的題庫,並徵詢專家 學者的意見,確立本研究之可行性。同時,也釐清了本研究的本質及界限。本研 究發展的測驗主要是提供學生一套量身訂做的適性測驗,以國小五、六年級為適 用對象,測驗的學科範圍為成語部分,以結合了音效、影像、動畫,且具備了高 品質、體積小、互動性高等優點的 Flash,作為製作題庫測驗的施測介面。

二、 測驗設計

「測驗設計」主要的效能是提高資訊品質與工作效率,本研究所設計的「成 語電腦適性測驗」,會以能達到更準確地評估學生成語能力並節省教師施測及批改 試卷的時間為主要考量方向。因此本研究提出「成語電腦適性測驗」之資料流程 圖,可知本測驗主要的使用對象為學生、教師及專家學者。學生經由此測驗得到 適當的結果;教師主要提供產生適性測驗題庫之試題;專家學者則是提供此測驗 建置及運作時的考量及評估。

三、 測驗建置

測驗建置包含了「測驗發展」和「測驗測試」兩個部份。其中,測驗發展部 分,本研究發展的「成語電腦適性測驗」,硬體方面,研究者預設輸出畫面為 800×600,其實使用者的輸出畫面解析度可以不拘,因 Flash 為向量圖形,具有不 失真的特性;軟體方面,作業系統為 Windows XP,建構施測介面則是使用 Macromedia Flash 8 來撰寫具有多項優點及高度整合能力的 Flash 程式,最後則是 利用 Tester 2.0 來進行適性題目分析與排列。

在測驗測試方面,首先都是由研究者親自修改及執行,來測試整個成語電腦 適性測驗的正確性。再經由專家學者的修正建議直到完成。在開放線上測驗驗收 階段,有請到台東大學教學科技碩士班一年級的學生進行施測驗證無誤後,便確 立了測驗建置的完成性。

四、 測驗運行與支援

測驗運行時之「軟硬體之規格需求」,硬體方面,在研究者端的規格如下:(一)

CPU:AMD Athlon(tm) 64 Processor 3200+(二)RAM:1.00 GB(三)HDD:WDC WD2500KS-00MJB0 250 GB(四)網路卡:10/100 Mbps。在使用者端,則為:(一)

CPU:Intel Pentium Ⅱ 350 MHz(含)以上(二)RAM:128 MB(含)以上(三)

HDD:2 GB(含)以上(四)網路卡:10/100 Mbps(五)顯示卡:可顯示 256 色 以上,及解析度至少達 800×600(含)以上。

至於在軟體部分,在研究者端:計有(一)Macromedia Flash 8(二)Tester 2.0

(三)作業系統:Microsoft Windows XP(四)成語電腦適性測驗:研究者利用 Macromedia Flash 8、Tester 2.0 等程式,建置在網際網路的環境,讓使用者連結下 載,完成線上施測。而使用者端由於網際網路為開放性架構,因此本研究所建置 的成語電腦適性測驗其使用者端之軟體,使用者可以自行依其習慣偏好調整以配 合不同的工作平臺,以下為本研究對於使用者端建置之軟體部份。(一)作業系統:

Microsoft Windows 95/98/ME/2000/XP(二)全球資訊網瀏覽器:Microsoft Internet Explorer 4.0(含)以上。

參、 在效能及滿意度評估方面

在效能及滿意度評估方面,旨在說明本研究所發展的「成語電腦適性測驗」

的使用成效,以下依「使用結果與傳統測驗的相關性」、「使用者評估」等二個方 面說明:

一、 使用結果與傳統測驗的相關性

正式施測,研究者抽取五所學校,共 284 名五、六年級的學生,進行成語電 腦適性測驗及傳統紙筆測驗。利用 Tester 2.0 測驗出來的結果,每間學校五、六年 級學生所分析出來的數據,在信度方面,除了後庄國小五年級學生的 .62 頗接 近 .70 外,其餘的九班學生的測驗信皆是高於 .70,因此顯示本題庫測驗具有很高

的信度。在效度方面,五間學校所分析出來的差異係數全都介於 .40 與 .60 之間,

代表此題庫測驗具有非常的效度。而在相關性方面,有四個班級的數據是頗接 近 .50,其餘六個班級皆大於 .50,由此可知,本研究所發展的「成語電腦適性測 驗」與「傳統紙筆測驗」的施測結果,呈現高度正相關。

二、 使用者評估方面

在使用者做完「成語電腦適性測驗」與「傳統紙筆測驗」後,會讓使用者填 答有關「成語電腦適性測驗」使用滿意度的問卷,計有 284 位學生填答問卷,回 收問卷數也為 284 份,回答率為 100%。研究主要發現在整體滿意度方面平均值皆 大於 3,亦即表示使用者對於本測驗是抱持著滿意的態度,其中「我覺得成語電腦 適性測驗用滑鼠點選答案很方便。」選項的滿意程度最高(M=4.31)。

第二節 結論

根據上述主要發現,本研究結論如下:

壹、 題庫建置方面

以「Tester 2.0」軟體的試題分析及「金字塔式」適性測驗,說明如下:

一、 利用 Tester 2.0 軟體進行試題分析具便利性

研究者利用 Tester for Windows 程式 2.0 版,進行試題預試的分析,只要鍵入 學生作答的資料,Tester 2.0 軟體即能算出問題注意係數表、內部一致性係數、差 異係數及各試題之難度、鑑別度等一些重要的分析訊息,就連學生作答後的分數,

也不需研究者一一批改,Tester 2.0 軟體自動能將各學生的作答資料跟正確答案一 一比對算出學生所作答後的分數。

在正式施測後的試題分析,研究者同樣採用 Tester 2.0 軟體,所不同的是,在 此次的分析中,研究者加入效標關聯的項目,主要是用來作「成語電腦適性測驗」

與「傳統紙筆測驗」相關性的分析,因此從 Tester 2.0 軟體分析的報表中,即能很 清楚地了解到「成語電腦適性測驗」與「傳統紙筆測驗」在各校的五、六年級學 生作答上,均呈現高度的正相關。

二、 利用金字塔式適性測驗便於達成學生能力的估計

適性測驗中最常用且最受重視的一種彈性的測驗方式就屬金字塔適性測驗

(陳新豐,2002)。一份含括 55 題的測驗內容,每位受試者只需要作答 10 題,即 可達成學生能力的估算(吳裕益,1997)。而本研究所發展的「成語電腦適性測驗」

內容含括 28 題的測驗內容,每位受試者只需要作答 7 題,即能得出學生能力的估 計。

貳、 工具研發方面

在工具研發方面以「整合」與「功能」二部份,說明整理如下:

一、 Flash 施測介面與金字塔適性測驗題庫內容可整合為一

目前測驗的發展,已逐漸邁向與電腦化的結合,許多電腦化測驗的研究,更 是如雨後春筍般不勝枚舉。可是,金字塔適性測驗與 Flash 介面所整合的題庫測驗,

目前並不多見。本研究首先嘗試將金字塔適性測驗與 Flash 介面整合在一起,就「成 語」這個部分,設計相關試題,統合成一個結合影音、互動性高,又能以設計好 的適性試題,即時達到學生成語能力估計的 Flash 題庫測驗。

二、 成語電腦適性測驗具有多項功能

本研究所發展的「成語電腦適性測驗」,結合網際網路,可提供受試者隨時上 網作答,不受時空的限制,作答完成後,電腦會自動產生回饋訊息給受試者。因 此,本測驗的功能有測驗結構立體化(金字塔式分支)、作答線上化及結果自動化。

參、 效能及滿意度評估方面

在滿意度評估方面,分為「估算效能」及「滿意度」等二部份,說明整理如 下:

一、 成語電腦適性測驗能力估算效能良好

傳統的紙筆測驗仍有其測驗效力的優勢存在,本研究所發展的「成語電腦適 性測驗」所估計的効力若能與傳統紙筆測驗所估計的等同,代表本研究發展的測 驗是具有測驗效度的。除了利用 Tester 2.0 軟體,分析出各校五、六年級的「成語 電腦適性測驗」與「傳統紙筆測驗」的分數均呈現高度正相關外,同時研究者也 將五校共 284 名學生的「成語電腦適性測驗」與「傳統紙筆測驗」的分數,利用 Spss 12.0 作 Pearson 積差相關分析,也達數據 .57 的高度正相關。由此可知,本研 究所發展的「成語電腦適性測驗」是可行的,不僅測驗效力與傳統紙筆測驗呈正 相關,而且測驗題數、測驗時間及測驗批改所花費的精力都要比傳統紙筆測驗節 省很多,受試者不必做完全部的試題,即能在短短做數題的時間裡,得到適性的 能力估計,施測者也不需再花額外的時間,做每份試卷的事後批改工作,因此本 題庫測驗的發展是具有實質上的效果的。

二、 使用者對成語電腦適性測驗感到滿意

本測驗經使用者使用後,在整滿意度方面平均值皆大於 3,表示使用者對於本 測驗抱持著滿意的態度。其中「我覺得成語電腦適性測驗用滑鼠點選答案很方便」

(M=4.31)滿意度最高,接下來分別是「我覺得成語電腦適性測驗的題目文字清 楚明確」(M=4.12)、「我比較喜歡做成語電腦適性測驗」(M=4.04)、「我覺得做成 語電腦適性測驗很有趣」(M=3.99)、「如果有其它類似的電腦適性測驗我會很想試 試看」(M=3.92)、「我做完成語電腦適性測驗後的感覺很新奇」(M=3.81)、「我覺 得成語電腦適性測驗的題目動畫很搭配」(M=3.76)、「我覺得成語電腦適性測驗的 整體版面設計很美觀」(M=3.74)、「我認為成語電腦適性測驗的歡迎動畫很吸引我」

(M=3.66)、「我比較不喜歡做成語紙筆測驗試卷」(M=3.30)。

第三節 建議

茲依據前述主要成果和結論提出建議,並分為三方面說明如下:

壹、 對建置題庫的建議

針對建置題庫,主要以豐富題庫內容方向為主,建議如下:

一、 可多參考各家版本之語文教科書

目前研究者只針對一家版本(翰林版)的國小語文教科書做成語部分的整理,

或許整理出來的成語內容,對於使用此版本的學校較能涵蓋到,而對於使用別家 版本的學校,可能就會有疏漏涵蓋不全的情況產生。不過研究者當初在設計成語 題庫時,除了參考翰林版的語文教科書外,也有收集坊間的成語題庫評量,應能

或許整理出來的成語內容,對於使用此版本的學校較能涵蓋到,而對於使用別家 版本的學校,可能就會有疏漏涵蓋不全的情況產生。不過研究者當初在設計成語 題庫時,除了參考翰林版的語文教科書外,也有收集坊間的成語題庫評量,應能

相關文件