中華大學碩士論文

(1)

中華大學碩士論文

題目：以資料探勘發掘學習錯誤概念之關聯的預防教學 ⎯ 以英語介係詞為例

A Study of Preventive Instruction Based on the Association among Misconceptions-Taking

English Prepositions as an Example

系所別：資訊管理學系碩士班學號姓名：M09110020 林秀如指導教授：羅家駿博士

中華民國九十三年六月

(2)

摘要

目前，一般的教學方式，大都是先給予學習者教材學習，然後對學習者作測驗以便衡量其學習狀況，再針對學習者學習狀況提供事後的補救教學。事後補救教學，顧名思義就是等錯誤發生之後再進行補救，而預防教學可算是在錯誤發生之前的一套「事前補救」教學方法。

學習過程中，學習者的學習特性，或許有某種學習的關聯。如果能預先發現學習者學習的錯誤概念之關聯性，預測可能發生的錯誤，進一步對未來有可能發生的錯誤概念進行預防，以防止相關的錯誤概念再度發生，達到錯誤發生的事前預防。

本研究利用資料探勘(Data Mining)的關聯式法則(Association Rules)方法，來發掘學習者常犯錯的英語介係詞概念彼此之間的關聯性，預測可能發生的錯誤概念。來對學習者進行預防教學，以減少相關概念學習錯誤的發生。

本研究實驗流程分成兩大階段，第一階段從作答記錄資料庫中挖掘無難度控制組和有難度控制組兩組關聯法則，作為後續預防教學法則啟動規則的基礎。

第二階段為預防教學，邀請中華大學資訊管理系所的學生來進行實驗，以所提供的教材版本和法則啟動規則為操弄因素，將 105 位學生隨機分派成三組，在不同的操弄因素下進行實驗；分別收集各組學生在學習前的前測評量資料，依照前測

(3)

作答資料以判斷是否要啟動法則來給予預防教材或一般教材，再收集各組學生在瀏覽教材學習後的後測學習評估資料，將各組的後測學習評量資料利用統計假說進行檢定。實驗結果顯示本研究所提出的預防教學，在有難度控制之法則且後測試題適中的情形下有著最顯著的學習成效。而在無難度控制之法則且後測試題偏難的情形下，教材內容較淺顯的預防教材比教材內容較深入的一般教材概念不易被混淆，有較佳的學習成效。而關聯法則數目較多的情形下，對預防教學也有較顯著的學習成效。

關鍵字：資料探勘，關聯式法則，錯誤概念，補救教學，預防教學，英語介係詞

(4)

Abstract

In general, instructions provide teaching materials to learners and evaluate the learning effects, mostly by tests. Based on the evaluated results, remedial instructions are provided accordingly. Remedial instruction, in general, is implemented after learning mistakes have been happened, which can be neither inefficient nor

ineffective. “Preventive” instruction, “remedial” instruction implemented before the learner mistakes have been detected, hence, might be a different alternative. The concept behind preventive instruction proposed in this research is based on the assumption that there may exist some relationships among learner misconceptions.

Once the misconception relationships are identified, potential misconceptions may be predicted based on the already detected misconceptions. Preventive instruction, hence, can be implemented to decrease the occurrence of farther learning mistakes.

Taking English preposition as an example, this research uses the data mining technique to find association rules among English preposition misconceptions. Based on these rules, preventive instruction is, then, implemented. The experimental results revealed that the controlled degree of test item difficulty (between 0.3 and 0.7) used to find the association rules had better effect in finding rules. In addition, the results showed the proposed preventive instruction model had better performance.

(5)

Keywords: data mining, association rules, misconceptions, remedial instructions, preventive instructions, English prepositions

(6)

致謝

在中華資管所兩年的研究生生涯轉眼間已經告一段落，這兩年的求學過程中，感謝指導教授羅家駿博士在學業上的細心指導和生活上的諄諄教誨，使我獲益良多，感謝之意溢於言表；也感謝中華資管教授們的指導，增長我的專業知識。

同時，還要感謝研究所同學、學長姊和學弟妹們在求學期間，彼此互相扶持和鼓勵，讓我的研究生活充滿歡樂，求學生涯更多采多姿。

感謝羅家駿博士、游坤明博士和鄭瑞恆博士在口試期間不吝指教，提供許多寶貴意見和建議，使本論文得以更加完整。也感謝葉修文博士，在論文撰寫期間細心指導和建議，使本文在英語領域上的應用更趨於完善。

最後，要感謝的是我的父母，在每個求學階段中，給我不斷的鼓勵和支持，

讓我可以全心全力專注於學業上的專研；另外，要感謝我的弟弟和妹妹，在我出外求學期間代我對父母親的悉心照顧和分擔家務，也感謝週遭親朋好友的關心與愛護，使我無後顧之憂，順利完成學業。

僅將此論文獻給在天上疼愛我的阿嬤和所有關心我的人，願與您們共享此份喜悅與榮耀。

林秀如謹誌

(7)

目錄

摘要...i

Abstract ... iii

致謝...v

目錄...vi

表目錄... viii

圖目率...x

第一章、緒論...1

1.1 研究背景...1

1.2 研究目的...3

1.3 論文架構...4

第二章、文獻探討...7

2.1 補救教學...7

2.2 關聯式法則...9

2.3 英語介係詞...14

2.4 概念圖的應用...16

2.5 文獻探討總結...17

第三章、研究方法...19

3.1 介係詞階層概念圖...19

3.2 系統架構圖...21

3.3 挖掘關聯法則...22

3.4 預防教學...29

3.5 結論...32

第四章、實驗第一階段-法則挖掘 ...33

4.1 試題難度...33

4.2 系統架構、規格...35

4.3 有難度控制之法則...36

4.4 無難度控制之法則...39

4.5 結論...42

第五章、實驗第二階段-預防教學 ...44

5.1 實驗流程...44

5.2 實驗前測...45

5.3 實驗中法則啟動規則...47

5.4 教材內容...48

5.5 實驗後測...50

(8)

5.6 實驗結果...50

5.6.1 法則前項、後項相關結果...51

5.6.2 有難度控制之法則下的前測分析...52

5.6.3 有難度控制之法則下的後測分析...54

5.6.3.1 後測試題難度偏難之平均數分析...55

5.6.3.2 後測試題難度適中之平均數分析...56

5.6.3.3 後測試題難度偏易之平均數分析...58

5.6.3.4 後測平均數分析...60

5.6.4 無難度控制之法則下的前測分析...62

5.6.5 無難度控制之法則下的後測分析...64

5.6.5.4 後測平均數分析...71

5.6.6 兩組難度控制之法則下的前測分析...72

5.6.7 兩組難度控制之法則下的後測分析...74

5.6.7.4 後測平均數分析...81

5.7 結論...83

第六章、結論與未來發展...88

6.1 結論...88

6.2 未來發展...89

參考文獻...91

附錄A...95

附錄B...106

附錄C... 111

(9)

表目錄

表 3.3-1：提取答錯的記錄格式...23

表 3.3-2：英語介係詞階層式概念對照題號表格 ...27

表 3.3-3：第 2、3 和 5 題概念對照表 ...29

表 3.4：一般教材與預防教材之比較表 ...31

表 4.1：難易度衡量表 ...33

表 4.3-1：有難度控制下符合最小支持度為 0.5 之關聯法則 ...37

表 4.3-4：符合最小支持度 0.45 之各題錯誤率 ...38

表 4.4-1：無難度控制試題的難易度分佈 ...39

表 4.4-2：無難度控制下符合最小支持度為 0.45 的關聯法則 ...39

表 4.4-3：無難度控制 2-itemsets法則...40

表 4.4-4：無難度控制 2-itemsets法則的支持度、可信度...41

表 4.4-5：符合最小支持度 0.45 之各題錯誤率 ...42

表 5.1：實驗組別之控制因素 ...45

表 5.2-1：有、無難度控制之關聯法則前項與後項 ...45

表 5.2-2：有、無難度控制兩組關聯法則前項與後項修減表 ...46

表 5.3-1：啟動規則的法則與前項、後項 ...47

表 5.4：法則後項題號與概念對照表 ...49

表 5.6.1：各組法則前項、後項同時出錯之比較表 ...51

表 5.6.2-1：有難度控制之法則下實驗組與對照組 1 前測平均數t檢定 ...52

表 5.6.2-2：有難度控制之法則下實驗組與對照組 2 前測平均數t檢定 ...53

表 5.6.2-3：有難度控制之法則下對照組 1 與對照組 2 前測平均數t檢定 ...53

表 5.6.3：有難度控制之法則下，各虛無假說列表 ...54

表 5.6.3.1-1：有難度控制下實驗組與對照組 1 後測難度偏難之平均數t檢定 ...55

表 5.6.3.1-2：有難度控制下實驗組與對照組 2 後測難度偏難之平均數t檢定 ...55

表 5.6.3.1-3：有難度控制下對照組 1 與對照組 2 後測難度偏難之平均數t檢定 ...56

表 5.6.3.2-1：有難度控制下實驗組與對照組 1 後測難度適中之平均數t檢定 ...57

表 5.6.3.2-2：有難度控制下實驗組與對照組 2 後測難度適中之平均數t檢定 ...57

表 5.6.3.2-3：有難度控制下對照組 1 與對照組 2 後測難度適中之平均數t檢定 ...58

表 5.6.3.3-1：有難度控制下實驗組與對照組 1 後測難度偏易之平均數t檢定 ...59

表 5.6.3.3-2：有難度控制下實驗組與對照組 2 後測難度偏易之平均數t檢定 ...59

表 5.6.3.3-3：有難度控制下對照組 1 與對照組 2 後測難度偏易之平均數t檢定 ...60

表 5.6.3.4-1：有難度控制之法則下實驗組與對照組 1 後測之平均數t檢定 ...61

(10)

表 5.6.3.4-2：有難度控制之法則下實驗組與對照組 2 後測平均數t檢定 ...61

表 5.6.3.4-3：有難度控制之法則下對照組 1 與對照組 2 後測平均數t檢定 ...62

表 5.6.4-1：無難度控制之法則下實驗組與對照組 1 前測平均數t檢定 ...63

表 5.6.4-2：無難度控制之法則下實驗組與對照組 2 前測平均數t檢定 ...63

表 5.6.4-3：無難度控制之法則下對照組 1 與對照組 2 前測平均數t檢定 ...64

表 5.6.5：無難度控制之法則下，各虛無假說列表 ...64

表 5.6.5.1-1：無難度控制下實驗組與對照組 1 後測難度偏難之平均數t檢定 ...65

表 5.6.5.1-2：無難度控制下實驗組與對照組 2 後測難度偏難之平均數t檢定 ...66

表 5.6.5.1-3：無難度控制下對照組 1 與對照組 2 後測難度偏難之平均數t檢定 ...66

表 5.6.5.2-1：無難度控制下實驗組與對照組 1 後測難度適中之平均數t檢定 ...68

表 5.6.5.2-2：無難度控制下實驗組與對照組 2 後測難度適中之平均數t檢定 ...68

表 5.6.5.2-3：無難度控制下對照組 1 與對照組 2 後測難度適中之平均數t檢定 ...69

表 5.6.5.3-1：無難度控制下實驗組與對照組 1 後測難度偏易之平均數t檢定 ...69

表 5.6.5.3-2：無難度控制下實驗組與對照組 2 後測難度偏易之平均數t檢定 ...70

表 5.6.5.3-3：無難度控制下對照組 1 與對照組 2 後測難度偏易之平均數t檢定 ...70

表 5.6.5.4-1：無難度控制之法則下實驗組與對照組 1 後測平均數t檢定 ...71

表 5.6.5.4-2：無難度控制之法則下實驗組與對照組 2 後測平均數t檢定 ...71

表 5.6.5.4-3：無難度控制之法則下對照組 1 與對照組 2 後測平均數t檢定 ...72

表 5.6.6-1：兩組難度控制之法則下實驗組與對照組 1 前測平均數t檢定 ...73

表 5.6.6-2：兩組難度控制之法則下實驗組與對照組 2 前測平均數t檢定 ...74

表 5.6.6-3：兩組難度控制之法則下對照組 1 與對照組 2 前測平均數t檢定 ...74

表 5.6.7：有、無難度控制之兩組法則下，各虛無假說列表 ...75

表 5.6.7.1-1：兩組難度控制法則下實驗組與對照組 1 後測難度偏難之平均數t檢定...76

表 5.6.7.1-2：兩組難度控制法則下實驗組與對照組 2 後測難度偏難之平均數t檢定...76

表 5.6.7.1-3：兩組難度控制法則下對照組 1 與對照組 2 後測難度偏難平均數t檢定...77

表 5.6.7.2-1：兩組難度控制法則下實驗組與對照組 1 後測難度適中之平均數t檢定...78

表 5.6.7.2-2：兩組難度控制法則下實驗組與對照組 2 後測難度適中之平均數t檢定...78

表 5.6.7.2-3：兩組難度控制法則下對照組 1 與對照組 2 後測難度適中平均數t檢定...79

表 5.6.7.3-1：兩組難度控制法則下實驗組與對照組 1 後測難度偏易之平均數t檢定 ...80

表 5.6.7.3-2：兩組難度控制法則下實驗組與對照組 2 後測難度偏易之平均數t檢定 ...80

表 5.6.7.3-3：兩組難度控制法則下對照組 1 與對照組 2 後測難度偏易平均數t檢定 ...81

表 5.6.7.4-1：兩組難度控制之法則下實驗組與對照組 1 後測平均數t檢定 ...81

表 5.6.7.4-2：兩組難度控制之法則下實驗組與對照組 2 後測平均數t檢定 ...82

表 5.6.7.4-3：兩組難度控制之法則下對照組 1 與對照組 2 後測平均數t檢定 ...82

表 5.7.1：有難度控制之法則下，各假說檢定表 ...83

表 5.7.2：無難度控制之法則下，各假說檢定表 ...84

表 5.7.3：有、無難度控制之兩組法則下，各假說檢定表 ...85

(11)

圖目率

圖 1.3：研究流程圖...6

圖 2.2：Apriori演算法(Zaki et al,1996) ...11

圖 2.4：階層式概念圖之組成要素...17

圖 3.1：英語介係詞階層式概念圖...20

圖 3.2：系統架構圖...21

圖 3.3：Apriori演算法產生候選集合及強物項集合...24

圖 4.2：主從式架構...35

圖 5.1：預防教學實驗流程圖...44

圖 5.4-1：一般教材範例 ...48

圖 5.4-2：預防教材範例 ...49

圖 5.4-3：介係詞概念教材內容圖 ...50

(12)

第一章、緒論

1.1 研究背景

補救教學的基本目標，正是因為學生在學習上有困難，沒學好，我們用「補救教學」幫忙他們學到好。由於，目前補救教學幾乎都是屬於事後的補救教學，

往往必須經過測驗之後才能發覺學習者的錯誤，然後再針對學習者的錯誤進行補救。就品質管理的概念而言，品質控制就是要把不符合標準的成品找出來後，進行補救行動：決定重做、補修或報廢。品質控制是只在事情發生之後去控制品質，

品質保證則是在事前確保質量達到所需的水準(謝家駒，1996)。若是能事先確保學習品質，就可以減少補救的行動，降低補救教學的學習成本。所以我們提出一

「事前補救」的預防教學，預測錯誤的發生，在錯誤發生之前，先給予預防錯誤的預防教學，以避免錯誤的發生，來增加學習成效、學習品質，達到事半功倍的效果，且學習者也可以減少成績不好的挫折感。

教學系統除了強調知識內容的呈現外，往往會適時的加入測驗項目，用以測試學習者在閱讀課程內容後，是否真正獲得該系統所欲表達的知識。這樣的學習評估方式可分為兩種型態：形成性評量(formative evaluation)和總結性評量

(summative evaluation)。形成性評量是在學習者的學習過程中，用來評估學習者的學習成果，形成性評量主要的目的在於分析及診斷學生的學習迷失，其範圍較小，測驗題目限於教學的特定內容，例如：在學習者學完一小部份概念後，即對

(13)

學習者進行形成性評量，依據評量結果對學生進行補救教學，這樣的評量只是用來判斷教學活動是否達到學習目標，以了解教學方式是否有效，透過形成性評量結果了解學習者的學習狀況，同時進行診斷、給予適當的補救教學。而總結性評量是來評定學生的學習狀況，就如同是課堂的期末考一般，其目的較偏重在學生成績等級的評定，不在於發現學生學習困難和改進教學。為了發掘錯誤概念的關聯性，本研究試著從大量的作答資料中，找出學習者常犯的介係詞錯誤概念之關聯性，並配合預防教學，在下一概念錯誤發生之前進行預防，減少錯誤發生的機率。

資料探勘(Data Mining)，是一種從大量資料中找尋有價值資訊的搜尋方法。

透過資料探勘的方法可過濾多餘的資料及萃取有用的資訊或是有關聯的法則資訊。將資料去蕪存菁，瀝沙撿金地再分析，以了解事情發生的潛在原因，並且具預測的功能，可藉由歷史資料來預測未來，來作為決策的參考依據(Lee and

Siau,2001)。在人們學習的過程中，可能對某類型的事物或某概念，會再三的犯錯，在學習者常犯錯的過程與錯誤型態中，或許存在不可知的關聯性。因此，我們試著從學習過程中，發掘出學習者常犯的錯誤概念之關聯性，以作進一步的預防動作。

關聯式法則(Association Rules)是指在龐大的資料庫中某些物項間彼此的關聯性，其最初的研究在於分析市場購物籃資料(Market Basket Data)的交易記錄，

藉由分析顧客之購物行為，找出相關商品集間彼此的關聯性，作為商品在儲架上

(14)

的擺放及進貨的參考，此資訊有助於提昇商品的競爭力以增進商品銷售週轉率提升利潤。關聯式法則的形式是簡單又易懂，目前有許多領域已利用此技術來幫助其作資料之分析及決策之制定。由於關聯式法則是用來找出物項之間彼此的關聯性，非常適合來幫助我們找出學習者常犯的學習錯誤概念之間的關聯性，以對學習者進行預防教學。

在英語的句法中，介係詞的用法是非常重要的一部份。以英語作為第二語言(English as a Second Language/English as a Foreign Language, ESL/EFL )的學生普遍認為介係詞(Preposition)的用法常讓他們感到困擾(Jabbour-Lagocki, 1990;

Vriend, 1988)。在 Vriend(1988)的研究中也曾提及，以英語作為第二語言(ESL/EFL ) 的學生普遍省略或誤用英語介係詞。大部分的英語介係詞具有多重的含意，在英語中是最活躍的詞類。由於英語介係詞的概念容易讓學生感到學習困難，且容易犯錯，所以適合用作為本研究預防教學的應用，來幫助學習者學習英語介係詞。

1.2 研究目的

本研究的目的，首先，發展一套階層式概念圖，將英語介係詞依概念用法分類，而非以英語介係詞本身分類，所以對同一介係詞而言可能會被分類成有兩種以上的概念用法，然後根據英語介係詞階層式概念圖設計介係詞試題，一個概念一個試題，並對試題難度作難易度控制，儲存作答資料進行資料探勘，找出學習者常犯錯的介係詞錯誤概念之關聯法則。接著，再利用所挖掘出來的關聯法則

(15)

為基礎，來設定法則啟動規則，提供不同教材，進行預防教學實驗，以驗證本研究所提的預防教學之有效性。

本研究的主要目的分別條列如下：

1. 發展以階層式概念圖為架構來對英語介係詞概念進行分類和建構一套輔助教學系統。

2. 利用關聯式法則(Association Rules)來找出英語介係詞錯誤概念之間的關聯性。

3. 利用統計檢定對預防教學進行假說驗證，並探討試題難易度對預防教學的影響效果。

1.3 論文架構

本論文研究架構在於，設計一個概念圖作為分類的依據，以英語介係詞為應用，找出常犯的英語介係詞錯誤概念之關聯法則。根據英語介係詞階層式概念圖來設計一般教材和預防教材的呈現，配合關聯法則和試題難易度，請受測者實際操作教學系統，進行預防教學實驗，收集實驗相關數據，用以驗證介係詞錯誤概念之關聯法則和預防教學的有效性。

本論文的主要章節可分為：文獻探討、研究方法、第一階段法則挖掘實驗、

第二階段預防教學實驗以及結論與未來發展，其各章節內容概述如下：

(16)

第二章文獻探討

彙整與本研究方法相關的文獻，整理並闡述其提出方法，同時指出本研究使用的研究方法。

第三章研究方法

本章節主要的目的為描述本研究的研究方法，介紹本研究用以區分英語介係詞概念的階層式概念圖架構和系統架構。說明所使用的資料探勘技術-關聯式法則，來發掘出學習者常犯的介係詞錯誤概念之關聯性和說明預防教學的做法

第四章第一階段法則挖掘實驗

在本章節中將會說明挖掘關聯法則的程序。首先，描述用以發展英語介係詞試題網頁和資料探勘的技術和設備，並說明試題難易度控制的方式。接著，進行試題在有難度控制和無難度控制下的法則挖掘，以作為第二階段預防教學實驗的法則啟動規則基礎。

第五章第二階段預防教學實驗

本章節將會說明預防教學的實驗程序，定義實驗中的組別、

操弄因素，並說明不同組別在不同操弄因素下所呈現的教學內容及操作方式。最後，將實驗所收集的相關數據，進行統計分析，利用統計假說檢定來評估實驗結果，驗證檢定結果和發現的事實，並進一步討論和解釋實驗結果背後發生的原因。

(17)

第六章結論與未來發展

針對本研究做結論，以及提出未來進一步的發展研究方向。描述本研究所挖掘的關聯法則和經過實際建置教學系統且透過預防教學實驗設計所得到的最後結果，同時提出本研究在未來可改進或進一步發展的研究方向。

本論文的研究流程如下

文獻探討挖掘關聯法則教學實驗設計結論與討論

確認研究目的

圖 1.3：研究流程圖

(18)

第二章、文獻探討

在本章節中，將提出與本研究相關的文獻，依序從補救教學、關聯式法則、

英語介係詞和概念圖的應用一一說明，並敘述本論文所使用的相關研究方法。

2.1 補救教學

正面而有效的學習對於人的自我成長與進步都是重要且需要的，唯有藉著不斷的學習才能促進個人不斷的成長與進步。但個人卻可能因為天賦能力之不同而有程度的差異，因為某種因素而使他們產生了學習的困難。

教學不是將教材運用各種方法，傳遞給學生便算了事。還需要再教學和評鑑以後，審查情形，然後作合適的措施。如果教學沒有達成目標，便需要檢討和瞭解失敗的現象與原因，以便改進。在一般教學模式中，除了起點行為是瞭解學生作為設計和施教的依據外，下面有一串箭頭所構成的反饋線(feed-back loop)，

便是檢討教學程序和瞭解學生學習。這些反饋作用及改進措施，便是診斷和補救教學(方炳林，1992)。

而補救教學(Remedial teaching)，是指對學生學習失敗的原因加以診斷之後，作有效的教學措施以謀補救(高廣孚，1997)。補救教學具有事後幫助的功能，

大多是在對未達成教學目標者或學習有困難者幫助他再學習(陳長春，1992)，補救教學的重要理念就是為了實踐「帶好每一位學生」而實施的教學措施。

(19)

補救教學是一種「評量-教學-再評量」的歷程，期望實施後學生的學習進度可以跟的上原班級的教學進度。其歷程大概分三階段(張新仁，2000)。

1. 轉介過程

補救教學的首要工作在篩選、診斷以選擇需接受補救教學的學生。

2. 正式評量

評量的意義：依據教育目標，分析學生學習行為的所有措施之方法，其重點在於瞭解學生的學習過程中，可能產生的學習困難、找出問題的癥結以對症下藥，進行補救教學。評量的來源大致包含：學習困難報告、教室觀察記錄、心理評量等。依據各評量方式，可以幫助教師隨時隨地瞭解學生的學習，診斷出學習的困難，以進行事後補救的教學而達到教學目標。

3. 教學

補救教學是一種診療教學模式，亦稱為臨床教學模式，在事先選擇好接受補救教學的對象後，再進行教學，其重點是在瞭解學生的學習困難後，精心設計課程內容慎選教學模式，而符合學生個別需求的教學。

由於，目前補救教學幾乎都是屬於事後的補救教學，往往必須經過測驗之診斷後才能發覺學習者的錯誤，然後再針對學習者的錯誤進行補救。就品質管理的概念而言，品質控制就是要把不符合標準的成品找出來後，進行補救行動：決定重做、補修或報廢。而品質保證除了把不符合標準的成品找出來之外，還要系統追溯不符標準之緣由，並採取適當措施加以改善使不再重犯。品質控制是只在

(20)

事情發生之後去控制品質，品質保證則是在事前確保質量達到所需的水準(謝家駒，1996)。若是能事先確保學習品質，就可以減少補救的行動。

由於，補救教學的重要理念就是為了實踐「帶好每一位學生」而實施的教學措施，經過評量診斷並非所有學生都須進行補救的動作，只有某部份學生需要進行補救教學，對於不需要補救動作的學生，必須放慢腳步等候通過補救教學的學生，才能同時進入下一階段的學習。為了減少學習較快學生的等待時間和降低學習較慢學生的補救校正活動，我們提出一「事前補救」的預防教學，預測錯誤的發生，在錯誤發生之前，先給予預防錯誤的預防教學，以減少錯誤的發生，來增加學習成效、學習品質，達到事半功倍的效果。

2.2 關聯式法則

資料探勘(Data Mining)是最近相當熱門的研究領域，這項研究主要目的是從大量的資料中找出有用的隱藏資訊，這些資訊事先並不知道，透過這些資訊將有助於資訊管理，並可以提供有用的決策參考。資料挖掘是利用各種的分析工具，

能夠自動地在資料庫或資料倉儲中找尋並分析資料，最後將結果以視覺化的方式展現出來。

透過資料探勘的方法可過濾多餘的資料及萃取有用的資訊或是有關聯的法則資訊(Lee and Siau, 2001)。一般說來，資料探勘主要步驟不外乎以下三個步驟：

收集資料、減少資料、尋找有價值的資訊。目前資料探勘的工具是利用高等統計、

(21)

挖掘交易/關聯資料庫技術、人工智慧、決策樹、遺傳基因演算法、視覺化等技術來探勘資料。而關聯式法則(Association Rules)則是資料探勘領域中發掘資訊間之關聯性最重要研究(Tseng, 2001)。

關聯式法則在資料探勘的技術中佔很重要的一環，這個技術是在龐大資料庫中找出物項之間的關聯性，一般比較常用在商業上的應用，我們可以經由分析每一筆交易資料及顧客在購買商品的行為，找出關聯規則，根據這些規則的關聯性，可作為商家進貨或商品上架的參考，以提供顧客購買商品的方便性，提高商品的流通性，進而提升商店的服務品質，使商店因此獲得更高的銷售利益。關聯法則有名的實例是美國超市 WORLDMART 所發生的啤酒與尿布的例子(彭文正，2001)，在禮拜四，消費者通常同時購買尿布和啤酒，利用這個關聯規則，

將自製品牌的尿布和啤酒放在一起，可以大大提高獲利。

關聯式法則(Association Rules)是由 Agrawal (1993)等人提出，挖掘關聯式法則是指在資料庫中挖掘出具有這種形式的規則：由於某些事件的發生而引起另外一些事件的發生(林傑斌等，2002)。依照 Agrawal 等人所設計的技術觀點來看，

主要可分為兩個步驟：

1. 找出所有可能的強物項集合(Large Itemsets)，且要大於或等於所設定的最低支持度(min-support)

2. 分析所產生的強物項集合(Large Itemsets)，產生適當的法則

(22)

圖 2.2：Apriori 演算法(Zaki et al,1996) L1={large 1-itemsets };

for (k = 2; Lk-1 ≠ ∅ ; k + +) Ck = Set of New Candidates;

for all transactions t ∈ D for all k-subsets s of t

if (s ∈ Ck) s.coun + +;

Lk = {c ∈ Ck | c.count ≥ minimum support};

Set of all large itemsets = ∪k Lk ;

強物項集合的產生，一般，都是從單一物項開始，先利用演算法找出所有可能的候選項集合(Candidate Itemsets)，再從這些候選項集合中找出真正的強物項集合(Large Itemsets)，而下一階段的開始就是將上一階段的強物項集合排列組合，再重新分析，如此循環下去。Apriori 演算法是關聯式法則中較具代表性的，平均每次的循環，Apriori 只需要掃描資料庫一次即可完成。

在法則建立階段，是指強物項集合(Large Itemsets)已經產生之後，將物項與物項之間的關聯以法則的形式表現出來，而在此部份，我們利用支持度

(Support Level)和可信度(Confidence Level)架構來建構出關聯式法則。支持度 s%

必須大於或等於使用者自訂的最小支持度(min-support level)；可信度 c%必須大於或等於使用者自訂的最小可信度(min-confidence level)。若是符合以上兩種限制將可以被視爲較好的關聯式法則。

(23)

可信度，代表此法則的正確率有多高，可信度愈高愈值得信賴；而

支持度，代表此法則的適用率有多高，支持度愈高表示法則常被使用(Berson et al, 2000)。

資料探勘應用在教育教學上的例子，使用資料探勘技術發掘課程最適性選修之學生(陳垂呈、賴春松，2002)，是藉由關聯規則及分類分析法兩種資料探勘的技術，來發掘某一課程最適合選修的學生。探討資料探勘(data mining)技術在協助學生選修課程、及支援學校當局了解學生選課傾向等方面的研究，從龐大的歷史選課資料中，擷取出隱藏在學生選課資料間的相關資訊，進而能發掘出某一課程最適性選修的學生，除了可支援學校選課系統篩選出某一課程最適合選修的學生之外，並且可對適合選修的學生進行推薦，以達成學生都能選修到其有興趣的課程。

關聯式法則之相關應用(楊文昇，2001) 在商業之應用上：

(1) 在進貨及存貨的管理方面，可藉由分析貨品的銷售情形及其關聯性做適當的措施。

(2) 在超市櫥架的擺設方面，可藉著分析以往顧客的購買行為以作為商品擺設的參考。

(3) 在商品促銷的方面，可經由分析各個顧客的消費習性寄出特別設計的廣

(24)

告郵件，以促進其銷售的成長。

(4) 在市場趨勢的預測方面，可提早預知未來的方向，以取得市場競爭中的優勢。

(5) 在電子商務的交易發展方面，分析進站參觀及購物的瀏覽行為，可提供經營網站者很好決策的參考。

在學術之應用上：

(1) 在網路教學方面，可藉由分析學生學習情形，改善相關設計以提升其教學品質。

(2) 在天文科學方面，可藉由分析太空人在太空無重力下之生活情形，以做為未來殖民外太空的根基。

在醫療之應用上：

(1) 在醫院管理方面，可分析藥物使用量及方法是否有異常，此將有助於醫藥管理及藥品成本控制。

(2) 在醫師診斷方面，可分析何種療法或療程有較好的效果，並分析各病例特徵間之關聯程度，此將有助於醫師的診斷。

(3) 在疾病的防治方面，可提早發現某些地區或某工作階層有羅患某種疾病的趨勢，發現類似的原因與趨勢，將有助於民眾諮詢保健且防患於未然。

(25)

在災害防治之應用上：

(1) 在地震偵測方面，可經由相關數據之分析，提早示警大地震來臨的可能性以降低損失及傷亡。

(2) 在天氣預測方面，可藉由分析溫度、濕度、風力等各種不同因素間之關聯性，以做更詳細準確之氣象報導。

在其他應用上：

(1) 在防治犯罪方面，可經由分析各刑案的關聯性以提昇破案率，幫助警方打擊犯罪以改善治安。

(2) 在都市規劃方面，幫助政府做一完善的規劃，使人民能享有一個優質的生活環境。

由以上關聯式法則在各領域所應用的例子得知，關聯式法則是用來找出物項之間彼此的關聯性，非常適合來幫助我們找出學習者常犯的學習錯誤概念之間的關聯性，以對學習者進行預防教學。

2.3 英語介係詞

在 Cheng (1993)提出的研究報告中表示，台灣的大學生在面對以英文撰寫的技術文件時普遍都有閱讀上的困難，根據來自於大學一年級學生的研究報告和過去的研究發現(Cheng, 1993)，學生感到學習困難的最大原因是很容易將英語介係詞混淆。Jin (1982) 曾提及，介係詞不但可以和名詞組成介係詞片語，還可以和

(26)

名詞、形容詞、動詞構成許多片語。

江玫嬛(1995)指出中國學生使用英語介係詞常犯的錯誤，大部分可歸於母語轉移以及介於中文和英語介係詞的進化發展形式。大致上來說，母語的移轉是由於中文所使用的介係詞少於英語的介係詞，中國 ESL 學生無法清楚辨識多種英語介係詞隱含的語意。而進化的發展的介係詞錯誤是因為對英文的文法機能沒有整體正確的認識。用我們的語言來解釋英文語意間複雜或簡單的用法是很難表達的，一個介係詞與不同的單字或詞句搭配，可能延伸出許多種意思和片語，又有些介係詞，雖然意思相似，但必須配合句子或上下文才能解釋出它的意思。

因此我們利用資料探勘(Data Mining)中的關聯式法則(Association Rules)的方式來發掘出，學習者在介係詞上所發生的錯誤型態之關聯性，來預測錯誤發生的型態而進行事前的預防教學。

英文測試項目分析是英文老師必須熟悉的一相當複雜程序，英文測試起初被建構為加強語言學習和激發學生學習的一個手段，也是評估學生成績的一個方法(Li, 2000)。衡量的方法有兩種，鑑別度(discrimination index, DISCR)和難易度

(facility value, FV)。難易度(facility value, FV)一般是被表示為答對人數的百分比，顯示特定的項目在測驗中多容易或多困難。FV 值介於 0.3~0.7 是可接受的難度，FV 值小於 0.3 表示測驗太難；FV 值大於 0.7 表示測驗太簡單，FV 值為 0.5 是最理想的。鑑別度(discrimination index, DISCR)是用來作鑑別項目，以區分高分群和低分群的差異，高分群恆高分，低分群恆低分，這才算具有鑑別度。當

(27)

DISCR 值為 1 時，表示可完美地區別；當 DISCR 值為 0 時，表示無法透過任何方法去區別；當 DISCR 值為-1 時，表示徹底用了錯誤的方法來作區別。測試的結果不只可以指出常犯錯誤型態，還可以知道錯誤的原因，提供英文老師很多有價值的資訊，改善教學內容、方法和重點。本研究中，並不考慮利用試題來對學生作鑑別，只利用難易度的衡量方式，控制試題的難易度，來分析試題難度控制與否的情況下，對所挖掘的關聯法則會不會使教學實驗有所影響。

2.4 概念圖的應用

概念圖(Concept)為階層式的圖形，用以表達某一領域的知識結構。概念圖的基本組成要素有：概念及連結，每個概念可稱為是一個節點，這樣的節點代表某一片段或部份的觀念知識，節點之間利用連結及箭頭方向來表示概念之間的學習先後次序(圖 2.4)。概念圖往往以一個或若干個「核心概念」為主題，再與其他相關概念節點延伸連結，形成某一主題知識的結構圖(劉明洲等，1999)。

在以階層式概念圖為架構的教學系統中，概念與概念之間可能存在著不同的兩種關係(王惠美，2002)：

(1) 概念繼承：

概念之間具有學習上的先後次序，也就是利用實線及箭頭方向表示的概念關係，如在圖 2.4 中，概念 B 分別與概念 D 和概念 E 的關係，透過概念 D 與概念 E 的學習，可完成概念 B 的學習。

(28)

(2) 概念關聯：

概念之間很難界定其學習的先後次序，也就是利用雙箭頭虛線表示的概念關係，如在圖 2.4 中，概念 B 與概念 C 皆包括在概念 A 內的中，他們之間具有一種相輔相成的學習關係。

連結 A

B C

D E

概念節點

連結的箭頭方向

圖 2.4：階層式概念圖之組成要素

在階層式的概念圖中，可以明確表達出整個系統的概念學習先後順序，引導學生閱讀教學網頁，一個學習概念可能使用一個或一個以上的教學網頁來呈現其欲表達的知識。在本研究中，以階層式概念圖為架構，將每一介係詞概念用法視為一獨立概念，去設計介係詞概念圖，把一介係詞概念當作一個物項，作為資料探勘的前置處理，方便挖掘關聯法則的進行。

2.5 文獻探討總結

總結上述的文獻探討，本論文將進行的研究如下：

(29)

(1) 以概念圖為架構，建構英語介係詞階層概念圖，將一介係詞概念用法視為一物項，作為資料探勘的前置處理。

(2) 應用資料探勘的技術-關聯式法則，挖掘出學習者常犯的介係詞錯誤概念關聯，根據挖掘的關聯法則來作為預防教學法則啟動規則基礎。

(3) 依據介係詞錯誤概念之法則啟動規則，提供適性化的預防教學，減少錯誤的發生。

(30)

第三章、研究方法

本章在各小節分別描述本研究所使用的研究方法。在 3.1 小節中說明以階層式概念圖為架構的介係詞概念分類模式。在 3.2 小節中說明本系統架構圖，在系統架構分成兩大階段，第一階段為法則挖掘，第二階段為預防教學。3.3 小節舉例說明 Apriori 演算法挖掘關聯法則的過程以及法則啟動方式。3.4 小節說明預防教學的方式以及一般教材與預防教材設計的方式和比較。3.5 小節為本章作個總結。

3.1 介係詞階層概念圖

概念圖是一階層式的圖形，由概念和連結所組成的，每個概念就是一個節點，節點配合連結和箭頭方向來表示概念之間的關係，本研究即利用階層式概念圖架構來分類各介係詞概念所扮演的角色。

以階層式概念表格作為英語介係詞呈現的基本架構(圖 3.1)，將介係詞分成數個概念階層 Level 0 ~ Level 3，在 Level 1 概念階層依其使用方式分成位置、方向、距離與方位、時間、修飾語五個類別(鄒啟明, 2000)，在各個類別中，又依使用特性再細分成數個概念階層(Level 2)，而 Level 3 階層概念即為 Level 2 階層概念所包括的子概念，也是最基層的概念。

我們稱各個概念階層包括的所有概念為概念群，概念群內又包含數個概念

(31)

群，且概念群是由數個概念或概念群所組合而成。在不同概念群中所包含的概念裡，一概念可能因為用法的關係所以被分屬在不同的概念群中，而這樣的特性只會發生在最基層的概念，也就是說，在英語介係詞中，每個介係詞可能具有一個或一個以上的用法，例如：介係詞「at」可以用來表示時間，也可用來表示地點、

目的或方向，因此，分屬於不同 Level 1 概念群內的概念群間，可能互相具有關聯，這種情況只會發生在最底層的概念(Level 3)；就像是子概念“at＂、“in＂、

“on＂除了屬於『距離和方位』概念群，亦屬於『時間』概念群。

圖 3.1：英語介係詞階層式概念圖

由於，一個介係詞可能在不同的情況下，會有不同的用法，所扮演的角色也會因此不同，例如「at」這個介係詞，後面接時間的時候，是屬於時間概念的介係詞，而當「at」後面所接的是地點時，它是屬於位置或距離方位的介係詞。

為了正確區分出每個介係詞的角色，我們依照每個介係詞的概念用法去做區隔，

(32)

將每個介係詞依照所屬的概念去設計試題，一個概念一個題目。若有 n 個最底層的概念(Level 3)，其將會有 n 個題目。在我們研究下所呈現的最底層介係詞概念有 40 個，代表我們會有 40 題試題。

3.2 系統架構圖

系統架構分成兩大階段，第一階段為法則挖掘，根據作答錯誤的資料進行資料挖掘，找出錯誤概念間的關聯法則。第二階段為預防教學，根據第一階段所挖掘的關聯法則，進行預防教學。

試題評量資料庫關聯性分析

之系統作答錯誤之資料

作答資料

法則挖掘預防教學

預防教材

後測教是學評量

法則啟否動規則作答資料

前測評量一般教材

圖 3.2：系統架構圖

在法則挖掘階段，利用 Apriori 演算法找出介係詞錯誤概念之關聯法則。採取主從式架構來建置英文介係詞試題系統，儲存作答資料於資料庫中，從資料庫中提取作答錯誤的介係詞概念，以供關聯性分析系統作資料探勘，挖掘出介係詞錯誤概念的關聯法則。

在預防教學階段，根據第一階段所挖掘出來的介係詞錯誤概念之關聯法則

(33)

為法則啟動規則基礎，依前測作答資料來判斷是否符合關聯法則的啟動規則，依照法則啟動規則來給予一般教材或預防教材，再對所預防的概念進行教學評量，

瞭解受測者的學習成效。

3.3 挖掘關聯法則

關聯式法則是用來發掘物項之間彼此的關聯性，找出由於某些事件的發生而引起另外一些事件的發生的規則，非常適合來幫助我們發覺出學習者常犯的學習錯誤概念之間的關聯性，找出哪些錯誤概念的發生會導致另外一些錯誤概念的發生規則，以針對未來有可能發生錯誤的概念進行預防教學，減少錯誤發生的機率。由於我們的受測者都是大學生，至少都具備基礎的英語程度，所以我們並沒有先給予教材瀏覽，而直接作試題評量進行測驗。

在第一階段法則挖掘，試題設計是以英語介係詞階層式概念圖(圖 3.1)為設計基礎，一個概念一個試題，共有 40 個概念所以有 40 題試題。然後參考各英語文法書籍、參考書和教科書(汪永棋，1998；陳琉琍，1994；賀立民，

1994；廖曄嵐，1993；蘇生豪，1993)，配合我們所欲表達的介係詞概念用法設計介係詞試題。

記錄作答資料，儲存在資料庫中。每個題目代表一個概念，即每個題目代表一個物項(item)。每位受測者完整的作答記錄為一筆物項集合(itemset)。利用 Apriori 演算法，針對答錯的題項進行資料挖掘，找出介係詞錯誤概念的關聯法

(34)

則。

以下我們利用簡單的例子，來看 Apriori 演算法的處理過程：若資料庫中有四筆作答記錄，每筆作答記錄都具有不同的 SID，而 item 代表題項，共有五題

(1~5)。提取答錯的記錄，整理如下所示：

表 3.3-1：提取答錯的記錄格式 SID Items

1 1,3,4 2 2,3,5 3 1,2,3,5 4 2,5

利用圖3.3，可以很清楚的看到Apriori演算法的運作過程，它先以所有作答錯誤的題目當成第一階段的候選物項集合(Candidate Itemset)，若是大於或等於使用者自訂的最小支持度(min-support )，在此設定最小支持度為0.5，即物項出現次數須為兩次(4*0.5=2)，才可成為第一階段的強物項集合(Large

Itemsets)，從圖3.3可知有1、2、3、5四個物項符合限制；接著，進入第二階段循環，候選物項集的產生是由上一階段的強物項集合做排列組合，一共產生了{1,2}、{1,3}、{1,5}、{2,3}、{2,5}、{3,5}六個候選物項集C2；依此類推，經過不斷的排列組合及資料庫存取，直到不再產生出新的候選物項集合為止，將可在最後產生{2,3,5}的強物項組合L3。

(35)

圖 3.3：Apriori 演算法產生候選集合及強物項集合

在法則建立階段，是指強物項集合(Large itemsets)已經產生之後，要如何將物項與物項之間的關聯以法則的形式表現出來，而在此部份，我們利用 Agrawal 等學者的 Support-Confidence 架構來建構出關聯式法則(Agrawal et al, 1993; Agrawal and Srikant, 1994; Zaki et al, 1996)。

將關聯法則整個流程內容做一詳細定義：

假設I = {i1,i2,..,im}，表示各題項的集合，每一題項為一介係詞概念。並設D 爲每一筆作答錯誤題項的紀錄集合，且每筆作答錯誤題項的紀錄T所包含的就是 一群錯誤題項的集合，一個錯誤題項即代表一個錯誤概念，且所有在T出現的題

(36)

項都是可以被I所涵蓋的。而在一般的關聯式法則表示上，設定X和Y都是一群作 答錯誤題項的集合，而X和Y所包含的題項都是可以在I中所找到，但X∩Y必須 爲Ø，如此將可以設定一法則格式為X=>Y，X為法則的前項(antecedent)，Y為法則的後項(consequent)。

各題項的集合I = {i₁,i2,..,im}，m=40

每一筆作答錯誤題項紀錄的集合D = {t₁,t₂,…,t_n}，t_i ∩ I (1<= i <=n)

設定

X 和 Y 都是一群錯誤題項的集合 且 X ∩ I，Y ∩ I，X∩Y = Ø

則可得一法則：X=>Y

為了進一步說明關聯法則的正確度和支持度，引入了可信度(Confidence Level) 和支持度(Support Level)兩個概念。

支持度(Support Level)：S = (X∪Y) / D

表示用這條規則可以推出百分之幾的目標，即這一原因對於這一結果的重要程度。代表實驗因子也就是資料物項集合(Data Itemsets)在資料庫中所佔有的比例(s%)，若佔的比例較高，則顯示此物項集合應是一個值得重視的討論要項。例如：答錯第 1、2 題佔總資料庫的比例為 70%。

可信度(Confidence Level)：C = (X∪Y) / X

(37)

表示這條規則的正確程度，代表被實驗的因子在主要因子中所佔有的條件比例程度，例如若要探討答錯第 1 題的人是否會同時答錯第 2 題，可能會發現答錯第 1 題的人裡頭有 90%會同時答錯第 2 題，這就代表兩因子之間的信賴程度，可信度愈高代表法則愈正確。

支持度 s%大於或等於使用者自訂的最小支持度 (min-support)；可信度 c%

大於或等於使用者自訂的最小可信度(min-confidence)。若是符合以上兩種限制門檻將可以被視爲較好的關聯式法則。法則前項(antecedent)、法則後項(consequent) 可由一個或多個物項條件組成，當法則前項全部為真時，法則後項也為真。法則後項一般為單一物項條件，單一物項條件會比多個物項條件來得好，尤其是在預測購物商品物項方面。法則後項為單一物項條件時預測的效果會比法則後項為多個物項條件的預測效果好(Berson,et al,2000)，因為當我們作預測時，會對法則後項比較在意，若是法則後項為多個物項所組成時，會增加我們做決策的困難度和複雜性，另一方面當在相同支持度(support)的物項集合中，法則後項為多個物項條件時，一般來說其法則的可信度(confidence)相對於法則後項為單一物項條件的法則可信度來的低，可信度代表此法則的正確程度，可信度愈高代表法則愈正確愈值得採信。

根據前面例子所產生的強物項{2,3,5}，排列組合後所可能產生的法則為：2->3,5、3->2,5、5->2,3、2,3->5、2,5->3、3,5->2，六個法則。再一一計算此六個法則的可信度，是否達到使用者自訂的最小可信度，假設我們設定最

(38)

小可信度為 0.8，若符合門檻，即表示此關聯法則是較好的法則，可信度愈高代表法則的正確度愈高，假設有 2,3->5、2,5->3、5->2,3 三條法則符合最小可信度。

2,3->5、2,5->3 此兩條法則，表示在第 2、3、5 題集合中，當第 2&3 題同時出錯時，會有第 5 題跟著出錯的現象；而當第 2&5 題同時出錯時，會有第 3 題跟著出錯的現象。再來看 5->2,3 此法則，表示當第 5 題出錯時，會有第 2&3 題跟著同時出錯的現象。接著再將題號比照英語介係詞階層式概念表格(表 3.3-2)，

即可得知 2、3、5 分屬哪個概念。如表 3.3-3 所示：

表 3.3-2：英語介係詞階層式概念對照題號表格 Level

0

Level 1

Level 2 Level 3 對照題號

at 24 in 33 on 15 towards 28

與接觸物相關

to 37 into 26 Out of 31

inside 39 方向動作的目的

outside 22 next to 7

具附近性質

near 40 at 14 in 4 介係詞位置與接觸物相關

on 23

(39)

表 3.3-2：英語介係詞階層式概念對照題號表格(續) Level

0

Level 1

Level 2 Level 3 對照題號

after 16 by 18 before 8

前後順序

in 25 at 6 in 35

某一特定時間

on 19 after 38 since 20

持續

from 2 for 21

in 9 時間一段時間

during 32 to 11 in 13

與接觸物相關

on 36 from 17

off 1 Away from 29

距離和方位與相對位置有關

Out of 12

from 10 of 27 by 3

材料變化與表示方法

with 34 besides 30 介係詞修飾語與語意相關

except 5

(40)

表 3.3-3：第 2、3 和 5 題概念對照表題號介係詞階層式概念

2 時間_持續_from

3 修飾語_材料變化與表示方法_by 5 修飾語_與語意相關_except

R2

R1

R1：2,3->5 表示，

2、3﹝時間_持續_from & 修飾語_材料變化與表示方法_by﹞的概念與 5﹝修飾 語_與語意相關_except﹞的概念彼此間有關聯性。表示當﹝時間_持續_from &

修飾語_材料變化與表示方法_by﹞的概念同時發生錯誤時，會引起﹝修飾語_與語意相關_except﹞的概念出錯，其發生的機率有八成以上。

R2：5->2,3 表示，

5﹝修飾語_與語意相關_except﹞的概念與 2、3﹝時間_持續_from & 修飾語_

材料變化與表示方法_by﹞的概念彼此間有關聯性。表示當﹝修飾語_與語意相關

_except﹞的概念發生錯誤時，會引起﹝時間_持續_from & 修飾語_材料變化與 表示方法_by﹞的概念同時出錯，其發生的機率有八成以上。

3.4 預防教學

關聯法則的形式是指當法則前項發生也會引起法則後項跟著發生的現象，

而在教學上有些學科是必須具有先備知識的要求才能進入下一階段的學習，例如數學，得先學會加減運算之後才能進入乘除運算的課程；但是也有些學科並沒有

(41)

先後順序之分，例如本論文所應用的例子，英語介係詞，並沒有一定的規定得要先學會哪個介係詞概念才能進入更深入的介係詞概念，每個介係詞概念算是獨立的物項。所以利用關聯法則中法則前項和後項，來界定在第一階段所挖掘的關聯法則中哪些介係詞概念是屬於前項或是後項的概念，因為我們只對後項錯誤概念進行事前預防，對於前項錯誤概念並沒有作補救動作。

先前一般補救教學的做法，必須對全部 40 個介係詞概念進行測試和診斷才能對需要進行補救的介係詞概念作補救動作；而預防教學的做法並不需要對全部的介係詞作測試，只需要針對前項部份的介係詞概念作測試，瞭解其錯誤發生的機率，再根據錯誤概念關聯法則，找出會被引發錯誤的後項介係詞概念，對可能發生錯誤的後項介係詞概念來作事前的預防措施，以求降低後項介係詞概念錯誤的發生機率。

本論文預防教學的重點是著重在法則後項介係詞錯誤概念的預防，對於法則前項介係詞錯誤概念並沒有作事前預防補救的動作，只是利用法則前項來作預測找出法則後項的關聯性。由於受測者都是大學學歷以上，至少都具備基礎的英語程度，所以在我們實驗流程上並沒有先給予教材瀏覽，而是直接作試題評量進行前測，再根據前測結果和關聯法則提供適當的預防教學。

在第二階段預防教學的前測評量，試題的設計是以第一階段所挖掘的關聯法則的前項概念為出題的範圍，將與法則前項概念相同的第一階段的試題作為預防教學前測評量的試題；而預防教學的後測評量則以法則的後項概念為出題的範

(42)

圍，以瞭解所要預防的後項概念是否有明顯的學習成效。

透過前測試題的作答資料，來判斷是否符合第一階段所挖掘的介係詞錯誤概念關聯法則，若是法則前項概念發生錯誤符合法則的啟動規則，給予法則後項的預防概念教材，對可能會發生錯誤的介係詞概念進行預防；如果法則前項概念沒有發生錯誤，表示法則並不會被啟動，後項概念不需進行預防，仍給予一般概念教材。

教材設計分成一般教材和預防教材。預防教材的內容，文法說明較為簡潔，

解釋較淺顯易懂，除了提供例子說明用法之外，並提供圖例輔助說明介係詞的用法。而一般教材的內容，文法說明較為深入，所涵蓋的解釋較廣，並提供例子輔助說明介係詞的用法。相較於一般教材，預防教材主要目的以淺顯易懂為主，所以內容較簡單不比一般教材深入。兩者之間的差異整理如表 3.4

表 3.4：一般教材與預防教材之比較表

文法說明例子

一般教材解釋較為深入例子數量較多

預防教材解釋較為淺顯、簡單易懂例子數量較少並有圖例說明

而教材的內容呈現是以法則所屬的概念為內容，例如有一法則 X->Y，則以後項 Y 概念群的概念為教材內容，讓學習者對此介係詞概念用法有全盤、整體性的認識和學習。

(43)

3.5 結論

在本研究模式中，首先，以階層概念圖為基礎將介係詞依每一介係詞概念用法將介係詞概念分類分成五大類：距離和方位、位置、時間、方向、修飾語等五大介係詞概念，再根據每一大類介係詞特性，細分其子概念，大致上分成 40 個子介係詞概念，將 40 個介係詞概念當作獨立的 40 個物項。接著，透過關聯式法則中的 Apriori 演算法，挖掘出學習者常犯的介係詞錯誤概念之關聯法則。第一階段介係詞錯誤概念關聯法則挖掘出來之後，再進行第二階段的預防教學，根據評量前測的結果來判斷是否會啟動關聯法則，依照啟動規則提供一般教材或預防教材給受測者瀏覽，最後進行教學評量後測，以瞭解預防教學對受測者所帶來的學習成效。

(44)

第四章、實驗第一階段-法則挖掘

本研究實驗分成兩階段，第一階段為法則挖掘、第二階段為教學實驗，第一階段法則挖掘在第四章作詳細說明，而第二階段預防教學實驗和實驗結果會在第五章中一一說明。

第一階段為法則挖掘，從大量資料中挖掘出介係詞錯誤概念之關聯法則，

因為有兩組難度不同的試題，一組為有難度控制，試題難度介於難度適中範圍

(FV=0.3~0.7)；另一組為無難度控制，不控制試題難度範圍，包含難度偏難、適中、偏易三種類型的試題，所以產生了兩組關聯法則，以瞭解試題在有難度控制下和無難度控制下所產生的關聯法則是否會對第二階段的預防教學實驗效果有所影響。

4.1 試題難度

試題的難易度計算方式，是根據此試題答對的人數佔全體受測者的比例，

難易度(facility value, FV)計算公式：FV = n / N（n：答對此試題人數，N：全體作答人數），難易度值範圍會介於 0~1 之間，數值愈高代表試題難度愈簡單，反之，數值愈低代表試題難度愈困難。一般難易度的衡量方式如表 4.1

表 4.1：難易度衡量表

FV 值 0~0.3 0.3~0.7 0.7~1

難度偏難適中偏易

(45)

由於試題的難易度可能會受題意與試題選項所影響，所以試題避免使用艱深的生字，盡量設計常用的單字來表達題意。

在試題無難度控制組中，試題選項的設計是以每個概念層下相同的概念群中的介係詞為試題選項，以了解受測者是否真正清楚同一概念下不同介係詞的用法。例如：「時間」概念下「某一特定時間」概念群中的三個介係詞「at」、「in」

和「on」，試題選項的設計則以此三個介係詞為選項。由於試題的選項設計是以同一群的概念群下的介係詞為選項，所以每一題的選項個數並不盡相同，依照同一群概念下的介係詞數目增減而定，所以在我們所發展的介係詞階層式概念圖中，每一介係詞概念試題最少有三個試題選項，最多有五個試題選項。

在試題有難度控制且難度適中的試題設計，是根據試題無難度控制組的試題去改進。首先把試題選項通通固定為四個選項，保留原試題難易度適中的題目。把難度偏難及偏易的試題進行題意與選項的修改，以讓 40 題試題都能符合難易度適中(FV=0.3~0.7)的題目。

因為學習評量效果的好壞，會因為試題難易度而有所影響，試題太難會讓學習者容易都答錯，而試題太簡單也無法衡量出效果，所以在我們的研究中會對試題的難易度作控制，並設計三種偏難、適中、偏易的難度試題，來說明試題難度可能會對實驗造成的影響。

(46)

4.2 系統架構、規格

系統架構前半段部分是採取主從式架構(Client/Sever Architecture)(圖 4.2)來建置英文介係詞試題系統。在設計架構中，客戶端、伺服器、及資料庫端透過網際網路的傳輸及超連結來進行系統測驗和資料儲存動作。由架構中的網頁伺服器 (Web Server)負責提供試題網頁給學生(Client)，進行評量測驗，資料庫系統(DB Server)紀錄學生的作答資料，以供系統架構後半段的資料探勘系統進行相關資料的關聯分析。

Web Server Client

Internet Data

Base

DB Server 圖 4.2：主從式架構

系統架構其相關的軟硬體規格及系統開發環境如下述：

1. Client 端：作業平台為 Web Browser，可為 IE 或 Netscape Navigator 等瀏覽器，提供試題網頁。

2. Web Server 端：伺服器主機配備為 P4-2G、256MB RAM；以 MS Windows 2000 為作業平台，並配合 IIS 5.0 來提供架構網站；採用 FrontPage、ASP(Active Server Page)為系統的開發工具。

(47)

3. DB Server 端：採用 MS-SQL Server 7.0 作為資料庫管理系統。

4. Data Mining：採取 VB6.0 程式語言以及 MS-SQL Server 7.0 資料庫管理系統來進行資料探勘，利用 Apriori 演算法找出介係詞錯誤概念的關聯性。

4.3 有難度控制之法則

155 位受測者，在 15~20 分鐘內做完 40 題難度介於 0.3~0.7 適中範圍的介係詞概念測試，試題平均難度=0.586。在關聯式法則運算中，依照我們所設定的最小支持度(min-support)和最小可信度(min-confidence)門檻值，挖掘出適當的法則。由於最小支持度設太低，所挖掘的法則容易過多，所以我們所設定的門檻值從 0.5 開始往下調整最小支持度以找出適當的法則；另一方面，我們希望法則的可信賴程度達到八成以上的正確率，所以將最小可信度固定為 0.8。最後，並將符合最小支持度和最小可信度限制的關聯法則，以題號表示，表 4.3-1 是支持度大於或等於 0.5、可信度大於或等於 0.8 的關聯法則(支持度>=0.5; 可信度>=0.8)；

表 4.3-2 是支持度大於或等於 0.4、可信度大於或等於 0.8 的關聯法則(支持度>=0.4;

可信度>=0.8)；表 4.3-3 是支持度大於或等於 0.45、可信度大於或等於 0.8 的關聯法則(支持度>=0.45; 可信度>=0.8)。

(48)

表 4.3-1：有難度控制下符合最小支持度為 0.5 之關聯法則法則支持度>=0.5 可信度>=0.8 18->23 0.5613 0.8447 23->2 0.6258 0.8509 3->2 0.5032 0.8966 36->2 0.5613 0.8286

表 4.3-2：有難度控制下符合最小支持度為 0.4 之關聯法則法則支持度>=0.4 可信度>=0.8 18,36->23 0.4194 0.8553 23,36->18 0.4194 0.8125 23,36->2 0.4323 0.8375 簡化為 2-itemsets 的法則支持度>=0.4 可信度 18->23 0.5613 0.8447 23->2 0.6258 0.8509 36->2 0.5613 0.8286 36->18 0.4903 0.7238 36->23 0.5161 0.7619 23->18 0.5613 0.7632

表 4.3-3：有難度控制下符合最小支持度為 0.45 之關聯法則法則支持度>=0.45 可信度>=0.8

1->2 0.4839 0.8621

23->2 0.6258 0.8509

3->2 0.5032 0.8966

36->2 0.5613 0.8286

6->2 0.4774 0.8222

12->23 0.4581 0.8353

18->23 0.5613 0.8447

由表 4.3-1 支持度>=0.5、可信度>=0.8 的關聯法則和表 4.3-2 支持度>=0.4、

(49)

可信度>=0.8 的關聯法則比較而知，在表 4.3-1 所產生的法則是一對一的 2-itemsets 關係，表 4.3-2 所產生的法則是二對一的 3-itemsets 關係，相較而下，二對一的法則比一對一的法則較複雜些，我們希望法則不要太複雜，所以將最小支持度往上調整設為 0.45，發現表 4.3-3 支持度>=0.45、可信度>=0.8 產生的法則也為一對一的 2-itemsets 關係，且法則數目比支持度>=0.5、可信度>=0.8 所產生的法則多，

也比支持度>=0.4、可信度>=0.8 下簡化成一對一關係的 2-itemsets 法則多，表示在支持度>=0.45、可信度>=0.8 產生的法則所涵蓋的介係詞概念較多，可以衡量比較多的介係詞概念，所以我們決定以 0.45 和 0.8 當作我們挖掘關聯法則的最小支持度和最小可信度的門檻值。

由表 4.3-3 可知在最小支持度門檻值為 0.45、最小可信度門檻值為 0.8 下，

當第 1 題、第 23 題、第 3 題、第 36 題或第 6 題的介係詞概念發生錯誤時，第 2 題的介係詞概念也會跟著出錯的機率高達八成以上；而當第 12 題或第 18 題的介係詞概念發生錯誤時，第 23 題的介係詞概念也會跟著出錯的機率高達八成以上。法則前項、後項中這 8 題都是 155 位受測者中將近有五成到八成受測者容易犯錯的概念(表 4.3-4)，尤其是法則後項第 2 題、第 23 題犯錯機率超過 74%以上，

犯錯率很高。

表 4.3-4：符合最小支持度 0.45 之各題錯誤率題

號 1 2 3 6 10 11 12 13 14 18 23 27 33 34 35 36 答

錯數

87 123 87 90 92 73 85 91 78 103 114 82 77 78 72 105 錯

誤率

0.56 0.79 0.56 0.58 0.59 0.47 0.55 0.59 0.5 0.66 0.74 0.53 0.5 0.5 0.46 0.68

(50)

4.4 無難度控制之法則

211 位受測者，在 15~20 分鐘做完 40 題介係詞概念測試，試題的難易度分佈如表 4.4-1，難度偏難的試題有 6 題，難度適中的試題有 24 題，難度偏易的試題有 10 題，試題平均難度=0.541。

表 4.4-1：無難度控制試題的難易度分佈

難易度偏難(FV=0~0.3) 適中(FV=0.3~0.7) 偏易(FV=0.7~1)

題數 6 24 10

題號 1, 2, 11, 16, 18, 31 3, 9, 10, 12, 13, 14, 15, 17, 19, 20, 22, 23, 25,27, 28, 29, 30, 33, 34, 36, 37, 38, 39, 40

4, 5, 6, 7, 8, 21, 24, 26, 32, 35

在關聯式法則運算中，依照我們所設定的最小支持度(min-support)和最小可信度(min-confidence)門檻值分別為 0.45 和 0.8，挖掘出適當的法則。表 4.4-2 是在最小支持度為 0.45、最小可信度為 0.8 的門檻值下，所挖掘的關聯法則。

表 4.4-2：無難度控制下符合最小支持度為 0.45 的關聯法則法則支持度>=0.45 可信度>=0.8

1,11,14->18 0.4615 0.8947

1,14,18->11 0.4615 0.8947

11,14,18->1 0.4615 0.9189

11,14->1,18 0.4615 0.8226

14,18->1,11 0.4615 0.8226

1,11,16->18 0.4932 0.8651

1,16,18->11 0.4932 0.8790

11,16,18->1 0.4932 0.8934

1,18,29->11 0.4525 0.8929

(51)

表 4.4-2：無難度控制下最小支持度為 0.45 的關聯法則(續) 法則支持度>=0.45 可信度>=0.8

11,18,29->1 0.4525 0.9009

1,11,29->18 0.4525 0.8696

18,29->1,11 0.4525 0.8065

1,18,31->11 0.5158 0.8837

11,18,31->1 0.5158 0.9268

1,11,31->18 0.5158 0.8321

18,31->1,11 0.5158 0.8261

進一步分析表 4.4-2，可發現法則的後項不是第 1 題、第 11 題、就是第 18 題的介係詞概念，而且第 1 題、第 11 題、第 18 題也常出現在法則前項，由於我們所要預防的是法則後項，所以為了簡化法則的複雜性，試著將原 4-itemsets 法則從中簡化為 2-itemsets 法則(表 4.4-3)，並對簡化為 2-itemsets 的法則計算其支持度和可信度是否符合所設定的門檻值。因為二對二的法則，價值比較不高，可信度也較低，所以為了簡化複雜性，在此我們就不討論二對二的法則。

表 4.4-3：無難度控制 2-itemsets 法則

法則後項強物項集合為 4-itemsets 法則強物項集合為 2-itemsets 法則

18

1,11,14->18、1,11,16->18、

1,11,29->18、1,11,31->18

1->18、11->18、14->18、16->18、

29->18、31->18

11

1,14,18->11、1,16,18->11、

1,18,29->11、1,18,31->11

1->11、14->11、18->11、16->11、

29->11、31->11

1

11,14,18->1、11,16,18->1、

11,18,29->1、11,18,31->1

11->1、14->1、18->1、16->1、

29->1、31->1

從原來的強物項集合為 4-itemsets 法則中，發現強物項集合為 2-itemsets 法則也都符合我們之前所設定最小支持度為 0.45 和最小可信度為 0.8 的門檻值如表 4.4-4。對第 18 題而言，只要第 1、11、14、16、29、31 題發生錯誤第 18 題也會

(52)

跟著錯誤；對第 11 題而言，只要第 1、14、18、16、29、31 題發生錯誤第 11 題也會跟著錯誤；對第 1 題而言，只要第 11、14、18、16、29、31 題發生錯誤第 1 題也會跟著錯誤。所以若是第 14、16、29、31 題發生錯誤，第 1 題、第 11 題、

第 18 題這三題都會跟著出錯的機率高達八成以上。而法則前項、後項這 7 題都是 211 位受測者中將近六成受測者容易犯錯的概念(表 4.4-5)，尤其是法則後項第 1 題、第 11 題、第 18 題犯錯機率超過 85%以上，犯錯率極高。

表 4.4-4：無難度控制 2-itemsets 法則的支持度、可信度強物項集合為 2-itemsets 法則支持度>=0.45 可信度>=0.8

1->18 0.7783 0.8431

11->18 0.7511 0.8557

14->18 0.5611 0.8921

16->18 0.6290 0.8634

29->18 0.5611 0.8794

31->18 0.6244 0.8415

1->11 0.8100 0.8775

14->11 0.5611 0.8921

18->11 0.6335 0.8696

16->11 0.7511 0.8830

29->11 0.5701 0.8936

31->11 0.6652 0.8963

11->1 0.5611 0.8921

14->1 0.6290 0.8634

18->1 0.5611 0.8794

16->1 0.6244 0.8415

29->1 0.7511 0.8557

31->1 0.7783 0.8431

中 華 大 學 碩 士 論 文