• 沒有找到結果。

從上一節的不同的學習者語料庫中,我們選出了 CLEC 語料庫作為本系統的文 法模組設計工具。選舉此語料庫的原因請見 Ch 3.4。下面我們要介紹 CLEC 語料 庫的一些相關背景。

2.7.1 CLEC 的收集文本對象

樣本的收集對象都是學生,分為 5 大類:

表 2 CLEC 語料分佈表

類型 詞次 ST2 208088 ST3 209043 ST4 212855 ST5 214510 ST6 226106 總計 1070602

1. ST2:中學階段,主要是高中生。

2. ST3:大學英語 4 級,大學 1~2 年級非英語科系學習者。

3. ST4:大學英語 6 級,大學 3~4 年級非英語科系學習者。

4. ST5:英語專業科系 1~2 年級學習者。

5. ST6:英語專業科系 3~4 年級學習者。

CLEC 的收集樣本對象,從國一到大學一般生, 甚至英語科系學生都有涵蓋。

每類學生二十萬詞, 約 38000 句句子。收集的樣本大多為作業的內容

12

determiners

2.7.3 CLEC 的實例說明:

下表是 CLEC 的一個範例 表 4 CLEC 範例文章

範例一開始是一些樣本的作者的資訊:

<ST 2>: 學生的程度在 ST2 – 中學程度

<SEX ?>: 性別不詳

<SCH GDWYWMDXFSWYXX>: 此為學校代碼

<TITLE A Shop> :文章 title 為 A shop

以下是 CLEC 中錯誤標記的方式,分為錯誤位置、錯誤類型與錯誤範圍標 記。錯誤位置是在句子當中使用方括號標記在錯誤單字的後方,括號中左邊標 示錯誤類型,右邊則標示出錯誤範圍,如第 3 列後方:its [fm3, 1-] name is Many [fm1,-] fruit shop.,即表示此句中 its、Many 兩個字是錯誤位置,而錯誤類 型分別是 fm3(大小寫錯誤)、fm1(拼字錯誤)。

至於針對錯誤範圍標示部分,有以下幾種分類,分別說明如下:

1. 錯誤字前方導致錯誤:

第 5 列:The women are very friendly [wd2, 1-] and busy.

括號中錯誤範圍標示的 1 在-號前,表示是 friendly 是錯誤,是因為往前 數一個字的位置的字導致該字發生錯誤,也就是因為 very 也是副詞,而導 致錯誤。

1. <ST 2> <SEX ?><Y ?> <SCH GDWYWMDXFSWYXX> <AGE ?>

2. <WAY ?><DIC ?> <TYP 2> <TITLE A Shop>

3. There is a fruit shop near my home. its [fm3, 1-] name is Many [fm1,-]

4. fruit shop. It's not very big, but it's clean and bright. There is [vp3,-2]

5. two women working in it. The women are very friendly [wd2, 1-] and 6. busy. Every buyer comes to the shop, they both give them smiles 7. and say [sn9, s] Hello. Can I help you? So every buyer comes to 8. here are very satisfy. [sn8,s]The shop has many different kinds of 9. fruit. There are apples [sn9, s]oranges bananes [fm1,-]pears 10. bananas many [wd6]. [sn8,s] So it aways [fm1,-] give [vp3, 1-] the 11. buyers a good time. I like the shop very much.

14

2. 錯誤字後方導致錯誤:

第 4 列:There is [vp3,-2] two women working in it.括號中錯誤範圍標 示的 2 在-號後,仍表示是 is 發生錯誤,但原因是後方的兩個字 two women 所導致的。

3. 本身錯誤:

第 3 列:its [fm3, 1-] name is Many [fm1,-] fruit shop.此句所示的第 二個括號,在-號前後並沒有任何數字標示,此即表示並沒有其他的字導致 Many 發生錯誤,是這個字本身就拼錯,並非原本作者所要使用的字。

4. 句中結構或標點錯誤:

第 9 列:There are apples [sn9,s] oranges bananes [fm1,-] pears…此 句的第一個錯誤標示範圍僅用一個 s 表示,此代表是句中的結構或標點發生 錯誤,因此這裡發生錯誤的原因,在於表示多個名詞的時候,需要用逗點分開。

三、英語作文錯誤檢查系統設計

相關文件