• 沒有找到結果。

第四章 電腦輔助列字系統

4.1 電腦輔助列字系統背景

立 政 治 大 學

Na tiona

l Ch engchi University

29

4.

第四章 電腦輔助列字系統

本章節介紹另外一個系統:電腦輔助列字系統,我們設計一個介面給教師做題目管理;

另外新增題目上我們提供題目字給教師做選擇,接著根據教師所選擇的題目字去列出正 確和錯誤答案後選字給教師做選擇,最後選擇的結果會加入到題庫中,4.1 小節會介紹 此系統的背景,4.2 小節會介紹系統的資料庫,最後 4.3 小節介紹此系統的介面。

4.1 電腦輔助列字系統背景

現在形音相近的漢字常被拿來當作考試的教材,諸如國小的改錯字等等[11],教師透過 一句中文句子將某一個字替換成其他可能的誘答選項,學生必須自己判斷哪個字才是正 確。雖然中文不常見,但英文試題卻幾乎常出這此類的題目。

一個中文句子往往也會因為一個字的不對而曲解了整句的意思,例如「今天我們來 試場買菜」,「試場」對於一般眾人來說是一個考試的地方,與買菜幾乎毫無關係,但若 發生像試場有一個商人在賣菜的特殊情景,這樣的解讀也是正確的,否則一般情況之下

「試場」應改為「市場」。

在我們實驗室所做的研究中,使用了倉頡碼做為我們的拆字工具[24]。我們曾考慮 使用影像技術的方法,但要彈性控制影像的縮放大小並不容易,故如何將中文字透過電 腦拆開成各個子部件是一個議題。簡體字或繁體字均可由透過電腦輸入並在畫面上顯

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

31

的字有可能是部首,也有可能不是,我們實驗室已有針對結構做相似度計算的研究[12]。

這篇論文採用 Lee 切割漢字的方式,其結構大致可分為 12 種,如圖 4.1,每個構形都有 對應的子結構,最多會擁有 3 個,我們將字的倉頡詳碼根據子結構設定對應的子倉頡詳 碼,例如「試」是第 2 個結構,可拆成第一個子結構「言」跟第二個子結構「式」,「言」

跟「式」又可分別對應到各自的倉頡詳碼「卜一一口」跟「戈心一」,所以第一個子結 構的倉頡詳碼是「卜一一口」,第二個子結構的倉頡詳碼是「戈心一」。

中文字的讀音如何相似我們通常用注音符號及其音調來判斷。中文字的讀音是由一 到三個注音及一個音調所構成,注音符號總共有 37 個音,但是並非所有 3 種組合都可 發音,注音符號包含三種分類,分別為聲母、介母和韻母,聲母中有些可單獨成為一個 字的音,有些則不行,例如「ㄅ」單獨存在就不是任何一個中文字的讀音,但「ㄓ」可 以是「之」的讀音。另外雖然這三個分類做組合時,必定是生母在介母上方、介母在韻 母上方,而且並非所有組合都可以行的通,例如聲母「ㄅ」可以和介母「ㄧ」以及韻母

「ㄢ」組合成「ㄅㄧㄢ」,而聲母「ㄓ」就無法和介母「一」做結合,所以能組合的讀 音有限;音調則總共有 5 種。近似音的分類通常有四種,分別為「同音同調」、「同音異 調」、「近音同調」及「近音異調」,例如「列跟烈」、「列跟咧」、「列跟聶」及「列跟捏」,

圖 4.1 Lee 切割漢字的構形資訊 [12]

字可能會有改動的需求,但又題目均儲存 phpMyAdmin 資料庫中,若要更改題目必須透 過網址輸入到 phpMyAdmin 的首頁,然後找儲存題目的資料表做刪除、增加或修改題目 的功能,而且有變動題目的話,還需要去改變所有小學生對此題目的權重值,這些步驟

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

33

面對此資料庫做管理,例如提供一個形聲字,系統就列出有哪些中文詞彙會包含此形聲 字,所以這部分也留下了後續的未來工作。

相關文件