• 沒有找到結果。

第二章 文獻探討

第五節 中文輸入

電腦是高科技的產物,它能快速處理大量資料,使其成為有用的資 訊,進而提供使用者更有效率、更合理的管理。因此社會資訊化、辦公室 自動化已真正成為一種趨勢。然而要真正落實資訊化的普及,需要熟悉電 腦技能的人員來操作使用,才能發揮電腦的功能。

長期以來用電腦輸入中文都是中國人的夢魘,皆因電腦由外國人發 明,當初沒有考慮過要處理中文。而且,中文並非拉丁語系,中文字非由 26 個英文字母組成,令到問題更形複雜。1976 年,朱邦復先生開始研究 中文輸入法,方法是每晚不停的剪字典,把中文字分類。直到 1979 年,

朱邦復先生創出首個適用於一般電腦鍵盤的中文輸入法——倉頡輸入 法,成為「中文電腦之父」。1980 年,朱邦復和宏碁電腦(Acer)合作,

推出「天龍」中文電腦。此後,有關於中文輸入的各種方法陸陸續續的推 出,讓人們可以選擇適合自己的輸入法。本節以探討中文輸入法的種類與 如何選擇適合的輸入法為主。

一、中文輸入法的種類

一般而言,中文輸入法按所用的設備劃分時,可分為鍵盤輸入和非鍵 盤輸入二種。以鍵盤為基礎的中文輸入法主要可分成字音解碼、字形解碼

(即拆字)、內碼輸入三類(薛偉傑,2000;戴俊芬,1996),以非鍵盤為 基礎的中文輸入法主要可分成語音辨識輸入和手寫辨識輸入兩大類(薛偉 傑,2000)。

(一)以鍵盤為基礎的中文輸入法

1.利用字形解碼:字形解碼所用的原理是將中文文字的筆劃經 過系統性分析,找出中國字所有可能出現的「字根」。例如:

「天」,可以分解為「一」和「大」兩個字根;「唱」,可以分 解為「口」、「日」、「曰」三個字根。然後再將分解出的字根 予以「分類」和「歸納」,把相關、可以聯想在一起的字根歸 為一類(如將日和曰歸為同一類),再對應到英文鍵盤上。每 一類字根都有一個「主要字根」,其他同類的字根則和這一個 主要字根或多或少有點「變形」的關係存在,以方便記憶(廖 瑞民,1993)。輸入中文字時,再由字根組合成字,且一個字 對應一組字根,故選字率低,速度較快,且不必認得字,也 可以看字形解碼,適合做大量資料的輸入。其缺點為每種輸 入法皆有專屬的解碼規則或字根記憶輔助口訣,需花較多的 心思去記憶(戴俊芬,1996)。這一類的中文輸入法,如倉頡、

嘸蝦米、大易、行列、三角、王碼、華象、說文等均屬之;

其不同點在於字根的「分類」、「歸納」及「和鍵盤的關係」

(廖瑞民,1993)。

2.利用字音解碼:字音解碼是利用現有的注音符號作為基本的 組合元件,把所有的注音符號對應到鍵盤上,使用者只需輸 入注音符號即可(廖瑞民,1993)。由於國人幾乎全都學過注 音,且日常工作當中,甚少使用到不認識的字,因此幾乎可 以不必訓練即可應用,適合一般人使用(曾士熊,1997)。其 缺點為需知道該字的讀音才可輸入,且同音字較多,故常需 要選字,造成輸入速度的瓶頸,不適合做大量資料的輸入。

這一類的中文輸入法,除傳統注音外,還有智慧型注音,如 自然、倚天忘形、微軟新注音等。這兩種注音輸入法的不同 點在於「電腦自動選字」。智慧型注音輸入法,為降低選字率,

因此內建辭庫,讓電腦能自動選字,而其選字的原理是根據

「詞」,所以在輸入「住址」、「姓名」、「詩詞」等資料時,就 錯誤百出了(李祥,2000;廖明德,1998;廖瑞民,1993)。

3.內碼:內碼是最直接的輸入法,直接和電腦的編碼有關係。

只要有一個字,就必須對應一個「碼」存在,而那一個碼就 是所謂的「內碼」。輸入內碼即產生代表的文字,可直接使用 標準英文鍵盤輸入(如輸入 B971,即產生「電」字)(廖瑞 民,1993)。內碼輸入法的優點是重碼率幾乎為零,不用選字,

故可提高輸入速度;缺點是使用者必須經過長期的訓練,才 能記住數以千計的中文字碼,也因此這類型輸入法並不適合 一般人使用,也很少有人使用它(李祥,2000)。這一類的中 文輸入法,如電信碼、五大碼(Big5)等均屬之。

(二)以非鍵盤為基礎的中文輸入法

1.語音辨識輸入:語音辨識所使用的原理是頻譜比對。使用者 對著麥克風說話,電腦便將麥克風所輸入的信號進行頻譜分 析,分析所得的結果再和內存的語音頻譜資訊比對,找出對 應的音碼來,這個過程就是「語音辨識」。語音轉換成音碼 之後,便可進一步轉換成中文字、詞或語句,顯示在電腦螢

幕上(曾士熊,1997)。但是中文字同音字非常多,因此有 大量的同音及同調詞語,如:「堅固」和「兼顧」、「技術」

和「記述」等,使得語音辨識的正確率降低。又中國話的詞 語非常多,無法把「所有的話」(包括標點符號)都事先教 給電腦,因此電腦中沒有的詞語便無法做語音輸入。另外,

對於不認識的字或發音不標準,或環境不夠安靜,也都無法 使用語音輸入(薛偉傑,2000)。

2.手寫辨識輸入:手寫辨識是直接用手寫的方式輸入。使用者 利用特殊的筆在書寫板上寫字,電腦辨識使用者所寫的字,

轉換成對應的中文碼(曾士熊,1997)。使用此種輸入法,

只要會寫字就可以了,不必再花時間學習。但一般人書寫中 文字的速度是每分鐘 10 至 20 個字,故此輸入法僅適用於 少量中文輸入的時機,不適用於長篇大論(廖明德,1998)。

另外,人寫字時往往不是寫得很工整,而且每次在書寫板上 寫字的位置、字的大小、筆畫方向與長短等也會有些偏差,

使得辨識正確率不盡理想(曾士熊,1997)。

綜合以上所述,以非鍵盤為基礎的中文輸入法,雖然在技術上已有進 步,但仍有不少的缺點和限制。目前仍以鍵盤為基礎的中文輸入法為主 流,而其中又以字形解碼式的中文輸入法在速度和選字率的問題上解決得 較好,能有高效率、高品質的輸入。而字音解碼式的中文輸入法,雖然輸 入的速度較慢且選字率高,但簡單易學,適合作為後備輸入法。(孟令珠,

2002)

二、如何選擇適合的輸入法

學習一種快而實用的中文輸入法,是生活在數位時代裡的我們刻不容 緩的事。要如何選擇一種適合的輸入法呢?您可能要思考以下幾個問題?

(一)學會了到處都可用嗎?

輸入法有附在系統內的內含式輸入法,以及另外購買需要自行 安裝的外掛式輸入法,通常內含式的方法是屬於開放授權的方式,

發明人將輸入法公開授權,任何一個廠商都可自由的將它植入系統

提供給使用者,目前全面開放授權的有倉頡、行列、注音輸入法。

學會了一種輸入法,當然希望到處都可以用,而且最好什麼都不必 帶,打開電腦,裡面就有您的輸入法。如果是要另外購買另外安裝 的輸入法,可能會因為下列幾個問題而無法操作:忘了帶安裝軟 體、系統無法配合、版本需要更新等。

(二)對我的工作效率有多少幫助?

隨著數位通訊的澎渤發展,網際網路的風行,辦公室無紙化時 代漸將來臨,所有的報告、報表、企劃書、會議通知、會議記錄、

信息傳遞等,都要透過內部或外部的電子網路來傳送。處於這樣的 時代,文字輸入的速度就相對重要了。

(三)是否容易學習又不容易忘記?

再快的輸入法如果學起來一個頭兩個大,那也是不及格的。易 學不易忘就是要能在短時間內即學會該種輸入法,且即使長時間不 使用,也能很快地恢復原來的水準。就易學性而言,如何依個人特 質而能輕鬆學習是相當重要的。而學習輸入法時,是否應背誦大批 字根,或者僅需熟悉、理解原則,也是影響易學易用的因素之一。

在「不易忘」的原則下,最好能選擇按照書寫習慣取碼且取碼規則 簡單的輸入法。

(四)輸入法的功能是否完整

輸入法必需要有以下的功能:

1.符號輸入的功能:輸入法除了輸入文字,也要能夠輕易快速 的輸入各種標點、括號、註記、方向、表格等等各種特殊符 號。

2.可以線上立即查詢的功能:當使用者碰到不會輸入的字,可 以及時求助。

3.有容錯的功能:同一個字因為字體的不同和筆順的不同,容 許有多種輸入方式。

4.「簡碼」或「自建詞庫」:當輸入熟練後,應該有「簡碼」的 設計來縮短字的碼數,才能提昇輸入速度。「自建詞庫」是依

使用者自己的需求,將一些常常會使用到的「專有名詞」或

「字串」(如公司名稱、住址、電話、專有名詞等)建立成「詞 庫」,只要按某一個按鍵,便能產生該「字串」,以增加輸入 的效率。

綜合以上所言,到處可用、終生可用、省錢、方便、易學、快速、不 易忘、功能完備是您選擇輸入法必需考慮的因素。

表 2-7 目前常用之繁體中文輸入法比較表

比較項目 倉頡 行列 大易 嘸蝦米 注音

到處可用 系統內含 系統內含 外掛式 外掛式 系統內含 使用字根鍵數 25 鍵 30 鍵 40 鍵 26 鍵 41 鍵 使用字根數 100個字根 260個字根 254個字根 290個字根 37個字根 一字最多碼數 5 碼 4 碼 4 碼 4 碼 4 碼 平均輸入碼數 約3.5碼/字 約3.0碼/字 約3.0碼/字 約2.6碼/字

選字率 低 低 低 低 高

特殊符號輸入功

能 無 有 有 有 無

線上查詢求助功

能 有 有 有 有 無

容錯功能 無 有 有 有

簡碼功能 無 有 有 有 無

自建詞庫功能 無 有 有 有 無

資料來源:孟令珠,2002

相關文件