第二章 文獻探討:從語義學及分類學觀點看歷代部首研究
2.2 部首、字原與義符分類的相關研究及語義網絡的開發
2.2.7 周亞民、黃居仁(2005)漢字義符知識結構
鑑於前面幾項研究在分類依據、義符定義及選擇上的問題,周亞民及 黃居仁(2005)提出了革新的方案,為突出部首的表意功能,並建立義符間 彼此的語義聯繫架構,該研究決定直接將《說文解字》的 540 個部首作為漢 字核心義符,詳細分析每個部首的本義並瞭解部首與從屬字的關係後,利用
IEEE SUMO(Suggested Upper Merged Ontology,即「上層共用知識本體」)
12的系統建立漢字義符概念的知識結構。周、黃(2006)對於義符認定的原 則打破說文以來漢字研究中講求「形旁」或「聲旁」的分類方式,認為只要 該符號功能與意義連結,即可認定為義符。藉由 SUMO 具有 3900 多個節點的 分類體系和階層關係,將 540 義符一一予以對應、歸類,如此一來不僅在搜 尋資訊時能根據義類檢索義符,也可藉此瞭解義符的概念與其他知識概念的 對應關係。此外,選擇說文的 540 部首是因為相較於甲骨文,小篆體在文字 發展史中已是臻製成熟的書寫系統,且周(2006)以為 540 個部首多為初文
(即表達具體概念的象形文字),應該能夠描述所需傳達的基本意義概念,
因此可以作為 SUMO 結構中具備基本核心語義的義符。以下便是 SUMO 知識階 層與說文義符相對應的關係圖示:
12 SUMO(Suggested Upper Merged Ontology,建議上層共用知識本體),網址:
http://www.ontologyportal.org/,由 IEEE 標準上層知識本體工作小組所建置。這工作小組的目的是 發展標準的上層知識本體,這將促進資料互通性、資訊搜尋和檢索、自動推理和自然語言處理。
知識本體(ontology)類似於字典或者術語表,但是能使電腦處理更多內容的細節和其結構。知識 本體包括將人們有興趣的領域正規化為一套概念、關係和定理(axiom)。上層的知識本體被限制 在 meta 的概念、一般、抽象或者哲學,因此足夠一般提出(在一定水準上)一個涵蓋廣闊範圍的 領域區域。特殊領域具體的概念不被包括在上層知識本體中,但是這樣的知識本體確可提供特殊 領域(例如:藥、財政、專案…等等)的知識本體結構的建立。SUMO 希望藉由最高層次的知識 本體,鼓勵其他特殊領域知識本體以其為基礎衍生出其他特殊領域的知識本體,並為一般多用途 的術語提供定義,另外,目前 SUMO 已經和英語詞彙網路 WordNet1.6 版本作初步的連結。本資訊 來源出自:http://bow.sinica.edu.tw/ont/(中央研究院中英雙語知識本體詞網)
圖(2-1):SUMO 中的動物階層結構:表格塗滿者表示該類有從屬義符(黃居仁,2006,P5)
表(2-7):SUMO(上層共用知識本體)中的動物階層結構與義符的相對應關係舉例說明
SUMO(上層共用知識本體)中的動物階層結構與義符的相對應關係 舉例說明
第一層 動物 e.g. 人ㄦ尸夫了馬牛羊豕鹿犬虎鼠兔象能熊鳥烏隹
無脊椎動物 脊椎動物
軟體動物 節肢動物 溫血脊椎動物 冷血脊椎動物
多足類 蜘蛛類 甲殼類 哺乳類 鳥類 魚類 爬行動物 昆蟲類 齧齒動物 肉食性動物 水棲動物 靈長類 有蹄哺乳動物 有袋類動物
動物
犬科動物 貓科動物 人科 猴 猿
人類
蠕蟲
SUMO(上層共用知識本體)中的動物階層結構
燕魚它易巴龜蟲虫 彙(generative lexicon)相似的衍生能力,驗證了 Pustejovsky (1995)
所提出的衍生詞彙理論,漢字義符系統的確存有語義衍生的能力,因此能夠
「說文中大部分義符表現的概念都是具體的」也不誠然如此。也許文字發展 的基礎均來自於象形,但以小篆體書寫而成的《說文解字》,其間已經經歷 過太多次字形與字義的訛變了。
況且,SUMO(上層共用知識本體)的概念固然符合人類的認知分類原則,
卻忽略了在義符部首分類上的針對性,例如漢語中的詞類系統、量詞系統、
義符部首系統在上層的認知分類結構也許相同,但下層的分類卻會依照知識 系統及概念運作方式的不同(畢竟是運用在不同的領域,詞類在語法層次,
量詞在詞彙層次,義符部首在辨識漢字的語義層次)而產生差別。黃和周的 研究是為了要能使義符系統進入電腦的知識系統中,建立一套漢字的知識系 統以方便查詢及文字研究使用。事實上,就本研究和量詞分類系統的研究而 言,下層細部分類仍依其語義及作用不同而有明顯的差別。若還要從漢字學 習的角度來看的話,SUMO 的系統對於教學者或學習者而言都太過複雜,並 不符合本研究的需要。