• 沒有找到結果。

知識組織方法探討

N/A
N/A
Protected

Academic year: 2021

Share "知識組織方法探討"

Copied!
14
0
0

加載中.... (立即查看全文)

全文

(1)

知識組織方法探討-從人工智慧、認知

心理學、語言學與圖書館學角度論之

An Exploration of Techniques of Knowledge

Organization–From the Views of AI, Cognitive

Psychology, Linguistic and Library Science

鄭惠珍

國立臺灣大學圖書資訊學研究所博士候選人

Hui-Chen Cheng

Ph.D. Candidate, Department of Library and Information Science, National Taiwan University E-mail: hcc@mail.sjsmit.edu.tw

陳雪華

國立臺灣大學圖書資訊學系教授

Hsueh-Hua Chen

Professor, Department of Library and Information Science, National Taiwan University E-mail: sherry@ntu.edu.tw

關鍵詞(Keywords):

人工智慧(Artificial Intelligence);認知心理學(Cognitive Psychology); 語言學(Linguistic);圖書館學(Library Science);知識組織(Knowledge Organization);知識表示(Knowledge Representation);知識單元(Knowledge Unit)

【摘要】

現今涉及知識組織理論的領域相當廣泛。本 文主要是從人工智慧、認知心理學、語言學與 圖書館學的角度探討知識組織方法。首先介紹 知識組織的定義,接著分別論述這四個學科之 知識組織方法,並將之作一比較,最後提出 結 論與建議。期能藉由此一探討,予向來擅長資 料蒐集與組織整理的圖書館學界可以從其他 領域之知識組織方法的特色或優點來改進傳 統所進行的組織模式,使其在「知識組織」的 領域中仍居重要領導地位。 【Abstract】

Today the notion of knowledge organization has pervaded in many disciplines. This paper investigates the techniques of knowledge organization from four disciplinary viewpoints including artificial intelligence, cognitive psychology, linguistic

(2)

and library science. At the beginning, the definition of knowledge and its type are described. The concept of knowledge organization is then defined. After that, this paper discusses and compares methods of knowledge organization in these four disciplines. Last, conclusions and suggestions are provided. Hopefully, members of the field of Library Science who are already skillful in data collection and organization can find even better ways that improves the technique of knowledge organization by this study, and maintaining the leading edge in knowledge organization.

前言

20 世紀末,知識經濟初現端倪,知識管理成為物 質經濟向知識經濟轉變過程中不可迴避的問題。隨 之,作為知識管理核心的「知識組織」也引起理論 界的關注。據文獻記載,人終其一生所閱讀之書籍 平均不超過 2,000 本,假設一位讀者平均一星期閱 讀一本書,一年大約可閱讀 50 本。[1]僅就台灣而 言,每年所出版之新書高達四萬本,一個人必須費 時 800 年的時間才可將此一整年之新出版品閱畢, 更遑論是閱讀他國的文獻。可想而知,當代知識以 指數速度增長,資訊呈混亂無序狀態,已嚴重威脅 到人類再創造活動,為避免因知識爆炸所產生的知 識貧乏,如何有效地組織、控制、傳遞知識,以提 高知識的利用率,已成為急待解決之問題。[2] 現 今 人 們 已 普 遍 瞭 解 到 知 識 整 序 (ordering knowledge)的重要性,早期百科全書的作者(如 Hugo Avicenna 等)和教育家(如 J.H. Alsted Comenius, W. Ratke 等)即開始從事這項活動,接著文獻學家(如 LaFontaine Otlet)和資訊學家亦加入這行列中,爾 後,語言學家也開始參與此事。現在人工智慧的代 表、專家系統的生產者、超媒體專家以及教育界同 業也對運用知識組織的方法產生了濃厚興趣。 雖然圖書館員和哲學家過去被排斥在知識整序領 域之外,[3] 但事實顯示此二領域與知識組織理論亦 有相關,例如,早在 1929 年分類法專家布利斯 (Evelyn Bliss) 的 著 作 < The Organization of

Knowledge and the System of the Science>提出知識 組織的觀念以來,知識組織的研究即受到圖書館界 的重視。此外,1993 年國際性學術刊物<國際分類 (International Classification) > 改 名 為 < 知 識 組 織 (Knowledge Organization)>的作法,更加證明圖書 館與知識組織有相關。[4] 而近年來因知識組織議題 而引起重視的 Ontology 即源自於哲學的理論,由此 可知,涉及知識組織理論的學科相當廣泛。 由於知識組織是一門跨學科的領域,可以想像其 組織方法應是多種多樣,在網際網路盛行與知識多 元化的今日,為使知識能被有效地檢索與利用實有 賴智能的專家系統,而要建構一友善使用者系統則 有必要整合或參考不同領域的知識組織方法。因 此,本文試圖從人工智慧、認知心理學、語言學與 圖書館學的角度探討知識組織方法。期能藉由此一 探討,使向來以擅長資料蒐集與組織整理自居的圖 書館學界可以思索有否需改進之處,使其在「知識 組織」的領域中仍居重要領導地位。

知識組織的定義

知識組織是 1929 年英國分類法專家布利斯(H. E. Bliss)首次提出的。雖然 Peter Jaenecke 認為很難找 到一適用之知識組織定義[5],但由於知識組織的研 究日形重要,中外學者仍嘗試為知識組織提出詮 釋。布魯克斯(B.C. Brookes)所下之定義是:「知識組 織是對文獻中所含內容進行分析,找到人們創造與 思考的相互影響及聯繫的結點,像地圖一樣把它們 標示出來(即知識地圖),以展示知識的有機結構, 為人們直接提供創造時所需要的知識。」;而 A. Sigel 的解釋是:「知識組織是將含有知識的集合物加入資 訊價值的一種跨學科領域的文化活動」[6];至於 J.D. Anderson 則認為:「知識組織是有關文獻的描述、內 涵、特色、目的及將前述這些活動予以組織,以利 於使用者的尋找。知識組織包含了索引、摘要、編目、 分類、記錄管理、書目,以及相關文獻資訊的產生或 檢索用的書目資料庫。」[7]。 中國大陸亦有多位學者提出對知識組織的看法, 有一觀點是:「知識組織是指對知識客體所進行的諸 如整理、加工、引導、提示、控制等一系列組織化

(3)

過程及其方法」。[8];也有表示:「知識組織是指為 促進或實現主觀知識客觀化和客觀知識主觀化而對 知識客體所進行的諸如整理、加工、引導、揭示、 控制等一系列組織化過程及其方法」[9]。另外,亦 有進一步將知識組織的定義從廣義和狹義來說明, 狹義的解釋是指「文獻的分類、標引、編目、文摘、 索引等一系列整序」;廣義則是「知識因子的有序化 和知識關聯的網路化」。所謂知識因子是指組成知識 最細微的部份,一個概念,一種事物;知識關聯是 為若干知識因子間建立起的聯繫。[10] 從上述這些「知識組織」的定義可以發現:學者 所詮釋的對象仍環繞在”文獻”本身。可見知識雖 有顯性與隱性之別,但在組織時還是以顯性的知識 為主。可以推測知,處理隱性知識的先決條件是先 將之換成顯性知識。而整序的方式,除了文獻的分 類、標引、編目、文摘等之外,尚須進一步針對更 細微的部分進行分析並具關聯性。因此,筆者試圖 為「知識組織」所做的詮釋是:知識組織是指已轉 換成顯性知識的載體為對象,內容分析的深度逾越 資訊組織,並兼顧知識的關聯性。

知識組織方法

知識組織是一門跨學科的領域,其組織方法可謂 多樣化。依知識的內部結構特徵,可分為知識因子 和知識關聯的組織方法;依知識不同存在形態,可 分為主觀與客觀知識的組織方法;依知識組織的語 言學原理可分為語法、語意和語用組織方法;而蔣 永福則認為具體的知識組織方法有知識表示、知識 重組、知識儲存與檢索、知識編輯、知識佈局與知 識監控等七種。[11] 上 述 知 識 組 織方 法 中 , 目 前 以 「 知 識 表 示 」 (knowledge representation) (亦有譯為知識表達、 知識呈現)最引起學術界之重視,例如於西班牙舉 行第七屆 ISKO (International Society for Knowledge Organization)國際會議之主題「21 世紀知識表示 (knowledge representation)與知識組織的挑戰」即是 與「知識表示」有關。[12]根據 Winston 的描述, 知識表示是指”一組句法和語意的協定,使一切事 物之描述得以實現”[13]。也有將知識呈現詮釋 成”把知識客體中的知識因子和知識關聯表示出 來,以便人們識別和理解知識。知識表示是知識組 織的基礎與前提,任何知識組織方法都要建立在知 識表示的基礎上”。[14] 本文以下將分別從人工智 慧、認知心理學、語言學以及圖書館學四個領域探 討知識組織方法。

人工智慧

所謂人工智慧(Artificial Intelligence,簡稱 AI)是指 某一電腦系統能夠具有人類知識行為,並具有學 習、推理並判斷解決問題、知識儲存記憶及了解人 類所說的語言等問題。此領域所研究的知識表示 (knowledge representation)包括兩大類:一是程序式 (procedural method) ; 二 是 宣 告 式 (declarative method),分述如下: 程序式表示法 程序式是指將知識用一些程序表示,其主要優點 為(1) 表達進行程序的知識較為簡單容易;(2) 啟發 性搜尋之知識較易表達;(3) 若知識無法有效使用宣 告式表達時,程序式是一種簡便的表達法[15]。此類 型之表示法包括邏輯、產生式規則表示法: 1. 邏輯表示法 邏輯表示法(Logical Systems)乃運用命題演算等 方法描述一事實的性質、狀況、關係等知識;它利 用命題中的邏輯符號(如 AND (&)、OR(V)、NOT 等)建立演繹邏輯系統,可進行事實推理、定理證 明等運算。最常見的是命題邏輯,其敘述形式,如, 蘇格拉底是一個人(Socrates is a man)。但命題邏輯有 其限制,例如蘇格拉底是一個人(Socrates is a man) 可表示成 SOCRATESMAN;亦可將柏拉圖是一個人 (Plato is a man) 表 示 成 PLATOMAN 。 但 SOCRATESMAN 與PLATOMAN 是完全不同的兩件 事,無法從上述得到任何相似之處,所以此事實最 佳的表示為 MAN (SOCRATES);MAN (PLATO)。 [16]

2. 產生式規則表示法

產生式規則(Production Rule Systems)用以描述在 某個產生系統中,一組規則的共同特徵。這是一種 前因後果式的知識表示模型,它由兩部份構成,前 一部份稱為條件,用來表示狀況、前提、原因等, 後一部份稱為結果。其規則是 IF(前提)THEN(後 果),亦即如果滿足前提,則系統執行動作、或得出

(4)

結論。在醫學診斷系統中,內科醫師的知識可用” 若(IF)病徵出現則(THEN)表示有疾病”型式陳述, 同樣地,在線路診斷問題中,工程師的知識可用” 若(IF)觀察到瑕疵則(THEN)表示產品不良”型式表 示。[17] 宣告式表示法 宣告式表示法是將知識表示成為事實的表達,其 優點是:(1)表達上較完整 (2)知識系統容易更動, 當添加新事實時,不需修改其他部分 (3)所需之知識 只需儲存一次。[18] 此類型之表示法包括語意網 絡、框架、腳本、概念從屬關係: 1. 語意網絡表示法 語意網絡(Semantic Networks)是圖解式的知識表 示法,最早由 Quillion(1968)所提出,用以作為人類 相關性記憶的模型。Simmons(1973)選用此方法,來 表示自然語言查詢系統中的知識。基本上,一個語 意網絡就是一個圖形(graph),節點代表事物(Object) 或事類(class),而邊(edge)代表的是此邊所接連事物 或事類間的二元(binary)關係。簡言之,語意網路中 的資訊是以一組相互連接的節點來表示,節點間是 以附有說明的箭號相互連接,來表示其間之關係。 此種表示法符合人類聯想記憶的思維模式,因此在 專家系統建設中得到廣泛應用。例如,”Fido 是隻 狗”的事實可用圖二的語意網路表示;如果增加了 另一事實”Fido 屬於 Mary ”,則圖形可擴充成圖三 模式。[19] 圖 2 語意網絡圖-Fido 是隻狗 圖 3 語意網絡圖-Fido 是 Mary 的狗 資料來源:Elaine Rich 著;蔣元隆、謝欽旭譯,人工 智慧技術概論(臺北市:松崗,民國 76 年),頁 67。 應用語意網絡的結構(如圖 4),可建構目標實體 (老鷹、獵鷹),再用這些目標實體建設一知識庫, 並且用這知識庫辨識飛行物體是一隻鳥還是一架飛 機。 2. 框架表示法

框架(Frames)是由 Minsky(1975)及 Winograd(1975) 所提出。此方法曾使用於自然語言了解系統、感觀 分析系統等。框架是複雜事物的一種描述,複雜事 物是指許多實體的集合,這些實體稱為這個複雜事 物的元件(component)。例如房間是一個複雜事物, 可由其它複雜事物,譬如書桌、椅子、電燈、電話、 日曆、書本、電腦等,以及這些複雜事物間的相關 性來描述。它的基本思想是根據人們以往的經驗和 背景知識,來推理當前事物的相關知識。一個框架 由多個槽(slot)組成,每個槽又由一個或多個側面 (Facet)描述,若干個槽共同描述框架所代表事物的 屬性及其各方面表現。[20] 3. 腳本表示法 腳本(Scripts)由 Abelson(1973)首先發表。腳本是一 種結構,用以描述某一特定背景中,事件引發的次 序(stereotyped sequence of events)。腳本中包含了動 作者(actor)、動作(action)、及事物(objects)。腳本可 視為一種計劃,此計劃的內容是動作者對事物所作 的動作順序。其功能有三:(1) 可預測未曾明白提及 的事件及各事件相關的關係,(譬如,某人點牛排與 某人吃牛排有何關聯等);(2) 能根據一系列觀察事 圖 4 用語意網絡表示鳥類和飛機,以及兩者間之關係 資料來源:簡立峰譯,人工智慧與專家系統 Artificial Intelligence and Expert Systems(臺北:三民,

(5)

實來建立一個連貫的解釋;(3) 能匯集注意力於不尋 常事件。最常被舉例的腳本是餐廳腳本。在餐館中, 通常預期會看到些事物,如餐桌、菜單、侍者等, 也預期會有一些事件發生,譬如客人走到一張餐桌 前,看菜單、點菜、食用、付賬等,這些情形可用 腳本模型化。腳本可用以瞭解和預測事件,亦即系 統可預儲許多不同的腳本。系統可觀察周遭環境有 何事件發生,並選出一個最適合這些事件的腳本。 基於此選中之腳本,系統可預測未來有何事發生。 例如當系統看到約翰走進餐館,則系統可以選擇餐 館腳本,並預測約翰會用餐。系統也可以瞭解事件 並回答觀察中沒有明顯看出的事實。例如系統只看 到約翰進入餐館並付費給出納員,即可知道約翰已 用過餐。[21] 4. 概念從屬關係表示法 概念從屬關係( Conceptual Dependency,簡稱 CD) 理論是 Schank 於 1973 年提出的。其後,Shank 再予 以作進一步發展,爾後就安裝在許多能夠讀、能夠 瞭解自然語言文字的程式中。本文先前提及的語意 網絡系統僅提供一種結構,使各階層的知識能夠放 入節點,而概念從屬關係系統,不僅提供結構,同 時亦具有特殊的基元觀念集合,並由此來建立特定 資訊的表示法。譬如,“我給那個人一本書”,用 DD 表示知識的方法如圖五,其中,箭號表示相依的 方向;雙箭號表示動作者與動作之雙向關聯;P 代 表過去式;ATRANS 是此定理所用的基本動作之 一,表示所有權的轉移;O 代表受詞的關係;R 代 表領受的關係。[22] 在上述宣告式表示法中,語意網絡、框架與腳本 皆屬於結構化表示法,這些技術之所以被發展乃因 邏輯形式表示知識的方法過於單純,難以作為描述 世界的一些複雜結構,許多複雜實體基本上可分出 兩種關係:ISA(是)關係及 ISPART (是一部份) 關係,前者是指實體間的階層式分類(如圖 6); 後者是指實體與組成零件間之關係(如圖 7)。此外 上述這兩種關係的最重要性質之一就是移轉性,亦 即當”貴賓狗是一種狗”以及”狗是一種寵物”之 敘述為真時,則”貴賓狗是一種寵物”之敘述必為 真。 知識表示法可說是知識庫系統核心技術之一,由 於人類知識本身的多樣性與複雜性,截至目前為止 尚無一表示法可以完全適用所有的需求。然而,從 上述有關人工智慧所發展的知識表達技術,可瞭解 其在系統中所展現的功能具備知識分析、判斷、推 理、移轉性與關聯性的能力。此外,亦應用層級 (hierarchical)架構模式,找出概念從屬關係。

認知心理學

認知心理學(Cognitive Psychology)在知識表示中 所關心的是認知理論與人類記憶模式在系統中之展 現。目前認知心理學對大腦知識儲存與檢索機制的 研究,可謂富有成果。在認知心理學研究中,知識 的儲存與檢索被當作”記憶”過程來對待。一個完 整的知識記憶過程包括知識的儲存與檢索、編碼和 提取(回憶)三個環節。至於知識如何被記憶的, 圖 5 一個簡單概念的概念從屬關係表示法 資料來源:Elaine Rich 著;顏仁鴻譯,人工智慧 (臺北市:曉園,民國 75 年),頁 225。 圖 7 ISPART(是一部份)階層關係例子 資料來源:Elaine Rich 著;顏仁鴻譯,人工智慧 (臺北市:曉園,民國 75 年),頁 207。 圖 6 ISA(是)階層關係例子

(6)

對此,認知心理學家阿特金森(R.C. Atkinson)和希夫 林(R.M. Shiffrin)提出感覺記憶、短時記憶和長時記 憶構成的三級記憶理論[23],以下分別就記憶模式、 記憶歷程與記憶模型說明之: 人類記憶模式 [24] 1. 感覺記憶 感覺記憶 (sensory memory)是指個體各感覺器官 如視覺、聽覺等接受到刺激時所引起的短暫記憶。 亦即從感官刺激接收的知識資訊以感覺形式保持瞬 間的記憶形式,其中被保留的部份進入短時記憶系 統。例如走在校園中,所看到的,所聽到的各種刺 激皆屬於此範圍。 2. 短時記憶

短時記憶(short term memory)是指一種假設性的 儲存系統,就像一個盒子一樣用來儲存來自感官記 憶的訊息。它的特徵是容量大小約是 7+2 項目,能立 即回憶(recall)訊息,但只能將訊息保留至 12 秒左右。 3. 長時記憶

長時記憶(long term memory)亦是一個假設性的儲 存系統,能將記憶的材料永久或長期保存。因此只 要有適當的提取線索,就能很容易地回憶,像動作 知識、語言、技能、態度等皆屬長期記憶。它的容 量可謂無限多,它的保持時間從幾分鐘幾小時幾天 幾年到一個人的終生。在長期記憶中,主要是以語 意(semantic)做為編碼的材料。一般認為它在容量上 是無限的,它足夠以應付人們生活上習得及所經驗 到的一切,只要有適當的線索便可加以提取出來。 記憶的歷程[25] 所 謂 記 憶 的 歷 程 是 指 包 括 從 刺 激 材 料 的 編 碼 (encoding) 、貯存(storage)到記憶的提取(retrieval)的 過程。 1. 編碼 所謂編碼是指個體在訊息處理時,經由心理運作 將外在刺激的物理特徵,如聲音、顏色等,轉換成 抽象的心理表徵(mental representation)的歷程。例如 在學習文字時,根據字的形狀、聲音、意義編成形 碼、聲碼、意碼,這就是編碼所得之心理表徵。 2. 貯存 貯存是指將編碼過後的訊息,存放在記憶儲存器的 過程,如同是將整理好的資料放在檔案櫃的情形類似。 3. 提取 提取是指「將貯存在記憶中的訊息抽取出來應用 的心理歷程」。因為貯存在記憶的刺激是以抽象表徵 方式記錄者,必須經過重新解碼才能恢復以前的形 式,再表現於行為中。 語意記憶模型 [26] 1. 群聚模型(clustering model) 此模型認為知識的組織是以相似的項目聚集儲存 在記憶中。例如,實驗中發現受試者常會將記憶材 料以同一類,如交通工具,動物等方式逐一回憶。 此現象說明知識是有組織地儲存在記憶中,如圖 8。 2. 組型理論模式 組型理論模式(set-theoretical model)也是由群聚 (clustering)概念而來。同類的字會聚在一起來描述同 一概念。但每一個字不只包含了概念的例證,如鳥 包 括 了 鷹 、 鴿 子 、 麻 雀 等 , 也 包 含 了 許 多 因 素 (attributes)如動物、羽毛等。 3. 語意特徵比較模式

語意特徵比較模式(semantic feature model)是由 Smith、Shoben 與 Rips 於 1974 年所發展出來的。除 了 認 為 組 型 理 論 的 模 式 的 結 構 外 , 認 為 字 義 (meaning) 可 進 一 步 被 分 解 為 語 意 特 徵 (semantic feature)。這些語意特徵可分為 (1)定義特徵(defining feature):即屬於該類事件的必備特徵,例如鳥的定 義特徵是”禽類、體生羽毛、前肢變為翼”;(2)特 質特徵(characteristic feature)指用以描述該概念的特 質,例如鳥的特質特徵之一是”會飛”。當定義特 圖 8 群聚模式之語意組織 資料來源:黃天中、洪英正,心理學(臺北市: 桂冠,民國 81 年),頁 233。

(7)

徵及特質特徵兩者皆符合概念的描述時,就稱為「真 實陳述」(true statement),例如”知更鳥是一隻鳥” 的陳述;若只有定義特徵符合時,稱為技術說法 (technical speaking) ,例如”小雞是一隻鳥”的說 法;若只有特質特徵符合時,稱為「粗略說法」(loosly speaking),例如”蝴蝶是一隻鳥”,由比較的過程 就可知道訊息的真偽,如判斷企鵝是否是鳥的例子。 4. 網狀模式 Collins 與 Quillian(1968, 1969)提出網狀階層模式 來 描 述 知 識 的 結 構 。 此 模 式 認 為記 憶 是 由 單 元 (Unit,即字)和其特質所組成(見圖 9)。此模式的重 要特徵是假設記憶的存取方式是單一而非重複。 5. 擴散促動 擴散促動理論是由 Collins 與 Loftus 於 1975 年所 提出的連結理論。認為知識結構是依單元的語意關 係強弱來組織的,如圖十。若單元間關聯性愈高, 線段愈短。表示反應時間也愈短。此理論可用來解 釋預示效果。此效果說明若事先給受試者與目標字 有關之預示,在後來目標字提取的反應時間會有加 快現象。 6. 命題式網路 這是由 Anderson 與 Bower 於 1973 年提出的,此 模式認為知識的組織結構是以命題的方式表達。命 題是最小的知識或意義單位,它像一個句子般的將 不同的概念連結起來,表達出不同的意義。 在上述認知心理學的介紹中,發現此領域在知識 表達中所展現的知識結構具關聯性特色,同時亦具 有分析、連結、判斷的功能,強調的是最小的知識 或意義單位。

語言學

語言學(Linguistic)是指研究語言的科學。語言可 被簡易地區分為人工語言與自然語言,後者是人與 人日常生活中彼此溝通的主要工具,也是人類表達 思考方式的語言。為使電腦能提供使用者自然語言 方式查尋,則有必要瞭解語法結構與語義等,而這 些研究是屬於語言學研究範疇,此也說明何以知識 組織與語言學有關,換句話說,語言學的知識表示 是在處理自然語言的句法與語意時所產生的,目的 是 為 使 用 者 利 用 知 識 時 提 供 有 序 的 語 言 訊 息 保 障。語言訊息可分為語意、語法和語用信息三個層 面。[27] 在知識組織的過程和方法中存在這三種語 言學基礎,以下將針對此三種概念加以陳述: 語意表示 傳 統 的 語 意 學 通 常 把 詞 看 作 是 語 意 的 最 小 單 位,但是當代的語意學趨向是把詞看作是許多「語 意成分」(semantic feature)的組合。主要是詞的意 義很多時候並不是籠統而整體性的。詞的語意是可 再細分的,例如,「王老五」一詞包括「有生命的」、 「人類」、「男性」、「未婚」等成分;「男孩」一詞 包括「有生命的」、「人類」、「未成年」、「男性」。 藉由語意成分的分析,可找出彼此間之共同點。例 如,表一利用「語意成分的方陣」(semantic matrix) 將四個親屬稱謂語詞的語義分辨出,可知其共同點 圖 10 語意知識的擴散促動理論 資料來源:黃天中、洪英正,心理學(臺北市: 桂冠,民國 81 年),頁 236。 圖 9 假設的三層記憶網狀結構 資料來源:黃天中、洪英正,心理學(臺北市: 桂冠,民國 81 年),頁 236。

(8)

是[人類]及[親屬]這兩種語意成分,而不同之處是 在於是否具有[陽性]或[同一代]。雖然[父親]的意義 不止於[人類]、[親屬]、[陽性]、[不同一代],但成 分分析提供更精細描述詞語的方式,大致上,兩個 詞語共有的語意成分愈多,詞意就愈相同。 表 1 語意成分分析 父親 母親 兄弟 姐妹 [人 類] + + + + [親 屬] + + + + [陽 性] + - + - [同一代] - - + + 資料來源:黃天中、洪英正,心理學(臺北市:桂 冠,民國 81 年),頁 246。 此外,語意上有兩個共同的特性,即語意的同義 (synonymy)與多義: 1. 同義 詞組的同義一般不易界定,例如一般人所說某兩 詞組(或句子)意思相同時,往往是互相釋義,並 非是同義,譬如”張三是一位素食者”與”張三不 吃肉”並非同義,因為張三可能不喜歡吃,或是太 窮吃不起,並不代表其本身是素食者。 2. 多義 是指當一個詞或詞組含有一個以上的語意時,稱 之為語言的多義(或歧義)。例如”They are visiting fireman.”一句中因為可有兩種不同結構分析產生 兩種語意,其解釋有兩種。一是他們正在訪問消防 員;二是他們是來訪的消防員。(如樹狀圖顯示, 見圖 11),若有上下文(context)可能不會有多義的 現象。[28] 在系統中,語意分析(syntactic analysis)是由語法 分析器(syntactic analyzer)所產生的結構將被賦予 某些特定的意義。換言之,在句法結構與任務領域 目的物間的映成,係透過語意分析完成之。無此種 映成關係的結構雖或有可能存在,將被棄置。如,” Colorless green idea sleep furiously”(無色的綠色 觀念狂烈地睡眠)將被視為不符語意規則。[29] 語法表示 語法學(Syntax)研究的是句子的結構。自然語言 中 的 句 子 絕 對 不 是 一 組 單 字 任 意 湊 在 一 起 的 結 果,例如「這是一本書」是合語法的中文字;而「這 一是書本」及「一這書是本」則不是。在語法研究 中,較著名的理論是 Chomsky 提出衍生語法理論, 主張變形不改變語義,並指出深層(Deep Structure) 與表面結構(Surface Structure)之區別,例如,假設 「我送一本書給他」為深層結構,則變形後的句子 「我送給他一本書」為表面結構,中間雖經過變形 (受事格移位)而推衍出表面結構,但並不改變語 義。知識組織方法中之「知識關聯的重組」,即是 以 Chomsky 所提的理論為基礎,用多種表層結構 形式去表示深層結構中的語意。[30] 所謂知識關聯的重組是指在相關知識領域中提 取大量知識因子,並對其進行分析與綜合,形成新 的知識關聯,從而生產出更高層次上的綜合的知識 產品的過程。由於改變了知識因子間原有的聯繫, 所以可以提供新知識,也可提供關於原知識的評論 性或解釋性知識,如詞典、百科全書、類書、年鑑 等。因為知識關聯的重組須遵循客觀性原則,亦即 不能改變原知識客體的語義內容。由此可知此種知 識組織是屬於語法組織的範疇。[31] 在資訊系統的應用中,單字依其線性順序,被轉 換成彼此之間有某種關係的結構,如果違反語言的 規則,則某些單字所形成之組合順序亦將被棄置不 用。如,在英文語法分析中,像”Boy the go the to store”句子已明顯違反文法規則即被棄置不用。[32] 語用表示 語用學(pragmatics)主要在研究語境(亦即在實際 使用句子時,對於語意句子的影響,而「語言行為」 是研究的重要部份。所謂語言行為是指說話時除了 表達出語意外,還能利用語句來達成某些功能,例 如,陳述「我命令你馬上離開」,這句話除了表達 圖 11 “他們正在訪問消防員” 與 “他們是來訪的 消防員” 之樹狀分析圖 資料來源:謝國平,語言學概論(臺北市:三民, 民國 87 年),頁 258-259。

(9)

句意外,亦做了「命令」的行為。語言行為的種類 包括「說出句子的行為」、「非表意行為」、「遂行行 為」與「命題行為」,其中,人們最常用的語言行 為是「非表意行為」,其細分類別如圖 12:[33] 整體而言,在知識組織的過程中需遵循上述語義 學原則與方法,此外,不僅要以詞為基礎,還要以 語法為鎖鏈,因為語法任務即是為知識的語義表示 提供語法保障。

圖書館學

語言學界的 Baiba Holma 認為圖書館學界所從事 的知識組織是文獻處理,知識組織的方法包括索引 (分類、主題索引、組合索引)與摘要之處理方法。 其目的是在各資訊檢索系統中提供有關主題資訊 檢索。而有研究指出圖書館學的組織方法主要是分 類與編目,至於處理網路資源的 Metadata 則是與 其他領域所共同發展的[34];另外,盛小平則提出 數位圖書館的知識組織方式包括文件方式、資料庫 方式、主題樹與超媒體,此四種方式在其發表的文 章中已有詳盡描述[35],故本文以下僅就分類及知 識重組兩種知識組織方式說明: 分類 分類亦被稱為知識聚類。聚類和分類是一個過程 的兩個方面:分類的結果產生聚類;聚類的結果產 生分類。知識分類的組織法是指將知識按一定的分 類標準分門別類地加以類集和序化的過程。其基本 原理是物以類聚,即根據事物的不同屬性,將屬性 相同或相近的事物集中一起,將屬性相異之事物區 別出來。分類的標準可分為五種類型:[36] 1. 以學科分類 這是以學科分野作為聚類標準,將相同學科之知 識聚集一起。為古今中外各種文獻分類法普遍採用 的知識聚類方法。它的基本原理是以學科分野作為 區分知識集合的標準。以類目代表知識因子,以類 目的等級體系作為表徵知識關聯的主要方法。 2. 以主題概念分類 這是知識客體的主題概念為聚類標準,將相同或 相近主題概念的知識聚集一起,為各種類型的主題 詞法所採用。基本原理是以主題概念作為類集知識 的標準,用主題詞表示知識因子,用參照系統顯示 知識關聯。 3. 以人聚類 此乃以人物作為標準來類集知識。在文獻分類法 和主題法中,經常採用以人聚類的組織方法,如在 中國圖書分類法中,類 128「現代哲學」之下是以 嚴復、康有為、梁啟超、章炳麟、胡適等人物來分 類;在詞典、手冊、百科全書以及地方誌的編篆過 程中,也經常以人為類目。 4. 以用聚類 這是以知識本身的用途或效用為標準來類集知 識。亦即是以讀者的需求來分類。例如美國底特律 公共圖書館有一部份藏書之排架方式是以讀者的 興趣來分類,館員分類時考慮的是讀者之興趣需 求,而非僅是圖書內容。[37] 圖 12 非表意行為的類別 資料來源:謝國平,語言學概論(臺北市:三民,民國 87 年),頁 288。

(10)

5. 以時空聚類 知識具有時空結構,知識的時空聚類就是根據知 識產生的時間和空間屬性為標準類集知識。例如分 類表中所採用的時代複分和地區複分,就體現了以 時空聚類知識的原則。在知識創新中,可採用如下 四種知識時空聚類方法: (1) 將時空相近的知識整合一起; (2) 將時間上相近、空間上跨度較大知識整合一起; (3) 將時間跨度較大、空間上相近的知識整合一起; (4) 將時間跨度和空間跨度都較大的知識合一起。 知識重組 知識重組是對相關知識客體中的知識因子和知 識關聯進行結構上的重新組合,形成另一種形式的 知識產品的過程。其目的是通過對知識客體結構的 重新組合,為讀者因知識分散而造成的檢索困難提 供索引指南,以及提供經過加工整序的後的知識資 訊,使讀者便於理解和吸收知識,提供評價性或解 釋性知識。圖書館員以編製書目、索引等形式將文 獻單元整理排序的過程即屬於此種。 基本上,圖書館組織的知識仍以客觀知識存在於 各種類型的文獻為主。客觀知識表示的任務即是將 文獻中的知識因子和知識關聯用一定方式表示出 即可。文獻組織的內容是對文獻形式上加工,亦即 對文獻進行整序、組合、編碼、標示、轉換和濃縮 等,並無改變文獻本身知識內容。另外,分類表中 雖已依知識體系的架構進行展現與標示,並標引相 關知識的關聯性,但從實際的卡片目錄與線上公用 目錄的個案中,並無法以立體方式實質展現分類法 的特色與知識結構體系,此為圖書館學界在知識組 織過程中所存在之問題。[38] 經過人工智慧、認知心理學、語言學與圖書館學 等不同領域探索知識組織方法後,可以知悉:人工 智慧所發展的知識表達技術,在系統中所展現的功 能具備知識分析、判斷、推理、移轉性與關聯性的 能力,並應用層級(hierarchical)架構模式,找出概 念從屬關係;認知心理學領域在知識表達中所展現 的知識結構亦具備關聯性,以及分析、連結、判斷 的功能,強調的是最小的知識或意義單位;語言學 強調語意、語法和語用,其知識組織的過程中需遵 循語意學的原則與方法,不僅以詞為基礎,還要以 語法為鎖鏈,近期更趨向將詞的語意再細分,重視 語意成分分析及知識關聯性;而圖書館組織的知識 仍以客觀知識存在於各種類型的文獻為主。文獻組 織的內容是對文獻形式上加工,亦即對文獻進行整 序、組合、編碼、標示、轉換和濃縮等,並無改變 文獻本身知識內容。

人工智慧、認知心理學、語言學與圖書館

學知識組織方法比較

前文已由縱向方式分別探討人工智慧、心理學、 語言學與圖書館學的知識組織方式,為了解這些領 域在知識組織上之差異,將進一步以橫向剖析做一 比較,項目包括知識表示的興起、方法類型、知識 組織之特點、處理單元、知識組織目的與處理知識 類別(見表 2): 知識表示的興起 圖書館知識表示興起源於館藏目錄的建立。自知 識表示興起時即受到圖書館與資訊科學領域的重 視,今日知識表示相關議題的探討已漫延至其他領 域,就語言學而言,知識表示是在處理自然語言的 句法與語義時所產生的;人工智慧關心的則是經過 程式指令執行後產生機械式(machine-based)的 智 慧。至於心理學在知識表示中所關心的則是認知理 論與人類記憶的模式在系統中的展現。[39] 知識組織方法 人工智慧的組織方式是程序式(細分為邏輯與產 生式規則)與宣告式(包括語意網路、框架、腳本 及概念從屬關係);認知心理學的知識組織方式著 重人的記憶模式包括群聚模型、組型理論模式、語 意特徵比較模式、網狀模式及擴散促動模式;語言 學則專注在語意、語用及語法上的分析;圖書館學 組織整理的方式則有文件式(如主題分析、分類 法、索引與摘要等)、資料庫式、主題樹方式、超 媒體方式、metadata 等。 知識組織特點 各不同領域雖有其知識組織方法,但從表 2 可發 現在人工智慧、認知心理學與語言學中皆強調”語 意”的概念,除了表現出語意分析在知識組織中的 重要性外,更顯出知識組織為跨學科的研究。此 外,上述這三種領域另一共同 特徵是將知識結構 化 , 並 強 調 知 識 關 聯 性 。 而 此 知 識 關 聯 性

(11)

(association)卻是圖書館學所欠缺的。美國國會圖書 館資訊科技委員會即曾對國會提出一項建議:「LC 以 Metadata 方法從事的知識組織,本質上仍以 MARC 為基礎理念發展出來,所以是將各項記錄予 以獨立與分離,然而此種做法卻無法將資訊資源間 的豐富關聯性予以標示出來」。[40] 處理單元 人工智慧、認知心理學與語言學所進行的知識組 織是建立在知識單元(knowledge unit)的基礎上,而 圖書館學則是以文獻為單元,所進行的知識組織等 同於文獻的分類、編目、索引與摘要等一系列的整 序。 處理知識類別 人工智慧處理的是語意知識、程序性知識與後藏 知識;認知心理學面臨的知識則是語意知識、程序 性知識、策略性知識;語言學所處理的是主觀知識 與客觀知識;圖書館學則以顯性知識為主。 表 2 人工智慧、心理學、語言學與圖書館學知識組織方法比較表 項目 人工智慧 認知心理學 語言學 圖書館學 知識表示 的興起 經過程式指令執行後產 生機器式(machine based) 的智慧 人類記憶的模式在系統 中的展現 處理自然語言的句法與 語意時所產生的 圖書館館藏目錄的 建立 知識組織 方 法 ( 類 型、方式) 程序式 1. 邏輯 2. 產生式規則 宣告式 1. 語意網絡 2. 框架 3. 腳本 4. 概念從屬關係 人類記憶模式 1. 感覺記憶 2. 短時記憶 3. 長時記憶 人類記憶模型 1. 群聚模型 2. 組型理論模式 3. 語意特徵比較模式 4. 網狀模式 5. 擴散促動 語意分析 語用分析 語法分析 文件式 主題分析法 分類法 索引與摘要 資料庫式 主題樹方式 超媒體方式 metadata 知識組織 特點 關聯性 階層式 分析式 從屬性 如 is a; is part 關聯性 連結性 關聯性 階層式 階層式 如,採用杜威分類 從屬性 如,採用索引典 BT, NT, RT 處理單元 知識單元 知識因子 (最小的知識單位-詞) 知識因子 (最小的知識單位-詞) 文獻單元 目的與功能 知識的組織 知識的組織 1. 為使用者利用知識提 供有序的語言訊息保 障 2. 提供自然語言檢索功 能 1. 為使用者提供有 序的知識 2. 資訊檢索系統中 提供有關主題資 訊檢索 處理知識 類別 語意知識 程序性知識 後藏知識 情節知識 語意知識 程序性知識 策略性知識 主觀知識 客觀知識 客觀知識 (顯性知識) 外部知識

(12)

結論與建議

經由上述不同領域,如人工智慧、認知心理學、 語言學及圖書館學等的角度探討知識組織及比較 之後,可以歸結出以下幾點結論與建議:

結論

(一) 文獻組織有別於知識組織 人工智慧、認知心理學、語言學三領域的知識組 織方法皆建立在知識單元(knowledge unit)的基礎 上 , 而 知 識 單 元 無 非 是 概 念 。 概 念 由 概 念 元 素 (concept elements)組成,概念元素亦稱為概念特性 (concept characteristics)[41]。而傳統圖書館的工作 核心是文獻組織,並無改變文獻本身的內容。直接 促進社會發展的是知識,文獻是知識的載體,知識 與文獻之間的密切聯繫不意味著文獻可以替代知 識,利用現在的各種分類法和索引法對文獻的處理 不是知識組織而是文獻組織。 (二) 知識關聯性是知識組織的重要特性 從人工智慧所發展的知識表示技術,除注重知識 組織的結構與元素,更強調知識的關聯性,而認知 心理學與語言學的知識組織方法亦具備關聯性的功 能。此外,在國內的研究中也指出知識關聯性的重 要性,可以確認知識關聯性是知識組織的重要特性。 (三) 知識單元具有分合特性 人工智慧、認知心理學、及語言學三個領域在知 識組織中的另一特性是將大容量的知識分解成不能 再分解的知識單元,如同是物質可分解成分子,分 子可再分解為原子。同時,不再分解的基本知識單 元可以組合成層次不同的各種容量和屬性的知識單 元。由此可知知識單元具有分合性,此種分析綜合 的特性與阮甘納桑的冒號分類理論雷同。

建議

(一) 結合人工語言與自然語言 語言學在知識組織的角色扮演中,是以研究自然 語言為重心,自然語言乃人與人日常生活中彼此溝 通的主要工具,也是人類表達思考方式的語言;反 觀傳統圖書館提供的知識組織語言主要是”分類語 言”與”主題語言”,是一種控制語言(人工語 言),對使用者而言通常是陌生不易掌握的,換句話 說,以往圖書館的知識組織主要是以作者語言進行 形式化處理,很少考慮這些語意與語法對使用者的 實際效用。目前資訊檢索系統主要存在的問題即是 因為大部份提供的是控制語言的檢索點,如主題式 檢索點(subject access points),而不是自然語言形式 的檢索點(natural access points),欲解決此一問題的 途徑是以使用者所熟悉的語言組織知識。然而現階 段在自然語言檢索尚未發展成熟,至於人工語言尚 有其規範性之優點,因此仍建議結合自然語言與人 工語言從事知識組織工作。 (二) 以知識單元為基礎 無論人工智慧、認知心理學或是語言學,在知識 組織過程中皆是將物件(如句子)分析至最小的元 素或單元(unit),反觀圖書館在知識組織的過程中是 以文獻為單元的知識組織,僅是對文獻外部特徵與 內容特徵有序排列,為一種靜態文獻間接表示,組 織知識不能真實表達知識。知識單元是知識不再分 解的基本單位,是構成系統知識的最小的最基本的 要素。根據文獻記載,知識單元可分為廣義與狹義 兩種。廣義知識單元係指任何一種相對獨立的單元 內容和形式。不僅可包括單篇文獻還可包括單冊文 獻,甚至單套的叢書等。狹義知識單元的容量是無 限的,只要有相對獨立性皆可稱之為知識單元。 因應時代需求,過去圖書館學已更迭為圖書資訊 學,然而其在知識組織中所從事的工作,充其量僅 可說是從文獻組織演進至資訊組織,尚未提升至知 識組織。從人工智慧與認知心理在知識組織中所扮 演的角色可以得知:知識單元概念使用頻率越來越 高的事實,反應了以文獻為單元的知識形態在朝向 以知識單元的知識形態發展的趨勢,換言之,圖書 館必須突破「文獻單元」的限制,直接把「知識單 元」組成有序的集合系統。[42]例如,傳統圖書館 的分類是以一本書或是期刊的主題來分類,未來分 類需要更深入的單元(unit),以書的章節、期刊的 文章進行分類。[43]此外像是小說類的書籍,傳統 組織方式僅有書名、作者等少數檢索點可使用,未 來可能須進一步以書的情節、角色或內容做查詢。 (三) 重視層面分類理論的應用 人工智慧、認知心理與語言學在知識組織中皆應 用了分析綜合的理念,而圖書館界阮甘納桑所創冒 號分類法,即是一種分析兼層面的分類法,Miksa

(13)

指出自 1950 年代起杜威分類法即逐漸朝向以層面 分析(facet analytic )分類理論方向發展。此外,探討 知識組織相關議題之作者如 Yan Xiao 及 Winfried Godert 等人亦提出考慮利用層面分類理論作為知識 組織或改善線上檢索功能。[44][45]因此圖書館學界 除重視階層式的分類理論(如 DDC)外,亦需對冒 號分類法的理論多加關注,或許可從中找出突破目 前在知識組織中所面臨的困境。

附註

[1] Peter Jaenecke, ”To What End Knowledge Organization, ” Knowledge Organization 21:1(1994):6.

[2] 張彩虹、田建良與王小科,「圖書館知識組織 問題」,圖書館雜誌 5 期(2001 年),頁 6。

[3] Ingetraut Dahlberg, ”Knowledge Organization: It’s Scope and Possibilities ” Knowledge Organization 21:4(1993):211.

[4] Ingetraut Dahlberg, ” Why ” Knowledge Organization”? The Reason for IC’s Change of Name,” Knowledge Organization 20:1(1993):1.

[5] 同註 2。

[6] “The Knowledge Organization on Internet” <http://index.bonn.iz-soz.de/~sigel/ISKO/wiss-org.faq. html >(20 April 2002). [7] 同前註。 [8] 盛小平,「數字圖書館的知識組織」,圖書情報 工作 9 期(2001 年),頁 24。 [9] 蔣永福,「圖書館與知識組織-從知識組織的 角度理解圖書館」,中國圖書館學報 5 期(民國 88 年),頁 19-23。 [10] 王知津、王樂,「文獻演化及其級別劃分」, 圖書情報工作 1 期(1998 年),頁 5。 [11] 蔣永福、李景正,「論知識組織方法」,中國 圖書館學報 1 期(2001 年),頁 3。 [12] “ISKO-Publications,” <http://is.gseis.ucla.edu/ orgs/isko/pubs.html> (21 February 2002).

[13] Jadish Chandra Binwal and Lalhmachhuana, ” Knowledge Representation: Concept, Techniques and the Analytic Synthetic Paradigm” Knowledge Organization 28:1(2001): 6.

[14] 同註 11,頁 1-7。 [15] 姚步慎,人工智慧與專家系統導論(臺北市: 碁峰資訊,民國 80 年),頁 3-18。 [16] Elaine Rich 著;顏仁鴻譯,「人工智慧」(臺 北市:曉園,民國 75 年),頁 138。 [17] 蔣元隆、謝欽旭合譯,人工智慧技術概論(臺 北市:松崗,民國 76 年),頁 118。 [18] 同註 15,頁 3-18。 [19] 同註 17,頁 66-67。 [20] 同前註,頁 133。 [21] 同前註。 [22] 同註 16,頁 225。 [23] 同註 11。 [24] 黃天中、洪英正,心理學(臺北市:桂冠, 民國 81 年),頁 214-216。 [25] 同前註,頁 216-127。 [26] 同前註,頁 232-236。 [27] 同註 9,頁 20。 [28] 謝國平,語言學概論(臺北市:三民,民國 87 年),頁 244-267。 [29] Rich 著;孫家麟等合譯,人工智慧(臺北市: 松崗,民國 78 年),頁 362。 [30] 同註 28。 [31] 同註 11。 [32] 同註 29。 [33] 同註 28,頁 270-288。 [34] 陳亞寧、陳淑君,「以知識探索為本之知識組 織方法論及研究分析」,圖書與資訊學刊 39 期(民 國 90 年),頁 36-51。 [35] 盛小平,「數字圖書館的知識組織」,圖書情 報工作 3 期(2001 年),頁 24-27。 [36] 同註 11,頁 4-5。

(14)

[37] Ruth Rutzen, “ A Classification for the Reader,” in The Role of Classification in the Modern American Library: Papers Presented at an Institute Conducted by the University of Illinois Graduate School of Library Science, November 1-4 (Champaign-Urbana, Ill.: Illinois Union Bookstore, 1959), 53-61. [38] 同註 34,頁 40。 [39] 同註 13。 [40] 同註 38。 [41] 同註 3。 [42] 徐榮生,「知識單元初論」,圖書館雜誌 20 卷 7 期(2001 年),頁 2。

[43] Birger Hjorland and Hanne Albrechtsen, ”An Analysis of Some Trends in Classification Research,” Knowledge Organization 26: 3(1999): 136

[44] Winfried Godert, ” Facet Classification in Online Retrieval,” Knowledge Organization 18: 2 (1991): 98-109.

[45] Yan Xiao, “ Faceted Classification: A Consideration of its Features as a Paradigm of Knowledge Organization,“ Knowledge Organization 21: 2 (1994): 64-65.

參考文獻

相關文件

As each school has its unique school context, including its organisation of the JS and SS curriculum, experience in conducting PL, self-directed learning atmosphere,

Process:  Design  of  the  method  and  sequence  of  actions  in  service  creation and  delivery. Physical  environment: The  appearance  of  buildings, 

Wang, Solving pseudomonotone variational inequalities and pseudocon- vex optimization problems using the projection neural network, IEEE Transactions on Neural Networks 17

By changing the status of a Buddhist from a repentance practitioner to a Chan practitioner, the role of Buddhism has also changed from focusing on the traditional notion

“Water control and useful knowledge: river management and the evolution of knowledge in China, Northern Italy and the Netherlands.” Paper presented at the Global Economic

• Environmental Report 2020 of Transport Department, Hong Kong: to provide a transport system in an environmentally acceptable manner to align with the sustainable development of

● the F&amp;B department will inform the security in advance if large-scaled conferences or banqueting events are to be held in the property.. Relationship Between Food and

This study intends to bridge this gap by developing models that can demonstrate and describe the mechanism of knowledge creation activities from the perspective of