• 沒有找到結果。

植基於中國詩詞語言特性所建構之語義概念分類體系研究

N/A
N/A
Protected

Academic year: 2021

Share "植基於中國詩詞語言特性所建構之語義概念分類體系研究"

Copied!
24
0
0

加載中.... (立即查看全文)

全文

(1)圖書與資訊學刊 3:3=78(Aug ’11)63-86 ISSN 1023-2125. 植基於中國詩詞語言特性所建構之語義概念 分類體系研究 Formulation of a Semantic Categorization System Based on Linguistic Characteristics of Chinese Poetry 羅 鳳 珠 Feng-Ju Lo 元智大學中國語文學系講師 Lecturer, Department of Linguistics & Literature, Yuan Ze University E-mail: [email protected]. 【摘要 Abstract】 目前電腦不具有人的認知、感知能力,不具備人的知識體系,以之用於文學研究與教學,有所不 足。本研究以兼顧詩詞文本內容及詩詞語言特性、語義學為前提,以詞彙為單位,建立語義標記資料 庫,參考前人分類,建構四個層級的詩詞語義概念分類知識庫。最上一層分為人、事、時、地、物、 其他等六大類,大類之下再分為 50 中類,368 小類,小類之下,以控制詞彙統攝同一小類之近義詞。 詩詞語言概念分類知識庫,能使電腦從分辨字形的檢索,轉為以語義概念檢索,提高查詢正確率;從 索引式的搜尋轉為更符合人類大腦以思維聯繫尋找資料的模式,使之更接近人的知識體系,也能滿足 文學研究與教學的需要。 Current computer systems have not yet worked in exact accordance with human cognition, perception, and knowledge organization. The gap between computer language and the human cognitive network becomes particularly apparent when computer systems are applied to literary research and education. In view of such subtle incompatibility, this study attempts to enhance a more cooperative application of computer systems to the literary field by establishing a semantic lexical database on the bases of textual contexts, linguistic characteristics, and semantics of Chinese poetry. In reference to conventional classifications, this semantic lexical database consists of four layers of semantic properties. The top layer is divided into 6 categories, including people, event, time, place, object, and others. The second layer is divided into 50 categories. The third layer has 368 subclasses. The fourth layer is composed of synonyms of individual subclasses. The design of this semantic lexical database improves the functionality of computer search engine as its operation shifts from information retrieval according to forms of characters to retrieval in terms of meanings of vocabulary items. This way of operation produces search results in a more precise manner that may meet the user’s. 63.

(2) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). demands for resources of specific themes. The enhancement of computer systems enables the search engine to function according to thinking modes of human brain and as a result constructs a structure similar to the human knowledge system. This advance may facilitate a more congruent application of computer systems to research and education in the field of literature.. 關鍵詞 Keyword 中國古典詩詞. 詩詞語言知識庫 語義標記 語義概念分類 Chinese classical poetry ; Knowledge database of poetic language ; Semantic tagging ; Semantic categorization. 64.

(3) 植基於中國詩詞語言特性所建構之語義概念分類體系研究. 知識的內涵,而不是文字的字形,電腦縱然有強. 壹、前言. 大的記憶與搜尋能力,如果只能分辨字形,無法. 詩詞的本質與電腦存在著基本上的差異,電. 理解及識別語義內涵,不具有人的認知、感知、. 腦理性客觀,處理有規則而合邏輯的資料;詩詞. 思考能力,不具備人的知識體系,便無法滿足使. 感性主觀,講究「只可意會而不可言傳」(劉大櫆,. 用者的需求。. 1959)、「不著一字盡得風流」(司空圖,1989,頁. 本研究以唐宋詩詞資料庫(羅鳳珠、張智星、. 2)、「言有盡而意無窮」(嚴羽,1967,頁 2),容. 許介彥,2005;羅鳳珠、張智星、許介彥,2006). 許反理而合情。. 為範圍,探討如何建構兼顧文本內容及詩詞語言特. 詩詞所使用的語言與其他文體不同,袁行霈. 性、語義學的語義概念分類體系,使之更接近人的. (1989,頁 2,3-24,25-56,57-72)從語義、語用及. 知識體系,建立詩詞語言知識庫,作為文學及語言. 語境的角度提出詩歌語言與其他文體的不同,論. 學研究與教學使用,以滿足不同使用者的需求。. 及:「如果從語言學的角度給詩歌下一個定義,不. 貳、詩詞文體語言的特性與資訊行為的 模式. 妨說詩歌是語言的變形,他離開了口語和一般的文 書語言,成為一種特異的語言形式。」王力(1988) 引葉聖陶給他的書信說,從詩歌語言形式的角度,. 就如詩評家及學者們所提出的觀點,詩詞是特. 詩歌的語言純出於人工的觀點(註 1)。由此可知,. 殊的語言形式,以不同的修辭技巧達到精緻凝練、. 無論從語義或語言形式的角度,詩歌非但與一般口. 語義無窮,情境高遠、言意與形神兼備的境界。透. 語、書面語言不同,與其他文體也存在著差異,再. 過修辭的技巧,將作者主觀內化的情思意念,投注. 加上詩歌的形式受到詩歌格律之平仄聲調及字. 在客觀外顯的事物上,作為作者與讀者之間引發共. 數、句法上的限制,語言更精鍊,語義更豐富,修. 鳴的媒介。詩詞所使用的詞彙,有一些是客觀知識. 辭更講究,語境更複雜,創作時需要更多藝術的創. 的描述闡釋,有一些是主觀情意的引導感發。以楊. 造,欣賞時需要更多聯想與文藝美學的修養作基. 花為例,蘇軾〈少年遊〉 : 「去年相送,餘杭門外,. 礎,因此解讀更困難。. 飛雪似楊花。今年春盡,楊花似雪,猶不見還家。」. 電腦處理有規則及合邏輯的資料,其效率高於. (唐圭璋,1983,頁 288)描寫冬季飛雪與春末飛花. 人腦何止千萬倍,但是電腦只能分辨字形的符碼,. 的景象,將楊花與飛雪對比呈現,讓只見過其中一. 無法解讀字詞含義的意碼,所以引用電腦做為偏重. 種物象的讀者,多出一條理解語義的管道。這裡的. 主觀抽象感知的詩詞文學研究與教學的輔助工. 楊花是純粹客觀的景物,不含作者的情意。同是寫. 具,比自然科學困難得多。. 楊花,蘇軾寫楊花的名作〈水龍吟〉 : 「似花還似非. 文學的研究,涉及龐大的資料,詩詞亦然。. 花,也無人惜從教墜。拋家傍路,思量卻是,無情. 在浩瀚的詩詞文獻中要具備旁徵博引,互相引證. 有思。……春色三分,二分塵土,一分流水。細看. 發明的能力,往往需要經年累月,皓首窮經才有. 來、不是楊花,點點是離人淚。」(唐圭璋,1983,. 可能。電腦強大的記憶能力及快速的搜尋檢索、. 頁 277)多重意象交互呈現,幽居空閨的女子,自. 分析統計能力,可以彌補人腦記憶與搜尋能力的. 傷處境如同隨風飄盪的楊花,拋家傍路,無人憐. 不足。但是,電腦只能分辨字形形符,無法解讀. 惜,不知情歸何人,不知郎行何處,多少幽微的心. 字詞語義的意符。旁徵博引及相互引證發明涉及. 事無處訴說,隨風飄落的片片楊花,看在傷心人眼. 65.

(4) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). 中,就不再只是楊花,盡是點點離人淚,這是心境、. 可知,組織、社會和文化背景,會影響到資訊搜尋. 情境、意境(羅鳳珠、張智星、許介彥,2007,頁. 及檢索行為人的認知,行為人的認知又會影響到所. 107-130)。詞中的楊花,也跳脫了物象本身的含. 有的資訊行為過程。. 義,增加了作者所附加的情意,語義也擴充了許. 文學表達的情感通常是主觀而抽象的,即便是. 多。從楊花的例子可知, 「飛雪似楊花」的「楊花」. 藉助客觀的物象作為作者與讀者之間溝通的媒. 是形符,代表的是楊花的物象本義,用來表述知. 介,仍然存在著感知層次的不同,因此,資訊技術. 識,但是「細看來、不是楊花,點點是離人淚」的. 應用在文學上,其困難度比自然科學領域高得多,. 「楊花」是意符,傳遞文學作品的主題內涵,並作. 應用在特殊語言形式的詩詞,困難度又高於小說、. 為詞中人物情感的寄託。. 戲劇、散文等文體。. 主觀情意的感發,往往因為讀者的學養、經. 語義的標記與語義概念分類,可以解決電腦只. 驗、際遇、年齡、心理氣質、思想境界、美學修. 能分辨字形,無法理解字詞義的問題,但仍然與人. 養等各種背景差異而使感受各有不同,因此相同. 的判斷解讀存在著相當大的差距。將文本經過詞彙. 的詞彙,相同的作品,感受上存在著個別的差異。. 切分及語義標記,使電腦能理解詞彙結構及語義,. 即便是同一個人,經過不同時空,重讀相同的作. 建立語義概念的分類及上下位詞層級的語義概念. 品,感受也會不同,這是客觀認知與主觀感知的. 結構,使之更接近人的知識體系,才能更接近使用. 問題。. 的需求,提升詩詞內容主題及語義分類的準確性與. 資訊的瀏覽、搜尋、檢索等行為,牽涉到行為. 完整性。. 人 的 認 知 , Belkin (1990) 發 表 的 “The cognitive. 參、詩詞文獻的分類. viewpoint in information science” 提出以認識論為 基礎的認知觀點。Ingwersen 在 1992 年出版的. 在還沒有資訊工具之前,書籍作者或編纂者因. Information Retrieval Interaction 書 中 的 “The. 應不同的使用需求,將書籍的內容做不同的分類,. cognitive view and information” 和 “IR interaction ?. 來幫助使用者快速方便查檢所需要的資料。孔子刪. the cognitive turn” 二個章節論及認知觀點;在. 詩書,訂禮樂,將《詩經》按照風、雅、頌分類,. 年 發 表 的 “Cognitive. of. 可說是分類的起源,《佩文韻府》以韻分類,《唐. information retrieval interaction: Elements of a. 詩別裁》、《清詩別裁》以詩體分類,用意不外乎. cognitive IR theory” 以 及 2001 年 發 表 的. 為了方便查檢瀏覽。. 1996. perspectives. “Cognitive information retrieval” 進一步將認知觀. 迄今為止,詩詞文獻的分類側重在整首詩的主. 點與資訊檢索結合,提出資訊檢索的交互作用是以. 題分類,以唐詩為例,宋代趙孟堅曾為唐詩做過分. 認知理論的元素為基礎的觀點;2005 年則以架構. 類,可惜「佚闕不完,世無刊本」(王瑢、紀昀等,. 圖反映出對資訊搜尋和檢索(Information seeking &. 1983,頁 156),明代張之象「因復有此作《唐詩. retrieval, IS & R) 的資訊搜尋之行為者,或在搜尋. 類苑二百卷》,凡分三十六部,以類隸詩。」(王. 情境群組裡的認知過程,牽涉到認知和感知的表. 瑢、紀昀等,1983,頁 156)。1992 年四川辭書出. 述,如人類認知、反應、感情、意見的表述,這些. 版社以明萬曆刻本的《唐詩類苑二百卷》為底本,. 都是資訊搜尋和檢索構成的一部份,也是資訊交互. 「編纂時……以原書為基礎,充分考慮原來的版. 影響情境的一種(註 2)。從 Ingwersen 提出的觀點. 本、體例;詩文內容有疑誤處參校《全唐詩》等書. 66.

(5) 植基於中國詩詞語言特性所建構之語義概念分類體系研究. 和作家專集;部類上進行必要的分合、增減、調整,. 潭〉,類別標題混雜普通名詞與專有名詞,體例. 部類名稱既尊重傳統,又兼顧現代,重新編制索. 不統一,「山部」、「居處部」、「寺觀部」等. 引。……得四十部,一千零八十三類。」(馬東田. 類別亦如是。. 主編,1992,頁 6),名之為《唐詩分類大辭典》,. 三、專名與通稱、俗名混合. 收錄唐詩 10,197 首(註 3)。依其凡例所言「分類以 題材為標準,不按詩的體裁排列。」(馬東田主編,. 除了大類之下的中類列舉體例不一,在同一. 1992,頁 9)。《唐詩分類大辭典》的分類,有幾. 中類中,也有將專有名詞與通俗名稱混合的情. 個問題值得商榷,舉其要者說明如下:. 況。該書的分類,既不是將所有詩題裡出現的專 有名詞一一列舉,又未曾將通俗專名做詞彙控. 一、分類與詩作內容不合. 制,如「草部」列有「苔」、「垣衣」及「瓦松」。. 依凡例所言「分類以題材為標準」 ,檢視全書,. 全唐詩詩題有「苔」字者共十七首,寫「蘚」者. 絕大多數都以詩題之字面含義分類,不是以詩作內. 二首,「苔、蘚」並列者一首,寫「垣衣」者一. 容之主題分類,使得有些分類與詩作內容的主題未. 首,寫「瓦松」者一首,總計二十二首。事實上. 必相關,產生分類類別與主題不合的現象,例如將. 「垣衣」是苔的一種,《廣群芳譜》之〈苔譜〉:. 杜牧〈金谷園〉歸在地理部的「園」類,與詩的主. 「苔,一名圓蘚,……苔在牆曰垣衣,在屋曰瓦. 題不合。金谷園是石崇所建,這首詩寫的是綠珠為. 松」(汪灝,1980,頁 5054-5055)。但中類中列了. 石崇墜樓而死的殉情故事,不是金谷園的園景,歸. 「苔」、「瓦松」及「垣衣」,未列「蘚」。在. 類於此,並不適當。又如〈關山月〉是漢樂府〈橫. 「木部」列有「情深樹」,李白有〈題情深樹寄. 吹曲〉曲調名,多用來寫邊塞士兵因久戍不歸,思. 象公〉詩:「腸斷枝上猿,淚添山下樽。白雲見. 念家人,和家人互傷離別之情的作品,《唐詩分類. 我去,亦為我飛翻。」(彭定求,1960,頁 1771). 大辭典》所收十一首〈關山月〉都寫到月亮。在戰. 李白詩題裡的情深樹只是李白看到的某一棵樹,. 地的征人雖因見到月亮而想念家鄉,但主要的重點. 李白隨意名之曰情深樹,在全唐詩之詩題及詩句. 是描寫邊塞征人思念家人之苦,月亮只是引發思鄉. 裡,也只有李白這首詩這麼寫,當作一個中類,. 情懷的觸媒劑,並不是寫作的標的。依該書分類凡. 顯然不合適。又如「木部」列有「端正樹」,《全. 例,這些詩應該歸入「人事部」。事實上《全唐詩》. 唐詩》收有溫庭筠〈題端正樹〉、貞元文士〈題. 共收有二十二首〈關山月〉,只有皎然的詩純寫月. 端正樹〉二首詩,貞元文士詩之詩序曰:「《酉. 亮(註 4),霍總的詩寫男女之情(註 5),與邊塞征戰. 陽雜俎》云:長安西端正樹,去馬嵬一舍之程,. 無關。. 迺德宗皇帝幸奉天,睹其蔽芾,錫以美名。有文 士經過,題詩逆旅,不顯姓名。」(彭定求,1960,. 二、標舉中類的體例不一. 頁 8847)可見「端正樹」是唐德宗錫以美名的樹,. 有些部類(大類)之下的中類,當作類別標題. 不是該樹種的學名,與本中類其他以柏、杉、檜、. 的體例不統一。以「河川部」的詩為例,有些詩. 楠……等樹種的學名為類別名稱的體例不同。其. 以普通名詞的河川湖潭為題,如劉長卿〈湖上遇. 他如「鳥部」所列「反舌」即百舌鳥,未做詞彙. 鄭田〉、李德裕〈潭上喜見新月〉;有些以專有. 控制而將二者並列為中類,徒增繁瑣與混淆。. 名詞為題,如宋之問〈洞庭湖〉、杜甫〈登白馬. 67.

(6) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). 從以上所分析的情況看來, 《唐詩分類大辭典》. 於 2011 年由商務印書館出版的《現代漢語語義分. 所區分的大類或中類,其分類方法及訂定類目名稱. 類詞典》(A Thesaurus of Modern Chinese, TMC),. 的方式,與語義的概念及使用者的認知不盡相同,. 將語義分為五個層級,包括 9 種一級類,62 種二. 也不符合學術分類的規則與慣例,使用者無論從. 級類,516 種三級類,2,086 種四級類,12,602 種. 「客觀知識性取向」或「主觀情意性取向」判斷,. 五級類,收詞 83,000 餘條,可說是後出轉精之作。. 《唐詩分類大辭典》的分類,都不盡符合語義概念. 由此可見,以義分類的詞典已逐漸受到重視。. 及使用者認知,再加上分類的結果與凡例所說的. 電子本文獻方面有:1998 年董振東的知網. 「分類以題材為標準」不盡相合,使用者的認知與. (HowNet Knowledge Database, http://www.keena. 該書分類有落差。如能以詩作之內容作語義標記與. ge.com); 2003 年中央研究院資訊所詞庫小組與. 分類,作為判斷詩作主題的依據,其準確度將會比. 董振東先生展開建構繁體字知網的合作計畫,建. 《唐詩分類大辭典》所作的分類高。. 立概念網,收錄詞條 55,912 筆,分析歧義後包. 本研究以唐宋詩詞之詞彙為單位,透過對唐宋. 含概念 60,482 筆(陳克健,2003;陳克健、黃淑. 詩詞作內容的語義標記及分類,嘗試從不同角度建. 齡、施悅音、陳怡君,2005)。其後北京大學計. 立詩詞語義概念分類知識庫,並與歷代類書及《唐. 算語言所俞士汶教授帶領的研究團隊與中國科. 詩分類大辭典》的分類相比較,修正前人分類的缺. 學院計算所自 1994 年開始聯合開發,1998 年完. 失及不足,期待在未來的研究裡,能進一步從語義. 成 的 《 現 代 漢 語 語 義 辭 典 》 (The Semantic. 標記及語義概念分類、詞彙共現三個角度分析、彙. Knowledge-base. 整、歸納,建立唐宋詩詞語言知識庫及唐宋詩詞主. of. Contemporary. Chinese,. SKCC),在語法分析的基礎上,為機器翻譯提供. 題分類,以滿足使用者以詩詞語義及主題作為查檢. 更深入的語義信息,研製的目的是為漢英機器翻. 條件的需求。. 譯服務,內容包括 48,835 條漢語常用實詞(名. 肆、中文語義概念分類研究回顧. 詞、動詞、形容詞)及部分成語、習用語的語義 分類。爾後北京大學計算語言所在原有基礎上,. 中文詞語的語義分類研究成果,紙本文獻方. 再與北京大學中文系合作,至 2003 年已達到. 面,先有梅家駒主編(1983/1996)的《同義詞詞林》. 66,539 筆詞條的規模。《現代漢語語義辭典》分. 最具代表性,收錄詞彙 54,235 筆,將詞義分為 12. 類,以詞性類別為最上層,總計有:名詞、時間. 大類,94 中類,1,428 小類,3,925 詞群。每一次. 詞、處所詞、方位詞、代詞、動詞、形容詞、區. 類所包含的詞彙以及該詞彙的同近義詞依序列. 別詞、狀態詞、副詞、數詞等十一種,其中分類. 出,成為研究詞彙語義學及語義概念分類的重要. 最細的是名詞,共有五個層級。《現代漢語語義. 工具書。繼《同義詞詞林》之後,陸續有多種以. 辭典》分類的原則,以與 WordNet 和中文概念. 義類為導向的詞典面世,如:徐為民主編(1984). 辭書(Chinese Concept Dictionary, CCD)兼容,與. 的《現代漢語分類詞典》 ;林杏光主編(1987)的《簡. 董振東的知網及《同義詞詞林》資源共享為前. 明漢語義類詞典》 ;董大年主編(1998/2008)的《現. 提,參照現有各家語義類的基礎,針對漢英機器. 代漢語分類詞典》。以董大年的最具規模,分為 17 大類,143 小類,3,717 詞群,49,000 筆詞條。. 翻譯的需要而建置(王惠、詹衛東、俞士汶,. 最新的著作是由廈門大學蘇新春教授主編,即將. 2006)。國際上其他具有代表性的語義網,還包. 68.

(7) 植基於中國詩詞語言特性所建構之語義概念分類體系研究. 括普林斯頓大學的 WordNet,加州柏克萊大學的. 未將詞彙置於文本之中解讀其語義,所以無法兼顧. FrameNet,微軟公司的 MindNet 等。以上語料. 語用與語境。由於韻文的語言表達及構詞方式與語. 都是以現代漢語為範圍。. 體文不同,目前所發展的語言處理工具、語義標記. 以文學文本建立語義網,目前有筆者所主持的. 及分類項目,勉強套用於韻文,除了扞格不入之. 「溫柔在頌-唐詩三百首計畫」(羅鳳珠、胡順萍、. 外,也抹煞了韻文的語言特徵。好的語言處理工. 歐慶亨,1999)及「網路學習模式範例—時空之旅. 具,需要兼顧其使用目的,用之於圖書資訊檢索、. 人物篇—蘇軾」(羅鳳珠,2001),與中央研究院「語. 語言學研究、文學語言研究或文學研究,都會因為. 言座標-參考資源建置與服務」(註 6)合作,參考. 需求不同而有不同的分類方法。. 中 央 研 究 院 「中 英 雙 語 知識 本 體 詞 網 」 (Sinica. 伍、詩詞語言語義分類的困難. BOW;註 7)和 SUMO (Suggested Upper Merged Ontology,建議上層共用知識本體;註 8)資料,建. 中國韻文發展到唐宋代,可說是達到了顛峰,. 置「唐詩三百首知識本體」(黃居仁、羅鳳珠,. 成為中國文學史上燦爛的一顆明珠。清代彭定求奉. 2003),以及「蘇軾詩知識本體網站」(黃居仁、羅. 敕編纂《全唐詩》,以明代胡震亨《唐音統籤》及. 鳳珠,2004)。這二個網站僅先將文本中的動物、. 季振宜《唐詩》為底本編纂而成。全書分為九百卷,. 植物、人造物分類,文本內容分析及語義標記、語. 將帝王后妃的作品列於首,其次是樂章、樂府,接. 義概念分類的工作由筆者負責。筆者於「以 XML. 著依作者時代先後編排,附以作者小傳,最後是聯. 可延伸式標注語言建立文章標記系統研究-以蘇. 句、逸句……等等。作者之後繫上詩題,使用者只. 軾詩詞為範圍」計畫網站 (羅鳳珠、李錫捷,. 能依照作者或詩題逐一查檢資料,非常不便。《唐. 2002),將蘇軾詩全面進行語義標記與分類;爾後. 詩分類大辭典》雖然存在著上述問題,但是初步達. 再以蘇軾詩所建置的詞彙語義標記資料庫為基. 到了提供使用者從內容主題尋找資料的功能,比. 礎,於「淺斟低唱—宋詞古唱虛擬實境教學環境建. 《全唐詩》方便許多。但是儘管《唐詩分類大辭典》. 置計畫」(羅鳳珠等,2005)選出柳永(218 闋詞)、. 聲稱是以主題分類,事實上有很多詩作除了文字表. 蘇軾(379)、秦觀(148)、周邦彥(187)、李清照(53)、. 面的含義,還含有「雙關義」 、 「情韻義」 、 「象徵義」 、. 姜夔(87)、辛棄疾(627)等七家詞為範圍,進行語義. 「深層義」 、「言外義」(袁行霈,1989,頁 6-23),. 標記與分類;「智慧型全台詩知識庫計畫第二階段. 不是只有單一主題,使得主題分類的困難度非常. 建置計畫」,以國家台灣文學館委託施懿琳編纂. 高。《唐詩分類大辭典》無法兼顧詞彙本義之外的. (2004)的《全台詩》前三年成果為範圍,建置全台. 含義,是分類的準確性及完整性相對不足的原因,. 詩語義標記與分類;2006 年繼續擴充,以唐宋詞(羅. 加上《唐詩分類大辭典》處理的內容只佔全唐詩的. 鳳珠等,2005)、全唐詩(羅鳳珠等,2006)為範圍,. 20%,涵蓋面不足。 前已述及,詩是特殊的語言,特別講究聲律. 建置唐宋詩詞詞彙語義標記與分類,以作為未來建. 及形式之美,受到字數及平仄押韻等格律的限. 立詩詞主題分類的基礎。 由前述可知,目前有關於語言之自動化處理技. 制,詩的用語與語體文不同。因字數的限制,一. 術及語義概念、語義標記等相關研究,以現代漢語. 首詩短則 20 字(五言絕句),多則不過數百字(排律. 的研究比較多,語料的來源雖然也包含了文學典籍. 或古體詩),短短篇幅要包含豐富的內涵,完整的. 的語料,但是以語體文為主,並未包含韻文,而且. 詩意與情意,修辭的技巧自然比語體文更為講. 69.

(8) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). 究,因此也存在著更多一詞多義,一義多詞的現. 概念系統?」的議題與「人的肉體經驗和運用想像. 象。除了一般用語之外,詩詞使用了更多典故等. 機制的方式,對於人如何建構範疇和理解經驗是至. 特殊用語,使得詞彙的含義比語體文更豐富,更. 關重要的。」的觀點。. 曲折多變,甚至於脫離了原有的語義而由詩人創. 本文以詩詞為例,說明人類是否具有相同或相. 造新的語義,如王維〈齊州送祖二〉:「送君南浦. 類似的概念系統?是否具有類似的情境認知、感知. 淚如絲,君向東州使我悲」(彭定求,1960,頁 1307). 與感發能力?詩詞的內容以人為軸心,描寫人主觀. 的「南浦」 ,詞義已從向南的水邊河岸,成為帶有. 內在的心靈活動、人與外物的互動及對客觀外在景. 離別感傷的意象,語義比原來豐富。. 物的敘述。內在的心靈活動是主觀的情志,表現在. 本研究嘗試把詩詞的語言,區分為一般用. 言志與言情的作品;客觀的敘述是對客觀外物的描. 語、特殊用語、情境用語三種(羅鳳珠,2007)。. 寫,表現在敘事、詠史、詠物、寫景……等作品;. 一般用語指的是詞彙的語義與其他文體類似,多. 物我互動的作品內容,是作者內在心靈的活動隨著. 數是客觀知識性的描述用語,講究語義精確,一. 外物的改變而產生的情意波動與感發,即劉勰《文. 次只使用一種語義;特殊用語指的是含有典故、. 心雕龍‧物色第四十六》所說的「春秋代序,陰陽. 象徵、比喻、意象等等修辭技巧含義的詞彙,多. 慘舒,外物之動,心亦搖焉。」(劉勰,1960,頁. 數具有主觀情意性的引導與感發功能,詞彙的含. 693)以及「情以物遷,辭以情發」(劉勰,1960,. 義不只是字面的含義,可能同時含有多種語義,. 頁 693)。與外物互動的描寫,往往是作者透過感. 詩人刻意引發讀者想像空間,達到言有盡而意無. 官感受以引發讀者相同的感官經驗而產生認知,引. 窮的境界;情境用語指的是不同詞彙共現所烘托. 發感知,進而體會作品,與作者共鳴。共鳴的基礎. 出來的情境,這些詞彙的本身,也許是一般用語,. 來自於人以耳、鼻、口、眼、皮膚、心智等感官與. 也許是特殊用語,但是因為是在同一作品共現而. 認知系統感知客觀外物,所產生的概念體系,具有. 產生的情境,往往就是詩的主題,這些詞彙的語. 多數人相同的共通性特徵。人的客觀認知加上主觀. 義必須與詩中其他詞彙共現才能顯示。由此可. 感知、哲理思維體系構成概念系統,當作者與讀者. 知,植基於文本內涵及語義學的詞彙語義標記,. 之間具有共同的知識基礎、情感經驗及概念體系,. 可以使電腦對文本內容含義的理解與判斷更接近. 便能夠產生感同身受的共鳴。. 人的認知觀點。如前所述,詩詞語言是特殊的語. 以詩詞裡寫及苔蘚的作品為例,苔蘚植物是由. 言形式,比起其他文體,存在著更多一詞多義,. 水生生活趨向陸生生活的植物族群,生長於極端潮. 一義多詞的現象,加上詩句語義或詩作主題不一. 濕的向陽地區或是陰暗的環境中,以配合其親水性. 定在單一詞彙顯示,而是以共現的詞彙整體烘托. 結構,不然便很快枯死。這些地方往往也是人跡罕. 出來,增加語義標記的困難,但相對而言,也可. 至之處,這是我們對於苔蘚的客觀認知基礎(註. 以從中歸納、推斷詩的主題。. 9)。由於苔蘚性喜陰暗潮濕的特性,潮濕陰暗在感 官上給人清冷幽深的感覺,因此詩詞中寫到苔蘚. 陸、概念體系與語言知識本體. 時,往往是「江邊道路多苔蘚,塵土無由得上衣。」. 何謂概念體系(Conceptual system)? 萊科夫. (彭定求,1960,頁 5617)的失意文人,或是「玉階. (1987/梁玉玲等譯,1994)曾提出「甚麼是概念體系. 陰陰苔蘚色,君王履綦難再得。」(彭定求,1960,. 以及它是如何組織的?所有的人是否都用同樣的. 頁 1026)的失寵佳人,或是「天花寂寂香深殿,苔. 70.

(9) 植基於中國詩詞語言特性所建構之語義概念分類體系研究. 蘚蒼蒼閟虛院。」(彭定求,1960,頁 1574)的塵外. 同的,那麼,以本體知識解構文學作品,再重新建. 僧人,或是「肌膚銷盡雪霜色,羅綺點成苔蘚斑。」. 構成為電腦可以讀懂的知識體系,便可以使電腦具. (彭定求,1960,頁 8326)的空閨女子,或是「花木. 備接近人的知識體系。. 閒門苔蘚生,滻川特去得吟情。」(彭定求,1960,. 詩詞的語義概念體系建立在詩詞語言知識本. 頁 7325)的山林雅士。「苔蘚」若是長於門前或台. 體上。本體論(Ontology)在十七世紀以後成為哲學. 階,詩人將之與「門」 、 「階」並列呈現時,更核心. 論述的課題,資訊科學引用本體論,起始於人工智. 的集中在描寫因失寵而幽居空閨女子的淒清冷. 慧領域的研究,引用作為組織、分類、管理及描述. 落。鄭谷〈長門怨,二首之二〉 : 「流水君恩共不回,. 知識的基礎,並且成為語義網的基本理論,本體論. 杏花爭忍掃成堆。殘春未必多煙雨,淚滴閒階長綠. 也開始被應用在不同的學門,本研究不僅是建立詩. 苔。」(彭定求,1960,頁 7762)便是以無人前來而. 詞語義網,還進一步將語義概念予以分類,建立語. 長滿綠苔的閒階,婉轉呈現幽居於此的空閨女子,. 義概念分類知識體系,最終目的是建立詩詞語言知. 因君恩不回,門前冷落,階閒無用而長滿綠苔的蒼. 識庫。. 涼景象(羅鳳珠,2007)。從這個例子可知,多數人. 柒、詩詞語言的語義概念分類方法及分 類體系. 因為具有共同的知識基礎,而有共同的認知,進而 能引發感同身受的感知。 但是,感知也會因為個人的特殊經驗、遭遇、. 使用者的認知行為,除了前述所論及對詞彙的. 情性而有差異。從李白〈月下獨酌〉 : 「花間一壺酒,. 知識認知、情意感知、情境感知之外,使用者還具. 獨酌無相親。舉杯邀明月,對影成三人。」(彭定. 備由各種單一詞彙的知識所建構的知識體系,以及. 求,1960,頁 1853)李商隱〈春日寄懷〉 : 「縱使有. 理解、感受詩詞作者在詩詞作品內容所創造的豐富. 花兼有月,可堪無酒又無人。」(彭定求,1960,. 語義、語境與情境,這是只能分辨字形的電腦所無. 頁 1853)等作品,可知「花、月、酒、人」被多數. 法具備的。詞彙經過語義標記,雖然已經能夠使電. 詩人認為是自然界與人世間的美好事物,但是在亡. 腦初步具有分辨語義的能力,但也只是零星片段沒. 國之君李煜筆下的〈虞美人〉 :「春花秋月何時了」. 有經過組織的語義,不符合人的知識體系,難以觸. (張璋、黃畬,1986,頁 444),春花秋月成為不忍. 引對詩詞的感發能力。. 面對,不堪忍受的事物,這是因境遇不同而產生的. 本研究以詩詞文本所切分之詞彙為單位,先建. 個別差異。. 立詞彙語義標記,再依據語義類別建構語義概念,. 從「苔蘚」及「花、月、酒、人」的例子,正. 依語義概念分類。電腦除了無法分辨字詞義,也無. 可以印證萊科夫所提出的說法,不同的文人以其對. 法判斷詞組的構詞單位,因此,正確的詞彙切分是. 苔蘚的客觀認知:「苔蘚生長在潮濕而人跡罕至之. 語義標記的基礎工作,也是重要的關鍵。. 處」以及視覺經驗:「看到長滿苔蘚的道上、院中、. 詩詞是特殊的語言形式,其特殊性包含語義、. 門前、階下」,依據客觀的經驗,想像這裡住著失. 構詞構句、篇章結構的特殊。除了使用專有名詞或. 意文人、失寵佳人、塵外僧人、空閨女子、山林雅. 典故之外,詩詞文體以雙音節及單音節詞為主,尤. 士。. 以雙音節詞居多。因遷就雙音節及平仄格律,使得 如果人的概念系統是有規則的,如果所有的人. 詩詞語言的構詞方式與其他文體不同,有些詞彙只. 都有同樣的概念系統,如果多數人的多數概念是相. 用於詩詞,不用於其他文體。或該詞彙在詩詞裡是. 71.

(10) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). 通順而有意義的詞彙,但是當抽離詩詞文本時,這. 完整的詞句是:「花下提壺盧鳥勸人提起葫蘆喝. 個詞彙往往不通順或無法顯示完整語義。舉例說明. 酒」,因為格律的約束,全句使用了倒裝句、雙關. 如下:. 語、縮略語。 詩詞的句法有固定的規則,五言詩之前二. 一、構詞特殊:. 字,七言詩之前四字,除非使用專有名詞或典故, 多數以雙音節詞為主。唐宋詞除了使用單字領字. 1.使用其他文體罕用的詞彙. 的句子第一個詞彙是單字詞,其他句子及扣除單. 白居易〈賦得古原草送別〉 : 「離離原上草,一. 字領字之後的句子,也以雙音節詞為主,例如柳. 歲一枯榮」(彭定求,1960,頁 4836)的「離離」 ;. 永〈八聲甘州〉 : 「對/瀟瀟/暮雨/灑/江天……. 蘇武〈結髮為夫妻〉 : 「參辰皆已沒,去去從此辭」. 漸/霜風/淒緊,/關河/冷落,/殘照當/樓。」. (蕭統,1986,頁 1355)的「去去」,在其他文體很. (唐圭璋,1983,頁 43)的「對」 、 「漸」字是領字,. 少使用。. 領字之外是五或七個字,句法與五、七言詩一樣 (羅鳳珠、曹偉政,2008,頁 189-220)。. 2.名詞雙舉並列,以豐富詞義. 五言詩的句法多數是上二下三(夜來/風雨 孟浩然〈過故人莊〉 : 「把酒話桑麻」(彭定求,. 聲,花落/知多少),下三部分作上二下一(風雨/. 1960,頁 1651)、施肩吾〈山中喜靜和子見訪〉 : 「每. 聲),或作上一下二(知/多少),而可以再細分為二. 逢猿鶴即相親」(彭定求,1960,頁 5605)。: 「桑. 二一(夜來/風雨/聲)或二一二(花落/知/多少). 麻」與: 「猿鶴」以名詞並列方式構詞,除了詞彙. 的句法;七言詩前四句是二組雙音節詞,多數是二. 本身的語義之外,還彰顯其並列所產生的言外之. 二一二或二二二一句法。五、七言詩之末三字,是. 意,如果予以切分為單字詞,不但因並列所烘託的. 上二下一或上一下二沒有固定的規則。五言詩的前. 語義將隨之消失,也不符合詩詞雙音節詞的構詞特. 二個字及七言詩的前四個字,除非是專有名詞或典. 性。. 故,鮮少使用單字或三字詞,因此依據詩的句法做 適切的詞彙切分,切分的優先順位是:(1)專有名. 二、構句特殊:. 詞;(2)詞的領字;(3)典故(羅鳳珠,2005)。末三字. 1.詞彙分散在上下句. 在名詞及典故優先的前提下,比對已切分出來的詞. 蘇軾 〈張子野年八十五尚聞買妾述古令作. 彙,相符合者,則先認定為詞彙,最後再以人工校 正。. 詩〉:「詩人老去鶯鶯在,公子歸來燕燕忙」(王文. 詩詞內容所描寫的元素包括人、事、時、地、. 誥,1982,頁 523),因詩詞格律的關係,「鶯鶯燕. 物五種,寫哪些人在哪些時間,哪些地方做過、發. 燕」詞被分散在上下句對仗的位置。. 生過哪些事,牽涉哪些物(以哪些物作為物象與意. 2.使用縮略倒裝語. 象)。小說、戲曲等多數文學作品的內容都包含這 五項元素,而且都是直接描寫。散文、詩詞因篇幅. 蘇軾〈和子由柳湖久涸忽有水開元寺山茶舊無. 較短,其描寫方式,或直接表述,或隱藏在字裡行. 花今歲盛開,二首之一〉 : 「如今勝事無人共,花下. 間間接表述。直接描寫者,如柳宗元〈江雪〉 : 「千. 壺盧鳥勸提」(王文誥,1982,頁 335-336),下句. 山鳥飛絕,萬徑人蹤滅。孤舟蓑笠翁,獨釣寒江雪。」. 72.

(11) 植基於中國詩詞語言特性所建構之語義概念分類體系研究. (彭定求,1960,頁 3948)詩句裡直接書寫:人(蓑. 義詞詞群」建立控制詞彙,藉以統攝相同(近)語. 笠翁)、事(獨釣)、時(寒冬)、地(江邊)、物(孤舟)。. 義概念的詞彙。詞彙語義標記所建立的語義概念. 間接表述者,如杜甫〈八陣圖〉:功蓋三分國,名. 予以分類,建立分類體系架構。分類的考慮以符. 成八陣圖。江流石不轉,遺恨失吞吳。」(彭定求,. 合詩詞語言特性、保留詩詞語義內涵、滿足文學. 1960,頁 2504)包含:人(諸葛亮、劉備、孫權、周. 研究與教學需要為前提,其次考慮分類學的意. 瑜、曹操……)、事(吳、蜀、魏三分天下之爭戰,. 義。包含詩詞全部內容的「詩詞詞彙表」經過語. 劉備遺恨失吞吳之史事)、時(三國時代)、地(魚復. 義概念分類之後,便可以成為詩詞詞彙的各種領. (腹),今四川奉節縣)、物(八陣圖)。人、事、時、. 域詞彙,進而建立人名、動物、植物、建築物…‥. 地、物隱藏在字裡行間。. 等各種領域詞彙庫。. 本研究將詩詞作品之詞彙以前述方法切分之. 詩詞詞彙表每一組同近義詞詞群以控制詞彙. 後,以詞彙為單位進行語義標記,並將同近義詞. 統攝之,舉例如表 1:. 詞彙建立「同近義詞詞群」 ,再針對每一組「同近. 表1. 同近義詞控制詞彙及詞群表 控制詞彙. 同. 近. 義. 詞. 詞. 群. ( 詩. 詞. 詞. 彙 ). 李白. 李白、太白、李太白、李謫仙、謫仙李、謫仙、騎鯨公子、謫仙人、李青蓮. 一年. 一載、一歲、一稔、一春、一年、一秋……. 浣花溪. 花溪、浣花溪、浣沙、浣紗、浣沙溪. 崑崙山. 崐崙、昆侖、昆崙、昆岡、崑崙、崑崙山、崙崑山、崑岡、崑山、崑崗. 月亮. 月、月華、太陰、玉兔、玉鉤、玉蜍、玉盤、玉輪、玉蟾、生魄、冰壺、冰輪、冰鏡、 冰鑑、兔影、兔魄、孤輪、明蟾、金波、金輪、秋蟾、飛鏡……. 本研究因詩詞文體內容所包含的元素,以. 詞彙經過詞彙控制所建立的「詩詞詞彙表」,其二. 「人、事、時、地、物」作為最上層的大類,無法. 是詩詞語義概念分類體系,以「控制詞彙」連結「詩. 包含在這五項元素的概念,另以「其他」類概括之。. 詞詞彙表」與「詩詞語義概念分類體系」二者之間. 大類之下再分為「中類」、「小類」。所建立的詩詞. 的聯繫關係,關係表如圖 1:. 語義概念分類體系包含二部分:其一是以詩詞作品. 73.

(12) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). 詩詞文學作品 詩 詞 語 義 概 念 分 類 體 系. 總 類. 人. 大 類. 中 類. 事. 人 名. 禮 俗. 本 名. 別 名. 時. 時 間. 地. 物. 四時 節氣. 四 季. 節 慶. 飲 食. 動 物. 其他. 生 物. 器 物. 植 物. 神 物. 建築 物. 人名領域 詞彙索引. 動物領域 詞彙索引. 植物領域 詞彙索引. 神物領域 詞彙索引. 控制 詞彙. 控制詞彙 李白. 控制詞彙 杜鵑. 控制詞彙 牡丹. 控制詞彙 鳳凰. 同近義詞群. 同近義詞群. 詩詞文本抽取之詞群表. 詞彙 索引. 同近義詞群. 同近義詞群. 詩詞詞彙. 謫仙. 詩詞詞彙. 太白. 圖1. 杜鵑. 鶗鴃. 詩詞詞彙. 詩詞詞彙. 牡丹. 鳳凰. 魏紫. 詩詞詞彙與語義概念關係圖 74. 彩鳳.

(13) 植基於中國詩詞語言特性所建構之語義概念分類體系研究. 詩詞語義概念分類體系在第一層「人、事、時、. 容,其知識類別便不會出現在詩詞語義概念分類體. 地、物、其他」等六大類之下,總計分為 50 中類,. 系裡,分類的方法、原則、類別也與現代漢語不同。. 368 小類。予以標記語義及分類的詞彙以實詞為原. 分類類別的數量也可能隨著用以分類之詩詞文本. 則,助詞、介詞、連詞、感嘆詞等虛詞的語義須附. 的增加而有所調整。. 著在實詞上,實詞裡的副詞也須和實詞連結,詞義. 為了統一分類的層級、類別名稱之相斥性以及. 才能完整顯示,因此這些詞彙暫時不標記語義及分. 相近類別之聚合性,因此在同一類別、同一層級之. 類。但是虛詞裡的擬聲詞所代表的含義,有些是某. 下,於括弧中再加上可以區分之名稱,例如在「植. 些物象的聲音,故予以標記及分類。本研究分類的. 物專名」之後,再於括弧中加上描述文字予以區. 標的是中國詩詞文獻,所分類別是將詩詞文獻所切. 分:植物專名(木本)、植物專名(草本)、植物專名(禾. 分之詞彙,依據前述之原則予以分類,所得結果是. 本)、植物專名(苔菌)、植物專名(瓜果),各類別數. 詩詞內容所包含的語義,不是完整的詞義,也不是. 量及類別名稱如表 2:. 完整的人類知識體系,因此有些古典詩詞缺乏的內. 表2. 各類數量表 大. 類. 中. 類. 小. 類. 人. 14. 118. 事. 8. 29. 時. 2. 17. 地. 7. 53. 物. 12. 126. 7. 25. 其他 總計:6 大類. 50 中類. 368 小類. 表3. 詩詞語義概念分類類別表 ( 類別標題前有「*」符號者為本研究新增類別 ) 大類 人. 中 人名. 類. 小. 類. 本名、別名字號、人名他稱、法號、外國人名、虛構人名、人名(合稱)、待考 人名(註 10). 人. 朝代君王. 君王帝號、君王年號、君王陵墓(註 11). 人. 神鬼仙人. 神鬼仙人(專稱)、神鬼仙人(泛稱)、菩薩尊號. 人. 稱謂. 人稱代名詞、指代稱謂、一般稱謂、自稱謙稱、尊稱美稱、貶稱惡稱、親人稱 謂、職業身份、職官爵位、皇室稱謂、宗教稱謂 (續下表) 75.

(14) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). (接上表) 大類. 中. 類. 小. 類. 人. 身體器官. 五官顏面、鬚鬢髮膚、身體四肢、五臟器官、分泌物、身體器官(合稱). 人. *感官詞. *嗅覺、*聽覺、*味覺、*視覺、*觸覺. 人. *情感詞. *情感(概稱)、*正面情感(喜悅欣樂)、*正面情感(自我肯定)、*正面情感(景. (綜合情感). 仰羨慕)、*正面情感(悠然自適)、*正面情感(憐惜愛寵)、*負面情感(自我否 定)、*負面情感(惱怒怨妒)、*負面情感(悲哀傷痛)、*負面情感(感懷惆悵)、 *負面情感(憂愁掛慮)、*負面情感(厭煩憎惡)、*負面情感(懊惱憾惜)、*負 面情感(擔驚受怕)、*負面情感(辛酸艱苦)、*負面情感(慚愧自責)、*負面情 感(驕矜自恃)、*負面情感(思鄉念舊)、*負面情感(尷尬為難)、*綜合情感(相 反合稱)、*綜合情感(相近合稱). 人. *情感詞. *傾心愛戀、*相思怨懟. (兩性情感) 人. 品德性情. 正面品性、負面品性. 人. 動作(人). 一般行為(人部)、一般行為(刀部)、一般行為(口部)、一般行為(土部)、一般行 為(彳部)、一般行為(手部)、一般行為(日部)、一般行為(水部)、一般行為(糸部)、 一般行為(衣部)、一般行為(艸部)、一般行為(言部)、一般行為(貝部)、一般行 為(走部)、一般行為(足部)、一般行為(馬部)、一般行為(宀部)、一般行為(攴部)、 一般行為(辵部)、一般行為(其他部)、言語動作、生活活動、官場活動、治國 之道、藝文活動、娛樂活動、戰爭活動、行蹤消息。(註 12). 人. 狀態(人). 生理狀態、心智狀態、心理能願、生活狀態、心神氣力、人類狀態(相反合稱)、 人類狀態(相近合稱)、人類狀態(相異合稱). 人. 形容詞彙(人). 氣質內涵、外表形貌、人生機遇、官場境遇. 人. 文藝. 文體、引文、書篇名、舞蹈、戲劇、書籍(泛稱)、書籍(專名)、樂曲(泛稱)、樂 曲(專名)、書畫(泛稱)、書畫(專名)、書法(泛稱)、書法(字帖專名)、. 人. 專業術語. 佛家語、作戰語、法術語、道家語. 事. *典故. *佛學典故、*神話典故、*一般典故. 事. 刑責法規. 刑責、法規. 事. 禮俗. 祭祀、婚喪喜慶、其他禮俗、節慶. 事. 災厄. 旱災、水災、地震、兵災、其他災害、災厄預兆. 事. 祥瑞. 福泰祥安、祥瑞預兆. 事. 事件. 史事、事件(概稱)、世局、國家氣運. 事. *行政體系. *部門名稱、*國名、*朝代名號(單稱)、*朝代名號(合稱)、*民族邦國名(單 稱)、*民族邦國名(合稱) (續下表) 76.

(15) 植基於中國詩詞語言特性所建構之語義概念分類體系研究. (接上表) 大類. 中. 類. 小. 類. 事. 疾病. 疾病療法、疾病類別. 時. 四時節氣. 節氣、四季. 時. 時間. 明確時間、相對時間、年齡時間、範圍時間(今昔)、範圍時間(日)、範圍時間(月)、 範圍時間(一生)、範圍時間(年)、範圍時間(世代)、範圍時間(清晨)、範圍時間 (白晝)、範圍時間(黃昏)、範圍時間(夜晚)、範圍時間(時刻)、範圍時間(其他)(註 13). 地. *地名. 行政地名、街坊地名、山嶺地名、島嶼地名、*外國地名、河湖地名(江河溪 流)、河湖地名(湖海池潭)、河湖地名(沙洲)、關津地名(關隘)、關津地名(門)、 關津地名(津堤)、關津地名(港口)、關津地名(橋)、地名別稱(行政地名)、地名 別稱(街坊地名)、地名別稱(山嶺地名)、地名別稱(河湖地名)、地名別稱(島嶼 地名)、地名別稱(關津地名)、*地名(合稱)、虛構地名(註 14). 地. *地理. 全域範圍、境外區域範圍、邦國都城、郊原村野、街道巷弄、境內區域範圍(全 域)、境內區域範圍(泛稱)、境內區域範圍(東方)、境內區域範圍(西方)、境內 區域範圍(南方)、境內區域範圍(北方)、*特殊場域、*場域(概稱). 地. *自然景觀. 山峰崖嶺、水澤湖泊、沙洲島嶼、洞穴坑谷、林原莽漠、*山川泛稱、關津渡 口(關隘)、關津渡口(津堤)、關津渡口(合稱)、*風景勝蹟(自然景物)、*風景 勝蹟(季節景物)、*風景勝蹟(人造景物). 地. *閬苑仙境. *閬苑、*仙境. 地. *幽冥之境. *幽冥. 地. *人世之境. *人間. 地. *空間. *方向、*位置、*距離. 地. 天候氣象. 風霜雪露、雲霧煙霞、雷電雹霓、冷寒、熱旱、晴天、陰雨、天候氣象(相反 合稱)、天候氣象(相近合稱)、天候氣象(相異合稱)、天候氣象(概稱). 物. *生物. *神物(動物)、*神物(植物)、*神物(合稱)、*神物(泛稱)、動物專名(走獸)、 動物專名(飛禽)、動物專名(昆蟲爬蟲)、動物專名(水生兩棲)、動物專名(合稱)(註 15)、動物指稱(皮毛)、動物指稱(泛稱)、動物指稱(其他)、動物指稱(合稱)、植 物專名(木本)、植物專名(草本)、植物專名(禾本)、植物專名(苔菌)、植物專名 (瓜果)、植物專名(合稱)、植物泛稱(花)、植物泛稱(木)、植物泛稱(葉)、植物 泛稱(枝)、植物泛稱(果)、植物泛稱(草)、植物泛稱(莖)、植物泛稱(根)、植物 泛稱(苗)、植物泛稱(合稱)、*生物(異類合稱). 物. *狀態(生物). *動物生命狀態、*植物生命狀態 (續下表). 77.

(16) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). (接上表) 大類. 中. 類. 小. 類. 物. *動作(動物). *動物動作. 物. *動態(植物). *植物動態. 物. *器物. 生活用品(飲食器具)、生活用品(烹飪器具)、生活用品(裝置容器)、生活用品(起 居用品)、生活用品(其他用品)、生活用品(梳妝用品)、交通工具(水路)、交通 工具(陸路)、交通工具(空路)、*交通工具(合稱)、工具用品(兵器單稱)、工具 用品(兵器合稱)、工具用品(戰爭工具)、工具用品(農牧漁獵工)、工具用品(生 活工具單稱)、工具用品(生活工具合稱)、工具用品(刑具)、絲帛服飾(衣冠腰 帶)、絲帛服飾(布料)、絲帛服飾(鞋襪)、絲帛服飾(配飾)、絲帛服飾(合稱)、宗 教用品、喪葬祭祀、娛樂器具、金帛錢幣、公堂器物、旗幟、帳幕、神器、樂 器(單稱)、樂器(合稱)、樂器(泛稱)、文具(單稱)、文具(合稱)、文具(泛稱)、* 器物(合稱)、*器物(泛稱). 物. *建築物. 建築專名(宮室屋廬)、建築專名(亭臺樓閣)、建築專名(園林院落)、建築專名(寺 廟道觀)、*建築專名(碑塔陵墓)、宮室屋廬、亭臺樓閣、園林院落、寺廟道觀、 *碑塔陵墓、公署建築、建築部件、軍事攻防. 物. 飲食. 飲品(茶)、飲品(酒)、飲品(其他)、食品、食材、糕點、調味品、菸草、宴席、 飲食(合稱). 物. *自然資源. 玉石、火、金屬、*礦物、燃料、*自然資源(同類合稱)、自然資源(異類合稱). 物. 天文. 日、月、星、天空、銀河、天文(同類合稱)、天文(異類合稱). 物. *事物. *事物(概稱). 物. *形態詞彙. *景物形態、*植物形態、*動物形態、*物品形態、*環境狀態. (物) 其他. *顏色. *原色、*借色、*間色、*顏色(概稱). 其他. *狀態. *對比狀態(其他類). (其他類) 其他. *形容詞彙. *形容對比詞(其他類). (其他類) 其他. *狀聲詞. *自然界聲音、*動物聲音、*人類聲音、*器物聲音. 其他. *現象. *光芒、*陰影、*自然現象. 其他. *單位詞. *文藝單位、*長度單位、*重量單位、*面積單位、*容量單位、*個體量 詞、*集合量詞、*不定量詞、*動量詞. 其他. *數詞. *定量數詞、*概量數詞、*等級數詞. 78.

(17) 植基於中國詩詞語言特性所建構之語義概念分類體系研究. 表 3 之詩詞語義概念分類類別表,列出第一. 生物類為例,各選一小類列出完整的語義概念分. 至第三層之語義類別,表 4 以物類之器物、四時、. 類。. 表4. 完整的語義概念分類表 大類. 中. 類. 物. 器物. 時. 四時節氣. 物. 生物. 小. 類. 生活用品 (裝置容器) 四季 植物專名 (禾本). 控制詞彙. 詞群(依據詩詞文本切分所得的詞彙). 領域詞彙. 甕. 瓦甕、酒甕、石甕、小甕、破甕……. 容器領域詞彙. 春. 春溫、春在、新春、逢春、春妍……. 春季領域詞彙. 竹. 翠竹、修竹、墨竹、竹林、竹間……. 竹子領域詞彙. 捌、本研究的分類與歷代各書分類的異 同. 《唐詩分類大辭典》等六部與詩詞相關之典籍比 較,其分類類別數與層級數比較如表 5:. 將本研究所做的分類與《藝文類聚》、《初學 記》、《唐詩類苑》、《古詩類苑》、《淵鑑類函》、. 表5. 各典籍分類類別數與層級數比較表 編. 者. 唐代,歐陽詢等 唐代,徐堅等. 項. 目. 及. 分. 類. 標. 的. 層級數. 大類. 中類. 小類. 類別數. 類別數. 類別數. 《藝文類聚》. 2. 無. 46. 757. 《初學記》. 2. 無. 26. 313. (敘事、事對之詞彙、詩賦文章). 明代,張之象. 《唐詩類苑》. 2. 無. 38. 1,089. 明代,張之象. 《古詩類苑》. 2. 無. 44. 779. 清代,張英、王士禎、 《淵鑑類函》. 2. 無. 45. 2,806. 2. 無. 40. 1,083. 4. 6. 50. 368. 王惔等 當代,馬東田等. (事對之詞彙、詩賦文章) 《唐詩分類大辭典》. 本研究分類(第四層之控制詞彙表未列入). 79.

(18) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). 要考量,限於篇幅,不在本文討論。新增類別表如. 前列各書用以分類的標的不同,但是都分為二. 表 3 之類別標題前有「*」符號者。. 層。各書第一層所分類別比較接近,第二層因為內 容數量及涵蓋範圍多寡不同,分類詳略精粗也不. 玖、結論與未來的發展. 同,類別數量差異比較大。《藝文類聚》、《初學 記》、《淵鑑類函》兼顧標題、內容主題、詞彙含. 詩詞語言的特殊性增加了詩詞詞彙切分及語. 義;《唐詩類苑》、《古詩類苑》、《唐詩分類大. 義標記、語義分類的困難。詩詞語義概念的分類,. 辭典》依標題或詩題字面含義分類,難以兼顧多重. 除了必須符合知識認知層次的語言知識分類,還. 主題,其分類結果,或只取一種主題,或將同一作. 需顧及情感感知層次的意象取向分類。有些詩詞. 品分列在不同類別項下。也容易發生因為主題與詩. 作品所呈現的情韻及理趣,需要從詩詞全文篇章. 題字面含義不相符而錯分,或分類與詩作內容不合. 結構才能體會,這一類的詩詞所使用的詞彙語義. 的情形,從前述所舉例子即可知。. 及語用,也與前述所分析之一般用語、特殊用語、. 本研究依據詩詞文本內容所切分的詞彙標記. 情境用語的情況不同,只標記其一般語義,很難. 語義,再進行語義概念分類,優點是:分類可以更. 顯示其情韻與理趣,作品的主題也較難歸類。充. 切合主題含義並兼顧多元主題、可以從所分類類別. 滿情韻的詩作,如李白〈山中與幽人對酌〉:「兩. 建立詩詞韻文之知識組織及知識體系架構、較能符. 人對酌山花開,一杯一杯復一杯。我醉欲眠卿且. 合文學及文學語言學研究使用需求。缺點是資料數. 去,明朝有意抱琴來。」(彭定求,1960,頁 1856). 量太大,難以單憑人力處理、雖可顯示多元主題,. 充滿理趣的詩作,如蘇軾〈題沈君琴〉:「若言. 但主題不易集中,較難呈現主從關系。. 琴上有琴聲,放在匣中何不鳴?若言聲在指頭. 比較各家分類,各家共有的類別如下:天、歲. 上 , 何 不 於 君 指 上 聽 ? 」 ( 王 文 誥 , 1982 , 頁. 時、地、山、水、州郡、帝王、職官、治政、禮、. 2534-2535)或是兼有情韻及理趣的詩作,如楊萬里. 樂、文、武、人、居處、器用、服食、玉帛、草、. 〈戲筆〉:「野菊荒苔各鑄錢,金黃銅綠兩爭妍。. 果、木、鳥、獸、鱗介、虫豸等二十五部。各家不. 天公支與窮詩客,只買清愁不買田。」(傅璇琮,. 同的類別(含詳略不同、涵蓋範圍不同)如下:中. 1991-1999,頁 26258)這些正是所謂「只可意會而. 宮、五穀、內典、方術、火、古諺、巧藝、布帛、. 不可言傳」、「不著一字而盡得風流」、「言有. 刑法、后妃、存逸、寺觀、百穀、舟車、衣冠、技. 盡而意無窮」的作品,語義標記無法顯示其作品. 藝、災異、京都、明良、封爵、帝戚、皇室、軍器、. 主題意涵。. 食物、祠廟、產業、祥異、祥瑞、符命、菜蔬、飲. 詩詞的詞彙以雙字詞居多,但是詩詞句子的字. 食、補亡、道、道釋、儀飾、儒家、儲宮、雜、藥、. 數多數是奇數,所以多數奇數字數的句子之中都會. 邊塞、釋佛、讖數、靈異等四十三部。. 有一個單字詞,單字詞的詞義比雙字詞更豐富多. 本研究分類與歷代類書比較,以能涵蓋詩詞文. 變,這也增加了詞義標記的複雜性。. 學內容之人、事、時、地、物、其他等六大類為最. 詩詞裡典故用語的標記方式比一般用語困. 上層,這是前書所舉各書所無。新增中類 21 類,. 難,由不同詞彙共現以烘托某種情境的情境用語,. 小類 98 類,僅新增部分小類的中類有六類。類別. 其詞義無法以單一詞彙之詞義顯示或涵蓋,這些特. 的增減分合,以詩詞語言特性及提供文學研究為主. 80.

(19) 植基於中國詩詞語言特性所建構之語義概念分類體系研究. 殊詞彙的語義,需要仰賴更多相關的研究,用更多. 目,只緣身在此山中。」(王文誥,1982,頁 1219). 分析、統計、歸納的方法尋找出規則。. 或如朱熹〈觀書有感〉:「半畝方塘一鑑開,天光 雲影共徘徊。問渠哪得清如許,為有源頭活水來。」. 詩詞語義標記的困難,還包括詩詞喜用多義 字來創造聯想的空間,以引出無窮的趣味及意在. (傅璇琮,1991-1999,頁 27500)這些哲理詩需仰賴. 言外的情境,例如古詩十九首之〈行行重行行〉:. 讀者的哲理思維領悟,當然也不是單獨的詞義標記. 「相去日已遠,衣帶日已緩」(蕭統,1986,頁. 所能夠清楚描述的,想要借助詞義標記或語義概念. 1342)之「遠」字,意指時間之長遠及空間之遙. 分類讓電腦能理解,其難度又比深層義及言外義更. 遠,含有雙重語義。袁行霈教授〈中國古典詩歌. 高,在分類上,只能以詩的主題作分類。. 的多義性〉文中即闡明: 「一個多義詞固然有多種. 從以上論述可知,可以透過語義標記及語義概. 意義,歧義是一般情況下使用語言時需要特別避. 念分類,讓電腦從分辨字形提升到理解詞義,使電. 忌的毛病。但是在詩詞裡,恰恰要避免詞義的單. 腦的認知能力更接近人的知識體系。人的知識體系. 一化,總是盡可能地使用詞語帶上多種意義,以. 分為「對知識的認知」、「對情意的感知」、「對哲. 造成廣泛的聯想,取得多義的效果。中國古典詩. 理的辨知」,認知是表述的層次,感知需要聯想輔. 詞的耐人尋味,就在於這種複合的作用。」(袁行. 助,哲理詩的解讀體會,卻不是單純的邏輯思維能. 霈,1989,頁 6)文中袁教授並將詩詞語言的多義. 解決,也就更難以用語義標記處理。. 性分為宣示義及啟示義二種,啟示義包含雙關. 唐宋詩詞語義標記及分類的架構是以唐宋詩. 義、情韻義、象徵義、深層義、言外義五種(袁行. 詞的文本內容為範圍,並不包含唐宋詩詞內容之外. 霈,1989)。宣示義是借助語言明確表達給讀者的. 的其他詞彙或知識。本研究進行的過程,最初是以. 語義,如王維〈積雨輞川莊作〉:「漠漠水田飛白. 蘇軾全部詩作為基礎,建立蘇軾詩作的詞彙庫及語. 鷺,陰陰夏木囀黃鸝。山中習靜觀朝槿,松下清. 義標記及分類資料庫,其後加入了宋代七家詞人. 齋折露葵。」(彭定求,1960,頁 1298)只有字面. (註 16)、四百萬字的全台詩(羅鳳珠,2006),以這. 含義。雙關義、情韻義、象徵義能夠從統計學歸. 些文本的詞彙庫、語義標記及分類資料庫為基礎,. 納出規則,能夠從單一詞彙標記其多重含義,如. 進行唐宋詩詞的詞彙切分、語義標記及分類。整合. 前述的苔、蘚,但是深層義與言外義的含義隱藏. 不同文體(詩、詞)、不同時代(唐、宋、清末至民國)、. 在字詞表面含義之外,以整首詩來烘托,這些詩. 不同寫作背景(中國大陸及台灣),但是構詞方式相. 即是前人所謂「言有盡而意無窮」、「不著一字而. 近的韻文文本,所含括的詞彙也因為文體、時代、. 盡得風流」的作品,讀者要了解這些深層含義,. 寫作背景的差異而有些微不同,因此需要再進行人. 必須要了解作者及寫作對象的背景資料,必須要. 工校對。. 具備更豐富的學養及詩詞鑑賞能力才能夠體會,. 唐宋詩詞網站所包含的文本數量龐大,人工校. 以詞彙為單位的語義標記無法完整標記這一類詩. 對所需要花費的人力很多。本研究的語義標記及分. 詞的完整含義,想要讓電腦理解,誠非易事。. 類只針對表中項目所訂的類別分類,撰寫本文時,. 宋代以後,受到理學發達及禪宗思想的影響,. 還來不及完成全部文獻的人工校正,語義分類的完. 有很多的哲理詩,如前述蘇軾〈題西林壁〉:「橫. 整性及準確性必定還有不足之處,也勢必會隨著文. 看成嶺側成峰,遠近高低總不同。不識廬山真面. 本的增加而調整,尚待後續的研究修正及補足。本. 81.

(20) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). 研究目前只完成上下階層的樹狀結構,尚未處理橫. 以語義概念分類所建立的語義概念檢索功. 向階層的相關性結構,這些都有待後續的研究補. 能,可以檢索到字形不同但語義相同的資料,例如. 足。. 以月(月亮)的語義概念可以檢索到玉盤、嬋娟、玉 語義標記及語義概念的分類,除了可以建立詩. 兔等語義與月亮相同的資料,而二月、三月等時間. 詞語言語義資料庫、詩詞語言領域詞彙索引典、詩. 詞的月不會被檢索出來,其查全率(Recall ratio)及. 詞語義概念分類知識體系,以及文學及語言學研究. 查準率(Precision ratio)比傳統以字形分辨方法檢索. 使用,還可以提升資訊檢索的質量。資訊檢索所涉. 的完整性高(註 18)。. 及的相關議題,包括認知的元素、語義與多重表述. 本研究從語義學及使用者的認知觀點,以唐宋. 的認知觀點,詞語概念及表述的關聯性,資訊行為. 詩詞網站的設計作為實證的研究,初步建立唐宋詩. 的研究、使用者的交互作用,檢索的策略、搜尋引. 詞語義標記資料庫及唐宋詩詞語義概念分類表,期. 擎、檢索方法的應用等等。被尊為資訊科學之父的. 待後續的研究,能進一步彙整、分析、歸納唐宋詩. Bush (1945) “As We May Think”一文提出:記錄思. 詞語義類別,再與共現詞彙比對,期望能從中建立. 想的文獻儲存在圖書館,圖書館的資料按照字母或. 唐宋詩詞主題分類的方法與規則,以彌補《唐詩分. 數字排列的索引,只能一層一層往下尋找,不符合. 類大辭典》等前代典籍分類的缺失與不足。. 人類大腦以思維聯繫尋找資料的方式,因此,Bush. 由於詩詞語言的構詞形式比較特殊,對多數人. 便構思著建立一個以聯繫(Association)代替索引. 而言,詩詞所使用的語言在一般書面語言或現代漢. (Indexing)以選擇資料的機械化個人文件夾和圖書. 語不常使用,以朏朒為例,這個詞彙意指初三之上. 館(Mechanized private file and library),Bush 將之. 弦月,蘇軾〈贈眼醫天彥若〉:「空花誰開落,明. 命名為 Memex。Bush 期待在這個機器裡可以儲存. 月自朏朒。」(王文誥,1982,頁 1331-1332)用過. 所有的文獻資料,檢索時能如同人類的思維邏輯,. 這個詞彙,今人已少用。詩詞因講究格律及用詞典. 建立知識連結的軌跡以進行聯繫索引,需要引用. 雅,有些書面語言及現代漢語常用的詞彙,在詩詞. 時,所有的資料都可以隨意檢索出來,並且可以快. 裡卻少用或不用,例如月亮,《詩經》、漢樂府詩. 速的找到另一個相關的資料,也可以二個條件同時. 及唐宋詩詞寫月亮的作品很多,卻未曾直接使用月. 並行檢索,這就是 Memex 的基本概念(註 17)。Bush. 亮的詞彙(羅鳳珠,2011)。為了貫穿不同時代、不. 的這篇文章,被認為是第一篇論及超文件基本觀念. 同文體所使用語言的脈絡,建立包含歷代韻文文. 的文獻,啟發資訊科學家對資訊檢索技術之研究。. 本、歷代語體文文本、現代漢語文本的歷代語言知. 依據語義概念分類知識體系建立能分辨語義及含. 識庫,也是未來可以繼續發展的目標。. 有上下層語義層級關係,整體與部分關係等等的語 (收稿日期:2011 年 6 月 2 日). 義概念分類知識體系,正符合「以聯繫取代索引」 的資訊搜尋方法。. 82.

(21) 植基於中國詩詞語言特性所建構之語義概念分類體系研究. 致謝 本研究感謝國科會,【新詩改罷自長吟—唐詩吟唱虛擬實境教學環境建置計畫】,(計畫編號: NSC95-2422-H-155-001)以及【淺斟低唱—宋詞古唱虛擬實境教學環境建置計畫】 (計畫編號:NSC 94-2422-H-155-001)、九十八年度蔣經國國際學術交流基金會「歷代語言知識庫建置計畫」(計畫編號: RG013-D-09)等三項研究計畫經費資助,感謝計畫共同主持人及參與計畫之助理。研究過程中,得到中研 院鄭錦全院士、業師黃啟方教授指導,北京大學蔣紹愚教授、袁行霈教授、俞士汶教授、廈門大學蘇新 春教授提出訂正意見,台灣大學圖書資訊研究所朱則剛教授、陳雪華教授、藍文欽教授、黃慕萱教授給 予很多指導,獲益匪淺,一併致謝。. 註釋 註 1:參見王力(1988)。《王力詩論》之〈略論語言形式之美.詩的語言〉 ,引葉聖陶給王力的書信:「詩之句型, 大別為二。一為平常的句型,與散文及口頭語言大致不異。一為特殊句型,散文絕不能如是寫,口頭亦絕 無此說法,可謂純出於人工」 。 註 2:引自 Ingwersen, P. “Integrative Framework for Information Seeking and Interactive Information Retrieval”:「The framework reflects the understanding that IS & R is a process of cognition for the information-seeking actor(s) or team in context. Algorithmic and IIR, as well as information seeking (IS), involve cognitive and emotional representations are seen as manifestations of human cognition, reflection, emotion, or ideas forming part of IS & R components and kinds of interaction in context」 ,In K. E. Fisher, S. Erdelez & L. Mckechnie (Eds.), Theories of information behavior (The Theories 35, pp215-220). Medford, N.J.: ASIST 註 3:清代彭定求奉敕編纂的《全唐詩》加上陳尚君輯校的《全唐詩補編》,總計收有 2,821 位詩人,51,170 首詩, 《唐詩分類大辭典》收錄分類的詩作只佔全唐詩的百分之二十。 註 4:皎然〈關山月〉 :「家家望秋月,不及秋山望。山中萬境長寂寥,夜夜孤明我山上。海人皆言生海東,山人 自謂出山中。憂虞歡樂皆占月,月本無心同不同。自從有月山不改,古人望盡今人在。不知萬世今夜時, 孤月將□誰更待。」(彭定求,1960:9266) 註 5:霍總〈關山月〉 :「珠瓏翡翠床,白皙侍中郎。五日來花下,雙童問道傍。到門車馬狹,連夜管弦長。每笑 東家子,窺他宋玉牆。」(彭定求,1960:6911) 註 6:中央研究院語言研究所所執行的「數位典藏國家型科技計畫」語言座標計畫,網址: http://linganchor.sinica.edu.tw/ 註 7:中央研究院語言研究所與遠見科技股份有限公司共同開發,中央研究院中英雙語知識本體詞網(The Academia Sinica Bilingual Ontological Wordnet),網址:http://bow.sinica.edu.tw/ 註 8:參 見 中 央 研 究 院 中 英 雙 語 知 識 本 體 詞 網 , 網 址 : http://bow.sinica.edu.tw/ont/bow_sumo_cont.html, 及 SUMO(Suggested Upper Merged Ontology,建議上層共用知識本體),網址:http://www.ontologyportal.org/, 由 IEEE 標準上層知識本體工作小組所建置。這工作小組的目的是發展標準的上層知識本體,這將促進資料. 83.

(22) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). 互通性、資訊搜尋和檢索、自動推理和自然語言處理。 註 9: 引自延陵科學綜合室建置的延陵植物標本閣,網址:http://www.ngensis.com/flora/fn01.htm,苔蘚類單元: http://ngensis.com/flora-b/L&M.htm。檢索時間:2011 年 5 月 2 日 註 10:詩詞作品中有許多人名知本名、身世均不可考,獨立為待考人名。 註 11:君王陵墓有時用以作為該君王之指代稱謂,文本語義若指人,則歸於「人」類,若指建築,則歸於「物」 類。 註 12:文字的部首往往是義符,因此一般行為再依部首分類,例如足部的跑、跳、跪等等。 註 13:將時間細分為清晨、白天、黃昏、夜晚,是因為在詩詞作品裡,時間與情感抒寫的類別有密切關係,例如 思鄉的情懷常寫於黃昏。 註 14:指的是文學作品裡虛構的地名。 註 15:動物專名應是獨立的詞彙,但是將二種動物專名並列為雙字詞詞彙,不予以切分,考量的理由是:一、為 了保存詩詞雙音節詞彙的特性與句法;二、二種動物專名並列,所蘊含的語義往往不是該動物名稱本身的 含義,而是詞彙共現所烘托的情韻義。例如「猿鶴」、「雁鴻」常並列。植物專名保持雙字並列的理由與 動物相同,例如「桑麻」、「桑榆」常並列。其他保留合稱詞彙並列的理由都相同。 註 16:七家詞人包含柳永(218 闋詞)、蘇軾(379)、秦觀(148)、周邦彥(187)、李清照(53)、姜夔(87)、辛棄疾(627)等, 選擇的標準考量北宋與南宋的時代均衡及婉約派與豪放派的風格均衡。 註 17:本段文字從“As we may think”原文摘錄重點。 註 18:參見筆者所建置的:浪淘盡千古風流人物─蘇軾文史地理資訊系統,網址: http://cls.hs.yzu.edu.tw/Su_shi/index.html 及斯文脈脈永留香─台灣古典漢詩傳唱教學地理資訊系統,網址: http://cls.hs.yzu.edu.tw/TWCCP/,都有語義概念檢索功能。. 參考文獻 (南朝‧梁)劉勰著,范文瀾注 (1960)。文心雕龍注‧物色第四十六。香港:香港商務印書館。 (南朝‧梁)蕭統主編 (1986)。文選。上海:上海古籍出版社。 (唐)司空圖 (1989)。二十四詩品。臺北市: 新文豐。 (宋)嚴羽 (1967)。滄浪詩話一卷。台北市:藝文。 (清)王文誥輯註,孔凡禮點校 (1982)。蘇軾詩集。北京:中華書局。 (清)王瑢、紀昀等撰 (1983)。武英殿本四庫全書總目提要,臺北市:台灣商務印書館。 (清)汪灝等撰 (1980)。佩文齋索引本廣群芳譜。臺北市 :新文豐出版社。 (清)彭定求修纂 (1960)。全唐詩。北京:中華書局。 (清)劉大櫆 (1959)。論文偶記。北京:人民文學出版社。 王力 (1988)。王力詩論。南寧市: 廣西人民社出版。 王惠、詹衛東、俞士汶 (2006)。現代漢語語義辭典的結構及應用。語言文字應用,1,134-141。 林杏光主編 (1987)。簡明漢語義類詞典。北京:商務印書館出版。 施懿琳編纂 (2004)。全台詩。臺北市:遠流。. 84.

(23) 植基於中國詩詞語言特性所建構之語義概念分類體系研究 唐圭璋編 (1983),全宋詞。台北:文光出版社。 徐為民主編 (1984)。現代漢語分類詞典。瀋陽:遼寧大學圖書館出版。 袁行霈 (1989)。中國詩歌藝術研究。臺北市:五南。 馬東田主編 (1992)。唐詩分類大辭典。四川:四川辭書出版社。 張璋、黃畬編 (1986)。全唐五代詞。台北:文史哲出版社。 梅家駒主編 (1983/1996)。同義詞詞林。上海:上海辭書出版社。 陳克健 (2003)。概念網。上網日期:2011 年 5 月 2 日。網址:http://ckip.iis.sinica.edu.tw/CKIP/conceptnet.htm 陳克健、黃淑齡、施悅音、陳怡君 (2005)。多層次概念定義與複雜關係表達-繁體字知網的新增架構。漢語辭彙語. 義研究的現狀與發展趨勢國際學術研討會。北京市:北京大學。 傅璇琮等主編 (1991-1999)。全宋詩。北京: 北京大學出版社 萊科夫 (Lakoff, G.)著(1994)。女人、火與危險事物:範疇所揭示之心智的奧秘(Women, Fire and Dangerous Things: What Categories Reveal About the Mind,梁玉玲等譯)。台北市:桂冠。(原作 1987 年出版) 黃居仁、羅鳳珠 (2003)。唐詩三百首知識本體。上網日期:2011 年 5 月 2 日。網址: http://bow.sinica.edu.tw/ont/ts300_ont.html 黃居仁、羅鳳珠 (2004)。蘇軾詩知識本體。上網日期:2011 年 6 月 1 日。網址:http://bow.sinica.edu.tw/ont/ShuShi_ont.html 董大年主編 (1998/2008)。現代漢語分類詞典。漢語大詞典出版社初版/上海辭書出版社再版。 羅鳳珠 (2001)。網路學習模式範例—時空之旅人物篇—蘇軾。上網日期:2011 年 6 月 1 日。網址: http://cls.hs.yzu.edu.tw/su_shih/ 羅鳳珠 (2005)。詩詞語言詞彙切分與語義分類標記之系統設計與應用。在中央研究院主辦,第四屆數位典藏技術研. 討會,台北市。 羅鳳珠 (2006)。全台詩‧智慧型全台詩知識庫。上網日期:2011 年 6 月 1 日。網址:http://cls.hs.yzu.edu.tw/TWP/ 羅鳳珠 (2007)。植基於語義學及使用者認知觀點的詩詞資訊檢索系統設計:以全唐詩網站為例。在日本學藝大學主 辦,第三屆文學與資訊科技國際研討會,日本。 羅鳳珠 (2011)。以語言知識庫為基礎的智慧型作詩填詞輔助系統。教學科技與媒體,95,36-52。 羅鳳珠、李錫捷 (2002)。以 XML 可延伸式標注語言建立文章標誌系統研究-以蘇軾詩詞為範圍。上網日期:2011 年 6 月 1 日。網址:http://cls.hs.yzu.edu.tw/CM/login.htm 羅鳳珠、胡順萍、歐慶亨 (1999)。溫柔在頌-唐詩三百首。上網日期:2011 年 5 月 2 日。網址: http://cls.hs.yzu.edu.tw/Tang300/ 羅鳳珠、張智星、許介彥 (2005)。淺斟低唱—宋詞古唱虛擬實境教學環境建置計畫(國科會數位典藏國家型科技計畫: 94 年度數位典藏創意學習計畫,NSC 94-2422-H-155-001)。桃園縣:元智大學。 羅鳳珠、張智星、許介彥 (2006)。新詩改罷自長吟—唐詩吟唱虛擬實境教學環境建置計畫(國科會數位典藏國家型科 技計畫:95 年度數位典藏創意學習計畫,NSC 95-2422-H-155-001)。桃園縣:元智大學。 羅鳳珠、張智星、許介彥 (2007)。虛擬與實境的交錯:多媒體在文學教學的設計與應用。收入張高評主編(2007)。. 文學數位製作與教學,台北市:五南。 羅鳳珠、曹偉政 (2008)。唐宋詞單字領字研究。語言暨語言學,9(2),189-220。. 85.

(24) 圖書與資訊學刊. 第 3 卷第 3 期(第 78 期). Belkin, N.J. (1990). The cognitive viewpoint in information science. Journal of Information Science, 16(1), 11-15. Bush, V. (1945). As we may think. The Atlantic Monthly, 76(1), 101-108. Ingwersen, P. (1992). Information retrieval interaction. Los Angeles, Calif., Taylor Graham. Ingwersen, P. (1996). Cognitive perspectives of information retrieval interaction: Elements of a cognitive IR theory. Journal of Documentation. 52(1), 3-50. Ingwersen, P. (2001). Cognitive information retrieval. Annual Review of Information Science and Technology, 34, 3-52. Ingwersen, P. (2005). Integrative framework for information seeking and interactive information retrieval. In: K. E. Fisher, S. Erdelez, & L. Mckechnie (Eds.). Theories of information behavior. Medford, NJ: Information Today.. 86.

(25)

參考文獻

相關文件

To enable the research team to gain a more in- depth understanding of the operation of the Scheme, 40 interviews were conducted, including 32 in eight case study

Through a critical examination of some Chinese Christian intellectuals’ discussion on the indigenization of Christianity in China, this paper attempts to show that Chinese

• (語文)術語學習 無助學生掌握有關概念,如 果教師只灌輸術語的定義,例如何謂「動

Experiment a little with the Hello program. It will say that it has no clue what you mean by ouch. The exact wording of the error message is dependent on the compiler, but it might

Augmented reality (AR) is a live direct or indirect view of a physical, real-world environment whose elements are augmented (or supplemented) by computer-generated sensory input

To convert a string containing floating-point digits to its floating-point value, use the static parseDouble method of the Double class..

[16] Dennis, A.R., Nunamaker, J.R., and Vogel, D.R., “A Comparison of Laboratory and Field Research in the Study of Electronic Meeting Systems,” Journal of Management

This study chose a qualitative research method to explore more in-depth information access strategy for the establishment of many commodities, institute of emphasis from