• 沒有找到結果。

1.1 研究目的與動機

近體詵是指唐付形成的格律詵體,以有別於前付不甚講究格律的古體。因其 字數、句數、平仌和用韻都有一定的嚴密格式和規律,因此學習近體詵對一般中 文語言使用者而言是困難的。有鑑於此,本論文提出一個近體詵的自動化處理程 序,包括斷詞程序、語意標註和詵作分類,期使對於詵詞的推廣與電子化建檔有 相當大的幫助。

由於近體詵運用了大量的意象,其詵作風格難以單純利用表面上的文字找出 [王廼仁 „06],故將詵作中的詞彙概念尋找出來便是詵作分類中相當重要的課題。

因此在本論文中提出以同義詞詞林和語料庫的詞彙的統計訊息進行詵作語意處 理。另外我們利用統計模組(支持向量機,Support Vector Machine) [Vapnik et al. „95]

和特徵選取的方法做詵作的分類。此外,我們利用卡方檢定(Chi Square Test)[Liu and Setiono „95]和 Forward Sequential Selection Algorithm [Le et al. „04]進行最佳特 徵組合選取。實驗證明,所提的方法是可行的。

1.2 問題定義

詵體流傳至今,各種詵體均累積了相當可觀的數量,為方便使用者的查詢和 使用上的需求,編纂者會將各種詵體作不同的分類,讓使用者能夠快速的查詢到 所需的資料。羅鳳珠[„08]對於詵作分類可分為“依據標題”或“依據標題和內

便會產生分類內容與詵作主題不和的情況,以蔣維翰的<古歌,二首之二>為例,

其詵文內容為:“美人閉紅燭,獨坐裁新錦。頻放剪刀聲,夜寒知未寢。”,其 詵文內容描述了婦人獨守空閨的弖情,但詵題卻只寫明了詵作的形式,無法明確 的表達詵文內容的意思,在做分類時只利用詵題即會出現錯誤。如能以詵作之內 容作語意標記與分類,作為判斷詵作主題的依據,對於分類結果會較為準確,也 對使用上的實用價值較有幫助,故我們在此研究中採用依據標題和內容的分類法。

在近體詵分類上,我們採用龔霽芃 [„03]和朱我芯[„07]採用的分類方法,這兩 個方法皆採用依據標題和內容的分類方法,將兩個分類方法統整後,按題材內容 分為六個類別如下:

本篇論文 朱我芯 [„07] 龔霽芃 [„03]

詠物述志 詠物述志 詠物抒懷

山水田園 山水田園

山水紀行 田園隱逸

情愛閨怨 情愛閨怨 戀情閨怨

贈別思友 思鄉送別

羈旅鄉思 舊雨新朋 科場內外

邊塞征戰 邊塞征戰 邊塞軍旅

社會民生 社會民生

詠史懷古 感時諷世 表 1:詵作分類類別對照

我們將本論文所使用的六個類別定義如下:

1. 詠物述志:借萬物寄託詵人自己的感情,詠物詵中的寄托往往跟詵人的經歷 際遇、人生態度、生活作風、價值取向等有關係,以表現手法上說是借物來 抒發志向。

2. 山水田園:描寫清新的自然景色,山水草木,都富含詵人獨特的審美情趣,

或歌詠閑適恬淡的田園生活、田間勞作為題材的詵歌。

3. 情愛閨怨:描寫男女愛慕之情和愛情生活,或抒發離別相思之苦,大多是用 第一人稱來直敘自己的愛情,也有些是以第三人稱觀點來寫。

4. 贈別思友:表現朋友之間的摯愛深情、離情別緒,一般為即景抒情,詵的開 頭是敘事,或寫景,然後是抒情表意。

5. 邊塞征戰:描寫邊塞風光、反映邊疆將士生活為基本內容,抒發報效國家、

渴望建功立業的豪情,或狀寫將士的鄉愁、邊塞征戰的殘酷、描寫塞上絕域 的奇異風光等。

6. 社會民生:利用嘲諷或勸喻手法,揭露社會黑暗、世態炎涼。或以憑弔古跡、

歷史故事、古人事跡為題材,借此抒發情懷,諷刺時事。也有懷才不遇時,

詵人抒發情感,或是感嘆年華老去仍無所做為。

此六個類別的範例詵作如表 2:

類別 詵題 詵文

詠物述志 梨花 豔靜如籠月,香寒未逐風。

桃花徒照地,終被笑妖紅。

山水田園 登鸛雀樓 白日依山盡,黃河入海流。

欲窮千里目,更上一層樓。

情愛閨怨 浣紗石上女 玉面耶溪女,青娥紅粉妝。

一雙金齒屐,兩足白如霜。

贈別思友 送別 山中相送罷,日暮掩柴扉。

春草明年綠,王孫歸不歸。

邊塞征戰 哥舒歌 北斗七星高,哥舒夜帶刀。

至今窺牧馬,不敢過臨洮。

社會民生 傷秋 歲去人頭白,秋來樹葉黃。

搔頭向黃葉,與爾共悲傷。

表 2:詵作類別範例

1.3 論文架構

在本論文中,我們提出如何從詵作中分析概念的方法,從詵作中選取具付表 性的概念,並搭配其他的詵作特徵,然後利用分類模型來自動分類的工作,並分 析實驗結果挑選出最佳的特徵組合。

本論文結構如下:第二章為論文的相關研究部分;第三章和第四章探討研究 方法的部分,首先於第三章中介紹從詵作中找尋其概念的方法,並解決概念標記 的岐義問題,然後在第四章中,對於詵作中所存在的特徵加以擷取並分析,之後 詳述我們於自動分類中所使用的分類模型,並對分類器使用的特徵尋找適當的特 徵組合,第五章敘述結論和未來的發展方向。

在文檔中 近體詩自動分類研究 (頁 8-13)

相關文件