第三章 新詩賞析研究方法
3.4 新詩內容賞析
(1) 意圖標籤擷取(Intention Tag Retrieve):
當賞析本體論所定義的重要詞彙足以表達學習者對於詩作整體的風格或詩作題 材、描寫手法的看法或詩作表達情感為何時,學習者只要選擇出所要表達詞彙表達 之,此步驟我們稱為「意圖標籤擷取」。
(2) 意圖標籤校正(Intention Tag Revise):
當賞析本體論重要詞彙不足表達學習者感受時,為了要協助學習者因詞窮或語 意模糊如:很好、不錯等,此皆無法具體表達對於詩作的感受或想法,因此我們需 要學習者輸入對於詩作的看法,藉由輸入的文字,我們將進行以下列步驟:學習者 自行輸入詞句,配合中研院斷詞系統,進行斷詞動作,本系統取名詞、動詞、形容 詞、副詞做為學習者意圖表達的關鍵字,並連結同義詞詞林找出所要表達的感受。
以下我們將說明如何使用斷詞系統及如何搭配同義詞詞林:
斷詞功能
本研究運用中央研究院中文斷詞系統功能,以補足進行內容賞析時,系統所提 供的重要詞彙不符所需時,學習者自行輸入描述其感受及看法解析詞句使用。先將 學習者輸入詞句進行斷詞,再接續語言分析、資訊抽取、資訊檢索等工作。該系統 包含約拾萬詞的詞彙庫及附加詞類、詞頻、詞類頻率、雙連詞類頻率等資料。根據 中研院斷詞系統說明指出,每篇文章中約有 3%~5%的詞彙是未知詞,文章經過斷 詞後,所取出的詞性有數十種,所有詞性說明如附錄一。
本系統進行斷詞後,首先進行詞性過濾,去除多餘的贅字,留下關鍵字,接著 經由學習者選擇欲表達的詞彙,此過程為學習者意圖關鍵字擷取,如下圖 3。
圖 3:學習者意圖關鍵字擷取流程圖
以「詩作哀傷但卻透露著浪漫」為例,經斷詞處理後為「詩作(Na) 哀傷(VH) 但(Cbb) 卻(D) 透露(VE) 著(Di) 浪漫(VH) 」,經由過濾詞性後,候選關鍵字為
「詩作(Na) 哀傷(VH) 透露(VE) 浪漫(VH) 」,學習者經由候選關鍵字選擇所要 表達的詞彙後如「哀傷」,經由同義詞詞林階層找出「哀傷」的大、中、小類概念,
如悲戚、悲喜交集、愀愴、椎心泣血、痛苦、愴然等,學習者在由這些詞彙中找出 欲表達的看法。
本研究希望藉由同義詞詞林,協助學生能更明確的表達出對於詩作賞析後的感 受,而不只是模糊的表達如「很好、不錯、普普」等,並且希望藉由同義詞詞林能 讓學習者學習更多的詞彙,以充實文學素質。綜合以上步驟我們稱此過程為「意圖 標籤校正」。
(3) 意圖標籤再使用(Intention Tag Reuse):
學習者透過意圖標籤擷取及意圖標籤修正的方法所取出的詞彙,來表達對於詩 作的情感、創意、風格等看法,我們稱此為「意圖標籤再使用」。
(4) 意圖標籤保留(Intention Tag Retain):
學習者透過文字輸入,經斷詞系統及同義詞詞林,發表感受後,為了要能達到 不同看法的賞析分享,本系統將表達出來的詞彙儲存於候選標籤資料庫,希望透過 眾人之力不斷的累積賞析本體論知識,其中包括對於詩作的情感、創意、風格等看 法,為了避免賞析本體論知識無意義的累積,候選標籤表達的詞彙需超過某一門檻 值,才能加入賞析本體論中。我們將以下列規則來進行意圖標籤保留:
Count(詞彙 Gi) = 各內容賞析的詞彙的頻率
IF Count(詞彙 Gi) >= α,新增至賞析本體論,其中α為一 threshold 值。
綜合以上其意圖標籤內容賞析演算法如下:
演算法 2:意圖標籤內容賞析演算法
Algorithm 2: Intention Finding for Content Appreciation Algorithm Symbols Definition:
D: is the depth of Appreciation Ontology.
L0~LD: denote the level of Appreciation Ontology.
termj: segmentation results which contains noun, verb, adjective, adverb.
<Q>: System prompts questions and options.
<A>: Learner chooses one option.
Input: Appreciation Ontology, modern poem, TYCCL Output: the results of content appreciation
Step 1: For i=L2to LD, do the following substeps.
Step 1.1: <Q> What kind of style do you want to describe?
Prompts the nodes in the Li. Step 1.2: <A> Chooses one from the options.
Step 2: If learner chooses none, then leaner inputs text.
Step 2.1: Segments text by using CKIP segmentation tool.
Step 2.2: <Q> Which term do you want to emphasize?
Prompts termj.
Step 2.3: <A> Chooses one from the options.
Step 2.4: Retrieves the synonyms in TYCCL with previous option.
Step 2.5: <A> Chooses one from the options.
Step 3: Outputs the result of content appreciation.
範例:
同樣以鄭愁予的「錯誤」來進行新詩內容賞析活動,透過演算法設計,新詩 意圖標籤形式賞析學習活動為:
系統:「內容」部分,你想描述以下哪一部分呢?
情感、創意、風格
系統:就「情感」而言,您認為此首詩作表達情感意境為何?
無病呻吟、感動、思念、以上皆非 學生:選擇所要的項目若為:感動
則系統將會記錄學習者的賞析內容為:內容 → 情感 → 感動 學生:選擇所要的項目若為:以上皆非
則系統將會要求學習者輸入自然語言,如學習者輸入「從期待到最後落空」經 由斷詞系統後過濾贅字,找出關鍵候選字如「期待、落空」,學習者在選擇所要表達 的關鍵字如「落空」,在經由同義詞詞林找出「落空」的大、中、小類概念如:一場 春夢、一場空、功敗垂成、南柯夢等,學習者在從此這幾個詞彙選擇所要表達的感 受如:南柯夢,最後系統將會記錄學習者的賞析內容為:內容 → 情感 → 南柯夢。