第四章 實驗結果與評估
4.1.3 語句對應和作品對應的結果分析
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
110
上《全唐詩》丁澤〈龜負圖〉250「神龜出負圖」;而也有王偉勇[22]的研究有提 及,但本研究沒有發現完整的語句對應,如《全唐詩》李商隱〈無題二首〉251「背 面鞦韆下」可以對應到《全宋詞》賀鑄〈辨絃聲〉252「久背面、鞦韆下」,本研 究只能找出「鞦韆下」的對應,由於「久背面、鞦韆下」會被標點符號斷為兩個 語句,再加上篩選門檻的緣故,所以「背面」和「久背面」的對應不會被紀錄下 來。因為狀況的不同本研究可能可以找到更多的對應實例,而也有一些例子本研 究法辦法找出來,但是可以在王偉勇的研究中發現的,這些差異,可能是語料範 圍、語料版本不同、篩選的門檻值,或是其他的因素所造成。
另外,透過作品比對所找出的對應,除了可以找到語料中重複收錄的作品外,
亦可以發現兩首作品不只有一語句相似的狀況,甚至發現有一些作品能對應到多 首作品,如《全唐詩》宋華〈蟬鳴一篇五章〉和《詩經》小雅·鹿鳴之什〈出車〉、
國風·召南〈草蟲〉、國風·秦風〈終南〉,都有部分對應的現象,如圖 4.1 所示。
250 《全唐詩》丁澤〈龜負圖〉天意將垂象,神龜出負圖。五方行有配,八卦義寧孤。作瑞旌君 德,披文協帝謨。乘流喜得路,逢聖倖存軀。蓮葉池通泛,桃花水自浮。還尋九江去,安肯曳泥 途。
251 《全唐詩》李商隱〈無題二首〉八歲偷照鏡,長眉已能畫。十歲去踏青,芙蓉作裙衩。十二 學彈箏,銀甲不曾卸。十四藏六親,懸知猶未嫁。十五泣春風,背面秋千下。幽人不倦賞,秋暑 貴招邀。竹碧轉悵望,池清尤寂寥。露花終裛濕,風蝶強嬌饒。此地如攜手,兼君不自聊。
252 《全宋詞》賀鑄〈辨絃聲〉(迎春樂)瓊瓊絕藝真無價。指尖纖、態閒暇。幾多方寸關情話。
都付與、弦聲寫。三月十三寒食夜。映花月、絮風台榭。明月待歡來,久背面、鞦韆下。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
111 11646_全唐詩_卷 257_2.宋華.蟬鳴一篇五章 蟬其鳴矣,於彼疏桐。庇影容跡,何所不容。
嘒嘒其長,永托於風。未見君子,我心忡忡。既見君子,樂且有融。彼蟬鳴矣,于林之表。
含風飲露,以樂吾道。有懷載遷,伊誰雲保。未見君子,我心悄悄。既見君子,披豁予抱。
蟬鳴蟬鳴,幽暢乎而。肅肅爾庭,遠近涼颸。言赴高柳,叢篁間之。思而不見,如渴如饑。
亦既覯止,我心則夷。蟬鳴伊何,時運未與。匪歎秋徂,怨斯路阻。願言莫從,鬱悒誰語。
君子至止,慰我延佇。何斯違斯,倏爾遐舉。歲之秋深,蟬其夕吟。披衣軒除,蕭蕭風林。
我友來斯,言告離衿。何以敘懷,臨水鳴琴。何以贈言,委順浮沉。
167_詩經_小雅·鹿鳴之什..出車
我出我車,於彼牧矣。自天子所,謂我來矣。召彼僕夫,謂之載矣。王事多難,維其棘矣。
我出我車,於彼郊矣。設此旐矣,建彼旄矣。彼旟旐斯,胡不旆旆?憂心悄悄,僕夫況瘁。
王命南仲,往城于方。出車彭彭,旗旐央央。天子命我,城彼朔方。赫赫南仲,玁狁於襄。
昔我往矣,黍稷方華。今我來思,雨雪載途。王事多難,不遑啟居。豈不懷歸?畏此簡書。
喓喓草蟲,趯趯阜螽。未見君子,憂心忡忡。既見君子,我心則降。赫赫南仲,薄伐西戎。
春日遲遲,卉木萋萋。倉庚喈喈,采蘩祁祁。執訊獲醜,薄言還歸。赫赫南仲,玁狁於夷。
13_詩經_國風·召南..草蟲
喓喓草蟲,趯趯阜螽。未見君子,憂心忡忡。亦既見止,亦既覯止,我心則降。
陟彼南山,言采其蕨。未見君子,憂心惙惙。亦既見止,亦既覯止,我心則說。
陟彼南山,言采其薇。未見君子,我心傷悲。亦既見止,亦既覯止,我心則夷。
129_詩經_國風·秦風..終南
終南何有?有條有梅。君子至止,錦衣狐裘。顏如渥丹,其君也哉!終南何有?有紀有堂。
君子至止,黻衣繡裳。佩玉將將,壽考不忘!
圖 4.1《全唐詩》宋華〈蟬鳴一篇五章〉和《詩經》的對應
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
112
斷詞實驗結果評估
本節我們將分析《全唐詩》、《全宋詞》和《全宋詩》斷詞實驗結果,其中包 含演算法的調整對斷詞結果的影響,以及和其他研究的斷詞方法比較,討論不同 方法的優缺。量化評估的部分,我們請一位政大語言所博士班學生,協助人工斷 詞,其中若詩歌有專有名詞,則也依照專有名詞斷開。另外,人工斷詞中有一些 狀況是兩種斷法都對,這個時候,則採用統一的規則,例如:《全宋詩》黃庭堅
〈謫居黔南十首〉253「瘴雲稍含毒」可斷為「瘴雲」+「稍」+「含毒」或是「瘴 雲」+「稍含」+「毒」,像是「稍含毒」這種副詞連接動詞再連接其他詞的這種 情況,統一採用副詞和動詞相連,故斷為「稍含」+「毒」。最後再透過 precision(準 確率),recall(召回率),F1-measure 以及 accuracy (準確率) 的計算將抽樣結果量 化,以評估斷詞成效。