• 沒有找到結果。

第六章 實驗結果與分析

6.4 詞彙史之實驗

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

6.4 詞彙史之實驗

這一小節為介紹詞彙史的實驗,詞彙的開始跟詞彙的沒落是很有研究價值的事情,我們 可以利用 CBDB 取出詩人的生卒年,使用者任意自訂一個詞彙集合,在《全唐詩》的詩 人作品的內文做詞彙搜尋,將搜尋到的詞彙與詩人生卒年做結合,能讓我們觀察到一個 詞彙在不同時間由不同詩人所使用,可能一段時間很多人使用或是隔一段時間才又有人 用,我們藉此能夠觀察到詞彙在時間長河中的載浮載沈。

6.4.1

實驗流程設計

我們的實驗能夠讓我們自定義一個欲查詢的詞彙集合,在我們語料檔案中的作品內文,

查詢這些詞彙是不是有出現,若是有出現詞彙集合中的詞彙,則可以把此作品的作者生 卒年標記在此詞彙上,一個詞彙可以被不同的作者生卒年所標記,最後產生我們定義的 詞彙集合時間序列圖。另一方面,若是有更多的語料,我們這個實驗也可以擴充到更多 語料,則可以包含更多詩人且是一個跨朝代的詞彙史分析,在實驗的最後會加入《宋詞 詞》,展示跨朝代的詞彙使用變化。

圖 6.9 得到詞彙集的時間序列圖流程

74

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

6.4.2

詞彙史實驗結果與分析

我們實驗中所自訂的詞彙集,為隨意挑選出一些看起來的有趣詞彙,若是角色為人文學 者,這些詞彙集組合則可以是更有意義的詞彙。我們挑選出來的詞彙為表 6. 38,我們依 據詞彙集的內容,在我們的《全唐詩》語料做實驗,詞彙集中的每個詞彙對每首詩內文 做比對,若存在一首詩的內文中,則將此詞彙標記一筆時間,最後將所有詞彙透過 Google chart 畫成時間序列圖。圖 6. 10 為我們根據表 6. 38 的詞彙的部分內容,真實的檔案是可 以控制畫面的移動,來觀看到所有詞彙的內容。圖 6. 10 的 X 軸為時間序列 Y 軸為詞彙 集的詞彙,我們可以依據此圖的呈現,觀察一個詞彙在一個時間段被大量詩人所使用,

如圖中的詞彙「樓台」在 750 年到 850 年的範圍內詩人數是最多的。而另一個可以觀察 到的現象,則是橫向的詩人數,如圖中的詞彙「雙飛燕」,較早使用此詞彙的詩人為李 益,到了李益的生命末端,又有另一位詩人李商隱繼續用了此詞彙,若是只看這張圖的 話,會認為此詞彙被李商隱所沿用,但背後的原因跟考據則是需要由專家進行研究。

表 6. 38 詞彙史實驗之測試詞彙集內容

雙飛燕、樓台、青衫、十指、當初、生物、將帥、老嫗、愚蠢、情留、危巒、閑官、

而已、假如

75

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖6. 10單一語料之時間序列圖部分內容

76

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

唐朝的時間為 618 年到 907 年,若我們只以單一朝代來觀察詞彙的時間序列圖,效 果事實上是十分有限的。因此我們的實驗加入宋朝的語料《全宋詩》,宋朝的時間為 960 年到 1279 年[23],藉此拉長整個時間序列的長度和增加詩人數。詞彙集的詞彙同時在《全 唐詩》和《全宋詩》的作品內文做搜尋,再結合從 CBDB 擷取的人物生卒年資訊。圖 6. 11 的結果,同樣是使用表 6. 38 的詞彙集,但我們可以發現時間軸的寬度被拉長,變 成從 600 年到 1300 年左右。觀察圖 6. 11 的時間序列可以知道左邊為《全唐詩》的詩人 群,右邊則為《全宋詩》的詩人群。以二個語料做為例子,更可以充分表達一個詞彙可 能興盛於什麼時期,亦或是詞彙只在某個語料中大量出現,如圖中的「閒官」詞彙,只 在單一語料的詩人在使用。若是我們能夠取得中國歷代文學,且有夠多的歷代文人的人 物資料,便可以更深入研究詞彙的源起、興盛、滅亡等等的問題。

77

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖6. 11結合兩個語料的詞彙史實驗之結果

78

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y