• 沒有找到結果。

第七章 結論與未來展望

7.2 未來展望

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

7.2 未來展望

我們在《全唐詩》語料搜尋交往詩的部分,是在文字間找到兩個詞彙的共現關係,

來做為交往詩的依據。在未來的研究中,我們希望可以將此搜尋方法系統化,能夠應用 在其他語料上,例如《全宋詞》、《全宋詩》、現代文章、小說、其他唐代的語料等等,

能給予人文學者針對不同語料做人物的社群網絡分析。但在我們的搜尋方法中,在別名 的部分,因為我們必須透過 CBDB 的資料來知道詩人的其他資訊,因此若是 CBDB 的 資料量不足,則會影響到我們搜尋到的結果,這方面則必須跟相關專業學者合作,取得 更多人物別名和生卒年的資料,相信能夠更豐富我們社群網絡分析的研究成果。

交往詩的結果評估中,我們提到現在並沒有《全唐詩》所有的交往詩數量,但有一 本實體書為《唐五代人交往詩索引》[1],其收錄了唐五代的所有交往詩,但它目前並無 一個較好的電子檔版本。若是未來能取得整理好的《唐五代詩交往詩索引》的檔案,我 們則可以更進一步的評估我們搜尋交往詩方法的效果。

在我們社群網絡結果中,目前只能透過圖的節點與邊以及表的數值大小來觀察社群 網絡關係。但在《全唐詩》的作品中其實存在一種特別的現象,詩人與詩人會以詩歌作 品來一答一唱,有學者稱這類詩為「和詩」[8],若是我們能發現《全唐詩》的「和詩」,

會使我們更加強詩人與詩人在社群網絡中的連結,更能說明他們是很好的朋友。另一方 面,歷史中詩人與詩人為何會交往,或是為什麼這個詩人不常在詩中提到別人,這些問 題其實也值得我們去研究,未來也許能透過更進一步的自然語言處理技術找出更多的訊 息以及跟人文學者合作,研究社群網絡中的詩人背景。

81

波》三部曲為例,第六屆數位典藏與數位人文國際研討會論文集,459-480,2015。

[10] 劉昭麟、張淳甯、許筑婷、鄭文惠、王宏甦及邱偉雲,《全唐詩》的分析、探勘與

[12] A. Agarwal, A. Corvalan, J. Jensen, and O. Rambow, Social Network Analysis of Alice in Wonderland, Proceedings of the NAACL-HLT 2012 Workshop on Computational Linguistics for Literature, 88–96, 2012.

[13] R. Disetel, Graph Theory (3rd ed.), Springer, 110-117, 2006.

82

[14] S. V. Dongen, Graph Clustering by Flow Simulation, PhD Thesis, University of Utrecht, 2000.

[15] C. D. Manning and H. Schütze, Foundations of Statistical Natural Language Processing, MIT Press, 192-195, 1999.

[16] C. D. Manning, P. Raghavan, and H. Schütze, Introduction to Information Retrieval, Cambridge University Press, 107-110, 2008.

[17] D. Schmidt and R. Colomb, A Data Structure for Representing Multi-Version Texts Online, Journal of Human–Computer Studies, 67(6), 497–514, 2009.

[18] J. Scott, Social Network Analysis (3rd ed.), SAGE, 2012.

[19] 中國歷代人物傳記資料庫,http://projects.iq.harvard.edu/chinesecbdb/home [last visited 2016/7/26]。

[20] 中國哲學書電子化計劃,http://ctext.org/zh [last visited 2016/7/26]。

[21] 文學 100,http://www.wenxue100.com/ [last visited 2016/7/26]。

[22] 全唐詩,http://ctext.org/quantangshi/zh [last visited 2016/7/26]。

[23] 宋朝介紹,http://www.qulishi.com/songchao/ [last visited 2016/7/26]。

[24] 故宮【寒泉】古典文獻全文檢索資料庫, http://210.69.170.100/S25/ [last visited 2016/7/26]。

[25] 詩式,http://www.cll.ncnu.edu.tw/hpoet/ha28.html [last visited 2016/7/26]。

[26] 逢 甲 大 學 - 唐 代 研 究 中 心 ,

http://tang.cl.fcu.edu.tw/wSite/ct?xItem=58221&ctNode=19741&mp=535601&idPath=1 9710_19711_19722_19741 [last visited 2016/7/26]。

[27] Digital Humanities 2016 conference ,http://dh2016.adho.org/about/ [last visited 2016/7/26]。

[28] Elasticsearch,https://www.elastic.co/ [last visited 2016/7/26]。

83

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

[29] Gephi,https://gephi.org/ [last visited 2016/7/26]。

[30] Google Chart,https://developers.google.com/chart/?hl=zh-TW [last visited 2016/7/26]。

[31] HTML Living Standard , https://html.spec.whatwg.org/multipage/ [last visited 2016/7/26]。

[32] ICTPOS3.0 詞 性 標 記 集 , https://gist.github.com/luw2007/6016931[last visited 2016/7/26]。

[33] International Conference of Digital Archives and Digital Humanities , http://www.dadh.digital.ntu.edu.tw/ch [last visited 2016/7/26]。

[34] Jieba 斷詞,https://github.com/fxsjy/jieba [last visited 2016/7/26]。

[35] Json format,http://www.json.org/ [last visited 2016/7/26]。

84

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

附錄一:檢索介面的操作流程以及說明

在版本比對的研究中,我們實做一個多版本的《全唐詩》檢索介面,能讓使用者對卷次、

作者、詩名以及內容的欄位做搜尋,以下將介紹使用我們的檢索介面其操作流程。

附錄圖. 1 為我們的檢索介面實際樣貌,在上方的欄位依序為卷次、作者、詩名、內 容,使用者可以針對你想搜尋的《全唐詩》內容在欄位的地方輸入字串,欄位的部分可 以留白不輸入,我們只會考慮有輸入的欄位,再取出《全唐詩》收錄的詩歌作品中,符 合所有輸入欄位條件的詩歌。需要注意的部分是卷次欄位的部分必須為「卷」+中文數 字。儲存位置的方法為使用者按下選擇按鈕後,自行選擇電腦中想儲存的位置。我們儲 存的檔案會依據使用者所檢索的結果進行版本比對後輸出成一個 html 檔案;純文字檔 的部分則為檢索的結果,我們所輸出的版本為「中國哲學書電子化計畫」,最後我們的 檢索介面上會顯示找到的作品數量。

附錄圖. 1 檢索介面實際樣貌

85

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

實際操作一個範例如附錄圖. 2,我們在作者的欄位輸入白居易以及內容的欄位輸入 黃金,接著再點選選擇按鈕,指定到我們的儲存資料夾。檢索介面依照我們輸入的條件,

一共找到 28 首詩。我們可以再到儲存位置的資料夾,可以看到一個名為 different.html 的檔案和一個 result.txt 的檔案,different.html 可以在網頁上呈現檢索結果,不同版本的 異同處;result.txt 則只輸出「中國哲學書電子化計畫」的搜尋結果文字檔。

附錄圖. 3 為我們此檢索結果,從左到右依序顯示卷次、詩名、作者、搜尋字串、版 本以及內文,不同版本在內文的異同處,會以跟版本相對應的顏色做標記,藉此能夠一 次看到多個版本的使用狀況。

附錄圖. 2 檢索介面操作範例

86

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

附錄圖. 3網頁上呈現不同版本異同處

87

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

附錄二:觀察詩人詞彙工具的操作流程以及說明

此工具的設計是為了幫助我們了解存在於社群網絡中,有興趣的詩人與詩人共同常用詞 彙以及找出他們共同使用詞彙的作品。此工具的必須有一個詩人與詞彙的使用比例矩陣 以及交往關係頻率表,因此在我們的工具資料夾中,會存放一個我們在 6.2.3 小節中找 到的全唐詩人名單所建立的詩人與詞彙關係矩陣,以及此全唐詩人名單的交往頻率表。

我們最後會透過在工具上輸入的條件,找出詩人與詩人的共同常用詞彙,再從我們資料 夾一個名為 tang_common.txt 的檔案中,詩人與詩人在那些作品中共用這些詞彙。附錄 圖. 4 中的 poet_wordmatrix.txt 則為詩人與詞彙的關係矩陣;name_edge.txt 則為詩人的交 往頻率表;tang_common.txt 則為我們將《全唐詩》有收錄的作品,相互比對找出有共同 詞彙的檔案。

附錄圖. 4 觀察詩人詞彙工具的資料夾

88

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

附錄圖. 5 為我們此工具的功能一介面,共有三個欄位可以做輸入以及一個欄位選擇 輸出資料夾。功能一的主要工作是使用者給予一組詩人,觀察此兩位詩人的共同常用的 詞彙以及找出他們存在共同常用詞彙的作品。以附錄圖. 6 的例子,我們於 Source Poet 與 Target Poet 二個欄位分別輸入白居易跟元稹,這代表我們會去 poet_wordmatrix.txt 的 檔案中,計算這二位詩人的共同常用詞彙。前幾名詞彙的欄位,則表示我們要列出計算 後前幾名的詞彙。我們最後找出來的詞彙列表的檔名為 word.txt,作品中存在共同常用 詞彙的詩歌則會儲存在 share_word_poems.txt 的檔案中,使用者可以在自己設定的儲存 位置中檢視這兩個檔案。

附錄圖. 5 觀察詩人詞彙的工具介面

附錄圖. 6 以白居易、元稹輸入為例

89

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

附錄圖. 7 為我們藉由交往頻率表觀察詩人詞彙工具的介面,此工具將會參考交往頻 率表,內容如附錄圖. 8 為例。畫面上的 Poet 欄位是讓使用者輸入任一位自己有興趣的 詩人,但此詩人必須存在於交往頻率表中;交往頻率高於的欄位,則是讓使用者設定一 個數字,限制想要看到跟 Poet 欄位的詩人交往頻率(weight)必須超過所輸入數字的其他 詩人;Source 與 Target 則可以讓我們勾選其中一個或是都不勾選,若是我們勾選 Source 則會顯示功能:1,則代表我們設定輸入的詩人為 Source 的角色,我們會去找出交往頻 率表中,所有跟這 Source 詩人有關的 Target 詩人都會被取出,再從 poet_wordmatrix.txt 計算 Source 跟這群 Target 詩人的共同常用詞彙,最後取出 Source 跟這群 Target 詩人存 在共同常用詞彙的作品。而若是我們勾選的是 Target 則會顯示功能:2,則是將 Poet 設 定為 Target 詩人,去找出跟其有關的 Source 詩人。最後若是我們都不勾選則會顯示功 能:0,在此情況下我們不會考慮輸入的 Poet 為 Source 或 Target,我們會把所有跟其有 關的詩人都取出,再計算所有人的共同常用詞彙,最後找出 Poet 與這群人共同常用詞彙 的作品。

附錄圖. 7 藉由交往頻率表觀察詩人詞彙之介面

附錄圖. 8 name_edge.txt 部分內容

90

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

我們以附錄圖. 9 所輸入的內容作為一個例子,在介面上輸入我們欲查詢的詩人為

「白居易」,跟白居易有關係的交往詩人其交往頻率必須高於 10,我們勾選 Source 後,

下方顯示會從功能:0 變成功能:1。最後我們會產生兩個檔案如附錄圖. 10 所示,word.txt 存放的資料,為當白居易是 Source 時與其交往頻率 10 以上的這些詩人前十名共同常用 詞彙,share_word_poems.txt 則存放我們以這些共同常用詞彙,去找出白居易與這些詩 人存在共同常用詞彙的作品。

附錄圖. 9 工具二的操作範例

附錄圖. 10 操作範例之輸出檔案

91

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

討論八:交往詩的定義,建議參考其他學者的敘述。我們最後採取的交往詩定義為 李鴻泰的《李白交往詩研究》中所敘述,交往詩是指任何有對象的一首詩歌作品,重點 在於雙方能有情感上的交流,因此二位詩人甚至可以處在不同時空或不認識。而我將這 段敘述放在論文 19 頁。

討論九:建議詞彙對應的社群關係不要用有向邊表示,因會有強烈的意涵,且必須 將社群網絡圖補上。詞彙對應的社群網絡,目前我已將詩人的關係已無向邊表示,且補 上此關係的社群網絡圖。

討論十:進行詩人劃分成四個唐朝時期的實驗,不應該直接以二分之一做為計算。

我們的改進為參考口試委員項潔教授所提議的方法,藉由已知被分類時期的詩人名單,

去找出哪一個值會給予此名單最好的準確度。因此我們做的更改為 5.3 小節與 6.2.3 小 節。

以上的討論都為我們在口試的過程中,三位口試委員給予的提問以及建議,在此附 錄三詳細說明各個討論,以便未來的讀者可以更好的了解整個論文的方向以及曾被提到 過的問題。另外口試委員們有提到我寫作上所沒注意到的錯誤,我也將這類的錯誤予以 修改完成。在此再次感謝三位口試委員給予的指導,有助於學生國峯的論文品質有所提

以上的討論都為我們在口試的過程中,三位口試委員給予的提問以及建議,在此附 錄三詳細說明各個討論,以便未來的讀者可以更好的了解整個論文的方向以及曾被提到 過的問題。另外口試委員們有提到我寫作上所沒注意到的錯誤,我也將這類的錯誤予以 修改完成。在此再次感謝三位口試委員給予的指導,有助於學生國峯的論文品質有所提