第六章 實驗結果與分析
6.2 社群網絡分析之實驗結果與分析
6.2.3 劃分四個唐朝時期詩人之分析結果
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
接著介紹四唐時期和全唐的詞彙分析以及各別的社群網絡,以四個唐朝時期做為聚 焦分析,原因來自於四個唐朝時期的詩歌風貌都不同,我們會依據我們劃分出的四唐詩 人名單,提取名單中詩人的所有作品,進行 bigram 來統計該時期的二字詞,這部分的 結果會和全唐的二字詞一起做比較。表 6. 14 所示為我們依照公式劃分詩人後的結果,
詩人數不多的情況,原因為 CBDB 記載的詩人數並不多,因此我們要藉由生卒年劃分時 沒有相對應的資訊。全唐的部份我們是將劃分後的全部詩人一起做分析,而並不是《全 唐詩》中收錄的所有詩人,這一全唐名單的詩人作品全部共有二萬七千餘首詩。我們將 各時期的詩人作品進行 bigram 的結果如表 6. 15,在此表我們目前是列出各時期前十名 二字詞,在我們排除各時期都有的高頻二字詞後,仍然可以發現各時期的常見詞彙,還 是有明顯的不同,我們以紅色且粗體的字體標記,被標記的詞彙可能只出現四個時期的 其中一個時期或兩個時期的前十名二字詞。全唐詞彙的部分,則可以讓我們看到全唐詩 人名單其作品挑選出的二字詞前十名,是我們目前詩人名單中最常用的十個詞彙。
表 6. 14 各唐時期詩人數以及作品數
時期 詩人數 作品數
初唐 82 1959
盛唐 77 4944
中唐 195 14522
晚唐 90 6927
全唐(前面的相加) 444 28352
50
‧
分支度計算工具,分支度計算的結果,會計算一個節點的 degree、in-degree、out-degree、weight degree、weight in-degree、weight out-degree。
Degree 為一個節點的 in-degree 和 out-degree 的總和;in-degree 為此節點詩人被幾位 詩人所提到過;out-degree 為此節點的詩人作品中曾提到的詩人數;weight degree 為 weight in-degree 和 weight out-degree 相加;weight in-degree 為此唐朝時期有多少作品曾
51
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
提到此節點詩人的數量;weight out-degree 為此節點詩人共寫給此時期詩人的交往詩數 量。因全部的總數過多,分支度計算的結果,我們會以 in-degree 和 out-degree 的前十名 做為我們的結果呈現,這二個數值代表一位詩人的作品,曾提到過哪些人以及多少人的 作品曾提到過此詩人。我們將結果放在各個唐朝時期的社群網絡分別進行討論。以下將 介紹四個唐朝時期以及全唐的社群網絡。
初唐
初唐的名單經過我們的劃分加上參考表 6.12 所列的詩人,目前共有 82 位詩人,透 過這 82 位詩人,在我們的交往詩檔案擷取出的交往詩為 46 首,而詩人跟詩人的交往頻 率大於 2 的組合,共有 9 組。將詩人的交往頻率關係表,透過 Gephi 的 Markov clustering 的演算法以及計算分支度的工具,結果如圖 6. 1、表 6. 16、表 6. 17。
圖 6. 1 初唐詩人社群網絡
52
‧
Label Degree In-Degree Out-Degree WeightedDegree
Weighted In-Degree
Weighted Out-Degree
韋嗣立 5 5 0 9 9 0 Label Degree In-Degree Out-Degree Weighted
Degree
Weighted In-Degree
Weighted Out-Degree
宋之問 9 2 7 12 4 8 的 out-degree 很高,但是 in-degree 卻不高,或是兩者相反,例如:宋之問與李嶠這兩位
53
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
詩人都是一個數值高而另一個數值低,我們能藉由分支度的表格,以及對此詩人的歷史 背景去研究其背後原因。
盛唐
盛唐的名單經過我們的劃分加上參考表 6.12 列的詩人,目前共有 77 位詩人,透過 這 77 位詩人,在我們的交往詩檔案擷取出的交往詩為 175 首,而詩人跟詩人的交往頻 率大於 2 的組合,共有 36 組。將詩人的交往頻率關係表,透過 Gephi 的 Markov clustering 的演算法以及計算分支度的工具,結果如圖 6. 2、表 6. 18、表 6. 19。
圖 6. 2 盛唐詩人社群網絡
54
‧
Label Degree In-Degree Out-Degree WeightedDegree
Weighted In-Degree
Weighted Out-Degree
李白 15 6 9 49 27 22 Label Degree In-Degree Out-Degree Weighted
Degree
Weighted In-Degree
Weighted Out-Degree
杜甫 22 4 18 63 8 55
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
前十名,仍然可以從中發現,杜甫、李白等等的有名詩人都位於前十名中。從中也可以 發現有趣的事情,杜甫 out-degree 非常的高但 in-degree 相對的低。
中唐
中唐的名單經過我們的劃分加上參考表 6. 12 列的詩人,目前共有 195 位詩人,透 過這 195 位詩人,在我們的交往詩檔案擷取出的交往詩為 1364 首,而詩人跟詩人的交 往頻率大於 2 的組合,共有 163 組。將詩人的交往頻率關係表,透過 Gephi 的 Markov clustering 的演算法以及計算分支度的工具,結果如圖 6. 3、表 6. 20、表 6. 21。
圖 6. 3 中唐詩人社群網絡
56
‧
Label Degree In-Degree Out-Degree WeightedDegree
Weighted In-Degree
Weighted Out-Degree
令狐楚 18 14 4 130 123 7 Label Degree In-Degree Out-Degree Weighted
Degree
Weighted In-Degree
Weighted Out-Degree 白居易 45 10 35 619 192 427
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
一直到第十名他的 out-degree 都大於 10,這代表中唐的詩人有許多詩人喜歡在詩中提起 其他人,因 out-degree 代表的是為一個節點作品共提到過多少個不重複的詩人。
晚唐
晚唐的名單經過我們的劃分加上參考表 6.12 列的詩人,目前共有 90 位詩人。透過 這 90 位詩人,在我們的交往詩檔案擷取出的交往詩為 373 首,而詩人跟詩人的交往頻 率大於 2 的組合,共有 11 組。將詩人的交往頻率關係表,透過 Gephi 的 Markov clustering 的演算法以及計算分支度的工具,結果如圖 6. 4、表 6. 22、表 6. 23。
圖 6. 4 晚唐詩人社群網絡
58
‧
Label Degree In-Degree Out-Degree WeightedDegree
Weighted In-Degree
Weighted Out-Degree
杜牧 9 4 5 20 9 11 Label Degree In-Degree Out-Degree Weighted
Degree
Weighted In-Degree
Weighted Out-Degree
杜牧 9 4 5 20 9 11
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
全唐
此部分的全唐詩人名單,為我們劃分後的四個唐朝時期,名單內的所有詩人。目前 共有 444 位詩人,透過這 444 位詩人,在我們的交往詩檔案擷取出的交往詩為 2563 首,
而詩人跟詩人的交往頻率大於 2 的組合,共有 321 組。將詩人的交往頻率關係表,透過 Gephi 的 Markov clustering 的演算法以及計算分支度的工具,結果如圖 6. 5、表 6. 24、
表 6. 25。
圖 6. 5 全唐詩人社群網絡
60
‧
Label Degree In-Degree Out-Degree WeightedDegree
Weighted In-Degree
Weighted Out-Degree
李白 32 21 11 96 71 25
Label Degree In-Degree Out-Degree Weighted Degree
Weighted In-Degree
Weighted Out-Degree 白居易 40 9 31 582 191 391