第三章 研究方法
3.2.2 作品單位比對
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
26
3.2.2 作品單位比對
比對的主要目標是為了研究字面上是否有相同或是不相同的地方,並且通過 篩選的機制,篩選出具有相關潛力的對應。要知道作品間有無相同之處,首先就 需要做以作品為單位的比對,在之後我們可以透過作品和作品的比對狀況,探究 作品和作品間的關係,或更進一步篩選出,有潛力具有語句對應的兩作品,再進 行語句比對。
作品比對會先計算兩作品的包含重複共用字,若兩作品只有一個字相同,兩 作品字面上只有一個單字詞可能具有共用的狀態;而若包含重複共用字數為 3,
則就增加了兩個作品共用三個單字詞、共用一個單字詞和一個雙字詞,或是共用 一個三字詞的可能,因此本研究以兩作品共用字數 3 以上為門檻,輸出兩作品的 包含重複共用字、共用字集合、初步共用詞彙、最長初步共用詞彙,以及分別以 兩作品輸出共用字構詞彙、共用字覆蓋率,接下來幾個例子說明。
以宋詞人周邦彥的作品〈西河·大石金陵〉32比對唐詩人劉禹錫〈烏衣巷〉33 為例,輸出如表 3.5:
32《全宋詞》,周邦彥,〈西河·大石金陵〉:
佳麗地,南朝盛事誰記?山圍故國繞清江,髻鬟對起。怒濤寂寞打孤城,風檣遙度天際。
斷崖樹、猶倒倚,莫愁艇子誰係?空餘舊跡鬱蒼蒼,霧沉半壘。
夜深月過女牆來,傷心東望淮水。酒旗戲鼓甚處市?
想依稀,王謝鄰裏,燕子不知何世,向尋常巷陌人家。相對如說興亡,斜陽裏。
33《全唐詩》,卷 365,劉禹錫,〈烏衣巷〉:
朱雀橋邊野草花,烏衣巷口夕陽斜。舊時王謝堂前燕,飛入尋常百姓家。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
27
表 3.5 〈西河·大石金陵〉和〈烏衣巷〉的作品比對狀況 共用字集合 舊、王、謝、燕、家、尋、常、巷、斜、陽 包含重複共用字 舊、王、謝、燕、家、尋、常、巷、斜、陽
初步共用詞彙 燕、家、舊、王謝 最長初步共用詞彙 王謝
共用字構詞彙 〈西河·大石金陵〉:斜陽、尋常巷
〈烏衣巷〉:陽斜、尋常、巷 共用字覆蓋率 〈西河·大石金陵〉:9.52%
〈烏衣巷〉:35.71%
此兩作品,可以見到〈烏衣巷〉中有十個字,和〈西河·大石金陵〉有共用 關係,共用字覆蓋率約有 35.71%。此兩作品在初步共用詞彙方面,有一個二字 詞以及三個單字詞;共用字構詞彙中,有一個組合分別是「斜陽」、「陽斜」,洽 是用共用字組成的詞彙,但順序不同的例子。
另以周邦彥〈西河·大石金陵〉比對南朝樂府〈莫愁樂〉34為例,輸出如表 3.6。
34 南朝樂府,無名氏,〈莫愁樂〉:莫愁在何處?莫愁石城西。艇子打兩槳,催送莫愁來。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
28
表 3.6 〈西河·大石金陵〉和〈莫愁樂〉的作品比對狀況 共用字集合 城、莫、愁、打、來、處、何、艇、子
包含重複共用字 城、莫、愁、打、來、處、何、艇、子 初步共用詞彙 城
最長初步共用詞彙 城
共用字構詞彙 〈西河·大石金陵〉:來、處、何、莫愁艇子、打、子
〈莫愁樂〉:莫愁來、何處、莫愁、艇子打 共用字覆蓋率 〈西河·大石金陵〉:9.52%
〈莫愁樂〉:65.00%
此兩作品,可以見到〈莫愁樂〉中有九個字,和〈西河·大石金陵〉有共用 關係;共用詞彙方面兩個二字詞,以及五個單字詞,其中一個二字詞「莫愁」在
〈莫愁樂〉裡面就出現過三次,因此導致〈莫愁樂〉的共用字覆蓋率較高約有 65%。〈西河·大石金陵〉中,「子」有兩個,一個是「莫愁艇子」的「子」,一個 是「燕子」的「子」,但〈莫愁樂〉中,「子」只有一個,在「艇子」的位置。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
29