第四章 隱喻對應分析
4.1 描述統計
4.1.1 兩種共現範圍的資料型態
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第四章 隱喻對應分析
本章就第三章提出的情感隱喻字詞共現網絡和文本隱喻分析的結果作一整體統計描 述,再分別就兩種方法做細部分析結果描述,最後以文本隱喻分析結果作為字詞共現網 絡未來在文字隱喻分析工具的評估。
4.1 描述統計
本節先針對兩種方法分析得出的結果作一概要的統計描述;首先是字詞共現網絡的 部分,依照兩種分析範圍和不同的字彙處理標準所得到的字彙組合,進行資料分布型態 和字彙組合的差異比較;而另一小節則針對文本隱喻分析的結果,列舉分析出的情感隱 喻對應關係,以及情感概念字彙(目標域)的資料筆數分布圖,以了解本研究分析的西洋 經典情歌歌詞,其內容主要描繪的情感面向。
4.1.1 兩種共現範圍的資料型態
本研究依據整首歌和每首歌中的句子,兩種共現距離進行此範圍內的字彙和字彙之 間的共現度計算,另從以句子為共現範圍的資料結果延伸出去除每首歌中重複句子的共 現度計算,因此,本研究共採用 3 種共現度計算的標準,分別是:
W (Co-occurrence by whole song):以整篇歌詞為共現範圍,扣除掉歌詞中重複出現的 字彙,再計算同一歌詞中每一字彙和其他字彙之間的距離,建立字彙的共現關係。
SS (Co-occurrence by same sentence):以每篇歌詞中的句子為共現範圍,扣除掉句子 中重複出現的字彙後,計算同一句子中每一字彙和其他字彙之間的距離,建立字彙 的共現關係。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
S (Co-occurrence by same sentence without duplicates): 以每篇歌詞中的句子為共現 範圍,並且先去除每篇歌詞中重複出現的句子,再去除句子中重複出現的字彙,再 行計算同一句子中每一字彙和其他字彙之間的距離,建立字彙的共現關係。
以上 W, SS, S 三種共現範圍所產生的字彙組合的資料總數,詳列於表 4.1,另將三 種字彙共現組合頻率,由大至小排列前 4000 筆資料作呈現,如圖 4.1。
Co-Occurrence Network Analysis Textual Analysis W 18,042 Metaphorical Tokens
Identified Counts 712
SS 31,509
S 20,060
表 4.1: 兩種分析方法所得資料總數表
圖 4.1: 三種共現標準的字彙組合筆數分布圖
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
從圖 4.1 可看出三組字彙組合的資料型態皆呈長尾分布,亦即有少量幾組的字彙配 對關係,是大量地出現在大部分的西洋經典情歌歌詞中,透過觀察共現度較高的幾筆資 料,可以初步了解這些西洋經典情歌再現了那些重要概念,因此,本研究將依這三條資 料分布型態,選定共現度較高的字彙為浮現字彙網絡的門檻值,來建置網絡,作更進一 步的網絡分析。
如圖 4.1,藍色線段 W 代表以一首歌為共現範圍的字彙組合分布,共有 184,042 筆 字彙配對組合,下表 4.2 列舉線段 W 前 40 組字彙共現資料;從 W 的資料分布曲線觀察 到,共現值(Count)在 25 以上為高頻次的共現字彙組合,表列第一筆資料為愛情(love) 和心(heart)的字彙共現組合,在 441 篇歌詞中共同出現 155 次。
表 4.2: W(以一首歌為單位)前 40 筆字彙共現組合
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
承前段敘述,紅色線段 SS 則代表以句子為共現範圍的字彙組合分布,共有 31,614 筆字彙組合,表 4.3 列舉前 40 組配對資料;從 SS 的資料分布曲線觀察到,共現值(Count) 在 7 以上為高頻次的共現字彙組合,表列第一筆資料為愛情(love)和寶貝(baby)的字彙共 現組合,在 441 篇歌詞的同一句子共同出現 69 次。
表 4.3: SS(以同句歌詞為單位)前 40 筆字彙共現組合
同上,綠色線段 S 則代表以句子為共現範圍的字彙組合分布,並去除掉重複的句 子,因此字彙筆數較少,共有 20,060 筆字彙配對組合,表 4.4 列舉前 40 組配對資料;
從 S 的資料分布曲線觀察到,和 S 曲線呈現類似的分布趨勢,共現值(Count)在 7 以上為 高頻次的共現字彙組合,表列第一筆資料同樣為愛情(love)和寶貝(baby)的字彙共現組 合,在 441 篇歌詞無重複的同一句子中共同出現 38 次。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
表 4.4: S(以同句為單位並去除重複)前 40 筆字彙共現組合
將數學模型,幕次法則(Power-Law)應用到網路世界的營銷模式觀察,而有長尾分 布理論,提出「80/20」的商品法則,認為 80%的業績來自 20%的產品,同樣地,長尾 現象也出現在蘊含大量文字訊息的網路上[30],就如相關文獻提及的,一般人的語言文 字使用,經常集中在少量的字彙,而我們的文字符號系統卻相當的廣大,但裡頭多數的 字彙卻罕為人用;而從歌詞文本中亦發現,情歌歌詞經常運用相似的字彙,透過這樣字 詞概念的共現關係計算,呈現了歌詞慣用字彙成長尾分布。因此,本研究依照字彙分布 的資料型態決定不同共現範圍的字彙網絡浮現門檻值,分別建立了 3 個共現網絡圖形,
後續章節將從網絡結構和網絡節點特性指標分析,不同的字彙節點所代表的概念含意,
而從中針對這些共現度高的字彙概念組合找出隱喻相關的詮釋意義。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
M
No.
SNA (Bottom-Up)
W SS S
Word Word Count Word Word Count Word Word Count 1 love heart 155 love baby 69 love baby 38
2 love time 143 love way 57 love time 32
3 love feel 143
break heart 48 love feel 32
4 love go 126 love stop 46 love way 31
5 love baby 123 love one 45 love one 30
6 love one 122 love fall 40 love heart 28
7 love way 122 love time 40
feel way 23
8 love life 106 love feel 39
hold tight 21 9 love hold 100 love woman 37 love girl 21
10 love day 95 love heart 36 love fall 20
表 4.5: 三種共現字彙組合比較表
三種共現範圍的字彙組合比較如表 4.5,可以觀察到 3 筆資料的共現計算筆數呈倍 數差距,代表了在 W 共現網絡中保留了較完整的字彙數目,較能反映西洋經典情歌聆 聽者所接收到的訊息重點,以 W 網絡圖的第一筆字彙共現組合來看,愛情(Love)和心 (heart)可能會令聆聽者留下較深刻的印象;而另外兩個以句子為共現範圍的網絡 SS 和 S,將歌詞中可能為了配合旋律、段落而反覆出現的句子去除,較能夠反映歌詞創作者 原始的創作構想,因此在 SS 網絡和 S 網絡的第一筆字彙共現組合皆為愛情(Love)和寶 貝(Baby),反映出作詞者在創作情歌時,最常運用寶貝此一概念來和愛情做連結。此外,
從 3 個網絡共現度最高的前 10 筆字彙組合來看,W 網絡皆是和愛情字彙的連結,而 SS 網絡和 S 網絡個別出現 1 筆和 2 筆和非愛情的連結的字彙組合,表現出較高的歧異度。