針對進入Web 2.0 傳播時代的數位語藝批評研究,本研究提問:研究者如何善用
「文本探勘」工具,以便能夠同時擴大文本處理數量並兼顧語藝批評的詮釋與批評精 神?也就是說,將「文本探勘」工具運用到數位語藝批評研究上,除了借重其有效處 理大量網路文本的長處外,也必須了解其限制,同時思考在不同的研究階段,研究者 如何將其優點發揮到最大而又如何補強其不足之處?回應上述問題,本研究探討語藝 批評方法結合「文字探勘」工具時,如何在不同研究階段的網路文本選擇、分析以及 詮釋上,透過研究者的適時與適度介入,逐步重構文本脈絡,以提供研究者有效的論 證或詮釋所需要的依據資料。
簡言之,本研究建議語藝學者採取語藝批評方法揉合「文本探勘」工具的「混合 取徑」。之所以選擇「揉合」而非「結合」,主要是本研究強調,即使是在「文本探 勘」工具分析為主的七個步驟中,各個步驟都需要語藝學者持續保持適時、適度的參 與;相對地,在進入語藝學者論證、評判為主階段後,研究者也需要在上一階段LDA 研究成果的基礎上,進行主題(詞群)辨識、命名與編碼工作。也就是說,以數位語藝 批評研究而言,比較難截然劃分哪些研究階段是盧安邦(2014)的『人工智慧』研 究階段而哪些是『工人智慧』研究階段。因此,本研究認為,對數位語藝批評研究而 言,宜避免以「非黑即白」的態度來區分『人工智慧』研究階段以及『工人智慧』研 究階段。
為了論證上述建議之可行性,本研究選擇常用的十一種語藝批評方法中之「幻 想主題分析」,分析11個反核臉書粉絲專頁的3424則貼文與6443則回文。在「揉合」
「主題模型方法」之LDA分析後,本研究發現,「主題模型方法」確實有助於研究者 從文件群集中抽取隱藏的「主題」。簡言之,即使在LDA主題(詞群)分析結果的基
礎上,還是需要仰賴研究者對所研究的語藝事件的了解,才能在決定形塑幻想主題的 關鍵字時,不受限於詞頻;然而,LDA的特性,也協助研究者可以根據所選定的關鍵 字,回溯、審視完整文本,讓研究者得以重構比較完整的文本內在脈絡。因此,對於 面對Web 2.0傳播時代挑戰的數位語藝批評研究,本研究所建議的「混合取徑」提供一 個可行的研究取徑。當然,本研究只是一個新的嚐試,後續研究還有很多可以開拓與 精進的空間。
首先,為了進一步理解數位語藝的「互文性」特徵,可嘗試其他不同的詞語 共現分析方法,例如運用文本探勘的「點對點交互資訊」(PMI, Pointwise Mutual Information)和「詞彙共現網路」(co-occurrence network);所謂「詞彙共現網路」
是以各個詞彙為網絡中的節點(node),而共同出現在同一篇文章的詞彙以「邊」
(edge)來聯結,繪製詞彙共現網絡圖,再依據網絡中心性(centrality)的指標 解各 節點(詞彙)在整個網絡中的重要程 (施旭峰等,2014)。上述分析工具可以確認 詞組社會網絡,再加進行詞群分析以及代表性樣本的人工瀏覽,或也有助於論證特定 的重要關鍵字,是否具有貫穿文本核心的意義。
其次,Van Dijk(2003: 349)曾強調「脈絡」(context)無疑是人們的「心靈模 式」(mental modals),是人們理解事物的社會認知準據,推估脈絡的方式,主要是 由文本中言者論述的關鍵話語來加以確認;也就是說,言者強調、重視的脈絡要項,
必然會在其所述文本中出現。基此,Van Dijk(2003:368)更指出,確認脈絡關係的 方式可由文本中歸類出溝通的「範疇」(domain,意指面臨的溝通情境)、「背景」
(setting,意指實際所處場域)、擔任的「角色」(role,意指言者支持或反對的立 場,諸如如何表述正向自我呈現與負向他者)、訴諸「行動」(action,其中又包括 全球行動、在地行動及當前行動等)及強調「目標」與「知識」(goal & knowledge)
等類目,俾利印證內、外在脈絡間的互動關係。本研究建議後續研究,可以針對Van Dijk的「社會認知脈絡理論」所提的脈絡主題類目,也可透過文本探勘工具(如LDA 分析)獲致相關主題類目的關鍵字串,進而釐清內在文本與外在脈絡間的特徵。
此外,對於兼具圖像、影音及語言文字之文本時,如何運用「文本探勘」進行分 析,本研究並未處理,也是本研究的限制。然而,本研究仍建議後續研究採取「混合 取徑」,針對圖像或是影音內容可先進行人工瀏覽與語藝分析,並以語藝批評理論為
依據,運用文本探勘工具針對網路回文,進行爬文、斷詞與詞語共現等步驟;俾利論 證圖象、影音內容,為何會引發認同的原由。總之,本研究強調,若能採取「混合取 徑」原則,善用電腦文本探勘工具,將有益於解決網路巨量文本的問題。