• 沒有找到結果。

社群媒體研究的異質行動網絡: 重新想像數位時代的知識生產*

N/A
N/A
Protected

Academic year: 2021

Share "社群媒體研究的異質行動網絡: 重新想像數位時代的知識生產*"

Copied!
48
0
0

加載中.... (立即查看全文)

全文

(1)

2020 年 4 月 頁 167-213 研究論文

社群媒體研究的異質行動網絡:

重新想像數位時代的知識生產

*

曹家榮

**

投稿日期:2019 年 11 月 21 日;通過日期:2020 年 03 月 08 日。

* 本研究為科技部計畫〈數位時代的社會科學:跨領域研究的「實作/協作」如何可 能?〉(MOST107-2410-H-128-036)之研究成果。作者感謝兩位匿名評審於審查 過程中提供的寶貴意見。

** 曹家榮為世新大學社會心理學系助理教授,email: [email protected]

本文引用格式:

曹家榮(2020)。〈社群媒體研究的異質行動網絡:重新想像數位時代的知識生 產〉,《新聞學研究》,143: 167-213。

DOI: 10.30386/MCR.202004_(143).0004

(2)

《摘要》

本研究透過新物質主義的視野,反思社群媒體研究的跨領 域實作與協作。近年來,大數據及相關數位工具正改變著人文 社會科學的知識生產,不管是在數位社會學或是數位人文研究 的發展中,都可以看到人文社會學者、資科學者與數位工具三 者間密切合作的趨勢。到目前為止,針對這類跨領域研究的反 思,除了聚焦在方法或方法論上的客觀性、有效性問題,亦有 認識論層次上的探問。本研究則是嘗試進一步追問「認識如何 可能」的過程問題,也就是追問人文社會學者、資料科學家與 數位工具三者間是如何互動、協作以生成相關的知識成果?以 新物質主義的理論為基礎,本研究將這一知識生產的過程看作 異質組裝的網絡,並以兩個社群媒體研究團隊為案例,分析團 隊的生成、跨領域協作之過程,同時也著眼於作為非人行動者 的數位工具之行動。本研究主張,不論數位工具是一種「恩 惠」還是「隱憂」,重新將知識生產過程想像為「異質行動網 絡」,才能夠有助於研究者更深入地反思這一過程,進而也才 能讓數位時代的知識生產有更踏實的基礎。

關鍵詞: 社群媒體研究、後人類、混雜網絡、數位人文、數位 工具、數位社會學

(3)

壹、前言:數位化與知識生產

如果在 Google Trends 上面探索 “big data” 的搜尋熱度變化,會發 現這個詞大概從 2012 年年初開始受到注意,之後受關注的程度不斷攀 升,到了 2014 年以後,至今都維持著相對高的搜尋熱度。且不論「大 數據」(big data)到底是否真的帶來了 Mayer-Schonberger & Cukier

(2013)所謂的「資料革命」,大數據及其所伴隨著的各種數位科技與 工具的出現,對於學術知識的生產來說,確實造成了值得關注的改變。

boyd & Crawford(2012, p. 666)也曾引述前《連線》(WIRED)

雜誌總編輯Chris Anderson 的話指出:「如今已然是個大量資料與應用 數學取代了其他所有工具的世界……。只要有足夠的資料,數據將會自 己說話」。「讓數據自己說話」大概是早期關於大數據所帶來的改變,

最經典(也可以最有野心)的一句口號。即便後來多數人都更保守、務 實地看待大數據的「能耐」,但我們確實不能忽視它如何改變知識生產 的過程。

對於人文社會科學研究者來說,最直接的衝擊就在於大數據這種新 的資料形式勢必改變我們的工作模式。數位社會學(digital sociology)

的倡導者 Deborah Lupton(2015, p. 46)即曾指出,如今社會學者面臨 的挑戰就是各種數位工具、數位資料的出現,因此數位社會學發展的必 然方向即是,社會學者要不是得學習數位工具的專業,就是得與資料科 學家進行跨領域的合作。另一方面,數位人文學者Evans & Rees(2012, p. 36)同樣也指出:「作為這世界中實存且既存的事物,數位科技不可 避免地影響著人文學者做研究(或是思考世界)的方式」。1

1 早期數位人文研究被認為僅是作為「真正」人文科學研究的技術支援(Berry,

(4)

然而,這樣的改變並不是在人文社會科學既有的「工具箱」裡增加 一種(或多種)數位工具如此簡單。一方面,現階段而言,多數投入人 文社會科學(大)數據研究的,仍是跨領域合作的團隊。2 因此,這涉 及了跨領域研究的協作與實作要如何可能?另一方面,當這些數位工具 進入人文社會科學的知識生產過程,這也就意味著一種新的「介面」或

「透鏡」形成了(Marres, 2017)。而這一新的介面、透鏡也必然將帶 來新的方法論,乃至於認識論層次上的問題。例如,當我們考慮到 Pasquale(2015)對於演算法帶來「黑箱社會」(black box society)的 批判,勢必就得去檢視數位工具如何「不透明」地影響了知識的生產。

Halford, Weal, Tinati, Carr & Pope(2018)即曾以「資料管道」(data pipeline)作為隱喻,主張我們必須關注「資料」生成、取得、整理與 分析的整個過程中,所涉及的各種異質行動者(如 API、資料庫等等)

之行動與影響。

因此,本研究嘗試探究下列問題:大數據這種新的資料形式以及各 種數位工具如何帶來一種新的知識生產過程?為了更聚焦且經驗地討論 這個問題,本研究將以「社群媒體研究」為例。社群媒體研究在幾個面 向上突顯了本研究關注的問題,一方面,如同 Manovich(2011, p. 2)

2012, p. 2),但隨著 1990 年代網際網路的發展,數位人文研究也不再只是單純 的技術工作。Burdick, Drucker, Lunenfeld, Presner & Schnapp(2012)將這一加速 發 展 、 轉 變 的 過 程 稱 為 「 第 一 波 數 位 人 文 學 」 (the first wave of digital humanities)。而 Hayles(2012, p. 43)更指出,這一波的發展已然使其成為「一 個具有自身專業實作、嚴格標準及理論探索的真正智識活動」。

2 Lupton(2015)說的那種具數位工具專業的人文社會科學研究者仍是少數。除了 跨領域團隊的形式外,個人研究者多半可能是有某程度的數位工具能力(例如可 以自己寫「爬」資料的程式),但許多地方仍須依賴資訊專業人員的協助,例 如,可能需要跟資料提供業者購買資料,或者使用現成的、功能受限的套裝分析 工具。

(5)

曾指出,社群媒體平台的出現開啟了一個新的契機,「我們首次有機會 可以直接追蹤上億人的想像、意見、觀點與感受」。換言之,作為新興 的研究取徑,處理(大)數據資料的數位社會科學現階段而言最主要的 資料即是社群媒體資料(Edwards, Housley, Williams, Sloan & Williams, 2013)。另一方面,我們也可以在社群媒體研究的資料取得、處理與分 析中,清楚地看到數位工具的影響。因此,透過社群媒體研究的案例,

本研究可以完整地說明這一新的知識生產過程。如同 Evans & Rees

(2012, p. 29)曾指出,對於數位人文研究的知識生產來說,一個很重 要的轉變在於,如今「知識是在人與機器的相遇中生產出來的」。

本研究主張,這一隨著(大)數據、數位工具普及形成的知識生產 過程,不僅必然需要來自不同學科研究者之間的跨領域合作,也涉及了 人與各種「數位工具」間的關係。循此,本研究將以晚近新物質主義

(new materialism)的「異質行動網絡」概念為基礎,探究社群媒體研 究知識生產的過程。如同Fox & Alldred(2017)所說的,有別於傳統社 會學的觀點,新物質主義社會學想像要求我們將人與非人、工具都放進 異質且相互關連的組裝(assemblage)中,並考察其中的相互影響與作 用。

貳、數位工具的方法反思

採用大數據或是所謂數據方法的社群媒體研究之所以具吸引力,原 因 在 於其 「資 料 」的 特殊 性 (劉 慧雯 ,2018)。如 Edwards

et al.

(2013, p. 247)所說的,「社群媒體資料真正獨特之處在於,自然發生 的或『使用者生產的』(user-generated)資料以涵括所有人的規模、即 時或近乎即時的速度生產出來」。換言之,這意味著透過數據方法取得

(6)

的社群媒體資料在一些學者看來,克服了傳統研究方法在「廣度」與

「深度」兩個面向上的選擇問題(Edwards et al., 2013; Marres, 2017)。

然而,即便看似有著結合了廣度與深度的長處,社會科學研究者也逐漸 察覺並開始批判這類資料與分析可能有的限制與問題。

例如,特別是對於社群媒體資料分析來說,最根本的問題在於研究 者並非真的能夠取得所有使用者資料(劉慧雯、柯籙晏,2016;陳百 齡、鄭宇君、陳恭,2016;Halford et al., 2018)。不管是 Facebook 還是 Twitter , 過 去 研 究 者 透 過 應 用 程 式 介 面 ( Application Programming Interface,簡稱 API)能夠取得的都僅是部分的資料,只有付得起鉅額 資料使用費的組織才可能取得完整的資料。這也正是為何 Pasquale

(2015)警告我們已然身陷於「黑箱社會」的原因,我們的各種資料、

數位足跡被以「私有」之名掌握在 Facebook、Google 這類企業體手 中。但如同 Halford et al.(2018)的研究所指出的,有不少使用數據方 法取得社群媒體資料的研究,實際上並沒有說明資料如何取得以及資料 完整性的問題。

除了在資料取得上有限制外,「資料清洗」──將取得之資料透過 人工方式篩選、過濾、整理以排除資料的雜訊──也一直是晚近幾年不 斷被反省的問題(boyd & Crawford, 2012; Kitchin, 2014)。而盧安邦與 鄭宇君(2017)的研究更實際以一個案例說明了在資料蒐集、清理與分 析的過程中,研究者主觀判斷實際介入之處。例如,不管是在文本斷詞 還是在情緒分析上都清楚地顯露出研究者的主觀介入。Halford et al.

(2018, p. 3350 ) 同 樣 也 主 張 , 雖 然 資 料 可 能 是 以 無 結 構 的

(unstructured)的方式收集,但工程師決定了這些資料會如何儲存與管 理,進而影響了它們可能如何被搜尋、檢索。

更進一步地,這幾年來對於數位工具的反思也已注意到工具本身的

(7)

問題。例如,2017 年時 Information, Communication & Society 就做了一 個 關 於 「 演 算 法 」 (algorithms ) 的 專 題 。 在 這 個 專 題 中 , Kitchin

(2017, p. 17)指出,過去人們往往將演算法視為是「理性的純粹形 式」,也就是說,關於演算法的應用、影響等問題從來不在討論的範 圍。然而,實際上演算法從來都不是客觀、中立的。雖然程式設計師堅 稱演算法的客觀性,但在將一項任務或是處理程序、計算轉換為演算法 時,他們其實無法擺脫其中的社會與政治面向。更不用說在所謂的「訓 練資料」(training data)的選擇上也存在問題。Burrell(2016)也有類 似的批判,他認為不管是在初步界定特徵、預先分類訓練資料,還是調 整臨界值與參數上,都可以看到人的判斷仍或多或少地涉入其中,人的 選擇成了預設。

從上文可以看到,社群媒體數據資料在吸引研究者目光的同時,也 引發了不少的反思,這些討論雖然較多是聚焦在「方法」(或方法論)

的問題,3 但也不乏論者已開始探討認識論層次的議題。例如,Kitchin

(2014)的研究便同時也提醒人們必須注意到,大數據與相應的資料分 析方法將帶來認識論上的典範轉移。前述對於「演算法」的批判性探究 也同樣涉及了演算法對於知識(認識)帶來的影響。在下一節中,我們 則可以更清楚看到,確實有一些學者已經注意到類似的問題,亦即,不 僅僅要問數位時代中這些新的資料形式、工具的使用是否合宜、或是科 學客觀,更要進一步追問,就知識生產的過程來說,這些新的資料形式 與工具如何突顯出一種新的研究實作與協作的關係?

3 當然還有倫理與隱私的問題。請參考 Mittelstadt, Allo, Taddeo, Wachter & Floridi

(2016)的討論。臉書在劍橋分析事件後,似乎為了展示維護使用者隱私的「決 心」,不再讓第三方透過 API 取得使用者 ID 的資訊,對於社群媒體數據研究者 來說造成極大的影響。

(8)

參、向運算轉:數位工具如何影響認識?

這種轉向認識論層次、知識生產過程的探問,最早在數位人文研究 發展的過程中即被提及。David M. Berry 是晚近推動數位人文發展的重 要學者,在2010 年時,以「向運算轉」(computational turn)為名舉辦 了一場數位人文工作坊。Berry(2012)主張,「向運算轉」是如今數 位人文發展的關鍵。這裡的「向運算轉」,意指我們必須要注意到數位 工具所帶來的根本性轉變。

換言之,Berry 相信,隨著各種數位科技與工具的普及,我們如今 確實已然生活在Lash(2002)所說的那種科技的生活形式之中。在幾乎 所有的日常工作與行動中,我們都得依賴著數位科技與工具才可能近 用、理解這個世界。以帶點科技哲學意味的語氣,Evans & Rees(2012, p. 37)也主張:「隨著我們每日使用這些運算裝置,詮釋與評價這個世 界的新方式在這樣的操作中就越清晰地顯露出來」。因此,向運算轉,

也就是要聚焦上述這樣的「運算性」,亦即要認識到,數位工具並不只 是在方法、工具的層次上影響知識的生成,也在人們的使用中形塑了人 們理解、詮釋與評價世界的方式。這意味著數位工具乃是在人、科技物 與世界的內在相互構成關係中發揮著影響。也就是說,其作用不在於功 能的實用目的,而在於其對使用者的行動與認識施加了各種擴增與化約 的轉換。

更具體來說,Berry 的提問即是直指研究者與其數位工具間的關 係。Berry(2012)主張,我們實際上是以一種「去中心」的方式與數 位工具建立關係。換言之,研究者並非僅是操作、使用著工具,而是實 際上依賴科技裝置填補我們心智的空白,並以嶄新的方式連結知識。另

(9)

外一位知名的數位人文學者──同時也是後人類學者──Katherine Hayles(2012)也主張研究者是在與數位工具「共同合作」之下,才得 以延伸其眼界與能力,而這樣一種隱藏在機器與資料庫介面之下的協作 關係才是數位人文研究的重要特徵。換言之,其實不論是 Berry 還是 Hayles,都將其對於數位人文研究發展的反思,指向了人與數位工具之 間非主客對立、非二元區分的關係。

總之,不管是在前一節中看到的,對於社群媒體資料分析的反思,

還是 Berry、Hayles 等人在「向運算轉」中涉及認識論層次的追問,都 顯示出隨著(大)數據及相應之數位工具普及而形成的知識生產過程,

是有別於過去的樣態——甚至如 Kitchin(2014)主張形成了一種典範 轉移。因此,本研究的目的,即是嘗試透過探究社群媒體研究的異質行 動網絡,更系統性、經驗性地探究與反思此一新的知識生產過程。亦 即,相較過去的研究,本研究從新物質主義的理論視角切入,將人與工 具(非人)都放進異質且相互關連的組裝中,並系統性地考察其中的相 互影響與作用。同時,如前文曾提及的,經驗上來說,現階段透過數據 方法進行的社群媒體資料分析,多半都需透過社會科學研究者與資料科 學家的跨領域合作才得以可能。因此,本研究所謂的「異質」,在最表 面的層次上即是指向跨學科領域的研究者協作。在一個經常是由社會科 學研究者與資料科學家組織起來的團隊中,過去被認為是分屬兩種文化

(科學與人文)的研究者們如何溝通、合作以生產知識?其次,所謂的

「異質」,就新物質主義的觀點來看,更重要的其實是指向了過去也被 區分為兩個世界的「人」與「物」之間。亦即,當「資料」總是在研究 者使用數位工具的實作中生產出來,這樣的實作實際上亦是一種「人與 物的跨領域的協作」。如此一來,探究社群媒體研究的異質行動網絡勢 必也就涉及了各種數位工具的「行動」,這些行動如何使得資料取得與 分析成為可能?

(10)

肆、新物質主義與異質行動網絡

本研究採取新物質主義的觀點,探究使用數據資料與方法的社群媒 體研究生產知識的過程。如同Fox & Alldred(2017, p. 3)所指出的,所 謂的新物質主義並非單一的理論,而是許多同樣將「物質轉向」(turn to matter)視作其出發點或關懷核心的理論觀點。例如,Barad(2003)

在其提出的「能動實在論」(agential realism)中,即從一種關係存有 論的立場出發,強調所謂的「觀察者」與「被觀察者」之間並非截然二 分的,因而過去所謂的主體與客體、人與物的區分實際上是透過內在互 動(intra-action)的關係才得以分離。或是 Braidotti(2013)在其「後 人 類 」 (posthuman ) 境 況 的 討 論 中 , 同 樣 也 強 調 了 物 質 性

(materiality)的重要性。Braidotti(2013)主張,傳統人文主義主體是

「人類中心」、甚至是以陽剛男性為理念的,因此忽略了各種差異的他 者、非人及物,而「後人類」的討論便是要探索一種去除人類中心的共 生可能性。就如Braidotti(2013, pp. 49-50)所說的,這是一種嘗試擴大 自我與他者之間連結的後人類倫理,而此處的他者包含了非人或是「地 球」他者。

Latour(1993, 2005)的行動者網絡理論(actor-network theory,簡 稱 ANT)同樣也將「物質」置放於其關懷的核心。同時,ANT 的分析 取徑更清楚地突顯出我們如何能透過新物質主義的觀點來解釋知識生產 的過程。與 Braidotti 相同的是,Latour(1993)也拒斥人類中心主義。

如同 Latour(1993)所指出的,人作為現代主體與被發現、被使用的

「客體」之間的二元對立,乃是現代社會構成的基礎。透過將兩者純化 為兩極,「現代」確保了「人」的例外、中心性,以及非人的可剝削性

(11)

與可棄性。但是 Latour(1993, p. 41)認為,這樣的「斷裂」與「人類 中心主義」乃是現代的「謊言」。在We Have Never Been Modern 一書 中,Latour(1993)主張,實際上自然與社會、人與非人從未真正清楚 被區分開來,相反地,「現代」的成功更可以說來自於越來越多的人與 非人混雜在一起。這一點也隨著晚近越來越難以分類、並大量增生的

「混雜物」(不穩定的核電廠、南極上空的臭氧層破洞)得到證明。

因 此 , 我 們 可 以 在 Latour ( 1993 ) 所 主 張 的 「 非 現 代 」

(amodern)視野中,看到一種去中心化:也就是揭露「人」不再(或 從未)是占據優位、例外的主宰。透過揭露過去被遮蓋的、不可見的中 介過程,Latour(1993)指出,實際上,人與非人、主體與客體都是扮 演著中介物(mediator)的行動者,兩者相互交織、共同構作並轉換著 自然與社會的事實。強調「中介」是 ANT 取徑的另一重要關懷,這意 味著研究者必須看見那個充滿著各種行動作用力的過程。也因此,

Latour(2005, pp. 28-29)將 ANT 與傳統「社會的社會學」(sociology of the social)區分開來,有別於後者經常將「社會」看作無須解釋且實 存 無 疑 的 實體 ,ANT 的出發點是關於「社會」的不確定性,如同 Latour(2005, p. 29)所說的:「他們的出發點正是關於人們到底從屬於 哪一種群聚(grouping)的爭論……」。

換 言 之 ,ANT 是 一 種 「 聯 結 的 社 會 學 」 ( sociology of associations),其任務如 Latour(2005)介紹 ANT 的書名所示:重組 社會(reassembling the social)。且 Latour(2005)強調這是一種異質 的重組、組裝。也就是說,如同前面已提及的,不同於傳統社會學僅關 注於人的行動或能動性,ANT 同時也以另一個不確定性為其探究的起 點:是誰或是什麼在行動?藉此,ANT 不再將行動限定為「人的」行 動,而是主張:「任何只要能藉由製造差異而使狀態改變的事物,就是

(12)

一個行動者(actor)……」(Latour, 2005, p. 71)。回過頭來,這也意 味著,人從未真的是位居世界中心的操控者、推動者;相反地,物、非 人也在行動,而人也只是其間的中介者。就如同 Latour(1993, p. 78)

所主張的:非人並非空洞、被動或無力的,作為中介者「它不僅創造了 它所轉換的事物,也創造了它居中扮演中介角色的那個世界」。同時,

「如果我們將人移出其例外、優越的位置,推進交織的網絡中,人也就 同樣成了中介者,甚至也成了人與非人兩者的交織」(Latour, 1993, p.

137)。

對本研究而言,也正是因為 ANT 將自身視為是嘗試「重組社會」

的一種分析取徑,相較於 Braidotti(2013, 2019)的後人類理論或是 Barad(2003)的能動實在論來說,ANT 是一種更適合於用來探究知識 生產過程的新物質主義觀點。也就是說,相較於Braidotti 與 Barad 更聚 焦於在所謂後人類境況中、或是「物質轉向」中的人與物的存有論樣 態 — — 例 如 Braidotti(2019)嘗試探索的後人類主體,或是 Barad

(2003)主張的那種有別於傳統人文主義想像的,基於內在行動(intra- acting)、促動(enactment)而生成的能動性——Latour 的 ANT 採取了 一種更經驗的路徑,切入對於各種事件的重組與分析,實際去看是誰

(或是什麼)在各個環節、中介中行動,進而讓我們能夠看到人與數位 工具是如何可能共同生產出知識(認識)。4

因此,總結來說,新物質主義在幾個面向上有助於本研究探究社群 媒體數據研究的知識生產過程。第一,也是最為核心的,新物質主義是 以關係存有論為基礎,強調透過關係來理解事物的生成與運作。透過此 一 觀 點 , 我 們 得 以 聚 焦 於 各 類 異 質 行 動 者 「 所 為 」 及 其 相 互 作 用

4 當然,反過來說,這也正是 Braidotti(2013, 2019)批評 ANT 缺乏對於「主體」

的探討,以及總是停留在「事實」層次的原因。

(13)

(affect)。第二,新物質主義對於「物」的強調,或是用 Latour 的話 來說,對於能動性的重新分配,讓我們得以將數位工具的「行動」納入 分析的視野中。同時也如 Braidotti 與 Latour 等人提醒的,認識到人不 是唯一的、具完全控制能力的行動者。最後,如同Latour 主張 ANT 的 任務是「重組社會」,這意味著新物質主義強調研究者需「退一步」看 待 其 探 究 之 現 象 , 將 其 視 為 各 種 行 動 的 「 組 裝 」 。Fox & Alldred

(2017)即曾主張,研究者可以透過新物質主義的觀點重新在方法論上 反省一個研究的過程,將其視為研究者、研究工具與研究對象的「組 裝」。

循此,本研究選擇採取 ANT 的觀點與方法,將使用數據資料與方 法的社群媒體研究看作是一個「異質行動網絡」。也就是說一個社群媒 體研究得以生產出以資料、數據方法為基礎的知識,並不單純是有一群 研究者取得了新的工具,並按照其意志設定目標便能取得的成果。透過

「異質行動網絡」,本研究重新將此一過程想像為不同類型的、包含人 與工具的行動如何持續中介、轉譯,才逐漸使某些知識(事實)得以生 成。更清楚地說,本研究在接下來的案例分析中,將從兩個部分說明社 群媒體研究作為異質行動網絡的運作。第一個部分涉及的是「網絡形成 與動員」,也就是社會科學研究者、資料科學家與各種工具最初是在什 麼樣的脈絡中,與彼此共同成為了異質行動網絡中的行動者。此外,本 研 究 也 將 藉 由 「 不 合 作 的 事 件 」 來 突 顯 出 異 質 行 動 網 絡 不 斷 流 變

(becoming)的動態過程。如同 Latour(2005, p. 31)指出的,「團體 不是沉默的事物,而是一種持續喧鬧的暫時性產物……」。也就是說,

一團體、群體(或甚至「社會」)不僅不是無須解釋的既定的實體,也 不是一次建構成形就不會改變的聯結。相反地,「持續喧鬧」、「暫時 定形」才是其經常的樣態。在社群媒體研究的異質行動網絡中,我們可

(14)

以透過各種不合作事件來看到這種持續流變。

在第二個部分,本研究也將特別關注工具的「黑箱」與行動。「黑 箱」這一隱喻在科學與技術研究(STS)中,指的是被傳統社會學視為 無需解釋的科技物「客體」或事實,實際上也是異質網絡運作的產物,

但其生成的過程就像被置入黑箱般不再可見。因此,為了理解這一新的 知識生產過程,我們不僅要探問來自不同領域的研究者們如何合作,更 要「打開黑箱」看到工具在這樣的合作中所處的位置、中介的作用。或 者從新物質主義的觀點來看,其實也就是要在社會科學研究者、資料科 學家與工具(如臉書的 Graph API、資料庫、演算法、視覺化工具、斷 詞工具)的共同行動中,才看到一個「研究團隊」逐漸形成。因此,就 如同科學與技術研究嘗試「打開黑箱」,本研究也試圖更進一步去看社 群媒體研究的知識生產過程中,「工具」中介的網絡與異質行動者們究 竟「做了什麼」?這也呼應了新物質主義的想像,我們該關注的是

「物」做了什麼,而非它是什麼(Fox & Alldred, 2017, p. 24)。

伍、網絡形成與動員:打造一個跨領域研究團隊

2013 年臺灣科技部開始推動數位人文主題研究計畫,在其徵件公 告中說明了三個主要的面向,其中第一個面向便是:「善用新工具:數 位科技支援人社研究下的新方向」。其後,在第一年度的補助計畫案 中,便有許多是透過數據方法、數位工具探究社群媒體相關現象。雖然 這不能算是一個精確的紀錄,但由科技部發起推動結合人文社會學者與 資料科學家的跨領域團隊,應可說是臺灣社群媒體數據研究的一個重要 起點。5 本研究接下來討論的經驗資料基礎,即是研究者自 2013 年年

5 當然,若是就數位人文研究的發展而言,其脈絡可以追溯至更早的時間點。例

(15)

底開始參與相關社群媒體研究團隊的觀察,以及從去年開始陸續與幾個 研究團隊成員訪談的資料。此外,國內社群媒體研究團隊近年來也有豐 富的研究成果產出,其中有許多關於其自身生產知識過程的描述與反 思,這些文本也將作為次級資料納入本研究的分析與討論中。

一、初期磨合:在關係中生成的團隊

在將社群媒體研究的知識生產看作是異質行動網絡時,首先需要釐 清的問題便是:透過什麼樣的關係、中介,一個社群媒體研究團隊才得 以形成?甲團隊是由一位社會科學學者與兩位資科學者及數名碩博士研 究生助理組成。乙團隊則是由兩位社會科學學者及兩位資科學者,以及 同樣有數名碩博士生研究助理組成。然而,兩個團隊形成的過程卻有著 不同的形式。相較於乙團隊是由幾位關鍵人類行動者推動的,甲團隊形 成的過程中,「工具」的行動則扮演關鍵的中介角色。但無論是甲、乙 團隊,成為一個「跨領域社群媒體研究團隊」都不是單純寫在計畫申請 書上就成立的實體。

以甲團隊為例,可以清楚看到團隊如何在「關係」中促動、生成。

甲團隊核心的三位學者,雖然同樣都是在 2013 年科技部數位人文主題 計畫徵件時被「徵召」進一個大型整合計畫中的成員,但三個人過去從 未有合作的經驗,甚至也不能算熟識。不僅如此,對於甲團隊的社會科 學學者L 來說,當時也是他第一次聽到「數位人文」這個概念。傳統的 社會科學在研究社群媒體現象時,往往是透過動員大量的人力在平台上

如,鄭文惠(2014)即曾提及在 2013 年科技部數位人文主題計畫徵件之前,臺 灣大學即有學者與團隊在發展能切合人文研究的數位工具。甚至,我們也可將 2002 年由當時的國科會(現在的科技部)推動的「數位典藏國家型科技計畫」視 為數位人文的前身及起點。

(16)

記錄、收集不同使用者的資料。甲團隊經常將這樣舊式資料收集的方 式,戲稱為「手動模式」。而相對來說,如 Hayles(2012)指出的,數 位人文研究這類結合數位工具的人文社會科學研究,之所以特殊的地方 在於,研究者需依賴「機器閱讀」(machine reading)作為使自身可能 閱讀、理解資料的第一步。換言之,這是一種透過數位工具協助的「自 動模式」,先讓機器幫我們讀一遍。L 在訪談中很直白地描述了第一次 認識到這些數位工具時的感受:「我老實說我是狀況外,就是一直被驚 嚇,就是喔可以這樣、喔可以這樣,然後我們就不斷受驚嚇的狀態。」6

讓甲團隊作為社群媒體研究團隊開始成形的,是當資科學者Z 在最 初的會議上展示了數位工具的行動。甚至可以說,當數位工具被展示那 一刻,其中介才促動了「這個」研究團隊。也就是說,其實 L 與 Z 等 人最初被徵召進 2013 年的整合型計畫時,大概都認為資科學者僅是來 提供技術上的協助。然而,數位工具的行動扭轉了研究者們的認知。因 為,這不再是由社會科學學者下指令,然後數位工具(及資科學者)就 產出結果的傳統模式。數位工具如何行動,資科學者如何為其代言,這 些關係才讓甲團隊「真正」成為一個社群媒體研究團隊。

那個在最初會議上由資科學者 Z 展示的工具,是可以將透過所謂

「應用程式介面」撈取到的社群媒體資料展示出來的一套工具。我們可 將其稱為工具 A。工具 A 的行動,讓研究者不再需要花費大量的人工

「手動」記錄、收集不同社群媒體使用者的相關活動,只要給定一段時

6 社會科學學者不見得不熟悉數位工具,至少在量化研究中各類統計軟體的使用都 是常態。然而,社群媒體研究中數位工具的特殊性在於,它的中介行動是與過去 不同的。傳統量化研究是由研究者設定了資料收集的框架、內容(問卷調查為 主),因此,統計軟體是在研究的大體上清楚其所面對的現象時進行中介。在社 群媒體研究中的數位工具,則是如Hayles 說的,研究者其實不知道現象是什麼,

必須透過機器(數位工具)幫我們先讀一遍之後,我們才能進行閱讀與理解。

(17)

間及欲撈取資料的使用者對象,7 工具 A 就能將這段時間內選定對象的 平台上所有公開貼文、貼文時間、按讚、留言與分享數等資料抓取下 來。

一方面,工具 A 的行動改變了資科學者的位置,從過去被認為僅 是協助者的角色轉變為關鍵代言人。就像社科學者 L 最初看著工具 A 的行動時,充滿疑問地說:「API?什麼是 API?就是 application……我 說,好,那是什麼?就是它會有一組 code……那是什麼?所以能幹 嘛?」於是,我們可以想像,原先相互分離的「資科學者與工具 A 的 關係」、「社會科學者與資科學者的關係」,透過工具 A 中介起來的 同時,三者的位置都被轉變了。資科學者Z 站上了關鍵代言人的位置,

為社科學者 L 等人拆解工具 A「黑箱」裡的秘密。另一方面,工具 A 作為 Berry(2011)所稱的「被委任的行動者」(delegated actor),雖 然有其自身受促動、生成的過程,但它那「黑箱化」的行動讓社會科學 研究者自身也被位移了。也就是說,工具 A 不再是聽任其命令的「工 具」,相反地研究者自身需修改其提問的方式,或如訪談中另一團隊受 訪者C 在相似的脈絡下所說的,得先認識工具才能提問。

受訪者C 是乙團隊的社會科學研究者,在訪談中談到數位工具的行 動時,他以一組譬喻來說明社群媒體研究的數位工具與傳統社會科學量 化研究工具的不同。C 認為:

我覺得我們的那個……社會科學量化方法的話呢,它比較像是 一個……呃……我……我不知道這樣講對不對吼,我只能講比 喻啦……,它比較是一個固態結構的東西。……以一個固定的

7 基於研究倫理與隱私問題的考量,甲團隊主要的研究對象均為資訊公開的社群媒 體平台。當然,這樣的設定也牽涉到資料完整性的問題。在某些社群媒體平台 上,用戶的隱私設定會隱蔽設定為隱私的貼文或回文,這會導致研究即便透過 API 工具也無法取得相關資料。

(18)

方法,去應對許許多多的…這個需求。

可是,呃……現在看起來的話呢,這個所謂的數位方法,其實 它比我們想像中……,我覺得它……某種程度,你還可以把 它……譬喻成……它比較液態的。(受訪者C)

在這一固態與液態的譬喻性差異中,受訪者C 指出了社群媒體研究 中的數位工具有著更多樣、異質且變動的型態,或者以本研究的語彙來 說,這些數位工具本身即是一連串中介、促動的過程,且此過程仍有著 持續變異的可能。如同 Kitchin(2017)在討論作為數位工具核心的演 算法時,也主張其並非單一、獨立、完成、固定不變的,相反地,演算 法實際上總是處於變化的狀態(always in a state of becoming),持續被 編輯、修改、刪除、重啟等等。而社會科學研究者可見的僅是數位工具 黑箱化後的結果。這也是為何C 認為,在面對數位工具時研究者必須要 先認識數位工具才能提問。

二、跨領域協作:多重網絡動員

在關係中促動、生成了「團隊」後,團隊並非就成為固定、不再改 變的實體。除了下一節我們會再進一步討論的因異質旨趣而產生的變化 外,社群媒體研究作為一種跨領域的協作,其「團隊」實際上需要——

借用俗民方法學的語彙——持續維繫與完成的。8從本研究採取的異質 行動網絡觀點來看,這即涉及了「團隊」的成員如何持續進行並維繫網

8 Garfinkel(1967)的俗民方法學主張日常生活的秩序並非傳統社會學所謂「社會 化」或規範內化的產物;相反地,秩序乃是日常實作持續維繫與完成的成就。

Latour(2005, p. 22)在主張 ANT 的出發點之一乃是聚焦於團體形成的過程時,

也曾指出俗民方法學有著相同的探究起點:尋常的日常實作。

(19)

絡的動員。

在與社科學者L 的訪談中,他有一句話貼切地描述了甲團隊聚集起 來的行動網絡:「我們自己做自己的,可我們都知道別人在做一件,他 很擅長但是我們搞不清楚的事情。」借用Law & Callon(1992)在研究 英國大型航空計畫時提出的概念,甲團隊的行動網絡樣態可以粗略描繪 如下:一方面,用Law & Callon(1992, pp. 21-22)的話來說,甲團隊 整體的行動便是一個「總體網絡」(global network),它「同時包含了 行動者與其周遭人物(neighbors)之間的一組關係,以及這些周遭人物 彼此之間的關係。」另一方面,整個總體網絡的打造與維繫需要各個

「地方網絡」(local network)的確立,譬喻地說,「也就是對於任何 運作裝置(working device)的成功生產來說,所有必要的各種零碎部分 的異質組合的配置的發展。」在甲團隊中,這些地方網絡可能包含了,

例如,資科學者 Z 與其實驗室的研究生助理,以及他們開發的數位工 具;或是另外一位資科學者H 及其「代言」的資料庫工具。

(一)溝通、說服與徵召

在這樣的異質行動網絡中,動員是如何可能與維繫下去?首先這涉 及了網絡中的行動者是否能在同一行動旨趣下——用 ANT 的語彙來 說——接受「徵召」(Callon, 1986)。或者,經驗地說,這就意味著團 隊中的成員需要說服彼此某個作法、概念或方向是可行且應然的。在由 社會科學研究者與資科學者組成的團隊中,這又經常涉及了跨學科領域 的溝通。例如,在甲團隊這邊,通常都是由社會科學研究者L 進行研究 議題設定與概念工具選擇。甲團隊其中一個研究問題是關於某社群媒體 平台在重大事件中資訊傳散的樣態,因此,L 在訪談中就提到:「最早 期的時候,我們會用大量的理論去告訴他,比方說,兩級傳播是什麼意

(20)

思呢……,他們就會聽喔,聽到最後覺得煩了,他們就講說,所以那為 什麼要這樣定義,他就會回來問個問題,確定你在講什麼。」也就是 說,就像受訪者 C 認為傳統社會科學研究經常是「理論驅動」的

(theory driven),一開始社科學者 L 也是習慣性地先從關於一個現象 可能的理論解釋出發、提問並給予概念定義。但這在資科學者來說其實 是一個不清楚的提問與要求。乙團隊的受訪者B 舉例說,例如社會科學 研究者可能想要做某次大選中候選人粉絲團留言的情緒分析,但「對於 傳播的人,他們是,不知道這些細……這些細節的……所以他只能從,

他直接溝通到最尾端那樣」,亦即,提出類似「有沒有什麼工具可以幫 我」之類的問題。然而,在資科學者來說,這是一個需要拆解成數個小 問題的大問題,且這裡面的每一個小問題,甚至資料欄位要怎麼安排都 是需要清楚界定的。

同樣地,反過來,資科學者在展示數位工具或解釋其運作過程時,

則是社會科學研究者難以理解的部分。就像B 所說的,對於資科學者而 言,「因為我處理會有這一堆程序,但是我在解釋的時候又會碰到非常 多專有名詞……然後他也無法理解……這時候……通、通常就會,兩邊 覺得很累。」曾參與過甲、乙團隊的受訪者 K 便認為,這樣的跨領域 隔閡導致溝通的過程經常就要用猜的,「你是不是這個意思?你是不是 A 意思?你是不是 B 意思?你是不是 C 意思?然後那邊就,欸……好 像是、好像不是,這又是溝通過程。」而這樣的阻礙要能夠解決,便需 要網絡中的中介行動,將異質的行動者串連起來。例如,在甲團隊中,

社科學者 L 便經常採取了關鍵的中介行動。如同受訪者 K 所陳述的,

「L 他就會把那個嗯……比如說在會議中……嗯……資科那邊的發言出 現了……嗯……人文這邊傳播這邊聽不懂的,L 就要把他直接講出來或 者倒過來也要直接講出來……,這樣的話才不會變成陷入說其實是因為

(21)

雞同鴨講所以問不出問題來的這種情況。」而在乙團隊中,受訪者C 同 樣也是類似的角色,而且就 K 的觀察,由於 C 本身的學術背景是有接 觸過資料科學的社會科學研究者,相較於甲團隊,C 的角色與行動也就 使得乙團隊的溝通更為順暢。如同 K 所說的,「他的身分本來就在這 兩邊!兩個中間!所以他來做這件事情的話比較沒有這個問題,……因 為他的思維本來就剛好在人文跟數位的中間。……我甚至覺得……資科 人會比較聽得懂……甚至會比較更聽得懂C 在講的東西。」社科學者 L 在訪談中,曾經很傳神地說明了這種需要不斷來回反覆的溝通過程:

「我們有一點就是,互相的且戰且走,然後互相的在 shaping 對方的問 題意識,互相的在教對方怎麼用我的方式思考你剛剛講的那件事」。

上述的境況也意味著,對於每一個作為異質行動網絡的社群媒體研 究團隊而言,都需要計畫推動者讓自己成功地成為 ANT 所說的那個關 鍵的「強制通過點」(obligatory point of passage, Law & Callon, 1992),

透過他的旨趣詮釋與動員讓總體網絡得以維繫與運作。而這需要行動者 的協商與相互說服才得以可能。例如,前述提及甲團隊在研究資訊傳散 的議題上,原先社科學者L 在理論基礎上界定出兩個重要的面向——一 個是傳散的「廣度」,一個則是傳散的「深度」——但對於資科學者 H 來說,他透過資料庫數據看到的卻不是如此。L 在訪談中提及當時的討 論時指出:

他的意思是說,我在資料上看到偏斜,它是 significant 的,我 才拿出來的,其他任何兩個變項加加減減沒有關聯,不會影響 資料的排序或什麼,所以他是測試了 n 次之後,發現幾個加減 乘除的方法是可以在這個 dimension 上把我講的那兩個東西給 牽進去,然後要長成這個樣子,所以他做的是他自己的演算 法,他其實做了演算測試,只是他把整個過程都略去不告訴我

(22)

們……。(受訪者L)

換言之,一方面,資科學者 H 使用的資料庫數據及相關演算法工 具作為中介者,轉譯了原先的概念界定,工具的行動讓 H 看到並得以 代言地提出資訊傳散概念的第三個面向:時間。另一方面,社科學者 L 接受了此一轉譯,他認為,H 及其工具的行動「讓我們看到了時間」。

而在旨趣不變的狀態下,接受此一轉譯的「妥協」得以維繫總體網絡的 運作。

(二)動員的策略

我們在前述已提及,應將甲、乙這類跨領域社群媒體研究團隊看作 是包含了多重的地方網絡,因此,異質行動網絡的維繫除了涉及可以看 作是微觀互動過程的溝通與協商外,在相對抽離直接互動脈絡的組織層 次上,還可以看到一些動員的策略。此處所涉及的問題更多是,計畫推 動者是否能合宜地組織、串連不同地方網絡間的關係。

首先,我們在甲、乙團隊都可以看到計畫推動者透過不同的組織策 略讓團隊中異質的行動網絡更有效地聚合在一起。此處行動者面臨的問 題是,在這種跨學科領域的研究團隊中,當每一次會議都將所有成員聚 集在一起時,就會發生如受訪者C 在訪談中提到的,不同領域的成員因 對另一方的知識不熟悉而聽不懂或沒興趣。因此,我們可以看到甲、乙 團隊各自採取了不同的策略來解決此一問題。在甲團隊中,社科學者 L 採用了他戲稱的「兩面手法」,就如L 所說的:

我們會私下找 Z,我跟助理,我們三個會開個小會溝通那個圖 怎麼改,不會涉及 H 的部分,然後我跟助理又會去找 H 說,

我 們 怎 樣 可 以 去 approach 資 料 庫 , 就 是 我 可 以 學 簡 單 的 coding,但是我要怎麼 approach?有沒有可能做介面?但這跟

(23)

Z 無關,我們會有一個小會,就第二層的小會,我跟個別的老 師之間,然後通常會帶著助理去這樣。然後我們三個有一個比 較大的會,所有的助理會來這樣。(受訪者L)

這所謂的「兩面手法」也可以看作是一種「空間」策略,亦即透過 空間的區隔,將不同的相關行動者串連進不同的會議之中,確保每一次 的溝通會議主題是明確、有效的。同時,也是透過這樣的策略,L 間接 地再確認與維繫了自身作為關鍵「強制通過點」的位置。區分為兩個地 方網絡的資科學者 Z 與 H 的實驗室團隊,藉由 L 的中介才得以串連起 來。

相較於甲團隊的空間策略,乙團隊採取的則更像是一種「時間」策 略。在同樣經歷過初期所有成員一起開會的問題後,乙團隊後來改採分 段開會模式。在固定每週的會議時間,先由團隊的核心成員(受訪者 C 與另一位社科學者 U,以及資科學者與資深助理)在第一個小時確認工 作進度,以及下一階段目標。在這個階段的會議中,如同曾參與過乙團 隊的受訪者B 所說的,由於參與的成員多半已有跨領域溝通能力,因此 能夠真的來解決問題。接著,在會議的第二個小時,才正式由所有團隊 成員參與。此時的參與者經常也包括社會科學與資科兩邊的新進助理。

此一階段的溝通任務主要放在向成員展示現階段成果,如受訪者 C 所 言:「在那個所有人的會裡面,他們會提一個……報告,等於告訴他們 說,欸我們這個系統現在目前怎麼樣……。但不是在討論說那個系統怎 麼改進」。同時,也藉此進行腦力激盪,探索工具、資料的應用可能 性。

甲、乙兩團隊採取的策略差異,可以說是源自於計畫推動者之間的 差異。前文中我們已曾提及,C 相較於社科學者 L 有更多的資料科學知 識背景,這除了使得 C 與 L 在跨領域溝通互動的過程中順暢程度不一

(24)

外,也讓他們採取了不同的組織策略。可以想像,對於資科知識更加缺 乏的L 來說,透過空間區隔的策略,各別與不同專長領域的資科學者 Z 與 H 互動,會更容易且有效地進行協商。相對地,因為 C 特殊的資科 知識背景,他不需要採用實際上更花時間的空間策略,可以僅透過時間 的分段來解決所有成員共同開會的無效率問題。這種組織策略上的差異 也在後來影響了甲、乙團隊不同的走向。透過空間區隔策略串連不同地 方網絡的甲團隊,很清楚地是由L 在主導團隊發展的旨趣,因此後來甲 團隊發展出更偏向社會科學式的資料分析模式。然而,乙團隊則由於受 訪者C 本身是兼具資科背景的社會科學研究者,從其會議模式便可窺見 一種工具、資料導向的旨趣。在與C 的訪談中,他即提及後來乙團隊最 重要的目標便是要打造一個共用的工具平台,讓相關領域、議題的研究 者都能在這一平台上使用及發展資料庫與各種分析工具。

三、不合作的行動者?異質旨趣的流變

本研究的兩個團隊案例分別採取了不同的組織策略(空間、時 間),當然,從異質行動網絡的概念來看,這兩個策略並非完全涵蓋了 行動網絡的串連形式。我們必須在個別的案例中,跟著不同的計畫推動 者(行動者)才可能得知不同研究團隊是如何生成與維繫的。此外,從 異質行動網絡的觀點來看社群媒體研究團隊,還必須注意到另一種變 異,亦即,因異質旨趣而生成的行動轉變。

網絡中的行動者並非總是「配合徵召」,這是當我們關注一個團體

(隊)實際生成與發展的過程時,經常會看到的現象。ANT 的研究 中,諸如無法使燃料電池運作的觸媒(Callon, 1987)或是在「養水種 電」計畫中改變了躉購費率的政務委員(楊弘任,2017)都是使行動網

(25)

絡軌跡改變的不合作行動者。這些「不合作」的事件經常源自於行動者 有著不同的旨趣,而這在本研究的案例中也可以看到。

前文曾提及,甲團隊關注的一個主要議題是社群媒體平台上資訊傳 散的形式,但除此之外,在檢視社群媒體使用者互動時,一個關於「離 題」現象的問題意識也浮現在討論中。所謂「離題」指的是,在一個互 動脈絡中,突然某一位使用者回覆了與既有脈絡不相關的文字,進而就 將整個互動帶離原有主題。「離題」現象至少有兩個重要性,其一是,

它其實就是臺灣 BBS 文化中的一個特色,即「樓蓋歪了」。9其二則 是,「離題」也一定程度上可能反映出「風向改變」的現象。社科學者 L 指出,當初他們為了實際從社群媒體資料測量到這個現象,試圖參考 語言學的作法,做出一些關鍵字的關連詞。例如說,柯文哲、柯市長、

柯P 等等可以被看作視同一圈裡的字。如果能夠做出這種關連詞的資料 庫,研究者就能以此為基礎判斷社群媒體使用者的回文是否「離題」—

—即與原有主題關鍵字皆無關連。L 說,「我們為了這件事情去找了語 言學家,我們就試著做這件事情,然後就跟 H 討論,可不可以在計算 的時候做類似這種加權」。於是資科學者 H 便與其助理 G 開始了這個 嘗試。

H 與 G 選擇了政治人物的媒體平台專頁作為對象,按社科學者 L 的說法,他們原先是「要把柯文哲的材料切一半,前面那一半做關連 詞,後面那一半做關連詞的測試跟計算,知道大概長什麼樣子,這樣我 們就可以建立柯文哲字典裡面,他大部分的字是怎麼互相影響的。」但

9 從 BBS 站到社群媒體平台,它們在互動介面的設計上經常都是讓使用者一個接續 一個對話或回文,因此,看起來就像是「蓋高樓」。PTT 早期的一個熱門字「五 樓」即這麼來的。也因此,當有使用者在對話串中離題時,就會被認為是「蓋歪 樓」了。

(26)

當助理 G 實際做下去後,卻發現有兩圈字逐漸分開了,這兩圈字又分 別對應了藍、綠不同的政治傾向。換言之,在 H、G 與資料庫的地方行 動網絡中,「資料」向研究者展現了另一種行動可能性。原先L 說服 H 與 G 做的,是利用資料做出「柯文哲(關連詞)字典」,但「資料」

所說的卻是字詞更像是對應於藍綠不同的政治傾向。因此,H 便建議改 做後來所謂的「藍綠字典」。也就是說,在 H、G 與資料庫這端的地方 網絡,雖然一開始看起來接受了 L 的動員,投入與探究離題現象相關的 關連字詞基礎研究。但如同每一個行動網絡既有的異質與混雜性,對於 H 與 G 來說,資料分析與計算過程所突顯出的另一個現象便讓他們偏離 了原先的旨趣。

甚至,說得更精確一點,對於資科學者 H 與 G 來說,其最初的行 動旨趣便是異質的。他們感興趣的是資料庫與演算法,而不是柯文哲說 了什麼。接受社科學者L 的動員,僅是因為這個(社會科學的)議題看 起來可用來進行資料庫的分析與演算法測試。如同L 在訪談中表述的,

「你開始看學生的論文,終於看懂的時候才知道說,他真的跟我做不同 的事耶,他真的在做他的事,只是我們做同一個題目,同一筆材料而 已,然後對我們來說重點是 meaning,對他們來說重點是算法,真的就 是算法……」。換言之,表面上,H 與 G 一開始確實被動員投入了關連 字詞的計算,但對這個地方網絡的運作而言,重點並不在是否真的判讀 出某些字詞的意義相近,而在於去實驗看看哪一種演算法是更有效用 的。如L 所言:

他們真的不在乎做出來的結果是什麼,他們真的在乎的就是那 個算的過程,哪一種算法更有效率,比方說像 G,我們就想說 是藍綠字典,好棒對不對,藍字典、綠字典,我們就愛這個對 不對,G 的論文完全不是做這個,不 care,他的論文做的是,

(27)

怎麼樣篩出好的藍字典綠字典,有三個算法,這個算法字的重 疊率會到,比方說0.67,這個算法 0.32,這個算法 0.85,喔這 個算法最好,我來算一次。(受訪者L)

從異質行動網絡來看跨領域研究團隊,我們才得以看到這類「不合 作事件」突顯出的問題。如何讓旨趣不同的成員朝共同的方向行動,這 是計畫推動者的重要課題,不僅需要找到動員的利害關鍵(Callon, 1986),「藍綠字典」事件更清楚顯示出,「非人」行動者(資料)的 中介具有的影響作用。而 H 選擇背離既有行動軌跡,除了「資料」中 介行動帶來的轉變外,也反映了「總體網絡」運作的關鍵問題:是否有 足夠的「資源」作為動員的誘因?在前一節中,我們看到 L 與 C 分別 採用不同的組織策略維繫團隊的討論與互動,但從「不合作事件」中我 們則可以看到這另一個關鍵問題。如同 K 在訪談中很直白地說:「如 果人文學家跟資料科學家的合作只是人文學家說,喔,你要幫我做 ABCDE,資料給我。然後資料科學家只是在那邊做工的話,對資料科 學家沒有任何好處啊。…那我為什麼要跟你合作呢?」K 認為,所謂的 合作應該是兩邊都能夠就其自身研究領域得到成果。甲團隊中社科學者 L 與資科學者 Z 之間看起來就更能達到這種合作關係。就像 L 說的,

「他們都有個共同的缺陷就是,他們沒有題目,是我們有題目……。」

或者反過來從Z 的角度看,對於他們本來在做的資料視覺化研究來說,

這個團隊讓他們可以在新的主題上嘗試新的繪圖方式。因此,雖然L 與 Z 也經常就「開發成本」是否值得有所爭論,但大部分時候動員都是順 暢的。相對來說,「藍綠字典」事件則可算是動員失敗,L 在此未能成 功地獲得地方網絡的回應。而這一失敗,可以帶我們進入下一節的討 論,將焦點更集中地放在「工具」的行動上。

(28)

陸、工具的「黑箱」與行動

本研究採取新物質主義觀點,將社群媒體研究團隊看作是異質行動 網絡,因此除了前述所關注的跨領域研究者的互動外,「物」在其中如 何行動、中介也是本研究的探問焦點。Fox & Alldred(2017)以新物質 主義為基礎,提出「研究組裝」(research-assemblage)這一概念,其 意味著我們必須將一個研究過程中的各種異質元素視為一種相互影響的 連續體(或是說「組裝」)。從被研究的事件、蒐集資料的工具、資料 本身、分析工具、產出與呈現結果的工具到研究者等等,它們在彼此的 行動中相互影響、促動。例如,在前一節的討論中,我們看到了資科學 者 H 如何因為「資料」在演算法的中介下呈現出資訊傳散的「時間」

面向,而堅持需將此一面向加入原先的兩個面向之中。這清楚地突顯出 透過數據方法進行社群媒體研究與過往不同的特性:有時候資料、數位 工具才是關鍵的行動者。

為了較適切地呈現異質行動網絡中的不同過程,前一節中本研究以 人類行動者(研究者)的角度,討論網絡的動員與流變。這一節我們則 將打開數位工具的「黑箱」,也就是進一步去看經常被人們忽略的

「物」的行動。更確切地說,在 ANT 的研究中,「黑箱」這一隱喻指 涉的是那些無法直接被看見、但實際上涉及了一連串複雜行動者(相 對)穩定運作的過程(Callon, 1987)。因此,本研究所謂「打開數位工 具的黑箱」,並非單純指向工具物本身,而是指向使數位工具得以運作 之組裝過程。

我們先前曾提及,數位人文學者 Berry(2011)主張可將工具視為

「被委任的行動者」,這樣的說法類似於 Latour(1992)提出的「預先

(29)

銘刻」(pre-inscription)之概念,也就是某些行動腳本被轉換進科技物 之中,藉此,這些非人行動者不僅有了力量,也承載了某些價值與責 任。不過,不管是「被委任」還是「預先銘刻」,這兩個概念都不足以 掌握數位工具本身行動的複雜性。實際上,每一個工具的行動本身都可 以被視為是一個由異質行動構成的地方網絡(也就是一個黑箱)。為了 討論上的清晰,下面我們分就資料收集、資料分析與資料呈現三個過程 來說明工具的行動網絡。10

一、資料收集:未被看見的中介

圖1 是陳百齡等人(2016)在其研究中引用「水火計畫」團隊如何 透過API 進行資料撈取的示意圖。包含本研究的案例甲團隊所使用的工 具A,大體上社群媒體研究要透過 API 取得平台上的資料,都是類似的 過程。在其中,社會科學研究者經常只參與了「使用者查詢」這一塊,

而「應用程式」後面發生什麼事情即是不可見(或不過問)的「黑 箱」。但從這個圖示可以看到,研究者要能取得資料,就至少需要「應 用程式」、「API」、「資料庫」以及「社群平台資料庫」的協作行 動。

圖2 則是熊凱文、魏浩翔與紀明德(2014)呈現的另一個類似的資 料收集過程。如果將此過程對照社科學者L 所謂「透過工具 A 撈取社群 媒體資料」的行動,我們可以發現,其中還涉及了使用工具 A 的用戶

10 特別需要說明的是,雖然本節將與「工具」相關的異質行動網絡(也就是黑箱)

運作區分為資料收集、資料分析與資料呈現三個階段,但在實作中這三個階段可 能是纏繞、交疊在一起的。也就是說,這裡僅是為了分析與討論的清晰而將整個 運作過程拆解成三個階段,實際上的運作可能是,例如,資料收集與分析會有重 疊、反覆,而資料呈現又可能會回過頭來影響如何分析。

(30)

端無法直接看見的資料處理與儲存的動作,也就是透過API 將資料撈取 進伺服器端並加以儲存的動作。這個過程在使用者於工具 A 的介面上 提出要求後,便看起來像是「自動完成」了。但實際上這背後乃是一個 地方網絡中介、轉譯的結果。例如,熊凱文等人(2014)在其研究中描 述了類似的過程,一方面,透過API 所取得之社群媒體資料已呈現既定 具階層架構的格式(JSON),這意味著透過 API 取得的資料已先初步 整理過了。Halford et al.(2018)也才因此主張,如果研究者未能認識 到透過API 取得之資料可能的扭曲,便無法察覺分析可能產生的偏誤。

另一方面,如熊凱文等人(2014)所述,從 API 取得之資料還需要匯入 資料庫,而這時就需要如他們研究中 MongoDB 這類資料庫管理模組的 中介,其運作也是不可見的。

圖 1:透過 API 撈取資料示意圖

資料來源:〈社群媒體資料分析:特性和歷程的初探〉,陳百齡、鄭宇君、

陳恭,2016,《傳播文化》,15: 56。

(31)

圖 2:系統架構圖

資料來源: 〈社群媒體資訊傳播之視覺化〉,熊凱文、魏浩翔、紀明德,

2014 年 7 月,「甲午年第廿二屆計算機圖學研討會(Computer Graphic Workshop, CGW)」,臺北市大安,頁 2。

資料在透過 API 與資料庫的中介儲存下來後,還需要經過所謂的

「資料清理」。此時,研究人員又會再次進入行動網絡之中,如同陳百 齡等人(2016)指出的,「研究人員進行資料清洗之前,必須先探索以 下幾件事:資料存在哪些格式?資料是什麼態樣?如何選取適當資料維 度進行分析?」例如,透過 API 從 Twitter 上撈取到的資料,可能包括 推文、網址、標籤(hashtags)等原始資料,而其下又有不同的資料項 目,像是在「標籤」下又可整理出「標籤名稱」、「含有此標籤的推特 文編號」、「發文時間」、「用戶名稱」、「用戶編號」等等(陳百齡 等人,2016)。而研究者需針對其研究所需決定要留下並整理清楚的資 料欄位有哪些。像是本研究案例的甲團隊,當他們探究臉書使用者資訊 傳散過程時,透過API 取得的資料中,紀錄了分享路徑的「分享編碼」

(share ID)便是重要且需留下的資料。

(32)

換言之,使用者在用戶端的軟體或介面上提出查詢時(例如,顯示 某一時段中某一粉專的所有貼文),實際上是由一連串的行動者相互促 動才能生成結果:將有著不同行動的工具召集在一起的資科學者、已預 作處理的社群媒體資料庫、涉及一套「請求」(request)行動的 API、

將取得的具 JSON 格式之資料匯入資料庫的管理模組、清理資料的研究 人員。正是因為認識到這一連串的過程,Berry(2011)認為,數位工 具運作著一種「雙重中介」(double mediation)的轉換。也就是說,它 們不僅將現象轉譯為資料,也將資料轉譯為呈現給研究者的資訊。對於 這樣的境況,Berry(2011, p. 16)憂心於這將「導致使用者越來越依賴 電腦生產、呈現出的螢幕資訊,也使得使用者無力於防範錯誤的發 生」。而這也是本研究的起點之一,本研究主張,這不必然意味著社會 科學研究不應使用數位工具,毋寧地,關鍵在於我們是否能夠「打開黑 箱」,是否有機會去檢視此一問題。

二、資料分析:演算法的行動與中介

工具中介行動的第二個部分則是參與資料分析。此處一個重要的行 動者即是「演算法」。以最廣義的方式來說,演算法是編碼的程序,在 特定的計算基礎上,它將輸入的資料轉換為人們想要的輸出資料。這個 程序同時說清楚了問題是什麼,以及解決問題的逐個步驟(Gillespie, 2014, p. 167)。換言之,一方面,演算法也是由程式碼(code)聚集起 來的,但它涉及了「運算」,因此有著相對獨立的行動能力。Burrell

(2016)即透過圖形辨識的機器學習演算法說明了,演算法透過訓練資 料進行學習的過程,涉及了人無法理解的不透明性。另一方面,演算法 的不透明也在於,它通常不是使用者「可以看見」的軟體,而是運作在

(33)

某些數位工具內部的程序。

我們可以從前文曾提及的資科學者 H 與其助理 G 針對社群媒體平 台專頁的政治傾向分析來看工具的行動。對於 H 與 G 來說,他們的研 究旨趣在於透過實驗找出什麼樣的演算法能夠最好地將資料分類。因 此,G 雖然原本確實在嘗試是否能夠為「離題」現象建立起一個基礎的 關連詞參考字典,卻在探索的過程中發現一個更能用來檢驗演算法優劣 的問題:如何以既有的資料為基礎去預測某個使用者專頁的政治傾向。

換言之,在 G 的研究中,演算法被委任了一個行動:藉由辨識每一個 使用者專頁上的貼文之特徵,來去預測其政治傾向。因此,就在甲團隊 已經收集且清理完的社群媒體平台資料的基礎上,G 進一步動員了數種 數位工具,建構了一套進行分類運作的行動網絡。

圖3 為張哲嘉(2016)在研究類似主題時,建構的一套系統架構,

我們可以以此對照來說明G 所動員的行動網絡。除了 API、資料伺服器 外,為了進行字詞的比對與分析,這個行動網絡還必須引入斷詞系統,

將字詞區隔為一個一個單元才能進行所謂相異詞的擷取。接著,如同我 們先前說的,G 將「辨識每一則貼文可能有的政黨傾向特徵」這個工作 委任給演算法,但在演算法介入行動前,研究者還需要先決定要採用哪 種「預測方式」。例如,張哲嘉(2016)在其研究即指出,一種可能是 透過所謂「相異詞」作為特徵來預測一個貼文的政治傾向,另一個則是 以貼文的文字特徵與互動特徵來預測。無論是哪一種,在這一過程中工 具的行動都是在界定出某一貼文的「特徵」。以較好理解的「相異詞特 徵」來說,首先一則貼文會被識別出數個相異詞,也就是這則貼文中被 辨識出來的所有相異的字詞,它們可以被想像為這則貼文的組成元素

(特徵)。接著,要辨識不同貼文之間的差異,就是要去比對其組成元 素的差異。此時可以有幾種權重的方式來判斷。例如,一種方式是透過

(34)

「詞頻」(term frequency,簡稱 tf),也就是去看一則貼文當中某個相 異詞出現的頻率,頻率越高表示它越能作為該貼文的代表特徵。建立起 貼文特徵後,這些資料才會被轉譯進分類器(演算法)進行判讀。

圖 3:預測政黨傾向之分類模式系統架構圖

資料來源: 《針對臉書粉絲專頁貼文之政治傾向預測》,張哲嘉,2016,

國立政治大學資訊科學學系碩士論文,頁17。

從上述的描述我們可以看到,首先,演算法的行動乃是鑲嵌在整個 行動網絡中才得以可能的。沒有先前的 API、斷詞工具、特徵界定等行 動,不管是哪一種分類器都無法「動起來」。如同Introna(2016)主張 的,演算法的行動或其作為(doing)必須放在脈絡實作中加以理解—

— 也 就 是 將 其 視 為 所 嵌 入 的 異 質 社 會 物 質 組 裝 ( heterogeneous

(35)

sociomaterial assemblage)的一部分。更甚地,這樣的行動是一連串時 序性行動的一部分,在其中,當下的行動/行動者從先前的行動/行動 者那邊接續下去,並傳給下一個行動/行動者。Introna 所謂的異質社會 物質組裝其實就是一種行動網絡。

其次,在工具的分析行動中,「人」同樣可能參與中介。如同 Kitchin(2017)主張的,演算法從來都不是獨立、固定且不變的,相反 地它總是處於變化的狀態(always in a state of becoming),諸如資料的 選擇、清洗、參數的調整,乃至於研究概念的轉變都會改變其狀態。

Rieder(2017)也以類似的方式指出,在機器學習的演算法中,如果使 用者重新分類檔案,各類屬的字詞列表就會重新被計算,亦即,在統計 模型中添加新的「知識」。而對中文使用者來說,中文斷詞的不確定性

(以及隨之而來的人為判斷)則是另一個更清楚突顯出「人」的參與的 部分。11 盧安邦與鄭宇君(2017,頁 158)即曾指出,「斷詞以及資料 清洗是電腦工具輔助文本分析的基礎,對詞頻、詞語共現與情緒分析結 果都有影響,那麼研究者到底應該如何對資料進行挑選?應該介入到甚 麼程度?」這些問題都反映了研究者中介的問題。

最後,在這種工具行動的異質網絡中,我們也可以在各類「失敗」

事件中看到「工具」同樣也可能是不合作的行動者。例如,張哲嘉

(2016)在其研究中即曾提到這樣的案例,他在實驗以相異詞作為特徵 的預測方法時,遭遇到來自網絡中其他行動者的阻力,如他所述,「在 實驗環境中,部分分類器如decision tree、KNN 在執行時需要複雜與大

11 斷詞工具實際上「不懂」中文,它無法如人類行動者般無疑難地將一句話斷開成 數個相異詞。比較常見的斷詞工具(例如 CKIP 斷詞器、Jieba)運作方式是透過 比對「字典」來將相異詞擷取出來。但即便有「字典」,中文斷詞仍有許多困 難,例如,一個經常用來說明中文斷詞的笑話即是:到底是「全台,大停電」,

還是「全台大,停電」?

(36)

量計算空間,佔據大量記憶體…」(張哲嘉,2016,頁 44)。也就是 說,當他嘗試讓 decision tree 與 KNN 進行轉譯時,其硬體環境卻無法 回應其行動。因此,在這個部分最終只能讓naïve Bayes 分類器與 SVM 進行轉譯。

三、資料呈現:擴增與化約

最後,工具的行動也在資料的呈現上作為重要的中介。我們在先前 的討論中曾提到甲團隊的資科學者Z 在一開始便開發了一套可以呈現社 群媒體資料的工具 A,這類「視覺化工具」對於以數據方法進行的研究 來說,經常是讓讀者能夠(或甚至是唯一能夠)直觀地理解現象的方 法。例如,甲團隊在關注社群媒體平台的資訊傳散時,就得藉由工具 A 呈現的圖像,讓讀者直觀地認識到某一則貼文在不同使用者之間是如何 傳散開的。圖 4 呈現了類似的資料轉譯過程,亦即,社群媒體平台上的 資料,首先經由API 被轉換為 JSON 格式的資料,進而才能再根據視覺 化套件(例如,D3.js)來繪圖。此外,如同熊凱文等人(2014)指出 的,在繪圖的圖像布局上,這個過程涉及了一些繪圖演算法的使用來增 加圖像的可讀性,而就如同我們上一節提到的,這些演算法被隱藏在繪 圖工具中,對於使用者而言是不可見的。同時,也正是在這個中介、轉 譯過程中,我們可以看到視覺化圖示的選擇呈現,實際上將某一文章的 分享途徑資訊擴增到最大,而其他資訊則被化約。

(37)

圖 4:資料轉譯過程示意圖

資料來源: 〈社群媒體資訊傳播之視覺化〉,熊凱文、魏浩翔、紀明德,

2014 年 7 月,「甲午年第廿二屆計算機圖學研討會(Computer Graphic Workshop, CGW)」,臺北市大安,頁 3。

除了視覺化圖像的呈現外,研究者在透過使用者介面端(如圖 1)

進行資料查詢時,這些資料如何呈現則又是另一個問題。例如,在熊凱 文等人(2014)的研究中,便有一套他們稱為 Pagedata 的資料查詢工 具。圖 5 為 Pagedata 的介面與查詢結果,使用者在經過認證授權手續 後,只要在上方輸入欲查詢的社群媒體平台專頁與時間區間,就會得到 類似圖 5 的這個表格。在使用者查詢的過程中,Pagedata 作為工具中 介、轉譯了「資料」(現象)。一方面,相較於我們實際看到的社群媒 體平台頁面,Pagedata 抹除了不同資訊在原有脈絡中的關係與順序。對 於社群媒體的使用者來說,我們首先注意到的是頁面上的資訊內容,而 那些分享、按讚、評論的數量,或是時間,都僅是作為補充、輔助的資 訊呈現在頁面上(不管是從字體大小、擺放位置來說都是如此)。但在

數據

圖 2:系統架構圖  資料來源: 〈社群媒體資訊傳播之視覺化〉,熊凱文、魏浩翔、紀明德, 2014 年 7 月,「甲午年第廿二屆計算機圖學研討會(Computer  Graphic Workshop, CGW)」,臺北市大安,頁 2。  資料在透過 API 與資料庫的中介儲存下來後,還需要經過所謂的 「資料清理」。此時,研究人員又會再次進入行動網絡之中,如同陳百 齡等人(2016)指出的,「研究人員進行資料清洗之前,必須先探索以 下幾件事:資料存在哪些格式?資料是什麼態樣?如何選取適當資料維 度進行分析?」
圖 4:資料轉譯過程示意圖  資料來源: 〈社群媒體資訊傳播之視覺化〉,熊凱文、魏浩翔、紀明德, 2014 年 7 月,「甲午年第廿二屆計算機圖學研討會(Computer  Graphic Workshop, CGW)」,臺北市大安,頁 3。  除了視覺化圖像的呈現外,研究者在透過使用者介面端(如圖 1) 進行資料查詢時,這些資料如何呈現則又是另一個問題。例如,在熊凱 文等人(2014)的研究中,便有一套他們稱為 Pagedata 的資料查詢工 具。圖 5 為 Pagedata 的介面與查詢結果,使用者在經

參考文獻

相關文件

CeBIT is the world's largest trade fair showcasing digital IT and CeBIT is the world's largest trade fair showcasing digital IT and5. telecommunications solutions for home and work

Access - ICT skills: the technical skills needed to use digital technologies and social media. - Information

between the roles of the individuals (private sector) and the public or government in the provision of social care and health services responsibility of the government, e.g.

Microphone and 600 ohm line conduits shall be mechanically and electrically connected to receptacle boxes and electrically grounded to the audio system ground point.. Lines in

Digital PCR works by partitioning a sample into many individual real-time PCR reactions, some portion of these reactions contain the target molecules(positive) while others do

Blue-screen matting, digital composition, Optical compositing digital composition, digital matte painting. Smith Duff Catmull

Blue-screen matting, digital composition, Optical compositing digital composition, digital matte painting... Digital matting: bluescreen matting Digital matting:

Define instead the imaginary.. potential, magnetic field, lattice…) Dirac-BdG Hamiltonian:. with small, and matrix