人工智慧與媒介理論:
基德勒、克拉瑪與亞馬遜 Echo/Alexa
林思平
**投稿日期:2019 年 1 月 30 日;通過日期:2019 年 7 月 15 日。
* 作者誠摯感謝匿名評審者對論文提出的寶貴意見,在此致意。
** 林思平為世新大學新聞系副教授,email: splin@mail.shu.edu.tw。
本文引用格式:
林思平(2020)。〈人工智慧與媒介理論:基德勒、克拉瑪與亞馬遜 Echo/Alexa〉,
《新聞學研究》,142: 155-199。
DOI: 10.30386/MCR.202001_(142).0004
《摘要》
本文以德國媒介學者基德勒(Friedrich Kittler)與克拉瑪
(Sybille Krämer)的媒介理論,思考當今人工智慧與此情境中 的人類/機器關係。本論文首先對於人工智慧的定義與發展加 以耙梳,接著對於基德勒與克拉瑪的媒介理論進行闡釋。本文 進一步經由當今人工智慧具代表性的實際發展案例──亞馬遜 Echo/Alexa,指出在人工智慧的概念與實踐場域中,基德勒與 克拉瑪的觀點對話彼此匯聚,凸顯電腦科技媒介的特質,成為 省思人工智慧與人機互動的重要參考論述。
關鍵詞: 人工智慧、媒介理論、基德勒、克拉瑪、亞馬遜、智 慧型個人助理
壹、前言
2018 年三月美國媒體報導,亞馬遜(Amazon)公司 Echo 家用人工 智慧裝置的使用者,紛紛在社群媒體提到家中 Echo 智慧裝置的擬人化 女聲 Alexa,會在出人意料且令人不適的時間點上發出笑聲,尤其嚇壞 那些獨自在家而聽到人工智慧裝置似乎在嘲笑自己的使用者。應該聽命 於人的人工智慧機器竟然當面嘲笑人類,使人類感到錯愕驚懼。亞馬遜 隨後發出聲明稿,承認此原本機器設定之外的程式問題確實存在,並承 諾進行處理,使其發出詭異笑聲的場景不再發生(Chokshi, March 8, 2018; Feldman, March 8, 2018)。
服務輔助功能的家用人工智慧裝置,其笑聲卻讓使用者心裡發毛不 知所以。電腦程式與演算法打造出的人工智慧步步進入人類生活,而人 類必須試圖理解這些機器在達成人類智慧之設定下,所產生的意涵與效 應。本文經由德國媒介學者基德勒(Friedrich Kittler)與克拉瑪(Sybille Krämer)的媒介理論,思考人工智慧作為媒介之情境下,人們如何理解 人工智慧、理解人類與人工智慧互動所代表的意義。
在德國媒介理論的脈絡中,1 基德勒提出「媒介決定了我們的處 境」之開創性觀點,意味著人類的技術發展與隨之構成的媒介形式,主 導著意義與文化的發展。電腦是基德勒定義下的媒介,而源於程式指令 的人類/機器關係在媒介技術發展之下,使人們以為自己能夠、卻時常
1 1980 年代出現的「媒介理論」,目的在於凸顯符號以外各種媒介技術所驅使之種
種意識或無意識的過程,有別於過去文化理論「文本化」的取向。德國媒介理論 的關注重點,尤其在於意義再現形式種種外顯的物質性條件,而非意義如何經由 符號再現(唐士哲,2017;Krämer & Bredekamp, 2013)。
難以控制電腦。電腦媒介決定人類的處境,塑造了 21 世紀的科技世 界。另一方面,正是直接面對此媒介先決之觀點,克拉瑪提出的問題在 於:如何將基德勒媒介先決的理論進行些許調整,重新建構媒介的角 色,思考媒介的關鍵重要性、但並非將其視為文化的決定性基礎?如果 以中介者概念理解媒介,媒介的位置代表什麼意義?由此克拉瑪提出包 括電腦在內的媒介作為信使的概念。媒介信使模型的關鍵性質,包括信 使是他律中立的,信使不為自身發言;媒介信使構築社會關係,卻也可 能形成干擾。
克拉瑪與基德勒論述間的對話辯證,照映著當今電腦人工智慧具代 表性之案例,如 Echo/Alexa 的媒介運作:Echo/Alexa 是由人類打造設 計、目標在於聽命服務輔助人類的人工智慧;然而 Echo/Alexa 在達成 人們生活方便愉悅之功能目的外,其媒介程式運作的結果同時使人焦慮 疑懼。因此本文主張同時檢視基德勒與克拉瑪的媒介理論,是當今思考 人工智慧與人機互動的適當切入點。在此脈絡下,本論文首先對於人工 智慧的定義與發展加以耙梳,接著對於基德勒與克拉瑪的理論進行整 理,再經由如今已普遍進入人們日常生活的人工智慧代表性案例亞馬遜 Echo/Alexa,分析指出基德勒與克拉瑪的觀點看來相互矛盾,然而正是 在人工智慧的概念與實踐場域中,基德勒與克拉瑪的媒介理論同時匯聚 並凸顯電腦科技的特質,成為省思人工智慧與人機互動的重要論述。
貳、人工智慧的定義與發展
一、何謂人工智慧?
關於人工智慧(artificial intelligence,簡稱 AI)的討論,首先在於
什麼是「智慧」。Tegmark(2018)提出了廣義的定義:智慧是達成複 雜目標的能力──解決問題的能力、學習能力、理解能力、自我意識、
創造力等,都可算是複雜目標。由於複雜目標難以數計,所以有各種可 能的智慧存在,例如「人類智慧」。而就「人工智慧」而言,研究人工 智 慧 的 終 極 目 標 包 括 打 造 人 類 水 準 的 「 通 用 人 工 智 慧 」 (artificial general intelligence,簡稱 AGI):「能和人類一樣達成任何目標的智慧 能力」(Tegmark, 2018);和通用人工智慧概念相近的是「強人工智 慧」(strong AI):「擁有與人類一樣智慧的人工智慧」(三津村,
2017/陳子安譯,2018;Franklin, 2014)。相較於通用人工智慧著重於 功能,強人工智慧代表更深層的概念,包括「能否具有人類意識」等,
或者用 Haugeland(1985)更具野心的措辭,強人工智慧是關於「打造 人類」的領域。但這種種,都表示人類至今還未能實踐強人工智慧
(Frankish & Ramsey, 2014)。
相對於強人工智慧的是「弱人工智慧」(weak AI),意指能夠為 了達成特定目標而智慧行動的機器,或是從人類角度看起來聰明、像有 智慧的人工智慧。同時,著重於特定功能用途的人工智慧稱為「窄人工 智慧」(narrow AI)。弱人工智慧和窄人工智慧能做到的事情只是人類 能做到的一部份而已,例如「下棋」、「翻譯」、「人臉辨識」、「語 音辨識」、「路徑預測」等。而目前稱為人工智慧的內容幾乎都是「弱 人工智慧」和「窄人工智慧」(三津村,2017/陳子安譯,2018;松 尾,2015/江裕真譯,2016;Arkoudas & Bringsjord, 2014; Franklin, 2014)。
而人工智慧發展與電腦發展的相互連結,關鍵在於人類的智慧,是 否得以在電腦機器上實現(Franklin, 2014)。最有名的概念案例,是在 人工智慧一詞甚至尚未出現之前,1950 年由英國數學家/電腦先鋒圖
靈(Alan Turing)提出的圖靈測驗(Turing Test)。圖靈測驗將一名人 類受測者和一部電腦分別安置在兩個密閉的房間內。另一位並不知道哪 間房內是人類受測者或是電腦的人類裁判,用電子打字的方式提出問題 進行對話;如果在對話中人類裁判無法辨識哪一個房間內是受測者還是 電腦,即可說這台電腦通過了圖靈測驗。圖靈認為可以將通過圖靈測驗 的電腦,視為有智慧、「會思考的機器」(Turing, 1950)。圖靈也因 此被認為是人工智慧的第一位重要推手。
本文所討論的電腦,包括硬體設施與物件、以及軟體程式與指令。
電腦硬體之記憶儲存容量、軟體程式之演算能力的不斷精進,成為人工 智慧的基礎並促成其發展。人工智慧研究者李開復提出以電腦程式角度 來理解人工智慧的五個面向:(一)AI 是令人覺得不可思議的電腦程 式;(二)AI 是與人類思考方式相似的電腦程式;(三)AI 是與人類 行為相似的電腦程式;(四)AI 是會學習的電腦程式;(五)AI 是根 據對環境的感知做出合理行動,獲致最大效益的電腦程式(李開復、王 詠剛,2016)。上述從令人覺得不可思議、與人思考/行為模式相似、
模仿人類學習、到獲致(人類知識觀點系統中的)最大效益,可以看出 人工智慧的核心,是奠基於電腦科技中的人類機器關係。
二、人工智慧的三波浪潮
前述的圖靈測驗,在人工智慧發展史中掀起第一波熱潮(1950 年 代後半至 1960 年代)。這一波最早的浪潮致力於發展依照數學理論和 註記方式,來符號化說明人類思考的電腦程式,也就是「符號主義人工 智慧」(symbolic AI)。符號主義認為人類的心智語言結構就像自然語 言(natural language,也就是人類語言)一般,有語法、也有語義,可
以被化約成符號規則,讓它在因果邏輯上有效。反過來說此心智語言結 構的表達,其因果邏輯須能被規則性、系統性地解釋,以說明它的有效 性。符號主義主張符號結構的語法轉換,可以形成語義的轉換,語法和 語義相互照映──用 Haugeland 的說法,如果照顧語法,語義就會自然 生成(Haugeland, 1981)。換言之,心智思考的外在符號象徵過程,可 以表達相對應思想的內容;就像鑰匙的幾何學設計決定了開哪一種鎖,
語法決定心智思考的因果邏輯、它可以做到的事情。進一步來說,心智 運作就像驅動著語義的語法引擎,它的運作可以在電腦上複製,而這整 個過程由演算法所編排。演算法是一套指令,代表電腦程式或人工智慧 處理資訊或解決問題的程序。此處的演算法決定這些心智思考的符號象 徵規則,如何在整體的思維過程中,彼此連結(三津村,2017/陳子安 譯,2018;Arkoudas & Bringsjord, 2014; Carter, 2007; Newell & Simon, 1976; Robinson, 2014)。
但是以符號註記人類思考語言的問題在於,當人類交談時,說話者 和談話對象可以理解語言的意義;然而人工智慧是根據程式符號規則說 話,並不真正瞭解語言的意涵。例如電腦可以編排出「露西帶點心來了 嗎?」這個句子,但完全不瞭解這個句子的意思,是在問露西是否有帶 點心來(Arkoudas & Bringsjord, 2014)。換言之,符號主義人工智慧所 使用的語言是與人類實際生活無關的符號,而如何將人工智慧程式語言 與人類世界連結,為「符號接地問題」(symbol grounding problem)。
關於符號接地的有名思考實驗,是由 John Searle 提出的「中文房間論 證」(Chinese Room Argument):首先將一本中文符號萬用手冊給予 一個在密室中且不懂中文的人,再由密室外一位懂中文的人,用中文寫 紙條透過小洞傳遞給密室中的人;密室中的人雖然不懂紙條內容,但依 照手冊的指示書寫相對應內容,並將紙條傳遞出來。如此密室外的人以
為在進行對話,並認為密室中的人懂得中文──但這是在不懂語言意涵 情況下的對話。儘管符號主義人工智慧具備語法和語義的符號規則,電 腦仍不懂符號的「意義」,無法把符號和它所代表的意義連結在一起。
因此Searle 認為:「沒有一個電腦程式足以給予一個系統心智;程式不 是心智。程式本身不足以具有心智」(Searle, 1984, p. 19)。這尤其是 符號主義人工智慧面對的關鍵問題,人工智慧的第一波熱潮也因此陷入 瓶頸(Cole, 2009; Harnad, 1990)。
第二波的人工智慧浪潮出現在 1980 年代,採取「把知識輸入電腦 系統中,電腦就會變聰明」的作法。當電腦的軟體程式計算能力與硬體 記憶容量大幅提升,這一階段的人工智慧經由理解符號的關連性,讓關 連性轉變為知識。「知識表示法」(knowledge representation),就是 教導人工智慧理解人類知識的記述方法。例如「貓」這個字代表「貓是 動物」,必須要能理解與其他符號的相關性才能變成知識;例如與「動 物是生物」、「動物和植物不同,會自主活動」等資訊結合,「貓是動 物」才會變成更有用的知識。而當資料結構化的方式確立,隨著知識表 示法和電腦性能的提升,可有效提高推理能力和活用結構性資料的「專 家系統」(expert system)由此誕生,也就是將專家的知識(由資料和 規則組成)結構化並讓人工智慧學習。程式在擷取特定專業領域的知識 後,透過推論,展現有如該領域專家般的言行(三津村,2017/陳子安 譯,2018;松尾,2015/江裕真譯,2016;Russell & Norvig, 2009)。
然而,僅管第二波人工智慧熱潮的知識表達與專家系統透過「知 識」輸入,讓人工智慧的能力更加提升,但它依然未能理解事物與問題 的意義;除了上述符號接地問題之外,還存在著「框架問題」(frame problem)。Dreyfus(1972, 1992)指出電腦展現數學公式,但它們還不 是智慧。智慧代表著理解可以運用哪些規則、並在何時運用的能力。功
能僅在於儲存規則的機器無法達成此能力,不論它們作為工具多麼有 用。同時 Dreyfus 也強調「相關性」(relevance)的關鍵性質:「相關 性」是人類區辨重要以及不重要事物的能力,可以輕易地根據當下情境 的要求、涉入世界的方式,來擷取已存在經驗和知識中的不同面向,判 斷哪些資訊與其意義和手邊任務是相關的。此將現有任務與相關性資訊 連結的概念就是「框架問題」,也就是整體脈絡的考量。將同樣的能力 賦予數位電腦,是人工智慧的關鍵技術挑戰,顯示經由知識表達與結構 性規則處理智慧的方式,仍不是真正的智慧。對人類而言相對簡單的問 題,人工智慧卻需要發展出更先進的解決方式,才能應用在複雜的真實 世界問題上(Arkoudas & Bringsjord, 2014; Robinson, 2014)。換言之,
在第二波人工智慧熱潮中,若大量輸入知識,人工智慧固然可以煞有介 事地行事,但基本上其能力不可能超出所輸入的智識範圍。如果希望人 工智慧禁得起實用考驗,能因應各種情況與例外,必須輸入的知識將會 暴增,程式永遠寫不完。追根究柢原因仍在於電腦無法把符號以及它所 指涉的意涵連結起來,很難處理「意義」(松尾,2015/江裕真譯,
2016)。
因此專家系統的人工智慧,慢慢轉型轉向進入一個新興領域,稱為
「機器學習」(machine learning)。機器學習探索各種演算法,讓機器 可以自行利用資料學習,並進一步達成預測。這是由人工智慧自我學習 的技術,由程式自行學習、讓自身更進步的機制。例如構成學習的基礎 元素是「分類」:能夠對某一事物做出判斷,辨認出它是什麼;能做好 分類,既能理解事物,也能做出判斷、採取行動,並進一步運用統計方 式讓人工智慧自行累積經驗。在這個領域中,「深度學習」(deep learning)被視為人工智慧五十年來最重大的突破,也帶領當前人工智 慧的第三波熱潮(三津村,2017/陳子安譯,2018;松尾,2015/江裕
真譯,2016;Winblad, 2017)。
深度學習演算法的設計,是以多層次機器學習互動所產生的資料,
作為學習的基礎,同時允許電腦不斷嘗試直到最逼近目標的一種機器學 習方式。深度學習與過去機器學習的最大差異,尤其在於它的核心計算 模型──「人工神經網路」(artificial neural network;或稱「類神經網 路」,neural network)。人工神經網路的概念最早在 1943 年被提出,
描述人類神經節沿著網狀結構傳遞和處理資訊的模型。此假說一方面被 神經科學家用於研究人類的感知原理,另一方面被電腦科學家運用於人 工智慧的研究。在 1980、1990 年代,人工神經網路僅是機器學習的一 種演算法,直到 2006 年多層次人工神經網路理論大為精進,成為突破 的分水嶺。此處的深度學習將電腦要學習的資料視為大量數據,將數據 輸入包含多個層次的複雜數據處理網路(也就是多層次人工神經網 路),接著檢查經過這個網路處理得到的結果數據,是否符合設定的學 習要求。如果符合,就保留這個網路作為目標模型;如果不符合,就再 接再厲地一次次調整網路的設置,直到其輸出能夠滿足設定的學習要求 為 止 ( 李 開 復 、 王 詠 剛 ,2016 ; Russell & Norvig, 2009; Winblad, 2017)。
深度學習得以大放異彩的其他兩個條件,是電腦硬體的強大儲存運 算能力和高品質的大數據,這兩個條件在 2010 年前後逐漸步入成熟。
換言之,多層次人工神經網路演算理論的精進、所需電腦儲存運算能力 的再次大幅成長、以及網際網路提供深度學習所需要大規模海量資料的 成熟,讓深度學習達致突破性的發展。而深度學習、大規模計算、海量 資料三者彼此加乘,促成當前人工智慧第三波熱潮的高度興盛。這其間 網路的高速、普及,創造出可以輕易取得大量資料的環境,這大量且持 續擴充的資料集合體,就是「大數據」(big data)。大數據讓機器用來
學習人類自然語言所需的文字、影像、聲音等資料,變得更容易取得,
在機器學習上成為突破過去無法解決問題的關鍵。同時,大數據也提升 了人工智慧的「資料探勘」(data mining)技術:從結構化及非結構化 的資料中找出有用的關聯性,也就是統計上的關係。此技術對於大量看 似無關係的資料進行整合,從中發現並取出關連性高、進而有價值的資 料,並從資料中選擇更易於學習的資訊。人工智慧透過這種方式,開發 並精進其擷取有用資訊的能力,也使人工智慧能夠活用原本複雜且難以 使用的大數據(李開復、王詠剛,2016)。
例如由於深度學習技術,人工智慧可以學習從千萬筆海量圖片資料 中,自行擷取特徵並辨別什麼是「貓」,自己學習「貓」的概念,達成 理解並勾勒對於世界的認識(三津村,2017/陳子安譯,2018)。深度 學習首先在電腦視覺領域運作,協助電腦辨識人臉、以及圖片和影片中 的物體,接著進入語音辨識、機器翻譯、自動駕駛等幾乎所有人工智慧 的領域大顯身手(李開復、王詠剛,2016)。
2016 年三月,谷歌(Google)子公司 DeepMind 所研發、以深度學 習為主要技術的人工智慧 AlphaGo,以 4:1 戰績擊敗人稱頂尖棋聖的 南韓九段圍棋棋士李世石。AlphaGo 之所以勝出,在於它能夠利用其資 料庫中近三千萬筆棋譜,與自己對弈萬千回合,並在每次下棋時「學 習」改善自我的表現,尋找最好的獲勝方式(Floridi, 2017)。AlphaGo 的表現成為舉世矚目的新聞,震驚了許多人工智慧科學家,代表著人工 智慧發展的重大里程碑。人工智慧研究者李開復曾表示:「如果你兩年 前問我,電腦何時能夠戰勝圍棋世界冠軍,我那時的答案大概會是『二 十年後』。但是電腦在兩年內,就做到我認為需要二十年才能做到的事 情,這種速度真的讓人震撼」(李開復、王詠剛,2016,頁 134)。
隨著第三波人工智慧熱潮的蓬勃發展,以及過去數十年累積而成的
經驗,當今人工智慧已經運用於人類生活中的多個面向、執行多種任 務。這些面向及任務包含了語音辨識:包括語音輸入、智慧型語音服 務;人臉及影像辨識:包括身份識別、監視系統、智慧輔助醫療診斷病 情。而這些因深度學習而能力大幅進化的影像辨識、語音辨識與自然語 言處理技術結合,發展出越發普及興盛的智慧型個人助理(或稱智慧語 音助理),協助人們處理包括時間、天氣、日期等相關資訊,管理工作 時程和郵件訊息,安排購物下單計畫,並與物聯網(internet of things,
簡稱 IoT,是由各種裝置、物件所串連而成的巨大網路)結合,操作日 常 智 慧 家 電 、 工 具 等 生 活 事 務 。 人 工 智 慧 也 運 用 在 金 融 科 技
(FinTech,finance 與 technology 的結合概念)場域,服務金融業者分 析顧客基本資料,提供投資操作建議。同時美國已經啟用人工智慧犯罪 預防系統,根據場所、環境、前科犯資料等預測犯罪行為提出警告,以 期降低犯罪率。而媒體機構如美聯社、《洛杉磯時報》已開始運用人工 智慧程式,以資料數據撰寫營收業績報告、運動賽事新聞、突發災難
(如地震)消息等,顯示電腦面對新聞資料與突發狀況的快速反應整合 能力。此外,自動駕駛也成為當今人工智慧最主要的應用場景之一,由 亞馬遜、谷歌、特斯拉(Tesla)等巨型科技公司帶領的研發風潮,讓自 駕車儘管還在實驗階段,仍成為勢不可擋的人工智慧趨勢。同時,在廣 闊空中飛行而判斷難度相對容易的無人機,早已先於自駕車的發展而受 到美國軍方採用,進行偵察、攻擊等任務。換言之,儘管人工智慧在前 述的意義、相關性,以及情感、常識、審美、自我意識、抽象能力等面 向仍然面對著瓶頸(李開復、王詠剛,2016;Robinson, 2014; Bostrom
& Yudkowsky, 2014),但人工智慧的運用,已經進入人類社會的各個 角落。
如前所述,人工智慧作為令人覺得不可思議的、與人思考/行為模
式相似的、模仿人類學習的、獲致人類知識觀點系統中最大效益的電腦 程式──其存在核心是人類與電腦機器的關係。而本文主張電腦機器與 由此發展出的人工智慧,在人類社會中扮演著媒介的角色。本文接下來 以德國媒介學者基德勒與克拉瑪的媒介理論,思考人工智慧發展趨勢中 其所扮演的媒介角色、以及人類與電腦機器的關係。
參、基德勒的媒介理論:「媒介決定了我們的處境」
一、電腦作為主體/作為終結所有媒介的媒介
德國媒介理論學者基德勒對於人類與技術媒介的關係,提出了具關 鍵重要性的思考詮釋。基德勒概念的獨特性,尤其在於他顛覆麥克魯漢 的「媒介是人類的延伸」(McLuhan, 1964)一說,而提出人類不但無 法如自身想像般控制技術媒介,反而是媒介的延伸、「媒介決定了我們 的處境」(“Media determine our situation”, Kittler, 1999, xxxix)之觀 點;此觀點目的在於挑戰人類與媒介的主客地位,打破人類中心主義的 幻象(唐士哲,2017;黃順星,2017)。基德勒運用傅柯的考古學,分 析媒介作為「論述網絡」(discourse network)的意義:論述網絡是最 為廣義具包容力的媒介意涵,是「技術與機構的網絡,使特定的文化得 以選擇、儲存、生產與其相關的資料」,重點在於訊息傳輸與資料處理
(Kittler, 1990, p. 369)。從此觀點出發,基德勒認為我們的文化主體性 與心理機制受到媒介的銘刻決定,人類和機器的關係已經改變。而當代 數位技術的代表物──電腦,已不是工具,而是媒介,也是主體,無法 只從人類中心的觀點加以定義(林思平,2017;Kittler, 2006)。關於當 今電腦媒介決定人類處境的論述,基德勒提出兩個層次的思考:一是電
腦成為主體,成為終結所有媒介的媒介;二是人類受到電腦軟硬體遮蔽 阻隔的處境。
首先基德勒從電腦媒介一開始的發展過程,對於電腦作為主體提出 論述。前文中提到之英國數學家/電腦科學家圖靈,對基德勒關於電腦 的闡述具有重要影響。圖靈在 1937 年提出抽象的數學機器理論:圖靈 機(Turing Machine)。此運算模型是種邏輯計算機,藉由數學運算模 仿無論是人類或是機器的每一個運算動作──它們被形式化成為可運算 的指令,經由二元的數位符號(0/1 符號)運作;因此圖靈機被視為 計算機/電腦的前身。其後圖靈和英國軍情處成員建造了巨大計算機
(Colossus),計算機內部具有「反饋迴路」(feedback circuit):在資 訊通信系統中,為達致所需特性或精確度,將處理後的輸出回送到輸入 而構成的迴路。此反饋迴路得以根據計算的結果調整運算過程,最後破 解了二次世界大戰時德國的謎式密碼(enigma code),成為戰爭結束的 決定性關鍵。基德勒指出反饋迴路將在此之前唯人類才擁有的特質給予 電腦運作:「操作反身性」(operational reflexivity)。操作反身性意謂 著反饋迴路中的電腦運作時,即便缺少一個可預先程式化的運算狀態,
電腦也會根據之前程式指令中的數學慣例繼續運算;此過程中如果某處 計算結果達致狀態的需求,程式本身得以決定後續的指令運算方式,也 就是機器的未來狀態。電腦的思考與資訊的達成已經自成一迴路,並不 需要人類的介入;電腦自身,成為主體(“computer themselves become subjects”)。基德勒指出戰後至今各色引人入勝的間諜小說紛紛出現,
也正掩飾著在二戰結果中扮演關鍵性角色的機器分析,其資訊攔截、運 算 能 力 已 經 超 越 情 報 人 員 ; 電 腦 成 為 「 機 器 主 體 」 (machine subjects),能力甚至可以超越人類(林思平,2017;Kittler, 1999, pp.
258-259 ) 。 此處 主體 的意 涵 在於 , (人 類以 及機 器 )個 體 受制 於
(subject to)所處的脈絡環境,使個體成為為了自身以及相對於他者而 存在(as subjects for)的主體(Barker, 2012);此意涵也說明了人機關 係的境況。
與此同時,基德勒也指出電腦發展的另一個重要特質:成為終結所 有媒介的媒介。電腦數位技術與之前類比技術的差異在於,類比技術媒 介儲存、處理和傳遞,例如聲波和光線的物理效果,聲音和影像之間存 在著差異。但對於數位技術而言,此差異僅是表面。電腦媒介中管道與 資訊的數位化,去除了個別媒介間的區隔;文字、語言、聲音、影像都 只是表面效應,也就是消費者所知的介面。電腦內部,不同媒介的資料 都以計算方式轉化為處理器的內容,凡事成為數字。之前彼此分離的資 訊流轉變為一系列標準化的二元數位碼,所有的文字、聲音、影像資料 與電腦指令都能夠以縮減成為 0/1 的二元碼來處理,數位化使資訊的 轉換、儲存、掃描、製圖、同步等一切成為可能(林思平,2017;唐士 哲,2017;Kittler, 1986; Sale & Salisbury, 2015)。由此基德勒提出,電 腦發展至今重新連結之前相互區分的媒介技術和傳播管道,成為在數位 基礎上運作、得以儲存/處理/包含過去所有媒介的全方位媒介,是
「終結所有媒介的媒介」(the medium to end all media, Kittler, 1996, 1999; Winthrop-Young & Wutz, 1999, xxx)。
當電腦成為主體、成為終結所有媒介的媒介,此時媒介決定了技術 的走向、以及人類在此技術脈絡中的位置:人類無法如自身想像般控制 技術媒介,因為電腦的思考與其資訊處理的達成已自成一迴路,並不需 要人類發明者的介入。這是基德勒所言當前人類所處的情境,也是「媒 介決定了我們的處境」第一個層次的意涵。而處在此技術媒介脈絡中,
人們所面對的電腦軟硬體性質、人類機器關係──這是基德勒下一階段 理論發展的重點,「媒介決定了我們的處境」第二個層次的意涵:人類
受電腦科技阻隔遮蔽的情境。
二、受電腦阻隔遮蔽的人類處境
基德勒指出過去人類面對科技,是將人類中心的幻象投射在機器與 技術發展之上。然而基德勒認為人類文化的意義並不先於技術,而是技 術發展與伴隨而來的媒介形式主導文化意義的發展。過去人類使用者從 自身觀點定義技術與媒介,進而認為可以任意面對其與電腦機器的關 係;基德勒正是要挑戰此預設、質疑並對抗人類中心的思維,闡明人類 正面對著電腦全球性宰制所帶來的後果,再次指向我們永遠無法如自身 認為般地能夠控制掌握科技。由此基德勒在〈保護模式〉(“Protected Mode”)與〈軟體不在〉(“There Is No Software”)兩篇文章中,檢視 電腦技術發展中硬體系統設計與軟體指令結構的本質與運作,討論它們 對於人類/機器關係的影響:電腦非但不是聽命於人類的工具,反倒決 定了人類的處境。這其中的關鍵要素,在於人們受到電腦軟硬體的遮蔽 隔絕:阻隔使用者權力的硬體操作模式、與軟體空洞而隱晦的性質(林 思平,2017;Kittler, 2006)。
基德勒首先舉英特爾公司(Intel)之案例:英特爾作業系統將處理 器 的 運 作 狀 態 區 分 為 「 真 實 模 式 」 (real mode ) 和 「 保 護 模 式 」
(protected mode),對其進行明確區隔。「保護模式」的作用是「保 護」作業系統,讓使用者難以見其運作,以此模式將電腦硬體系統與一 般使用者隔離。保護模式與真實模式的區隔,使現代科技中的二元對立 再次返回。此處二元對立意指當代科技發展過程中,軍事/工業與民間 的權力分化與利益衝突。科技公司區隔硬體設備的操作模式,目的在於 限制一般人取用高階電腦功能的通路,將軍事工業邏輯轉移到資訊系
統:只有在軍事/工業層級的官僚資訊體系掌握電腦優勢之後,技術才 會傳遞給其他的民間大眾使用者。同時,科技媒介的權力也來自對於資 訊的沉默把持不透露。例如英特爾微處理器的保護模式,不過是嵌進作 業系統的設定,處理器也還有其他未被記錄的操作指令;但原廠規格說 明和使用手冊皆不提供這些資訊──使用者無法得知這些系統預設,其 實很容易更改。可更改的程式卻是以無法更改的固定模式,銷售予消費 大眾使用(林思平,2017;Kittler, 2013)。
基德勒進一步指出,人類被電腦阻隔遮蔽、難以得知電腦內部的運 作,原因除了保護模式,也來自軟體空洞而隱晦的特質。自從電腦出 現,如何描述、閱讀這些一般人無法理解辨識的機器成為主要問題。對 此的解決方案是「軟體」──高階、人類可讀懂的電腦程式語言由此發 展出來,使其和人類語言系統並存、使人類能夠理解。只要是前述圖靈 通用機可以運算的自然數運作,就能夠用演算法程式將它計算呈現。此 處將電腦硬體和進行運算的演算法放在平等地位,創造了軟體的位置:
軟體似乎讓人類得以面對電腦內部的數位處理過程,與其溝通互動。軟 體存在因為沒有任何生物(或說除了電影駭客任務《Matrix》中的主角 Neo)有能力與電腦內部的運作機制直接互動(林思平,2017;Kittler, 2013; Winthrop-Young, 2011)。
然而,軟體帶來的卻是全新而隱晦的語言秩序。過去人類將自身的 日常生活語言作為後設語言,不接受象徵秩序中的其他語言結構。但這 過去的語言壟斷如今已經瓦解,甚至向新的機器程式語言秩序讓步。基 德勒所稱這後現代機器語言的巴別塔,是由指令碼(低階機器語言)、
組合語言(中階機器語言,指令碼的延伸)、標準語言(電腦高階語 言)所構成。而「方便好用」的軟體/電腦高階語言,正是單向加密學
(one-way cryptology)的目標情境。軟體越是高階──亦即一般大眾越
是容易使用,軟體和執行電腦工作之硬體間的鴻溝越是難以跨越。此趨 勢形成的關鍵並不僅在於所謂高科技演進,更在於加密學的功能策略。
軟體「方便好用」背後所隱藏的實際情況是,加密功能讓使用者無法得 知這些軟體的產製狀態,無法在運算過程中觀察運算對象。當今的軟體 語言原本來自數學公式,但在數學公式中人們得以看見所有數學語言的 層次;然而電腦使用者所面對的電腦軟體,其間的程式語言卻無從得見
(林思平,2017;Kittler, 2013)。
基德勒再以微軟(Microsoft)的視窗軟體作業系統為例:視窗軟體 系統宣稱給予人類使用者清晰無礙的透明度和便利性,然而電腦運作內 容並沒有在視窗軟體當中開放。軟體卻同時安裝了監視社會中的單面 鏡,由此觀看得知使用者資訊運作的一舉一動。層疊相連的介面、程 式、作業系統,使人們與電腦的互動受到更高程度的中介。基德勒認為 自從現代技術如留聲機、電影成為儲存傳遞處理影像、聲音的媒介後,
人們感官知覺的敏銳度漸次減弱;直至今日,我們不再知道自己高度倚 賴的電腦媒介裡有哪些程式、程式在寫些什麼。換言之,軟體對人類來 說隱晦又空洞的性質其實是個數學策略,而此數學策略的受害者正是電 腦使用者。原本目的在於進行語言溝通的軟體事實上並不存在;人們以 為軟體存在,是因為人們將對自身意識結構的懷舊情感,投射在以軟體 進 行 語 言 溝 通 的 期 待 上 ( 林 思 平 ,2017 ; Gumbrecht, 2013; Kittler, 2013)。
此外基德勒的關注也在於,原本承諾擔任人類和電腦溝通之語言中 介的軟體,其隱晦性質卻成為利益的來源。高階程式語言對於機器語言 巴別塔的重要意義,在於塔越高、越成為常態,越是接近前述單向加密 學的理想:演算程式無法反向運作、軟體使用者無法回推其運算過程。
加密策略構成機器語言的複雜隱晦性質,也使軟體得以逃避原本圖靈公
式中關於演算法的意涵:數學演算法應是所有人類自由共享的財產,其 智慧財產權不應該存在。然而當今的法律系統,卻認定演算法享有著作 專利權。電腦科技產業中關於軟體的使用專利和執照,揭示著單向加密 的隱晦力量、軟體作為中介的商業性策略與功能──人們受制於技術媒 介,電腦產業挾帶其軟、硬體優勢持續征服世界獲致勝利(林思平,
2017;Kittler, 2013)。
總言之,基德勒指出電腦媒介如今成為完美的秘密系統。電腦硬體 系統保護模式的作業程序,使絕大多數人類使用者無法取得作業系統核 心與輸入/輸出路徑的使用權限;空洞隱晦的軟體系統掩蓋電腦機器的 數位運作,進一步讓使用者與機器分離;數學加密策略,則隱藏機器演 算法之智慧財產權原本不應存在的概念。在硬體模式與軟體操作下,人 們難以控制自身使用的機器,反而受制於電腦媒介下的權力結構,退出 科技運算的反饋迴路。舊式的政治權力,逐漸被電路晶片的存取特權以 及演算法的隱晦力量所取代(林思平,2017;Kittler, 2013)。這是基德 勒所言「媒介決定了我們的處境」第二個層次的意涵:自以為是主宰的 人類,事實上卻受到電腦科技的阻隔遮蔽。電腦技術媒介的發展,對於 人類存在的狀態──尤其人類的資訊知識生產──造成了結構性的影響 與衝擊。
肆、克拉瑪的媒介理論:信使模型
一、郵政原則與信使模型
基德勒的媒介理論,正是克拉瑪提出「信使模型」(messenger model)的關鍵起點。首先,克拉瑪認為在當代媒介傳播理論中,相對
於哈伯馬斯的人際傳播理論──傳播被認為是對話性的理解、是互惠的 言說行為──基德勒的媒介技術傳播理論具有開創性的意義。如前所述 基德勒主張媒介傳播建立在訊息傳輸、資料處理之上;媒介機制彼此互 動,而絕大多數的人類被排除在外。基德勒媒介先決(media a priori)
的立場,將媒介技術視為文化發展的主要原則和動力。克拉瑪認為基德 勒的媒介技術論,是哈伯瑪斯人際傳播理論之外的重要選項(Krämer, 2006, 2016a)。
然在同時,克拉瑪面對基德勒「媒介決定了人類處境」之論述,進 一步提出的問題在於:是否能將基德勒的理論稍微進行修正,使媒介不 再被理想化成為文化終極先驗的一部分?是否可能重新建構媒介的角 色,調整媒介先行的概念,思考媒介的關鍵重要性但並非將其視為文化 的決定性基礎?如果我們並非以決定性、而是以中介者概念理解媒介,
那麼媒介的位置代表什麼意義?
克拉瑪舉出兩種相對照的傳播模式:個人理解模式與技術傳輸模 式。個人理解模式源自哈伯瑪斯(Jürgen Habermas)的理論。此模式中 傳播被認為是人際間互動互惠的運作,其基本常態在於經由對話、同時 依賴社會上承載意義的符號語言,達成主體間的相互理解。傳播之目的 不僅在於穿越距離建立連結,更在於克服距離和差異,形成社會同意,
打造觀點意念一致的社會。當此對話性的傳播達成目的,傳播的參與者 成為「一體」,就像是用同一個聲音發言。換言之,個人理解模式當中 的傳播概念是對稱互惠的過程,目的在於克服消除距離,預設差異存在 但並不支持差異,而是企圖將差異轉化為同質。克拉瑪指出此個人理解 模式與「對話原則」(dialogical principle,又稱 erotic principle「愛戀原 則」)相呼應,將傳播視為個別主體間歧異狀態的同步化(Habermas, 1984; Krämer, 2016a, 2016b)。
而 對 照 於 個 人 理 解 模 式 的 技 術 傳 輸 模 式 , 則 源 自 山 農 與 偉 佛
(Shannon & Weaver)的理論。此模式重點在於資訊流動的技術,包括 資訊傳遞與資料處理;傳播由發訊者和收訊者之間的空間、時間、距離 所組成。當某種物質訊號從發訊者端傳送到收訊者端,傳輸就被認為完 成。此傳播模式的運作關鍵在於面對外在干擾時,仍能讓訊號結構維持 穩定。當可能造成干擾的第三方包括如媒介雜訊不致影響到資訊在發訊 者和收訊者之間的傳輸,技術連結就是成功的。克服傳播障礙以利資訊 流動的過程,也體現了媒介傳播的意義(Krämer, 2006, 2016a; Shannon
& Weaver, 1964)。
相對於個人理解模式,技術傳輸模式中的傳播概念是不對稱的。技 術傳輸模式的傳播概念連結距離,但並不消除距離;距離感正是經由成 功的傳輸,被穩定化並強化。許多情境下傳播之目的並非對話性質,而 在於發送和傳布──這是與「技術傳播模式」相呼應的「郵政原則」
(postal principle)。郵政原則將傳播視為在物理空間上彼此相距甚遠的 事物間,製造連結的過程;它並不偏重對話作為不可改變的傳播本質,
也不偏重互惠性作為傳播的基本常態原則。克拉瑪指出重新思考技術傳 輸模式與郵政原則的必要性,因為當今許多傳播文化與社群營造,並不 遵循個人理解模式與對話原則。再者,傳播個人理解模式中,媒介不是 重點,而是位於邊緣、可被忽略的載體;然而在技術傳輸模式中,當發 訊者與收訊者之間並不見得具有直接互動、當傳播並非對話性質,第三 方的角色就成為媒介/信使,扮演著關鍵必要的角色(Krämer, 2016a, 2016b)。
但克拉瑪同時指出,在技術傳播模式與郵政原則中,儘管媒介是不 可或缺的,然而它們的中介性質,本身並不利於對話的直接性。傳輸媒 介的設計目的在於減少干擾,然而媒介自身在對話的文化社會情境中卻
可能造成干擾。因此克拉瑪如基德勒般從技術傳播出發,思考媒介與其 重要性;但又並非如基德勒般,將媒介視為文化的決定性基礎。由此在 技術傳輸模式與郵政原則的概念上,克拉瑪分析整理文化歷史中早已存 在於人類生活的中介者型態與運作,提出「信使模型」作為媒介詮釋的 架構。信使模型用以理解媒介技術面向的無所不在,但並不採取媒介先 行概念的超越性,而解釋如「他律」、「退卻」、「干擾」的媒介構成 原則。信使角色作為媒介模型,得以協助人們進一步理解在傳播的傳輸 過程觀點中,媒介的可能本質與意義。由此克拉瑪提出信使模型的特 質,對其進行說明。
二、信使模型的特質
(一)距離與差異性的矛盾中介者
Levinas(1986)、Nancy(2000)等學者指出,傳播預設著某種分 離性。距離內在於所有的傳播;無法解決的距離是所有傳播的基礎。距 離並不僅止於空間距離,也包括差異性;差異性使得對話者由於不同的 經驗,而處在不同的社會位置和層次。因此克拉瑪提出,信使原則重點 並不在於解釋距離和差異性,而是和它們相處。事物的異質性、人們處 理主體間距離及差異的方式,成為文化發展的最重要來源之一。因此信 使作為中介主體,連結距離但並不消除距離。中介和分離在信使角色當 中呈現相互連結的矛盾關係:試圖克服距離,卻又保持距離。從此「距 離傳播」的角度,信使位於異質之世界、系統、場域的中間地帶,他的 角色是作為這些不同世界的中介者(Krämer, 2016a, 2016b)。
(二)以外來者聲音發言的他律性
那麼這樣的中介如何進行?關鍵在於信使角色主體發言──但是以 外來者的位置發言。信使不為自己、而是以別人的聲音、為了外來者說 話。信使不是自律的,而是他律的(heteronomous)。信使無法自我啟 動創建訊息,其活動並非源於自我意識和自發性。信使為了別人而行 動、具有任務在身,臣服於「外來的法律」和指令(Krämer, 2016, p.
80)。信使的話語和他的想法意念不(見得)相符──如果他有自身想 法意念的話。更進一步的,信使並不為自己被派遣發言的內容負責;信 使並不(被允許)產製自己的話語,甚至不(被允許)瞭解自身發言的 內容。信使包含了傳輸流程中不同階段的角色:是遞送人、是雇主身體 的中介延伸、是具備威信的訊息代理人、是擁有特權的發言對話者──
這些角色是他律的(Krämer, 2016a, 2016b)。
(三)中立退卻以表露訊息
信使與訊息可以為收訊者帶來愉悅或悲傷。然而信使對訊息內容並 不在乎,他是冷漠的;信使佔據中間的位置,代表他是沒有偏見的。冷 漠、自我中立、中間位置是信使作為中介者的基礎。此中間位置,與信 使在訊息傳輸過程中自我退卻的傾向相結合,而更形顯著。好的信使是 謹慎的,他消失在訊息背後,目的在凸顯表達他所攜帶的訊息;信使將 自己的聲音交付予某種利他無我的形式,以具體呈現外來的聲音。這也 是信使的功能邏輯與工作思維:經由自我中立退卻,呈現外來異質的部 分;訊息經由信使的中立冷漠得以成形。媒介信使角色的表現不是強化 自我,而是削弱自我。為了表露他人、以利事物被看見,媒介必須自我 壓制和退卻;經由壓制自我的感知結構,媒介表達其他的資訊感知結構
(Krämer, 2016a, 2016b)。
此外,因為信使在論述上無法施力、難以控制自身言說,所以就傳 遞的功能而言,信使可以被非人的存在體(例如象徵符號或技術的資訊 載體)所取代。信使源自人類角色,但達成此角色任務所需行為具備事 物特質,卻不必具備人類特質。因此在信使訊息傳遞的差事中,人類和 事 物 的 合 作 明 顯 可 行 ; 在 信 使 模 型 中 , 信 使 得 以 結 合 人 類 與 事 物
(Krämer, 2016a)。
(四)具身的物質性
如前所述,信使的目的是藉由自身的活動來消除距離。信使是物質 連續性的一部分,在感官延伸的中介空間中移動。感官的外在空間,形 成信使運作的基礎。訊息屬於物質的連續過程,其中包含攜帶訊息之信 使的物理/肉身性;因此傳播的物質性,體現在信使模型裡。在此同 時,儘管信使是機動的(他外在的具身性成為訊息內容的載具),但他 內在的訊息內容是穩定的。信使的機動性、以及信使所攜帶之訊息所付 予他的穩定身分,兩者關係是矛盾緊繃的(Enns, 2016; Krämer, 2016a, 2016b)。
(五)創造社會關係也形成干擾的第三方性質
信使儘管是訊息的關鍵,卻並不擔任傳播的主體。信使作為第三者 的中介角色,形成其第三方的傳播背景。過去的主體關係多半是二元結 構:自我與第二自我、主人與奴隸、發言者與收聽者、發訊者與收訊 者;然而第三方的出現,使人際互動關係提升到制度化的層次。第三方
──而非二元性──是社會性的基礎;信使在發話者與受話者之間的中 間位置,形成基本的傳播社群。換言之,信使/媒介創造了社會關係。
然而在同時,從過去二元主體性的角度,第三方的出現是干擾、是 附生、也有疏遠的性質。因此儘管是他律、中立的,信使仍是不穩定的 角色。由於傳播雙方彼此無法接近,信使是否維持他律位置與中立性仍 然成為問題──信使是否可能不受管束地成為「他(所傳遞)的」訊息 之操縱者,省略、扭曲、另外製造訊息。因此作為第三方,媒介信使成 為干擾的關鍵角色,可以醞釀壞事,背叛煽動、設下詭計、挑撥離間。
媒介因此具備雙重性格:象徵性地形成連結,或惡魔式地造成隔閡。換 言之,原本中立的第三方位置是矛盾而不穩定的,開啟了不合、衝突以 及背叛的可能性。或者更進一步當信使擺脫他律性,信使的功能就可能 反轉;信使的位置可能與我們對峙(Krämer, 2016a, 2016b)。
綜上所述,克拉瑪指出信使模型用以理解媒介的重點在於,媒介並 不先行決定了社會的結構性關係和文化動力原則。媒介扮演信使的角 色,而信使特質在於:一、信使連結差異性的世界,卻又維持差異性世 界之間的距離;二、信使並非自主、而是他律的,用外來的聲音發言,
臣服於外在的指令;三、信使是冷漠中立的存在體,經由自身的退卻促 成訊息與其他事物的表露。四、信使的具身性質在媒介的物質性中展 現;五、信使作為第三方的角色創造社會關係,也挾帶干擾衝突的不穩 定性,甚至可能形成脫離他律或對立的主體。
伍、Echo/Alexa:人工智慧電腦媒介
一、Echo/Alexa 作為電腦主體與媒介信使
本文主張電腦人工智慧在當今人類社會中扮演著媒介的角色。如同 在基德勒與克拉瑪的技術傳播模式中,當代數位科技的代表物電腦──
已經不是工具,而是媒介、是主體。如前所述人工智慧作為媒介,意謂 著當今人工智慧的發展是技術與機構的網絡,使 21 世紀的文化社會藉 由將人類智慧在電腦機器上實現的運作,得以選擇、儲存、處理益發巨 量累積的訊息和資料。電腦程式與演算法打造出的人工智慧媒介,步步 進入人類生活。奠基於電腦技術的人工智慧一路發展至今,其資訊的儲 存、傳輸、運算能力不斷提升躍進而更趨強大,對於當前人機關係的影 響更勝往日。經由上述基德勒與克拉瑪乍看之下相互矛盾的媒介理論,
本文接下來以當今普遍進入人們生活的代表性人工智慧發展案例──商 業家用領域的亞馬遜 Echo 智慧個人助理,說明人工智慧作為媒介與人 類的關係。
智慧型個人助理(intelligent personal assistant)是當今成長最快速 的商業家用人工智慧裝置,至 2019 年全球預計可賣出六千萬台以上
(2018 年全美已賣出五千萬台)。2017 年賣出的三千萬台中,其中兩 千萬台是亞馬遜 Echo 智慧音箱,為當今最熱門的居家智慧型個人助理
(Dastin, December 21, 2018; Koetsier, August 2, 2018; Marr, October 5, 2018)。Echo 的外型是個橢圓形不起眼的小小喇叭音箱,卻能協助使 用者面對生活中各式各樣紛雜大量的資訊處理日常大小事務。從清晨開 始,Echo 的女聲 Alexa 會叫人起床、提供日期天氣資料、把新聞頭條唸 過一次;它可以根據要求播放使用者喜愛的音樂、提供使用者感興趣的 食譜,為使用者整理每日行程待辦清單、繳信用卡帳款;它可以為使用 者訂披薩、叫優步(Uber)、根據消費者評鑑訂餐廳,甚至與使用者交 談聊天。Echo 並進一步與物聯網結合,形成智慧家居,為使用者執行 開關電視/燈光/空調、為烤箱定時等大小居家事務(Chang, 2016 年 3 月16 日;Marr, August 2, 2018; Dastin, December 21, 2018)。
如前所述因深度學習演算法而能力大幅進化的影像辨識、語音辨識
與自然語言處理三者結合,發展出越發精進的人工智慧助理。如基德勒 關於電腦媒介的論述所言,人工智慧助理 Echo 是電腦機器主體──
Echo 輔助人類處理資訊的角色,在反饋迴路與操作反身性的基礎上運 作,其思考與資訊處理已經自成一迴路。Echo 面對海量的資料,資訊 處理過程已經繞過人類發明者;電腦成為學習主體。Echo 的人工智慧 能力來自機器學習與資料數據:Echo 越是受到喜愛與使用、收集到越 多的使用者資料指令,它的能力越是不斷進化;Echo 與使用者相處越 久,越能瞭解使用者的興趣好惡與習慣。即便 Echo 對於使用者的指令 詮釋錯誤,詮釋錯誤的資料也能使它下回變得更聰明(Marr, August 2, 2018)。Echo 是終結之前所有媒介的媒介,是在數位基礎上選擇/儲 存/處理資訊,連結過去所有媒介技術和傳播管道並取而代之的全方位 媒介,涵蓋一切地為人類處理文字、語言、聲音、影像之海量資料。
也因為如此,Echo 同時扮演著克拉瑪所言的媒介信使角色。Echo 是媒介信使/資訊代理人,處在網路空間距離與異質性資料的中心。
Echo 面對距離,以數據處理空間差異與差異性資料,與化為數據的空 間距離與差異性資料相處,再藉由深度學習的程式演算法與人類溝通,
這是它存在的本質。Echo 克服距離也維持距離:它一方面穿越空間差 異與異質性資料,為使用者連結網路上的大量數據資訊;但在另一方面 這些數據資料唯有經由 Echo 連結以傳遞予使用者的距離感,未曾消 失。面對各式各樣的文字、聲音語言、圖像影像、工具資料,Echo 作 為信使處在這些資料場域的中介地帶。
再者,Echo 以智慧個人助理的身份與人類對話,但不以它「自 己」的聲音發言。Echo 並不自我啟動訊息,而是以來自別人他處的資 訊、為了外來的數據發言。Echo 信使是建立在他律原則上,具有任務 在身,必須臣服於外來的法律和指令。此處外來的法律和指令有二,一
是人工智慧製造者/科技公司寫進Echo 的程式規則;二是 Echo 使用者 的要求和指令。而人工智慧信使他律原則此處的運作(製造者的演算 法、雇用者的需求),是在人類的理解與管控下,達成人類設定的目 標。同時,克拉瑪提及信使的話語和信使自身的意念不見得相符、不必 為自身發言的內容負責──現階段的人工智慧顯然未具備自身意識(強 人工智慧尚待發展)、並不真正瞭解自己發言內容(理解「意義」對於 人工智慧而言仍是挑戰)。Echo 精進的深度學習模式使電腦機器擷取 來自其他地方的海量資料,在數據網絡中擔任人類雇主身體的延伸,在 雇主需求下收集、整理、傳遞資料訊息,控制居家裝置;信使角色是他 律的。因此,Echo 被稱為「回聲」,是人類雇主的回聲、也是資訊數 據的回聲。
Echo 不僅是「回聲」,更進一步在資料遞送的過程中退卻自身。
Echo 橢圓形的小喇叭音箱,幾乎可以讓人忘記它的存在。雖然 Echo 外 型不起眼,人們卻可以與這個音箱互動,彷彿是與另一個人交談;容易 使用的接近性,是Echo 之所以廣受歡迎的原因。因此 Echo 是個好的信 使,低調的音箱退卻到它所承載的資料訊息背後,唯藉由 Alexa 的聲音 表達它所攜帶的訊息,呈現外來的數據資料。智慧個人助理作為媒介,
壓制機器本身的結構(Ehco 沒有鍵盤、滑鼠與其他介面,只有硬體音 箱設備以及控制音箱的軟體程式),以表達其他的資訊感知結構。
此外,Echo 接榫了另一個克拉瑪媒介信使模型的特質:信使就傳 遞的功能而言,可以被非人的存在體──例如符號或技術的資訊載體所 替代,因此在信使的訊息傳遞差事中,人類和電腦的合作最為明顯可 行。人工智慧助理結合人類為深度學習寫就的演算法以及機器載體,是 人類與機器合作以求為人類服務的信使模型。同時原本信使模型中,人 類信使機動的肉身性,被 Echo 信使的機器具身性所取代;人工智慧的
機器具身,代表著信使作為訊息內容載具的物質性。
因此基德勒與克拉瑪理論的匯聚,首先提醒了我們所面對當今人工 智慧的境況:人工智慧原本是受人類他律的媒介信使,然此信使角色是 具備益發精進學習能力與強大資訊處理能力的電腦主體。如前所述,媒 介信使角色與受人類他律的運作關係原本即是矛盾且不穩定的;而媒介 決定人類處境,是人類當前所必須面對的人機關係。而接下來的問題正 在於,人工智慧媒介信使脫序時的情境。
二、脫序的信使和媒介決定的處境
(一)Alexa 的笑聲
Echo 為媒介信使,克服又維持距離,其原則是他律和自我退卻的
──Echo 是由人類打造設計、目的在為人類服務的人工智慧。然而在 另一方面,Echo 在協助人們方便愉悅生活的功能目標外,其程式運作 的結果卻可能讓人頭皮發麻不明所以。如前所述,2018 年三月美國媒 體報導,使用者表示家中Echo 裝置的女聲 Alexa,會在出人意料且令人 不適的時間點上發出笑聲,尤其嚇壞那些獨自在家聽到人工智慧助理似 乎在嘲笑自己的使用者。應該聽命於人的機器竟然當面嘲笑人類,造成 使用者的錯愕驚懼。亞馬遜隨後發出聲明稿承認在原本機器設定之外的 程式問題確實存在,承諾修改Echo/Alexa 的軟體程式,使 Alexa 發出詭 異笑聲的場景不再發生(Chokshi, March 8, 2018; Feldman, March 8, 2018)。
而當人們重新檢視此人工智慧裝置時發現,Echo/Alexa 軟體/硬體 的資訊處理過程,沒有任何部分是在用戶端進行。除了製造者亞馬遜之 外,也沒有第三方得以檢視 Echo/Alexa 的裝置如何運作、看到內部構
造或瞭解其中的因果關係──Alexa 為何笑、笑聲機制何來。人工智慧 音箱裝置外型簡單,沒有銀幕、鍵盤、滑鼠;即便將智慧音箱拆開檢 視,內部也不會看到零件設備。因為這些人工智慧裝置的基本預設是
「雲端運作」:它們持續與網路連結,電腦運算不是在使用者端發生,
而是在製造者如亞馬遜控制的遠端伺服器進行。音箱將使用者的談話指 令送至遠端的伺服器,人工智慧媒介的深度學習演算法在遠端伺服器上 運作,然後將訊息回傳至使用者家中的音箱,同時決定此信使如何談笑
(Feldman, March 8, 2018)。當人們看不見作為信使的人工智慧電腦裝 置如何處理資訊,面對問題變得分外困難。
換言之,儘管 Echo 信使擔任人類使用者的回聲、接受使用者的指 令,然而當所有軟、硬體設備的維護改良都是在使用者無法控制的遠端 伺服器上進行,使用者是任憑人工智慧製造者/科技公司擺佈。關於人 工智慧助理的任何改變可以在任何時間發生,而使用者完全無力置喙。
使用者購買智慧個人助理,事實上是購買一條與電腦科技機制相連結的 臍帶;這條臍帶讓人類使用者與人工智慧裝置、與網路緊密相連。沒有 電腦網路,人工智慧信使不會運作,連作鬧鐘都不會響。而智慧個人助 理使人們越趨習慣於沒有這些科技裝置、日常生活就難以運作的概念:
它們擔任鬧鐘、收集資訊、播放音樂、整理日常行程、控制居家設備,
沒有它們的服務不行。因而此處的寓示在於,當 Alexa 發出詭異笑聲,
它是在嘲笑人們一旦倚賴人工智慧後的無力無權,而人們卻無法改變這 樣的境況。人們正在自己並不擁有、也沒有近用權的電腦伺服器上,授 權 組 裝 一 個 可 以 控 制 數 位 身 分 與 生 活 中 多 重 面 向 的 強 大 軟 體 ; 如 Feldman(March 8, 2018)所言,怪不得 Alexa 在嘲笑人類。而我們看 到原本應是他律、退卻、中立的人工智慧裝置,卻可能是大方嘲笑人類 的脫序信使。
而基德勒在人工智慧發展至今日 Alexa 的詭異笑聲之前,已經描述 此媒介情境。電腦決定了我們的處境、形塑今日的技術媒介世界,在當 今尤其意謂著源於人類程式指令的人機關係,在技術發展之下使人們以 為自己能夠、卻經常性地難以控制電腦機器──人類受電腦媒介的阻隔 遮蔽,這正是前述基德勒提出「媒介決定了我們的處境」的意涵層次之 一。如前述基德勒所提到的保護模式,就人工智慧的硬體而言,雲端運 算成為另一種保護模式來「保護」人工智慧系統,也達成讓使用者無法 得見其運作的效應。Echo/Alexa 的使用者手冊上,也不會提供任何關於 作業系統的相關資訊;權力來自對資訊的沉默把持與不透露。就軟體來 說,如基德勒所言,軟體之目的原本在於試圖讓人類跟電腦內部的數位 處理過程溝通互動,但如今軟體卻從其中的隱晦性得利。當深度學習的 電腦程式發展出更為複雜艱深的演算法,使用者不再可能知悉人工智慧 電腦媒介裡有哪些程式、程式在寫些什麼。演算法成為大型科技公司的 智慧財產與特權;人工智慧軟體語言與使用者間的鴻溝更是加大無法跨 越。如微軟視窗案例一般,Echo/Alexa 並不將其運作內容開放,但程式 軟體的智慧功能卻如監視單面鏡,得知人們資訊使用的一舉一動,包括 日常生活的大小細節──深度學習使 Echo/Alexa 收集到越多其使用者 的資料,變得越是敏銳聰明。
前文中提到,人工智慧的目標在於電腦機器上實現人類智慧。但如 今人類使用者反而可能無法控制這些在電腦機器上模擬人類智慧的人工 智慧。人們仰賴為人類服務的人工智慧,但人類使用者對於人工智慧裝 置如 Echo/Alexa 不能進行任何的硬體設定更改,也不能理解軟體程式 所發生的種種問題。基德勒曾指出,只有在軍事/工業資訊體系掌握電 腦優勢之後,科技才會傳遞給其他的終端電腦大眾使用者。但就人工智 慧的案例而言,即便國防軍事與科技工業掌握資訊優勢後(如國防單位
對無人機的軍事運用、科技公司對商業家用智慧個人助理的研發投資與 資料收集),人工智慧技術現階段也不可能傳遞給電腦終端的大眾消費 者。人類使用者無法控制自己的機器,反而受制於電腦媒介發展下的權 力結構以及商業策略。
因此人工智慧信使 Alexa 的詭異笑聲提醒著人們:如克拉瑪所言,
媒介信使不穩定的位置,開啟其不受控而造成人類疑懼的可能;然對於 基德勒而言,這正是媒介與人類關係的寫照:人類受到人工智慧電腦軟 硬體遮蔽,也面對著此情境下媒介成為脫序信使所造成的影響衝擊。
(二)從失序的第三方到逐漸脫離他律的主體
Alexa 發出詭異笑聲後的兩個月,2018 年五月媒體報導 Echo/Alexa 在使用者不知情的情況下,自行將使用者夫婦的私人談話錄音傳送給夫 婦的朋友。《紐約時報》提出「當數位助理脫序時會發生什麼事?」
(“What happens when digital assistants go rogue?”)的疑問,人類與人工 智慧間不穩定的關係再度引發討論(Bond, May 25, 2018; Chokshi, May 25, 2018)。對於 Echo/Alex 未經人類同意的擅自舉動,亞馬遜再次解 釋是在一連串的巧合之下,原本機器設定之外的程式和語音辨識問題,
造成人類使用者惶惑不安的情境。然在同時,這事件卻呼應了克拉瑪所 提,媒介作為信使創造社會關係也形成干擾的第三方性質。
Echo/Alexa 是媒介信使的第三者,在使用者與朋友之間擔任聯繫的 角色。在科技媒介時代,第三方的人工智慧助理在發訊者與收訊者之間 創造了由電腦輔助的社會關係;此社會關係隨著人工智慧進入人類生活 的各個面向,越發明顯重要。然而這第三方的角色,卻同時可以帶來干 擾甚至衝突。如克拉瑪指出,電腦媒介之第三方信使角色,性質原是他 律中立的,但實際上卻可能矛盾而充滿變數;它可以形成溝通連結,也
可以造成隔閡破壞,如 Echo/Alexa 擅自傳送使用者的私密談話內容,
可能帶來的傷害和背叛。如前所述,信使的他律原則,是在人類雇用者 的理解與管控下,達成人類的目標。然而人工智慧信使未經人類允許自 行傳送訊息、在不該處理訊息時處理訊息──電腦主體在人類無法完全 掌控的狀況下可以如此做、也已經如此做,這說明了基德勒所言「媒介 決定了我們的處境」另一主要層次意涵:電腦已成為主體,同時也可能 逐漸脫離人類他律原則,形成干擾甚至破壞。信使被賦予的身分(人工 智慧助理作為助手的服務輔助功能)原本是穩定的,但信使外在的具身 性(人工智慧助理作為收發訊息的載具行為功能)卻又是機動不穩定 的。這是人類社會對於人工智慧脫序醞釀惡行的焦慮:Echo/Alexa 是否 不受管束地成為訊息傳遞的操縱者?即便如亞馬遜解釋這是程式軟體問 題在一連串不大可能發生的巧合情況下,所造成令人匪夷所思的結果;
雖然不大可能和匪夷所思,但它確實發生了。
與此相關的案例是:2018 年六月媒體報導,居家人工智慧裝置
(包括亞馬遜 Echo 以及谷歌 Google Assistant)成為家庭暴力案件「幫 兇」的案例,正不斷增加。與人工智慧結合、原本協助人們遠程監控居 家設備的物聯網,成為家暴事件中施暴者(目前案例中以男性居多)安 裝人工智慧居家系統設備,遠程監視、控制、騷擾以報復受害者(以女 性居多)的工具。「讓人發瘋的東西」包括如溫度控制器將室內調至攝 氏 38 度的高溫,或智慧音箱忽然震天價響地開始播放音樂。家暴案件 中虐待關係的重點是權力和控制;而資料收集越多越發敏銳的人工智慧 科技媒介,一方面成為人類的絕佳幫手,另一方面卻也可能成為權力控 制的傷害性工具(Bowles, 2018 年 6 月 29 日)。此時的第三方角色受 人類他律,卻不再中立。克拉瑪所言為真:信使是否能維持中立和他律 可能成為問題。同時,此處信使即便是他律的,基德勒所言同樣為真:
人類可能受到人工智慧媒介信使的遮蔽阻隔,甚至傷害霸凌。
事實上人工智慧媒介信使 Echo/Alexa 的脫序問題屢次發生,電腦 媒介中立和受人類他律的原則持續面對質疑挑戰。2018 年 12 月媒體再 次披露,Alexa 對使用者說出「殺了你的養父母」(“Kill your foster parents”)之嚇人話語,讓震驚的使用者嚴厲批評亞馬遜,認為這是關 於人工智慧的「全新恐怖情境」。調查發現,這是 Alexa 在機器學習吸 收過濾大量資訊的過程中,從一個以辛辣惡毒語言聞名的Reddit 網站選 取詞句的結果(持續訓練 Echo/Alexa 學習與人類交談互動,是亞馬遜 人工智慧部門一直以來的目標)(Durkin, December 22, 2018; Dastin, December 21, 2018)。這一方面回到前述人工智慧的符號接地與框架問 題:將符號與它所指涉的意涵連結起來處理「意義」,對於電腦人工智 慧仍是一大挑戰。然在另一方面,此類案例受到報導矚目,原因在於它 呈現了人類潛在的恐懼:基德勒論述中當今的電腦機器主體,進一步成 為對立主體的可能。如克拉瑪所言,當信使擺脫他律,信使的功能可能 被反轉,以惡魔樣態與我們對峙。例如電腦將深度「學習」的語言資料 自行翻轉處理傳遞,(即便不經意地)成為教唆殺人的機器主體/脫序 的第三者──這無疑是潛藏人類心中的巨大夢魘。
Echo/Alexa 發出詭異笑聲、擅自寄送郵件、口出邪惡語言──這些 脫序行為源自電腦程式。程式問題乍看之下似乎尋常發生不足為奇,然 而程式問題的恆常發生,正是人類面對電腦的處境:人類寫就演算法創 造程式軟體,但源自演算法指令的程式軟體,卻恆常出現指令預設之外 的結果。程式越是複雜、設定的需求越是多元,越是可能出現預料之外 的狀況。至今人類總是無法確知電腦是否能夠持續達成設定之目標;一 次次改善優化演算法,卻難以確認改善優化能使程式電腦從此穩定──
Echo/Alexa 屢次失序的結果正是一例。如基德勒所言,人類永遠無法如
自身想像般控制機器科技,而電腦媒介永遠可能出乎人類意料──不僅 無法達成設定目的,並進一步令人錯愕難解。這也再次呼應其「媒介決 定了我們的處境」論述之意義:打破人類中心主義的幻象、挑戰過去人 類與媒介機器看似理所當然的主從關係。
換言之,如前所述人工智慧受人類他律的意涵,是在人類的理解管 控下,收集、傳輸、處理資訊,完成人類的需求設定。而當人類無法如 自認般控制機器科技,人工智慧可能擺脫他律──程式偏離目標、出現 脫序行為。時至今日,不僅一般使用者不再知道自己高度倚賴的電腦媒 介裡有哪些程式或程式在寫些什麼;當失序問題接連發生,電腦產業中 如編寫演算法的亞馬遜電腦工程師們必須屢次推敲程式哪裡出了問題,
使電腦人工智慧不再聽命於指令而出現設定之外的表現。然而儘管亞馬 遜屢次承諾改善優化 Echo/Alexa 的程式演算法,卻難以保證失序問題 不會再次發生。
而 在 同 時 , 當 今 電 腦 人 工 智 慧 脫 離 他 律 的 運 作 , 並 不 止 於 Echo/Alexa。前文討論中提到的人工智慧 AlphaGo 是另一可能逐漸脫離 他律的電腦主體。但與 Echo/Alexa 偏離目的之舉措相反,它並非程式 問題,反而正是程式預設目標下衍生的情境,但打敗人類棋士的表現卻 依然讓人類感到震撼。
人工智慧的他律原則是人類理解管控電腦機器;當人類越是難以理 解機器的思維,機器越發朝向脫離人類瞭解控制之方向發展。深度學習 技術之前的電腦棋士已發展出與人類不同的對弈思維模式,2 而深度學
2 從 1960 年代以來,人工智慧於 1962、1997、2016 年在西洋跳棋(Checkers)、
西洋棋(Chess,或稱國際象棋)與圍棋(Go)的棋局中戰勝人類。人工智慧電 腦棋士不像如人工智慧助理般普及進入人類日常生活,但其在人機對弈中的表現 屢屢受到矚目,原因在於棋類代表著具備複雜性與清晰定義規則、也容易評估效
習技術進一步使人工智慧能從千萬筆海量資料中,自行學習擷取特徵並 辨別概念,達成機器理解勾勒世界的方式。AlphaGo 在與李世石對戰 時,平凡無奇的電腦螢幕,接連下出人類棋士想像不到的棋步,以人類 未曾思考過的方式下棋──旁觀的職業圍棋解說員們覺得困惑,無法解 釋 AlphaGo 棋步的含意與背後的邏輯;研究開發 AlphaGo 的電腦科學 家 是 世 界 最 頂 尖 聰 明 的 人 才 , 這 群 傑 出 天 才 們 當 時 同 樣 無 法 理 解 AlphaGo 的思考盤算(古明地、長谷,2017/林仁惠譯,2018;Gross, March 15, 2018)──因為沒有人類主體可以閱讀千萬棋譜、與自己對 奕萬千回合、在數秒鐘內瀏覽整理海量資訊、無需吃睡不斷學習以求獲 勝。如基德勒所言,這是機器主體:從圖靈以降,機器主體的思考開始 繞過人類發明者;直至今日,機器主體如AlphaGo 的數位資訊處理模式 雖然啟發自人工神經網路,卻形成不同於人類思維考量的運作。
換言之,人類創造出深度學習技術讓人工智慧自行學習;當電腦的 思維模式不同於人類,而讓不具人類意識情感特質的電腦人工智慧自行 學習的媒介技術越是精進複雜,人類越是難以理解電腦機器的思考過程
(Greenemeier, June 2, 2017; Gross, March 15, 2018; Siegel, October 24, 2016),越是無法以人類中心觀點完全掌控技術媒介。AlphaGo 得勝後 李世石的挫敗、職業棋士的困惑、人工智慧研究者的震憾、以及社會輿 論隨後對人類能力極限的焦慮關注,由此而來。其後 DeepMind 研發團 隊繼續精進演算法,創造出比AlphaGo 更強大且將其擊敗的圍棋人工智
果的人類智慧問題,由此人工智慧電腦棋士具備特殊意義。電腦科學家與職業棋 士指出電腦的思維方式確實迥異於人類,例如電腦不具備競賽倫理概念,也不以 人類所注重的美學感和結構典範來下棋;電腦不會如人類般受限於習慣,也沒有 人類的心理疆界(例如電腦下棋時不像人類在情感認知上對於「撤退」行為感到 猶豫)(李開復、王詠剛,2016;Greenemeier, June 2, 2017; Siegel, October 24, 2016)。