• 沒有找到結果。

超連結網絡分析:一項分析網路社會結構的新方法

N/A
N/A
Protected

Academic year: 2021

Share "超連結網絡分析:一項分析網路社會結構的新方法"

Copied!
22
0
0

加載中.... (立即查看全文)

全文

(1)

超連結網絡分析:

一項分析網路社會結構的新方法

吳齊殷

莊庭瑞

中央研究院社會學研究所 中央研究院資訊科學研究所 sss1ciw@gate.sinica.edu.tw trc@iis.sinica.edu.tw

摘 要

網路資訊技術的進步使得人與人間知識與情感的來源和表現形 式更加多樣化。透過電腦網路技術結合情感意念乃在電腦網路上有了 更合適的表達形式,從而擴大了人們在網際網路建構社會網絡的形式 與空間。全球資訊網(World Wide Web)的興起,讓人類的許多社會活 動從此能夠在網上進行,而這些網上的社會活動也產生了大量的資 料。這些詳細記錄的資料,正可以用來分析及視覺化這些只存在於線 上活動場域(online forums)的社會關係網絡。這些分析與視覺化線上 人際互動與溝通詳細資料的努力,往往可以改善我們對線上人際溝通 機制的理解。這些資料如能做有意義的分析,不僅能讓我們對目前的 網路使用現象有深入的了解,也可對未來人類社會的發展趨勢有所掌 握。在這篇文章所討論的研究中,我們特別設計並製作了一套可以在 網際網路的連結中進行社會網絡分析的軟體系統。文中除了說明我們 發展此套軟體系統的動機與想法之外,我們運用此套軟體系統試行資 料分析的經驗,亦一併討論。為增加這篇文章的實質效用,我們針對 社會網絡分析方法做了簡要的介紹,尤其著重在闡明由解構圖型理論 所衍伸的分析策略。 關鍵字:新聞群組、瀏覽、社會網絡、電腦輔助溝通 [收稿]2003/09/27; [接受刊登]2003/12/27

(2)

1

一、前言

近年來,由於資訊科技的發展突飛猛進,尤其是其中的媒體數 位化與壓縮技術,以及網路傳輸與網際網路技術等方面跳躍式的進 展,促使資訊的數位化、典藏與傳播比以往更加便利。資訊技術的趨 勢,大抵可以用我們耳熟能詳的 3C 來說明, 3C 即是「通訊 (communication)、運算(computing)與消費(consumer)」三者 的代稱。在通訊方面,趨向跨越國界與網域等各種藩籬,以便隨時隨 地收發資訊的技術(如網際網路);在運算能力方面,電腦的計算能 力越來越強大,整合處理各種媒體的功能也更完善(如虛擬實境); 在消費方面,趨向以消費者需求導向為設計原則(如,圖形介面以及 數位圖書館的開發等等)。值得注意的是,此 3C 科技並非各自孤立 發展,而是力求此三者的整合應用(例如,網路化的多媒體系統與全 球資訊網)。換言之, 3C 資訊技術趨勢帶來資訊流通成本的下降, 導致資訊流通量的增加與流通媒介的多元化。 由資訊網路架構出的「網際空間」(Cyberspace),不只是提供了 資訊流通的管道,同時也累積了這些資訊內所蘊含的知識,成為一種 「網路知識庫」。這些知識包含了各種形式的電子檔案,和操作電腦 強大的計算能力以解決問題的各種軟體程式。網路資訊技術的進步, 亦同時使得人與人間知識與情感的來源和表現形式更加多樣化。藉由 強大的計算能力與友善的人機介面操作方式,使得許多不容易親身經 驗的溝通情境與抽象的關係和情緒,可以透過電腦網路技術結合情感 意念而在電腦網路上有了更合適的表達形式。電腦與網路技術的結合 創造了虛擬溝通的可能性,從而擴大了人們在網際網路建構社會網絡 的形式與空間。當資訊網路聯絡起一部又一部的電腦之時,同時也就 聯繫了這一部又一部電腦的使用者,而就在「聯結上了」的當下,電 腦資訊網路就旋身變成了社會關係網絡(Wellman, Salaff, Dimitrova, Garton, Gulia, and Haythornthwaite, 1996)。這個完全由電腦所架構的 社會網絡(Computer-Supported Social Networks, CSSNs)乃是虛擬社區

1 本文初稿發表於台灣資訊社會研究學會主辦之「網路研究方法工作坊」,2003

(3)

(Virtual Communities)的重要基礎(Miller, 1996)。與過往人類在真實社 區(Real Communities)中,必須親身與其他人來往互動的情形相比 較,這個電腦所架構的社會網絡,出乎預料之外的,竟然一樣能夠撐

持起人際關係中的強聯繫(strong ties)、中介聯繫(intermediate ties)

與弱聯繫(weak ties)等,這些原先只在真實社區生活中實際存在的 人際網絡關係特性;進而使得電腦所架構的社會網絡足以在虛擬社區 中提供人與人之間訊息的交換和社會支持(social support)(Wellman 等人,1996)。以兩人交談為例,交談雙方必須在同一段時間內進行 聽與說的動作,此為同步溝通;相較之下,信件往來雙方,則不需要 在同時間內進行寫信與讀信的行動,此為非同步溝通。一般而言,同 步溝通的互動性強,然而成本高,非同步溝通的成本低,然而互動性 弱。在網路上,由於機器居間成為溝通的媒介,透過機器本身強大的 儲存與運算能力能夠獲得相當程度的互動。換言之,需要互動溝通的 資訊服務,可以透過網路以較低的成本在較有時間彈性的情況下取 得。簡言之,電腦網路的發展,使得人類建構人際與社會網絡時必須 透過有限之節點(limited gateways)的先天限制,獲得空前的解放。 這個虛擬的電腦資訊網路,使得未來所有的人們,都能輕易地透過這 個系統,自由的建構其個人的社會關係聯繫。從網際網路發展之初, 使用者便互相分享工具程式與資料,互相解答問題,交換意見。共享 的內容,除了「資源」、「資訊」還有「價值」,共享的精神一直是網 路的特色。然而,網路的共享機制是價值中立的,價值共享對社會的 效應取決於網路使用者的互動作為。網路使用前輩將有用的資訊或工 具程式、程式庫、文件等蒐集起來,提供後進遇到相同或類似的問題 時參考,這樣的行為在網路上相當普通。最具代表性的就是討論群的

FAQ(Frequently asked question),或者像是 BBS 內的「精華區」。

這些共同在網路上產生、分享的數位資訊,由於便於處理,而得以快 速地累積成為知識,而網路使用者也從知識的分享開始,逐漸發展出 情感的聯繫與相依。

全球資訊網(World Wide Web)的興起,讓人類的許多社會活動從 此能夠在網上進行,而這些網上的社會活動也產生了大量的資料。例 如:在虛擬的電腦資訊網路中,電腦中介溝通 (Computer-mediated

(4)

Communication, CMC) 系統,如:Usenet newsgroups, e-mail lists, online chats 等等,促進了大規模的人際互動與溝通,同時也產生了極 大量的這些人際溝通活動的詳細記錄。這些詳細記錄的資料,正可以 用來分析及視覺化這些只存在於線上活動場域(online forums)的社會 關係網絡。這些分析與視覺化線上人際互動與溝通詳細資料的努力, 往往可以改善我們對線上人際溝通機制的理解,同時亦可導致 CMC 系統的補強與改良。這些資料如能做有意義的分析,不僅能讓我們對 目前的網路使用現象有深入的了解,也可對未來人類社會的發展趨勢 有所掌握。然而,因為網路分散的本質,以及資料量的龐大,使得描 述線上社會活動特徵這件事,變得非常具有挑戰性。本研究試圖發展 新的方法和技術來描述網上社會活動的特徵。我們尤其對網路使用者 的網上集體行為,及其在社會學上的意涵,特別感到興趣。

二、社會網絡分析

社會網絡分析主要是研究社會實體間的關係連結以及這些連結 關係的模式、結構與功能。社會網絡分析同時亦可用來探討社群中個 體間的關係以及由個體間關係所形成的結構及其意涵。換言之,社會 網絡分析的主要目標是從社會網絡的「潛在結構」(latent structure)中, 分析發掘其間次團體之間的關係動態。隨著網際網路與全球資訊網的 日益普及,極大量的社會活動已經有從日常實體社區移到由電腦資訊 系統所中介的線上活動場域的趨勢。這些電腦中介的人際關係活動軌 跡記錄,因電腦網路的特性之故,可以被鉅細靡遺地以資料的方式儲 存起來,供作分析線上活動場域之社會網絡建構的絕佳素材。例如: 美國電報暨電話公司(AT&T)即曾以其通話聯通記錄資料,探索每一 位在電話之一端的通話者,是否能夠在數目極小(個位次數以內)的 連結裡,就能夠與通話記錄資料中的任何一位通話者連結上,即便他 們彼此之間可能是素未謀面的全然陌生人(Abello, Pardalos, and

Resende, 1998)。另外,IBM 也曾經利用網頁間超連結的紀錄結構資

料分析發現:有許多虛擬的新生社群逐漸在醞釀成形中,因為這些成 形中的虛擬新生社群的成員,往往以他們自己的網頁與其他成員的網

(5)

頁進行超連結,而少與社群成員以外的網頁或使用者有互動聯繫 (Kumar, Raghavan, Rajagopalan, and Tomkins, 1999)。以上 AT&T 以及 IBM 的實驗研究,都是利用極大量的「點與點」之間的聯繫資料(通 話記錄或網頁超連結)為基礎所進行的資料分析,從分析中,我們可 以清晰的察覺到「社會結構」隱然成型。從實用的觀點來看,AT&T 以及 IBM 這兩家公司或許可以藉由這樣的資料分析,找出各自新穎 而有賣點的商業模式(business model);然而從學術研究的觀點思之, 這樣的資料分析策略,不啻說明了結合網際網路特性與社會網絡分析 方法,在研究當代資訊社會的形式與內涵時的創意與可行性。 對應網際網路日益增生複雜且「擬社會化」的連結趨勢,已有 學者亟力聲稱「社會網絡分析」可以被適切地用來理解電腦所中介的 社會過程之間的連結關係 (Garton, Haythornthwaite, and Wellman, 1997)。雖然不同的學者對網際網路(Internet)有不同的概念或看法,但 原則上大家仍有著網際網路是「網中之網」(Network of Networks)的 共 識 , 而 網 際 網 路 最 基 本 的 結 構 元 素 乃 是 超 連 結 (Hyperlink)(Berners-Lee, 1999)。超連結這項網際網路的技術特性,使 得個人或團體組織得以在網際網路線上經營網址,經由與全球各地在 網際網路上設有網址的個人或團體的直接而輕易的接觸,乃得以擴充 其社會或溝通關係。使用超連結,人們可以擁有雙邊對稱的溝通與合 作。而這些對等的溝通與合作,可以強化彼此之間(無論是個人與個 人之間,或團體與團體之間,甚或個人與團體之間)的信任與情感聯 繫。在超連結系統的空間中,人們經由超連結的方法,在某一特定的 背景、興趣或計畫上,可以互通聲息、可以交換訊息、亦可以維持合 作關係。在當今的全球資訊網內,這項溝通結構的新型態到處可見。 在這篇文章所討論的研究中,我們特別設計並製作了一套可以 在網際網路的連結中進行社會網絡分析的軟體系統。文中除了說明我 們發展此套軟體系統的動機與想法之外,我們運用此套軟體系統試行 資料分析的經驗,亦一併討論。為增加這篇文章的實質效用,我們針 對社會網絡分析方法做了簡要的介紹,尤其著重在闡明由解構圖型理 論所衍伸的分析策略。

(6)

三、以新聞群組(Newsgroups)的社會網絡分析為例

Usenet newsgroups 乃是典型的線上論壇(online forums),參與者 藉由發表意見(主要經由張貼文章)或對別人已張貼的文章做出回 應,以公開討論許多不同性質的議題(或話題)。這些不同的議題基 本上以分門別類的方式,組合成一系列的新聞群組,每一個新聞群組 代表一項特定的討論議題。實際上,網路線上存在著成百上千的新聞 群組,反映出隨時有著成千上萬的網路使用者參與這些特定議題的討 論,不論其中有些人是積極的參與(經由主動提出意見或回應別人的 意見)或僅僅只是消極被動的參與(僅只閱讀其中的文本,不親身參 與討論)。 一般而言,Usenet 新聞群組即便是在以網際網路介面為主的時 代,仍是相當普遍且受到極大的歡迎的「傳統產物」,其原因之一乃 是新聞群組的操作是在自動傳輸與分發的機制下進行。參與者不需依 賴某一特定的具有威權的「人」或「機構」(此二者可能是不可靠或 甚至會進行片面管制的「邪惡勢力」)才能讀到他/她想看想閱覽的文 章。更有甚者,一旦一篇文章被張貼到某一個新聞群組,這一篇文章 就非常有可能會被自動轉載至其他的新聞群組,最終在全世界各處都 能被看到或讀到。這種分散式的、同儕對同儕的新聞群組服務性架 構,允許有意見者能夠在自己不需花費太多成本的情況下,也能夠接 觸 到 廣 大 的 甚 至 全 球 性 的 聽 眾 或 觀 眾 。 其 結 果 就 是 : Usenet newsgroups 鼓勵了使用者之間的相互的互動與聯繫。他們變成了線 上的「市集」或「論壇」,讓人們得以自由地交換對某些特定事物的 自己的想法或興趣。為使使用者瀏覽方便起見,新聞群組經常將使用 者所張貼的文章較有系統地陳列出來。並在每篇文章的開頭放置一些 格式相同的重要訊息,包括:文章主題、作者的 e-mail address、以及 張貼日期等等,同時,每篇文章也往往會被賦予一個全球獨一無二的 ID 稱做:the Message – ID header。而如果文章乙是直接對文章甲的 回應,則在文章乙的參考欄(References header)裡就會包含文章甲的 Message ID,同時在這之前,被文章甲所指涉到的所有其他文章的

(7)

Message ID,也會附在文章乙的參考欄中。這些參考欄中的訊息使得 新聞群組的伺服器能夠依照文章及其回應張貼的先後次序,將這些前 後相關的一系列文章「穿針引線」地串連起來。有些以網頁為基底的 新聞群組甚至還提供額外的伺服端的訊息處理,幫助使用者更容易搜 尋或瀏覽新聞群組中的文章訊息。這些以網頁為基底的新聞群組允許 使用者經由查詢作者名字、主題關鍵字或其他相關文章資料等交互查 詢文章指標的方式,瞄定並查出特定的文章系列。 穿針引線和交互查詢文章指標兩項功能,在組織新聞群組中張 貼的文章時是非常好用的方法,但是對於文章作者之間互動的認證, 卻不是有太大的幫助,因為,使用者在讀取新聞群組中張貼的文章 時,往往會汲汲於在參與者當中尋找有意義的對話,而穿針引線功能 的作用只是將張貼在版上的文章依先後順序串連起來,這些被串連在 一起的文章之間並不必然存在著有意義的對話(例如:其中有些文章 可能只是一兩句表示同意或不以為然的意思,更不用說,有些是夾雜 其中的廣告)。交互查詢文章指標這項功能,基本上是以查詢作者姓 名或文章主題之關鍵字為依據,在搜尋文章間的往來互動關連時,幫 助亦不大,因為它會漏失掉「團體對團體間討論」這個可能也重要的 面向。 為能比較貼切地掌握新聞群組所張貼的文章意見之間的互動關 連以及明確地找出活躍其中的意見領袖,我們乃將新聞群組視為一個 社會網絡,運用我們所發展出來的以網路為基底的社會網絡分析軟體 系統深入分析之。於此,我們將對已經張貼的文章進行回應的行動視 為具體的社會互動。從這些互動當中,我們選錄了一些次團體(成員 彼此間顯示曾有有意義的往來對話),作為稍後進一步瀏覽與觀察記 錄的對象。這個分析策略對於晚進的參與者在特別喧鬧吵嚷、充滿雜 音而人馬雜遢的新聞群組中,能夠在短時間內掌握狀況跟上進度特別 有助益。我們將新聞群組視為社會網絡而加以分析的另一個動機是想 藉由這樣的分析角度對於線上虛擬社群的特性及其互動機制,能有較 深入而精確的理解。我們的分析方法主要可分為兩方面,一是運用簡 單的圖形演算法,另一是機率統計方法。

(8)

四、新聞群組的社會網絡分析

為進行針對新聞群組的社會網絡分析,我們將在某一新聞群組 中張貼的所有文章的 FROM 處的 e-mail address 視為構成一個完整社 會網絡的點(nodes)。換言之,所有在此新聞群組中張貼文章的作者, 就是構成一社會網絡的所有成員。此外,在新聞群組中張貼的文章, 一般都會有一個參考欄(References header),如果某甲曾在新聞群組中 張貼過文章,而其個人之 Message ID 的確曾出現在稍後某乙在此新 聞群組所張貼的文章的參考欄中,則我們就從某甲畫一條線連結到某 乙身上。也就是說,只要某乙確曾在新聞群組中張貼過文章,以回應 某甲先前張貼的文章,則某甲與某乙之間,即可視為具有個人與個人 之間的連結關係。根據此項原則,我們就可以在一個由新聞群組所有 參與者所構成的社會網絡中,逐一描繪出彼此之間的連結關係,這些 連結關係顯然會是多方、多頭緒的圖形繪樣。

根據 RFC1036(Horton and Adams, 1987)的規則,如果文章乙是對 文章甲的回應,則文章乙必須包含文章甲的 Message ID,同時,在文 章甲中已經包含的之前的所有文章,也都必須包含在文章乙的參考欄 中。因此之故,在一個多方且多頭緒的圖形繪樣網絡圖中,因參考欄 存在而產生的文章作者之間的間接的聯繫,並不一定表示兩個作者間 的聯繫即是有意義的社會關係網絡聯繫。基於此項考量,我們先後建 構兩套作者之間的社會網絡關係圖,其一即是根據 RFC1036 規則所 形成的「複雜」關係網絡,另一是簡化了的社會關係網絡(亦即,我 們將間接經由參考欄所產生的作者間的聯繫排除),並比較這兩套社 會關係網絡的異同。我們發現簡化的社會網絡在圖形的表現上,比較 清朗(因為連結線少了的緣故),而簡化的社會網絡事實上也比較明 確,因為其中剩下的每一條連結線現在都清楚的代表兩位作者之間的 直接的聯繫,而且這個聯繫是由新聞群組中的一篇「獨存」的文章所 支持。 我們緊接著將此簡化的社會網絡,分解成一些個緊相連子圖 (Strongly Connected Components, SCC),在一個緊相連子圖中,每一

(9)

位作者都能透過直接的連線,或透過與第三者之間的連線,而最終都 能彼此串連起來。之後,我們計算在一個緊相連子圖中,任何兩位作 者之間的所有聯繫次數(經由計算參考欄中及相互直接回應的次數而

得),作為此二位作者之間聯繫的強度(關係比重)。再來,我們就可

以根據此既經權重的相鄰矩陣(weighted adjacent matrix)來估計其轉 移機率矩陣(transitional probability matrix),而後直接估算此 SCC 的聲 望向量(prestige vector)。一個 SCC 中,每位作者的聲望高低程度 (prestige degree)意指他/她在此 SCC 中,從其他作者身上所獲得之注 意(attention)強度,這項測量可由各該作者獲得在同一 SCC 中多少個 其他作者的回應或背書次數(endorsement)取得。在我們發展出來的數 會網絡分析軟體系統中,這個由好幾個緊相連子圖所共同構成的社會 網絡,以及每一個緊相連子圖的特徵(例如:網絡大小、密度乃至形 狀等等),和每一位作者的社會網絡特性(例如:聲望高低程度、張 貼總文章數、以及其網絡位置等等),都可以透過一項稱為「互動式 圖形使用介面」的功能,以圖表或圖形視覺化的方式直接表現出來。 使用者還可以透過此軟體系統,翻轉已視覺化的社為網絡圖形,進一 步探索其關係結構。

五、將新聞群組視覺化成社會網絡

我們藉由 AT&T 所發展的 Grsphviz 和 Grapa Java package,來自 動形構和視覺化一個社會網絡關係圖。我們將 Java routines 附著在社 會網絡圖形上的元件,例如,節點(nodes)和連線(edges)上面,因此這 些元件可以動態地擷取資訊。例如:如果用滑鼠點按在一條連線上, 則跟這條連線相關的所有新聞群組裡所張貼過的文章,都會在視窗中 一一呈現出來;而如果點按在某一節點上,則與此作者相關之所有在 新聞群組裡張貼過的文章,就會在另開的視窗中顯示出來。我們所發 展的軟體系統(瀏覽器),共提供兩種圖像以描繪在某一新聞群組中 的社會網絡關係。其中微視的圖像顯現所有作者之間的聯繫情形;而 另一鉅視的圖像則標示各個 SCC 及其之間的聯繫情況。鉅視的圖像 讓軟體系統的使用者能夠對一個新聞群組中的 SCC(小團體)的組織

(10)

及分佈情況,有一個整體的掌握,而且可以用來比較不同新聞群組之 間的社會關係結構差異的比較。另外,對於微視的圖像,我們則以下 列的變項測量方式,來反映作者之間特性的差異與彼此之間的聯繫強 度,同時設法讓這些特性與聯繫強度以視覺化的方式呈現出來。

張貼文章數

作者在新聞群組中所張貼的文章數目,在取其對 數值後,所得的數據就直接反映在代表該作者的節點的尺寸大小上。 換言之,如果某位作者發表了n篇的文章,那麼代表這位作者的節點, 就會有㏒2(n+1)這麼大的尺寸。這樣做的緣故是使得那些勤於大量張 貼文章的作者的節點不會因此佔滿整個畫面。

聲望高低程度

某一位作者在一新聞群組社會網絡中的聲望 高低程度,直接反映在代表該作者之節點的灰階顏色深淺上面。一個 節點的顏色愈趨於黑色,意味著這位作者擁有較高的聲望。

連結

任何兩位作者之間的聯繫,就由代表該二位作者之兩個節 點間的連線映現。 我們將屬於同一個 SCC 的所有節點,在微視的圖像中,以方形的 框框標示出來,便於軟體系統的使用者能輕易的辨識每一個 SCC 的 邊界。此外,我們以下列的視覺化標示來呈現鉅視的圖像。

SCC 的尺寸

一個 SCC 總共所有的作者人數,就直接線性 地反映在代表該 SCC 的節點的尺寸大小上。包含越多作者的 SCC, 其代表節點的尺寸就越大。

SCC 的密度

一個 SCC 的密度(即兩兩作者之間連線的繁 密程度),以該 SCC 之代表節點的灰階彩度反映出來。密度越高的 SCC,其節點之顏色就越趨黑色。

SCC 的直徑

代表之中的某位作者,要與同一 SCC 中的另 一位作者連結上時,所需經過的節點數。直徑越短代表此 SCC 中的 作者之間的直接聯繫越緊密,反之,直徑越長代表該 SCC 中的作者 間聯繫,多半得透過間接的串連。在鉅視圖像中,我們是用以 SCC 的圓心為起點,所畫出的直線長短來代表各該 SCC 的直徑程度。

(11)

SCC 的聲望階序

一個 SCC 的聲望階序是用來測量其中各 個作者的聲望高低程度的差異情形,若 SCC 中作者聲望高低程度相 差極為明顯(即有垂直階層化之傾向),則 SCC 的聲望階序就會很明 顯,反之,若 SCC 中作者聲望高低程度相差無幾(即有水平化之傾 向),則 SCC 的聲望階序就不明顯。我們在鉅視的圖像中,以代表 SCC 之直徑的直線與十二點鐘方向的假想線之間的夾角,代表 SCC 的聲望階序。夾角越大,反映出 SCC 的聲望階序越明顯,反之,夾 角越小,則反映出 SCC 的聲望階序越不明顯,即作者間享有類似的 聲望。讀者可以想像,這樣的圖像,事實上,是說明了作者之間可能 往往是相互回應文章的。 圖一是我們在 2002 年 4 月 23 日至 4 月 27 日之間,從 sci.logic 這個新聞群組,擷取在這段期間所有在其上張貼文章之相互回應所得 之聯繫情況,我們將這些聯繫轉化為作者之間的關係網絡圖。圖一即 我們之前所提及之微視的圖像。圖一的社會網絡分析圖很清楚的顯 示:在 sci.logic 這個新聞群組中,有兩大完全分離的「次團體」。其 中多產的作者(經常在其上張貼文章者)很容易即可看出(因為有著 較大的節點),聲望較高的作者(文章經常被回應或指涉者),也很容 易被指認出來(因為有較深的灰階色)。在 SCC 邊界外的單箭頭連結 線代表單向而非雙向的連結關係(即被箭頭射中者,並沒有直接或間 接地對箭頭射出者做出回應),若曾張貼文章的作者,從來都沒有受 到任何的回應或指涉,則這些作者在圖中的顯現方式是:沒有任何連 結線連到的「孤立節點」。圖二則是圖一的鉅視圖像。圖二的節點代 表每一個 SCC,而連結現代表 SCC 之間的關係連結情況。圖二當中 的兩個大節點,就是上述之兩大完全分離的次團體(即 SCC)。兩者 的尺寸大小一模一樣(各有九位作者成員),但其中之一有著較深的 灰階色彩,意味著這個 SCC 的成員之間,有著較為頻繁的互相回應 或指涉。在圖二中,我們將圖一看似凌亂的關係模式加以「有秩序」 的整理,亦即將「孤立節點」和「曾回應或指涉其他作者文章但未曾 被回應或指涉者」,放在圖二的最左端;曾經回應或指涉其他作者文 章,同時也被回應或指涉者放在中間;那些不曾回應或指涉其他作者 文章但曾被回應或指涉者,放在右端。這樣整理的理由是:讀者可以

(12)

較清楚的看出此新聞群組作者之間連結關係的層級與次序(rank and order)。圖三則是進一步將圖二加以整理而成的總結關係結構圖。圖 三顯示一種典型的,在所有有關網頁間「超連結」關係結構的樣態, 一般稱做「蝴蝶結」(bow-knot structure)的結構模式(Broder, Kumar, Maghoul, Raghavan, Rajagopalan, Stata, Tomkins and Wiener, 2000)。一 般而言,「蝴蝶結」的核心元件是一個巨大的 SCC(本文的例子,則 顯現有兩個一般大的 SCC),加上其他三個元件,分別是:孤立節點 (singleton)、來源節點(the source nodes)和去向節點(the sink nodes)。根 據經驗資料,這四個元件會各佔四分之一左右的新聞群組參與者。亦 即,在任一新聞群組中,一般會有四分之一左右的作者,彼此之間牽 來覆去,形成一個意見集團;另有四分之一的作者,則如鬼影一般在 裡面晃來晃去,不理別人,別人也不理睬他們;再有四分之一左右的 作者,則是拼命的回應別人的文章,但少有人理睬他們;最又也有大 約四分之一左右的作者的文章,經常是別的作者回應的對象,但他們 從來只顧張貼自自己的文章,而不顧他人的反應。綜合圖一至圖三的 所有視覺化的訊息,讀者將能很清晰而快捷的掌握住一個社會網絡關 係的結構。 (此處為圖一) (此處為圖二) (此處為圖三)

六、新聞群組做為社會網絡的探討

我們所發展的瀏覽器允許使用者利用視覺化以及互動式的社會 網絡的關係矩陣來探索新聞群組。特別值得一提的是:使用者可以輕 易地在一個新聞群組中指認出其中的 SCC,並且標示出那些聲望較高 的作者(類似意見領袖的尋找)。使用者只需以滑鼠點按在節點上,

(13)

即可發現該作者所張貼過的所有文章,並且找到已被大量回應的「熱」 文章。使用者只需知道哪些是經常被提及或回應的作者,然後讀取各 該「領袖作者」引人注目的少許文章,使用者將能立即明瞭當前最熱 的話題為何。對於那些「後來者」而言,這些功能將能適時幫助他們 很快地抓住並參與最吵雜也最受歡迎的新聞群組。一般而言,一個社 會網絡關係網中,散兵遊勇總是多於結成一體的 SCC,因此將注意力 放在 SCC 裡,應該可以比較節省時間和精力,而且比較能夠有效地 找到令人感興趣的議題或話題。 圖四所顯示的電腦螢幕樣式,是用來說明以上的探索過程。圖 四右半邊是主視窗的圖示,該圖示提供範例新聞群組(sci.logic)所形成 之社會網絡的詳細的微視圖樣。我們檢視第十二個 SCC(SCC012)及 其所有的進出串連連線。電腦螢幕的左半邊則是另一個視窗,該視窗 列出 SCC012 的所有作者名單。我們選取其中一位擁有較高聲望者, 並發現他共張貼了六篇文章。如果進一步選取其中一篇文章,則該篇 文章的內容會顯示在螢幕左半邊中間的視窗當中。依此類推,使用者 即可一步一步對此社會網絡(由新聞群組所構成)的結構,進行深入 的解析。 (此處為圖四)

七、未來展望

使用「連結」作為「背書」的概念想法,在網際網路發展之初 即已有之,並不是新穎的創意。很多網頁搜尋技術就是立基於這樣的 概 念 想 法 (Kleinberg, 1998) 。 而 使 用 固 定 機 率 向 量 (Stationary probability vector)作為一些社會實體(Social entities)之聲望高低程度 的指標,也不是新鮮之事。五十多年前美國的一些社會學家即已倡議 相似的概念想法 (Wasserman and Faust, 1994)。我們的軟體分析系統 即是根據這兩項學術傳統所發展而來,以新聞群組的結構組成,說明 如何運用我們這套網路社會網路分析系統來進行「超連結網絡分

(14)

回顧文獻,Smith and Fiore (2001)在 Netscan 中運用搜尋和視覺 化的技術,幫助使用者參與新聞群組的討論。他們將作者依據其所張 貼的文章數和被回應的次數進行排名,在我們的系統中,則是根據作 者們之間的互動關係連結所形成的關係矩陣所引伸出來的聲望向 量,以幫助使用者指認出在一些次團體中的意見領袖。此外,Donath and Karahalios(1999) 所 發 展 的 Loom , 以 及 Sack(2000) 所 發 展 的 Conversation Map 等系統,以都嘗試視覺化新聞群組。這兩套系統基 本上都是根據文章之間的相互引述來連結所有的作者。然而,目前為 止,只有我們所發展的這套軟體系統,具有將這些原先扭結在一起的 相互引述,分解成一些緊相連子圖(SCC)的功能,而且能分別分析這 些緊相連子圖,以尋找其社會網絡機制。目前我們所發展的系統還在 Stand-alone Java 的應用層面,將來如果能發展成以網頁為基底的系 統模式,則使用者介面(user interface)、分析器(analyzer)、及資料來源 (data source)三者就可以模組化的方式,整合成為一獨立完整的軟體 元件系統。如此一來,這套以分析網路社會的社會結構的以網頁為基 底的軟體系統,將能夠被用來分析任何電腦中介的溝通系統(CMC system),例如:e-mail lists 等等。 嚴格來講,雖然我們的系統已有一定之功能水準,但下列一些 有關社會網絡分析的核心議題,仍尚未能完備地回答,例如:第一、 有意義的溝通關係,真的能經由超連結而被維持或傳遞嗎?有沒有經 超連結而形成的結構化的「資訊流」這樣的東西存在,而能夠聯繫祝 個人、組織與國家等實體?超連結所形成的資訊流通管道(如果確實 存在的話),與線上(online)或線下(offline)的其他管道有何異同之處? 彼此之間又有何連結樣態呢?第二、超連結網絡關係如何能夠細緻地 連結多樣化的線上或線下連結關係呢?超連結網絡關係真的能夠反 映出物理實體世界的社會網絡關係嗎?第三、文化上的差異會不會影 響到網站或網頁間的超連結網絡結構?第四、一個網站或網頁在一個 超連結網絡結構上的位置,意味著什麼意義?其中心度的測量(例 如:in/out degree, betweenness, and closeness)告訴我們什麼訊息?我 們 需 不 需 要 發 展 新 的 測 量 以 量 度 信 用 度 (credibility) 、 聲 望 度 reputation)、或品質(quality)?最後,為什麼一個網頁或網站會與某一

(15)

特定的網頁或網站進行超連結,本身就是值得深究的網路現象,什麼 因素導致一個網頁或網站現在或未來可能增加或減少的連結?什麼 樣狀況下決定與其他網頁或網站進行超連結?什麼樣的考量牽涉其 中?這些未解的問題,在過往的研究中,並未受到應有的注意。因此, 未來的研究取向,需針對這些與超連結之特性與本質相關連的未解的 問題,深入探討。

參考文獻

Abello, J., P. M. Pardalos, & M. G. Resende. “On maximum clique problems in very large graphs,” Research Technical Report: TR 98.

32. 1, AT&T Labs, Oct. 1998.

AT&T Research Labs. “Graphviz – Open Source Graph Drawing Software,” <http://www.research.att.com/sw/tools/graphviz/>.

Broder, A., R. Kumar, F. Maghoul, P. Raghavan, S. Rajagopalan, R. Stata, A. Tomkins, & J. Wiener(2000). “Graph structure in the Web,”

Computer Networks, 33(1-6): 309-320.

Garton, L., C. Haythornthwaite, & B. Wellman(1997). “Studying online social networks,” Journal of Computer-Mediated Communication,

3(1). Retrieved September 19, 2000 from:

http://www.ascusc.org/jcmc/vol3/issue1/garon.htm

Donath, J., K. Karahalios & F. Viega. “Visualizing conversation,” In 32nd Annual Hawaii International Conference on Systems Sciences,. Maui, Hawaii, USA, Jan. 1999. IEEE Computer Society.

<http://www.computer.org/proceedings/hicss/0001/000012/00001202 3abs.htm>.

Horton M.& R. Adams(1987). “Standard for interchange of USENET messages,” RFC 1036. (http://www.ietf.org/rfc/rfc1036.txt)

IBM Almaden Research Center. “Campfire Home Page,” http:/www.almaden.ibm.com/csk53/camfire.html

Kleinberg J. M.(1998) “Authoritative sources in a hyperlinked environment,” In Proceedings of 9th Annual ACM-SIAM Symposium on Discrete Algorithms, pages 668-677. San Francisco, California Kumar, R., P. Raghavan, S. Rajagopalan, & A. Tomkins(1999).

(16)

“Trawling the Web for emerging cyber-communities,” Computer

Networks, 31(11-16): 1481-1493.

Sack, W.(2000) “Conversion map: An interface for very-large-scale conversions,” Journal of Information Management Systems, 17(3): 73-92. System online at http://www.sims.berkeley.edu/sack/cm

Smith M. A. & A. T. Fiore(2001) “Visualization components for persistent conversions,” In Proceedings of the SIGCHI on Human Factors in Computing Systems, pages 136-143. Seattle, Washington, March – April 2001. ACM.

http:/doi.acm.org/10.1145/365024.365073

Wasserman S. & K. Faust(1994). Socila Network Analysis: Methods and

(17)
(18)

圖二 SCCs and inter-SCC connections in newsgroup sci.logic

(19)

圖三 Singleton, source, and sink nodes are combined, respectively

(redrawn from 圖二). Together with the core SCCs, they form a “bow-tie” structure.

(20)

【回應討論】資訊與社會在方法上的結合

翟本瑞

南華大學社會所教授 M.Granovetter 及 B.Wellman 等人關於社會網絡的研究,早已成 為一個獨立的分析取向,不但能對特定人際關係加以探究,更能對關 係強度及社會結構予以量化處理,清楚顯示人際關係網胳圖。網胳不 必然要與既存在時、空上清楚標定的血緣、鄰里、親族等關係一致, 也不必是我們所熟知的社區、社群關係,不同文化的成員,依其社會 特性,具有不同的社會關係網胳。 累積三十年的研究,不論是強聯繫、中介聯繫抑或是弱聯繫,社 會網絡研究都可以具體地分析諸多社會關係。在網路文化快速發展之 際,Wellman等人也針對虛擬社區間的人際關係是否具備網絡特性加 以討論。虛擬社區中有著什麼樣的支援關係?網路如何能影響人們建 立持久性的弱聯繫?網友為何會對陌生人伸出援手?網路上是否能 建立相互的權利、義務關係,並發展出特定的規範來?網上親蜜關係 能夠強到什麼程度?虛擬社區對真實生活的涉入程度能有多高?網 路活動能夠豐富社區聯帶的多元性,以及整合度嗎?虛擬社區是否如 同真實社區一般實在?2這些問題當然可以有不同的回答,但是,線 上人際關係具有如同真實世界般的網絡結構則是不容置疑的,網胳分 析的確可以用在關於線上人際關係的研究。 在網路文化研究尚未普及之前,關於線上人際關係的研究取向, 主要是以傳播學界所發展出的「電腦媒介溝通」為主流,當社會學家 注意到線上關係之後,社會網絡研究自然就成為檢証此一議題的接合 2

Wellman, Barry & Milena Gulia(1999),“Net-Surfers Don’t Ride Alone:Virtual Communities as Communities," pp331-367 in Barry Wellman (ed.)Networks in the

(21)

點。尤其是,藉網絡研究來比較線上關係與真實社會中的關係之異

同,是學界所關心的議題。3

然而,當線上活動愈益複雜化,單單依憑傳統網絡分析的研究方 法,不一定能更深刻地掌握線上關係,尤其在關係強弱程度上,更是 不容易分辨。這時,我們需要一套符合網路特性的新研究方法。

吳齊殷與莊庭瑞博士藉由 AT&T 所發展出的 Grsphviz 和 Grapa Java package,將新聞群組視覺化成社會網絡的關係圖,以掌握不同 新聞群組間的關係結構差異,並將其間的強度以視覺化方式呈現出 來。藉由此工具,對特定新聞群組間的人際關係,可以進行比較研究, 也可以分析個體的關係網絡圖,本系統是國內第一次發展出來用研究 線上關係的相關工具,深具實用價值。 當然,相關構想,並不一定限於社會關係的網絡分析。過去,社 會科學與資訊科學研究人員間的互動關係並不密切,在選取研究方法 時,往往只能遷就現有方法,無法自行設計所需的研究工具。尤其是, 社會科學研究人員在程式設計以及模組規劃上,往往有著較多的限 制,以致於很難將自己在研究上的需求具體落實,以發展出新而且合 用的工具,進行深入的研究。這種情形在針對傳統研究議題上,問題 還不算太大,採用傳統研究方法所進行的多數研究,往往也還算有 效,研究者因此也就習慣接受既有套裝軟體來進行研究。 吳齊殷與莊庭瑞此一設計,提供了一個範例,在社會科學面對新 議題與新研究對象時,設計出全新的工具,利用網路與資訊科技的特 性,並結合傳統研究取向,提出新而有效的分析模式。雖然,利用此 一系統,要如何考驗並推論相關議題仍有待進一步檢視,但本文可說 是一個成功的例子,結合不同學門,共同發展出新的分析工具。或許, 關心網路研究的朋友,應該主動與資訊科技學界往來合作。 本文走出了第一步,未來仍有許多發展空間! 3 除了Wellman的研究外,國內學者羅家德亦曾進行相關討論。參見Yeh, Yung-Chu & Jar-Der Luo(2001), “Are Virtual Social Relationships Independent from Reality?” 《資訊社會研究》1: 33-55。

(22)

Hyperlinking Network Analysis:

A New Approach to Analyze Social Network

Structure.

Chy-In Wu

Tyng-Ruey Chuang

Institute of Sociology Academia Sinica

Institute of Information Science Academia Sinica

Abstract

Computer-mediated communication (CMC) systems such as Usenet newsgroups, e-mail lists, online chats, etc. facilitate large-scale human interactions and produce large sets of activity records. These datasets can be used to analyze and visualize the social networks exist at the online forums. Such analyses often improve our understanding of online inter-personal interactions, as well as lead to better designs and implementations of CMC systems.

We report in this paper our experience in designing a newsgroup browser based on ideas from social network analysis. Our analyzer identifies reciprocal sub-groups in newsgroup discussions, and utilizes visual methods to help users look for leading authors and provocative articles. This is especially helpful for late comers to catch up and participate in popular and noisy newsgroups.

參考文獻

相關文件

網站首頁請設定為 index.php 或 index.htm,並製作超連結,連結到 各題之作答結果,且將 Internet Explorer

Chang, Sym- metric Mendelsohn triple systems and large sets of disjoint Mendelsohn triple systems, in Combinatorial de- signs and applications (Lecture Notes in Pure and

Step 4: : :模擬結果分析 : 模擬結果分析 模擬結果分析(脈寬為 模擬結果分析 脈寬為 脈寬為90%) 脈寬為.

方法一: 採用 【Compare Means】分析選項 One- One -way ANOVA way ANOVA分析報表說明 分析報表說明

新媒體定義 網絡形象 網絡言行 網絡自保 網絡交友 網絡法律 網絡欺凌 沉迷上網

We will quickly discuss some examples and show both types of optimization methods are useful for linear classification.. Chih-Jen Lin (National Taiwan Univ.) 16

◦ Disallow tasks in the production prio rity band to preempt one another.... Jobs

An instance associated with ≥ 2 labels e.g., a video shot includes several concepts Large-scale Data. SVM cannot handle large sets if using kernels