• 沒有找到結果。

複雜網路中橋接式與強鍵式連結之偵測、分析與應用

N/A
N/A
Protected

Academic year: 2021

Share "複雜網路中橋接式與強鍵式連結之偵測、分析與應用"

Copied!
99
0
0

加載中.... (立即查看全文)

全文

(1)

國立

國立

國立

國立交通大學

交通大學

交通大學

交通大學

多媒體工程研究所

碩士論文

複雜網路中橋接式與強鍵式連結之偵測、

分析與應用

Bridge and Bond Link in Complex Networks:

Detection, Analysis and Applications

研 究 生:黃全榮

指導老師:孫春在 教授

中華民國

中華民國

中華民國

中華民國 九十九

九十九

九十九

九十九 年

年六

六月

(2)

複雜網路中橋接式與強鍵式連結之偵測、分析與應

用 Bridge and Bond Link in Complex Networks: Detection, Analysis and

Applications

研 究 生:黃全榮 Student:Chuan-Jung Huang 指導老師:孫春在 Advisor:Dr. Chuen-Tsai Sun

國 立 交 通 大 學

多 媒 體 工 程 研 究 所

碩 士 論 文

A Thesis

Submitted to Institute of Multimedia Engineering College of Computer Science

National Chiao Tung University in partial Fulfillment of the Requirements

for the Degree of Master

In

Computer Science

June 2010

Hsinchu, Taiwan, Republic of China

中華民國

中華民國

中華民國

(3)

複雜網路中橋接式與強鍵式連結的偵測

複雜網路中橋接式與強鍵式連結的偵測

複雜網路中橋接式與強鍵式連結的偵測

複雜網路中橋接式與強鍵式連結的偵測、

、分析與應用

分析與應用

分析與應用

分析與應用

學生:黃全榮 指導教授:孫春在 博士

國立交通大學

多媒體工程研究所

中文摘要

中文摘要

中文摘要

中文摘要

強弱連結是分析複雜網路的核心概念之一。然而,先前的研究對於網路連結 強弱的定義面臨兩種挑戰:一、對於模糊不清的強弱定義,在應用上認定困難。 二、雖然嚴格定義了強弱的界線,卻以非強即弱的判斷方式區分連結性質,未能 反映許多真實網路的性質。我們強調複雜網路具有階層性質,並認為複雜網路中 的連結在不同階層時具有不同的特性,有些連結對於區域訊息傳遞具有較大的影 響力,但是對於全域訊息傳遞的影響力較低;有些連結對於區域到全域的訊息傳 遞都極具影響力。 為了避免在量化連結性質時模糊不清的強弱定義或非強即弱的判斷方式,我 們基於連結特性提出了橋接式與強鍵式連結的概念,並且設計一套偵測演算法, 該演算法能夠依據拓樸與統計上的意義偵測出某特定連結在不同網路階層中所 具有的性質。在分析之後,我們將連結分為下列四種類型:全域橋接式連結、N 階橋接式連結、強鍵式連結和沉沒橋接式連結。以此為基礎,我們觀察三種不同 類型真實網路中連結在不同階層時具有的性質,瞭解網路中每一條連結從區域觀 點到全域觀點的性質變化,並且依據演算法將連結分成不同類型。藉由這些不同

(4)

類型的連結在網路中存在的比例,我們能夠描述網路的拓樸性質與動態特性。 最後,我們以連結的階層性質與連結類型分佈比例為基礎提出了三個應用: 一、尋找網路中的社群結構。二、真實網路分群。三、分析真實網路與理論網路 在拓樸架構上的相似性。實驗結果顯示,本研究提出的概念除了在這些應用上得 到不錯的結果之外,更能夠以一致的概念與方法解決不同的問題,說明了掌握連 結的階層性質能夠給予研究學者在網路拓樸架構的建構或演化原理上更深入的 瞭解。 關鍵詞 關鍵詞 關鍵詞 關鍵詞::::強弱連結強弱連結強弱連結、強弱連結、、複雜網路、複雜網路、複雜網路複雜網路、、分群、分群分群、分群、、社群結構、社群結構社群結構 社群結構

(5)

Bridge and Bond Link in Complex Networks: Detection,

Analysis and Applications

Student:Chuan-Jung Huang Advisor:Dr. Chuen-Tsai Sun

Institute of Multimedia Engineering National Chiao-Tung University

Abstract

A concept of strong-ties and weak-ties played an important role in

complex network studies. However, different researcher would face following problem in defining strong or weak of links: (1) Ambiguous definition

between strong and weak, and (2) Clear definition of limit between strong and weak but link is either strong-tie or weak tie (dichotomy method). We considered that characteristic of links varies in different network layers (hierarchy property). Some links have obvious influence on information transmission in local area, but have no effect on information transmission in global scale; and some link have significant influence on information

transmission from local to global scale.

To avoid ambiguous definition and dichotomy method when quantifying links, we applied characteristic of links to propose the concept of bridge link and bond link, and designed an algorism which can detect varies

characteristic of links in the different network layers according to topology properties and statistically significant, then classify links into four types:

(6)

Global bridge link, N degree bridge link, Bond link, and Sink bridge link. In this paper, we observed the characteristic of links in different layers under three real networks, and realized variation in properties of every links from local to global view, then classified links into different types according to the algorism. We can describe the topology structure and specific dynamic properties of networks by means of the proportion of different link types.

Ultimately, we proposed three applications based on hierarchy property of links and the proportion of different link types: (1) find community

structure in complex network; (2) complex network clustering; (3) analyzing the correlation between real-world network and theoretic network on

topology structure. The results demonstrated that the concept we proposed not only led to decent results on these applications, but also resolved different problems with the consistent methodology. By analyzing and realizing

hierarchy property of links, researchers in many fields of science will have a better understanding of design principle or evolution principle beyond complex network.

Keywords::::strong-ties and weak-ties, complex network, clustering,

(7)

誌 謝

在許多人的協助之下完成了這篇研究論文,首先要感謝我的母親總是默默的 支持我與鼓勵我,讓我在兩年的碩士生涯中沒有後顧之憂。接著要感謝我的指導 教授孫春在先生,在孫老師的帶領下,我學習到什麼是「作研究」,使我瞭解一 篇論文不只是在解決研究問題,更是要瞭解研究的動機和研究的重要性與貢獻, 並且能夠完整的呈現一篇論文的價值所在。然後要感謝我的老師兼學長黃崇源先 生,從研究問題的產生、實驗方法與數據分析都給了我非常多的建議與指導,除 了研究上的指導之外,在人生規劃與生活態度上也給予我許多方向與意見,讓我 更清楚未來的目標。 感謝口試委員項潔教授、曾憲雄教授以及陳穎平教授,在口試的過程中給予 我許多建議與指導,使得本篇研究論文能夠趨於完善。 感謝實驗室的學長,宇軒、聖文、王豪、宜睿、基成和立先,在口試投影片 的呈現與製作上給予了很多意見,使得我在口試報告時能夠更事半功倍。也感謝 實驗室碩二的同伴們,壯為、嘉宏、璽文、謹譽、泰源和柏志,大家在作研究的 日子裡互相鼓勵與協助,是一群不可缺少的好夥伴。也要感謝實驗室的學弟妹們, 偉存、誌宏、承宏、景照、皓琮和順貞,無論是在課業上或是生活上的幫忙,能 讓我省下了許多時間,可以將心力完全放在研究上。感謝學習科技實驗室的每一 位同學,讓實驗室的氣氛非常的融洽,是完成論文寫作的原動力。在此,致上最 深的謝意。

(8)

目錄

目錄

目錄

目錄

中文摘要... i Abstract... iii 誌謝... v 目錄... vi 表目錄... viii 圖目錄... ix 第一章 緒論... 1 1.1 研究背景... 1 1.2 研究動機... 4 1.3 研究目標... 6 1.4 研究重要性... 7 第二章 文獻探討... 9 2.1 拓樸特性影響複雜網路的行為... 9 2.2 強弱連結... 15 2.3 從局部觀點到整體觀點... 20 2.4 Edge-betweenness 與連結兩端節點的共同朋友 ... 22 第三章 研究方法... 24 3.1 實驗目的與概念描述... 24 3.1.1 連結的「階層」(Hierarchy) ... 26 3.1.2 連結兩端節點的共同朋友... 28 3.2 實驗設計... 30 3.2.1 產生「對應的隨機網路」... 30 3.2.2 判斷連結種類... 31 3.2.3 討論... 36 第四章 研究結果與發現... 37 4.1 理論網路... 37 4.1.1 WS-小世界網路 ... 37 4.2 真實世界網路... 42 4.2.1 社會網路(朋友網路) ... 42 4.2.2 生態網路... 44

(9)

4.2.3 電子電路網路... 47 第五章 演算法穩固分析與應用... 50 5.1 穩固分析... 51 5.2 演算法應用... 56 5.2.1 複雜網路的分群... 56 5.2.2 找尋網路中的社群結構(Community structure) ... 61 第六章 結論... 67 第七章 未來展望... 70 附錄.A ... 72 附錄.B ... 73 附錄.C ... 74 附錄.D ... 75 附錄.E ... 76 附錄 F.資料來源 ... 83 參考文獻... 84

(10)

表目錄

目錄

目錄

目錄

表 1:四種社會網路的拓樸資訊... 43 表 2:七種食物鏈網路的拓樸資訊... 45 表 3:三種電子電路網路的拓樸資訊... 48 表 4:不同連結類型性質整理表... 68 表 5:不同繞線機率下的 WS 小世界網路 ... 76 表 6:不同繞線機率下的 NW 小世界網路 ... 82

(11)

圖目錄

圖目錄

圖目錄

圖目錄

圖 1:連結的影響範圍。... 4 圖 2:連結種類。... 6 圖 3:13 種大小為三節點的基調。... 12 圖 4:產生對應的隨機網路... 12 圖 5:社會網路中的強弱連結。... 15 圖 6:連結強弱與資料複雜度的關係圖。... 17 圖 7:整體中心度示意圖。... 21 圖 8:節點在網路中的位置與中心度關係圖。... 22 圖 9:共同朋友、edge-betweenness 與實際通話量之間的關係。 ... 23 圖 10:階層概念圖。... 27 圖 11:節點 i 延伸一步之後所拜訪到的節點形成 i1。 ... 28 圖 12:共同朋友。... 28 圖 13:共同朋友概念圖。... 29 圖 14:實驗流程圖。... 30 圖 15:交換演算法示意圖。... 31 圖 16:演算法流程圖... 33 圖 17:WS-Small world, N=100, <k>=4。 ... 38 圖 18:WS-Small world, N=100, <k>=8。 ... 38 圖 19:WS-Small world, N=100, <k>=16。 ... 39 圖 20:WS-Small world, N=100, <k>=32。 ... 39 圖 21:WS-Small world, N=100, <k>=64。 ... 39 圖 22:四種社會網路連結種類分佈結果統計圖。... 43 圖 23:七種食物鏈網路連結種類分佈結果統計圖。... 46

圖 24:Trophic food chain(TFC)。 ... 46

圖 25: Bridge Brook Lake 的食物鏈網路示意圖。... 47

圖 26:三種電子電路網路中連結種類分佈結果統計圖。... 48 圖 27:s208 的電子電路網路拓樸架構示意圖。 ... 49 圖 28:演算法判斷失真網路的比對正確率統計圖。... 51 圖 29:移除連結事件下,「一階強鍵式連結」的比對正確率。... 54 圖 30:移除連結事件下,「全域橋接式連結」的比對正確率... 55 圖 31:移除連結事件下,「其他連結」的比對正確率... 55 圖 32:四種社會網路在分群指標下的相關性(C=0.9~0.99)。 ... 58 圖 33:七種食物鏈網路在分群指標下的相關性(C=0.62~0.99)。 ... 58 圖 34:三種電子電路網路在分群指標下的相關性(C=0.7~0.92)。 ... 58 圖 35:14 種網路彼此之間的相關係數矩陣視覺圖。... 59

(12)

圖 36:14 種複雜網路與理論網路之間的相關係數矩陣視覺圖。... 60 圖 37:具有社群結構的簡單網路。... 61 圖 38:Zachary 研究美國某大學空手道俱樂部成員互動網路。 ... 63 圖 39:GN 演算法分析 Zachary 網路的結果。 ... 63 圖 40:經由找尋網路中社群架構步驟所得到的樹狀圖。... 64 圖 41:本研究所提出的演算法分析 Zachary 網路的結果。 ... 65 圖 42:共同朋友與連結方向性。... 70 圖 43:共同朋友與連結權重值。... 71 圖 44:傳播速率圖。... 73 圖 45:不同性質的社會資本混合下所產生不同型態的社會。... 74 圖 46:共同朋友比例。... 75 圖 47:WS-small world, N=100, p=2%。 ... 77 圖 48:WS-small world, N=100, p=4% ... 77 圖 49:WS-small world, N=100, p=8%。 ... 78 圖 50:WS-small world, N=100, p=16%。 ... 78 圖 51:WS-small world, N=100, p=32%。 ... 78 圖 52:WS-small world, N=100, p=64%。 ... 79 圖 53:NW-small world, N=100, p=2%。 ... 80 圖 54:NW-small world, N=100, p=4%。 ... 80 圖 55:NW-small world, N=100, p=8%。 ... 80 圖 56:NW-small world, N=100, p=16%。 ... 81 圖 57:NW-small world, N=100, p=32%。 ... 81 圖 58:NW-small world, N=100, p=64%。 ... 81

(13)

第一章

第一章

第一章

第一章 緒論

緒論

緒論

緒論

1.1 研究背景

研究背景

研究背景

研究背景

複雜性科學是當前科學發展的焦點與前沿,其理論研究與實務應用正在向各 個學科領域滲透,成為一門蓬勃發展且受到眾多科學家關注的跨領域學科。複雜 系統涉及的範圍非常廣闊,包括自然、工程、生物、經濟、管理、政治與社會等 各個方面;從一個細胞呈現出來的生命現象,到經濟股票市場的漲落、城市交通 運輸的管理、自然災害的預測與預防,乃至社會國家的興衰等等。由於各個學科 領域對於複雜性的認識和理解都不大相同,所以學術研究人員為了避開專有名詞 的爭論,遂採用「複雜系統」來代表在變化無常的活動中,所浮現出的某種秩序, 其中的演化、湧現、自組織、自適應、自相似現象被認為是複雜系統共同且重要 的特徵。 複雜系統是一個由多個簡單單元所組成的結構。一般來說,複雜系統最特別 的地方就是這些簡單單元之間會經由非線性的交互作用,而產生集體的行為。為 了瞭解複雜網路中個體互相影響之後產生的集體行為,許多統計上和數學上的工 具已經被發展出來,進而幫助複雜系統的研究。在過去幾年的研究當中對於複雜 系統的瞭解有重大的發展,其原因有:第一、資料收集或取得容易,可建立大型 資料庫;第二、電腦的計算能力日益強大,能夠將收集的資料做大型的模擬;第 三、跨領域的研究使得各個領域互通方便,能夠互相存取研究結果;第四、越來 越多簡化的方法,能夠去瞭解整個複雜系統的動態行為。 複雜系統中的集體行為可以在空間或時間上表現為圖形化的結構。網路是現 代複雜科學中重要的研究工具之一,許多複雜系統能夠簡化成網路的方式展現, 使我們能夠藉由複雜系統的拓樸形式去瞭解個體間互相影響後所產生的集體行 為。譬如說,當在研究社會現象或是瞭解輿論和八卦是如何在社會上傳播時,我 們可以將人簡化成節點,人與人之間的社交關係則簡化成為連結;當在研究某個

(14)

地區的生態系為何發生物種間的消長或滅絕時,我們可將物種簡化成節點,物種 間食物鏈的關係簡化成連結;當在研究網際網路架構如何影響資訊傳播路徑或是 網路安全時,我們可將路由器簡化成節點,實體線路則簡化成連結。不同的複雜 系統都有各自不同的意義,但是當其表示成複雜網路時,都能夠以拓樸的角度來 探討其所發生的各種現象,因此複雜網路本身已經成為新興科學中相當重要的研 究領域。 複雜網路中最重要的基礎元素就是連結。連結代表了複雜網路中個體間資訊 流動的途徑,而這些途徑勾勒出複雜網路所呈現的拓樸形式會直接影響到複雜網 路的動態行為,舉例來說,複雜網路的分隔度、群聚度與階層結構都會影響到複 雜 網 路 所 產 生 的 現 象 (Clauset, Moore & Newman, 2008; Dakker, 2007; Newman, 2003),網路中存在具有功能性的基調(motifs)對於網路中的訊息傳遞 提供了合適的拓樸架構(Artzy-Randrup, Fleishman, Ben-Tal & Stone, 2004; Huang, Cheng & Sun, 2007; Milo et al., 2002; Milo et al., 2004)。Granovetter 提 出了弱連結(weak tie)與強連結(strong tie)的概念,他的『找工作』實驗說明了 弱連結對於複雜網路中資訊的傳遞扮演了極為重要的角色(Granovetter, 1973; Papakyriazis & Boudourides, 2001),它能夠對於網路中的群體帶來新的資訊以 及將資訊傳到更廣的範圍;此外,某些研究也指出弱連結對於複雜網路有穩定性 的作用(Csermely, 2006; McCann, Hastings & Huxel, 1998),當網路發生危難或 是被攻擊,只要大部分弱連結還能夠存在,整體網路還是能夠維持運作而不至於 崩潰。相反地,強連結對於資訊的傳遞較為不重要,但是對於複雜網路中的群體 或社群中個體間的資訊交流有著重要的影響。這些強連結能夠維持群體中個體間 的緊密關係,個體不會輕易的消失或離開於此群體。舉例來說,社會網路上充滿 了許多群體,學校中的班級、公司中的部門或是國家內的政黨等等,這些群體內 的成員彼此間都有共同的目標、話題甚至是文化。強連結的作用在於將這些共同 的資訊保留在群體中,維持群體中的同質性。

(15)

類似強弱連結的概念也在 Putnam 提出橋接型社會資本和強鍵型社會資本 中找到類似的看法(Putnam, 2000),他認為橋接型社會資本屬於外展型,能夠包 含分屬不同全體的人們,能夠為群體帶來新的資訊與機會。另外,強鍵型社會資 本則屬於內聚型,傾向於強化排他性認同與同質性團體,群體中的成員彼此間能 夠提供較多支持與鼓勵。對於家族企業的公司或是集團中,若是能夠擁有強鍵型 社會資本,則個體更有機會在團體中獲得較好的職位或是職薪。 Hansen 利用了社會網路中強弱連結的概念與知識複雜程度的觀念去探討組 織中的各個子單位要交換或分享知識時,單位間的連結特性會造成什麼樣的影響 (Hansen, 1999)。他的研究發現組織中無論是強連截或是弱連結都能夠導致這些 知識能夠有效的分享於單位之間,強連結和弱連結在知識分享時,對於知識的搜 尋與傳遞均有優缺點。當知識的複雜程度較高時,弱連結會造成知識在傳遞時的 阻礙,但是無論知識的複雜程度高或低,弱連結均會降低知識的搜尋時間。反觀 強連結對於知識的搜尋沒有直接的幫助,但是當知識的複雜程度較高時,能夠有 效的傳達知識到目的地。因此,經由這些研究結果我們可以知道強連結和弱連結 在複雜網路當中各自擁有存在的功能與目的,對於網路來說兩種類型的連結都有 其重要性。 以往在研究複雜網路時,大部分主要是聚焦在節點的特性上,想要瞭解哪一 些節點居於網路核心的位置並且對於整體網路最具有影響力。值得注意的是,我 們能夠從節點的區域特性(節點的分支度,degree)向外分析到全域特性(節點的接 近性,closeness)。但是對於網路中節點間的溝通管道—連結,卻沒有從區域到全 域式的探討。因此,在這篇研究論文當中將提出一套演算法能夠以不同網路尺度 的觀點來分析網路中的連結,藉此瞭解每一條連結在網路中所扮演的角色。

(16)

1.2 研究動機

研究動機

研究動機

研究動機

在以往研究中鮮少對於複雜網路中的強弱連結有清楚地定義,更重要的是對 於強弱連結的區分也總是非強即弱的二分法。但是由網路層級的觀點來看,連結 在不同層級的網路觀點中所具有的強弱性質也有所不同。也就是說,有些連結對 於複雜網路中某個區域的訊息傳遞相當重要,但是對於整體複雜網路的資訊傳遞 的影響卻不大;有些連結從區域到全域的訊息傳遞都具有相當大的影響力。舉例 來說,以圖 1 中的網路為例,對於圖 1.(a)來說,此網路的藍色連結對於訊息傳 遞有較大的影響力。但當考慮圖 1.(b)的多層級網路時,藍色連結的影響力限制 在綠色或黃色節點所形成的子網路當中,而紅色連結卻對於整體網路的資訊傳遞 擁有決定性的影響,一旦紅色連結消失,那麼黃色節點的資訊永遠不能傳遞到綠 色節點,使得兩個子網路完全分離。另外,(a)、(b)兩圖中的黑色連結對於訊息 傳遞都不具太大的影響力。 圖 1:連結的影響範圍。 因此複雜網路中的連結所扮演的角色會隨著網路層級的不同而有所不同,並不是 以往認為的非強即弱的這種二分法。此外,許多研究已經證明了複雜網路是具有 階層(hierarchy)性質的(Clauset et al., 2008),然而,以某連結為中心向外延伸之 後,此連結在不同階層之下的影響力是會消退或是增長,這樣的問題仍需要被解 決(Goyal, 2008)。 過去對於複雜網路的研究當中,若是節點之間有連結,都會參考此連結背景

(17)

特 性 (domain-specific) 的 意 義 , 並 且 找 尋 不 同 的 方 式 量 化 這 些 特 性 (Barrat, Barthélemy, Pastor-Satorras & Vespignani, 2004; Papakyriazis & Boudourides, 2001; Onnela et al., 2007) 。舉例來說,雖然性關係網路和生態網都是複雜網路, 但是在性關係網路中,兩節點若有性關係,那麼就擁有連結;但是想要量化此連 結的背景特性,可能就要紀錄兩節點在一定時間內的性交次數。對於生態網路來 說,兩節點之間若是有“捕食者-獵物”的關係,那麼就擁有連結;但是想要量化 此連結背景特性,可能就要紀錄捕食者在一定時間之內捕食獵物的的數量。對於 這兩種複雜網路來說,除了量化方式大不相同之外,這些紀錄資料的取得或蒐集 都很困難,而且最重要的是這些資料的正確性也難以驗證。 藉由複雜網路的拓樸特性,我們能夠由複雜網路最底層的觀點探討連結的強 弱。更重要的是,複雜網路的拓樸特性使我們能夠使用相同的方式找出不同複雜 網路間共同的特性,目前複雜網路所發現的共同全域拓樸特性有三點:網路平均 路徑短(Small world property)、群聚性高(Highly clustered connection)以及節 點 degree 呈現冪次率分佈(Scale-free phenomenon)(Albert & Barabási, 2002; Goh, Oh, Jeong, Kahng & Kim, 2002; Watts & Strogatz, 1998; Strogatz, 2001)。 經由這些拓樸特性我們可以不必考慮複雜網路的背景物理意義,而直接透過研究 拓樸架構得到這些與網路行為息息相關的拓樸特性;另外更重要的是,這些共同 特性說明了複雜網路的拓樸架構並不是”偶然”產生的,複雜網路的拓樸架構擁有 某種設計原則或演化原則,經由上一節也說明拓樸特性對於複雜網路的行為有著 重要的影響性,因此,我們希望利用拓樸的觀點來研究複雜網路中連結的特性。

(18)

1.3 研究目標

研究目標

研究目標

研究目標

在本研究中,為了要避免強弱連結模糊不清的定義,我們提出橋接式連結 (bridge link)以及強鍵式連結(bond link)的概念。橋接式連結代表網路中兩個群 體間聯繫的力量,它對於遠距離的訊息傳遞有很大的影響力;強鍵式連結則代表 了一個群體中兩個體間的聯繫力量,它對於個體間的互助資源有較大的影響力。 因此,橋接式連結與強鍵式連結在複雜網路中扮演了不同的角色,其影響也大不 相同。根據橋接式/強鍵式連結的概念我們提出一個演算法,它能夠根據拓樸特 性判斷出連結在不同網路層級時所具有的性質,給予橋接式/強鍵式連結拓樸與 統計上的定義。此外我們也依據連結的特性分為:沉沒橋接式連結(Sink bridge link)、N 階橋接式連結(N degree of bridge link) 、全域橋接式連結(global bridge link)以及強鍵式連結(Bond link),代表了此連結對於不同層級所扮演的 角色,能夠讓我們瞭解連結從區域到全域的影響性。全域橋接式連結的存在對於 整體網路的訊息流動或是能量移轉的範圍具有最大的影響力,如圖 2 中的紅色連 結(DE)。強鍵式連結在網路中的群體內呈現較為緊密的出現,對於群體內同質化 有加強的作用,如圖 2 中的黑色連結。N 階橋接式連結對於網路的功能介於全域 橋接式連結與強鍵式連結之間,如圖 2 中的藍色連結(AC,BC,FG,FH)。沉默 橋接式連結是網路中邊緣節點和整體網路連接的邊,如圖 2 的橘色連結(BI ,JG )。 A B C D E F G H I J 圖 2:連結種類。

(19)

本篇研究論文中也分別針對各種理論網路與實際網路,觀察橋接式/強鍵式 連結對於群聚度或分隔度等拓樸特性的影響,能夠更進一步的瞭解各種類型的連 結在這些網路中具有的功能與扮演的角色。

1.4 研究重要性

研究重要性

研究重要性

研究重要性

無論是何種領域的複雜網路,個體展現的行為或是群體發生的現象都會和其 所嵌入的網路形式脫離不了關係。舉例來說,由社會學的觀點來看,我們自己所 建立的人際關係網路會影響到我們生活的各方面,包括了健康狀況、職業選擇或 是個人身份。研究指出,缺乏社會聯繫與社區聯繫的人與接觸面廣泛的人相比, 死亡率更高(Berkman & Syme, 1979);處於團體之間的溝通者或是人際關係良好 的人,通常擁有較高的社會地位。由生態網路的觀點來看,擁有越多食物鏈關係 的物種,在遭遇環境劇變時,能有較高的存活率;缺少食物鏈關係的物種,很可 能因為其他少數物種的遷移或是消失而面臨絕種的危機。就政策制訂而言,利用 複雜網路的拓樸分析能夠預測組織將要發生的現象並且提早做出防範與規劃。複 雜網路中個體間的關係形式更是我們想要探討的重點,我們相信個體之間的相互 作用會直接影響個體本身的行為,因此,本研究探討複雜網路中連結的特性,藉 此看到不同性質的連結在網路中具有什麼樣的影響力。 一旦瞭解了連結從區域到全域對於複雜網路的影響,那麼針對不同的複雜網 路,能夠依據其中連結重要性的不同,提供不同的策略。例如,在一個網際網路 拓樸當中,若是能夠有效判斷橋接式/強鍵式連結,那麼就可以針對那些全域橋 接式連結做加強,使得遠距離資訊能夠到達目的,就可以提昇整體網路的可靠性。 再如傳染病網路的防治,若能針對各類型的連結提供不同的防疫策略,則可以更 具成本效益地控制傳染病的傳播。又如在生態網路的研究上,若是全域橋接式連

(20)

結兩端的物種瀕臨絕種或是被外來種威脅而數量減少時,那麼很可能會影響到整 個生態網路的穩定。因此,藉由我們的演算法的結果,我們能夠提早針對屬於全 域橋接式連結兩端的物種加以保護,讓整個生態網路能夠維持穩定的發展與演 化。 外,找出網路中每一條連結的特性能夠在網路分群或是尋找網路中的社群 (community)上提供更多的資訊,全域橋接式連結將會是網路中主要群體間的連 結,扮演了主要橋樑的作用。同時,藉由不同階層的橋接式連結,能夠逐漸分割 出較小的群體。目前各個科學領域當中都可能存在著複雜網路,藉由本研究所提 出的演算法,我們能夠用一致的方法分析不同的網路中的連結型態。更重要的是, 隨著分析過的網路資料不斷累積,當日後要研究新的複雜網路時,就能借助先前 分析過的網路資料來做比對,若是新的複雜網路與某個已研究過的複雜網路有相 似的連結分佈特性,那麼就能藉由研究先前複雜網路的方式來研究新的複雜網路, 得到加速的效果。

(21)

第二章

第二章

第二章

第二章 文獻探討

文獻探討

文獻探討

文獻探討

依據研究的目標,提出一個利用拓樸性質的演算法能夠判斷出連結在不同網 路階層下的性質,首先章節 2.1 探討複雜網路的拓樸性質是如何影響網路的行為, 以及前人對於拓樸性質的研究方法為何。章節 2.2 討論強弱連結的概念與不同性 質的連結提供網路在運作上何種功能。章節 2.3 藉由前人對於節點的研究導出本 研究希望以微觀到宏觀的角度探討連結性質的目的。最後章節 2.4 探討不同計算 連結權重方式之間的關係,以及 edge-betweenness 與連結兩端節點共同朋友的 差異。藉由本章的文獻探討,除了能夠瞭解前人對於連結特性的研究之外,也能 夠呼應本研究的動機和目標。

2.1 拓樸特性

拓樸特性

拓樸特性

拓樸特性影響複雜網路的行為

影響複雜網路的行為

影響複雜網路的行為

影響複雜網路的行為

自從 Erdos-Renyi 隨機模型在 1960 年代被提出之後,使得許多科學家開始 思考是否複雜網路的背後只是單純的隨機模型?直觀上來看,複雜網路的拓樸形 式必然隱藏了一些重要性質。在從電腦計算能力快速發展之後,對於複雜網路拓 樸性質的研究大量被提出,複雜網路中的小世界現象便是近年來廣為探討的性質 之一,此現象最重要的三個拓樸特性就是下列三點: 1. 分隔度低 分隔度低表示網路中任兩個節點的距離很短。這邊提到的「距離」代表 了兩節點之間最短路徑所經過的連結數。這個性質也就是大家所熟知的小世 界現象,即使是規模很大的複雜網路,其中任意兩節點之間卻具有相對較短 的路徑數。其中最有名的例子就是 Milgram 的六度分隔實驗,他利用信件追 蹤實驗對象的「相識鍊」,最後實驗結果顯示:在美國任兩人之間平均只間隔 六個相識的朋友。這樣的性質也在其他大部分的複雜網路中被發現,例如說, 全球資訊網、電影演員合作網路、生態網路等。

(22)

2. 群聚度高

在自然界中群聚現象是相當常見的現象之一。舉例來說,人際關係網路 之中,大部分的人都會與自己的家人或是熟識的朋友生活在一起而形成群體。 此外,研究顯示許多複雜網路,節點間都會具有密度較高的連結數而形成群 體(Watts & Strogatz, 1998)。

對於群聚度來說,最基礎也是最重要的測量指標就是群聚係數,這個測 量指標用來指出網路中節點和其鄰近節點的緊密程度。在以往的研究當中, 無論是理論網路或是實際網路,計算群聚係數的方法一直都是相當重要的議 題,主要可以分為兩個觀點,全域群聚係數和區域群聚係數。

全域群聚係數為 C =ɶ 三角形個數

連通三節點組個數(Wassermann & Faust , 1994); 連通三節點組(connected triplets of vertices)表示網路中任意三個節點中,其 中一節點與另外兩節點相連。此定義方式是以整體網路為觀察對象,計算出 目標網路的分隔度。

區域群聚係數是 1998 年 Watts 和 Strogatz 所提出用來決定一個圖(graph) 是否為小世界網路的測量數據之一,其定義如下:網路種某一節點 vi的群聚 度 2 ( ) ( )( ( ) 1) i i i i T v C deg v deg v = − ;其中 T(vi)為網路中所有通過vi的三角形個數; deg(vi)為的vi擁有的連結數。整個網路的群聚度為 1 1 n i i C C n = =

ɶ ;其中 n 為此 網路的總節點數。此定義方式是以網路中每個節點為觀察對象,以區域角度 計算出整體網路的分隔度。經由研究結果指出,對於大部分的複雜網路來說, 其分隔度相較於其對應的隨機網路的分隔度明顯地高出許多,這點除了說明 分隔度能夠當作複雜網路的指標之外,也說明了複雜網路並不是單純的隨機 網路。

(23)

3. 節點度(degree)數呈現冪次率分佈 假設節點度數機率分佈函式為 p( k ),表示當隨機選取一節點時,其節點 度數為 k 的機率;隨機網路的平均節點度數為<k>,那麼隨機網路的節點度數 機率分佈將會出現高峰值 p(<k>)。因為隨機網路中的連結是依照機率值來決 定是否出現,因此大部分的節點擁有相近的連結數目,也就是平均值<k>。 然而,有趣的是具有小世界現象的複雜網路的節點度數分佈卻是形成冪次率 分佈;尤其是全球資訊網路、網際網路和人際關係網路等…,這些複雜網路 均遵守冪次率關係式:p k( )= pr,其中 r 是一個常數。此外,這樣的複雜網 路也就是所謂的無尺度網路(Goh et al., 2002)。簡單來說,在這些複雜網路當 中大部分節點都只有少數的鄰居,其度數較小;但是卻有少部份的節點擁有 較多的鄰居,其度數較大。這些度數較大的節點在網際網路中可能是集線器 (hubs),而在人際關係網路中這些節點可能是所謂的”交際花”。 複雜網路的拓樸特性對於複雜網路所展現的功能與行為有很大的影響力。尤 其是當複雜網路中個體間需要互相合作解決問題時,拓樸特性更是影響整體效率 (performance)的關鍵所在。在此研究中,Dekker 針對拓樸特性與網路行為之間 的關係做了深入的研究(Dekker, 2007)。他修改了 Kawachi rewiring process 產 生出十種不同的網路形式,接著 Dekker 將這些網路當作下列三個簡易計算模型 的拓樸形式:Assignment problem、Kuramoto model 以及 Lagrange’s model; 並且針對每一個計算模型,提出各自評估解決問題效率高低的數學公式。實驗結 果顯示,當網路擁有較低的平均路徑長度時,其解決問題的效率是最高的。另外 Dekker 在 Lagrange’s model 的實驗中發現另一個影響網路行為拓樸特性,網路 中節點的平均分支度(degree)越高代表節點之間的存取能力越強,相互合作解決 問題的效率也就越高。因此,網路中的拓樸特性對於複雜網路的行為有直接的影 響。

(24)

除了拓樸特性之外,複雜網路的局部拓樸樣式(pattern)也具有關鍵性的影響 力。Milo 為了瞭解複雜網路所展現的功能與行為,他想要尋找出複雜網路中具 有顯著性的網路基塊(building block),也就是所謂的基調(motif)(Milo et al., 2002)。Milo 定義出了三節點的基調共有 13 種形式,如圖 3 所示: 圖 3:13 種大小為三節點的基調(Milo et al., 2002)。 在真實網路中,Milo 紀錄上圖中每一種子圖出現的次數,接著他針對此真 實網路所對應的隨機網路(randomized network)紀錄圖 3 中每一種子圖的出現 次數,最後若是某一個子圖在真實網路的出現次數比在對應的隨機網路的出現次 數明顯高出許多的話,那麼稱此子圖為真實網路的基調。為了要讓實驗更為嚴謹, Milo 在產生對應的隨機網路時,保存每個節點的特性,使得每個節點在各個對 應隨機網路當中的 in-degree 和 out-degree 是相同的,如圖 4 所示。 圖 4:產生對應的隨機網路(Milo et al., 2002)。A. 真實網路,B. 對應的隨機網路 此外,Milo 產生的所有對應的隨機網路中,都和真實網路含有相同數目的 (n-1)node 子圖,此虛無假設(null hypothesis)的作法是為了能夠在比較 3-node 的子圖出現次數時,實驗不會受到子結構的影響。實驗結果顯示,許多真實網路

(25)

當中都具有特定的基調,舉例來說,基因調控網路與線蟲的神經網路都具有 feed-forward loop 基調,而這兩個複雜網路都是需要將快速的將訊息傳達到目 的地,因此可以推測 feed-forward loop 基調對於訊息傳遞的過程具有某種功能 性的影響。Milo 的基調實驗除了能夠更深入瞭解拓樸樣式對於整體複雜網路的 影響之外,更重要的是能夠利用統計的角度探究複雜網路的演化與設計原則。

Huang 等人針對 Milo 所提出的網路基調加入了強弱連結的概念(Huang et al., 2007)。他們認為當考慮複雜網路的全域特徵與區域結構基調時,連結的權重 對於網路的動態行為與功能有著很大的影響。複雜網路的研究學者說明連結的權 重代表兩節點互動的能力,並且在真實網路當中,連結的權重能夠直接賦予給連 結本身。此外,Milo 所提出的簡單基調雖然具有統計上的顯著性,但是卻可能 沒有具備功能性。因此,他們將連結的強弱性質加入基調之後分為兩類:bridge motif 和 brick motif,這樣的概念不但能夠瞭解全域性質與區域結構之間的關係; 並且除了看出那些重要的基調在統計上的顯著性之外,也能夠解釋其在網路上所 具有的功能性。

首先,定義出複雜網路中連結強弱的判斷公式(見附錄.A)。接著他們認為基 調中若是包涵了至少一條弱連結,那麼此基調就稱作 bridge motif;若是基調中 的所有連結都是強連結,那麼此基調就稱作 brick motif。他們發現 bridge motifs 在網路中能夠降低網路的分隔度;brick motifs 在網路中則會建立起群聚的現 象。

對於真實網路的研究結果中,他們發現在食物鏈網路中同時存在了 bridge motifs 和 brick motifs。對於 brick motifs 來說,它使得某一種獵食者擁有許多 不同種類的獵物,讓他有許多種食物的選擇。當此獵食者消失的時候,整個食物 鏈網路會受到很大的影響。而當獵物和獵食者之間的關係被移除之後,此網路影 響卻很小,因為獵食者仍然可以經由其他獵物來填飽肚子。另一方面,bridge

(26)

motifs 卻提供相反地效果,當獵物和獵食者的關係被移除之後,將會對此食物鏈 網路發生重大的影響,可能發生獵食者滅絕或是獵物大量繁殖而發生網路失衡的 狀態。另外,他們在電子電路網路當中,只發現了 bridge motifs,而沒有 brick motifs。這是因為在設計電子迴路的時候,工程師總是希望減少多餘的電路,並 且希望訊號傳遞是直接的而不是間接的,經過越少節點,則延遲的狀況就會越少, 因此這個網路的連結都為弱連結。因此 bridge motifs 提供此網路較少的延遲時 間,使得此電路運作時比較有效率。最後他們發現,幾乎所有網路都會存在弱連 結,因此都會具有 bridge motifs。但是某些網路的 brick motifs 的數量比 bridge motifs 的數量多出很多。舉例來說,社會網路中,人們都會和自己熟識的人接觸 較為頻繁並且互動較多,所以容易造成群聚現象,而原本陌生的兩個人會因為擁 有共同熟識的朋友而成為好朋友的機會較高,因此社會網路中的 brick motifs 的 數量較多。

藉由 bridge motif 和 brick motif 的研究我們可以看出連結強弱性質對於網 路的功能性具有相當大的影響,但是在判斷連結強弱性質時,仍然使用了非強即 弱的二分法。因此在我們的研究,希望能夠將連結的強弱性質對於網路的影響力 區分成不同的等級,往後在研究複雜網路時,能夠更準確的解釋複雜網路所產生 的現象。

(27)

2.2 強弱連結

強弱連結

強弱連結

強弱連結

複雜網路中的連結代表了個體之間所具有的關係,個體之間的互動都必須透 過連結才能夠達到。然而,許多研究學者都想要知道網路中的連結對於整體網路 的影響是否都相同呢?以拓樸的角度來看這個問題時,顯然答案是否定的。舉例 來說,兩端的節點分支度(degree)較高的連結可能就會比兩端的節點分支度數較 低的連結來說,對於整體網路更有影響力。Granovetter 針對社會網路中的各種 連結所扮演的角色做了深入的研究(Granovetter, 1973),他對於人際關係網路中 連結的強弱性質給了初步的概念。舉例來說,人們總是會和家人或是熟識的朋友 聚在一起,這種關係視為強連結;而弱連結則是屬於生活中”點頭之交”的相識關 係。瞭解了強弱連結的概念之後,Granovetter 想要探討強弱連結何者對於整體 網路有關鍵性的影響。如圖 5 所示,假設 A 和 B 與 A 和 C 之間的連結為強連結, 那麼 B 和 C 之間存在著強連結的機率將會非常高。也就是說,強連結很少會單 獨出現在人際關係網路之中,並且經常會形成兩兩互相認識的三角形關係,也就 是所謂的三角閉合原理。在現實生活當中,若 A 和 B 是好朋友並且 A 和 C 也是 好朋友的情況下,則 B 和 C 也同樣會是好朋友。這些強連結形成的關係形式會 讓訊息滯留在某個區域之內,這也是為什麼我們會時常從自己身邊的好朋友們接 收到許多相同重複訊息的原因;反之,強連結對於整體網路的分隔度沒有太大的 影響。因此,強連結並不是維持整體複雜網路訊息傳遞的關鍵角色,因為當強連 結消失時,訊息仍然可以經由另外剩下的兩條連結傳遞到目的地。 圖 5:社會網路中的強弱連結。

(28)

反觀弱連結對於維持整體複雜網路的訊息傳遞扮演了相當重要的角色,若是 弱連結消失時,它所連接的兩端節點的訊息將會難以互相傳遞。弱連結就像是「橋」 (bridge)的功能,讓原來難以互相到達的兩地能夠藉由橋而達到目的地。 Granovetter 的「找工作實驗」將人與人之間的連結強度分為三種:經常見面(一 個禮拜至少見一次面),偶爾見面(一年見面一次以上)以及很少見面(一年至多見 一次面)。實驗結果顯示,大約只有 16%的人找到的工作是藉由經常見面的人所 介紹,例如家人或是熟識的好友;而大約有 84%的人找到的工作是經由偶爾見面 或很少見面的人所介紹,例如遠房親戚。此實驗給了我們一個重要的概念:當我 們想要傳送某個訊息給身邊的人時,這個訊息通常傳遞的不夠遠,然而,當這個 訊息傳遞給那些「點頭之交」時,卻能將訊息傳遞到更遠的地方。Granovetter 最後的結論為:弱連結對於小世界網路能夠擁有低分隔度的性質具有非常關鍵性 的因素。弱連結不單單只是複雜網路中個體之間的連結,更是複雜網路中各群體 之間的連結。 生化學家 Csermely 針對弱連結對於網路穩定性影響給了概念上的定義 (Csermely, 2006)。他認為某個網路遭到破壞之後,若是此網路還是能夠維持原 來的功能或是行為,或是能夠將傷害降到最低的話,那麼此網路的穩定度則越高。 反之,此網路的穩定度則越低。當複雜網路遭到破壞的時候,弱連結能夠舒緩 (relaxation)破壞的情況或是使得網路中的雜訊(noise)能夠快速消散,不會滯留在 網路當中。因此,弱連結的存在能夠提高複雜網路的穩定性。Onnela 等人的研 究結果顯示(Onnela et al. 2007),若是網路中的弱連結先被移除,那麼此網路很 快就會產生相變並且使得整體網路發生崩潰;而若是先將網路中的強連結移除, 此網路則會慢慢收縮卻不會突然發生崩潰的狀況。這證明弱連結對於整體複雜網 路穩定性的提昇有關鍵性的影響。 經由上述的研究,似乎強連結的重要性遠不如弱連結。Hansen 以一家大型

(29)

電子科技公司中 41個單位作為複雜網路的研究對象 連結在固定時間內對於新產品的研發所造成的影響 就是加入了單位間相互流動的資訊的複雜程度 與「獨立性」(independent) 訊的成文性低且獨立性高 立性低,則此資訊的複雜程度就較 就會耗費越多的時間去傳遞 各單位之間「搜尋」資訊與 連結能夠有較高的機會接收到新的資訊或知識 可以有效的降低搜尋時間 結之間的單位相互交流的機會也比較多 提供複雜程度較高的資訊傳遞 知識的複雜程度和連結的強弱關係圖 圖 6:連結強弱與資料複雜度的關係圖 Low search benefits, moderate transfer problems Low search benefits, few transfer problems KNOWLEDGE Non-codified, Dependent Codified, Independent 個單位作為複雜網路的研究對象,想要探討單位 連結在固定時間內對於新產品的研發所造成的影響(Hansen, 1999) 就是加入了單位間相互流動的資訊的複雜程度,並且利用「成文性」 (independent)的程度來量化資訊的複雜程度。舉例來說 訊的成文性低且獨立性高,那麼此資訊的複雜程度就較高;資訊的成文性高且獨 複雜程度就較低。兩單位之間互相交流的資訊越複雜 傳遞。當產品專案小組要發展新產品的時候 資訊與「傳遞」資訊。當要搜尋資訊的時候, 較高的機會接收到新的資訊或知識,而不會重複搜尋到相同的資訊 可以有效的降低搜尋時間;單位之間的強連結通常需要時間去維持其存在 結之間的單位相互交流的機會也比較多,因此當要傳遞資訊的時候 提供複雜程度較高的資訊傳遞,使得資訊能夠完整的抵達目的單位 知識的複雜程度和連結的強弱關係圖。 連結強弱與資料複雜度的關係圖(Hansen, 1999) Low search benefits, moderate transfer problems Search benefits, severe transfer problems Low search benefits, few transfer problems Search benefits, few transfer problems TIE STRENGTH Strong Weak 想要探討單位之間的強弱 (Hansen, 1999)。此研究重點 」(codification) 舉例來說,當某資 資訊的成文性高且獨 兩單位之間互相交流的資訊越複雜,那麼 產品專案小組要發展新產品的時候,就必須要從 ,單位之間的弱 而不會重複搜尋到相同的資訊, 間的強連結通常需要時間去維持其存在,強連 因此當要傳遞資訊的時候,強連結能夠 使得資訊能夠完整的抵達目的單位。下圖 6 是將 (Hansen, 1999)。

(30)

由研究結果發現,在各個單位之間的連結強度無論是強或是弱,都能夠有效 地分享資訊。不過弱連結和強連結在搜尋資訊與傳遞資訊時,各有其優勢與劣勢, 最後仍需取決於將在各個單位間傳遞的資訊的複雜程度。強連結提供了網路中各 單位之間的高度相關性,因此在傳遞較為複雜的資訊時能夠有較好的效率。當資 訊的複雜程度較低的時候,弱連結對於資訊的取得與傳遞能有效的降低產品完成 時間。 Onnela 等人利用了手機通訊網路當作研究對象,探討網路結構與連結強弱 對於網路所產生的影響(Onnela et al., 2007)。作者認為若是兩個使用者有雙向通 話紀錄,代表這兩位使用者在人際網路上可能較為熟識,也許是家人關係或是同 事關係。然而,若是兩個使用者之間只有單向通話紀錄的話,他們在人際網路上 相識的機會就大為減少。因此為了建構穩固的社會溝通網路,作者認為擁有雙向 通話紀錄的兩個使用者之間才有連結。經過上述的方法建構出的網路稱作 mobile call graph (MCG),擁有 N = 4.6 x 106個節點,L = 7.0 x 106個邊。

為了瞭解網路拓樸與連結強度之間的關係是否會影響到全域資訊散播,作者 們設計了一連串的實驗步驟去觀察網路中資訊流動的過程(見附錄.B)。研究結果 發現:無論弱連結或強連結,都會對於資訊的傳遞造成某些程度上的阻礙。以弱 連結為例,在通訊網路中的弱連結會因為本身的權重較低(對話時間花費較少), 使得資訊傳播的量就比較少,而造成傳播上得阻礙。以強連結為例,它屬於同一 個社群之內的連結,因此彼此之間比較不容易接收到新的資訊進來。因此,強連 結與弱連結在網路中各有其目的與功能,必須要考量切入點為何,才能探討不同 特性的連結對於複雜網路是否重要。 關於強弱連結的類似概念也在社會學領域當中出現過。社會學家 Putnam 認 為,社會資本是社會生活的重要特性(Putnam, 2000),例如信任、規範、社會網 路,透過協調性的行動,它能夠讓團體內的成員一起行動並且分享目標。公民社

(31)

會中的自願性組織的形成與發展,使得社會資本能夠自我補充與儲存的良性循環, 也就是信任、規範、社會網路的特質使得自願性組織的參與者能行動一致,並更 有效的追求共同的目標與理想,尤其可貢獻其組織之力量,並提昇組織達成目標 的效率。

Putnam 將社會資本分成兩個類別:強鍵型社會資本(bonding social capital) 與橋接型社會資本(bridging social capital)。強鍵型社會資本指的是要增加排他 性的認同,並且維持同質性,其有助於強化個體之間的互助或凝聚力。在社會網 路當中,這種黏著性社會資本存在於團體之內,能夠使得原本彼此就認識的人更 加靠近結合;對於複雜網路來說,強鍵型社會資本屬於較封閉型的緊密連結。橋 接型社會資本指的是要結合社會當中不同層面的人,通常存在著某種程度上的異 質性,其有助於連結外界資源並且傳播訊息,並且提供廣泛的認同與互助。在社 會網路當中,橋接型社會資本存在於團體之間,使得原本不認識的人形成團體或 結合在一起。對於複雜網路來說,橋接型社會資本屬於開放型掮客性連結。對於 社會資本更深入的討論請參考附錄.C。 Putnam 提出的兩種社會資本類別的概念與 Granovetter 提出的強弱連結的 概念有幾分相似。強鍵型社會資本和強連結是存在於網路中群體之內,而橋接型 社會資本和弱連結則是存在於網路中群體之間。然而,Granovetter 強調的是弱 連結對於網路中資訊的傳播扮演了重要的角色;Putnam 強調的是不同類別的社 會資本提供社會網路何種功能和影響,而兩種社會資本對於社會網路來說是同等 的重要。

(32)

2.3 從局部觀點到整體觀點

從局部觀點到整體觀點

從局部觀點到整體觀點

從局部觀點到整體觀點

找出網路中心的節點或是節點集合,一直以來都是複雜網路分析的重要研究 議題,對於網路中心度的概念也一直被提出(Freeman, 1979)。利用計算網路中各 個節點的相對中心度讓我們能夠整合各種中心度的概念,這樣的方法也稱作「節 點中心度」。然而,對於節點的中心度也發展出許多不同的測量方法,主要的差 別在於局部觀點與整體觀點的不同。若是一個節點為局部中心點,指的是這個節 點擁有許多直接相連的節點;若是一個節點為整體中心點,指的是這個節點在此 網路的結構上佔據了戰略上重要的位置。舉例來說,如圖 7,雖然 A 點和 C 點 的直接鄰居較多, 但對於整體結構來說,B 點佔據較重要的位置。因此 A 點和 C 點為局部中心點,B 點為整體中心點。Freeman 提出了局部中心度與整體中心 度的測量方式(Freeman, 1979),對於局部中心度他提出以節點的分支度(degree) 為測量基礎,並且為了克服此測量方式因為網路規模不同而造成的局限性, Freeman 定義了節點的局部中心度為節點的分支度與可能聯絡的最多節點數之 比。對於整體中心度他提出以不同之間的距離作為測量基礎,計算出各節點之間 的接近性(clossness),若是一個節點在網路中和其他節點的距離都相對較近,那 麼則稱這個節點為整體中心點。最後,Freeman 提出了新的中心度概念,稱之 為中間度(betweenness) (Freeman, 1979),若是一個節點居於網路中其他大部分 節點之間的最短路徑上,那麼此節點所起到重要的中介作用,因而處在網路的中 心。節點中間度的概念被 Girvan 修改成了連結中間度(edge-betweenness),被 用來偵測網路中所存在的社群結構(Girvan & Newman, 2002)。無論是節點中間 度或連結中間度,其概念都是在測量節點或是連結的不可取代性,在網路中越是 不可取代的節點或是連結則越具有影響力。

(33)

圖 7:整體中心度示意圖。 上個段落的重點是以網路中節點的觀點來評估一個網路的中心。另一方面, 我們也可以由整體網路的觀點去測量一個網路在多大程度上具有中心化的結構 (Freeman, 1979)。密度和中心勢的概念能夠以整體的角度去評估網路。密度指的 是一個網路的凝聚力有多強;中心勢則是描述這種凝聚力是如何圍繞某些特定的 節點而組織起來。因此密度與中心勢是兩個重要且互補的測量指標。但若是一個 網路的中心點不只有一個,而是廣泛的分佈在網路當中,那麼網路中心勢的測量 可能就不會提供太多資訊給我們。因此,我們必須要觀察一個網路是否存著「結 構中心」,所謂結構中心可能是一個節點或是節點的集合,它是網路結構的樞紐。 這樣的概念在 Stokman 的研究中已經被勾勒出來( Stokman, Ziegler & Scott, 1985),下圖 8 為研究概念示意圖,他的研究重點就是把那些具有最高節點中心 度的節點認定為網路的中心,接著再去研究這些節點和網路中其他節點所形成的 結構關係為何,最後可以將節點區分成三種不同的類型,不同類型的節點對於網 路的影響也有所不同。 網路中心度與中心勢的概念都包含了局部與整體的觀點,也就是說某些節點 對於局部網路的影響力較大,但是對於整體網路的影響力就相對較小。然而,無 論何種評估方式,都只能計算出區域性質或是直接計算出全域性質。舉例來說, 對於節點的局部中心度能夠使用分支度來計算,而整體中心度能夠使用接近性來 計算,但是在區域與全域的評估值之間,我們無法知道節點的中心度呈現何種變 化。最重要的是已經有許多研究指出複雜網路具有階層性(Clauset, Moore & Newman, 2008),我們認為在不同階層之下,連結必然會有不同影響力。因此, 針對連結在網路中的重要性,我們希望能夠提出一套測量方式,能夠有效的評估 出連結的局部影響力向外擴展至全域影響力。若是能夠區分出複雜網路中不同影 響力的連結,那麼在對於複雜網路架構的瞭解與應用上都能夠提供更具有意義的 資訊。

(34)

圖 8:節點在網路中的位置與中心度關係圖。

2.4 Edge-betweenness 與連結兩端節點的共同朋友

與連結兩端節點的共同朋友

與連結兩端節點的共同朋友

與連結兩端節點的共同朋友

在複雜網路的研究當中,有許多以連結為測量對象的應用,Girvan 提出了 複雜網路在拓樸特性上另一個重要的概念:社群結構(Community structure) (Girvan & Newman, 2002)。存在於社群之中的連結密度比較高,節點會緊密的 連繫在一起,而社群之間的連結則比較少。在此研究當中,他們提出了一個偵測 複雜網路中社群結構的演算法,其中心概念就是計算 edge-betweenness。

對於 betweenness 概念的研究,最早是 Freeman 所提出的 node -betweenness,Girvan 將 betweenness 的概念延伸到連結上,提出 edge -betweenness。計算某個連結 e 的 betweenness 值為:網路中任意兩節點的最短 路徑會經過 e 的數目。這個計算方式也就是在評估每一個連結在網路之中所處位 置的重要性。我們可以推論得知,在社群之間的連結的 betweenness 值一定相 對較高,因為不同社群之間的節點的最短路徑必然會經過這些社群之間的連結, 所以這些連結對於社群之間的訊息傳遞擁有較大的作用。 Onnela 等人在 2007 年利用了手機通訊網路當作研究對象,探討網路結構與 連結強弱對網路的影響(Onnela, 2007)。在這個研究當中,作者們利用了現今廣 為人們所使用的通訊方式:手機,也就是用手機的通訊紀錄來獲取手機用戶之間 的互動模式並且建構社會網路的架構。接著作者們利用 edge-betweenness、實 際通話時間及流量與連結兩端節點的共同朋友比例(見附錄.D)這三個概念分別 計算網路中連結的強度,藉由三種不同的計算方式去瞭解連結強度對於複雜網路 的影響。

(35)

研究結果展示了三種不同計算方式的關係,我們可以由圖 9 中的藍色圓圈所 構成的曲線代表了兩節點真實通話量與共同朋友之間的關係,我們可以發現 <O>w會隨著 Pcum(w)上升而上升,因為當兩節點的通話量越大則 w 越高,也就

表示此兩位手機用戶越熟識,他們之間的共同朋友也會越多。圖 9 中黑色菱形所 構成的曲線代表了 edge-betweenness 與共同朋友之間的關係,我們可以發現 <O>w會隨著 Pcum(b)上升而下降,因為當連結的 edge-betweenness 的值越高,

也就表示此連結的強度越弱,依據強弱連結理論,這樣的連結屬於社群與社群之 間的連結,所以共同朋友也會越來越少,<O>w的值也就跟著下降了。而圖 9 中 紅色方框所構成的曲線代表了隨機給予連結權重的狀況,可以發現 Pcum(w)與 <O>w無關。 對於 edge-betweenness 來說,是計算連結的不可取代性,越多最短路徑經 過的連結對於資訊傳遞就越重要,也就越不可被取代。對於連結兩端節點的共同 朋友來說,是計算連結的可取代性,當兩端節點的共同朋友數越多,表示當此連 結消失的時候,資訊還是能夠藉由這些共同朋友來傳遞,因此可取代性也就越 高。 圖 9:共同朋友、edge-betweenness 與實際通話量之間的關係(Onnela, 2007)。

Pcum(w)表示連結權重小於 w 的比例,<O>w表示在連結權重為 w 下的共同朋友比例。Pcum(b)

(36)

第三章

第三章

第三章

第三章 研究方法

研究方法

研究方法

研究方法

3.1 實驗目的與概念描述

實驗目的與概念描述

實驗目的與概念描述

實驗目的與概念描述

在第二章文獻探討中,我們已經從各個角度來探討連結的拓樸特性對於複雜 網路具有相當大的影響力,自從 Granovetter 提出強弱連結的概念之後 (Granovetter, 1973),對於網路中連結強度的研究成為了複雜科學領域的研究焦 點之一。為了要更具體的描述連結的強弱概念,我們依據連結在網路中的拓樸性 質與其所展現的功能性,本研究提出了「橋接式連結」(bridge link)與「強鍵式 連結」(bond link)。複雜網路中橋接式連結能夠將訊息從一個群體傳至另一個的 群體,使訊息能夠傳遞到較遠的地方。強鍵式連結能夠將訊息滯留在群體之中, 使訊息在群體中不會輕易消失。這兩種類型的連結在網路中具有不同的特性,我 們可以從「可取代性」的角度來分析連結。當橋接式連結消失時,網路中的訊息 很可能無法到達目的地,或者需要花更長的時間完成傳遞;當強鍵式連結消失時, 訊息仍然可以藉由周遭的連結來完成傳遞。換句話說,橋接式連結在網路中的可 取代性較低,而強鍵式連結的可取代性較高。直觀來看,網路中的連結若是越緊 密,當某條連結消失時,訊息能夠從其他連結傳遞的機會就越高,此連結的可取 代性也就越高。 在這篇研究論當中,我們利用「共同朋友」的概念來探討連結的特性,當連 結兩端節點的共同朋友數越少,它們可能存在於網路中不同的兩個群體之中,那 麼此連結在網路中可能扮演了群體之間訊息橋樑的角色;兩端節點的共同朋友數 較多,它們可能存在於網路中同一群體之間,那麼此連結可能是群體之中較為緊 密的連結。除此之外,為了要避免對於連結特性只有強和弱的二分法,本研究提 出網路「階層」的概念,我們能夠探討連結在不同階層時,其所具有的特性為何, 連結的影響力範圍有多廣,進而提出了「全域橋接式連結」(global bridge link)、 「N 階橋接式連結」(N degree of bridge link)與「沉沒橋接式連結」(sink bridge

(37)

link),並且根據不同的連結類型,我們利用「可取代性」給予這些連結類型概念 上的描述: 1. 強鍵式連結:若是連結為強鍵式連結,若且唯若當此連結被移除時,此連結 的兩端節點能夠經由路徑長度為 O(1)的替代路徑來傳遞訊息。 2. N 階橋接式連結:若是連結為 N 階橋接式連結,若且唯若當此連結被移除時, 此連結的兩端節點能夠經由路徑長度為 O(m)的替代路徑來傳遞訊息(m 為此 連結所連接的兩區域群體內的節點個數總和)。 3. 全域橋接式連結:若是連結為全域橋接式連結,若且唯若當此連結被移除時, 此連結的兩端節點能夠經由路徑長度為 O(n)的替代路徑來傳遞訊息或者無 法找到替代路徑(n 整體網路的節點個數)。 4. 沉沒橋接式連結:若是連結為沉沒橋接式連結,若且唯若當此連結被移除時, 使得此連結兩端節點中的其中一節點的分支度為 0。 經由瞭解不同連結類型的概念,我們可以從可取代性的角度瞭解這些連結類型在 網路當中所具有的影響力。當某連結被移除後,其替代路徑的路徑長度越長,表 示資訊必須花費較久的時間才能將訊息傳遞到目的地,此連結對於整體網路的影 響力也就越大。 利用上述的概念,在接下來的子章節中我們先定義出網路的「階層」 (hierarchy),其目的是為了觀察連結在不同階層下所具有的性質為何。接著我們 利用階層的概念定義出不同階層下的共同朋友比例,其目的是為了量化連結在不 同階層下所具有的影響力,舉例來說,當連結在某階層下的共同朋友比例越高, 則當此連接被移除之後,在此階層能夠找到路徑長度較短的替代路徑,那麼連結 在此階層所具有的影響力也較小。

(38)

3.1.1 連結的連結的連結的連結的「「「「階層階層階層」階層」」(Hierarchy) 」 首先,我們利用圖論的定義將複雜網路表示成一個無向圖G=( , )V E ,其中 V 為節點的集合,若 G 有n 個節點,則 V = {v1, v2, v3, …,vn}。E 為連結的集合, 若 G 有 m 個連結,則 E = {e1, e2, ,e3, …,em}且 e 為二元組數對,e=( , )i j ,其中 ,   。 將複雜網路定義成圖之後,我們希望能夠從區域觀點出發,接著逐漸拓展成 全域觀點,一步一步瞭解每一條連結對於整體網路的影響為何,因此針對不同的 尺度觀點,我們必須定義「階層」(hierarchy)。假設圖G=( , )V E ,G 中含有某 一連結e=( , )i j 。G 中節點 i 或節點 j 距離為 k 的所有節點之集合所形成的子圖 ' ' , ( , , , ) e k e k e k g = V E 稱作連結 e 的第 k 階層。  ,  |      !" ,  # $ %   !",  # $&且1<k<D。 ' ,   , (| , (  ,) ,,  * (, , ( *  , &。 上式中的distance i v( , )表示節點 i 與節點 v 的最短路徑長度。D 表示此網路的網 路直徑,本研究的網路直徑1定義為:任意兩節點之間所存在最短路徑的平均值。 , e k g 相當於連結 e 向外延伸 k 個路徑之後所形成的子圖,而 k 值會被限制在 1 到 D 之間,對於連結 e 我們會得到ge,1,ge,2,…,ge D, 總共 D 個子圖。藉由這些子 圖,我們可以分析連結 e 從區域到全域的影響力。舉例來說,在複雜網路圖中我 們定義某連結e=( , )i j 的第 n 階層表示由 e 為中心向外延伸 n 步所形成的子圖。 圖 10.a 為一個簡單的網路圖,白色的節點是由連結 e 為中心向外延伸一步所能 到達的節點,因此對於連結 e 來說,其第一階層就是白色節點所形成的子圖(圖 10.c)。而白色節點和黃色節點所形成的子圖則是第二階層(圖 10.c)。

(39)

圖 10:階層概念圖。a.整體網路圖,b.第一階層,c.第二階層。 值得注意的是根據階層的定義,對於目標連結作延伸時,我們必須忽略目標 連結,這個目的就是為了要計算目標連結的可取代性。所謂可取代性就是想要評 估當目標連結消失之後,其功能是否會被網路中其他的連結所取代。所以我們對 於目標連結作延伸時不考慮任何經由目標連結所延伸到的節點。 依據網路直徑的定義,每一條連結在做延伸時可能不會延伸到所有的節點, 但是依據複雜網路的重要拓樸特性—低分隔度。假設網路直徑為 D,對於任一節 點延伸 D 個路徑長之後所產生的子圖,均能夠涵蓋大部分的節點,對於連結的 影響範圍計算已經足夠。直觀來看,若是節點 i 和節點 j 的路徑距離相對較遠, 那麼節點 i 附近的連結對於節點 j 的影響則是相當有限。

(40)

3.1.2 連結兩端節點的共同朋友連結兩端節點的共同朋友連結兩端節點的共同朋友連結兩端節點的共同朋友 複雜網路中某一連結e=( , )i jin表示節點 i 延伸 n 步之後所有拜訪到的節 點之集合。假設網路圖G=( , )V E ,我們可以將in定義成: { | ( ) ( , ) } n i = v vVdistanse i v =n 舉例來說,如圖 11 所示,橘色節點是節點 i 延伸一步之後所能拜訪到的節點。 因此,i1為橘色節點的集合。 圖 11:節點 i 延伸一步之後所拜訪到的節點形成 i1。 n n ij 代表節點 i 延伸 n 步與節點 j 延伸 n 步之後的共同朋友所形成的集合。 如圖 12 所示,a 圖代表節點 i 延伸一步之後所拜訪到的節點(i1),b 圖代表節點 j 延伸一步之後所拜訪到的節點( j1),而 c 圖中的綠色節點代表了連結 e 在第一階 層的共同朋友所形成的集合(i1∩ j1)。 圖 12:共同朋友。

(41)

由上述的定義,對於複雜網路中每一條連結e=( , )i j 我們可以推導出連結 e 在第 n 階層下「所有」共同朋友的集合Ci j n, , : , , 1 1 |Ci j n| |= in− ∩ jn|+|injn− |+|injn| 因此,複雜網路中每一條連結e=( , )i j 在第 n 階層的共同朋友比例定義如下: 共同朋友比例 , , , 1 1 | |

min(| |,| |) min(| |,| |) min(| |,| |)

i j n e n n n n n n n C R ij i ji j = + + 。 圖 13 為在每一階層共同朋友的意識圖。左邊三角形的每一階層代表連結 e 的左 節點所延伸到的節點之集合。舉例來說,黃色部份是左節點延伸一步所到達的節 點形成的集合。同理,右節點每一階層延伸所形成的集合為右邊的三角形。而兩 個三角形在每一階層重疊的部份就是在此階層中兩節點的共同朋友所形成之集 合。 圖 13:共同朋友概念圖。 ______________________________________ 1. 本研究所採用的網路直徑定義為:網路中任意兩節點之間最短路徑的平均值。如果網路為非連 通圖,那麼網路直徑為無限大;若網路為完全圖,則網路直徑為 1。有些複雜網路的研究將網路 直徑定義為任意兩節點之間最短路徑中的最大值,這樣的作法如果遇到複雜網路當中只有極少部 份的節點距離較遠,那麼對於大部分連結則會執行無意義的延伸動作而沒有效率。

(42)

3.2 實驗設計

實驗設計

實驗設計

實驗設計

目標網路中連結兩端節點的共同朋友比例越高 的訊息仍然能夠藉由這些共同朋友當作 失後對於網路的影響就越小 當此連結消失之後,兩端節點難以找到這些 導致整體網路無法達到某種功能或是目的 端節點的共同朋友比例的高低 產生判斷連結共同朋友比例高低的 驗操作流程圖: 3.2.1 產生產生產生產生「「「「對應的隨機網路對應的隨機網路對應的隨機網路對應的隨機網路 我們使用交換演算法 路的「對應的隨機網路」 利用通過上一階層外部與內部門檻值的連結計算其平均值與標準差

2.針對

算出每條連結在各階層共同朋友比例的平均值與標準差 目標網路經過交換演算法產生 目標網路中連結兩端節點的共同朋友比例越高時,當此連接消失 的訊息仍然能夠藉由這些共同朋友當作「替代」途徑達到目的地, 失後對於網路的影響就越小。反之,目標網路中兩端節點的共同朋友比例越低 兩端節點難以找到這些「替代」途徑來幫忙傳遞訊息 導致整體網路無法達到某種功能或是目的,造成較大的傷害。為了要判斷連結兩 端節點的共同朋友比例的高低,我們利用了目標網路本身和其「對應的隨機網路 比例高低的「內部門檻值」與「外部門檻值 圖 14:實驗流程圖。 對應的隨機網路 對應的隨機網路對應的隨機網路 對應的隨機網路」」」

我們使用交換演算法(i.e. 若 ab,cd 則變為 ad,cb)來產生目標網

」(Milo et al., 2002; Huang et al., 2007)。產生這些隨機網

4.判斷連結特性

依據2和3的結果判斷出連結的種類

3.針對目標網路算出內部門檻值

利用通過上一階層外部與內部門檻值的連結計算其平均值與標準差

針對「對應的隨機網路」算出外部門檻直

算出每條連結在各階層共同朋友比例的平均值與標準差

1.產生「對應的隨機網路」

目標網路經過交換演算法產生「對應的隨機網路 當此連接消失,兩端節點 ,所以此連結消 兩端節點的共同朋友比例越低, 途徑來幫忙傳遞訊息,可能 為了要判斷連結兩 對應的隨機網路」 外部門檻值」。圖 14 為實 來產生目標網 產生這些隨機網 利用通過上一階層外部與內部門檻值的連結計算其平均值與標準差

算出外部門檻直

算出每條連結在各階層共同朋友比例的平均值與標準差 對應的隨機網路」

數據

圖 10:階層概念圖。 a.整體網路圖,b.第一階層,c.第二階層。 值得注意的是根據階層的定義,對於目標連結作延伸時,我們必須忽略目標 連結,這個目的就是為了要計算目標連結的可取代性。所謂可取代性就是想要評 估當目標連結消失之後,其功能是否會被網路中其他的連結所取代。所以我們對 於目標連結作延伸時不考慮任何經由目標連結所延伸到的節點。  依據網路直徑的定義,每一條連結在做延伸時可能不會延伸到所有的節點, 但是依據複雜網路的重要拓樸特性—低分隔度。假設網路直徑為 D,對於任一節 點延伸 D 個路徑長之後所產
圖 23: 七種食物鏈網路連結種類分佈結果統計圖
圖 25:  Bridge Brook Lake 的食物鏈網路示意圖。 紅色連結代表全域橋接式連結。藍 色連結代表一階橋接式連結。黑色連結代表強鍵式連結。淡藍色連結代表沉沒式連結。
圖 30:移除連結事件下,「全域橋接式連結」的比對正確率  圖 31:移除連結事件下,「其他連結」的比對正確率 0%20%40%60%80%100%0%10%20%30%40%50%Match Ratio
+5

參考文獻

相關文件

Optim. Humes, The symmetric eigenvalue complementarity problem, Math. Rohn, An algorithm for solving the absolute value equation, Eletron. Seeger and Torki, On eigenvalues induced by

In addressing the questions of its changing religious identities and institutional affiliations, the paper shows that both local and global factors are involved, namely, Puhua

In order to reveal the real purpose of this important work, the present paper discusses both Dau-shr's historical background, the fierce competition between Buddhist and the

• Each student might start from a somewhat different point of view and experience the encounters with works of art and ideas in a different way... Postmodern

In light of the unique context and different student needs in every school, and the common goal of fostering students’ learning abilities, the EDB has been encouraging schools

 Create and present information and ideas for the purpose of sharing and exchanging by using information from different sources, in view of the needs of the audience. 

 Create and present information and ideas for the purpose of sharing and exchanging by using information from different sources, in view of the needs of the audience. 

Abstract— This paper has analyzed link probability, expected node degree, expected number of links, and expected area collectively covered by a finite number of nodes in wireless ad