• 沒有找到結果。

第五章 演算法穩固分析與應用

5.2 演算法應用

5.2.1 複雜網路的分群

Milo 等人在 2004 年利用網路中的三節點與四節點基調(3-node and 4-node motifs)當作分群的指標(Milo et al., 2004),將具有相同顯著性的基調的網路分為 同一群,稱為 Superfamily(參考章節 2.1)。在第四章的真實網路分析結果當中,

我們可以發現不同領域的複雜網路會因為拓樸結構上的不同造成連結種類分佈 比例也有明顯的差異,因此我們認為連結種類的分佈比例會是複雜網路分群應用 上的重要參考資訊之一。本研究利用演算法所得到的連結類型分佈比例中的七項 數據當作分群指標,下面是七種分群指標的分群觀點:

1. 一階強鍵式連結之比例:此類型連結屬於網路中最緊密的連結,其分佈的比 例與網路群聚度有直接的關係,一階強鍵式所佔比例越高,則網路群聚度就 越高。因此,我們將一階強鍵式連結所佔比例當作分群指標之一。

2. 全域橋接式連結之比例:此類型連結屬於網路中可取代性最低的連結,對於 網路的資訊傳遞有極大的影響力,並且存在此類型連結的網路都具有相對較 低的分隔度。因此,我們將全域橋接式連結所佔比例當作分群指標之一。

3. 沉沒橋接式連結之比例:此類型連結屬於網路中邊緣節點與其他節點之間的 連結,若是沉沒橋接式連結所佔比例越高,表示邊緣節點越多,網路拓樸可 能會越接近星狀網路。因此,我們將沉沒橋接式連結所佔比例當作分群指標 之一。

4. 一階、二階和三階橋接式連結之比例:每一種複雜網路的分隔度均不相同,

但是此三種類型的連結所佔比例之總和在大部分的網路中超過 60%。一階橋 接式連結的可取代性較高,三階橋接式連結的可取代性較低。因此,我們將 這三種類型的連結分別當作三種分群指標。

5. 其他類型連結之比例和:若是網路的分隔度超過三,就會出現四階或四階以 上的橋接式連結。一般來說,三階以上的橋接式連結所佔比例都較低,因此 我們將四階或四階以上的橋階式連結視為同一類型連結所佔比例,將其比例 加總,稱之為其他類型連結之比例和。因此,我們將其他類型連結之比例和 當作最後一個分群指標。

接著我們針對第四章中 14 個真實世界網路以上述七個分群指標做分群。如圖 32 到圖 34 所示,同樣領域的複雜網路在連結類型的分佈比例上都呈現高度的相 關性,在四個社會網路中,因為群聚現象的關係,一階強鍵式連結比例較其他指 標來的高出許多,彼此在分群指標之間的相關係數介於 0.89~0.99 之間;在七個 食物鏈網路中,因為網路具有明顯的階層性以及跨階層或同階層消費的現象,兩 種性質互相拉扯之下,因此大部分的連結都被判斷為一階橋接式連結,七種網路 彼此在分群指標之間的相關係數介於 0.63~0.99 之間;在三種電子電路網路當中,

因為電子電路的基本設計原則,使得分隔度較高以及不存在一階橋接式連結,彼

此在分群指標之間的相關係數介於 0.7~0.99 之間。

圖 32:四種社會網路在分群指標下的相關性(C=0.9~0.99)。

圖 33:七種食物鏈網路在分群指標下的相關性(C=0.62~0.99)。

圖 34:三種電子電路網路在分群指標下的相關性(C=0.7~0.92)。 layer 1

Global bridge link

Sink link 1-degree of bridge link

2-degree of bridge link

3-degree of bridge link

Else link sum

Distribution Ratio

Social network

成衣工廠工人遊戲關係網路 layer 1

Global bridge link

Sink link 1-degree of bridge link

2-degree of bridge link

3-degree of bridge link

Else link sum

Distribution Ratio

Food web

B.brook lake Chesapeake Coachella Littlt rock Skipwith St Martin Ythan91

0%

50%

100%

Bond link of layer 1

Global bridge link

Sink link 1-degree of bridge link

2-degree of bridge link

3-degree of bridge link

Else link sum

Distribution Ratio

Electronic circuit network

s208 s420 s838

中可以觀察到對角線的黑色區塊(相關係數高)剛好對應到不同領域的複雜網路,

而不同領域的複雜網路之間的呈現灰白色區塊。

圖 35:14 種網路彼此之間的相關係數矩陣視覺圖。

結果顯示同一領域的複雜網路呈現高度的相關性,而不同領域的複雜網路之 間相關性就低的多。這樣的結果清楚顯示出利用連結種類分佈比例當作分群指標 具有相當不錯的分群效果。接下來我們利用分群指標將 14 種真實世界網路與 3 種理論網路做比較,理論網路包括小世界網路、無尺度網路和隨機網路(三種網 路節點數 N=100,連結數 E=400,小世界網路的繞線率 p=0.040.080.160.320.64)。圖 36 是 14 種真實世界網路和三種理論網路在分群指標上的相關係數矩陣 視覺圖,我們可以發現社會網路和小世界網路在繞線率低時(p=0.4~0.16)在連結 類型分佈上具有高度的相關性,並且與無尺度網路和隨機網路的相關性都較低。

此外,我們發現以拓樸的角度來說,無尺度網路比隨機網路更接近食物鏈網路的 連結類型分佈比例,這樣的結果在以往在探討生態網路的拓樸架構的研究上提供 了新的觀點。最後我們發現電子電路網路不符合任何一種理論網路的連結類型分 佈,因為電子電路網路本身就是一種人工網路,其拓樸性質較為特殊,因此和理

論網路的相關性相當的低。

圖 36:14 種複雜網路與理論網路之間的相關係數矩陣視覺圖。

利用連結類型分佈比例當作網路的分群指標能夠提供在做複雜網路的研究 時,一個相當有用的工具。舉例來說,當要研究一個未知的複雜網路時,我們能 夠先觀察此複雜網路的連結類型分佈比例與哪一種已知複雜網路相似,那麼我們 就可以嘗試著用分析已知複雜網路的方式去分析未知的複雜網路,如此一來就能 夠提高研究效率。

最後,藉由觀察真實網路與理論網路的連結類型分佈比例,我們可以瞭解真 實網路與理論網路之間的相關性。往後在各個領域的研究當中,當無法蒐集到真 實世界的網路資料時,我們能夠藉由這樣的相關性,利用相似拓樸性質的理論網 路取代真實網路當作分析對象,能夠降低模擬或是計算上的誤差,得到較為貼近 真實世界的分析結果。

5.2.2 找尋網路中的社群結構找尋網路中的社群結構找尋網路中的社群結構找尋網路中的社群結構(Community structure)

隨著對複雜網路的研究發展,很多研究都已經發現許多真實網路都具有一個 重要的性質:社群結構(community structure)(Girvan & Newman, 2002)。簡單 來說,整體網路架構就是由若干個群體(group)所組成的。在社群結構當中,每 個群體內部節點之間的連結相對的緊密,而各群體之間的連結卻較為稀疏。如圖 37 示,這個簡單的網路具有三個群體(虛線包圍的部份),可以發現群體內的連結 非常的緊密,而群體之間的連結就稀疏的多。偵測複雜網路中的社群對於瞭解複 雜網路結構與分析是非常重要的。社團結構的分析也在社會學、生物學、物理學 以及計算機圖學都具有廣泛的應用。

圖 37:具有社群結構的簡單網路。

對於網路社群結構的偵測或判斷,依據針對連結的處理主要可以分成兩大類,

分別是分裂法和內聚法。Girvan 所提出的 GN 演算法就是分裂法的代表,GN 演算法的核心概念為不斷移除網路中 Edge-betweenness 值最高的連結,其演算 法的基本流程如下:

步驟一:計算網路中所有連結的 Edge-betweenness 值。

步驟二:找到 Edge-betweenness 值最高的連結並且將其從網路中移除。

步驟三:移除最高 Edge-betweenness 值的連結之後,重新計算網路中會受到移

除動作影響的連結的 Edge-betweenness 值。

步驟四:重複步驟二,直到每一個節點就是一個退化的社團為止。

接著我們來看 GN 演算法在社會網路研究中經典問題的應用。此問題是出自 二十世紀七零年代初期,Zachary 運用兩年的時間觀察美國一所大學中的空手道 俱樂部中內部成員之間的互動關係網路(以下稱作 Zachary 網路)。在他觀察的過 程當中,該俱樂部的主管與校長之間為了是否要抬高俱樂部的收費問題產生了爭 執。結果,此俱樂部分裂成了兩個分別以主管和校長兩人為核心的小俱樂部(拓 樸資訊見附錄 G)。圖 38 節點 1 和節點 33 分別為俱樂部的主管與校長,而三角 形和正方形節點也分別代表了俱樂部分裂之後的成員所形成的兩個小型群體。

利用 GN 演算法分析 Zachary 網路,結果如圖 39 所示,若是將 GN 演算法 所得到的分裂結果和真實情況做比對,可以發現到其結果與實際分裂的情況幾乎 相同。只有節點 3 被判斷錯誤,Girvan 認為節點 3 和兩個群體之間各有五條連 結,此節點本身就具有拓樸上的分歧性,因此在演算法判斷上才會出現錯誤。但 是 GN 演算法無法用 Edge-betweenness 的結果對應到真實世界去解釋為何會出 現錯誤,這樣的情況屬於 GN 演算法在找尋社群結構上的偏見。

圖 38:Zachary 研究美國某大學空手道俱樂部成員互動網路。

圖 39:GN 演算法分析 Zachary 網路的結果(Girvan & Newman, 2002)。

藉由社群結構的概念,同一個群體內的連結兩端節點的共同朋友比例會相對 較高,而群體之間的連結兩端節點的共同朋友比例就會相對較低。舉例來說,社 會網路中同一個社團或是群體內的任兩個人若是互相熟識,那麼此兩人在同一個 社團或是群體內也會有許多共同認識的朋友;而不同社團或是群體之間的兩人若 是互相熟識,那麼他們的共同朋友的數量可能就會少的多。本研究所提出的演算 法,能夠依據「共同朋友」的概念將網路中的連結區分成多種不同的類型。因此,

我們能夠利用這些不同類型的連結來幫助偵測複雜網路中的社群結構。我們認為 強鍵式連結存在於同一個群體內的節點之間;全域橋接式連結則存在於群體之

我們能夠利用這些不同類型的連結來幫助偵測複雜網路中的社群結構。我們認為 強鍵式連結存在於同一個群體內的節點之間;全域橋接式連結則存在於群體之

相關文件