第三章 區域化模型
本研究的目的在於找出小世界網路中的區域現象,並觀察此一現象會帶來 什麼好處與影響。所以首先我們必須要先將區域現象做出定義,且此定義可以套 用在所有領域的小世界網路之中。同時我們也希望將時間的因素加入參考,使我 們的研究結果能夠更加完整。
本章會首先在第一節中,探討我們對於小世界網路中關於區域現象的觀 察,第二節則是討論我們研究區域現象之潛在影響。第三節開始則是會對區域現 象做詳細的定義,與分析各定義的優缺點,最後在第四節我們會將時間因素加入 我們的研究之中,並且探討時間對於網路結構的影響。
3.1 問題定義
要用一個通用的定義來詮釋所有的網路系統,是一項困難的研究議題,因 為不僅是其內在的複雜性,還需要面對各個網路之領域中所有專業知識的差異。
但在許多已知的領域中,都有小世界網路存在其中。因此,我們仍要努力找出一 個可以通用在各個領域的小世界網路之區域定義,使我們的研究貢獻顯得更有意 義。因為如此,我們對於這小世界網路之區域的定義,作出了三個方向的詮釋與 定義,希望能夠經由我們的實驗驗證之後,能夠找出最為適當,或者是對於該領 域應用價值最高的一組。而之後我們也會對於網路的動態性質作一個相對應的實 驗,希望能夠作為一個對照;檢視網路在加入時間的因素之後,會產生什麼樣的 變化。
在之前針對小世界網路為主的各種研究,對整個網路世界影響甚鉅,不僅 為網路科學揭開了新的一頁,也為許多之前找不到最佳解,或者是之前一直無法 將其網路模型作出定義的系統,找到了研究的方向。小世界理論的貢獻像是:將 早在 1964 年由 Paul Baren 所提出的網路路由模型,做了一個大幅度的改進。在 Watts 和 Strogatz 提出了小世界理論之後,藉此理論改進 routing 效能的論文 便出現的非常頻繁,也對現在這個網際網路的規模有爆炸性成長的時代,做出了 相當大的貢獻。目前的網際網路是當初最早剛剛產生時的幾百萬倍的規模,在有 鑑於網際網路對全球經濟的重要性日益成長的情況下,我們會希望能夠有個權力 中心,能夠負責追蹤,控管整個網路的結構,成長計畫,或者是預測他可能會發 生的災害和所會影響到的規模。但是實際上的情形卻是我們非常難以對整體的網 路作出一個綜觀。在 1998 年的時候 Bill Cheswick 和 Hal Birch 經由不停反覆 的試驗,作出了如圖 3.1 的網際網路圖,讓我們對網路有了基本的了解。但是真 正的能夠了解網際網路的成長模式以及模擬其變化,也是等到了小世界理論和無 尺度網路這兩個重要的理論之後,我們才能對這類的大型網路作模擬或是控管的 動作。
圖 3.1 網際網路之 topology
雖然這個小世界理論讓我們受益如此的龐大,但是到目前為止的研究都缺 乏了對於網路之中各個節點之間的親近程度及其相互影響程度的影響,這使我想 到是否在此之中我們也可以找出小世界理論的一些 feature,讓我們可以在其中 找到更高的應用價值。在許多可能存在的 features 中,我們對區域現象特別感 到興趣,在許多的網路中,我們可以很明確察覺區域化的現象。比如說一個學校 的學生可能可以分成許多社團的群組組成,一家公司可以由不同部門的員工所組 成;但是並不是在所有的網路結構中,都會產生這樣顯而易見的區域現象。我們 希望可以找尋出在小世界網路之中所形成的區域現象,是可以應用在各個領域的 小世界網路之中,並且在面對到網路結構並沒有明確指出其中的社群狀況的情形 下,也能夠對其做出劃分區域的動作,使得我們的研究結果能夠最為有效的讓各 個領域能夠應用。
過去的研究都把網路當成是一種純然的結構,其特性為靜止固定的,但是 這和真實的情況相差很遠,雖然網路中個別份子之間的關係結構確實相當值得我 們去關心,但是其重要性主要來自於這些關係對個體或是整個系統所帶來的影 響,再者,網路是個動態的實體,不僅是因為網路系統中會有事情發生,更因為 網路本身會隨著時間演化而會有所改變的,所以希望我們的研究能夠帶入時間變 化的因素,使得我們對於區域現象的定義以及應用能夠更加完善。
3.2 區域現象的潛在影響
在我們對這小世界網路的區域現象作出定義之前,我們將先觀察這種現象 會對整體的網路造成什麼樣的影響。從許多層面看來,小世界理論對整體的網路 科學來說帶來了非常大的貢獻,而且因為他的定義非常簡單,只要是一個網路他 符合了低分隔度和高群聚度的話,我們就可以稱他為一個小世界網路。因為有如
此的定義,所以這個理論可以輕鬆的應用在所有的網路上,不需要做太多的轉 換,也不會有一般定義時會產生的只有某個領域才能用的這種問題,特別是這類 的問題常常在網路科學中產生。
然而,也是因為這種性質,雖然我們可以知道我們所存在的世界,人與人 之間的距離遠遠的比我們所要想像的還要接近。但是話說回來,到底是多麼的 近,小世界理論並沒有非常仔細的定義,甚至看起來很近的距離(很小的連結 度),但是在實質意義的距離卻並不是那麼的靠近,就像是之前有提到的電影演 員的網路,也許凱文貝肯與所有曾經演過電影的演員之間的分隔度都不高,但是 並不代表他和所有演員都關係密切。另外,分隔度低到多小才算是一個夠貼近的 距離,有可能有兩位演員他們和凱文貝肯的都同樣的分隔度只有一,表示他們曾 經合演過電影,但是也許他們其中有一位和他一同合演過四五部電影,而另一位 只是曾經在某一部電影中客串一角,但是他們在小世界網路中所展示出來的距離 卻是相同的。這也是為什麼我們想要探究這個在小世界網路中的區域現象的原 因。
另一個方面,我們知道在網路之中的個體,是很容易會被他週遭的群體影 響的。以人為例,我們知道在群眾之中,擁用著一種能夠改變個人意識的力量,
甚至可以使人為之瘋狂。在西元 1634 年時,荷蘭發生了一個被稱為鬱金香泡沫 經濟的事件 [15] 。那年,鬱金香才剛從原產地土耳其引進西歐,而且同時也在 社會上代表著一種上流社會的地位。當時在阿姆斯特丹的花市,單單是球莖就能 賣得高價。而後,由於所有荷蘭人的狂熱,在客觀價值上非常低廉的鬱金香,居 然它能夠有著和黃金甚至是鑽石一般的經濟地位。雖然後來這個鬱金香經濟沒有 多久就泡沫化了,但是由此可知,在一個群體之中每個個體之間互相的影響程度 有多大。
像這樣在一個事件當中,群眾裡的個人不再以個人立場,而開始向全體一 致的集合體採取行動,以經濟學的術語而言,這種現象稱為『資訊串連』
(information cascade) [16] 。有的時候資訊串連發生的很快,有的時候來的 非常緩慢-像是新的社會規範,例如種族平等,女性選舉權,對同性戀的接納等 等,可能要花上好幾個世紀才得以普遍。但是所有資訊串連所共有的特性是,他 一但發生就會永續的自我生存;也就是說,靠著之前事件發生時所累積的力量,
就能不斷的繼續影響到新的群體。因此,就算一開始的事件本身的衝擊力量很微 弱,他還是能在很大的體系中擴展開來。另外我們也可以找出各個群組間的網路 hub 分配點,幫助我們知道誰才是聯繫各個群組間的最主要的個體,並不一定是 連結度最大的那一個。能夠找出這個角色,能夠更有助於我們模擬觀察一個網路 的發展情況,而也會對一些類似人脈網的網路系統找出更大而且更有效率的應用 價值;像是人類的決策行為,常常會受到大群體所作出的結論而被影響。又或者 我們想要找出對整個網路最具經濟性的宣傳方法,而針對各個群組分別宣傳會更 有效率,這些都是我們之所以想要找出這區域現象的動機。
3.3 區域現象之定義
我們希望我們所提出的小世界區域現象之定義,能夠像小世界理論一般,
是能夠在所有的網路領域中都可以通用的。基於這個原因,我們以兩種出發點來 對這區域現象作出定義,並會在之後以實驗的方式來驗證我們的定義是否完善,
以及哪種定義會產生出最佳的應用結果。
3.3.1 以社會網路的角度出發之區域定義
在原本的小世界網路之中,網路的各個節點間的距離,只要是有關係,距 離就會設定為一。所以在小世界的網路之中,所說的距離其實只是節點間所會經 過的路徑長度,而且各節點間並沒有所謂的距離遠近的情形存在(如圖
3.2(a))。因此,我們並沒有找出一個適當的方法將整個小世界網路找出一個群 組現象來分割出其個別的區域。
(b) (a)
圖 3.2 小世界網路作 clustering 之示意圖
社會網路是最早注意到網路現象的領域,並開始以此為主題從事研究分 析。其最早的根源,是從人類的社會網路開始觀察。Pattison 指出社會網路是 指社會組織中,組織或是個人間相互連結的關係集合 [17] 。簡言之,社會網路 分析是研究行為者(actor)彼此之間的關係,所謂的行為者可以是個人,組織,
事件或是物件。而在分析的應用上,藉由行為者之間關係與聯繫的連結情況進行 研究與分析,將能顯露出行為者的社會網路資訊,甚至進一步觀察並了解行為者 的社會網路特徵。社會網路分析嘗試去了解這些行為者的人際關係狀況,尋找人 際關係的特徵,及發覺這些關係對個人或是組織的影響。
如果我們將這社會網路中點與點之間的關係加入小世界網路中來做更多的 分析之後,在各個節點之間的連結,就不再只是一個單純的路徑而已了,而是關 係的強弱,我們可以試著把關係的強弱轉換成關係的遠近,藉此我們可以利用一
些 clustering 的技術,將網路中的節點比較接近的分成一個個的群組,讓原本 的小世界網路產生了區域的現象(如圖 3.2(b)) 。
而為了希望能夠達到我們可以通用在各個領域的網路上的目標,我們在面 對各個不同類型領域的網路時,必須去針對他們該領域特定的方式來作關係強弱 的轉換。關係的特徵可經由四個部分來說明,分別為內容,方向,強度和主被動 關係:
z 內容:就是指兩行為者間之關係產生原因與關係建構基礎,例如:兩 行為者因為同事,同校,同班,或者是共同做過某件事情而產生了關 係。
z 方向:是指關係可以分成有方向性(directed)及無方向性
(undirected),例如兩位同事之間的關係是沒有方向性的,但是如果 長官和下屬之間的關係,就可以定義成有方向性的關係。
z 強度:這指的是關係也會有著程度不同的強度,其衡量方式會因為不 同的關係型態和研究主題而有著不同的變化。譬如同學關係可以由共 同讀過多少所學校來決定;若是以兩家公司的合作關係來看,合作的 期間長度或者是合約的金額都可以用來當做強度的依據。
z 主被動關係:關係產生時,因為行為者本身意向之主被動的不同,也 是一種關係的特徵,例如同學關係與同事關係若沒有預先的安排,通 常行為者本身對這個關係的發生,是處於被動的情況;但是若是老闆 選擇員工或者是指導教授選擇研究生等情形,一般都具有主動的選擇 權,故我們可將其歸類為主動關係。
這個定義的方法所代表的含意是一個真正對其領域的網路做出一種基於關 係強弱的分群模式,讓我們可以把原來在小世界網路中的連結改變了一種定義,
可以說是加上了權重的概念在其中,讓各點間的實際距離能夠透過這個轉換來展 現出來,讓我們對於點和點之間的實質距離能夠更為具體的定義,而有別於原本 的小世界網路架構。例如在某些情況下,搜尋到的最短路徑雖然距離較短,但是 存在著有其他的路徑具有較遠的距離,但是卻擁有較短的長度,可以讓我們可以 真正的知道在小世界網路中,雖然任何節點間的關係都看似接近,但是真正和節 點本身關係親密的節點到底是哪些。
A
C
D B
D
AB=10D
AC=3D
CD=5圖 3.3 節點之距離與長度的示意圖
在我們的定義之中,節點間的距離為兩節點間所經過的連結數,實際長度 的定義則是兩節點間實際經過的路徑長度。例如在圖 3.3 之中,節點A和B之間 的距離為1,實際長度為10。但是存在一個節點D雖然和A之間的距離為2,
比A和B的距離大,但是他們的實際長度卻只有3+5=8。故實際上D相較於 點B來說和點A比較接近。
但是這個定義也是有缺點存在的,這個的缺點就是在於此做法還不算是非 常通用的一種定義。在對於某個網路要找尋出其區域現象時,還需要具備對該領 域的專業知識,才能針對該網路節點間的關係做出強度的轉換。並不是這麼的直 觀來對這個網路作出分區是這個定義的弱點,但是在劃分區域上,被分在同一區 域的各個節點會擁有較為接近的關係。
3.3.2 以網路屬性的角度出發之區域定義
基於上述的論點,我們希望可以找出另一個定義,能夠直接對於一個網路 系統作出分類,而且可以通用在所有的小世界網路系統之中。並且,不需要太多 的專業知識就可以達到我們希望分群的目標。
在這個前提之下,我們必須考量到所有的網路所共同擁有的特性,以助於 讓所有的網路結構都能夠使用相同的步驟來找出其網路中的區域現象。所以我提 出了一個以網路本身的屬性(attribute)為出發點來分群的定義,藉以做為一個 非常有力的對照組,可以比較與我們之前的另一定義之優劣。而在所有的網路系 統中,所有的節點都共同具有連結度,分隔度和群聚度(如圖 3.4)。我們希望由 此三種網路的屬性,能夠將網路中代表相同意義的節點能夠聚集在一起,這些屬 性的計算方式如下:
z 連結度:是指一個節點他所擁有的度數,也就是該點與其他點有多少 個連結,代表這個節點在網路中與其他節點的互動情形,可以顯示出 該節點的活躍(active)程度。
z 分隔度:是指一個節點到此網路所有節點的最短路徑之平均值,可以 用來代表一個節點在其網路中所在的位置是位於中央或是邊緣,一般 來說在中央的節點的分隔度會比在邊緣的節點要來的低。
z 群聚度:這個屬性的計算方式則是一個節點他周圍鄰點所可能產生的 最大連結數除以這些鄰點實際上所擁有的連結數,代表了這個節點他 週遭的節點聚集情況的密度是密集的或是稀疏的。
我們將在這第二個定義之中,把所有連結度一樣的分成同樣的群組;或是 每個節點算出他到所有節點之分隔度的平均,將其作為分群的依據;最後就是算 出每個節點的群聚度,將擁有相同群聚度的節點是為同一群組的成員。我們將作 出各個實驗,比較個別的結果,以及或許能把這些屬性綜合起來把這個群組的區 域現象能夠更佳的呈現。經過我們不斷的觀察,分析,比較之後,希望能夠整理 出一個讓我們最為滿意的結果。
例如在圖 3.4 中,點 1 的各項屬性之計算方式為:在連結度的部分,因為 點 1 與點 2、3、4、6 相連,故點 1 之連結度D=4;在分隔度的計算上,點 1 到
圖 3.4 網路屬性計算之示意圖
各點的最短路徑分別為 1、1、1、2、1,故分隔度=(1+1+1+2+1)/5=1.2;
最後在群聚度的部分,點 1 有 4 個鄰點,此 4 個鄰點最大可能會產生的連結為(4
*3)/2=6,而這 4 個鄰點之間互相的實際連結有 2 條,故群聚度=2/6=0.33。
這個定義的方法所代表的含意是我們去用網路最直接的各項屬性來對節點 進行分區,不需要去面對到各個領域的專業問題,所以在通用性方面來說這個定 義會達到最好的效果。另外,利用這種方式所區分出來的區域現象,有可能可以 幫助我們找出一些我們本來被表面所隱瞞住的資訊內涵,可以找尋出本來不是那 麼容易發現的線索,這些都是這個定義的優點。
相反的,此定義的缺點也是顯而易見的,因為網路領域的特定關係無法算 進分群的依據之中,所以分出來的區域,我們所得到的結果有可能並不代表任何 意義。另外,針對不同的領域,我們會需要對這以某種屬性來分出來的群組做一 個解釋和說明。例如,之前提過的企業家的網路,在我們以連結度作為分群的定 義之下,會把那些擁有相同數量人脈或者是擁有類似勢力的商界人士能夠分成在 同一群組織中。然而這個分組所代表的意義,可能還是需要一番解釋之後,才能 了解其所代表的價值為何。
3.3.3 結合了社會關係與網路屬性的區域定義
基本上我們採取了前述這兩種方式雖然是截然不同的兩個出發點,但是他 們各有優劣,在我們將經過實驗,觀察比較其個別結果的優缺點。而為了能夠找 出一個最適當的區域定義,我們也提出一個能夠結合所有屬性的方法,希望以此 能夠使得這個方法融合了前述方法的優點,也能夠將前兩者的缺點有所改善。其 定義如下:
Adjusted Distance(a,b)=α*
D
ab+β*S
a− S
b + γ*Deg
a− Deg
b +δ*G
a− G
b在這個公式之中, 代表點 a 與點 b 之間的社會距離、 代表點 a 與
點 b 個別之分隔度, 表示點 a 與點 b 個別之連結度,
G
為點 a 與 點 b 個別之群聚度,而 α、β、γ、δ 則是公式中可變動之權重。D
abS ,
aS
bb
a
Deg
Deg ,
a,G
bD
ab在網路內原先所有節點間的距離 ,我們再加入了相互的 attribute 的相 似程度之計算。在分隔度、群聚度或是連結度如果數值越是接近的話,則節點間 的距離就會調整為越接近。並且再加入了 α,β,γ,δ 這四項可變動之權重來調 整個別參數對於距離影響的重要性,最後會得到一個調整過後的距離 Adjusted Distance(a,b),再以此距離來作區域現象的分群依據。
我們會將此方法所得到的分群結果,拿來和之前的兩個方法來作為比較,
檢驗此方法和個別使用社會關係和網路屬性的方法在結果上的差異性,並且探討 在什麼樣的資料來源或者是應用需求下,使用哪一個分群方法會最為適當。
3.4 加入時間面向的變化
社會網路分析學者對於結構的深入了解,開啟了某些議題之濫觴,這些問 題對純粹圖形理論而言,原本是無法探究的。但是,雖然像我們之前所說的,社 會網路為網路科學做了許多的貢獻,但是社會網路本身還是存在著一個很大的問 題,就是並沒有將網路中各節點間的動態變化列入考量。網路並不被看做是社會 力量影響之下逐步演化的實體,反而傾向於將之視為社會力量造就出來的一種架 構。網路結構被視為一組靜態的度量,用來表達所有和個體行為及影響系統行為 能力相關之社會結構所蘊含的資訊。由於網路單純結構性的靜態度量並不能解釋
發生在網路上的動態行為,這樣的方法也不能系統化地將測量結果轉換成有意義 的解釋。所以如果缺乏相對應的行為理論-動態分析的理論 [18] ,網路結構在 本質上就無法詮釋出其所想要代表的事物本質,因而在實際應用上也會有所限 制。
儘管網路結構不可忽略,但動態分析更是重要。然而,當我們使用到動態 這個詞彙時,必須細分兩個不同的意義,因為兩者將分別為網路新科學導引出不 同的分支 [19] 。
第一個意義,我們稱之為"網路上的動態學"(dynamics on the network),
從這個角度來看,我們可以把網路想成是一個串聯個體的固定平台,網路上的個 體是動態的進行尋找資訊,傳遞訊息,或是立下決定等行為。呈現出來的結果會 受到旁人所做所為的影響,也因此與網路結構息息相關。這和我們之前提到的群 體決策非常類似,討論的重點是網路中的節點互相影響的結果,所以對整體既有 網路結構來說會有所產生之動態內容或產生之作用的變化。
第二種意義,我們稱之為"網路動態學"(dynamics of the network),指 的是網路本身的結構發展變化,如網路的形成與斷裂。例如:人際關係的網路之 中,時間是一個非常重要的因素,我們有可能會結交新的朋友,但是舊的朋友,
有可能會因為太久沒有去聯絡而有了關係的消退。於是,個人的網路起了變化,
而我們所屬之社會網路的整體結構也將有所轉變。傳統網路分析的靜態結構,或 許可以被視為演化進程中的一個瞬間畫面。然而,就網路動態學的觀點,只有從 衍生過程的本質出發,才能適切地了解現存的結構。
基於以上各點,所以我們將會在我們的研究之中再加上時間的因素進去,
比對一下隨著時間的變化,整體網路的區域現象又會產生什麼樣的反應。在我們
的研究之中,我們會定義出一個時間的門檻值(threshold),當兩個節點的關係 建立的時間距離目前時間太久的話,它們之間的關係強度就會逐漸減弱,當超過 了我們定義的最大時間之後,這段關係就會隨之消失。相對的,如果兩個節點持 續的有相互之間的關係存在的話,那麼此兩點之間的聯繫也會越來越強大,也就 是這兩點之間的關係更密切。經過時間的因素加入在我們的研究架構之後,會讓 我們更能夠真實的反映出網路的變化:有可能在原本的定義中被分在同一個群組 的節點,會因為時間的變化而發現其實某些節點間的關係已經消失了;而時間的 因素也會使得在不同的時間點上會有不同的分組結果,由此就可以知道在各個時 間點上的區域關係的資訊。我們將以時間這個面向來做為一個對照,以期讓我們 的定義能夠更加完整。