第三章 研究方法
3.2 實驗設計
3.2.2 判斷連結種類
產生完對應的隨機網路之後,分別針對目標網路和其對應的隨機網路計算共 同朋友比例值與連結種類的判斷門檻值的相關參數。
針對「對應的隨機網路」,計算出外部門檻值:
1. 計算出所有「對應的隨機網路」的平均網路直徑 D。
2. 計算出網路中連結從第 1 階層到第 D 階層的共同朋友比例。
3. 計算出所有「對應的隨機網路」的第 1 階層到第 D 階層的共同朋友比例的平 均值(k1~kD)與平均標準差(σ1~σD)。
針對目標網路,計算出內部門檻值:
1. 計算目標網路中的連結從第 1 階層到第 D 階層的共同朋友比例值。
2. 找出目標網路中每一階層中通過上一階層外部與內部門檻值的連結,計算這 些連結的共同朋友比例的平均值(S2~SD)與標準差(δ2~δD)。在第一階層中沒有 上一階層,所以 S1和 δ1是直接由通過「一階外部門檻值」的連結所計算得到。
計算出所有相關數據之後,接下來依據統計的概念,我們藉由下面的步驟來 判斷複雜網路中每一條連結屬於何種類型。
1. 對於目標網路中的連結e=( , )i j 延伸一步至 L 階層(L 從 1 開始)。若是此連結 的兩端節點中,有一個節點無法延伸(iL或 jL為空集合),則此連結被判斷為
「沉沒橋接式連結沉沒橋接式連結沉沒橋接式連結」(sink bridge link)。若兩端節點皆可延伸,則繼續至步沉沒橋接式連結 驟二。
2. 計算連結 e 在第 L 階層的共同朋友比例 RL,e。若是 RL,e ≧ kL + 2σL,則連結 e 被判斷為「強鍵式連結強鍵式連結強鍵式連結」(bond link),判斷流程結束。若是 R強鍵式連結 L,e <<<< kL + 2σL, 則繼續至步驟三。(kL + 2σL稱之為「L 階外部門檻值1」)
3. 若是 RL,e≧≧≧≧ SL -δL,則連結 e 被判斷為「L 階階階階橋接式連結橋接式連結橋接式連結」(L degree of bridge 橋接式連結 link)並且繼續將連結 e 延伸至 D 階層,並且在每階層檢驗連結 e 是否轉變 為強鍵式連結。若是 RL,e <<<< SL -δL,則直接繼續至步驟四。(SL -δL稱之為「L 階內部門檻值2」)
4. 若是 L = D,則連結 e 被判斷為「全域橋接式連結全域橋接式連結全域橋接式連結」(global bridge link),判全域橋接式連結 斷流程結束。否則回到步驟一。
下圖 16 是完整演算法的流程圖(包含圖 14 的實驗步驟)。
______________________________________
1.「L 階外部門檻值」主要是判斷連結的共同朋友比例值是否高於所有對應的隨機網路的 L 階層 下所有連結的共同朋友比例值之平均加上 x 倍標準差(x 通常為 2),是判斷強鍵式連結或橋接式 連結的標準。
2.「L 階內部門檻值」主要是判斷連結的共同朋友比例值是否高於目標網路的 L 階層下所有連結 的共同朋友比例值減掉 y 倍標準差(y 通常為 1),是判斷 L 階橋接式連結的標準。
產生目標網路所
點完全分離,雖然這樣的連結對於整體網路的影響不大,但是對於末端節點卻有 非常重要的地位,因為此連結是末端節點與整體網路唯一的聯繫,所以我們將此 連結判斷為「沉沒橋接式連結」。
在第二步驟中,我們利用對應隨機網路第 L 階層中所有連結的共同朋友比例 的平均值加上兩個標準差的結果當作真實目標網路中連結的「L 階外部門檻值」,
其目的是要判斷出「強鍵式連結」,若是某個連結在第 L 階層的共同朋友比例大 於這個值,表示這條連結的兩端節點在第 L 階層具有相對較多共同朋友數,在拓 樸上與附近的連結也較為緊密,當此連結消失的時候,其兩端節點的資訊也能夠 經由這些共同朋友來傳遞,所以此連結的性質對於網路的影響較小;以統計的角 度來看,若是某連結的共同朋友比例超過門檻值代表了這樣的連結出現在對應的 隨機網路中的機率只有 2.5%左右,說明了在拓樸中這樣的連結具有統計上的顯 著特性。
在第三步驟中,我們利用真實目標網路在第 L 階層中通過「L-1 階內部門檻 值」與「L-1 階內部門檻值」的連結的共同朋友比例的平均值減掉一個標準差的 結果當作真實目標網路中連結的「L 階內部門檻值」,其目的是為了要判斷出「L 階橋接式連結」。若是某個連結在第 L 階層的共同朋友比例小於這個值,表示此 連結在第 L 階層具有的共同朋友比例相對較少,當此連結消失的時候,訊息可能 需要經更多替代路徑來傳遞或甚至是無法傳遞到目的地,因此這樣連結的性質對 於網路的影響力較大。而共同朋友比例大於門檻值的連結,其影響力只侷限在 L 階層以下,因此被判斷為「L 階層橋接式連結」。此階段為了要避免對應的隨機 網路為均勻的性質,無法看出在拓樸上連結對於區域的影響,並且避免真實網路 中強鍵式連結的共同朋友比例值對於計算內部門檻值的影響,因此我們直接利用 真實目標網路中通過「L-1 階內部門檻值」與「L-1 階內部門檻值」的連結的共 同朋友比例平均值減掉一個標準差的結果當作「L 階內部門檻值」。
在第四步驟中,若是 L 與 D(「對應的隨機網路」的平均網路直徑)相等時,
此連結的延伸範圍可能已經涵蓋整個目標網路,表示在拓樸上此連結對於整體網 路有關鍵性的影響,對於整體網路的資訊傳遞可能佔有重要的地位。因此,我們 將這種連結判斷成「全域橋接式連結」。
依據上述的判斷流程,我們能夠依照目標網路中每一條連結的拓樸特性,將 其分類成:橋接式連結、N 階橋接式連結、沉沒橋接式連結與強鍵式連結。依據 Granovetter 的強弱連結理論(Granovetter, 1973),弱連結重要性在於訊息的傳 遞,也就是說弱連結消失的時候,網路中群體之間的訊息將難以交流。因此這樣 的概念就可以說明弱連結的特性和橋接式連結的特性是相當類似的;強連結的特 性和強鍵式連結的特性是相當類似的。
上述的判斷流程當中,我們可以注意到當連結被判斷成強鍵式連結時,對於 此連結的判斷才會停止,否則一定要等到延伸路徑數與對應的複雜網路的平均網 路直徑相等時才停止。這樣設計演算法的原因是隨著目標連結延伸的路徑數增加,
所形成的子圖也就越來越大,此連結兩端的共同朋友就會越來越多,則此連結與 其他連結也就越趨緊密。因此,當某個連結在較低階層被判斷為強鍵式連結之後,
那麼在較高階層當中,此連結仍然也會是強鍵式連結;當某個連結在第 n 階層被 判斷為 n 階橋階式連結之後,那麼在第 N 階層當中(N>n),此連結有可能被判斷 為強鍵式連結並且依據上述原因而不可能被判斷為 N 階橋接式連結。依據強弱 連結的概念,在擴大網路的情況下,連結的特性只會由弱轉強,不會由強轉弱。
因此,本研究提出的演算法不單單只是依據連結在不同階層時所具有的性質分成 不同的類型,更能夠觀察到連結從低階層(區域)到高階層(全域)的性質變化,讓 我們可以更深入的瞭解每一條連結對於網路的影響。