• 沒有找到結果。

傳統網絡重抽樣方法 傳統網絡重抽樣方法 傳統網絡重抽樣方法 傳統網絡重抽樣方法

2. 文獻回顧 文獻回顧 文獻回顧 文獻回顧

2.2. 傳統網絡重抽樣方法 傳統網絡重抽樣方法 傳統網絡重抽樣方法 傳統網絡重抽樣方法

2.2.1. Jackknife 摺刀法 摺刀法 摺刀法 摺刀法

Jackknife 的網絡重抽樣方法(Frank and Snijders, 1994),它的作法其實與我們 在傳統統計裡談的方法大同小異,原本是(Quenouille 1949)提出了摺刀法,其概 念就是假設a/, a , … , aW為來自相同母體分配 F(x)的獨立隨機變數,θ為我們感興 趣的參數,且de為完整的樣本估計量,將完整的樣本分成 k 群,每群有 m 個觀察 值,即n = mk。若刪除第 i 群樣本,則可以利用剩餘的 n=m(k-1)個樣本求得相同 形式的參數估計量de,。Frank and Snijders 所提出的網絡重抽樣的概念其實也是與 傳統的作法雷同,每次從我們所觀察到的網絡中抽樣的時候,每次去除掉一個點,

就像小刀一樣割去一部分,同樣有多個網絡參數估計。

以下為作法的步驟:

I. 產生由一個由 N 個節點所組成的觀察網絡 G。

II. 從原本的網絡 G 依序移除掉 N 個節點,因此造出多個網絡g/… gO

III. 由多個網絡 g 的網絡特徵,計算它的標準差。

IV. 上述步驟完成後,最後可以得到網絡特徵值的信賴區間。

在步驟 III 計算的標準差為:

s. e.f(g) = h0 − 1

0 5(g9,− g9∙)

,./

g9,: 從步驟 II 所造出 N 個網絡g:的統計量 Z(網絡特徵) g9∙: N 個網絡特徵(g9/, g9 , … , g9 )的平均

然而 Frank and Snijders 認為上式的標準差的乘數因子(multiplication factor)

- 19 -

N-1/N 不適用在網絡特徵的計算上,對於 jackknife 刪掉點的特性,應用在隨機的 樣本中,它們之間的變異數會與他們的樣本大小成反比,所以他們認為網絡計算 的標準差可能需要一個修正項藉此修正。

修正後的標準差為:

s. e.f g! h0 2

20 5 g9, g9∙!

,./

以下為 jackknife 重抽樣的整體概念:

圖表 14: Jackknife 重抽樣方法示意圖

由上圖可以簡單知道由網絡 Frank and Snijders 兩人提出 jackknife 的重抽樣 的方法,依照刪掉點來產生多個網絡,同時每個網絡擁有網絡特徵,最後有了標 準差的估計之後,使得建立信賴區間。對於重抽樣的方法,在 1994 那篇文獻中,

兩人認為 jackknife 的方式在估計網絡參數標準差的估計表現上是較好的。

- 20 -

2.2.2. Bootstrap 拔靴法 拔靴法 拔靴法 拔靴法

Bootstrap 的方法是一種無母數的抽樣方法,最早是由 Efron 在 1979 年所提 出(Efron, 1979),最初是使用在標準差的估計。一般來說,統計推論的方法有兩 種,一種是有母數的統計推論,另一種是無母數的統計推論,兩者的差異是在於 對於母體有沒有做分布的假設,在研究者觀察的網絡當中,我們通常都不會知道 其背後的分布是什麼,所以無母數的推論相較於之下比較適合用在網絡分析的思 維。

此作法與傳統(Efron, 1979)所抽樣的方式也是差不多的,傳統方法為先假設 a/, a , … , aW為相同來自母體分配 F(x)的獨立隨機變數,θ為我們感興趣的參數,

其估計值為de,接著從原始的隨機樣本a/, a , … , aW中以取後放回的方式抽出 n 個 樣本,因此得到新的一組樣本a/, a, … , aW,一樣得到估計值de,此方法重複 B 次,所以最後會得到估計值de 1!, de 2), … , de(;),同樣在 Snijders and Borgatti 在 1999 年提出的網絡抽樣方法(Snijders and Borgatti, 1999),兩者都是同樣的精 神去作重抽樣的估計。

以下為作法的步驟:

I. 產生由一個由 N 個節點所組成的觀察網絡 G。

II. 從原本的網絡 G,以取後放回的方式抽出 N 個點,再由這些抽出的點造出 第一個網絡,同時有一個參數估計de(1)。

III. 步驟二重複作 M 次(假設做 1000 次),得到估計值de(1), de(2), … , de(1000)。

IV. 在由多個估計值(網絡特徵值),計算它的標準差。

V. 上述步驟完成後,最後可以得到網絡特徵值的信賴區間。

在步驟 II 由原網絡 G 抽出的點所造出的網絡G/,當中G/裡的點與點的連結

- 21 -

是根據原網絡 G 的點與點之間的連結所連成的,而抽到重複的點不會與自己相 連,為一個或多個的單一孤立的點。假設在網絡 G 裡點 k 和點 h 相連可看成Gkl, 另外每次利用取後放回的所造出的網絡中,第 i 次所造出的網絡G,裡的點 k 和點 h 可記成 i(k)和 i(h) ,最後做一個整理,可以把上述連結的意義簡化為:

Gkl = G: k!: l!, m n >(o) ≠ >(V) 在步驟 III 計算的標準差為:

s. e.p(g) = h 1

q − 1 5(g∗(r)− g∗(.))

s

r./

g∗(,): 第 i 個所造出的網絡G,的網絡統計量(網絡特徵值) g∗(.): 所有g∗(/), g∗( ), … , g∗(r)的平均

以下為 Bootstrap 重抽樣的整體概念:

圖表 15: Bootstrap 重抽樣方法示意圖

由上圖可以簡單知道由網絡 Snijders and Borgatti 兩人對於 Bootstrap 的重抽 樣的方法,依照取後放回的方式來產生多個網絡,同時每個網絡擁有網絡特徵,

- 22 -

最後有了標準差的估計之後,使得建立信賴區間。