傳統網絡重抽樣方法傳統網絡重抽樣方法傳統網絡重抽樣方法傳統網絡重抽樣方法

2. 文獻回顧文獻回顧文獻回顧文獻回顧

2.2. 傳統網絡重抽樣方法傳統網絡重抽樣方法傳統網絡重抽樣方法傳統網絡重抽樣方法

2.2.1. Jackknife 摺刀法摺刀法摺刀法摺刀法

Jackknife 的網絡重抽樣方法(Frank and Snijders, 1994)，它的作法其實與我們在傳統統計裡談的方法大同小異，原本是(Quenouille 1949)提出了摺刀法，其概念就是假設a_/, a , … , a_W為來自相同母體分配 F(x)的獨立隨機變數，θ為我們感興趣的參數，且de為完整的樣本估計量，將完整的樣本分成 k 群，每群有 m 個觀察值，即n = mk。若刪除第 i 群樣本，則可以利用剩餘的 n=m(k-1)個樣本求得相同形式的參數估計量de_,。Frank and Snijders 所提出的網絡重抽樣的概念其實也是與傳統的作法雷同，每次從我們所觀察到的網絡中抽樣的時候，每次去除掉一個點，

就像小刀一樣割去一部分，同樣有多個網絡參數估計。

以下為作法的步驟：

I. 產生由一個由 N 個節點所組成的觀察網絡 G。

II. 從原本的網絡 G 依序移除掉 N 個節點，因此造出多個網絡g_/… g_O。

III. 由多個網絡 g 的網絡特徵，計算它的標準差。

IV. 上述步驟完成後，最後可以得到網絡特徵值的信賴區間。

在步驟 III 計算的標準差為：

s. e._f(g) = h0 − 1

0 5(g^9,− g_9∙)

,./

g_9,: 從步驟 II 所造出 N 個網絡g_:的統計量 Z(網絡特徵) g_9∙: N 個網絡特徵(g_9/, g₉ , … , g₉ )的平均

然而 Frank and Snijders 認為上式的標準差的乘數因子(multiplication factor)

- 19 -

N-1/N 不適用在網絡特徵的計算上，對於 jackknife 刪掉點的特性，應用在隨機的樣本中，它們之間的變異數會與他們的樣本大小成反比，所以他們認為網絡計算的標準差可能需要一個修正項藉此修正。

修正後的標準差為：

s. e._f g! h0 2

20 5 g^9, g_9∙!

,./

以下為 jackknife 重抽樣的整體概念:

圖表 14: Jackknife 重抽樣方法示意圖

由上圖可以簡單知道由網絡 Frank and Snijders 兩人提出 jackknife 的重抽樣的方法，依照刪掉點來產生多個網絡，同時每個網絡擁有網絡特徵，最後有了標準差的估計之後，使得建立信賴區間。對於重抽樣的方法，在 1994 那篇文獻中，

兩人認為 jackknife 的方式在估計網絡參數標準差的估計表現上是較好的。

- 20 -

2.2.2. Bootstrap 拔靴法拔靴法拔靴法拔靴法

Bootstrap 的方法是一種無母數的抽樣方法，最早是由 Efron 在 1979 年所提出(Efron, 1979)，最初是使用在標準差的估計。一般來說，統計推論的方法有兩種，一種是有母數的統計推論，另一種是無母數的統計推論，兩者的差異是在於對於母體有沒有做分布的假設，在研究者觀察的網絡當中，我們通常都不會知道其背後的分布是什麼，所以無母數的推論相較於之下比較適合用在網絡分析的思維。

此作法與傳統(Efron, 1979)所抽樣的方式也是差不多的，傳統方法為先假設 a_/, a , … , a_W為相同來自母體分配 F(x)的獨立隨機變數，θ為我們感興趣的參數，

其估計值為de，接著從原始的隨機樣本a_/, a , … , a_W中以取後放回的方式抽出 n 個樣本，因此得到新的一組樣本a_/^∗, a^∗, … , a_W^∗，一樣得到估計值de^∗，此方法重複 B 次，所以最後會得到估計值de^∗ 1!, de^∗ 2), … , de^∗(;)，同樣在 Snijders and Borgatti 在 1999 年提出的網絡抽樣方法(Snijders and Borgatti, 1999)，兩者都是同樣的精神去作重抽樣的估計。

以下為作法的步驟：

I. 產生由一個由 N 個節點所組成的觀察網絡 G。

II. 從原本的網絡 G，以取後放回的方式抽出 N 個點，再由這些抽出的點造出第一個網絡，同時有一個參數估計de^∗(1)。

III. 步驟二重複作 M 次(假設做 1000 次)，得到估計值de^∗(1), de^∗(2), … , de^∗(1000)。

IV. 在由多個估計值(網絡特徵值)，計算它的標準差。

V. 上述步驟完成後，最後可以得到網絡特徵值的信賴區間。

在步驟 II 由原網絡 G 抽出的點所造出的網絡G_/^∗，當中G_/^∗裡的點與點的連結

- 21 -

是根據原網絡 G 的點與點之間的連結所連成的，而抽到重複的點不會與自己相連，為一個或多個的單一孤立的點。假設在網絡 G 裡點 k 和點 h 相連可看成G_kl，另外每次利用取後放回的所造出的網絡中，第 i 次所造出的網絡G_,^∗裡的點 k 和點 h 可記成 i(k)和 i(h) ，最後做一個整理，可以把上述連結的意義簡化為：

G_kl^∗ = G_{: k!: l!}, m n >(o) ≠ >(V) 在步驟 III 計算的標準差為：

s. e._p(g) = h 1

q − 1 5(g^∗(r)− g^∗(.))

r./

g^∗(,): 第 i 個所造出的網絡G_,^∗的網絡統計量(網絡特徵值) g^∗(.): 所有g^∗(/), g^{∗( )}, … , g^∗(r)的平均

以下為 Bootstrap 重抽樣的整體概念:

圖表 15: Bootstrap 重抽樣方法示意圖

由上圖可以簡單知道由網絡 Snijders and Borgatti 兩人對於 Bootstrap 的重抽樣的方法，依照取後放回的方式來產生多個網絡，同時每個網絡擁有網絡特徵，

- 22 -

最後有了標準差的估計之後，使得建立信賴區間。

在文檔中網絡特徵之統計推論與其應用 (頁 28-32)

傳統網絡重抽樣方法 傳統網絡重抽樣方法 傳統網絡重抽樣方法 傳統網絡重抽樣方法

2. 文獻回顧 文獻回顧 文獻回顧 文獻回顧

2.2. 傳統網絡重抽樣方法 傳統網絡重抽樣方法 傳統網絡重抽樣方法 傳統網絡重抽樣方法

2.2.1. Jackknife 摺刀法 摺刀法 摺刀法 摺刀法

2.2.2. Bootstrap 拔靴法 拔靴法 拔靴法 拔靴法

傳統網絡重抽樣方法傳統網絡重抽樣方法傳統網絡重抽樣方法傳統網絡重抽樣方法

2. 文獻回顧文獻回顧文獻回顧文獻回顧

2.2. 傳統網絡重抽樣方法傳統網絡重抽樣方法傳統網絡重抽樣方法傳統網絡重抽樣方法

2.2.1. Jackknife 摺刀法摺刀法摺刀法摺刀法

2.2.2. Bootstrap 拔靴法拔靴法拔靴法拔靴法