第四章 分層隨機採樣設計
4.5 應用案例
吾人欲評估在有害廢棄物焚化廠的煙囪附近表土層砷平均濃 度,是否高於一般自然土壤中砷的濃度。假設樣品從煙囪半徑500 公 尺處內取得。基於先前環境調查所收集之資料得知:(1)盛行風的區 域砷的濃度較高,(2)黏土的砷含量也較砂土高。因此依據輔助的變 異如盛行風的方向、不同土壤型態之區域,而判斷此環境調查場址呈 現出如圖 4.1 所示之分層現象。假設經費限制只能支應 60 個樣品之 採樣及檢測之情況下:
一、 依此案例,「層」已界定清楚如圖 4.1 所示。
二、 每一層的樣品數量以 Neyman 分配公式計算得出,並以此分配 數量於每一層隨機採樣。經計算結果如表4.1。
煙囪
上風處 黏土 下風處
黏土
黏土
上風處 砂土
垂直風處 黏土
垂直風處 砂土 黏土 垂直風處
砂土
下風處 砂土
半徑:500 m
盛行的風向
圖 4.1 有害廢棄物焚化廠的煙囪附近表土之分層示意圖
表 4.1 簡單隨機採樣與 SS 之統計結果比較 方法 SS
項目
簡單 隨機 採樣
下風處 黏土
下風處 砂土
垂直風處 黏土
垂 直 風 處 砂土
總計 樣品數 60 43 5 10 2 60 平均值 19.81 46.16 12.66 9.49 10.20 22.94
標準誤差 4.35 9.99 4.63 2.28 3.12 3.68
從表4.1 中之比較結果發現,同樣該地區取 60 個隨機土壤樣品,
與 60 個分層採樣之樣品有相似砷含量的評估值,但是標準誤差
(standard error)卻顯示分層採樣比隨機採樣來的低,代表分層採樣 之精密度比隨機採樣高。
上述簡單隨機採樣之平均值與標準差計算請參閱第三章。SS 之 平均值與標準差計算,條列如下:
步驟1:利用 Neyman 公式計算在總採樣數 60(n = 60)下,各分層 所分配到之採樣數
n
h:⎟⎟
⎟ ⎟
⎠
⎞
⎜⎜
⎜ ⎜
⎝
⎛
= ∑
= L
h
h h
h h h
W n W n
1
σ σ
假設每一層之母體標準偏差σh及權重 如下,則依Neyman 公式可得出各層之分配數於下表。
W
h分層 權重
W
h 母體標準偏差σh Neyman 分配數n
h下風處黏土 0.35 75 43
下風處砂土 0.15 20 5
垂直風處黏土 0.30 20 10
垂直風處砂土 0.20 5 2
步驟2:計算各層所採集樣品之平均值x 及變異數h ,所得結果彙整 於下表(可利用作為簡單隨機採樣標準公式之計算)。
2
sh
分層 平均值x h 變異數sh2 採樣數量nh 權重Wh 下風處黏土 46.16 4287.84 43 0.35 下風處砂土 12.66 107.08 5 0.15 垂直風處黏土 9.49 51.88 10 0.30 垂直風處砂土 10.20 19.52 2 0.20
步驟 3:計算分層採樣之平均值
∑
==
Lh h h
st
W x
x
1
= 22.94
當母體樣本數N 非常大時,在此例子中變異數已減少為:
x
st 的變異數 = ⎥⎦
⎢ ⎤
⎣
⎡
∑
= L
h h
h h
n s W
1 2 2
= 13.55
步驟4:標準誤差之計算
x 的標準誤差 = st
2 1
1 2 2
⎥ ⎦
⎢ ⎤
⎣
⎡ ∑
= L
h h
h h
n s
W
= 3.68三、 同樣地,再進一步將不同採樣數量之標準誤差與 95%可信賴區 間彙整於表4.2 顯示,吾人僅需採集 40 個分層之土壤樣品,即 可獲得與60 個隨機樣品相同精密度的結果。
表 4.2 不同採樣數之標準誤差與 95%信賴區間之比較 方法
項目
簡單 隨機 採樣
SS
樣品數 60 60 40 20 14 9 8 7 標準誤差 4.35 3.68 4.51 6.41 7.57 9.06 9.73 10.59 95%
信賴區間
±8.69 ±7.36 ±9.12 ±10.57 ±16.35 ±20.50 ±22.43 ±25.04
結論:
案例研究發現土壤中黏土的含量與化學物質殘留量有關。因此,
在實際規劃採樣設計時,吾人可以製作一張調查場址的地圖,圖上顯 示土壤中黏土量,並據以界定「層」之區域。本案例顯示,在採樣設 計上適當使用分層比隨機採樣可提高精密度,或減少採樣所需之數量 及成本。
4.6 Dalenius-Hodges 分層程序
Dalenius-Hodges 分層程序係用一個與初步量測結果具有高相關 性的可變數(y),來決定層與層間之最佳切斷點(cut-off point)。
一、 製表列出所有的區間(K區間),必須組合涵蓋所有範圍的y值,
令[Ai-1, Ai]分別表示出第ith個區間(i = 1, 2, 3…., K-1)的起點和 終點。列出每一層之相關觀測值Ni。
二、 計算Di = Ai-Ai-1和T = NiDi 。
三、 在每一區間i,計算
∑
。將所有的T=
= i
j j
i T
C
1
j 從第一個區間開始 累加上去。
四、 計算Q = Total/L,此處 Total =
∑
,而L 為層的數量。= L
i
Ti 1
五、 在每一區間i 計算 Ci/Q,並將此值去掉小數點,得出較高之整 數,此即該區間將被歸類哪一個層數。
計算範例
假設某地下污染場址經初步環境監測得知相關數據: 0 到 5 公 尺間之監測值為254 ppm,5 到 14 之區間為 195 ppm,其餘如圖 4.2 所示。
5 14 20 30 35 45 50
0 0
5
30
50
254 195 160 135 90 155 76
第一層
第二層
第三層
圖 4.2 某地下土壤污染場址之分層界定
由題意知y 變數從 0 到 50 公尺之間,假設限制條件為 L=3 層。
則Dalenius-Hodges 分層計算程序列表如下:
區間 Ni
(量測值) Di
(Ai-Ai-1)
Ti ( NiDi )
Ci (∑ T)
Ci/Q
(Q=225.3/3=75.1)
Rounded value 0-5 254 5 35.6 35.6 0.47 1 5-14 195 9 41.9 77.5 1.03 2 14-20 160 6 31.0 108.5 1.44 2 20-30 135 10 36.7 145.2 1.93 2 30-35 90 5 21.2 166.4 2.22 3 35-45 155 10 39.4 205.8 2.74 3 45-50 76 5 19.5 225.3 3.00 3
Total 1065 225.3
得出之結果為:第一層的 y 值包含於 0-5 公尺之間,第二層的 y 值在 5-30 公尺之間,第三層的 y 值在 30-50 公尺之間。
4.7 SS 設計之採樣數量估算公式
一、計算SS 之總平均值(overall mean)和變異數(variance of the overall mean):
L=層數
Nh=在分層h的母體數
N=總母體數,即各分層母體數之總和(N =
∑
Lh=1Nh) nh=在分層h的採樣數1. 總平均值
∑
=
= L
h h h
st W x
x
1
2. 變異數 variance of
∑
= ⎥
⎦
⎢ ⎤
⎣
⎡ ⎟⎟⎠
⎜⎜ ⎞
⎝
⎛ −
= L
h h
h h h st h
n s N w n
x
1
2 2 1
上式x ,h sh2分別為h 層之平均值及變異數。
二、各分層內之採樣數計算
n=各分層採樣數之總和(n=
∑
Lh=1nh) σh=h 層預知之標準偏差Wh=h 層之權重,
N Wh =Nh C=總預算
C0=最初固定成本
V=固定變異數 1. 平等分配公式:
L nh = n 2. 比例分配公式:nh
=
nWh3. Neyman 分配公式:
⎟⎟
⎟ ⎟
⎠
⎞
⎜⎜
⎜ ⎜
⎝
⎛
= ∑
= L
h
h h
h h h
W n W n
1
σ σ
4. 固定成本之最佳分配公式:
( )
∑
== −
Lk
h h h
h h h h
C W
C W
C n C
1 0
σ σ
5. 每一層皆有一固定邊際誤差之最佳分配
⎟⎠
⎜ ⎞
⎝ + ⎛
⎟⎠
⎜ ⎞
⎝
⎛
=
∑
∑
− =
− = L
h
h h L
h
h h
N d s W z
d s W z
n
1
2 2 2
1 2 1
2 2
1 2
/ 1
/
α α
上式 d 為每一層內邊際誤差之估計值