第三章 簡單隨機採樣設計
3.4 執行步驟
一、採樣樣品數量之估計
欲從樣品資料推估採樣母體之特性,樣品數之多寡,會影響 估計結果的正確性,因此樣品數之選擇成為環境研究人員最重要
(一) 保守的估計:
當SRS的目的是作為健康風險評估之依據,那麼在先 前環境背景資料不足的情況下,最保守估計的方式為取最 大的樣品數量的50%作為最少樣品數量之估計。
(二) 粗略的估計:
如果只是要估計樣品的平均污染濃度,那麼首先要確 定保守之樣品數量的變化,以被期望樣品數值的範圍除以 6之估計標準偏差,即
σ=(最大期望值-最小期望值)÷ 6
不過,這只是一個粗略的近似值,並且應該是最後才 被使用。
(三) 最適採樣數(appropriate number of samples)估計:
當樣品數愈多,採樣成本雖較高,但可獲得較多的資 訊,其估計誤差會較小,正確性較高;反之,若樣品數較 少,雖採樣成本較低,但其估計誤差會較大。因此要兼顧 採樣成本及減少誤差,以取得最適當之樣品數(如圖3.1),
必須先設定一個可容許的估計誤差,來選擇樣品數。
目前公告之「事業廢棄物採樣方法」係以區間估計
(interval estimation)的方式,來推論母體的特性。也就 是 說 , 要 讓 母 體 之 估 計 值 能 落 在 一 定 水 準 的 信 賴 區 間
樣本數 成
本
最 小 成 本
最適樣本數 E
0
蒐集樣本成本
抽樣誤差成本 抽樣總成本
()
圖3.1 兼顧採樣成本及減少誤差之最適當樣品數
(confidence interval)內,所必須的低偏差、低變異之最少樣品 數,即為最適採樣數。其估算公式請參閱本章附表。
高偏差低變異 高偏差高變異
低偏差高變異 低偏差低變異
二、採樣位置之決定
(一)一維空間(one-dimensional)之採樣
當採樣母體可以很清楚的列出所有N個採樣單元(如倉庫中的 貯存桶,調查場址中的樹木)時,屬一維空間的採樣。N個採樣單 元的標示,同樣可適用於如放流管線每隔多少長度標示一個採樣 單元,或以時間作為區隔,每隔多少時間標示一個採樣單元。其 採樣數及採樣位置可使用下列步驟決定之︰
1. 標示採樣單元並編號為1到N。
2. 以抽籤方式,或使用亂數表,或利用電腦之亂數產生器,隨 機從1到N編號(或位置)中選擇n個採樣數。
(1)亂數表之使用:假設母體有800個樣品,欲從中抽取50個 樣品,此時先將800個樣品依序編號001~800,再在亂數表 上隨意找一個數字為起始點,接著可以從任何方向(上下 左右均可)。例如從表3.1第5行、第4列的數字1813 0012 3781 8635 0286開始,因為母體樣品有800個(三位數),
故依次選取三位數。此時第一個連續三位數為181,即為 第一個樣品點;接著向右選取相連的三位數字300(第二 樣品點),接著選第3個號碼123,第4個號碼781,而第5 個號碼863大於800,因此可將863減800得63,得到編號063 為第5個號碼,接著下一個號碼為 502,如此依序直至50
個樣品號碼選滿為止。
表3.1 亂數表
1 2 3 4 5 6 7 8 9 10
1
6824 7709 3937 3289 9545 0620 3904 5203 6590 87692
0237 7574 8607 1502 4776 0944 4946 1519 4834 28103
1336 8960 2192 7132 9267 4262 6070 7664 7690 38734
6840 3016 3991 8582 1813 0012 3781 8635 0286 39325
5577 7452 9477 7942 7328 0822 7876 6379 9014 68456
3495 3500 9497 8688 7764 0017 1221 5816 8840 85737
5163 5127 5955 7826 0982 3563 7783 1575 7738 91468
3746 5767 5137 3846 9113 3394 5172 3745 2574 52759
0596 6736 4273 7665 8229 6933 6510 0093 4091 456710
6553 4267 4071 3532 0593 3874 5368 5295 6303 2629(2)電腦亂數產生器之使用:可利用Window之office軟體中
「EXCEL」的「抽樣」功能下的「亂數產生器」來抽樣。
(二)二維空間(two-dimensional)之採樣
當從二維空間中採集樣品(例如土壤表面或者自湖、河流的 底部採樣)時,就必須再加上M的座標軸,並從MN交叉的單元中,
隨機選出n個採樣數。例如圖3.2所示,欲採樣之區域被標上一矩 形座標系統(x, y軸可能是緯度和經度)。然後隨機採樣點即標在
採樣位置被標定完畢。但是此時必須注意的是隨機採樣點不可落 在採樣區域以外,如圖3.2中採樣點3及4,應該刪除不可併入n個 採樣數內。
0 25 50 75 100 125 150 175 25
50 75 100
1
4 7
8
5
6
2 9
3
X 座標
Y 座 標
圖3.2 二維空間採樣位置之標示案例
但是如果隨機選擇的位置在實際採樣上,無法順利取得樣品 時,可改變採樣(隨機)位置,以代替不易接近的位置。
(三)三維空間(three-dimensional)之採樣
上述同樣的觀念,也可用在三維空間之廢棄物採樣。亦即訂 出三度空間的座標(如x, y, z),隨機取得x-,y-,及z-之相關性,
並確定採樣點之位置。雖然理論可行,但實際上,要使用採樣工 具進入一種三維空間內採集正確的核心樣品(如樣品大小、形狀 和所處的環境位置),可能是不容易或者是困難的。
三維空間採樣中最大困難是深度的問題,以及如何在正確的 深度採到核心樣品。尤其是,廢棄物堆中含有大的岩石無法穿越,
或者欲採樣的物質非常細密,像灰一樣,將引起廢棄物堆的移動 或倒塌,而無法取得代表性之樣品。因此有些應變的做法可因應 如下(Pitard, 1993):
1. 以高壓或其他方式將中空採樣管垂直打入廢棄物堆(或地下 土壤)裏,然後抽出採樣管,將此採樣管視為一維空間採樣 方式隨機採樣。
2. 依據專家知識或以往經驗,判斷預定採樣的深度(即設定z 軸為常數),並移除該深度上層之廢棄物,再以二維空間採 樣方式隨機取樣。
目前涉及採樣深度之相關公告方法或規定者,摘述於下:
1. 地下土壤:採樣深度依場址及污染物特性而定,分為淺層污 染採樣及深層污染採樣。
(1) 淺層污染採樣:一般重金屬污染或半揮發性有機物之採 樣深度以地表下0~30公分之土壤層為主,即表土(地 表下0~15公分)及裏土(地表下15~30公分)。
(2) 深層污染採樣:一般深度之參考方式有三:
a. 分別於可能的污染源位置(如地表下管線或儲槽埋設 深度)及地下水位附近抓取兩種深度的樣品;
b. 或將採樣之深度分別設於地表下0~30公分處、地表至 當時地下水面之中間區處(中間區處採樣深度間距以 自地表往下每隔1.5公尺至3公尺設一採樣點)、及地 下水位上方及下方各1公尺之區間處等三個不同之深 度;
c. 或自地表往下採至未發現污染處。
2. 河川:河寬小於6公尺時,僅於中央處設置採樣點;若河寬大
於6公尺時,則分別於左岸、右岸及河中央各設置採樣點。再 依各採樣點之實際水深於不同深度採樣:
(1) 當採樣點水深<1.5公尺時,取0.6水深處之水樣。
(2) 當採樣點水深介於1.5~3公尺間時,分別取水面下0.2、
0.8水深之兩層水,將此兩層水等體積比例混合取樣。
(3) 當採樣點水深>3公尺時,分別取水面下0.2、0.6、0.8 水深之三層水,將此三層水等體積比例混合取樣。
左岸 中央處 左岸
河川斷面< 6 m時,於中央處;
或> 6 m時,於左、中、右各 設置一採樣點 ,依水深採樣。
水 深 h
水 深 h 水
深 h
0.6 h 0.6 h
0.2 h 0.2 h
0.8 h
h < 1.5 m
取0.6 h水深之水樣
1.5 m < h < 3 m 取0.2 h及0.8 h水深之 水樣等體積混樣
h > 3 m
取0.2 h、 0.6 h及0.8 h 水深之水樣等體積混樣 0.8 h
3. 湖泊及水庫:先於湖泊或水庫選定適當之斷面採樣點,然後 再在其斷面點之中央位置進行各分層不同深度之採樣(各分 層水樣不混樣)。
(1) 表水層:水面下0.5公尺處。
(2) 中層:水深之中間處,若水深超過50公尺則中間層採 兩點。
(3) 底層:底床上1公尺處。
4. 土資場:一般土資場之開挖原則註之採樣的深度應兩倍於開 挖的寬度或直徑。
(1) 至少開挖二孔,現場埋填面積超過五公頃,每增加二 公頃開挖一孔。
(2) 開挖位置考量現場埋填區域平均分佈開挖,以不破壞 邊坡完整安全為原則。
(3) 每孔開挖面積3×3平方公尺(考量挖土機之開挖迴轉半 徑)。
(4) 每孔開挖深度5至6公尺(以二倍寬度計算)。
上 述 土 資 場 之 開 挖 原 則 註 記 載 於 台 北 縣 政 府92.03.10 北 府 工 施 字 第 0920206069號函之「台北縣政府訂定土資場違規收受廢棄物處理原則」內。
3.5 應用的案例
一、最少採樣樣品數之估計(試誤法)
某事業單位棄置若干數量之桶裝廢棄物,遭檢舉查獲有鋇
(barium)之污染嫌疑。假設鋇之毒性溶出管制標準為 100 ppm。
此時環保採樣人員應先將採樣範圍內每一容器加以編號,合理的 採樣樣品數可用試誤法(try and error method)確定,程序如下:
(一) 分析每一個樣品,得各測定值 X1, X2, X3, …。
假設先採四個樣,測值分別為:86、90、98、104
(二) 計算樣品之平均值(sample mean)、變異數(variance of sample)S2。
n Xi X
n i
∑
== 1 =
4
104 98 90
86+ + +
= 94.50
1
1
2
1 2
2
−
⎟⎟
⎠
⎞
⎜⎜
⎝
−⎛
=
∑ ∑
= =
n Xi n Xi
S
n i
n
i =
3
00 . 721 , 35 00 . 916 ,
35 −
= 65.00
(三) 查司徒頓 Student ”t.20”值,計算採樣約略數 n。
2 2 220
. Δ
= t ×S
n =
( ) ( )
( )
22
5 . 94 100
00 . 65 638
. 1
−
× = ( ) ( )
( )
22
5 . 5
00 . 65 638
.
1 × = 5.77
(四) 依計算得採樣約略數
n
=6
,即採四個樣不夠。若本案例當初就採六個樣品,其結果又有何不同?計算如下:
(一) 假設六個測值為
89
、90
、87
、96
、93
及113
。(二) 樣品之平均值、變異數
S
2。n Xi X
n i
∑
==
1=
6
113 93 96 87 90
89 + + + + +
=94.67
1
1
2
1 2
2
−
⎟ ⎟
⎠
⎞
⎜ ⎜
⎝
− ⎛
=
∑ ∑
= =
n Xi n Xi
S
n i
n
i
=
5
67 . 770 , 53 00 . 224 ,
54 −
= 90.67
(三) 查司徒頓
Student ”t.20”
值(附表一),計算採樣約略數n
。2 2 220
. Δ
=
t×
Sn
= ( ) ( )
( )
22
67 . 94 100
67 . 90 476
. 1
−
× = ( ) ( )
( )
22
33 . 5
67 . 90 476
.
1 ×
= 6.95
(四) 計算得出採樣約略數
n
=7
,因此六個採樣數仍不足。(五) 驗算信賴區間(
Confidence Interval
,簡稱CI
)。S2
S
= = 9.52
n S
X= S =
6 52 .
9 = 3.89
(
t SX)
X
CI = ± .20 ⋅ = 94.67±
(
1.476) (
⋅ 3.89)
= 94.67±5.74(六) 由信賴區間(CI)與管制值(RT)比較。
因CI= 之上限為100.41,超過管制值100。故必 須繼續採樣,且採樣數至少為七。
74 . 5 67 . 94 ±
如果本案例當初之採樣數為9的話,則摘要計算過程如下:
n Xi X
n i
∑
== 1 =
9
91 ...
90
86+ + + = 93.56
1
1
2
1 2
2
−
⎟⎟
⎠
⎞
⎜⎜
⎝
−⎛
=
∑ ∑
= =
n Xi n Xi
S
n i
n
i =
8
78 . 773 , 78 00 . 254 ,
79 − = 60.03
S2
S = = 7.75
n SX = S =
9 75 .
7 = 2.58
(
t SX)
X
CI = ± .20 ⋅ = 93.56±
(
1.397) (
⋅ 2.58)
= 93.56±3.60結果:上限為97.16,未超過管制值(100),就不用再繼續採樣。
因為即使採樣數目增加,亦無法有效接近真值。
在採樣實務經驗上,樣品應多採集一些備用(可先不予檢
雖然繁複,但除 SRS 外,系統隨機採樣或分層隨機採樣皆可參 考運用,環保人員應多加練習。相關數學方程式彙整於附表二。
二、最少採樣樣品數之估計(查表法)
一般事業單位產生之桶裝廢棄物或廢棄物場址之採樣可先 預估大概體積,再參考表 3.2 廢棄物總量大小與最少採樣樣品數 關係表,決定採樣數後,依亂數表隨機以一維空間、二維空間或 三維空間之採樣方式執行之。
表 3.2 廢棄物總量大小與最少採樣樣品數關係表
廢棄物總量 最少採樣樣品數
<1 6
1 - 5 10
5 - 30 14
30 - 100 20 100 - 500 30 500 - 1,000 36 1,000 - 5,000 50
>5,000 60 1.廢棄物總量單位:液體 公秉(kL);固體 公噸(t)。
2.資料來源:JIS K 0060 (1992) 「事業廢棄物採樣方法 Sampling method of industrial wastes 」。
3.6 與其他採樣設計之搭配
如果研究經費比採樣經費來得多的話。事實上,可以搭配採 用其他的採樣設計方法,來降低樣品的採樣數量。例如,使用分 層隨機採樣、排列組合採樣、混合採樣等,都可以減少採樣或檢 測分析的數量。
附表一 司徒頓Student ”t.20”值表
自由度(n - 1) "t.20"值 自由度(n - 1) "t.20"值
1 3.078 21 1.323
2 1.886 22 1.321
3 1.638 23 1.319
4 1.533 24 1.318
5 1.476 25 1.316
6 1.440 26 1.315
7 1.415 27 1.314
8 1.397 28 1.313
9 1.393 29 1.311
10 1.372 30 1.310
11 1.363 40 1.303
12 1.356
13 1.350 60 1.296
14 1.345
15 1.341 120 1.289
16 1.337 ∞ 1.282 17 1.333
18 1.330 19 1.328 20 1.325 1.自由度等於採樣數(n)減 1。
2. t.20 代表在兩端之可信賴區域以外機率為 0.2(雙尾,可信賴區間為 80%),即其一端之區外各為 0.1。