• 沒有找到結果。

自我迴歸移動平均部分整合模式在監測具長期記憶性空氣品質資料上之應用研究

N/A
N/A
Protected

Academic year: 2021

Share "自我迴歸移動平均部分整合模式在監測具長期記憶性空氣品質資料上之應用研究"

Copied!
4
0
0

加載中.... (立即查看全文)

全文

(1)

成大研發快訊 - 文摘 成大研發快訊 第七卷 第十期 - 2009年三月十三日 [ http://research.ncku.edu.tw/re/articles/c/20090313/2.html ]

自我迴歸移動平均部分整合模式在監測具長期記憶性空

氣品質資料上之應用研究

潘浙楠

1,*

、陳素足

2 1國立成功大學統計系 2輔英科技大學職業安全衛生系 [email protected] ENVIRONMETRICS 2008, 19, 209-219

業界常用統計管制圖作爲監控製程穩定性的工具,近年 來管制圖亦被應用於監測環境品質,如空氣品質及工業廢棄物 污染的改善上。然而,當製程資料呈現自我相關時,使用傳統 管制圖可能會導致誤判之狀況,例如台北市空氣品質資料的懸 浮微粒(PM10)及臭氧(O3)即呈現自我迴歸平均整合(ARIMA) 模式。因此,發展一種有別於傳統的特殊管制圖有其必要,雖 然此種適合相關資料的單變量管制圖已廣受討論,但環境資料 常呈現長期記憶(long memory)之特性,我們應該使用自我迴 歸移動平均部份整合(ARFIMA)模式,而非自我迴歸移動平均 整合(ARIMA)模式去配適它。為了監測呈現長期記憶性的環境 資料,本文提出使用ARFIMA模式的管制圖去監測呈自我相關 的空氣品質資料。一般而言,建構ARFIMA模式有兩個階段, 第一個階段係利用歷史資料建立管制界限,其中若有脫離管制狀態之異常點應予刪除再重算可供第二階段 使用的管制界限。第二階段則稱為管制圖正式使用的階段。在此階段監測資料若出現異常點,作業員必須 查明原因使製程重新回復管制狀態。茲將建構第一個階段管制圖試用上、下限的步驟簡述如下: 1.蒐集長期的空氣品質或環境污染資料(本文採用為期兩年的資料)。 2.將所蒐集的資料配適當的統計模式並估計相關的參數。若所選取的模式合適則可計算每一期資料的殘差 (即實際值與估計值間的差異)。 3.若殘差呈常態分配則可建立管制界限。 4.刪除脫離管制狀態的異常點。 5.再重新計算殘差管制圖的管制界限。 6.重複步驟4及5直到無任何異常點出現為止。 在第一階段所建立的適用上、下限即可作為監測製程在第二階段的表現。由於模式選擇的正確與否直接會 影響到管制圖在使用階段的表現,因此,我們以高雄楠梓地區的空氣品質資料為例說明如何利用ARFIMA 模式建立適當的管制圖。 根據環保署的資料,目前台灣地區共有58個空氣品質監測站。長期以來南台灣大城市高雄一直存在著嚴重 的空氣污染問題。由於中國石油公司的煉油廠及為數眾多的重工業均座落在高雄市的楠梓區。因此該地區 1 of 4

(2)

成大研發快訊 - 文摘 的空氣品質一直為民眾所詬病。本文所探討空氣品質的懸浮微粒(PM10)資料即採樣自楠梓監測站。根據楠 梓監測站所提供1999年至2002年的小時資料,本文在刪除部分遺失值並計算日平均資料後,分別得到 1999年至2000年的725筆資料及2001年至2002年的712筆資料。 在建立適當的管制圖以監測楠梓地區空氣品質資料時,在第一個階段中,我們利用1999至2000年間所蒐 集的725筆資料作為建構管制圖上、下限的歷史資料。由於PM10資料的變異數不是常數,為了使變異數穩 定,我們將PM10的資料取對數ln(PM10)後成功解決了此一問題,而ln(PM10)資料的自我相關函數值 (autocorrelation function, ACF)亦呈非常緩慢遞減,這進一步証實楠梓地區的空氣品質資料呈長期記憶的 特性,因此用ARFIMA模式配適是較佳的選擇。 根據ACF的參數選取準則,我們發現ARFIMA(0, d, 1)模 式配適ln(PM10)資料十分恰當,而且配適後殘差亦呈常態分配。

為了監測殘差值的改變,我們使用Montgomery(2004)所建議的指數平滑移動平均管制圖(exponentially weighted moving average, EWMA)持續偵測製程平均微量的變動,結果發現EWMA管制圖對非常態性資 料的偵測表現十分穩健。假設在 t 時間的殘差為 rt。EWMA殘差管制圖的統計量可寫成下式

Yt=(1-λ)Yt-1+λrt (2)

其中參數λ及呈管制狀態下的平均串長度(average run length, ARL)必須先決定。一般而言,若須偵測較小 的製程平均移動,參數λ可設定在0.1左右,至於呈管制狀態下的平均串長度我們則設定在370.8(此時誤警 率為0.27%)。在第一個階段中經配適1999至2000年725筆的殘差資料後,EWMA統計量顯示有8點超出管 制界限,在刪除8個脫離管制狀的異常點後,我們再以EWMA管制圖配適其餘的殘差資料直至所有統計量 均呈管制狀態為止。此時,ARFIMA模式再次被用來配適2001至2002年的712筆資料。經參數估算, ARFIMA模式可寫成如方程式(3)所示: (1-B)0.47 (ln(PM10 t) - 4.34) =(1+ 0.16B) εt. (3) 在第二階段中,我們首先將2001年至2002年間的712筆資料配適方程式(3),再建立EWMA殘差管制圖如 圖1所示。 2 of 4

(3)

成大研發快訊 - 文摘 圖 1. 在第二階段中使用ARFIMA模式監測楠梓地區空氣品質資料的EWMA管制圖 圖1顯示所有的殘差值均在管制界限內,顯示第二階段中ln(PM10)的EWMA管制圖資料所呈現變化樣式與 第一階段相同。因此,我們可作出以懸浮微粒PM10為主楠梓地區的空氣品質在第一階段與第二階段中並 無顯著差異之推論,即1999年至2002年為止,楠梓地區PM10所造成的空氣染並無改善跡象。 若忽略長期的自我相關,一般均採用ARIMA模式來配適時間序列資料。本研究1999至2000年楠梓地區空 氣品質資料若改用ARIMA(0, 1, 2)模式來配適,雖然該模式的殘差值無法滿足常態性假設,但經Box-Cox 轉換(λ=2 )後的殘差值已能滿足常態性假設,因此在第一階段中的EWMA管制圖是針對轉換後的殘差值進 行監測。在刪除脫離管制狀態的點後,重新對空氣品質資料配適統計模式則可寫成如方程式(4)所示: (1-B) ln(PM10t)=-.0003+(1-0.4031B-0.2883B2) ε t. (4) 在第二階段中,我們利用方程式(4)進行的2001至2002年楠梓地區ln(PM10)資料的配適。由於我們透過 Box-Cox方法對該階段的殘差進行轉換後,仍無法使殘差分配滿足常態性假設,因此EWMA管制圖是針對 未經Box-Cox轉換的殘差進行監測。 圖2顯示有二個殘差值脫離管制即呈現不穩定狀態,此時殘差管制圖的自我相關函數值(ACF)樣式明顯與圖 1不同。可見以楠梓PM10之資料為例,ARFIMA模式確實較ARIMA模式合適。若我們以錯誤的ARIMA模 式取代ARFIMA模式則可能發生假警訊(false alarm)。另外,在謹慎地執行殘差診斷後,發現ARIMA模式 無法配適殘差資料,因為殘差的變異數不是常數且並未出現較大的遞延且緩慢遞減現象。ACF是非常值得 注意的指標,因為ACF是否出現較大的遞延(lag)將有助於分辨資料是否具有長期記憶的特性。簡言之,在 第一階段中的正確統計模式的選取配適可避免在第二階段假警訊的發生。 圖 2. 在第二階段中使用ARIMA模式監測楠梓地區空氣品質資料的EWMA管制圖 3 of 4

(4)

成大研發快訊 - 文摘 由於環境或空氣品質資料常呈自我相關及長期記憶的特性,因此模式選擇的正確與否會直接影響後續監測 的表現,選擇正確的管制圖有助於我們了解某一地區空氣品質或環境污染情形是否改變。本研究以南台灣 地區空氣品質PM10之資料為例,在比較使用ARFIMA模式與ARIMA模式在監測空氣品質之間的差異後我 們發現:配適ARFIMA模式所得的殘差管制圖較配適ARIMA模式所得的殘差管制圖適當。除了可及早偵測 出異當點外,藉由殘差管制圖是否偏離原先所認定「殘差值應在管制界限內呈隨機跳動」的假設,我們即 可判斷該地區的空氣污染的情形是否有改善。上述研究成果可作為環保署在開發及裝置線上資料分析儀器 的參考。透過與各地空污監測站的連線與資料分析,環保專業人員可對環境或空氣品質的改變作出及時的 改善對策。 4 of 4

參考文獻

相關文件

在第一章我們已瞭解一元一次方程式的意義與解法,而在本章當中,我們將介紹

第四章 直角座標與二元一次方程式.

第四章 直角座標與二元一次方程式.

我們已經學過了一元一次方程式與二元一次方程式,在本章中,我們將學習一元二次

審查整理呈現資料:蒐集到的資料應先審核 是否完整、正確、合理與一致,然後利用敘

1.1.3 檢視分三個階段 。 在過去第一、第二階段 (即由1999年 1月至2000年

• External Sort: 資料太大了, 有些要放到別的地方 (硬碟, 記憶 卡, 網路上的其他電腦上, 等等等).. •

中文科 宗教教育科 文化/社會層面 個人層面 文化知識和反思