• 沒有找到結果。

發展時空資料補遺技術於環境監測之應用Missing Data Imputation Based on Spatial-Temporal Data for Environmental Monitoring Applications

N/A
N/A
Protected

Academic year: 2021

Share "發展時空資料補遺技術於環境監測之應用Missing Data Imputation Based on Spatial-Temporal Data for Environmental Monitoring Applications"

Copied!
7
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會專題研究計畫 成果報告

發展時空資料補遺技術於環境監測之應用

計畫類別: 個別型計畫 計畫編號: NSC94-2622-E-110-002-CC3 執行期間: 94 年 05 月 01 日至 95 年 04 月 30 日 執行單位: 國立中山大學海洋環境及工程學系(所) 計畫主持人: 張揚祺 計畫參與人員: 黃雅真、賴柏全 報告類型: 精簡報告 處理方式: 本計畫為提升產業技術及人才培育研究計畫,不提供公開查詢 中 華 民 國 95 年 6 月 29 日

(2)

國科會補助提升產業技術及人才培育研究計畫成果精簡報告

學門領域:環境工程 計畫名稱:發展時空資料補遺技術於環境監測之應用 計畫編號:NSC 94 - 2622 - E - 110 - 002 - CC3 執行期間:94 年 05 月 01 日起至 95 年 04 月 30 日 執行單位:國立中山大學海工系 主 持 人:張揚祺 參與學生: 姓 名 年 級 (大學部、碩 士班、博士 班) 已發表論文或已申請之專利 (含大學部專題研究論文、碩博 士論文) 工作內容 黃雅真 碩士班 碩士論文:發展時空資料補遺 技術於環境監測之應用

Yang-Chi Chang, Ya-Zhen Huang, Dun-Cheng Chang and Meng-Tsung Lee, Assessment of marine environment by spatial analysis in kao-ping coastal water, Journal of

Environmental Engineering and Management (JEEAM)

(Accepted)

發展整合時間與空間 維度之資料補遺技術

賴柏全 碩士班 碩士論文:應用資料探勘技術 於垃圾焚化爐作業之知識擷取 Yang-Chi Chang, Po-Chuan Lai, Meng-Tsung Lee, An integrated approach for operational

knowledge acquisition of refuse incinerators, Expert Systems

with Applications (Accepted)

協助資料採礦方法論 之應用 合作企業簡介 合作企業名稱:浩群開發股份有限公司 計畫聯絡人:羅皓鴻 資本額:伍佰萬元 產品簡介:環保相關技術服務、諮詢 網址: 電話:089-220288

(3)

研究摘要(500 字以內): 近年來永續發展已成為國際上的重要議題,許多永續發展指標也陸續被提 出,例如海島台灣、都市台灣的指標系統等。但是當我們在研究海域環境永續 指標時,赫然發現環境監測資料的缺失情況極為嚴重。資料是所有資訊的源 頭,然而原始資料往往會有各式缺失值存在,由這些充滿缺失的資料所推估的 結果,其準確性亦受質疑。是故,如果想進一步的分析資料且獲得正確的資訊, 原始資料的處理就變得格外重要。經由研究分析大致了解環境監測資料缺失值 產生的原因,例如:測量機器發生故障、檢測的樣本遭到毀壞、研究人員忘記 記錄、資料合併時有記錄沒有匹配,或因資料進行整理程序造成記錄遺失等。 分析時,亦發現資料的缺失狀態極為不同,例如:在同一時間點,空間資料缺 失某些欄位、或是缺失部分空間點的資料,以及在同一空間點,缺失少數時間 點的資料、或是缺失所有時間序列資料等。因此環境監測之缺失資料與時間和 空間具有相關性,目前應用於資料插補法大致有:針對資料型態插補、針對空 間分佈關係作插補、與針對時間數列函數作插補。因為同時考慮時間與空間相 關性的插補極少,所以本研究發展出一套結合時間與空間資訊之環境監測資料 插補法,整合相關分析技術,提升資料補遺的正確性。 人才培育成果說明: 藉由此次計畫,本研究室訓練兩位碩士班研究生,兩位的論文研究方向均 與資料分析、處理相關,賴柏全同學已經於去年畢業,他應用資料採礦技術, 分析大量的垃圾焚化廠監測資料,並獲得蘊含其中的操作準則,論文已經獲得 國際知名的 Expert Systems with Applications 期刊的接受,另外,賴同學也協 助黃雅真同學,運用資料採礦技術,整合相關的時間維度與空間維度之分析方 法,發展較傳統分析方法精確的資料補遺技術,黃同學即將於近期畢業,黃同 學參與此次計畫與之前國科會永續發展的相關計畫,累積許多分析的技術,如 空間分析的克利金方法、時序列分析的移動平均等方法、多變量統計的因子分 析主成分分析、資料採礦的類神經網路等,相關的研究成果也將發表於 Journal

of Environmental Engineering and Management,這兩位學生具備非常紮實的

資料分析、整合、處理技能,可以提供環境、工程、管理顧問業界,以及相關 產業所需的技術。

(4)

技術研發成果說明: 本研究嘗試運用克利金插補、時間序列插補、3-D 時空插補法、以及倒傳 遞類神經等四種資料分析方式,經由模擬資料補遺實驗,找出較佳之資料補遺 方法,研究發現以克利金、時間序列分別進行資料插補後,再配合倒傳遞類神 經網路,所發展出之插補模式,應可提供較為精確的資料補遺結果,以下分別 就所使用的技術做簡單的說明。 克利金法(kriging)是應用在空間插值或推估之方法,主要是利用空間中 已知觀測點為推估基礎,以統計學模式,對鄰近未知點求得最佳線性不偏估計 (Best Linear Unbiased Estimate, BLUE),由點至面分析資料之分佈。克利金內 插法假設空間變異現象具全面統計同質性(statistical homogeneity),即空間中任 一點的物理量 視為隨機變數,各隨機變數構成一隨機變域,而不同位置之隨 機變數間存在一空間變異結構,使隨機變數除受地區性變異之影響外,也受該 空間變異結構之影響,則該變異數稱為一區域化變數,由此可知區域化變數在 空間上具有 (1)局部:隨機、不規則之隨機變數、(2)整體:一般性結構化之空 間變異的特性。 一般而言,所謂時間序列(times series)係指以時間順序型態出現之一連 串觀測值集合,或更明確的說,對某動態系統(Dynamic System)隨時間連續觀 察所產生有順序的觀測值之集合。時間序列分析法之構成要素有長期趨勢 (Trend, T)、循環變動(Cycle, C)、季節變動(Seasonal Variation, S)以及不規則變 動(Irregular fluctuation, I);構成要素之間關係形成兩種時間序列模式,加法模 式(Additive model),主要是假設構成要素 T, C, S, I 之間彼此獨立,因此分析 結果可以藉由累加而得(Y=T+C+S+I);另外,乘法模式(Multiplicative model) 則是假設 T, C, S, I 之間互相影響,分析結果可以運用乘法方式來得到時間序列 的變化預測(Y=T*C*S*I)。移動平均法是在一時間序列

{ }

Zt , 內,依 次求取若干期間 k 內(年或月等)數值之趨向值。例如取五年移動平均值,在年 序列 , ,…, 中,取第一年到第五年之平均值作為第三年之移動平均數,取 第二年到第六年之平均值為第四年之移動平均數;依此類推,則第t年、 n t =1,2,..., 1 Z Z2 Zn 5 = k 之 移動平均數為:

(

Zt2 +Zt1+Zt +Zt+1 +Zt+2

)

/5

Lixin 與 Peter(2004)在”Interpolation methods for spatio-temporal geographic data”一文中,提出利用有限元素演算法推展出 3D 與 4D 之時空插補法,其中 3D 時空插補法意指二維空間加上一維時間,綜合成為三維的資料尺度,而 4D

(5)

時空插補法意指三維空間加上一維時間。不論是 3D 或 4D 之時空插補法,其 第一步便是將空間與時間維度依照數學理論中之 Solid Geometry 的演算法,設 立已知之資料網格,此演算法是經由三角網格發展而來。二維與三維空間點經 由 MATLAB 程式中”Delaunay Triangulation”的演算法可畫出網格如圖 1 與圖 2 所示。該演算法再利用補遺點所在網格之已知點資料,進行線性內插,找出補 遺點的缺失值。 圖1、二維網格圖 圖2、三維網格圖 類神經網路是一種模擬生物神經系統的資訊處理系統,生物神經系統具有 許多神經元相互連結,而每個神經元各有其輸出訊號與輸入訊號並與其他神經 元相連以傳遞訊息;所以當以電腦來模擬生物神經網路運作時,需先設計許多 處理單元(即神經元),神經元間相互連結、處理並傳遞訊息。倒傳遞網路模 式主要包括學習過程及回想過程,學習過程是利用最陡坡降法(the gradient steepest descent method),對所給予的訓練資料,在模式中逐步改善類神經元間 的連接加權值及閥值(threshold),得到一組趨近最佳的網路訓練參數,再透過 回想過程驗證此模式的學習效果及品質。模式基本架構是由神經元(或稱處理

(6)

單元,processing element, PE)組成層(layer),再由層組合為網路架構(network)。 空間插補以克利金法最常被使用,時間序列法則已被大量用於時間資料的 預測與插補,而類神經能找出目標與輸入間之關聯,所以本研究整合這三項技 術,利用克利金法與時序列法模擬形成類神經網路之輸入,以原始資料做為目 標,訓練類神經網路,建構出一新時空插補模式。因克利金插補法只考慮到空 間位置關係,而時間序列插補法只考慮時間位置之關聯;所以利用上述兩種插 補法搭配類神經網路,便可開發一套時空類神經插補法。 技術特點說明: 本計畫所研發之資料補遺模式,因為整合時間與空間維度資訊之分析方 法,預期應該可以提供較好的缺失值預測效果,經過實際測試驗證,也的確比 單一的分析方法與 3D 時空插補法的效果都還要好,雖然與最佳的單一分析方 法比較,改善幅度有限,但亦足以證明環境品質監測資料補遺,若能同時充分 利用時間與空間所蘊含的資訊,所得到的分析結果應更能貼近實際數值。 可利用之產業及可開發之產品: 該技術適用於具有空間與時間尺度的資料分析,而環境品質監測資料即是 具備這樣的性質,因此在環境相關的顧問公司,或是電腦軟體開發公司,應該 可以利用這樣的技術進行資料庫缺失值的補遺工作,以確保環境資料庫品質的 可信度。除此之外,一些自然資源的資料也同樣具有時間與空間的特性,若是 能應用這項技術,也同樣能提升資料補遺的準確性,因此也歡迎提供調查服務 或是使用這類資料的顧問公司,使用這項技術。至於在民間的運用,則適用於 房地產的價格推估,根據已經成交的部分資料,使用本項技術應該可以推估出 相鄰區域的房價範圍,提供房屋仲介公司可信的預估價格。 推廣及運用的價值: 在環境相關的顧問公司,或是電腦軟體開發公司,應該可以利用這樣的技 術進行資料庫缺失值的補遺工作,以確保環境資料庫品質的可信度,環境監測 資料往往可以提供政策評估、環境影響評估所需的基本資訊,如果因為過多的 缺失值,或是不正確的補遺,誤導運用基礎資料的分析結果,那就有失當初進 行環境監測的用意,也浪費大量資金與人力資源進行環境監測。

(7)

※ 備註:精簡報告係可供國科會立即公開之資料,並以四至十頁為原則,如 有圖片或照片請以附加檔案上傳,若涉及智財權、技術移轉案及專 利申請而需保密之資料,請勿揭露。

參考文獻

相關文件

 定之與智如是無  無智及智無所得   云何是法淨無垢  而無所有等虛空 

replacement therapy」 ,請儘可能明確列出給予 外源性 FVIII 置換療法之標準 (criteria),包 括治療時機和用量。統計部分亦請說明此指 標將如何估計,針對 missing value 的插補方 法

  以不有 (實無) 之有 (幻有) 而成於有 (能有) 有 (所有) 之宗 (妙有) 以不空 (頑空) 之空 (真空) 而現 於空 (能空) 空 (所現) 之境

在上 一節中給出了有單位元的交換環 R 上的模的定義以及它的一些性質。 當環 R 為 體時, 模就是向量空間, 至於向量空間中的部分基本概念與定理, 有些可以移植到模上來。 例如 子

第四章 連續時間週期訊號之頻域分析-傅立葉級數 第五章 連續時間訊號之頻域分析-傅立葉轉換.. 第六章

了⼀一個方案,用以尋找滿足 Calabi 方程的空 間,這些空間現在通稱為 Calabi-Yau 空間。.

下圖一是測量 1994 年發生於洛杉磯的 Northridge 地震所得 到的圖形。任意給定一個時間 t ,從圖上可看出此時間所對

「三昧空」,與上面三空中的觀空不同。這是就修空觀──三三昧的 時候,在能觀的心上 所現的空相 所現的空相