應用系統架構 - 基於時間序列、迴歸和正規化的快速預測PM2.5方法

在本章節中會介紹到本研究的模型應用於實際生活中的系統架構，此系統的功能有以下幾點:

1. 提供實際的未來預測狀況，將本研究實際應用在生活中

2. 提供和其他預測方法的比較功能

3. 將預測成果視覺化

整體的架構如圖 39 所示。一開始我們會讀入開放的原始資料後，在 AWS 上

執行一個資料預處理的程式，接著執行我們的預測模型，便能產出未來 1-5 小時

的預測值，之後將欲處理好的資料以及預測出的結果傳送到 GCP 上保存。

GCP 負責的任務有透過 MySQL 保存資料以及提供其他預測方法一個計算

的平台，除此之外我們的呈現網頁和預測結果比對以及資料視覺化也是透過 GCP

所呈現的，任何預測方法皆可以透過 GCP 上的計算平台以及我們所保存的預處

理資料進行預測，如此一來便能達到各個預測使用同一組資料進行方法比較。

圖 39 應用系統流程圖

上面的部分介紹完了架構，接下來為實際應用部分，整個網頁系統大致上會

分為三個部分，第一部分為綜觀方法比較部分，如圖 40 所示，這部分的主要功

用為比較不同方法的誤差率，所以提供了不同方法用同樣資料預測後各小時的中

位數相對誤差，以及相對誤差的 CDF 圖進行比較。

圖 40 預測方法中位數相對誤差率比較

第二部分的功能則是提供了各個站點的詳細預測數據，以及各個測站的各自

預測相對誤差率，如圖 41 所示，可以從這一部分來觀察那些測站在預測上的表

現好壞以及過去五小時至未來五小時各個方法所有測站的預測情況如何，圖中左

半部分包含數值以及百分比數值的部分為過去 5 小時的預測數值以及和實際數值

的相對誤差率，右半部分為目前數值以及對於未來 5 小時的預測數值，我們將預

測結果的好壞分為三個等級，如果預測結果和實際誤差的相對誤差在 10%以內，

那麼我們會將結果用綠色表示，代表預測結果還不錯，如果再 10%~20%之間會

用藍色表示，若是 20%以上則用紅色表示。

圖 41 各個測站的預測數據圖

最後一部分為視覺化，我們將各個測站的預測數值搭配經緯度在網站系統中

做了資料視覺化，如圖 42 所示，我們將預測的數值分組，並使用不同顏色代表

不同的群組，方便使用者直接利用顏色分辨預測的 PM2.5 高低，此外我們也將預

測的時間序列結果建立成動態圖檔，可以從圖 42 左下方的時間控制圖示中進行

控制，讓使用者更方便了解過去 5 小時到未來 5 小時 PM2.5 的濃度變化，而圖片

中沒有顏色的範圍為目前沒有感測器可以預測的區域。

圖 42 資料視覺化

最後一部分我們比較了系統上 AIF 和 Hybrid 預測法之間對於實際資料預

測的表現，我們在 2017/03 月中將系統完整上線，但礙於 Hybrid 預測法的計算

速度以及硬體上的資源，所以我們只讓 Hybrid 預測法對於 400 個測站進行預測，

而 AIF 預測法則對 1000 多個站點進行預測。整體的結果在圖 43 顯示，可以發

現實際結果與我們在模擬實驗中表現的差不多，Hybrid 預測法在預測誤差率上表

現得比 AIF 優異許多，但因為計算速度的原因，所以預測測站點會少於 AIF。

圖 43 AIF 與 Hrbrid 預測法 2018/03-2018/05 預測結果圖

在文檔中基於時間序列、迴歸和正規化的快速預測PM2.5方法 (頁 57-61)