第二章 資料統計特性
2.1 資料來源
如前章所述,蘇澳與漢本二站均是使用長距型的CODAR高頻雷達測流系統,
根據Fang et al. (2011),二站CODAR系統之作業方式為在接收到回波信號後即先將 其快速傅立葉轉換(Fast Fourier Transform, FFT)轉為能譜(spectrum)形式暫存,接著 約經每15分鐘累積後自動產生一組互能譜資料檔(Cross Spectrum File, CSQ File),
以及約每30分鐘系統再將前後之CSQ File進行平均,產生一組稱為短時間互能譜的 資料檔(Short Time Cross Spectrum File, CSS File) (如圖2-1)。為了有效提升訊噪比,
CODAR系統又會以經驗時間長度(一般多使用3小時,但蘇澳與漢本二站係設定使 用4小時,Fang et al. 2011)對所收集的CSS File再進行一次平均(Ramp et al., 2008),
並以此作為估算海流的基礎,二站CODAR系統每小時產出的流速資料即是根據這 種平均後的能譜所估算,會以雷達站為中心按極座標方式輸出每間隔1度方位角以 及徑向上每8.16 km一點之徑向海流資料檔(Radial Velocity File, RUV File) (如圖 2-2)。最後再將不同雷達站的同步徑向海流觀測資料回傳到中控站系統並由後者做 整合,產出合成表面海流資料檔(Total Velocity File, TUV File) (如圖2-3),徑向海流 資料檔與合成表面海流資料檔皆為每小時輸出一次。
圖2-1 2012 年 4 月 30 日 1200UTC 蘇澳站短時間互能譜資料檔(CSS File)中三支 天線回波的自能譜(auto-spectra)。橫軸為頻率(中央為 0,左側為負,右側為正),
縱軸為與接收天線的水平距離(km),顏色越亮表示回波訊號越強。
圖2-2 蘇澳站 2012 年 4 月 30 日 1200UTC 徑向海流分佈。徑向海流速度即是指 觀測區內某點海流流速指向該點與雷達站連線之射線上的流速分量,也就是海流 接近或遠離雷達站的流速分量。
圖2-3 2012 年 4 月 30 日 1200UTC 的合成海流流速分佈圖,係由蘇澳與漢本二站 徑向海流資料經中控站系統結合而成。
Fang et al. (2011)將國科會海洋學門資料庫累積之歷史海流資料與蘇澳、漢本 二 CODAR 長期觀測資料相比對,並參考二站互能譜資料中所記錄之資料品質參 數統計,最後設定了資料品質相對較好且穩定的 70 個點(如圖 1-5 所示)作為中控 站系統產生合成海流場之輸出範圍;我們在以下各章節內所使用的資料均為這類 產品。本文分析所用資料是從2011 年 4 月 14 日 2300UTC 開始,到 2012 年 12 月 31 日 2200UTC 為止,每小時一組(如圖 2-3 即為其中一例),共計 15048 組。其中 前20 個月(即由 2011 年 4 月 14 日 2300UTC 至 2012 年 11 月 30 日 2300UTC 止)共 14305 組資料將用於 EOF 以及 KLE 模分析(詳見第三章),而最後一個月(2012 年 12 月 1 日 0000UTC 至 2012 年 12 月 31 日 2200UTC 止)共 743 組資料則當作獨立 樣本,作為填補缺值實驗之根據。
如1.2 節所述,蘇澳、漢本二站有時會因各種因素影響會造成合成海流資料中 出現某些點位無資料的情形。在 15048 組觀測資料中,各觀測點出現缺漏值之數 量統計如圖 1-6,換算成百分比出現率則如圖 2-4(a)所示,可看出各點資料之最大 缺漏率幾乎都在5%以下。此外,資料中完全沒有任何缺漏值的組數為 14014,約 佔全部資料的93.13%,有缺值情況的組數為 1034,共佔 6.87%;後者中,因儀器 故障完全沒有任何觀測資料的組數則為605,佔全部資料的 4.02%;而其餘的 429 組,資料缺漏量由1 至 69 點,其百分比出現率(以總樣本數 429 計)分佈則如圖 2-4(b) 所示,其中以每組缺漏一點的情形數量最多,共 126 次,佔有缺漏值資料組的 29.37%,缺二點佔 11.42%,缺三點則為 9.79%,顯示觀測值發生缺漏情形時,約 有一半左右的情況都是在三點以內,至於其他缺漏數量情況詳見表 2-1。另方面,
將15048 組資料中所有有缺漏值的組數(共 1034 組)按其每日出現之小時數另行統 計,則每小時總共約發生30~60 次缺漏,詳細數據見表 2-2。圖 2-4(c)為每日資料 缺漏量百分比之逐時變化分佈,缺漏量之每小時出現率(以樣本數 1034 計)都在 6%
以下,但在每日UTC 時間 10 時至 20 時(約本地時間晚上 6 點到凌晨 4 點)則比較 容易發生資料缺漏情形,此時段內缺漏事件之出現率約為4~6%,與 Fang et al. (2011) 所述SCONET 海域 CODAR 系統受電離層干擾影響時間大致吻合。
(b)
(c)
圖2-4 合成海流資料點位出現資料缺漏情況之統計(2011 年 4 月 14 日至 2012 年 12 月 31 日):(a)資料缺漏之百分比分佈;(b)不完整資料中缺漏點數之百分比統計 直方圖;(c)長期統計資料缺漏百分比之平均日變化。
(a)
表2-1 合成海流資料中發生缺漏情形(共 429 組)之統計。
缺漏值個數 組 % 缺漏值個數 組 % 缺漏值個數 組 %
1 126 29.37 24 1 0.23 47 1 0.23 2 49 11.42 25 2 0.47 48 2 0.47 3 42 9.79 26 1 0.23 49 3 0.70 4 21 4.90 27 1 0.23 50 1 0.23 5 10 2.33 28 3 0.70 51 0 0.00 6 10 2.33 29 0 0.00 52 2 0.47 7 10 2.33 30 1 0.23 53 2 0.47 8 8 1.86 31 0 0.00 54 3 0.70 9 12 2.80 32 3 0.70 55 4 0.93 10 9 2.10 33 0 0.00 56 8 1.86 11 7 1.63 34 0 0.00 57 6 1.40 12 6 1.40 35 2 0.47 58 1 0.23 13 5 1.17 36 1 0.23 59 4 0.93 14 8 1.86 37 1 0.23 60 1 0.23 15 5 1.17 38 1 0.23 61 0 0.00 16 4 0.93 39 1 0.23 62 2 0.47 17 4 0.93 40 2 0.47 63 6 1.40 18 3 0.70 41 3 0.70 64 0 0.00 19 4 0.93 42 2 0.47 65 1 0.23 20 3 0.70 43 0 0.00 66 0 0.00 21 1 0.23 44 2 0.47 67 0 0.00 22 2 0.47 45 0 0.00 68 1 0.23 23 4 0.93 46 1 0.23 69 0 0.00
表2-2 長期統計資料缺漏百分比之平均日變化。
UTC Hour No Missing Missing Missing (%)
0 592 35 3.38
1 587 40 3.87
2 589 38 3.68
3 591 36 3.48
4 590 37 3.58
5 594 33 3.19
6 591 36 3.48
7 592 35 3.38
8 591 36 3.48
9 588 39 3.77
10 582 45 4.35 11 579 48 4.64 12 584 43 4.16 13 578 49 4.74 14 573 54 5.22 15 575 52 5.03 16 571 56 5.42 17 570 57 5.51 18 575 52 5.03 19 576 51 4.93 20 578 49 4.74 21 588 39 3.77 22 591 36 3.48 23 589 38 3.68 Total 14014 1034 100.00