第三章 月極值統計特性之極值統計季節性變化
3.2 資料分析
3.2.2 箱型圖分析決定取樣資料
利用儀器蒐集現場資料的過程中,常因電壓的不穩定或其它不明 原因而產生異常的雜訊,本文分析的對象為極值資料,極易和異常雜
3-10
訊混淆不清,因此必需進一步檢定資料的合理性。本文引用統計學上 的箱型圖(Box Plot)理論進行資料之篩分,並佐以當地的海象資料以 研判資料的合理性。箱型圖架構如圖21所示
圖 21 箱型圖架構示意圖
圖21顯示,三個四分位數(即圖上p1、p2、p3點位值)構成箱型結 構,組成箱型圖主體。其箱型之長度為 p3-p1 的值,稱為分位數間隔
(interquartile range, IQR)。
進行箱型圖檢定時,首先將所有資料從小至大排序,之後判定四 分位數值。
Ii =N*i/4, i=1,2,3,4 (40)
式(40)中,N 為總資料個數。Ii為排序資料中第 i 個四分位數的位 置,pi為該位置處的資料值,稱之為第i個四分位數。估算第一四分位 數(p1)與第三四分位數(p3)時,分別取 i=1、3,即排序為第 25%
與 75%位置處的資料值,用以描述資料之離散程度;估算第二四分位 數(p2)時,取i=2,為排序第 50%處的資料值,描述資料的中位數。
由式(40)中計算出四分位數,繪出箱型主體後,須判定大於75%與 小於25%的極值波高,以 1.5倍與 3倍的IQR 劃分成觸鬚(whisker)、
雜訊(outlier)與極端雜訊(extreme outlier)三種類型。觸鬚為第一和 第三四分位數向箱型外延伸,在1.5倍IQR 範圍內的資料以直線表示。
雜訊位置為觸鬚外圍,介於1.5倍與3倍IQR 資料間,以小圓圈表示。
而大於 3倍 IQR 樣本資料以大圓圈表示,稱為極端雜訊。以月最大法 選取的花蓮港與高雄港每月最大波高資料如表 10 及表 11 所示。將表
3-11
3-12 2005 1.59 1.77 1.55 1.64 5.05 3.82 6.46 4.75 4.94 2.64 1.12 1.34 2006 1.27 1.48 1.39 1.53 6.67 4.24 5.75 4.17 1.91 1.26 1.24 1.20 2007 1.27 1.44 1.42 1.32 1.00 1.95 2.16 2.91 1.98 4.18 1.83 1.24 2008 1.27 1.39 1.39 1.19 1.40 4.53 5.27 6.12 3.53 1.24 1.38 1.14 2009 1.28 1.19 1.56 1.14 1.15 6.41 3.55 0.93 4.17 3.08 1.42 1.09
收集
3-13
1.5*IQR 0.885 0.765 0.75 0.99 1.635 3.075 7.02 6.195 5.07 5.505 2.55 1.125
3*IQR 1.77 1.53 1.5 1.98 3.27 6.15 14.04 12.39 10.14 11.01 5.1 2.25
3-14
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11
波高 ( 公尺 )
月份
圖 23 花蓮港 1990-2008 年極值波高箱型圖
依中央氣象局提供的歷年颱風資訊,1990年 6月 21日至 24日間 曾發生中度颱風-歐菲莉,颱風路徑為第六類,屬於沿東岸或東部海面 北上直接影響花蓮港的路徑;箱形圖分析得之極端雜訊波高發生於颱 風侵襲臺灣之際,該極值波高極有可能是颱風所造成,而並非儀器產 生的異常雜訊,故此極端雜訊波高被保留進行後續的分析。
3-15
圖 24 高雄港 2001-2009 年極值波高箱型圖 3.2.3 重現期的極值波高估算
利用3.1-3節所述之參數推定法推得不同分布時的尺度參數及位置 參數後,可推估各重現期的極值波高。將欲求的重現期年值T,以年為 單位,代入式(41)中可計算T年重現期的可靠度累積機率FT
1/T -1
FT (41)
將FT取代式(33)及式(34)中的Fm,可計算得T年重現期的基準化變 量yT。將尺度參數設為斜率、位置參數設為截距與 T 年重現期基準化 變量代入式(32),可得T 年重現期的極值波高xT。圖25 所示為估算 T 年重現期之極值波高流程圖。
3-16
=[-ln(1-FT)]^(1/k)Weibull
xT=AyT+B 計算
T 年重現期極值波高