• 沒有找到結果。

波高直方圖最佳組數與分佈函數

2-1 測站地理位置及儀器安置

本研究分析用之資料是由交通部港灣技術研究中心運輸研究所 所提供之花蓮港波浪資料。花蓮港位於台灣東部,面臨太平洋,背倚 中央山脈,地處花蓮市東北方,是一個以東西防波堤環抱而成之人工 港,其內港水深平均為 6.5 公尺。港灣技術研究中心所設置之測站位 置位於花蓮港東防波堤往南延長 380 公尺、水深 34 公尺處,於 2000 年 9 月 8 日安裝挪威 NORTEK 公司之剖面海流與表面波浪即時傳送 監測系統(簡稱 AWCP),主要收集資料為波高、週期以及波向。設置 於花蓮港觀測儀位置圖,如圖 2-1 所示。

圖 2-1 花蓮港波浪站位置圖

2-2 資料處理 (pressure transfer function),將壓力頻譜轉換成水位頻譜,此水位頻譜 經過反快速傅立葉轉換後,即可得到水位之時序值。

其中式(2-2)稱為壓力轉換函數(pressure transfer function),p為波壓,

γ 為海水比重,η表示水位,zh則分別代表儀器距水面之高程及水

求得水位的時序資料後,根據零上切(zero up cross)法,可將所得 之水位定義出波高值。一般常用的波高統計代表值(代表波)有很多 種,本研究選取Hs來計算相關波高特性,Hs(示性波)其計算方法即 以波群中波高較大的 1/3 部分的個別波波高平均值來代表,雖其不具

有特別的意義,但接近人類以目視觀測對不規則波直覺上得到的波 常態分佈主要有兩個參數,σ為標準偏差(standard deviation),μ 為平均值(mean value)。且由式(2-4)及式(2-5)推算標準偏差及平均值:

N

當λ =1/2和η =n/2,n=1,2....時,其分佈函數為卡方分佈(Chi-square distribution),亦為 Gamma 分佈的特例。當η =1時,其分佈函數為指 數分佈(Exponential distribution),亦是 Gamma 分佈的特例。

(3)Rayleigh 分佈:

( )

xa (method of maximum likelihood)來估算各種理論機率分佈函數中之參 數。 成後,根據最大概似法(method of maximum likelihood)以估算各種理

論機率分佈的參數,再依照這些參數即可求出理論的機率分佈模式。

誤差均方根 MSE 為常用之統計學上的技巧,其計算方法及定義 如下:

在波高理論分佈的直方圖(histogram)中,假設有 k 個分組區間,

n1、n2、…nk是實測資料確定的機率分佈模式中各個分組區間的機率

(2)判定係數(Coefficient of Determination)R2

表示所輸入的依變數的總變異量中,能被迴歸模式所解釋的變異

Pi=0 與|Pi-Pj|>1/N 為本研究建議用來評估的兩參數,根據施、

尹(1994)探討近海波高的機率分佈時,以卡方檢定(Chi-Square test)與 統計學中回歸分析的最小平方法,來檢定與判斷機率分佈與直方圖的 適用性,本研究亦參考其分析方法,引用卡方檢定與最小平方法,及 Kolmogorov-Smirnov test 檢定方法來判斷適用性,然而在分析過程 中,以最小平方法來檢定並無法明顯地判斷出各分佈的優劣,另兩種 檢定方法則在 99%有效水準下,各機率分佈函數均可被接受,因此 亦難以判斷各區間的分佈函數中,何種組數為最佳的分組組數。有鑑 於此,本研究提出以 Pi=0 與|Pi-Pj|>1/N 兩參數來判斷適用性 。

圖 2-2 及圖 2-3 分別表示同筆波高資料,在分成 5 組與 12 組情 況下的直方圖,其中 Pi=0 即表示當波高根據組數分組時,各組距中 有產生機率值為零的情況。由圖可看出,當分組組數越多時,間距內 的機率值為零的情況更為明顯,這是因為當分組組數越多,間距分的 過細,以致於在該間距內的機率或者次數為零。如圖 2-3 所示,分成 12 組時,於波高 0.38m 至 0.425m 中,次數為零(機率值亦為零),因 此 Pi=0 的參數記錄為 1,即代表該筆資料中,至少有一組間距機率 值是為零的情況,因此不論是否有幾組間距機率值為零,一律紀錄為 1;相反地,若無任何間距的機率值為零,Pi=0 之參數紀錄為零;即 1 與 0 代表有跟無的情況。

另一參數|Pi-Pj|>1/N(N 為分組組數)的說明如圖 2-3 所示,當各 組距中的機率值與其下一組距的機率值,相減之後的絕對值大於分組 組數倒數的情況至少發生一次以上,該參數值紀錄為 1;相反地,若 各組距中的機率值與其下一組距的機率值,相減之後的絕對值大於分 組組數倒數的情況皆無發生,該參數值紀錄為 0。兩參數的紀錄方法 相同,即 1 與 0 代表資料發生要判斷的條件有跟無的情況。

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

2-5 最佳組數與分佈函數判斷流程

根據上述分析方法,可建立一套波高直方圖的機率分佈模式分析 步驟,即由港灣技術研究中心運輸研究所所提供之花蓮港的資料,將 其資料經過處理後,可得到花蓮港之水位訊號,再行零上切法得到波 高時序值,即以此進行計算並繪出實際波高機率直方圖。由波高時序 資料,以最大概似法(Maximum Likelihood Estimator)MLE,可求解各 理論機率分佈之參數,其各參數值均落在 95%信賴區間,根據參數計 算結果即可推得理論分佈函數,最後再根據分組組數與資料分佈函數 的特性,以 MSE、R2、Pi=0 與|Pi-Pj|>1/N 等四種參數來探討最適之 機率分佈特性和最佳分組組數。

圖 2-4 波高分析流程圖

壓力形式資料轉成水位訊號 1.水位訊號 波高 2.波高 示性波高

零上切 資料收集與處理

示性波高劃分區間

直方圖分組

機率分佈函數套配

適合度判斷

選擇最佳分佈函數與 最佳直方圖分組組數

1.Gamma 機率分佈 2.Normal 機率分佈 3.Rayleigh 機率分佈 4.Weibull 機率分佈

1.RMS 2.R2 3.Pi=0 4.|Pi-Pj|>1/N

2-6 最佳組數之決定

根據上述判斷最佳組數與分佈函數之流程方法,本文將利用所收 集之波浪時序資料進行統計分析,分析資料分別以每月、每季、一年 的資料時間間隔來探討最適之機率分佈與波高分組組數的關係。

理論上不同的示性波高值,代表著不同的統計特性,因此要探討 不同示性波高下的波浪特性,應將示性波高值按其大小分成幾個區 間,再分別加以討論。分組的區間大小決定,會影響到分析的結果,

但若分組分的太過於細,不僅造成分析上的困難,時間上的經濟效益 也不顯著;反之,分組分的範圍過大,則對於整個統計動作上,分析 的結果並無法代表特殊的意義,僅能代表大範圍的示性波高下之特 性。因此本研究選取適當的示性波高劃分範圍,將不同大小之示性波 高加以區別,以分析各區間波高資料不同之機率函數的差異。

本研究示性波高分組方法,乃根據其大小將之分成六個區間,即 Hs<0.5m、0.5m<Hs<1.0m、1.0m<Hs<1.5m、1.5m<Hs<2.0m、

2.0m<Hs<3.0m、Hs>3.0m 共六區間,根據每筆波浪資料的示性波 高值(Hs),按大小將其歸類於六個區間中,逐一歸類,待示性波高分 類完畢後,將各區間所含之若干波高資料,按不同之分組組數,作直 方圖機率分佈的統計分析。

由於示性波高分組的每個區間中,其資料筆數大小不一,因此根 據中央極限定理,本研究在每區間中各取每筆的波高資料至少 30 筆 來進行分析。根據不同的資料範圍,其選取分析資料筆數亦不同,如 當分析一年之波高資料時,每區間之波高筆數大於 30 筆之可能性較 高,假設其各區間波高資料最小的筆數值為 100 筆,則進行統計分析 時,每區間採各取 100 筆來進行統計分析;反之分析資料範圍過小,

例如資料時序範圍為一個月,則可能因為資料筆數過少,導致歸類於 某些區間的波高資料筆數會小於 30 筆,則在作資料分析時,其計算 出之數據及結果,無法具體的描述於該區間的統計特性。因此,本研 究將區間波高筆數小於 30 筆之計算忽略不計,即假設於該區間筆數 過小時,可視其為偶發的狀況,或者儀器測量錯誤,以避免少數的異

常資料影響到判斷結果,並有利於分析該區間大部分的波高特性。

選定要分析的資料範圍之後,再根據四個參數 MSE、R2、Pi=0 與|Pi-Pj|>1/N,分別計算各區間各組中每筆波高資料結果,即每筆資 料分析後將會有四個參數值,再取其平均值當代表,將每區間每組計 算結果以列表表示之,以利於觀察並比較各區間不同的波浪統計分佈 特性。

相關文件