• 沒有找到結果。

極端降雨量其空間分布之群集特性分析

N/A
N/A
Protected

Academic year: 2021

Share "極端降雨量其空間分布之群集特性分析"

Copied!
10
0
0

加載中.... (立即查看全文)

全文

(1)

極端降雨量其空間分布之群集特性分析

陳嘉榮

興國管理學院資訊管理學系暨環境資訊與知識管理研究中心

摘 要

本文旨在探討降雨型態空間分布之群集特性,以定義空間屬性均一區,做 為區域雨量分析之依據。以臺灣北部地區38 個雨量站樣本作為研究對象,選 擇主要影響降雨空間分布之因子;如測站之空間位置、年雨量變異性、短延時 降雨型態等物理特性做為分析變量。在主成份分析結果中,顯示前三個主成份 可說明原始29 個變量之 92.9%訊息,其中第一主成份佔 82.7%為降雨型態因 子、第二主成份佔6.1%為測站空間位置因子、第三主成份佔 4.1%為年降雨變 化因子。最後,在主成份空間中,經比較兩階段群集分析與模糊聚類分析之結 果,將研究區劃分為三個降雨均一區,其分區結果除能結合地理位置之相鄰性 外,又與氣候分區結果相吻合,顯現分區之合理性,將有助於雨量區域分析工 作之進行。

關鍵詞:區域分析、主成份分析、群集分析、均一性。

A STUDY ON CLUSTERING CHARACTERISTICS OF SPATIAL DISTRIBUTION OF EXTREME RAINFALL

Chia-Jung Chen Department of Information Management

Hsing Kuo University of Management Tainan, Taiwan 709, R.O.C

Key Words: regional analysis, principal component analysis, cluster analy- sis, homogeneity.

ABSTRACT

The aim of this study is to identify the spatial distribution of extreme rainfall in Northern Taiwan and further to divide this area into three homo- geneous regions as the basis of regional analysis. Some physical character- istics of 38 recording rain gages, representing typical spacing, annual rain- fall variations, and short period rainfall patterns, were chosen to be analytic variables. By principal component analysis, these 29 variables were re- duced to three independent principal components as clustering variables.

The similarities of clustering variables between rain gages were calculated by using Euclidean distance in the principal component space. The results of two-stage cluster analysis are better than fuzzy cluster analysis, and three homogeneous regions were determined. The first subregion lies in Taipei and Tao-Yuan. The second includes Hsin-Chu and Ta-Tung and Nan-Ao in I-Lan. The third encompasses the northern coast, Kee-Lung and

(2)

I-Lan. These three regions not only have well-defined geographic bounda- ries, but also correspond to climatic characteristics. The first three principal components account for 92.96% of original variation, and depict the rain- fall patterns, positions, and annual variation respectively. The study reveals that there was a reasonable result from grouping 38 rain gages into three homogeneous regions and the results could be an aid in regional analysis of Northern Taiwan.

一、前 言

區域分析為提供未量測地點水文量訊息之重要工具,

於分析前首先需借助於均一區之劃分,其目的主要在於將 相似水文反應之測站能歸納為一區,以便於利用點或區域 資料進行區域分析。在區域分析相關研究中,均一區之劃 分大部分利用多變量統計分析方法,其中以群集分析及因 子分析較為廣泛應用。Coursey 等人[1-3]分別利用判別分 析、因子分析與群集分析等方法來定義相似洪水反應均一 區。群集分析與因子分析對於變量之選擇相當敏感,選擇 用來分區之變量必需能夠反應均一區的特性。Wiltshire[4]

將分區之變量歸納為二類,其一為機率分布之統計值,其 二為流域物理特性。NERC[5]研究中選擇面積、平均年雨 量、週期五年日雨量、主流坡度、河川頻率、土壤含水量 等變量來定義均一區。Singh[6]曾利用地形分界及土壤滲透 性等因素來分區,Dingman[7]及 Tasker[8,9]利用流量殘差 值(residual)劃分區域。Mosely[10]與 Bhaskar 等人[11]以平 均年比洪水量(Qsp)及變異係數(Cv)為變量利用群集分析將 其相似洪水反應之集水區歸納為同類。Burn[12]加入測站 之相對位置為分類變量以期分類結果能結合地理位置。

Wiltshire[13]則將平均年比流量與變異係數繪製二維圖 形,以判別分析來分類,Wiltshire[14]更進一步採用流域面 積,平均年雨量定義相似洪水反應區。Guttman[15]利用位 置經度、緯度、高程、平均年降雨量、連續最小二個月降 雨總量對連續最大二個月降雨總量之比值及分別之起始月 份等七個變量來描述降雨,並定義乾旱區。易任、葉惠中 [16]以 34 年之年降雨量數列為變量,利用主成份分析及群 集分析探討台灣中部地區年降雨量空間分布之群集特性。

楊道昌[17]取九個百分比延時流量值,利用主成份分析及 群集分析劃分南部地區流量延時曲線均一區。陳嘉榮等[18]

選擇月波浪數列之平均值、變異數及自相關函數等三個群 集變量,波浪資料劃分與颱風及非颱風季節相當符合。陳 嘉榮[19]研究中應用多變量分析之系統聚類分析法於北部 區域探討降雨分區特性,其中顯示多變量分析法能得到合 理之降雨均一區劃分結果。

本文中以北部地區為分析對象,選取可能影響降雨空

間分布之主要因子,利用多變量統計分析與模糊聚類分 析,分別來探討降雨型態之空間分布群集特性,進一步定 義降雨空間屬性均一區,提供後續雨量區域分析之研究依 據[20]。

二、區域基本資料

本研究之北部地區,行政區域包括台北、桃園、新竹、

基隆及宜蘭等縣市,西半側部份北起淡水河,南以中港溪 為界,濱臨台灣海峽,地勢較為平緩。東半側部份北起磺 溪、雙溪,南迄於和平溪流域,毗鄰太平洋。南部中央山 脈之山岳區,地勢較為陡峻,海拔高度600 公尺以上,其 地形如圖1 所示。本區幅員面積約 7,400 平方公里,區內 大小河川遍佈,流域水系有明顯差別,可分為東、西二部 份。西側有淡水河、南崁溪、老街溪、社子溪、鳳山溪、

頭前溪及客雅溪等河川流經而注入台灣海峽。東側有磺 溪、雙溪、福德溪、頭城溪、蘭陽溪、冬山河、新城溪、

蘇澳溪、南澳溪及和平溪等河川流經且注入太平洋,其中 以淡水河、頭前溪及蘭陽溪三個流域為主。在地理位置上,

位於台灣本島北端,且三面臨海,西側濱臨台灣海峽,東 側接鄰太平洋,台北、新竹地區與基隆地區及宜蘭地區均 表現出氣候上之顯著差異性[21]。本區域冬季受東北季風 影響特別顯著,在東北角、基隆及宜蘭地區,形成冬季多 雨的現象。因此東側部份降雨特性與西側部份形成明顯差 異性,如圖2 所示之平均年降雨等雨量線圖,東半部平均 年降雨量達 5,000 公厘以上,相對地西半部年雨量均在 3,000 公厘以下。本研究中選定記錄年數 15 年以上之 38 個測站做為分類樣本,其中包括降雨記錄、相關座標及高 程等資料[22]。

三、理論方法

本研究中主要應用主成份分析來篩選出影響降雨量空 間群集特性之決策變量,再進一步於主成份空間中分別利 用兩階段群集分析與模糊聚類分析法,進行降雨特性均一 區劃分之探討與比較,其方法介紹如后。

(3)

圖1 北部地區地形等高線概要圖 (m)

1. 主成份分析

主成份分析是一種以少數成份來表示多變量訊息之統 計技術,通常變量間彼此存在某種程度之相關性,可藉由 主成份分析來將原先座標系統轉換成一個各軸間是正交 (orthogonal)的新座標系統,亦即新變量間是相互獨立。其 中每一主成份均說明部份的原始變量訊息(變異數),並依 佔 有 之 多 寡 依 次 排 列 , 而 由 主 成 份 之 因 子 負 荷(factor loading)中可知其與原始變量間之相關程度,可做適當的物 理解釋。故本文採用主成份分析來消除分析變量間之相關 性、降低變量維度及萃取重要訊息提供適切之現象解釋。

相關分析步驟摘要如下[23,24]:

(一) 先將每一個變量的觀測值給予標準化,使其具有零平 均值及單位變異數。因為主成份分析主要的目的在將 P 個具有相關性的原始變量 Xi轉換為P 個不相關的新 變量Yi (稱為主成份),各主成份與原始變量間存在著 線性轉換關係,可用矩陣表示為:

X C

Y = ⋅ (1)









=









⋅⋅

⋅⋅

⋅⋅

⋅⋅

=

P Pn P

P

n n

Y Y Y

y y

y

y y

y

y y

y

Y M M M M

2 1

2 1

2 22

21

1 12

11

(2)









=









⋅⋅

⋅⋅

⋅⋅

⋅⋅

=

P Pn P

P

n n

X X X

x x

x

x x

x

x x

x

X M M M M

2 1

2 1

2 22

21

1 12

11

(3)

圖2 北部地區平均年等雨量線圖 (mm)

[

P

]

PP P

P

P P

C C

C c c

c

c c

c

c c

c

C L

M M

M 1 2

2 1

2 22

21

1 12

11

=









⋅⋅

⋅⋅

⋅⋅

⋅⋅

= (4)

其中n 為觀測樣本數,C 為 P×P 維的係數矩陣,用來定義 原始變量與主成份間的轉換關係,為一正交矩陣且滿足

I C

C⋅ ′= C′C 矩陣的逆矩陣(inverse matrix),I 為單 位矩陣。

(二) 原始變量經標準化後,計算各變量間的相關係數可以 組成相關矩陣:









=

PP P

P

P P

r r

r

r r

r

r r

r R

L M M M M

L L

2 1

2 22

21

1 12

11

(5)

式中

r

ij為第i 變量與第 j 變量間之相關係數(i, j=1,2…,P)。

(三) 計算相關矩陣 R 的特徵值λ1,λ2,…,λP (即為主成份的變 異數)及特徵向量

(四) 因子負荷

主成份Yk與變量Xi之相關係數矩陣,又稱為因子負荷 量矩陣。因Xi已經標準化處理則σi=1,因子負荷量可 以下式表示:

k ki

ki C

a = λ (6)

式中Cki為第k 主成份第 i 變量之特徵向量值。由各主 成份與原始變量間之因子負荷量,即可見該主成份與 原始變量間之關係。

(4)

(五) 方差最大正交旋轉(varimax rotation)之因子負荷量[25]

經由步驟(4)求出之因子負荷量,往往不能突出地解釋 原始變量與主成份間之關係,因此需對因子負荷矩陣 施行旋轉,使得因子負荷量之平方值向0 與 1 做極化,

以便於解釋原始變量與主成份間之關係。為達到將因 子負荷矩陣簡單化之目的,經正交軸旋轉後須使(7)式 值極大化。

2 1

2 2

2 1

2

=

=



m

i ki k

a a a

V m Max

k (7)

其中 2

ak為第k 個主成份在 m 個變數上因子負荷量平方值之 平均數, 22

ak

V 是第 k 個主成份上各因子負荷量平方值之方 差。

(六) 主成份選取

為降低原始變量維度以達精簡資料之目的,可選用較 少之主成份替代原始大量的變量訊息。目前尚無固定 準則來適當選取成份個數,本文選取前P 個最大特徵 值之主成份變異數總和達全部主成份變異數總和之 90%以上即選用[25]。

2. 二階段群集分析

群集分析是一種能根據相似性與相異性客觀地進行物 以類聚的邏輯程序,其目的在於辨認某些事物的相似特 性,並將這些事物依照此特性劃分成幾個群集,使同一群 集內之事物具有高度之均一性(homogeneity),而不同群集 間之事物具有明顯的異質性(heterogeneity)。Anderberg[26]

建議基於經濟性、簡單性與有效性之理由,可先由階層分 群(hierarchical cluster method)法求得概略分群結果後,再 進行非階層分群法(non-hierarchical cluster method)求得更 精確之分析結果。Punj and Stewart[27]歸納比較各種分群方 法,發現華德法(Ward's method)[28]為階層分群法中分群效 果較佳的方法,同時建議第一階段採用華德法以求得初始 分類,再以非階層分群法進行第二階段分類工作。

(一) 階層群集法

階層群集法是群集分析中應用最廣泛的一種方法,凡 具有數值特徵變量之樣本均可採用此法進行分類。

Ward[28]提出離差平方和法(squares sum of dispersion method),亦稱華德法,它基於方差分析概念,類若區 分得宜則同類樣本之間離差平方和應當較小,類與類 之間的離差平方和應當較大。假定已將具有m 個變量 n 個樣本分成 T 類,Xikt表第t 類第 i 個樣本之第 k 個變量,nt表示第t 類樣本之個數, X kt表示第t 類第 k 個變量的重心,則第 t 類中樣本的離差平方和是:

∑∑

= =

= nt

i m k

kt ikt

t X X

S

1 1

)2

( (8)

其中

( )

Xkt n X

t ikt i

nt

=

=

1

1

(9)

T 個類的總類內離差平方和:

( )

∑∑∑

= = = =

=

= T

t n i

m k

kt ikt T

t t

t X X

S S

1 1 1

2 1

(10)

Ward 提出先使 n 個樣本自成一類,此時 S=0,然後將 其中某兩類合併成一類,使S 增加最少,這時類的數目變 為(n-2)個,隨後再合併其中兩類,使 S 增加最少,直到所 有樣本都歸為一類為止。計算類與類間之距離後,可繪製 群集譜系圖(hierarchical diagram)進行樣本之分類。至於適 當之分類數目一般依據群集譜系圖及以下之準則決定之 [23]。

(1) 任何類必須與鄰近類有顯著差異,即各類間重心 之距離必須極大。

(2) 在各類中所包含的元素都不要過份地多。

(3) 分類的數目必須符合實用目的。

(二) 非階層群集法

階層群集法在其分類過程中,群集一旦形成即不再拆 散。而非階層群集法則在各階段分類過程中,均將原 有群集全部拆散,並重新組合新的群集。多種不同的 非階層群集法中以K 均值法(K-means method)較為廣 泛,其演算步驟如下[26]:

(1) 將所有樣本點分割為 K 個原始群集,此 K 個群集 重心稱為「種子點」(seed points)。

(2) 計算某一樣本至各群集重心之距離(採用歐氏距 離),然後指定該樣本至距離最近群集中,再重新 計算得到新樣本群集和失去該樣本群集之新重 心。

(3) 重覆步驟(2)直到各樣本不須重新指定到各群集 中。

為客觀地檢定群集分析之結果,本文選擇多變量變方 分析顯著性檢定中的魏氏Λ 值(Wilk's Λ )來檢定群集間是 否有明顯之差異性,定義如下[29]:

t e e h

e

Q Q Q Q

Q =

= +

Λ (11)

其中Qt代表總體之平方與交叉乘積和(sum of squares and cross product, SSCP)矩陣,Qe代表組內SSCP 矩陣,而 Qh

代表組間之SSCP 矩陣,倘若Λ<Uα(p,g−1,n−g) 則群集間有明 顯之差異性(其中α 為信賴度,p 為變量,g 為群組數,n 為總樣本數)

(5)

3. 模糊聚類分析

傳統的分類方法(如 c-mean)乃根據適當的統計量,將 母體分割成若干族群,但有時因考慮因子過多而影響效 能。在許多研究領域中,存在著許多不嚴謹或模糊的概念,

即所謂的模糊性,主要是指客觀事物差異的中間過渡之不 明確性,例如洪水對農業生產量的影響程度為「嚴重、重、

輕」,不同集水區之水文現象為「頗為相似、不相似」這些 通常是屬於客觀模糊。而為處理這些模糊概念的數據之聚 類問題,產生了模糊聚類分析(fuzzy clusterung)。Bezdek[30]

提出模糊 c 平均分類法(fuzzy c-mean clustering method, FCM)來改善 c-mean 分類法,近來模糊聚類分析已廣泛應 用於各學科領域[31-34],例如 Wang and Bell[35]利用模糊 聚類分析對學生在解答物理問題的想像力上作多因子評 價,Mukherjec et al[36]採用 FCM 對水質作分析以觀測生 物上的大腸桿菌。

在模糊聚類分析中有兩個基本方法,其一為模糊c 平 均分類法,另一法乃根據模糊等價關係計算,稱為模糊等 價關係聚類法(fuzzy equivalence relation clustering method, FERCM)。FCM 與傳統分類法最大不同在於隸屬度函數與 特徵函數之差別,此演算法中當 m→1 時則分類結果愈驅 近於傳統分類法,反之當 m→∞時則分類結果愈模糊。由 FCM 中需先給定聚類數 c、一個實數 m 及收斂值ε,當 問題並無給定分類數目時,則是一個不利的條件。此時依 據模糊分類關係的分類法,則可自然地由資料結構反應出 聚類中心的數目,而每個模糊關係對於每個分割(partition) 均可導出明確的分類。因此本文採用模糊聚類分析中之模 糊關係分類法來探討降雨空間分布之群集特性,並與前述 方法作一比較。

(一) 模糊集合

對於一個普通的集合 A,空間中任一元素 x,要麼 x∈A,要麼 x∉A,二者必居其一,這一特徵用一個函 數表示為A(x)={1,x∈A; 0, x∉A}則稱 A(x)為集合 A 的特 徵函數。設X 為論域,若集合 A 內各元素 x 之特徵函 A(x)推廣至[0,1],則稱集合 A 為模糊集。若集合 A X 上的任一模糊集,對任意 0 ≤ λ ≤ 1,記 Aλ={x|x∈X, A(x)≥ λ},稱 AλA 的 λ 截集。Aλ是普通集合,而不 是模糊集,它的特徵函數為Aλ(x)= {1, A(x) ≥ λ;0, A(x)<

λ}。由於模糊集的邊界是模糊的,如果要把模糊概念 轉 化 為 數 學 語 言 時 , 需 要 選 取 不 同 的 置 信 水 平 λ(0≤λ≤1),來確定其隸屬關係,λ 截集就是將模糊集轉 化為普通集合的方法,而模糊集A 是一個具有游移邊 界的集合,它隨λ 值的變小而增大,即當 λ1< λ2時,

有 Aλ1Aλ2。若一個矩陣元素取值為[0,1]區間內,則稱 該矩陣為模糊矩陣,A 和 B 是n×m 和 m×l 的模糊矩 陣,則它們的乘積C=A.B 為 n×l 矩陣,其元素表為

l j

n b i

a C m ik kj

k

ij 1,2,3...,

,..., 3 , 2 , ) 1

(

1 =

∧ =

=

= (12)

其中運算子(operator) “”及“”,例如 ab =max(a,b),

ab =max(a,b)。

(二) 模糊分類關係

模糊聚類分析是在模糊分類關係基礎上進行聚類,從 集合的概念出發,來定義模糊分類關係。設X, Y 為兩 個集合,令X×Y=

{

( yx, )| xX,yY

}

,則稱X×Y X 的乘積空間,又稱笛卡爾積。R 為X×Y上的一 個集合具有等價性質,並且滿足三個特性的集合稱為 一模糊分類關係。其定義如下:

(1) 自反性:(x,x)∈R,即集合中每一個元素和它自 己同屬一類。

(2) 對稱性:若(x,y)∈R,則(y,x)∈R,即集合中 )

,

( yx 元素同屬於類R 時,則( xy, )也同屬於R。

(3) 傳遞性:(x,y)∈R(y,z)∈R,則有(x,z)∈R 聚類分析的基本思想是用相似性尺度來衡量事物 間的親疏程度,並以此來實現分類。而模糊聚類 分析的本質就是根據研究對象本身的屬性而構造 模糊矩陣,在此基礎上根據一定的隸屬度來確定 其分類關係。R 為 X 上的一個分類關係的充分必 要條件為(1)rii=1 (2) rji = rij (3)R·R R,式中 rij 樣本i 與樣本 j 之相似關係。當模糊分類關係 R 確 定後,對於給定的λ[0,1],便可相應地得到普通 分類關係 R,亦即決定一個λ 水平的分類。對每 一個λ(0 λ 1),Rλ為普通的分類關係。

(三) 模糊關係聚類法

利用模糊集理論進行聚類分析,需先對於原始數據進 行轉換或標準化處理,以消除不同變量數量級之差 異。相關演算步驟簡述如下[34,35]:

(1) 模糊相似矩陣

通常可取系統聚類分析之相似係數或距離等方法 來計算各樣本間的相似關係(rij),為使它成為模糊 相似矩陣,將相似係數或距離壓縮到[0,1]的區間 內,R=(rij)即構成一個模糊相似矩陣。相似係數或 距離等方法甚多,在此不詳加贅述,例如夾角餘 弦法、相似係數法、絕對值減數法等等。本研究 於此採用夾角餘弦法[19],通常可取[-1,1]區間中 的普通相似係數rij*=cosQ=cos(i,j)構成相似係 數矩陣,使它成為模糊矩陣,而又不改變原來各 元素的對應關係,其轉換式表為 12

*

rij

rij= + ,其中rij 被壓縮到[0,1]的區間內,其為樣本 i 與樣本 j 之相 似關係。

(2) 模糊等價矩陣

對模糊相似矩陣進行褶積計算;R R2 R3

(6)

表一 主成份分析中原始變量之相關係數矩陣(部分) Variable X Y P CV E R1

X 1.0000 0.2006 0.5544 0.3074 -0.2353 0.1652 Y 0.2006 1.0000 -0.0024 -0.2370 -0.4836 -0.1655 P 0.5544 -0.0024 1.0000 0.1519 0.2611 0.5714 CV 0.3074 -0.2370 0.1519 1.0000 -0.1024 -0.0278 E -0.2353 -0.4836 0.2611 -0.1024 1.0000 0.1722 R1 0.1652 -0.1655 0.5714 -0.0278 0.1722 1.0000

表二 前九個主成份之特徵值 Principal

component

Eigenvalue (Variance)

Percent (%)

Accumulation (%) Y1 23.9970 82.7483 82.7483 Y2 1.7687 6.0989 88.8472 Y3 1.1929 4.1134 92.9606 Y4 0.9604 3.3117 96.2723 Y5 0.4677 1.6126 97.8849 Y6 0.3595 1.2396 99.1245 Y7 0.1596 0.5502 99.6748 Y8 0.0635 0.2189 99.8937 Y9 0.0149 0.0512 99.9449

Rn,這樣經過有限次褶積後,使得 Rn R=Rn,由此得到模糊等價矩陣Rn。在實際處理過 程中,為加快收斂速度,通常採取平方法進行褶 積處理;R R2 R4 R6 R2nR 自乘的 概念是依最短距離法原則,尋求兩個向量XiXj 的親密程度。假設 R2=(r′ij),即 1(ik kj)

n

ij k r r

r=

= ,說

XiXj是通過第三者Xk做為媒介發生關係,因 k 是任意數,故一切rikrkj中尋求一個使XiXj 關係最密切的通道。

(3) 動態性聚類

對滿足傳遞性的模糊等價矩陣R 進行聚類處理,給 定不同置信水平的λ 值,求取 R 的 λ 截矩陣(Rλ),

矩陣內元素為1 的兩個樣本相互併為一類。當 λ=1 時,每個樣品自成一類,隨λ 值的降低,由細到粗 逐漸歸併,最後得到動態性的聚類譜係圖。

四、雨量空間分布群集特性分析

1. 決策變量選取

群 集 分 析 與 因 子 分 析 對 於 變 量 之 選 擇 相 當 敏 感 [14,37],因此用來分析之變量必需能夠反應均一區的特 性,其選擇一般遵循兩個原則:(1)變量對於研究之問題有 直接密切的關係;(2)變量對空間屬性有較強的分辨能力。

由於本文主要目的在於劃分降雨空間屬性均一區,使相同 均一區內之測站具有相似型態的降雨-延時曲線(IDF),其

表三 方差最大正交旋轉後之前三個主成份的因子負

荷量(部分)

Original variable Principal component Symbol Definition Y1 Y2 Y3

X 經 度 0.2674 0.8496 0.4546 Y 緯 度 -0.4955 0.7713 -0.3993 E 標 高 0.5671 -0.8161 -0.1117 P 平均年降雨量 0.8611 0.5066 0.0417 Cv 年降雨量變異係數 0.1536 0.1553 0.9759 R1 平均年最大1小時降雨 0.8779 0.2774 -0.3903 R2 平均年最大2小時降雨 0.9926 0.0910 -0.0803 R3 平均年最大3小時降雨 0.9994 0.0307 0.0188

圖3 華得法聚類分析結果譜系圖

採用的變量需能反應出各分區降雨型態之差異特性,且又 需結合空間位置分布,以便於爾後進行區域雨量分析。在 分析各測站對降雨空間屬性影響較大之可能因素(factor),

其中平均年降雨量是空間降雨的指標,能反應雨量空間分 布的長期特性,其變異係數則能表現歷年來年降雨量的統 計分布的特性,而降雨型態曲線則能反應短期降雨延時分 布特性。因此本文在變量之選取上,選取三組主要影響降 雨時間、空間分布與變化特性之因子,其包括:(1)測站空 間位置:選取測站之經度、緯度、高程三個變量來描述雨 量站的三度空間位置;(2)長期降雨特性:以平均年降雨量 及變異係數來描述年雨量空間分布與變化特性;(3)短期降 雨特性:以平均年最大1 小時,2 小時,

K

,24 小時降 雨量時間分布曲線來表達短延時降雨曲線型態特性。總計 選取29 個分析變量[19]。

(7)

表四 兩階段群集分析結果 Method of cluster

analysis

Method of cluster analysis Station

No. Ward K-mean

Station

No. Ward K-mean 012001 3 3 030140 1 1 012006 3 3 030143 1 1 030037 3 2 035002 1 1 030038 1 1 080005 3 3 030050 1 1 100002 2 2 030064 1 1 100012 3 2 030065 1 1 100026 3 3 030069 3 3 100043 2 2 030080 1 1 100051 3 3 030081 1 1 120003 3 3 030083 1 1 120004 3 3 030105 3 3 130003 2 2 030106 3 3 130006 2 2 030121 1 1 130012 2 2 030124 1 1 130026 2 2 030125 1 1 130027 2 2 030128 3 3 180001 2 2 030135 1 1 180002 2 2 030138 3 3 200007 2 2

4 模糊聚類分析結果譜系圖

2. 主成份分析結果

由於前述所選定之變量間可能存在相關性,不宜直接 利用歐氏距離計算樣本間之相似性測度及進行群集分類工 作。故應先將變量利用主成份分析來消除其中之相關性,

並選取重要之主成份作為聚類分析之輸入變量。將原始變 量進行主成份分析,計算其相關係數、特徵向量及特徵值,

圖5 北部地區雨量站屬性均一區分布圖

圖6 北部地區降雨空間屬性均一區分區圖

從表一相關係數矩陣中得知測站年雨量(P)與高程(E)間之 相關性並不高約為0.26,顯示高程並非影響降雨量之唯一 因素。另在表二主成份分析之特徵方程式的特徵值(主成份 的 變 異 數)中 , 顯 示 前 三 個 主 成 份 已 可 說 明 原 始 變 量 92.96%之訊息(總變異量),依據主成份個數選取之參考原 則,本文選取其中第一主成份、第二主成份及第三主成份 做為群集分析之變量,其為原始變量之線性組合。為進一 步解釋其所代表之物理意義,利用方差最大正交旋轉予以 極化,並求出因子負荷矩陣(如表三),以解釋各主成份所 代表之意義,分別簡述如下:

(一) 第一主成份:第一主成份與平均年降雨量,平均年最 1 小時,2 小時,

K

,24 小時降雨量間均具有高 度相關性,故第一主成份主要受降雨量所主宰,可視 為「降雨特性因子」

(8)

(二) 第二主成份:第二主成份與測站位置之經度、緯度及 高程間存在高度相關性,故第二主成份主要受測站空 間位置之影響,可視為「測站位置因子」

(三) 第三主成份:第三主成份主要與年雨量之變異係數間 具有高相關性,其反應統計值之變異特性,可視為「降 雨變異因子」

3. 群集分析結果 (一) 二階段群集分析

在主成份空間中進行兩階段群集分析,首先利用Ward 法進行階層群集分析,得到群集譜系圖(如圖 3),此譜 係圖可清楚反應各雨量站其變量間之親疏程度,且需 要主觀地選取一臨界相似尺度,用以分割譜係圖來得 到雨量站之分類結果。本文初步將其區分為三個群集 (如表四),能同時考慮分類之間為突出而明顯,且各 類間之測站數目不致於過少,並以此做為第二階段分 析之起始群集,再應用 K 均值法進行非階層群集分 析,期以求得更穩定之分群結果。最後得到兩階段群 集分析之分群結果(如表四),其中僅有 030037 及 100012 二個測站從第三區移至第二區,此亦說明 Ward 法已具有穩健之分群結果。文中進一步利用多變量變

方分析中Λ 效標(式 11)來做顯著性檢定,以客觀地檢

驗分類之正確性,計算結果Λ= 0.0764 < U0.01(3,2,35)= 0.6046,可知三個群集間其差異性均達顯著水準。

(二) 模糊聚類分析結果

本研究續利用各雨量站之前三個主成份值為分析變量 進行模糊聚類分析。由夾角餘弦法計算樣本間相似程 度,並得到模糊相似矩陣,然後再經由平方法計算模 糊等價矩陣。對滿足傳遞性的模糊等價矩陣進行聚類 處理,給定不同置信水平的λ 值,求取 R 的 λ 截矩陣,

矩陣內元素為1 的兩個樣本相互併為一類。隨 λ 值的 降低,由細到粗逐漸歸併,最後得到動態性的聚類譜 系圖(如圖 4)。

(三) 分析結果與討論

K 均值法之分群結果(如表四)依測站編號排序後各 群組分別為:

群組1:{030038, 030050, 030064, 030065, 030080, 030081, 030083, 030121, 030124, 030125, 030135, 030140, 030143, 035002}

群組 2:{030037, 100002, 100012, 100043, 130003, 130006, 130012, 130026, 130027, 180001, 180002, 200007}

群組3:{012001, 012006, 030069, 030105, 030106, 030128, 030138, 080005, 100026, 100051, 120003, 120004}

而模糊聚類分析於置信水平的λ 值為 0.9 時,在圖 4 中可分為三個群組,經依測站編號排序後各群組分別 為:

群組1:{030038, 030050, 030064, 030065, 030080, 030081, 030083, 030121, 030124, 030125, 030135, 030140, 030143, 035002, 100043, 180001, 180002}

群組2:{030037, 100002, 100012, 130003, 130006, 130012, 130026, 130027, 200007}

群組3:{012001, 012006, 030069, 030105, 030106, 030128, 030138, 080005, 100026, 100051, 120003, 120004}

上述兩種聚類方法之分群結果中群組3 為相同,群組 1 及群組 2 則甚為相近,其中標註黑體字之測站 (100043,180001,180002)為相異之處,此三個測站位於 南澳溪上游宜蘭大同地區,在模糊聚類分析時被併入 淡水河流域地區,此一分區結果較不能結合地理位置 之相鄰性(如圖 5 中標註區)。

由兩種聚類方法之分區結果的比較中,顯示兩階段群 集分析優於模糊聚類分析,可能選擇分析之變量較不 具模糊性,致使結果趨近於傳統K 均值法(或 c-mean 法)。本研究將北部地區根據行政區域及流域邊界線繪 出均一區之分界線,並區分為三個降雨屬性均一區(如 6),將雨量站之分群結果標示於圖上,其中第一區 主要分布於淡水河流域,位於北部地區之西北部,包 括台北市、桃園地區及台北縣之淡水、石碇、烏來、

三峽為界。第二區位於北部地區之西南部,包括新竹 及桃園縣復興鄉、台北縣烏來鄉南半部、宜蘭縣大同 鄉、南澳鄉。第三區位於北部地區東半側濱臨太平洋,

包括基隆地區及台北縣之北海岸地區與宜蘭縣頭城、

礁溪、員山、三屋、壯圍、五結、冬山、蘇澳等地區。

此分析結果除能結合地理位置之相鄰性及滿足區域分 析目的外,群集間亦存在明顯之差異特性,進一步根 據氣候因素來暸解分區合理性,顯示本文中降雨屬性 分區與氣候分區[21]結果相吻合。唯本研究中涵蓋有 較高空間密度之分析測站,在空間分區上較為詳細,

將台北與新竹又劃分為不同屬性分區。

五、結論與建議

1. 利用文中 38 個測站之 29 個變量經主成份分析,選取前 三個主成份解釋原始變量 92.9%的訊息。第一主成份佔 82.7%為降雨特性因子,第二主成份佔 6.1%為測站位置 因子,第三主成份佔4.1%為降雨變異因子。

2. 北部地區劃分為三個降雨空間屬性均一區,分區之合理 性與氣候分區結果相吻合,台北、新竹與基隆、宜蘭之 間存在明顯差異性。由於分析中北海岸地區沒有測站,

本文將此地區歸類為第三區與基隆地區相結合。

3. 文中兩種聚類法在本研究實例中得到相近的分類結果,

因此除利用傳統聚類方法外,模糊聚類分析亦為另一分

(9)

析工具之選擇,惟模糊聚類分析較適用於樣本間存在模 糊性關係,而傳統聚類分析適用於具明確性的樣本關 係,可視樣本間相互關係之模糊程度決定採用何種聚類 方法。

4. 後續研究中可根據此分區結果,來驗證短延時降雨型態 均一區劃分對區域雨量分析之影響。

符號索引

2

ak k 個主成份在 m 個變數上因子負荷量平方 值之平均數

C P×P 維的係數矩陣為一正交距陣

CC 矩陣的逆矩陣(inverse matrix) Cki k 主成份第 i 變量之特徵向量值

I 單位矩陣

n 觀測樣本數

Qt 總體之平方與交叉乘積和(sum of squares and cross product, SSCP)矩陣

Qe 組內SSCP 矩陣 Qh 組間之SSCP 矩陣

r

ij i 變量與第 j 變量間之相關係數(i, j=1,2…, P)

2

k2

Va k 個主成份上各因子負荷量平方值之方差

Λ 魏氏Λ 值(Wilk's Λ)倘若Λ<Uα(p,g1,ng)則群 集間有明顯之差異性(其中 α 為信賴度,p 為變量,g 為群組數,n 為總樣本數)

參考文獻

1. Coursey, D. G., “Objective Regionalization by Peak flow Rates,” Proceeding Second International Symposium in Hydrology, Fort Collins, Colo., pp. 385-405 (1972).

2. Waylen, P. R., and Woo, M., “Regionalisation and Predic- tion of Floods in the Frazer River Catchment,” Water Re- source Bulletin, Vol. 20, No. 6, pp. 941-949 (1984).

3. White, E. L., “Factor Analysis of Drainage Basin Proper- ties : Classification of Flood Behaviour in Terms of Basin Geomorphology,” Water Resource Bulletin, Vol. 11, No. 4, pp. 676-687 (1975).

4. Wiltshire, S. E., “Regional Flood Frequency Analysis I : Homogeneity Statistics,” Hydrological Science Journal, Vol. 31, No. 3, pp. 321-333 (1986b).

5. Nature Environment Research Council (NERC), “Flood

Studies Report,” Vol. I, II (1975).

6. Singh, V. P., “Model Flow Duration and Stream Variabil- ity,” Water Resource Research, Vol. 7, No. 4, pp.

1031-1036 (1971).

7. Dingman, S. L., “Synthetic of Flow Duration Curves for Unregulated Streams in New Hampshire,” Water Resource Bulletin, Vol. 14, No. 6, pp. 1481-1501 (1978).

8. Tasker, G. D., “Simplified Testing of Hydrologic Regres- sion Regions,” Journal of Hydraulics Dividing Proceed- ings, ASCE, Vol. 108, pp. 1218-1222 (1982).

9. Tasker, G. D., “Comparing Methods of Hydrological Re- gionalization,” Water Resource Bulltin, Vol. 18, No. 6, pp.

965-970 (1982).

10. Mosley, M. P., “Delimitation of New Zealand hydrologi- cal regions,” Journal of Hydrology, Vol. 49, pp. 173-92 (1981).

11. Bhaskar, N. R., and Connor, C. A., O'“Comparison of Method of Residuals and Cluster Analysis for Flood Re- gionalization,” Journal of Water Resources Planning and Management, Vol. 115, No. 6, pp. 793-808 (1989).

12. Burn, D. H., “Cluster Analysis as Applied to Regional Flood Frequency,” Journal of Water Resources Planning and Management, Vol. 115, No. 5, pp. 567-582 (1989).

13. Wiltshire, S. E., “Regional Flood Frequency Analysis II : Multivariate Classification of Drainage Basins in Britain,”

Hydrological Science Journal, Vol. 31, No. 3, pp. 335-346 (1986).

14. Wiltshire, S. E., “Identification of Homogeneous Regions for flood frequency analysis,” Journal of Hydrology, Vol.

84, pp. 287-302 (1986).

15. Guttman, N. B., “The Use of L-moments in Determination a Regional Precipitation Climates,” Journal of Climate, pp. 2309-2325 (1993).

16. 易任、葉惠中,「臺灣中部地區降雨空間分布之研究」,

臺灣水利季刊,第三十九卷,第四期,第1-15 頁(1991)。

17. 楊道昌,「臺灣南部地區區域流量延時曲線之研究」,

碩士論文,國立成功大學水利及海洋工程研究所,臺 南(1994)。

18. 陳嘉榮、楊道昌、游保杉、高家俊,「彌陀海域即時波 浪預報模式之研究」,第七屆水利工程研討會論文集,

基隆(1994)。

19. 陳嘉榮,「區域雨量分析與降雨-逕流預報之研究」,

博士論文,國立成功大學水利及海洋工程研究所,台 南(2000)。

20. 游保杉、董東璟,「臺灣北部區域雨量強度公式之研究 (二):無母數區域雨量頻率分析」,中國土木水利工程

(10)

學刊,第十一卷,第一期,第99-109 頁(1999)。

21. 吳明進、陳幼麟,「臺灣的氣候分區」,大氣科學,第 二十一卷,第一期,第55-66 頁(1993)。

22. 中央氣象局,「專用氣象觀測站基本資料」,第三版 (1990)。

23. 羅積玉,多元統計分析方法與應用,科技公司(1994)。

24. Johnson, R. A., and Wichern, D. W., Applied Multivariate Statistical Analysis, Prentice-Hall. Inc (1988).

25. Kaiser, H. F., “The Varimax Criterion for Analytic Rota- tion in Factor Analysis,” Psychometrika, Vol. 23, pp.

187-200 (1958).

26. Anderberg, M., Cluster Analysis for Applications, Aca- demic Press, New York, USA, pp. 185-190 (1973).

27. Punj, G., and Stewart, D. W., “Cluster Analysis in Mar- keting Research : Review and Suggestion for Applica- tion,” Journal of Marketing Research, pp. 134-148 (1983).

28. Ward, J. E., “Hierarchical Grouping to Optimize an Ob- jective Function,” Journal of America Statistical Associa- tion, Vol. 59, pp. 236-244 (1963).

29. 林清山,多變項分析統計法,東華書局(1992)。

30. Bezdek, J., “Some Recent Application of Fuzzy C-mean in Pattern Recognition and Image Processing,” IEEE 1983 Workshop on Languages for Automation, IEEE Computer Society, pp. 247-252(1983).

31. Sugeno, M., and Yasukawa, T., “A Fuzzy-logic-based Approach to Qualitative Modeling,” IEEE Transaction

Fuzzy Set and Systems, 1, pp. 7-31 (1993).

32. Yager, R., and Filev, D., “Approximate Clustering via the Mountain Method,” IEEE Transactions on System., Man, Cyber. Vol. 24, pp. 1279-1284 (1994).

33. Chiu, S. L., “Fuzzy Model Identification Based on Cluster Estimation,” Journal of Intelligent and Fuzzy Systems, Vol.

2, No. 3 pp.267-278 (1994).

34. Klir, G., and Yuar, Bo, Fuzzy Sets and Fuzzy LogicTheory and Applications, Pearson Eduation Taiwan Ltd.

Published, Prentice Hall (2003).

35. Wang, H., and Bell, P., “Fuzzy Clustering Analysis and Multifactorial Evaluation for Students’ Imaginative Power in Physics Problem Solving,” Fuzzy Sets and Systems, Vol.

78, pp. 95-105 (1996).

36. Mukherjee, D. P., A. Pal, S. E. Sarma and D. D. Majum- der., “Water Quality Analysis: a Pattern Recognition Ap- proach,” Pattern Recognition, Vol. 28, No. 2, pp. 269-281 (1995).

37. Wiltshire, S. E., “Grouping Basins for regional Flood Frequency Analysis,” Hydrological Science Journal, Vol.

30, No. 1, pp. 151-159 (1985).

2004 年 07 月 23 日 收稿 2004 年 08 月 25 日 初審 2005 年 05 月 09 日 複審 2005 年 10 月 31 日 接受

數據

圖 1  北部地區地形等高線概要圖 (m)  1.  主成份分析  主成份分析是一種以少數成份來表示多變量訊息之統 計技術,通常變量間彼此存在某種程度之相關性,可藉由 主成份分析來將原先座標系統轉換成一個各軸間是正交 (orthogonal)的新座標系統,亦即新變量間是相互獨立。其 中每一主成份均說明部份的原始變量訊息(變異數),並依 佔 有 之 多 寡 依 次 排 列 , 而 由 主 成 份 之 因 子 負 荷 (factor  loading)中可知其與原始變量間之相關程度,可做適當的物 理解釋。故本文

參考文獻

相關文件

and Feng-Tsai Lin, “Analysis of the Transient Ground Surface Displacements Subject to a Point Sink in a Poroelastic Half Space,” Chung Hua Journal of Science and Engineering,

Y., (1997), “Resource recovery of sludge as building and construction materials — a future trend in sludge management,” Journal of Water Science and Technology, Vol. J.,

In this paper, a novel feature set derived from modulation spectrum analysis of Mel-frequency cepstral coefficients (MFCC), octave-based spectral contrast (OSC), and

Hampton, G.,(1993).“Gap Analysis of College Student Satisfaction as a Measure of ProfessionService Quality,”Journal of Professional Service Marketing, Vol.9.,P.P.115-128.

The sensitivities of microphone are mainly affected by mechanical sensitivity and first resonance frequency of diaphragms, so this research have detailed analysis for different

In this paper, we first applied grey relational analysis and grey prediction of grey system theory to analyze the ranking of IT industry competitiveness and e-readiness of

【7】FEMA National Flood Insurance Program,1990,“Regulations for Floodplain Management and Flood Hazard dentification Revised as”of

Imamura, “ Fuzzy Decision Analysis on the Development of Centralized Regional Energy Control System,” IFAC Symposium on Fuzzy Information, Knowledge Representation