第五章 研究案例
5.1 衛星影像監測尺度
5.1.3 研究方法
應用水質遙測技術中,最主要之研究資料為近同時之衛星影像波段與現地水質 數據,前者在模式中即為自變數,而後者則為因變數。除擷取或獲取相關資料外,
在因子,即自變數選擇上極為重要,對於預測模式之好壞有一定程度之影響。由前 人研究中,乾淨水體對光譜之反應特性以穿透與吸收為主,而反射較少,僅可見光 部分(400~700 nm)有約 5 %,近紅外光(700~2,500 nm)則幾乎不反射,反而 是幾乎吸收,如圖 2-18 所示,但隨著水體成分濃度之改變,可見光部分會降低其 穿透率,卻增加其反射率,而近紅外光部分會降低其吸收率,因此可選取衛星影像 中高穿透率與高吸收率之波段,如藍光與短波紅外光等,但本論文研究有加入Terra 衛星之MODIS-250 m 之影像,其僅有紅光與近紅外短波光,如表 4-4 所示,且以 探討與其他衛星之空間解析度上之差異,故固定各衛星之光譜解析度,在進行分析 比較,故以紅光與近紅外短波光為研究因子。
然而此二個波段在地表植生研究上極為重要,尤其是紅外短波光對地表植被有
極高反射率,可提供判釋地表植生之能力,因此經數學運算與線性或非線性組合,
發展許多植生指標(Vegetation Index, VI),如常見之比值植生指標(Ratio Vegetation Index, RVI)、差異植生指標(Difference Vegetation Index, DVI)與常態化差異植生 指標(Normalized Difference Vegetation Index, NDVI)等造成影像上有較大之差異,
這些指標會造成影像上植生與其他類別有較大之差異,可提高判釋之準確度,其說 明如下:
比值植生指標
RVI 為 NIR 與 Red 兩個波段之比值,如式 5-1 所示。若為綠色健康植被覆蓋 之地表,其值遠大於1,而無植被覆蓋,如裸土、水體、建築物與植物枯死等,
則其值為 1 左右。但 RVI 易受大氣條件影響,大氣效應會降低其敏感度,故計 算此值時須進行大氣校正。
RVI=NIR
Red ...(5-1)
其中NIR 為近紅外短波光,Red 為紅光。
差異植生指標
DVI 為 NIR 與 Red 兩個波段之差值,如式 5-2 所示,其對土壤背景之變化 即為敏感。
DVI=NIR-Red ...(5-2)
其中NIR 為近紅外短波光,Red 為紅光。
常態化差異植生指標
NDVI 為 DVI 衍生而來,是 NIR 與 Red 兩個波段之差值與尺度化之比值,
如式5-3 所示,其值介於-1~1 之間,若為負值代表地表覆蓋水或雪等,對可見 光之高反射率;若為0 值代表有岩石或裸土等;若為正值代表有植被覆蓋,且隨 覆蓋度增大而變大。NDVI 的侷限性表現在用非線性延伸之方式增強了 NIR 與
Red 之反射率的對比度,使其能反應出植物冠層之背景影響,如土壤、潮濕地面、
雪、枯葉與粗糙度等,且與植被覆蓋有關。
NIR-Red NDVI=
NIR+Red ...(5-3)
其中NIR 為近紅外短波光,Red 為紅光。
若將NDVI 之值映射於 0~255 之間,則其公式變為如式 5-4 所示。
NIR-Red
NDVI=( )*127+128
NIR+Red ...(5-4)
其中NIR 為近紅外短波光,Red 為紅光。
上述三個指標雖以判釋植生為對象,但對於水體變化是否亦會提供相關資訊?
且前人研究中極少探討加入此指標為研究因子之結果,故本論文研究會加入探討。
此三個指標經比較發現,若由同一張影像分別求RVI 與 NDVI,則 RVI 值之變化增 加速度會高於NDVI,即 NDVI 較 RVI 穩定,且 DVI 較難區分出植生與非植生之 界線,故本論文研究加入NDVI 為研究因子。雖然亦有其他植生指標,如 GVI(Green Vegetation Index)與 PVI(Perpendicular Vegetation Index)等,有的是經由常見之 VI 所衍生發展,而有的則加入土壤(Soil)性質,以增加判釋土壤與植生之能力,
但卻與水體無相關性,故本論文研究即不採用為研究因子。然而研究上亦有發展判 釋水體之指標,如NDWI(Normalized Difference Water Index),其是根據 NDVI 而 衍生出來的,但其是以近紅外短波光與短波紅外光(Short Wave Infrared)所組成,
如式5-5 所示,但本論文研究所使用之衛星影像皆無使用此波段,故亦不採用為研 究因子。
NIR-SWIR NDWI=
NIR+SWIR ...(5-5)
其中NIR 為近紅外短波光,SWIR 為短波紅外光。
本論文研究方法採用所謂經驗方法,即分別導入多元線性迴歸、類神經網路與 遺傳運算樹等方法,進行水庫水質之推估分析與模式建立,其中模式皆以 RMSE 之最小為目標函數與以 R2之最大為解釋能力,並以評估模式之指標方法探討各模
式間之優劣程度,再將模式外推至整個水庫區域,以瞭解整個水庫區域之水質變化。
多元線性迴歸
本論文研究之多元線性迴歸方法是使用XL Miner 資料探勘之套裝軟體,其 可掛載於Microsoft Office 之 EXCEL 中使用,其公式如式 3-2 或式 3-3 所示。
類神經網路
本論文研究之類神經網路方法採用倒傳遞方式,是使用XL Miner 資料探勘 之套裝軟體,其可掛載於Microsoft Office 之 EXCEL 中使用,其公式如式 3-10 所示,因模式有區分加入研究因子 NDVI 之前後探討,故模式架構為二,如圖 5-2 與圖 5-3 所示。
Input Layer Hidden Layer Output Layer
Red
NIR
Node Node
W
W
E
Chl-a TP SS TB SDD
Y X
圖5-2 倒傳遞類神經網路之架構圖(X, Y,輸入出;W,權重;E,誤差)
Input Layer Hidden Layer Output Layer
Red
NIR
Node
Node
NDVI
Node X
Y W
W
W E
Chl-a TP SS TB SDD
圖5-3 倒傳遞類神經網路之架構圖(X, Y,輸入出;W,權重;E,誤差)
由於模式架構之不同,故其運算時所設定之參數亦有所差異,如表5-2 所示。
表5-2 倒傳遞類神經網路模式加入NDVI 前後之參數設定差異
Set Parameters(參數設定) None(NDVI) Yes(NDVI)
Input Layer Nodes(輸入層處理單元數) 2 3
Hidden Layers(隱藏層層數) 1 1
Hidden Layer Nodes(隱藏層處理單元數) 1 2
Output Layer Nodes(輸出層處理單元數) 1 1
Step Size for Gradient Descent(學習速率) 0.1 0.1
Epochs(學習循環) 1000 1000
Weight Change Momentum(慣性因子) 0.6 0.6
Error Tolerance(容許誤差) 0.01 0.01
Weight Decay(權重衰減) 0 0
遺傳運算樹
本論文研究導入能自組織產生公式之遺傳運算樹方法,其是經遺傳演算尋優 至最佳之運算元與運算子,並經自行運算後所建構之最佳模式,但為有較佳之尋 優空間與深度,採用五層之運算樹,如圖5-4 所示,而運算樹之運算元與運算子,
即變數,在遺傳演算中之基因編碼方式如表5-3 與表 5-4 所示。
圖5-4 五層遺傳運算樹之示意圖
表5-3 運算元之基因編碼方法
Code 1 2 3 4 5 6 7 8
Operands + - × ÷ xy ln( )x 1 x x
表5-4 運算子之基因編碼方法
Code 9 10 11 12
Operators K(Constant) Red NIR NDVI
然而每一層運算樹中有其運算規則須先進行參數設定與限制,如下:
1. 第一層之{ X1 }樹莖(Stem)限制僅能搜尋運算元之編碼,因此所能搜尋的 編碼為1~8 之正整數。
2. 第二、三與四層之{ X2~X15 }樹枝(Branch)可搜尋範圍完全自由,因此所 能搜尋之運算元與運算子之編碼為 1~12 之正整數,其中編碼 9 之 K
(Constant)值限定為± 1,000 內之連續實數值。
3. 第五層之{ X9~X12 }樹葉(Leaf)限制僅能搜尋運算子(常數與輸入變數)
之編碼,因此所能搜尋的編碼為9~12 之正整數。
另外此樹狀結構亦遵守下列規則:
1. 當該運算樹之{ X1~X31 }位置,在經遺傳演算尋優過程中除常數{ K }之運 算子可以實數型態呈現,其餘運算元與運算子,因在尋優過程中會將接近 之實數變為整數,且因無負值,故其僅能以正整數型態呈現。
2. 當該樹枝搜尋到的運算元之編碼為ln( )x、1 x與 x時,則限制下一層僅取「左」
邊樹枝有效,「右」邊樹枝則無法再成長。
3. 當該樹枝搜尋到運算元之編碼為ln( )x 與 x時,因{ x }不許為負,則需先取 絕對值後再進行運算。
4. 當該樹枝搜尋到運算元之編碼為xy時,則以下一層之「左」邊樹枝為{ x },
而其「右」邊樹枝為{ y }。
5. 當該樹枝搜尋到運算子之編碼時,則限制該樹枝無法再成長至下一層。
最後遺傳運算樹之預測值因會有偏斜現象,即預測值與實際值間存在平移及 旋轉關係,故須進行單變數迴歸方式修正,如式 3-16 所示,其最後公式會以如 式3-19 之型態呈現。
由於是利用遺傳演算GeneHunter 掛在於 Microsoft Office 之 EXCEL 中使用 之套裝軟體,故其運算時需先設定參數,如表5-5 所示。
表5-5 遺傳演算於運算樹中之參數設定
Set Parameters(參數設定)
Population Size(群集大小) 50~500 Chromocome Length(染色體長度) 8 bit, 16 bit, 32 bit
Crossover Rate(交換率) 0.9 Mutation Rate(突變率) 0.01
Generation Gap(代溝) 0.96 Generations(代數) 100~1000 Screen Update(更新顯示) Smart Set Random Seed(設定隨機種子) 1
Elitist Strategy(菁英策略)
Diversity Operator(多樣性運算子) Yes