研究方法

第五章研究案例

5.1 衛星影像監測尺度

5.1.3 研究方法

應用水質遙測技術中，最主要之研究資料為近同時之衛星影像波段與現地水質數據，前者在模式中即為自變數，而後者則為因變數。除擷取或獲取相關資料外，

在因子，即自變數選擇上極為重要，對於預測模式之好壞有一定程度之影響。由前人研究中，乾淨水體對光譜之反應特性以穿透與吸收為主，而反射較少，僅可見光部分（400～700 nm）有約 5 %，近紅外光（700～2,500 nm）則幾乎不反射，反而是幾乎吸收，如圖 2-18 所示，但隨著水體成分濃度之改變，可見光部分會降低其穿透率，卻增加其反射率，而近紅外光部分會降低其吸收率，因此可選取衛星影像中高穿透率與高吸收率之波段，如藍光與短波紅外光等，但本論文研究有加入Terra 衛星之MODIS-250 m 之影像，其僅有紅光與近紅外短波光，如表 4-4 所示，且以探討與其他衛星之空間解析度上之差異，故固定各衛星之光譜解析度，在進行分析比較，故以紅光與近紅外短波光為研究因子。

然而此二個波段在地表植生研究上極為重要，尤其是紅外短波光對地表植被有

極高反射率，可提供判釋地表植生之能力，因此經數學運算與線性或非線性組合，

發展許多植生指標（Vegetation Index, VI），如常見之比值植生指標（Ratio Vegetation Index, RVI）、差異植生指標（Difference Vegetation Index, DVI）與常態化差異植生指標（Normalized Difference Vegetation Index, NDVI）等造成影像上有較大之差異，

這些指標會造成影像上植生與其他類別有較大之差異，可提高判釋之準確度，其說明如下：

比值植生指標

RVI 為 NIR 與 Red 兩個波段之比值，如式 5-1 所示。若為綠色健康植被覆蓋之地表，其值遠大於1，而無植被覆蓋，如裸土、水體、建築物與植物枯死等，

則其值為 1 左右。但 RVI 易受大氣條件影響，大氣效應會降低其敏感度，故計算此值時須進行大氣校正。

RVI=NIR

Red ...（5-1）

其中NIR 為近紅外短波光，Red 為紅光。

差異植生指標

DVI 為 NIR 與 Red 兩個波段之差值，如式 5-2 所示，其對土壤背景之變化即為敏感。

DVI=NIR-Red ...（5-2）

其中NIR 為近紅外短波光，Red 為紅光。

常態化差異植生指標

NDVI 為 DVI 衍生而來，是 NIR 與 Red 兩個波段之差值與尺度化之比值，

如式5-3 所示，其值介於-1～1 之間，若為負值代表地表覆蓋水或雪等，對可見光之高反射率；若為0 值代表有岩石或裸土等；若為正值代表有植被覆蓋，且隨覆蓋度增大而變大。NDVI 的侷限性表現在用非線性延伸之方式增強了 NIR 與

Red 之反射率的對比度，使其能反應出植物冠層之背景影響，如土壤、潮濕地面、

雪、枯葉與粗糙度等，且與植被覆蓋有關。

NIR-Red NDVI=

NIR+Red ...（5-3）

其中NIR 為近紅外短波光，Red 為紅光。

若將NDVI 之值映射於 0～255 之間，則其公式變為如式 5-4 所示。

NIR-Red

NDVI=( )*127+128

NIR+Red ...（5-4）

其中NIR 為近紅外短波光，Red 為紅光。

上述三個指標雖以判釋植生為對象，但對於水體變化是否亦會提供相關資訊？

且前人研究中極少探討加入此指標為研究因子之結果，故本論文研究會加入探討。

此三個指標經比較發現，若由同一張影像分別求RVI 與 NDVI，則 RVI 值之變化增加速度會高於NDVI，即 NDVI 較 RVI 穩定，且 DVI 較難區分出植生與非植生之界線，故本論文研究加入NDVI 為研究因子。雖然亦有其他植生指標，如 GVI（Green Vegetation Index）與 PVI（Perpendicular Vegetation Index）等，有的是經由常見之 VI 所衍生發展，而有的則加入土壤（Soil）性質，以增加判釋土壤與植生之能力，

但卻與水體無相關性，故本論文研究即不採用為研究因子。然而研究上亦有發展判釋水體之指標，如NDWI（Normalized Difference Water Index），其是根據 NDVI 而衍生出來的，但其是以近紅外短波光與短波紅外光（Short Wave Infrared）所組成，

如式5-5 所示，但本論文研究所使用之衛星影像皆無使用此波段，故亦不採用為研究因子。

NIR-SWIR NDWI=

NIR+SWIR ...（5-5）

其中NIR 為近紅外短波光，SWIR 為短波紅外光。

本論文研究方法採用所謂經驗方法，即分別導入多元線性迴歸、類神經網路與遺傳運算樹等方法，進行水庫水質之推估分析與模式建立，其中模式皆以 RMSE 之最小為目標函數與以 R²之最大為解釋能力，並以評估模式之指標方法探討各模

式間之優劣程度，再將模式外推至整個水庫區域，以瞭解整個水庫區域之水質變化。

多元線性迴歸

本論文研究之多元線性迴歸方法是使用XL Miner 資料探勘之套裝軟體，其可掛載於Microsoft Office 之 EXCEL 中使用，其公式如式 3-2 或式 3-3 所示。

類神經網路

本論文研究之類神經網路方法採用倒傳遞方式，是使用XL Miner 資料探勘之套裝軟體，其可掛載於Microsoft Office 之 EXCEL 中使用，其公式如式 3-10 所示，因模式有區分加入研究因子 NDVI 之前後探討，故模式架構為二，如圖 5-2 與圖 5-3 所示。

Input Layer Hidden Layer Output Layer

Red

NIR

Node Node

Chl-a TP SS TB SDD

Y X

圖5-2 倒傳遞類神經網路之架構圖（X, Y，輸入出；W，權重；E，誤差）

Input Layer Hidden Layer Output Layer

Red

NIR

Node

NDVI

Node X

Y W

W E

Chl-a TP SS TB SDD

圖5-3 倒傳遞類神經網路之架構圖（X, Y，輸入出；W，權重；E，誤差）

由於模式架構之不同，故其運算時所設定之參數亦有所差異，如表5-2 所示。

表5-2 倒傳遞類神經網路模式加入NDVI 前後之參數設定差異

Set Parameters（參數設定） None（NDVI） Yes（NDVI）

Input Layer Nodes（輸入層處理單元數） 2 3

Hidden Layers（隱藏層層數） 1 1

Hidden Layer Nodes（隱藏層處理單元數） 1 2

Output Layer Nodes（輸出層處理單元數） 1 1

Step Size for Gradient Descent（學習速率） 0.1 0.1

Epochs（學習循環） 1000 1000

Weight Change Momentum（慣性因子） 0.6 0.6

Error Tolerance（容許誤差） 0.01 0.01

Weight Decay（權重衰減） 0 0

遺傳運算樹

本論文研究導入能自組織產生公式之遺傳運算樹方法，其是經遺傳演算尋優至最佳之運算元與運算子，並經自行運算後所建構之最佳模式，但為有較佳之尋優空間與深度，採用五層之運算樹，如圖5-4 所示，而運算樹之運算元與運算子，

即變數，在遺傳演算中之基因編碼方式如表5-3 與表 5-4 所示。

圖5-4 五層遺傳運算樹之示意圖

表5-3 運算元之基因編碼方法

Code 1 2 3 4 5 6 7 8

Operands + － × ÷ x^y ln( )x 1 x x

表5-4 運算子之基因編碼方法

Code 9 10 11 12

Operators K（Constant） Red NIR NDVI

然而每一層運算樹中有其運算規則須先進行參數設定與限制，如下：

1. 第一層之{ X1 }樹莖（Stem）限制僅能搜尋運算元之編碼，因此所能搜尋的編碼為1～8 之正整數。

2. 第二、三與四層之{ X2～X15 }樹枝（Branch）可搜尋範圍完全自由，因此所能搜尋之運算元與運算子之編碼為 1～12 之正整數，其中編碼 9 之 K

（Constant）值限定為± 1,000 內之連續實數值。

3. 第五層之{ X9～X12 }樹葉（Leaf）限制僅能搜尋運算子（常數與輸入變數）

之編碼，因此所能搜尋的編碼為9～12 之正整數。

另外此樹狀結構亦遵守下列規則：

1. 當該運算樹之{ X1～X31 }位置，在經遺傳演算尋優過程中除常數{ K }之運算子可以實數型態呈現，其餘運算元與運算子，因在尋優過程中會將接近之實數變為整數，且因無負值，故其僅能以正整數型態呈現。

2. 當該樹枝搜尋到的運算元之編碼為ln( )x、1 x與 x時，則限制下一層僅取「左」

邊樹枝有效，「右」邊樹枝則無法再成長。

3. 當該樹枝搜尋到運算元之編碼為ln( )x 與 x時，因{ x }不許為負，則需先取絕對值後再進行運算。

4. 當該樹枝搜尋到運算元之編碼為x^y時，則以下一層之「左」邊樹枝為{ x }，

而其「右」邊樹枝為{ y }。

5. 當該樹枝搜尋到運算子之編碼時，則限制該樹枝無法再成長至下一層。

最後遺傳運算樹之預測值因會有偏斜現象，即預測值與實際值間存在平移及旋轉關係，故須進行單變數迴歸方式修正，如式 3-16 所示，其最後公式會以如式3-19 之型態呈現。

由於是利用遺傳演算GeneHunter 掛在於 Microsoft Office 之 EXCEL 中使用之套裝軟體，故其運算時需先設定參數，如表5-5 所示。

表5-5 遺傳演算於運算樹中之參數設定

Set Parameters（參數設定）

Population Size（群集大小） 50～500 Chromocome Length（染色體長度） 8 bit, 16 bit, 32 bit

Crossover Rate（交換率） 0.9 Mutation Rate（突變率） 0.01

Generation Gap（代溝） 0.96 Generations（代數） 100～1000 Screen Update（更新顯示） Smart Set Random Seed（設定隨機種子） 1

Elitist Strategy（菁英策略）

Diversity Operator（多樣性運算子） Yes

在文檔中應用不同尺度衛星影像於監測台灣內陸水體水質之研究 (頁 126-133)

第五章 研究案例

5.1 衛星影像監測尺度

5.1.3 研究方法

第五章研究案例