Full text

(1)

I

誌 謝

論文撰寫期間,承蒙恩師 陳莉教授悉心的指導與教誨,使我受 益匪淺,在此謹致上由衷的感激與謝意,論文口試期間,感謝 葉克 家博士、 葉惠中博士與 譚智宏博士的指正與建議,關心與厚愛之 情,銘感於心。

研究期間,感謝簡大為、何智超,江柏寬、梁訓源、? 雲和等學 長在課業及論文上的協助,同窗好友周芳如、王勝民、褚政鑫、黃建 達、徐家盛、蔡家盛在生活上的幫忙與照顧,學弟妹陳慧敏、王泰盛、

郭? 良感謝你們的關心與鼓勵,令我在求學生涯留下許多美好的回 憶。

最後謹以此論文獻給我最敬愛的家人,謝謝你們的支持與關 懷,願與你們分享這份喜悅並獻上我最深摯的祝福。

(2)

II

摘 要

近年來,遙感探測在全世界已經成為資料收集分析及決策之重要 來源。當然,在台灣遙測技術之應用亦日漸普及大眾化,遙測之主要 特性為其資料所涵蓋面積廣泛且具有即期之特性,故其亦能作為一種 建立環境資源資料庫之有效量測工具。

本研究選擇水利會之竹東工作站為研究區域。主要以高斯最大似 然分類法(maximum-likelihood decision Rule)和倒傳遞類神經網路 ( BPN )兩種人工智慧進行影像分類,其訓練程序由地面調查可能之耕 作面積和由影像分類所判釋之面積兩者互相比較。本研究所利用之監 督分類方法具有高度之準確性可證明其精確度。此外,這兩種方法可 根據影像分類和生長及收成之圖像能協助我們計算每一農作物所需 之水量。

(3)

III

A b s t r a c t

Recently, remote sensing has been served as an important data resource collector for analysis and decision planning all around the world.

The application of remotely sensor technique has also been more and more popular in Taiwan. The main characteristic s of remote sensing include wide cover and up-to-date. It is able to serve as a kind of effective survey tool for environmental resource database.

The Chutung Working Station of Irrigation Association was selected as the study area. This study is aimed at imagery classification by the maximum-likelihood decision Rule and Back-propagation neural network (BPN), both belong to artificial intelligence. The training procedure are comparing between the cultivation area calculated by ground survey and by image classification in the paddy-majority area. The supervised classification methods have high accuracy, which could demonstrate by the accuracy verification table. Furthermore, these two methods could assist us to calculate the water requirement for each crop, based on the area of each crop derives from image classification and the growing and cropping pattern 。

(4)

IV

目 錄

謝 誌… … … ? 中文摘要… … … Ⅱ 英文摘要… … … Ⅲ 目 錄… … … ..Ⅳ 圖目錄… … … Ⅶ 表目錄… … … .. Ⅸ

第一章 緒論… … … 1

1-1 研究動機與目的… … … ..1

1-2 研究方法… … … ..2

1-3 論文架構… … … ..4

第二章 文獻回顧… … … ...5

2-1 衛星遙測影像之分類… … … ..5

2-2 類神經網路於測影像之分類… … … ..8

第三章 理論基礎… … … ..11

3-1 衛星影像之應用… … … 11

3-2 影像資料分類… … … ..… … ...12

3-3 衛星基本資料… … … ..… … … ..14

3-4 應用軟體、硬體設備… … … ..… … … … 20

(5)

V

3-5 決定特徵… … … ..… … … .20

3-6 影像分類成果的精確度評估… … … ..… … … … .22

第四章 影像分類分法與原理… … … ..… … ..… 28

4-1 高斯最大似然分類法… … … ..… .… 29

4-2 類神經網路… … … ..… … .32

4-2-1 倒傳遞類神經網路… … … .… … … ...37

4-2-2 常用之非線性轉換函數… … … … .… … … … .… … … ..40

4-2-3 倒傳遞網路參數… … … 41

第五章 應用實例… … … .45

5-1 研究地區概況… … … .… ..45

5-2 訓練試區選取… … … ..… .47

5-3 網路參數… … … .48

5-4 分類結果… … … .… … … ..… … ....49

5-4-1 類神經網路分類法… … … ...50

5-4-2 最大概似法分類法… … … ..… ..54

5-5 Z-test… … … 64

第六章 結論與建議… … … .… ..… … … ..… … … ...66

6-1 結論… … … ..… … … .66

6-2 建議… … … ..… … … .67

(6)

VI

參考文獻… … … ..68 附錄一 現地調查資料… … … 72

(7)

VII

圖 目 錄

圖 1-1 研究方法流程圖… … … .… .… 3

圖 3-1 不同類別之分佈情形… … … .… … … ...12

圖 3-2 影像分類流程圖… … … .… … ...14

圖 3-3 QuickBird 衛星影像可接收之波段類別… … … … ..… … … .17

圖 3-4 本研究所使用的 QuickBird 衛星影像… … … .20

圖 4-1 最大概似法分類決策示意圖… … … ..… ..32

圖 4-2 最大概似分類法判別說明… … … ..… … … ..32

圖 4-3 生物神經元模型… … … ....36

圖 4-4 人工神經元模型… … … ....36

圖 4-5 倒傳遞網路… … … 40

圖 4-6 倒傳遞類神經網路常用的非線性轉換… .… … … ...41

圖 5-1 新竹農田水利會灌溉區域… … … ..… ..46

圖 5-2 新竹農田水利會竹東工作站衛星影像位置圖… … … ....47

圖 5-3 現地調察資料圖… … … ..… … … … ..48

圖 5-4 研究區中訓練區的位置… … … 49

圖 5-5 原來四個光波使用倒傳遞分類結果… … … 51

圖 5-6 原來四個光波加 NDVI 使用倒傳遞分....… … … .… 52

圖 5-7 原來四個光波加 NDVI 及 RVI 使用倒傳遞分類結果… … ..… ..53

(8)

VIII

圖 5-8 原來四個光波使用最大概似法分類結果… … … ...55 圖 5-9 原來四個光波加 NDVI 使用最大概似法分類結果… … … 56 圖 5-10 原來四個光波加 NDVI 及 RVI 使用最大概似法分類結果… .57

(9)

IX

表 目 錄

表 3-1 QuickBird 影像類別..… … … .18

表 3-2 QuickBird 影像處理… … … … ..… … … ..… ...19

表 3-3 軟、硬體設備一覽表… … … ..… … … ..21

表 3-4 誤差矩陣關係表… … … ..… … … ..23

表 3-5 型Ⅰ錯誤與型Ⅱ錯誤… ..… … … ..… … 28

表 4-1 類神經網路的優缺… … … ..… … … ..… … 37

表 5-1 研究區中訓練區的點數選取… … … ..… ..… … 47

表 5-2 倒傳遞網路參數表… … … .48

表 5-3 原始影像使用倒傳遞網路分類法誤差距陣分析表… … ..… ..… .58

表 5-3 加入 NDVI 特徵值使用倒傳遞網路分類法誤差距陣分析表… .59 表 5-4 加入 RVI 特徵值使用倒傳遞網路分類法誤差距陣分析表.… ..60

表 5-5 原始影像使用最大概似法分類法誤差距陣分析表… … … .61

表 5-6 原始影像加入 NDVI 特徵值使用最大概似法分類法誤差距陣分 析表… … … ..… … … .… … ....… … … 62

表 5-7 原始影像加入 NDVI 及 RVI 特徵值使用最大概似法分類法誤差 距陣分析表… … … ..… .63

表 5-9 為不同分類方法之 kappa 指標及其 kappa 指標變異數表… ..… 64

表 5-10 為不同分類方法比較顯著性測驗的結果… … … ...85

(10)

1

第一章 緒 論 1-1 研究動機與目的

一般傳統的土地利用調查需地面逐點調查及航照圖的判釋,調查 程序往往耗費須許多人力、金錢及時間,其所得的結果仍有不盡理想 之處:例如不易掌握現況、調查資料過時、無法適時發現地區遭破壞、

無法有效監測、無法利用電腦提高分析資料之效率常造成人力、物力、

財力及時間上的浪費。近年來衛星遙測光譜影像資料,不論在時間解 析力、光譜解析力、輻射值解析力與空間解析力方面都有精進,實為 現今對環境監測最有利且客觀的工具。

目前有許多國家大量應用遙感探測( Remote Sensing,以下簡稱 遙測)之方法,做為其分析及決策規劃的重要資料來源,應用遙測技 術在水文、地文、水資源管理及環境監測上,已有數十年之歷史。經 由遙測方式而得之資料,具有即期(up-to-date)與具空間分佈之特性 與優點,可做為建立環境資源資料庫之一種有效且使用方便的量測工 具,所以將遙測技術運用在具有空間性或時間性的資料分析上,是一 種有效且可靠的資源調查及環境監測的利器(郭育全,1997;鄭克聲 等,1997)。

遙測最大的優點是無需到達現地勘查,可節省可觀的人力及經 費,例如某水庫集水區之土地利用現況調查,傳統方法係經由實地調 查、收集資料及航照圖的判釋,然而實地調查所費人力、經費至鉅,

且對大面積調查,費時甚久且僅能選某些特定位置進行,故所收集之 資料無法反應集水區之〝現況〞(對時間而言)與〝實況〞(對空間而

(11)

2

言)。遙測另一優點即具有快速掌握全區域資料的能力,例如其資料能 經常予以更新,可瞭解環境之變遷 (陳炫東,1993)。

隨著遙測衛星技術提升,國內採用衛星資料於地面分類工作上已 有顯著成就。因此本研究以新竹農田水利竹東工作站的衛星影像資 料,依據衛星影像資料應用監督式分類法中倒傳遞類神經網路及高斯 最大似然分類法進行地表覆蓋物的判釋,所得到的判釋結果可用來推 求灌溉區內農作物需水量。

1-2 研究方法

本研究之試區為新竹農田水利竹東工作站轄區,所選用之遙測影 像為捷鳥(QuickBird)衛星所測得者,該衛星為美國 Digital Globe 公司 所擁有高解析度光學衛星,運用捷鳥衛星影像資訊及加入植標特徵作 為分類之基礎,再根據新竹農田水利竹東工作站現地土地利用調查成 果,製作成地面檢核資料,作為分類方法精確度之依據。

所採用的分類理論為監督式分類,選用類神經網路架構中應用最 普遍的倒傳遞類神經網路及傳統分類法最常使用的高斯最大似然分類 法來對研究試區做分類工作,並比較分類方法的精確度。

分類成果以精確度評估中最常使用的誤差矩陣表示,並計算全體 精度、平均精度、生產者精度、使用者精度、kappa 指標,最後將分 類成果將採用 Z-test 檢驗,檢驗各分類方法是否有顯著不同。

(12)

3

圖 1-1.研究方法流程圖

高斯最大似然分類法 分割影像

衛星影像

加入特徵值 (NDVI 、、 RVI)

倒傳遞類神經網路

成果的精確度評估

(13)

4

1-3 論 文 架 構

本文的架構分成五章,各章的內容分別摘要如下:

第一章 緒論

說明本論文的研究動機與目的、方法與架構。

第二章 文獻回顧

回顧國內、外前人相關研究 第三章 研究理論基礎

介紹研究工具、影像處理、影像分類成果的精確度評估方法。

第四章 分類分法與原理

介紹遙測之原理與特性、衛星影像之應用、影像資料分類 分法與原理。

第五章 應用實例

首先介紹研究目標區概況、研究資料來源等,接著以 類神經網路、高斯最大似然分類法對研究區進行影像分類。

第六章 結論與建議

對研究成果加以總結,並提出建議。

(14)

5

第二章 文獻回顧

遙感探測(Remote Sensing)是由早期美國因軍事上的需要所發 展技術,原屬軍事機密。在二次大戰期間,主要用途於偵測掩蔽物

(camouflage detection),直到 1965 年美國軍方才開放部份技術,用 於支援資源調查方面。1972 年 7 月 23 日美國第一顆大地衛星(Landsat)

升空後,遙測技術之重要性開始受到重視,且由於遙測衛星影像的各 種優點、特性,國內對於衛星影像的利用已日漸普及,衛星影像常見 用於各種資源的監測、土地開發、農作物判釋、生態調查等,近年來 已有許多專家學者對於遙測影像分類進行研究。

2-1 衛星遙測影像之分類

國內陳炫東(1993)提出「水庫集水區之土地覆蓋判釋-運用衛星 影像及地理資訊系統」研究,以衛星遙測之技術,配合地理資訊系統,

並利用光譜特徵、組織特徵,配合線性及常態對比增揚、高斯最相近 分類法及線性步階分類法,應用此一遙測技術作土地覆蓋及土地利用 變遷之分析、都市計畫、水質模擬、監測山坡地違法開發及濫墾濫伐 等(郭育全,1997;陳炫東,1993)。

雷祖強(1994)提出「利用 SPOT 衛星影像計算地表覆蓋碎形維 度之研究」,討論了維度值對於地表覆蓋物的鑑別與描述,並且可由不 同的地表覆蓋物得到碎形維度值,描述不同地表的物理特性。在影像 分類方面,計算地表覆蓋物的碎形維度值與組織特徵,使用群集分類 法與鑑別函數分群地物,並利用 SPOT 衛星影像,配合組織特徵計算 地表覆蓋碎形維度,將其應用在土地利用變遷分析,及山坡地濫墾開 發等環境資源監控作業分析上(郭育全,1997;雷祖強,1994)。

(15)

6

林錦全(1995)提出「衛星影像資料於集水區地表覆蓋分類之研 究」,使用「巢狀超矩形學習模式」及傳統線性判別分析法,配合組織 特徵,分類美濃水庫集水區之 SPOT 衛星影像,分析該集水區內之地 表覆蓋。

楊純明等(1997)在臺灣省農業試驗所試驗場中建立一、二期水 稻作物因季節改變而? 生反射光譜變化,尋找正規化差異植生指數

(normalized difference vegetation index, NDVI)和水稻成長的關係,

且評估 NDVI 使用潛能。

郭育全(1997)提出「分散度指標應用於遙測影像分類特徵選取 之研究」,使用分離度指標中的一種「發散度」,評估光譜特徵與組織 特徵的重要性,並計算選入分類特徵的順序,再使用最大概似分類法 及貝氏分類法進行曾文水庫集水區地表覆蓋判釋。

蕭國鑫(1998)研究以 STOP 多時段影像和雷達回音波強度資料,

採用逐像元及區塊式分類法判釋水稻田,探討生長期的攝像何種組合 才能得到最佳分類成果。

江良印(1998)使用 STOP 衛星多光譜影像的資訊,綠光段、紅光 段、近紅外光段等三個多光譜波段外,在由紋理特徵輔助進行土地利 用類別判釋之研究。

陳益凰、曾義星(1999)於應用多時段衛星影像辨識水稻田之研 究中嘗試結合耕地坵塊之地理資訊與多時段衛星遙測影像,利用各坵 塊內之光譜植生指標隨時間的變化,以差分影像分類法(differenced image classification)、時間剖面匹配法(temporal profile matching)與波峰 偵測法(peak detecting)進行自動化水稻田辨識作業。

(16)

7

黃信茗(2001)利用監督性分類法之一的最大概似分類法及非監 督性分類法中之反覆式的自我組織資料分析群集偵測法作土地利用分 類。此外,以地面真實資料求得精確度驗證分類結果與現場人員調查 之作物面積與判釋分類之面積作比較。依據分類後之各作物類別面 積,配合作物生長型態及耕作制度等基本資料,輸入製作完成之灌溉 用水量程式中計算出作物需要之水量,使水利會人員擬訂灌溉計劃更 迅速及確實。

國外則有 Tassan(1993)利用 TM 影像建構海洋中葉綠素濃度之 關係。

Baban(1993)利用 TM 資料調查英國諾福克湖沼區,探討環境 特性與污染程度之影響。

Williamson(1989)使用 SPOT HRV 衛星,應用可見光、近紅外光 及中紅外光資料判別葡萄及四種果樹作物其精確度可高達 85%~90%。

Wu 等人(Wu et al.,1985)應用平均值、二階角動差(angular second moment,ASM)、對比(contrast, CON)及熵(entropy, ENT)等組織 特徵於 GOES 衛星影像,推測降雨率(郭育全,1997;Wu et al.,1985)。

Lillesand 等人(1983)利用美國大地衛星(Landsat)TM 影像資 料,評估明尼蘇達(Minnesota)州內 60 個淡水湖泊優養化程度。

Lichen(2003)利用進化演算法(GP)對 SPOT 影像建構影像

因子與葉綠數參數的關係,判別水庫水體優養狀況。

(17)

8

2-2 類神經網路於遙測影像之分類

類神經網路在遙測影像研究的方面,大多用於影像分類上。Bishof et al.(1992)使用三層隱藏層之倒傳遞類神經網路進行 Landsat 影像 分類,且加紋理資訊輔助分類,其所得之結果較傳統所使用高斯最大 似 然 分 類 法 佳 ; 最 後 亦 加 入 分 類 後 平 滑 技 巧 ( postclassification smoothing),應用分類同時? 生之可信度影像,消除分類結果影像的 不均質性(Salt-and-Peper)。

阮聖裕(1994)運用類神經網路技術最大概似法及貝氏分類法等 方法,並使用組織特徵產生更多分類特徵,應用於地表土地利用分類 及變遷偵測。

顏世坤(1994)以 Wavelet 轉換於遙測影像之分析及其應用,結 合碎形幾何的概念所求得的碎形影像,再利用類神經網路作為分類法 則所做的衛星影像分類研究,在土地分類精度上可大為提昇。

蔡敏之(1996)應用倒傳遞類神經網路且加入輔助資訊識別都市 地區,加入的輔助資料分為兩種包括空間相關性資訊及地理性統計資 訊,成果顯示輔助資料可有效提升分類精度。

詹進發(1997)探討類神經網路應用於遙測影像分類的可行性,

並使用不同誤差函數,研究其對分類精度? 生不同之影響。

陳繼藩等(1997)結合群集分析法(clustering analysis)和調適性

(18)

9

共振理論(adaptive resonance theory, ART)類神經網路模型,分兩階 段進行覆蓋與利用的分類工作;結果顯示比傳統演算法的分類精度提 高。

蕭百齡(1999)應用類神經網路與 SPOT 衛星影像分類,研究以 各類別準確度較高者為優先,依序疊合出分類準確度最高之地被類別 分佈圖,其總體準確度達 0.82,總體 kappa 值 0.787。

張右峻(1999)利用類神經網路探討土地利用型態與環境變遷,

研究中利用遙測影像與地理資訊系統進行資料收集與整理的工作,並 透過類神經網路進行變數間相關的分析工作。

邵泰璋(1999)應用類神經網路於多光譜影像分類,研究結果顯 示,在使用多時段光譜影像時,粗編碼之倒傳遞類神經網路展現出最 佳的分類效果;而使用多時段正規化差分植生指數影像時,則以一般 正規化編碼之倒傳遞類神經網路表現較佳。

周晏勤(2000)使用多變量分析法與類神經網路分析法所得結果,

皆顯示地層種類與坡度,對邊坡破壞的影響程度比其他分析用因子重 要。

洪皓人(2000)以鳳山溪上游集水區為例進行衛星影像分類方法 之研究,得知:類神經網路分類法因具備人類思考模式並能判釋混合 像元,以致表現最佳;監督式分類法因掌握地文資訊,但無法判釋混

(19)

10

合像元,所以居次;非監督式分類法因純粹以像元光譜特性聚集分類,

結果最差。

盧文鴻(2000)嘗試使用超矩形學習模式與類神經網路模式進行 影像分類。

孟中杰(2001)分別以數值高程模式、運動波模式以及類神經網 路模式等理論,建立各項地文、水文計算模組以及降雨逕流預報模組。

研究中利用遙測影像資料應用類神經網路中的倒傳遞類神經網路

(back-propagation neural network;簡稱 BPN),進行集水區地表覆蓋 分類以推求運動波集流時間公式所需之地表糙度係數值。

吳 俊 穎 ( 2001) 使用法國史波特(SPOT)衛星之影像,作為 監測水庫水體之資料來源,研究中組合 89 種影像因子並利用線性迴歸 方式,建構影像因子與地面水質參數(葉綠素、總磷、透明度)之模 型關係,尋求較佳之迴歸公式。建立永和山水庫水質污染狀況空間分 佈關係,並進而以 Carlson 營養狀況指標(Carlson Trophic Status Index,

CTSI)判別水庫水體優養狀況。由於利用上述方法推估結果仍不夠理 想,因此研究中再使用有測試與訓練之迴歸分析法與類神經網路來建 構水質推估模型,結果顯示以迴歸分析法與以神經網路模式皆可建構 模型,惟神經網路擁有自動配適之能力並可增進效率。

黃誌勇(2002)使用倒傳遞神經網路來產生 SPOT 的自然色影像,

研究中分為三個測試階段,(1)分別是以同一天的 Landsat 假色影像 與 Landsat 自然色影像進行訓練,得到一組權係數。(2)以該組網路 測試與 Landsat 同一天的 SPOT 假色影像產生 SPOT 自然色研究使用

(20)

11

倒傳遞神經網路的演算法使 SPOT 假色影像轉換到 SPOT 自然色影 像。影像的結果。(3)以不同天的 SPOT 假色影像進行網路回想,產 生 SPOT 自然色影像。以上三組的結果在目視上所呈現的色調皆與 Landsat 自然色很近似,若以相似性的評估檢核成果,相關係數皆大於 0.90,顯示以類神經網路產生自然色影像確實可行,於提高 SPOT 影 像使用層面上,具有實質成效。

(21)

12

第三章 理論基礎

3-1 衛星影像之應用

目前遙測系統已應用於農、林、漁、水資源、氣象及軍事等方面,

遙感探測於地表資源之應用,有六項不可缺之要素,分別為輻射源

(radiation source)、輻射路徑(transmission path)、目標物(object)、

感 測 系 統( sensing system)、 資料處理與分析( interpretation and analysis )、使用者(users)。

遙測資料之最基本單元為像元(pixel),相同類別之像元在不同光 譜波段(spectral band)內會因其反射、放射率的差異而有其特殊之分 布範圍,亦即地表覆蓋物會因其種類及狀況之不同,在遙測影像上有 所差異。在由 n 個光譜波段所構成之 n 維空間中,相同類別之像元即 形成一群集。理想情況下,不同類別所形成之群集應在此 n 維空間中 存在著明顯的距離,如圖 3-1 所示(林錦全 1995)。

圖 3-1.不同類別之分佈情形(林錦全 1995)

(22)

13

3-2 影像資料分類

對衛星影像分類的工作可分成二階段,第一階段為訓練另一階段 對影像進行分類,訓練階段從訓練區蒐集地表覆蓋物波譜反應型式之 數值資料,而分類階段則將每一個未知的像元和波譜型式比較,指定 為最相似的類別,其基本原理為考慮各類別群集在 n 維空間中之位 置、分布情況等因素下,以數學或統計理論決定某未知類別像元之歸 屬類別。

傳統影像分類方法包含如圖 3-2 的步驟(Schowengerdt,1997):

1. 特徵萃取(feature extraction)

藉由空間轉換或光譜轉換,將多光譜影像轉換成特徵影像。

此步驟非必須的,多光譜影像也可以視情況需要直接使用。

2. 訓練(training)

萃取像元以供分類器訓練並辨識各類別,於特徵空間內決定 判釋方法,每一像元允許被指定為某一類別。此步驟可由分析人 員決定採監督式或非監督式的。

3. 分類(labeling)

將判釋方法應用於整個特徵影像並分類所有像元,如上述訓 練過程為監督式的,則分類與判釋方法有關;如為非監督式的,則 分析人員此刻必須監督分類。輸出影像圖內每一個像元即代表一 個種類。

最後的結果為將數值影像資料轉換為描述性的分類,並得以 辨識不同的地表覆蓋物或狀況。

(23)

14

圖 3-2.影像分類流程圖

( 參考資料來源:Robert A.Schowengerdt,1997 )

大氣層

感測器

多光譜影像

特徵萃取

訓練

分類

A B C

實景

特徵影像 分類器

主影像圖

(24)

15

3-3 衛星基本資料

本研究使用捷鳥(QuickBird)衛星之影像,它為美國 Digital Globe 公司所擁有高解析度光學衛星,在 2001 年 10 月 18 日於美國

Vandenberg 空軍機地順利發射升空,同年 12 月份開始接收衛星影像。

QuickBird 捷鳥衛星係從 450 公里外的太空拍攝地球表面上之地物、地 貌等空間資訊,其影像解析度高達 61 公分,是全球首顆提供 1 米以下 解析度之光學衛星。QuickBird 衛星為太陽同步衛星,平均 4 至 6 天即 可拍攝同一地點的影像。因此,QuickBird 衛星影像可提供快速且清晰 品質,更可快速掌握環境訊息。

Quick Bird 衛星影像可同時接收 Black & White、Blue(藍色可見 光)、Green(綠色可見光)、Red(紅色可見光)、Near infra-red(近紅 外光)5 個波段的波譜資料如圖 3-3 所示,影像類別分為全色態影像

(黑白影像)、多光譜影像(彩色影像)三種,QuickBird 捷鳥衛星可 分為三大類:

A. 全色態影像

全色態影像即黑白影像(Panchromatic),其影像解析度為 61~72 公分,收集單一波段(B&W)波譜資料,波譜範圍為 0.45~0.90microns,

提供 Basic 與 Standard 兩種影像處理等級之影像資料。

B. 多光譜影像

(25)

16

多光譜影像(multi-spectral)又可稱為彩色影像,其收集了四個 波段之波譜資料,藍色可見光、綠色可見光、紅色可見光及近紅外光 等,藍色可見光:0.45~0.52、綠色可見光:0.52~0.60、紅色可見光:

0.63~0.69、近紅外光:0.76~0.90、影像解析度為 2.44~2.88 公尺,提 供 Basic 與 Standard 兩種影像處理等級之影像資料。

C. 彩色合成影像(Pan-sharpened)

係將解析度 70 公分之全色態影像與解析度 2.88 米之多光譜影 像融合(Fusion)後,製成解析度為 70 公分的彩色合成影像,所提供 波譜資料型態有 Natural Color(B,G,R)、Color Infrared(G,R,N-IR)、4 個 band(B,G,R,N-IR)三種、資料類別為 8 bits,提供 Standard 影像 處理等級之影像資料。

美國 DigitalGlobe 公司提供 Basic、Standard 及 Ortho Ready Standard 三種處理等級的 QuickBird 捷鳥衛星影像資料。

所謂的 Basic 等級,係指影像資料僅經過輻射校正(radiometric distortion)及衛星系統(sensor distortion)之校正處理;空間解析度 為 全色態影像:61~72 公分、多光譜影像:2.44~2.88 公尺,資料型態

(dynamic range)為 8 Bits 或 16Bits。

Standard 等級之衛星影像,除了輻射校正及衛星系統之校正外,

並透過 GTOPO30DEM 進行影像的幾何糾正處理;空間解析度有兩種

(26)

17

全色態影像為 70 公分、多光譜影像為 2.8 公尺,資料型態(Dynamic Range)8 Bits 或 16Bits。

而 Ortho Ready Standard 等級之衛星影像,係指未經過任何地形改 正(terrain corrections)處理,而直接投影於參考橢球體之平均海平面 上。影像處理過程,包含:輻射校正(radiometric distortion)、衛星系 統校正(sensor distortion)、 地圖投影(map projection),空間解析度 全色態影像為 70 公分、多光譜影像為 2.8 公尺,資料型態(Dynamic Range)8 Bits 或 16Bits。

圖 3-3. QuickBird 衛星影像可接收之波段類別

(資料來源:http://www.quickbird.com.tw/)

(27)

18

表 3-1. QuickBird 影像類別 影像類

全色態影像

(Panchromatic)

多光譜影像

(Multi-Spectral)

彩色合成影像

(Pan-sharpened)

俗稱 黑白影像 彩色影像 彩色合成影像

影像解 析度

61~72 公分 2.44~2.88 公尺 70 公分

波段數 單一波段 4 個波段 3 或 4 個波段 波譜範

0.45~0.90microns

Blue:0.45~0.52 Green:0.52~0.60

Red:0.63~0.69 Near-IR:0.76~0.9

(Blue、Green、Red) 或

(Green、Red、Near-IR) 或

(Blue、Green、Red、

Near-IR) 影像處

理等級

Basic 與 Standard Basic 與 Standard

Standard

(資料來源:http://www.quickbird.com.tw/)

(28)

19

表 3-2. QuickBird 影像處理

影像資訊(Image Information)

影像精確

(Image Accuracy)

影像解析度

(Spatial Resolution)

光譜解析度

(Spectral Resolution)

CE90% RMSE 全色

多光譜 彩色 合成

全色態 多光譜 彩色合成

Basic 23 公尺 14 公尺 61~72

公分

2.4~2.8 公尺

不提 供

0.45~0.90 microns

B:0.45~0.52 G:0.52~0.60 R:0.63~0.69 IR:0.76~0.90

不提供

Standard 23 公尺

14 公尺

70 公分

2.8 公尺

2.8 公尺

0.45~0.90 microns

B:0.45~0.52 G:0.52~0.60 R:0.63~0.69 IR:0.76~0.90

(B,G,R)

(G,R、IR)

(資料來源:http://www.quickbird.com.tw/)

目前 QuickBird 捷鳥衛星影像所應用範圍有土地開發、自然資源 管理、都市規劃設計、環境監測(如空氣污染、油污擴散、淹水災區 之潛勢分析… 等)、農作物判識、土地利用變遷分析、生態調查、目標 物判識、景觀圖面展示與高精度之地圖繪製等用途使用上。

本研究所使用的 QuickBird 衛星影像是台灣 TM 二度分帶座標系

(29)

20

統,處理等級為 Standard,影像為多光譜是 2.88 公尺,全色態是 70 公 分,拍攝日期為 2002 年 8 月 24 日,格林威治時間二點三十二分四十 四秒換算後為台灣早上十點三十二分四十四秒,拍攝時雲蓋百分率為 零。其影像如圖 3-4。

圖 3-4.本研究所使用的 QuickBird 衛星影像

(30)

21

3-4 應用軟體、硬體設備

表 3-3.軟、硬體設備一覽表 個人電腦:Pentium 4

體 全球衛星定為系統接收器:Garmin eTrex Vista GIS 軟體:ArcView GIS Version 3.2a

影像處理軟體:ERDAS IMAGINE 8.4 TNT Mips

3-5 決定特徵

本研究考慮的特徵有近紅外光段(IR)、紅外光段(R)、綠光段

(G)、藍光段外(B),另外還加入植生植標差(NDVI)與光波波段 比值(RVI)。

1.

近紅外光段(IR)

2.

紅外光段(R)

3.

綠光段(G)

4.

藍光段(B)

5.

正 規 化 差 分 植 被 指 標

(normalized difference vegetation

index ;NDVI)

(31)

22

綠色植物因有吸收藍光(B)、紅光(R)及強烈反射紅外光(IR)

之特性,故可應用於植物資源之探測,判別植生反射量之多寡,而正 規化差分植被指標〈NDVI〉為較常被使用的植被指標,定義為近紅外 光波與紅外光波段之差異與兩者之和的比值,其比值介於-1~1 之間,

為了避免比值有負數出現於是加上一個常數,再乘上 100,既可將 NDVI 值擴展到 0~200 之間,較符合遙測影像分析數值(0~255)的需 求,其計算式(3-1):

100 1 ×

 

  +

 

+

= −

R IR

R

NDVI IR

(3-1)

NDVI:表示正規化差分植被指標 IR:表示近紅外光波段

R:表示紅光波段

6.光波波段比值(ratio vegetation index ;RVI)

光波波段比值的影像具有以下幾項特點:

a.不同特徵波譜反應曲線亮度值若有顯著差異時,會被強調出來。

b.減少地形因子與坡向所造成日照不均的影響,並在使用多光譜影 像時,有助於常態化其亮度值的差異。

c.減少所有來自遙感探測器的影響,因每個波段受到同樣影響。其 公式如(3-2)

=( )×100 R

RVI IR (3-2)

(32)

23

3-6 影像分類成果的精確度評估

遙測影像經分類後所得到的資訊,分類成果的精確度評估是否達 到需求,是遙測分類能否達到監測目的的一個研究重點,而目前對於 影像精確度評估最常使用的方法是誤差矩陣,因此對誤差矩陣作一概 略性介紹。

誤差矩陣為一個方形的矩陣,類別數方陣中的行、列數相等,行 列數因種類數量而定,如表 3-4 為例有四種類別,行(column)表示 參考資料 的類 別( reference data), 而以列( row) 表示分類類別

(classification),所有的結果皆可從於矩陣表現中得知,誤差矩陣是 以比較取樣區域的參考類別和相同取樣空間中的遙測影像分類成果的 差異狀況。

表 3-4.誤差矩陣關係(Error matrix)表 分類成果(classification)

類別 A B C D 合計 生產者精度 A XAA XAB XAC XAD X1+ PA1+

B XBA XBB XBC XBD X2+ PA2+

C XCA XCB XCC XCD X3+ PA3+

D XDA XDB XDC XDD X4+ PA4+

合計 X+1 X+2 X+3 X+4 X

地面參考真值 (reference data)

使用者精度 UA+1 UA+2 UA+3 UA+4

(資料來源:Verbyla,D.L.,1995)

在矩陣對角線上所表示的 XAA、XBB、 XCC及 XDD是地面參考類 別與分類的成果呈現一致(Agreement)狀況的數目,而 XAB、 XAC

(33)

24

XAD則表示出在已知的地面參考資料中,經過分類後將原屬於 A 類別 的元素判釋? 非 A 類別元素,此既為? 漏授(omission 或 exclusion), 而 XBA、 XCA、 XDA的數值則表示將地物原不屬於 A 類別的元素歸

? A 類別,此種狀況? 誤授(commission 或 inclusion)。精度評估指 標為判斷分類成果是否達到滿意需求之依據,因此藉由誤差矩陣關係 表中可得到的分類評估指標除了使用者精度(user’s accuracy,UA)、

生產者精度(producer’s accuracy,PA)外、尚可計算整體精度(overall accuracy,QA)、平均精度(average accuracy, AA)、Kappa 指標、Tau 係數指標(T)等。誤差矩陣可以視為描述與解釋精度發展的起點,

以下分別介紹常用的分析技巧;首先對符號作定義。

x

ij

:表示在誤差矩陣中第 I 列第 j 行的元素;

xi+:表示第 i 列元素總和;

x+i :表示第 I 行元素總和;

N:表示元素總和;

n:表示類別數。

(1)整體精度(Overall Accuracy)

最簡單的整體描述法,對角線元素總和除以所有元素的總和,由 於已考慮到每個類別相對的權重關係,所以整體精度較客觀公式如 (3-3):

% 100 Accuracy

Overall

1 1

n

1

i ×

=

∑ ∑

= =

= n

i n

j ij ii

X X

(3-3)

(34)

25

(2)生產者精度(Producer’s Accuracy)

生產者精度針對單一類別的精度表示。採用任一種類中,分類 正確的元素量除以參考資料中屬於此一種類的元素總和,公式如 (3-4):

% X 100

Accurac X Producers

i ii

×

= ∑

+ (3-4)

此精度即表示在使用某種分類方法下,地面參考資料可正確地被 分類的精度,另一相同的意義即為漏授誤差(Omission Error);與生 產者精度同樣意義者為漏授,漏授表示已知類別被遺漏而歸類到其他 類別,其公式定義為:

漏授(OE)=1- Producer’s Accuracy(PA)

(3)使用者精度(User’s Accuracy)

使用者精度和生產者精度都是針對單一類別的精度表示。採用任 一種類別中分類正確的元素除以分類後被歸為此種類別的元素總和,

公式如(3-5) :

% X 100

Accuracy X Users

i ii

×

= ∑

+ (3-5)

表示地面覆蓋物經分類後,類別被正確歸類的機率;另一個相似 意義的是誤授誤差(Commission Error),表示分類後之類別被錯誤分 類的百分比。其表示式為:

(35)

26

誤授(CE)=1-User’s Accuracy (4)平均精度(Average Accuracy)

平均精度為被正確分類百分比的平均值,即生產者精度加總後之 平均值,在遙測分類精度評估中若地表物各類別的面積大致相等,則 平均精度有其意義存在,但是不同類別的地物面積差異頗大,此時需 考慮每個類別之精度是否平均,如一個像元素很少的地物有高的生產 者精度但佔大部分像元素的地物卻有相對較低的精度值精平均後拉高 了平均精度平均精度經不具意義。其表示式為(3-6):

% 1 100

Accuracy Average

1

×

=

= +

M

i i

ii

X X

M (3-6) (5)Kappa 指標

假設有一誤差矩陣,整體精度 70%,某類別的使用精度 65%,但 產品精度高達 84%,此時該如何分辨分類好壞?因此,另一個離散多 變相的分析技巧 Kappa( K^ )由 Cohen(1960)提出,Kappa 指標為 表示分類成果比隨機分類好多少的指標。Kappa 統計指標考慮到兩種 一致性的差異,一為自動分類和參考資料間的一致性,另一為取樣和 參考分類的一致性機率。一般而言,Kappa 介於 0~1 間,Kappa 值越 大代表分類精度越高。

agreement chance

agreement chance

accuracy observed

K 1 _

_ _

^

= −

(36)

27

% 100 )

* (

)

* (

1 2

1

1 ×

=

= + +

= +

=

n

i

i i

n

i

i i

n

i

ii

X X

N

X X

X N

(3-7) Kappa 指標另一項功能是可以提供統計測試,利用σ Kappa 可作 Z 檢定 (Z-test,如 3-9 式),決定在兩種不同的分類方法之間是否有明顯的差 異。Kappa 的標準差計算方法如下:

) ] 1 (

) 4 ( ) 1 ( )

1 (

) 2

)(

1 ( 2 ) 1 (

) 1 [ ( 1

4 1

2 1 3 2 0 3

1

3 1 0 0 2

1 0 2 0

P P P P P

P P P P P

P P

Kappa

N

− + −

− + −

= − σ

(3-8) 其中,

=

= n

i

X ii

P N

1 0

1

i n

i

i X

N X

P +

=

= 1 *

1 1 2

) (

1 *

1

2 2 i i

n

i

ii X X

N X

P + +

=

+

=

2

1 1

3 1 3 * ( )

i j

n

j i

ij X X

N X

P +

==

+

=

評估兩種分類方法之分類成果是否有差異之檢定,屬於獨立樣本

(Independent Sample)之雙母體檢定,使用的檢定假說分別為:

C1:方法一結果等於方法二結果,即種方法無顯著差異;

C2:方法一結果不等於方法二結果,即兩種方法有顯著差異。

2 2 2 1

2 1

σ σ +

= CC

Z (3-9)

(37)

28

如取α=0.05 值時,即為 95%的信心區間時,查表可得 Z0.05=1.96,

假若式〈3-9〉計算出之 Z 值小於 1.96,則接受 H0假說,兩種分類方 法成果並沒有顯著的差異;相反地,若 Z 值大於 1.96,則拒絕 H0接 受 H1假說,即兩種分類方法有明顯差異。本研究成果將採用 Z-test 檢驗,檢驗各種方法是否有顯著的不同。

表 3-5. 型Ⅰ錯誤與型Ⅱ錯誤(周文賢,1997)

事實 決策

H0為真 H1為真

結論為 H0 決策正確 型Ⅱ錯誤 結論為 H1 型Ⅰ錯誤 決策正確

以上所述的全體精度與平均精度無法顧及漏授與誤授的情形,所 以可能發生分類之平均精度或全體精度不佳,但其中某個類別的生產 者精度或使用者精度極高的狀況。K 指標則同時考慮整個誤差矩陣的 對角線元素與非對角線元素,是屬於分類成果與檢核資料間相似程度 的指標,故 k 係數指標可用來代表誤差矩陣的統計意義。

本研究中即利用全體精度、k 指標進行精度評估,至於平均精度 只提供參考,而分類成果將採用 Z-test 檢驗,檢驗各方法是否有顯著 不同。

(38)

29

第四章 影像分類分法與原理

傳統利用遙測影像判釋地表覆蓋,主要是應用統計方法計算地表 特徵物在各電磁波波段範圍內反射強度之平均值向量(mean vector)

與共變異數矩陣(covariance matrix),並依此建立分類判讀準則,進 而區分出特徵物之類別。而類神經網路屬一種形式特殊的統計方法,

利用其柔性之網路結構所具有的大量可調適參數以及具有容錯能力之 特性:經不斷學習已知類別地表特徵物及其波譜反射特性之內對映規 則,並記憶於網路結構中,以提供未知類別之地表特徵物分類應用。

(Yoshida and Omatu,1994;陳繼藩 1997)。

衛 星 影 像 的 分 類 方 法 分 為 監 督 性 分 類 法 ( supervised classification)及非監督性分類法(unsupervised classification)二種。

其所根據的原理都一樣,都是用「波譜型態辨認法」,所謂波譜型態是 指遙測資料值在特徵空間聚集的情形(歐陽鐘裕,1986)

監督性的分類法係需先決定分類之各類別,再以既有資料研究 各類別在 n 維空間中之分佈特性,並依此特性決定未分類像元之歸屬 類別,其中較著名有最大概似決定法( maximum-likelihood decision Rule)、貝氏分類法(bayesian classifier)、平行六面體(parallelepiped)、 最小距離法(minimum distance)、類神經網路分類法(artificial neural network classifier)、及超矩形學習模式分類法(hyper-rectangles learning model classifier)等方法。其監督性分類法有五個主要步驟(洪皓人,

2000):

1.目標物訓練樣區選取,例如水田、修耕田、建築物、水體、雜木林、

裸露地等。

(39)

30

2.由衛星影像中判釋具有代表性的目標物像元,即訓練樣區,同時配 合現地土地利用資料,此方式較易找到足夠之數量與正確之樣本樣 元。此步驟甚為重要,因為訓練樣區的統計資料為分類時之標準,若 其中摻雜太多的混合像元,容易導致分類準確性降低。

3.從選出的訓練樣區中,計算各波段之統計資料。

4.多波段影像中,相鄰波段相關性較高,不同的物質可能在某些波段 具有相似的反應,若事先能知道它們相關程度,則分類時可減少波段 數目,以節省時間、提高分類準確性。

5.利用以上四步驟所決定之各項參數來進行影像分類。

非監督式分類是依照地物的光譜值做地物的分類,由於並沒有利 用空間的判釋資訊,所以其分類會有不少誤判的情形發生。非監督性 分類又稱群集分析(Cluster analysis ),需先決定欲分類之類別數目

(m),再由統計理論將 n 維空間中之所有像元區分為 m 類。非監督 性分類與監督性分類兩者最大不同點在於分類過程中並不需先知道類 別之特性。其中較著名 K-均數演算法(K-means algorithm)(阮聖裕,

1994)。

倒傳遞類神經網路為類神經網路方法中使用最為普遍,而傳統監 督式分類法為高斯最大似然分類法最常使用,因此本研究選用類神經 網路分類法及最大概似決定法來對影像分類。

4-1 高斯最大似然分類法

最大概似分類法,通常假設影像之分類特徵具有多變量常態分 佈。計算訓練樣區每一類的共變異矩陣(Covariance matrix)、平均向

(40)

31

量(mean vector),再以(4-1)式計算第 i 類中 X 出現之機率。

( )

X i =

( )

d

i 

(

X i

)

T

i

(

X i

)



P π 2 21 µ 1 µ

2 exp 1 2

(4-1)

(1)式中:

d 為特徵數;

i 為第 i 類的共變異數矩陣;

1

i

i 的反矩陣;

i

i 的行列式值;

µi為第 i 類的平均值向量;

(

Xµi

)

T

(

Xµi

)

的轉置矩陣;

X 為某樣本以特徵表示,為 d 維矩陣;

( )

Xi

P :為某 X 由第 i 類而來的機率;

S

ij

:第 i 類與第 j 類的共變異數。









=

xd

x x

x Μ

2 1









=

di i i

i

µ µ µ

µ Μ

2 1













=

dd d

d d

d d d

i

S S

S S

S S

S S

S S

S S

S S

S S

Λ Μ Ο Μ Μ Μ

Λ Λ Λ

3 2 1

3 33

32 31

2 23

22 21

1 13

12 11

在分類時,比較出某樣本 X 在那一類類別中的機率密度函數值最 大,即可判釋該樣本為那一類,最大概似法分類之決策如圖 4-1 所示。

(41)

32

( ) ( ) ( ) ( )







r X P

X P

X P

X P

X

Λ Λ

3 2 1

圖 4-1.最大概似法分類決策示意圖

茲以圖 4-2(一維二類別為例)說明判別 X 該屬於第 i 類或第 j 類的規則。(1)若 X>X0 時,P (X j)> P(X i),則將 X 分類成第 j 類;

(2)若 X<X0 時,P

( ) ( )

Xi >P X j ,則將 X 分類成第 i 類;(3)若 X=X0 時,P

( ) ( )

Xi = P X j ,則將 X 分類成第 i 類及第 j 類的機率相等。

圖 4-2.最大概似分類法判別說明 選 擇 最 大 的 值,並將 X 指定

(42)

33

4-2 類神經網路

類神經網路是「一種基於腦與神經系統研究所啟發的資訊處理技 術」。它可以利用一組範例(即系統輸入與輸出所組成的資料)建立系 統模型(輸入與輸出間的關係),有了這樣的系統模型便可用於推估、

預測、決策、診斷 (葉怡成,2002) 。

類神經網路的應用依其輸出變數之特性可分成二大類:

1.函數型問題

網路的輸出為一個連續值的變數,例如

物理化學變量(濃度、溫度、PH 值、強度、流量、座標、尺寸… ) 經濟社會變量(股價漲跌百分比、匯率、利率、成本、銷售量… ) 2.分類型問題

網路的輸出為一組代表分類的變數,例如 決策(醫藥處方、替代方案、買賣決策… ) 診斷(疾病種類、故障原因、訊號分類… )

一個類神經網路是由許多個人工神經元與其連結所組成,並可組 成各種網路拓撲(topology),其中以前向網路(forward network)應 用最為普遍。一個前向網路包含許多層,每一層包含若干個處理單元,

輸入層處理單元用以輸入外在環境的訊息,輸出層處理單元用以輸出 訊息給外在環境。此外,一個層狀類神經網路經常包含若干層隱藏層

(hidden layer)。隱藏層的存在提供類神經網路表現處理單元間的交互 作用,與問題的內在結構的能力。通常每一層處理單元均有連結與相

(43)

34

鄰層的處理單元連接,前向類神經網路的重要術語及概念說明如下:

(1) 推論過程(reasoning process)

在推論時,網路激發訊號的傳遞均是從輸入層開始,經 由若干層隱藏層,最後到達輸出層。

(2) 學習過程(learning process)

在學習時,誤差訊號的傳遞是從輸出層開始,經由若干 層隱藏層,最後到達輸入層,並在誤差訊號的傳遞過程修正連接 上的加權值大小。

(3) 訓練範例(training example)

一個訓練範例包括一組輸入處理單元的輸入值,與一組輸出處理 單元的輸出值。

(4) 學習演算法(learning algorithm)

一種修正連結中的加權值的演算法,可從一組訓練範例中學習隱 函的知識。生物神經網路的形狀與一般細胞有很大的不同,它包含了:

神經核(soma)、神經索(axon)、神經樹(dendrites)和神經節(synapse)

四個部分,如圖 4-3 所示,分述如下:

類神經網路是由許多的人工神經細胞所組成,人工神經細胞又稱 為神經元、人工神經元或處理單元(processing element),人工神經 元模型如圖 4-4,每一個處理單元的輸出以扇狀輸送出,做為其他處 理單元的輸入,其輸入值與輸出值的關係式,如式(4-2),可用輸入

(44)

35

值的加權乘積和函數表示:

) (

1

=

= n

i

j i ij

i f W X

Y θ (4-2)

其中:

Yj:模仿生物神經元的模型的輸出訊號。

f:模仿生物神經元的模型的轉換函數(transfer function),將從

其他處理單元輸入值的加權乘積和轉換成處理單元輸出值的數學公 式。

Wij:模仿生物神經元的模型的神經強度,又稱連結加權值。

Xi:模仿生物神經元的模型的輸入訊號。

Θj:模仿生物神經元的模型的閥值。

介於處理單元間的訊息傳遞路徑稱為連結(connection)。每 一個連結上有一個數值的加權值 Wij,表示第 i 個處理單元對第 j 個處理單元影響程度。

(45)

36

圖 4-3.生物神經元模型

圖 4-4.人工神經元模型 輸入訊號

偏權值 輸出訊號

連結加權值

轉換函數

yj netj

Wij

Θj

輸入神經樹

輸出神經樹

神經軸

神經節

神經細胞核

神經細胞 核

(46)

37

從遙感探測觀點歸納出類神經網路的優缺點如表 4-1(Jarvis & Stuart,1996; Hafner& Komac,1998)

表 4-1.類神經網路的優缺點

l 具有非線性的構件

l 對於雜訊與不完整的資料具有相當的容忍度

l 容許名詞性或輔助資料輸入網路

l 演算法具有平行處理的能力

l 輸入資料分佈無根據統計假設

l 網路架構權值訓練完成後,即可有效的分類

l 相對於傳統分類方法,類神經網路可採用較少的訓練樣本

l 可歸納和合併紋理資訊

l 有能力去處理前後資料間的關係

l 理想的網路架構和訓練演算法仍處於研究階段

l 訓練階段可能收斂於局部最小值問題

l 部份網路架構需要龐大的硬體設備

l 預測模式與處理過程不透明化,權值作用不易解釋

l 部份網路模式訓練學習過程耗時多

(47)

38

4-2-1 倒傳遞類神經網路

倒傳遞類神經網路模式(Back-propagation Network,BPN)是目 前類神經網路學習模式中最具代表性,應用最普遍的模式。倒傳遞類 神經網路基本原理是利用最陡坡降法( Gradient Steepest Descent Method)的觀念,將誤差函數予以最小化。

倒傳遞類神經網路架構如圖 4-5 所示,包括(1)輸入層:用以表現 網路的輸入變數,其處理單元數目依問題而定,使用線性轉換函數,

即 f(x)=x ;(2)隱藏層:用以表現輸入處理單元間的交互影響,其 處理單元數目並無標準方法可以決定,經常需以試驗方式決定其最佳 數目。使用非線性轉換函數,網路可以不只一層隱藏層,也可以沒有 隱藏層;(3)輸出層:用以表現網路的輸出變數,其處理單元數目依 問題而定,使用非線性轉換函數。

就每一個神經元來說,可接收鍊結之輸入訊號,並經轉換函數 與閥值計算,輸出其反應值,以第 n 層的第 j 個單元得輸出值 Anj

為例,其為第 n-1 層單元輸出值的轉換函數值如式 4-3:

) (

nj

n

j

f net

A =

(4-3)

f:轉換函數

其中集成函數 netnj定義如式(4-4)

(48)

39

=

j

n j ij n

j

W A

net

'

1

θ

(4-4)

Wij:神經元 i 與神經元 j 間的連結強度,即連結加權值

θj:神經元 j 的閥值

根據神經元連結的關係,以最陡坡降法來調整神經元間的連結加權 值,期望達到誤差函數的最小值。誤差函數定義如式(4-5)。

=

j

j

j A

T

E ( )2

2

1 (4-5)

Tj:目標輸出值

Aj:推論輸出值

若未達到設定之誤差量則網路權值需要修正修正方式如式(4-6)

ij

ij W

W E

− ∂

=

η. (4-6)

Wij

∆ :神經元 i 與神經元 j 間的連結加權值修正量

η:學習速率(Learning Rate)

(49)

40

另外為避免網路收斂時產生震盪情形,可增加慣性量(Momentum)

的設計,如式(4-7)

ij ij

ij W

W E

W

+ ∂

=

α η. (4-7)

α:慣性量

圖 4-5. 倒傳遞網路

網路演算程序為:

步驟 1:設定網路參數,包含隱藏層數目、各層單元數目、學 習速率、容忍誤差等。

步驟 2:以亂數產生初始權重和偏權值。

步驟 3:計算隱藏層與輸出層之輸出。

步驟 4:計算誤差值。

步驟 5:計算加權修正量。

步驟 6:調整各層加權量和偏權值。

步驟 7:跳回步驟 3,重複計算誤差至容忍誤差內時,或達到 預設訓練次數時,網路即停止運算。

(50)

41

4-2-2 常用之非線性轉換函數

轉換函數的目的是將作用函數輸出值已轉換成處理單元的輸出,而 一般常用的非線性函數有下列二種:

1. 雙彎曲函數(sigmoid function)如圖 4-6a

e x

x

f = + 1 ) 1

( ,0<f(X)<1 (4-8)

2. 雙曲線正切函數(Hyperbolic tangent function)如圖 4-6b

e x

x

f = + 1 ) 1

( -1<f(X)<1 (4-9)

a.雙彎曲函數

b.雙曲線正切函數

圖 4-6. 倒傳遞類神經網路常用的非線性轉換函數

(51)

42

4-2-3 倒傳遞網路參數

倒傳遞網路有幾個重要參數,包括隱藏層處理單元數目、隱藏層 層數、學習速率、慣性項,詳述如下:

葉怡成,1993

(1)隱藏層層數

通常隱藏層之數目為 1-2 層時有最好的收斂性質,太多層或太少 層收斂結果均較差。沒有隱藏層不能反應此問題輸入單元間的交互作 用,因而有較大的誤差;而有 1 或 2 層隱藏層己足以反應此問題的輸 入單元間的交互作用,太多的隱藏層反而使網路過度複雜,導致收斂 性逐漸減低,造成更多局部最小值,使得在修正網路加權值時更易掉 入一個誤差函數的局部最小值,而無法收斂。依據經驗,一般問題可 取一層隱藏層,較複雜的問題則取二層隱藏層。但有一點必須注意:

在用倒傳遞網路解問題時,一定要先用無隱藏層架構試試看,如果其 精確性比有隱藏層者為佳,則此問題必不適合用倒傳遞網路解,其理 由為無隱藏層架構的倒傳遞網路其效果接近統計學上一些有「線性」

假設的方法,例如線性迴歸、區別分析,因此無理由用一個複雜的網 路解答去取代一個有明確公式的統計學解答。

(2)隱藏層處理單元數目

(52)

43

一般來說,隱藏層處理單元數目過少可能無法有效描述問題型 態;隱藏層處理單元數目越多則收斂越慢,但可達到更小的誤差值,

特別是「訓練範例」誤差。但超過一定數目後,再增加則對降低「測 試範例」誤差幾乎沒幫助,只是增加執行時間。為平衡研究品質與時 間成本,應取適當的處理單元數目。於一般情況下,隱藏層處理單元 數目的選取原則如下:

1.公式 1:隱藏層單元數目=(輸入層單元數+輸出層單元數)/ 2 或

公式 2:隱藏層單元數目=(輸入層單元數*輸出層單元數)1/2 2.問題雜訊高,隱藏層單元數目宜少。

3.問題複雜性高,隱藏層單元數目宜多。

4.測試範例誤差遠高於訓練範例誤差,隱藏層單元數目宜減少;反 之,宜增加。

(3)學習速率(η)

學習速率太大或太小對網路的收斂性質均不利,簡單的說:太小 時容易浪費時間,且可能無法跳脫局部最小值;太大易造成震盪不易 收斂。較大的學習速率,有較大的網路加權值修正量,可較快逼近函 數最小值,但過大的學習速率將導致網路加權值修正過量,並造成數 值振盪而難達到收斂的目的,因此學習速率的大小對學習有很大的影

Figure

Updating...

References

Related subjects :