• 沒有找到結果。

中 華 大 學 碩 士 論 文

N/A
N/A
Protected

Academic year: 2022

Share "中 華 大 學 碩 士 論 文"

Copied!
112
0
0

加載中.... (立即查看全文)

全文

(1)

中 華 大 學 碩 士 論 文

題目:類神經網路與一般克利金法在空間內 插之比較

Comparison of Artificial Neural Networks and Ordinary Kriging Method in Spatial Interpolation

系 所 別:土木工程學系碩士班 學號姓名:M09204044 薛仲宏 指導教授:葉怡成 博士

周文杰 博士

中 華 民 國 九 十 四 年 七 月

(2)
(3)
(4)
(5)
(6)

類神經網路與一般克利金法在空間內插之比較

研究生:薛仲宏 指導教授:葉怡成 博士 周文杰 博士 中華大學土木工程系碩士班

摘要

空間內插(Spatial Interpolation)是一種利用空間資料中已知點的 屬性值來推估未知點的屬性值的方法;類神經網路(Artificial Neural Network, ANN)多用於預測、分類與決策等問題,且類神經網路本身 具備有建構函數近似函數之功能,可用以建立未知資料方式模擬空間 分 析 中 網 格 之 型 式 。 故 本 研 究 選 取 五 組 個 案 係 以 一 般 克 利 金 法 (Ordinary Kriging, O.K.) 、倒傳遞網路(Back-propagation Network, BPN)與分析調整綜合網路(Analysis-Adjustment-Synthesis Networks, AASN)等三種方法繪置空間模型並以預測指標-誤差均方根(RMS)

與判定係數(

R

2)比較分析三種方法在數值推估上之優劣。研究結果顯

示除了個案(五)以外,其餘四組個案其類神經網路模式是可以達成 內插計算的效果,證實其在空間內插計算上的可行性。個案(一)~

個案(四)BPN 與 AASN 在數值預測能力上皆優於 O.K.,且可匯出 相似之空間模型。由本研究可知類神經網路亦可用於空間內插領域,

其預測準確率往往高於一般常用之空間內插法。

關 鍵 詞 : 一 般 克 利 金 法 (Ordinary Kriging, O.K.) 、 倒 傳 遞 網 路 (Back-propagation Network, BPN) 、 分 析 調 整 綜 合 網 路 (Analysis-Adjustment-Synthesis Networks, AASN)。

(7)

誌謝

打從開始撰寫此論文的第一個字開始,就非常期待著寫誌謝這天到來。在 這本百餘頁的心血即將付梓的前夕,令我想起了電影『征服情海』中的一句經典 對白:「You complete me!」。憶起這兩年研究生涯中的點點滴滴,一幕幕地 我腦海中浮現。朝夕相處的過程中有歡樂笑容,也有著不為人知的辛酸血淚。對 我而言,就像是一部值得細細品味的好電影啊!

首先感謝葉怡成老師這二年來的辛苦指導。葉老師認真嚴謹的治學態度,讓 我從中體會到在人工智慧領域真正的奧妙與精髓,在論文遇瓶頸處更給予我最大 的提點與包容,讓我不至於感到孤單無助。

再者感謝周文杰老師這一年來的細心指導,周老師在水資源以及地理資訊系 統兩個領域上博大精深的學問讓我在學習 GIS 的路上更加順利,在論文告急處 周老師更是不辭辛勞地給予鼓勵與協助。有了兩位好老師,讓我兩年的研究所生 涯更加充實,在此衷心祝福兩位老師一家身體健康與快樂。最後感謝評審委員─

曾惠斌教授細心的審閱,因為曾教授的建議與批評,讓這本論文更臻豐富與完整。

ANN 研究室的夥伴們,博士班振名學長與婷鈺學姊,碩士班學長為灝、宗 原、冠傑,同學立川、少宣、豐銘,學弟陳安、柏愷、定中、皓博等,感謝你們 為研究室這大家庭不斷地付出心力,讓研究室充滿了合諧與歡笑。兩年來數不清 的聚餐與一年級時的觀霧之旅、畢業後的花蓮之旅等,這些美好的畫面至今仍在 我腦海中繚繞著。還有系助理佩嵐、水資組逸靚同學,環工組宜含同學,大地組 安琪同學等,感謝你們曾經在論文期間給予我許多協助。

寶山鄉吉的堡美語的張主任,謝謝你讓我有機會體驗到當老師的責任感與成 就感。昭懿老師、欣儀老師,跟你們共事真的很快樂,在我課業兩頭燒時,你們 幫了我很多,這份情我會謹記在心,有空來高雄讓我請吃海之冰!還有被我教的 那班小鬼,你們確實讓我見識到在純真的外表下原來都是惡魔,要當你們老師不 簡單,不只要軟硬兼施,更要文武雙全,不然很快就會被你們淘汰掉。哈!還真 要謝謝你們能認同我的教學方式,讓我教起來很順手,不過我真的很好奇,你們 一學期讓兩個英文老師哭著回家吃自己,就只是因為她們相貌不佳嗎?

感謝一位一直在我身邊,當我犯錯時給我對大的包容與鼓勵;當我難過時默 默陪我度過低潮期的女朋友-佳雯,與妳在一起快三年我確實成長許多,風雨中 建立的感情確實是讓人會更珍惜眼前所擁有的一切,人生旅途中因為妳的相隨與 勉勵而變得更精采。

一個從國中就認識的死黨-峻傑,雖然我知道你是個有異性沒人性的傢伙,

你失戀時我總是會出面當你的垃圾桶,但看在十三年來的情義相挺與相互勉勵,

我就不計較了,很感謝上帝讓我同時擁有一個摯友兼損友,祝你一切順利。

專科時期的死黨簡仔、光志、家豪、世凱、偉仔、支仔冰等,每當我回高雄 時你們總是找我去後壁湖吃海產小酌兩杯,感覺像是幫剛出獄的大哥接風般,久 久見一次面總是有說不完的八卦事;大學時期的死黨阿銓等轉學生們,大家一起

(8)

從不同的地方來到陌生的新竹,兩年來彼此打氣加油,度過了異鄉的求學心酸 史;捷米的死黨文長、繪凌與飛燕等,很難相信我會在只短短打工三個月的地方 裡認識了你們這群好朋友,雖然至今各奔東西,但仍偶爾會小聚一番,說來都是 緣分使然吧!祝你們都找到屬於自己的幸福囉!

兩年的研究生涯,昔日一起共同打拼報告熬夜的場景,鬥嘴吵鬧PK 的畫面,

都將會是我最珍貴的記憶,謝幕這一天即將來臨,說來心中有不捨,也有感傷,

但天下無不散的筵席,今日的離別或許就是為了日後的相聚作準備。珍重了各位 ANN 的同志們!

最後將此論文獻給我最摯愛的父母親以及兄長,家中老么的我從小到大就倍 受你們的呵護關懷,並在背後給予我最大的肯定與援助,我若是有任何成就,都 應歸於你們,為我無怨無悔的付出,讓我始終深信家永遠是最安全的避風港。

僅將誌謝獻給每一個曾經在人生路上給予我鼓勵與支持的你們

薛仲宏 謹致 於新竹中華大學 中華民國九十四年七月

(9)

總 目 錄

本文目錄

...I

圖目錄

...IV

表目錄

...VIII

本 文 目 錄

第一章 緒論

...1

1.1 前言 ...1

1.2 研究方法與目的 ...4

1.3 個案簡述 ...6

1.3.1 個案(一):污染地區城市人口罹患甲狀腺癌機率 ...6

1.3.2 個案(二):鄰近地區土壤中銫(CS137)含量 ...8

1.3.3 個案(三):台灣各地區雨量站歷年平均降雨量 ...10

1.3.4 個案(四):美國愛達荷州(Idaho)雨量站 30 年平均降雨量 ...11

1.3.5 個案(五):田間鹼解氮含量 ...13

1.4 研究內容與流程 ...14

第二章 文獻回顧

...15

2.1 前言 ...15

2.2 克利金法 ...15

2.2.1 空間統計 ...15

2.2.2 區域化變數理論 ...16

2.3 類神經網路 ...22

2.3.1 類神經網路的原理 ...23

2.3.2 類神經網路的訓練(training)與學習(learning) ...27

(10)

2.3.3 倒傳遞網路與分析調整綜合網路架構 ...29

2.4 克利金法或類神經網路應用在空間內插之相關文獻 ...33

第三章 以一般克利金法建構空間模型

...38

3.1 前言 ... ...38

3.2 ArcGIS Geostatistical Analyst 簡介 ...38

3.3 模型建置流程 ...39

3.4 個案(一):污染地區城市人口罹患甲狀腺癌機率 ...40

3.5 個案(二):鄰近地區土壤中銫(CS137)含量 ...43

3.6 個案(三):台灣各地區雨量站歷年平均降雨量 ...46

3.7 個案(四):美國愛達荷州(Idaho)雨量站 30 年平均降雨量 .49 3.8 個案(五):田間鹼解氮含量 ...52

第四章 以類神經網路建構空間模型

...55

4.1 前言 ...55

4.2 PCNeuron3.1 簡介 ...55

4.3 模型建置流程 ...55

4.4 個案(一):污染地區城市人口罹患甲狀腺癌機率 ...57

4.5 個案(二):鄰近地區土壤中銫(CS137)含量 ...63

4.6 個案(三):台灣各地區雨量站歷年平均降雨量 ...67

4.7 個案(四):美國愛達荷州(Idaho)雨量站 30 年平均降雨量 .71 4.8 個案(五):田間鹼解氮含量 ...75

第五章 一般克利金法與類神經網路之比較

...79

5.1 前言 ...79

(11)

5.2 個案(一):污染地區城市人口罹患甲狀腺癌機率 ...79

5.3 個案(二):鄰近地區土壤中銫(CS137)含量 ...81

5.4 個案(三):台灣各地區雨量站歷年平均降雨量 ...83

5.5 個案(四):美國愛達荷州(Idaho)雨量站 30 年平均降雨量 .85 5.6 個案(五):田間鹼解氮含量 ...87

5.7 討論 ...89

第六章 結論與建議

...91

6.1 結論 ...91

6.2 建議 ...91

參考文獻

...93

(12)

圖目錄

圖 1-1 污染地區城市名稱與罹患機率分佈圖 ...8

圖 1-2 隨機取樣CS137含量分佈圖 ...9

圖 1-3 台灣地區各縣市雨量站分佈圖 ...11

圖 1-4 愛達荷州(Idaho)於美國地理位置示意圖 ...12

圖 1-5 愛達荷州(Idaho)雨量站位置分佈圖 ...12

圖 1-6 鹼解氮含量(mg/kg)分佈圖 ...13

圖 1-7 研究流程圖 ...14

圖 2-1 空間推估示意圖 ...17

圖 2-2 真實系統 A 與系統模型(類神經網路)B 之比較 ...22

圖 2-3 生物神經元的模型 ...24

圖 2-4 人工神經元模型 ...25

圖 2-5 隱藏層輸出層非線性轉換函數 ...25

圖 2-6 倒傳遞網路(BPN)模型 ...27

圖 2-7 分析調整綜合網路(AASN)模型 ...30

圖 2-8 分析次網路轉換函數 ...32

圖 2-9 綜合次網路轉換函數 ...32

圖 3-1 ArcView 操作介面 ...38

圖 3-2 克利金空間模型建構流程圖 ...39

圖 3-3 個案(一)測試與訓練範例取樣圖 ...40

圖 3-4 個案(一)半變異圖模型參數設定 ...41

圖 3-5 個案(一)最近鄰居點參數設定圖 ...41

圖 3-6 個案(一)推估成果輸出圖 ...42

圖 3-7 個案(一)克利金空間模型 ...42

(13)

圖 3-9 個案(二)半變異圖模型參數設定 ...44

圖 3-10 個案(二)最近鄰居點參數設定圖 ...44

圖 3-11 個案(二)推估成果輸出圖 ...45

圖 3-12 個案(二)克利金空間模型 ...45

圖 3-13 個案(三)測試與訓練範例取樣圖 ...46

圖 3-14 個案(三)半變異圖模型參數設定 ...47

圖 3-15 個案(三)最近鄰居點參數設定圖 ...47

圖 3-16 個案(三)推估成果輸出圖 ...48

圖 3-17 個案(三)克利金空間模型 ...48

圖 3-18 個案(四)測試與訓練範例取樣圖 ...49

圖 3-19 個案(四)半變異圖模型參數設定 ...50

圖 3-20 個案(四)最近鄰居點參數設定圖 ...50

圖 3-21 個案(四)推估成果輸出圖 ...51

圖 3-22 個案(四)克利金空間模型 ...51

圖 3-23 個案(五)測試與訓練範例取樣圖 ...52

圖 3-24 個案(五)半變異圖模型參數設定 ...53

圖 3-25 個案(五)最近鄰居點參數設定圖 ...53

圖 3-26 個案(五)推估成果輸出圖 ...54

圖 3-27 個案(五)克利金空間模型 ...54

圖 4-1 PCNeuron 3.1 操作介面 ...55

圖 4-2 類神經網路建構空間模型流程圖 ...56

圖 4-3 個案(一)BPN 收斂圖 ...60

圖 4-4 個案(一)AASN 收斂圖 ...60

圖 4-5 個案(一)未知檔輸出示意圖 ...61

圖 4-6 個案(一)BPN 空間模型...62

(14)

圖 4-7 個案(一)AASN 空間模型...62

圖 4-8 個案(二)BPN 收斂圖 ...64

圖 4-9 個案(二)AASN 收斂圖 ...65

圖 4-10 個案(二)BPN 空間模型 ...66

圖 4-11 個案(二)AASN 空間模型 ...66

圖 4-12 個案(三)BPN 收斂圖 ...68

圖 4-13 個案(三)AASN 收斂圖 ...69

圖 4-14 個案(三)BPN 空間模型 ...70

圖 4-15 個案(三)AASN 空間模型 ...70

圖 4-16 個案(四)BPN 收斂圖 ...72

圖 4-17 個案(四)AASN 收斂圖 ...73

圖 4-18 個案(四)BPN 空間模型 ...74

圖 4-19 個案(四)AASN 空間模型 ...74

圖 4-20 個案(五)BPN 收斂圖 ...76

圖 4-21 個案(五)AASN 收斂圖 ...77

圖 4-22 個案(五)BPN 空間模型 ...78

圖 4-23 個案(五)AASN 空間模型 ...78

圖 5-1 個案(一)O.K.測試範例散佈圖 ...80

圖 5-2 個案(一)BPN 測試範例散佈圖 ...80

圖 5-3 個案(一)AASN 測試範例散佈圖 ...81

圖 5-4 個案(二)O.K.測試範例散佈圖 ...82

圖 5-5 個案(二)BPN 測試範例散佈圖 ...82

圖 5-6 個案(二)AASN 測試範例散佈圖 ...83

圖 5-7 個案(三)O.K.測試範例散佈圖 ...84

圖 5-8 個案(三)BPN 測試範例散佈圖 ...84

(15)

圖 5-9 個案(三)AASN 測試範例散佈圖 ...85

圖 5-10 個案(四)O.K.測試範例散佈圖 ...86

圖 5-11 個案(四)BPN 測試範例散佈圖 ...86

圖 5-12 個案(四)AASN 測試範例散佈圖 ...87

圖 5-13 個案(五)O.K.測試範例散佈圖 ...88

圖 5-14 個案(五)BPN 測試範例散佈圖 ...88

圖 5-15 個案(五)AASN 測試範例散佈圖 ...89

(16)

表目錄

表 1-1 車諾比爾事故對於人體健康影響 ...7

表 1-2 俄羅斯境內土壤CS 137 含量 ...9

表 2-1 變異圖模式 ………19

表 2-2 人工神經元參數說明一覽表 ………26

表 2-3 博碩士相關文獻一覽表 ………33

表 2-4 期刊相關相關文獻一覽表 ………35

表 4-1 個案(一)類神經網路資料前處理表 ………57

表 4-2 個案(一)類神經網路設定參數 ………58

表 4-3 個案(一)BPN 與 AASN 輸出結果 ………..59

表 4-4 個案(一)BPN 與 AASN 最佳輸出結果………..59

表 4-5 個案(二)BPN 與 AASN 輸出結果 ………..63

表 4-6 個案(二)BPN 與 AASN 最佳輸出結果………..64

表 4-7 個案(三)BPN 與 AASN 輸出結果 ………..67

表 4-8 個案(三)BPN 與 AASN 最佳輸出結果………..68

表 4-9 個案(四)BPN 與 AASN 輸出結果 ………..71

表 4-10 個案(四)BPN 與 AASN 最佳輸出結果………...72

表 4-11 個案(五)BPN 與 AASN 輸出結果 ………...75

表 4-12 個案(五)BPN 與 AASN 最佳輸出結果………...76

表 5-1 個案(一)測試範例預測指標比較………..…..79

表 5-2 個案(二)測試範例預測指標比較………..…..81

表 5-3 個案(三)測試範例預測指標比較………..…..83

表 5-4 個案(四)測試範例預測指標比較………..…..85

表 5-5 個案(五)測試範例預測指標比較………..…...87

(17)

第一章 緒論

第一章 緒論

1.1 前言

近年來空間資料分析的需求與日遽增,空間模型之建構因而成為 空間統計的一個主要發展方向。空間內插(Spatial Interpolation)是一種 常用的空間資料處理方法,它是利用資料中已知點的屬性值來推估未 知點的屬性值。舉例來說,像是病理學者分析病例的空間分佈規律 性,推測其是否與污染分佈有關;地震學者根據地震的區域分佈,推 測鄰近地區地震發生的機率;遙測專家需要將遙測圖中的雜訊過濾掉 以恢復其基本空間格局;地質學家需要根據空間離散分佈的鑽孔點推 測礦藏儲量等,所應用之領域可說是相當廣泛。

一般常用於處理空間內插之方法有[17,26]:

(1) 距離反比權重法(Inverse Distance Weight, IDW)

對於每一個未知點是利用鄰近的已知點數值進行加權計算,而所 給的權重值則是依照距離遠近來計算,其概念和物理學的重力模式相 似,如(1-1)式

⎥⎥

⎢⎢

= ∑

=

= N

i i

N

i i i

d w

z d w y

x f

1 1

) (

) ) (

,

( …...………...(1-1)

式中

z

i是第 i 個已知點的數值;

d

i是i 點到未知點的距離;

w ( ) d

i 是權重方程,其大小由的次方反比來決定計算之,若採用距離的高次 方之反比為權重,則未知點受鄰近資料影響就會增加。Arc/Info 系統

提供兩種選擇模式,一種是決定樣本點的數目,以最鄰近的 n 個已知

點作為資料來源;另一種是決定取樣的半徑,落在未知點周圍一定半

(18)

第一章 緒論

徑範圍內的點皆納為估算的依據。

(2) 雲行曲線法(Spline)

利用數學方程式產生一條通過一組已知點的平滑曲線,並依據這 一條曲線來推估範圍內每一個定點上的屬性數值,在運算過程中採取 最小曲率的概念來進行。Arc/Info 系統提供兩種模式來控制內插平面 的 曲 率 , 一 種 是 可 以 產 生 一 平 滑 的 表 面 和 一 次 微 分 的 規 則 法 (regularized);另一種是依照模擬現象的特徵來調整內插平面張度的張 度法(tension)。

(3) 克利金法(Kriging)

克利金是地理統計(Geostatistics)上的一種方法,在形式上與 IDW 相當類似,唯獨在權重的運算過程相當複雜,推估未知點的過程第一 是空間結構的分析,由已知點的數值來分析資料數值間大小差異和其 空間分佈的關係,並產生一個變異圖(variogram)作為內插法適用性的 判斷;第二是以平均法或移動視窗法來計算每個網格的數值,樣本點 的權重在第一個過程中所產生的空間連續方程來決定。

克利金法在實際運算上分為一般克利金法(Ordinary Kriging, O.K.)與通用克利金法(Universal Kriging, U.K.)。前者假設資料在空間 變數不受任何結構因素影響;後者則是假設資料在空間變數上會受結 構因素所影響。

(4) 趨勢面法(Trend Surface)

此法屬於fitted function 之內插法,它是將輸入資料點經由迴歸 來產生一個誤差平方和最小的表面多項式。此多項式的次數越高所產 生的結果越複雜,但結果的準確率不一定越高,需視資料的特性來決 定。趨勢面法主要有兩種模式,一種是次方序列多項式(power series polynomial model),它是一種多重廻歸模式,利用獨立變數來表示,

(19)

第一章 緒論

也可以是線性的、二次方或更高次方,不過對於屬性複雜的空間資 料 , 該 模 式 很 難 提 供 適 當 的 計 量 。 另 一 種 是 三 角 法 多 項 式 (trigonometric polynominal model),又稱傅立葉模式(Fourier model),

則是適用於有循環變化的空間資料。

然而這些方法在空間資料內插上的結果優劣,現有的文獻研究成 果並沒有具體的結論。

類神經網路(Artificial Neural Network, ANN)多用於預測、分類與

決策的問題。由於ANN 本身具備有建構函數近似函數之功能,且可

以建立未知資料方式模擬空間分析中網格型態,故本研究選擇 ANN

為製作空間模型主要方法之一。

目前有將 ANN 應用在空間資訊方面之文獻並不多,包括賴進貴 等(1998)[17]提出利用地形資料為例,分別以兩種不同的地形資料,

利用誤差後傳的類神經網路模式進行內插。研究結果顯示這種模式是 可以達成內插計算的效果,也證實其在內插計算上的可行性。

林祥偉(2003)[30]提出以地理資訊系統,整合類神經網路、模糊

邏輯、及遺傳演算等三種人工智慧方法,建立新的GIS 空間分析模式

應用在地理學研究上,並補強當前 GIS 在資料擷取與知識探索之不

足。

盧瑞山等(1999)[19]以 Turning Band Method(TBM)產生出人工虛 擬之土壤受重金屬污染之全域資料,用類神經網路結合地理統計 (Geostatitics)之概念,提出一種 Neural-estimation 的空間推估技術應用 於土壤中重金屬含量之推估,由已知採樣點之測值去推估未知點之含 量值。並將比較Neural-estimation 與一般克利金法之優劣。

何勇等(2005)[6]在麥田中以 50 公尺相同距離進行鹼解氮(N)含量 採樣,並將倒傳遞網路(BPN)與克利金(Kriging)兩種方法所預測之田

(20)

第一章 緒論

間鹼解氮(N)含量分別匯入 Arc/Info 系統中以網格(grid)模式做最佳化 空間模型輸出之比較,並對兩種方法所得結果進行誤差分析。

許瑞文(2003)[32]選定影響土石流發生之參數為集水區面積、有 效集水區面積、集水區內平均坡度、形狀係數、溪床平均坡度與集水 區內崩塌地面積等六項,使用地理資訊系統建置地文因子資料庫。採

用 BPN 分析並決定各網路結構之最佳性能比參數,確保網路結構判

定結果的正確率與穩定性。

周乃昉等(2000)[15]使用 BPN 來建立颱風降雨推估模式,透過倒 傳遞網路的非線性關係的處理能力,將複雜的颱風降雨機制記憶在類 神經網路架構內,以達到推估颱風降雨量之目的。

陳韋龍(2004)[37]建立數值化的房價基本資料庫,一方面利用 GIS 在資料查詢展示功能上的優勢,提供規劃者作為既有資料的查詢:一

方面依據相關影響因子,引進類神經網路的觀念,於 Arc/Info 系統中

以視覺化方式呈現,作為推估都市房價的基礎,並探討房價之區位特 性。

1.2 研究方法與目的

為了比較兩種方法在於空間模型預測成果之優劣,本研究將選 取五組個案,分別先以一般克利金法(O.K.)將原始資料分為訓練範例 (training data)與測試範例(test data),經最佳參數設定後建構空間模

型。再以相同之測試與訓練範例分別套用至 ANN 中之倒傳遞網路

(BPN)與分析調整綜合網路(AASN),由網路參數最佳化設定經過未 知檔(PCN.unk)處裡後所得之輸出檔匯入 Arc/Info 系統中個別以 BPN

與 AASN 製作空間模型,並依照選定之預測指標將 O.K、BPN 與

AASN 三種方法進行誤差分析,最後將所得之預測指標[1,38]做比較

(21)

第一章 緒論

與總結。本研究所選用之預測指標有:

(1) 誤差均方根(Root of Mean-Square, RMS)

如式(1-2)所示,就類神經網路而言,所指的是網路經『尺度化』

後全部輸出變數之平均誤差均方根。

( )

MN Y T RMS

M

p N

j jp jp

∑∑ −

=

2

..………(1-2)

式中

T =第 p 個範例的第 j 個輸出單元之目標輸出值;

jp

Y =第 p 個範例的第 j 個輸出單元之推論輸出值;

jp M =範例數目;

N =輸出層處理單元的數目。

(2) 判定係數(Coefficient of Determination,

R

2)

判定係數定義為解釋方差和佔總方差和之比例,如式(1-3)所示,

其值域在0 到 1 之間,通常最懷的情況都在 0 左右。判定係數越

大,代表模型對變異的解釋能力越大。由於判定係數總是隨著模 型的增加而增加,故複雜度高的模型會有高估模型對變異的解釋 能力之傾向,因此有調整判定係數

R

adj2 的提出如式(1-4)所示。而

本研究僅以

R

2為判斷預測優劣之基準。

yy E

yy E yy

yy R

S SS S

SS S

S

R SS

− = −

=

= 1

2 ………...(1-3)

式中

SS =迴歸方差和(已解釋方差和);

R

SS

E=迴歸方差和(未解釋方差和);

S =總方差和。

yy

(22)

第一章 緒論

) 1 1 ( ) 1

1 /(

)

1 /( 2

2

R

p n

n n

S

p n R SS

yy R

adj ⎟⎟ −

⎜⎜ ⎞

− −

− =

− −

= ………(1-4)

式中

n

=數據數目;

p

=模型細述之數目。

1.3 個案簡述

本研究所選用個案資料其結構皆為向量式資料(vector data),可 用於一般空間平面分析或 3D 圖之製作。為了使訓練範例(training data)與測試範例(test data)對於每一組個案研究推估結果之影響達到 一致性,故本研究將每一組個案數據所選取之訓練範例資料筆數與 測試範例資料筆數分配為全部資料比數之 70%與 30%。本節將分別 敘述所選取之五組個案資料來源以及相關資訊。

1.3.1 個案(一):污染地區城市人口罹患甲狀腺癌機率

1986 年 4 月 26 日凌晨,前蘇聯車諾比爾(Chernobyl)核能電廠(現 為烏克蘭共和國境內)的 4 號反應器,因為運轉人員違法進行極危 險的實驗,導致水蒸氣及氫氣爆炸。爆炸後引起反應器內石墨的燃 燒,造成大量的放射性物質外釋,使得31 名搶救的消防人員死亡與 廣大地區遭受污染。這項實驗違反所有電廠安全運轉規定,它必須 強迫停止電廠所有安全防護系統;再加上反應器先天設計不良,在 一連串蓄意違法情況下,終於釀成核能史上最大災變。

受輻射響地區小孩罹患甲狀腺癌的案例明顯增加,是車諾比爾 災變中,唯一可以清楚確定的是輻射健康效應。如表 1-1 所示,至 1995 年底,共發現約 1,800 例的 15 歲以下兒童罹患甲狀腺癌病例。

事故發生時已出生及事故發生後六個月內出生的小孩,其罹患甲狀 腺癌案例上升極明顯,但事故後六個月才出生的小孩,其罹患甲狀

(23)

第一章 緒論

癒,故至今真正只有 3 位兒童死於甲狀腺癌。本個案研究使用資料 選錄自User Guide (2003) “Using ArcGIS 3D Analyst”[33] Exercise 3 , 而 該 範 例 資 料 來 源 為 國 際 薩 哈 羅 夫 環 保 大 學 (International Sakharov Environmental University)所提供。

原始資料經整理後選取「X」(橫座標)、「Y」(縱座標)與「機 率(1/1000)」三組欄位(共有 117 筆資料),分別取 81 筆訓練範例 (training data)與 36 筆測試範例(test data),做為 O.K.與 ANN 兩種方 法之研究與分析。如圖 1-1 所示,圖中每一點所代表的意義為污染 地區城市名稱以及人口罹患甲狀腺癌的千分之一機率值(原始資料 未包含車諾比爾所在地點)。

表 1-1 車諾比爾事故對於人體健康影響

工作人員 受影響民眾 全球 參考資料

輻射致死 28 0 0

非輻射致死 3 0 0

急性輻射疾病 208 0 0

《OECD 報告》

《UNSCEAR2000 報告》

《EC/IAEA/WHO 聯合報告》

癌症增加率

(與自然病例相較) 2.80% 0.80% < 0.004%

《OECD 報告》

《EC/IAEA/WHO 聯合報告》

《V. K. Ivanov》

遺傳效應 +0.035% +0.015% 0

甲狀腺癌症

(非致命癌) 增加1,800 例 N.A.

《EC/IAEA/WHO 聯合報告》

《UNSCEAR2000 報告》

《NRER-1999》

死亡率 N.A. 無顯著變化 無顯著變化 嬰兒出生率 N.A. 無顯著變化 無顯著變化

《俄國報告》

《Mortality Table 1, 》

(資料來源:http://www.newnuclearhome.com/pages/safety/tschernobyl.htm)

(24)

第一章 緒論

圖 1-1 污染地區城市名稱與罹患機率分佈圖(․:城市)

1.3.2 個案(二):鄰近地區土壤中銫(CS137)含量

接續個案(一),罹患甲狀腺癌來源之最大核種為銫(CS137)。在 俄羅斯境內,當中超過自然背景 3 倍以上的污染區(CS137活度超過 555kBq/ m2(15Ci/ km2)只有 2440 平方公里(如表 1-2 所示),而並非 一些報導所誇張的數萬平方公里。

本個案研究使用之資料選錄來源與個案(一)相同,原始資料 經整理後選取「X」(橫座標)、「Y」(縱座標)與「CS137」三組欄 位(共有400 筆資料),分別取 280 筆訓練範例與 120 筆測試範例,

做為O.K.與 ANN 兩種方法之研究與分析。如圖 1-2 所示,圖中每一 點所代表的意義為將受輻射污染區土壤中隨機取樣所量測之CS137

(25)

第一章 緒論

表 1-2 俄羅斯境內土壤CS137含量

CS137濃度(Ci/ km2 面積(平方公里)

1-5 49760 5-15 5450 15-40 2130

> 40 310 合計 57650 超過15Ci/ km2 2440

(資料來源:http://www.newnuclearhome.com/pages/safety/tschernobyl.htm)

圖 1-2 隨機取樣CS137含量分佈圖(

:取樣點)

(26)

第一章 緒論

1.3.3 個案(三):台灣各地區雨量站平均降雨量

台灣為一四面環海之島,屬亞熱帶季風區之氣候,氣候溫暖潮 溼,根據歷年降雨資料顯示,各雨量站年平均雨量總合達2,510mm,

為台灣水資源之主要來源。台灣雨量雖然豐沛,約為世界平均值之 2.6 倍,但因地狹人稠,每人每年所分配雨量僅及世界平均值之七分 之一,且雨量在時間及空間上之分佈極不均勻,五月至十月之雨量即 佔全年之78%,枯水期長達六個月,再加上河川坡陡流急、腹地狹隘,

逕流量被攔蓄利用的僅有 177.54 億立方公尺,約佔年總逕流量之 18%,其餘均奔流入海。台灣目前現有雨量站約 234 座(紀錄截至 2004 年為止),密度相當高,但是真正有運作之雨量站約 151 站。本個案 研究使用資料來源為經濟部水利署水文水資源資料管理供應系統與 吳瑞賢等(2003)[5]所附資料加以整理之。

原始資料經整理後選取「TM2-X」(二度分帶橫座標)、「TM2-Y」

(二度分帶縱座標)與「平均值(mm)」三組欄位(共有 151 筆資料),

分別取105 筆訓練範例與 46 筆測試範例,做為 O.K.與 ANN 兩種方 法之研究與分析,其中「平均值(mm)」該組欄位是以該雨量站從設 立至2004 年間年降雨量之平均值,如圖 1-3 所示,圖中每一點所代 表的意義為雨量站分佈在各縣市所在位置。

(27)

第一章 緒論

圖 1-3 台灣地區各縣市雨量站分佈圖(▲:雨量站)

1.3.4 個案(四):美國愛達荷州(Idaho)雨量站 30 年平均降雨量 愛達荷州(Idaho)位於美國大西北的心臟地帶(如圖 1-4 框選處所 示),北鄰加拿大,南邊與內華達州和猶他州為界,著名的黃石國家 公園在愛達荷州東部,而西邊與俄勒岡州和華盛頓州為鄰。氣候類型 屬大陸型氣候,且位居內陸,因此,全州都非常乾燥。由於氣候乾燥 且降雨量稀少的緣故,該州農業非常多樣化,東南部是全世界馬鈴薯 的故鄉,而北邊碗豆、扁豆的產量在全美更佔有舉足輕重之地位。本 個案研究資料選錄自Chang, Kang-tsung (2003)[34]Chap.13 Data。

原始資料經整理選取「X」(橫座標)、「Y」(縱座標)與「年平 均值(inch)」三組欄位(共有 105 筆資料),分別取 73 筆訓練範例與 32 筆測試範例,做為 O.K.與 ANN 兩種方法之研究與分析。如圖 1-5 所示,圖中每一點所代表的意義為雨量站名稱以及其所在位置。

µ

(28)

第一章 緒論

圖 1-4 愛達荷州(Idaho)於美國地理位置示意圖

圖1-5 愛達荷州(Idaho)雨量站位置分佈圖(▲:雨量站)

(29)

第一章 緒論

1.3.5 個案(五):田間鹼解氮含量

鹼解氮是一種有機肥料,耕種豆類時常於生長期施用,可提高 產量,且在土質貧瘠的田地施用亦可獲得不錯的效果。本研究個案 所使用資料選錄自何勇、張淑娟(2005)[6]。該篇文獻作者在麥田裡 以 GPS 定位,每隔 50 公尺取樣一點量測鹼解氮含量(mg/kg),如圖 1-6 所示,以左下角為起始點依序縱向間隔取樣,形成一方格網。

原始資料經整理後僅選取「X」(橫座標)、「Y」(縱座標)與「鹼 解氮(mg/kg)」三組欄位(共有 63 筆資料),分別取 45 筆訓練範例 (training data)與 18 筆測試範例(test data),做為 O.K.與 ANN 兩種方 法之研究與分析。如圖 1-6 所示,圖中每一點所代表的意義為固定 距離取樣所得之鹼解氮含量(mg/kg)。

圖1-6 鹼解氮含量(mg/kg)分佈圖(․:取樣點)

(30)

第一章 緒論

1.4 研究內容與流程

本研究分二部分同時進行,全文共六個章節。第一章主要提及 研究方法以及簡述每組個案背景與資料來源;第二章將個案研究所 用兩種方法理論做一深入淺出之描述以及說明所蒐集之歷年相關研 究文獻;第三章主要是將五組個案利分別以 O.K.製作空間模型;而 第四章則是將五組個案分別以BPN 與 AASN 經參數最佳化將未知檔 輸出真實結果後並個別製作空間模型;三種方法用於五組個案所得 之預測指標優劣與空間模型將於第五章做比較並分析之;最後,對 於適合以 ANN 製作空間內插之題型做分析並為日後研究的方針給 予初步之方向。完整流程如圖 1-7,圖中有關一般克利金法與類神經 網路空間模型建置之流程將於3-3 節與 4-3 節中詳述之。

圖1-7 研究流程圖

個案資料收集 資料歸納整理

克利金空間模型建置

預測指標誤差分析

結論與建議 文獻回顧

類神經空間模型建置 研究目的

研究方法

(31)

第二章 文獻回顧

第二章 文獻回顧

2.1 前言

本研究所分析之個案主要是利用一般克利金(O.K.)與類神經網路 (ANN)中之 BPN 與 AAS 三種方法為主。故本章節對於三種方法之理 論將做一深入淺出的描述與探討,並於2-4 節中將選取與本研究相關 之文獻做分類整理。

2.2 克利金法

克利金法[8,18]最早是由地質學家馬特隆(G.. Matheron)研究南非 礦冶工程師克利金(Krige, D.G.)等人之實際探礦資料,於 1962 年提出

『地質統計學(或稱地理統計)』學說,並以該學說之區域化變數理 論(Regionalized Variable Theory)於 1971 年提出推估未知點值之方法。

2.2.1 空間統計

空間統計顧名思義為分析空間資料的統計方法[8]。因空間統計與 各類實際問題之間的關係相當緊密,故成為一個快速發展的領域。其 主要構思來自於空間中鄰近的資料通常比距離較遠的資料具有較高 的相似性,廣義而言,空間統計乃透過資料間位置建立所有資料間的 統計關係。其應用的範圍包羅萬象,包括地質、大氣、水文、生態、

天文、遙測、地震、環境監測、流行病、及影像處理等。此外,任何 其他領域如所收集的資料與位置有關,亦可為空間統計研究之範疇。

除了極少數的例子外,真實世界的空間資料大多不能為物理化學機制 以簡單的公式描述。為解決資料中所隱含的空間不確定因素,空間統 計模型乃嘗試從凌亂的空間資料中,以統計方法發掘空間變動(Spatial variation)之規律。

(32)

第二章 文獻回顧

空間資料之分析與傳統的統計分析主要有兩大差異[8]:

(1) 空間資料間並非獨立,而是在多維空間中具有某種空間相關性,

且在不同的空間解析度下呈現不同之相關程度。

(2) 因地球只有一個,大多數空間問題僅有一組(不規則在空間分佈 的)觀測值,而無重複觀測的資料。

因此,空間現象的了解與描述是極為複雜的,而傳統的統計分析 技巧,尤其是建立在獨立樣本的統計方法,並不適合用來分析空間資 料。其與時間序列最大的差異在於空間中並無過去、未來之次序,因 而不易透過某種因果關係的描述來建構空間模型。目前空間統計模型 大致可分為三類:地理統計(Geostatistics)、格點空間模型(Spatial lattice model)、及空間點分佈型態(Spatial point pattern)。本研究於 2.2.2 節中 僅以地理統計之區域化變數理論(Regionalized Variable Theory)來敘述 O.K.之推導過程。

2.2.2 區域化變數理論

如圖2-1 所示,一空間隨機變數

Z

(

x

),乃表示空間自變量

x

所對 應之空間變量,則此

Z

(

x

)即為一區域化變數。自然界空間變量,如:

降雨分佈、礦產分佈、地下水位、地形高程分佈均可視為區域化變數。

因此區域化變數乃存在空間上相關性之特性,即隨距離遠近而變化,

變數間存在不同程度之相關性。

區域化變數理論以線性定常性(linear stationarity)假設為基礎,變 異圖(variogram)為分析基本工具,以二階定常性假設(hypothesis of second-order stationary)及本質假設(hypothesis of intrinsic)為基本假 設。利用克利金法對空間已知變量對未知點進行推估,其推估方法為 最佳線性不偏性推估(Best Linear Unbiased Estimate; BLUE)。符合此

(33)

第二章 文獻回顧

二階定常性假設及本質假設之基本假設所發展之空間推估方法即一 般克利金法(Ordinary Kriging, O.K.) [8,12,18]。其推導過程如(1)~(4) 中詳加敘述。

圖 2-1 空間推估示意圖

(資料來源:User Guide(2003), Using ArcGIS 3D Analyst[33])

(1) 內在假設(Intrinsic Hypothesis)

假設空間中任一不相同位置的隨機變數之差仍為一隨機變數 (Random Variable),且其期望值及變異數只與隨機變數間之距離 有關,與所在的位置無關。如式(2-1)所示。

) ( )]

( ) (

[

Z x h Z x m h

E

+ − = ,for all

x

………....(2-1)

空間中任意兩個位置之隨機變數

Z

(

x

)與

Z

(

x

+

h

)的變異函數,其 與所在的位置無關,等於兩倍的半變異元函數γ(

h

),如式(2-2)所 示。

(34)

第二章 文獻回顧

) ( 2 )]

( ) (

[

Z x h Z x h

Var

+ − = γ ,for all

x

………..…….(2-2) 其中

Z

(

x

)、

Z

(

x

+

h

):表空間中任意二觀測值。

h

:表觀測值間之相對距離。

) (

h

γ :稱為半變異元(Semi-Variogram)或簡稱變異元,其僅為 )

(

h

γ 距離

h

之函數。

(2) 半變異元分析

半變異元亦稱為半變異數(Semivariance),其區域化變數可依特定 方向但不同位置間的隨機含數之差的變異程度來表示,在半變異 元分析中,可用式(2-3)求解試驗半變異元γ(h)。

) 2 (

1 [ ( ) ( )]

) ( 2 ) 1

(

Z x Z x h

h

h N

i

h N

i i − +

= ∑

=

γ ………(2-3)

上式中

Z

(

x

i)為位於

x

點觀測值,

Z

(

x

i +

h

)為位於

x

+

h

之觀測值,

h

為平均距離,

N

(h)為配對數,並繼續計算臨界變異值(sill),影 響範圍(influence range)與碎塊效應(nugget effect)等三個重要克利 金參數。其中當兩點平均距離達到某一種程度時,半變異數就會 緩慢增加,或不再增加,此時所得到的半變異元稱為臨界變異值 而臨界變異值所對應的距離則稱為影響範圍。碎塊效應則是表示 當距離

h

趨近於零時,γ(0)並不一定會等於零,而是一定值,因 此顯示在微小距離內有極大變異之現象。

(3) 半變異圖模式

Z

(x) 之 觀 測 值 所 計 算 得 之 半 變 異 元 稱 為 試 驗 變 異 元

(35)

第二章 文獻回顧

須將之套配至理論變異元,求得理論半變異元之後,尚需要套配 幾種需要的變差函數理論模式,如表2-1所述。

表 2-1變異圖模式

模式名稱 變差函數理論模式

球形模式 (Spherical)

a h h

)= ,0 = γ(

a a h

h a

C h C

h

⎥ ≤ ≤

⎢ ⎤

⎡ ⎟

⎜ ⎞

− ⎛

⎟⎠

⎜ ⎞

⎝ + ⎛

= ,0

2 1 2

) 3 (

3

γ 0

a h C C

h

)= + , >

( 0

γ

圓形模式 (Circular)

a h h

)= ,0 = γ(

a a h

h a

C h C

h

⎥ ≤ ≤

⎢ ⎤

⎡ ⎟+ −

⎜ ⎞

− ⎛ +

= 2 cos 1 ,0

1 )

( 2

2 1

0 π

γ

a h C C

h

)= + , >

( 0 γ

指數模式 (Exponential)

a h h

)= ,0 = γ(

0 , exp 1 )

( 0 ⎥ >

⎢ ⎤

⎡ − +

=

C C

⎛ −

h

h

a

h

γ

高斯模式 (Gaussian)

a h h

)= ,0 = γ(

0 , exp 1 )

(

2

0 ⎥ >

⎢ ⎤

⎡ − +

=

⎛ −

h C

C

h

a

h

γ

冪函數模式 (Power)

γ(

h

)=

h

θ 0<θ <2

表 2-1 五種模式,其中

a

為影響範圍;

C

0為碎塊效應值;

C

為基 值。γ(h)決定後。即可提供克利金變差函數進行最佳推估。由於 球形模式(Spherical)計算便利且使用廣泛,因此本研究之個案空間

(36)

第二章 文獻回顧

模型建構皆採用此模式進行推估。

(4) 克利金推估

Z

(x)唯一區域化變數,在

x 、

1

x 、

2 …、

x 等位置之觀測值為

n )

(

x

1

Z

Z

(

x

2)、…、

Z

(

x

n),且

Z

(

x

0)為未知,而欲由各觀測值來 推 測

Z

(

x

0) 。 克 利 金 推 估 具 有 最 佳 線 性 不 偏 估(Best Linear Unbiased Estimate, BLUE)之特性。而BLUE具備有以下三種條件:

a. 最佳化:推估值

Z

(

x

0)

與真值(觀測值)

Z

(

x

i)差之變異數為最 小,如式(2-4)所示。權係數(weight)λi可有許多組,故克利金推 估法要求

λ

i必須使得推測誤差之變異數為最小。

Min

Var

[

Z

(

x

0)−

Z

(

x

0)].………..(2-4)

b. 線性:推估值

Z

(

x

0)

為觀測值

Z

(

x

i)之線性組合,如式(2-5)與式 (2-6)所示。

) ( )

(

0 1 i

n

i i

Z x

x

Z

=∑

=

λ ………...(2-5)

∑ == n

i i

1

0 .

λ 1 ………...(2-6)

c. 不偏估:推估值

Z

(

x

0)

與觀測值

Z

(

x

i)差之期望值為零,如式(2-7) 所示。

(37)

第二章 文獻回顧

0 ) ( )

( 0 =

⎥⎦⎤

⎢⎣⎡

Z

x

Z x

i

E

……….………(2-7)

為求解使之γi同時滿足(2-4)式及(2-6)式,則引用拉格蘭吉乘數 (Largrangian Multiplier)μ,如式(2-8)所示。

Min ⎩⎨

(

∑ −=n

)

⎭⎬

i i

x Z x Z E

1 2

0

0) ( )] 2 1

(

[ μ λ …...…………..……..(2-8)

令 =0

i

L

λ (i =1,2,…n),且 =0

i

L

λ 則可得之如下之克利金系統方 程式(Kriging System Equation),如式(2-9)所示。

) (

)

( 0

1 i j i

n

i i

x

x

+ =

x

x

= λγ μ γ (i =1,2,…,n) ………...(2-9)

其中 1.0

1

=

= m

i

λ

i ,以矩陣型式表如式(2-10)所示。

⎥⎥

⎥⎥

⎥⎥

⎢⎢

⎢⎢

⎢⎢

=

⎥⎥

⎥⎥

⎥⎥

⎢⎢

⎢⎢

⎢⎢

⎥⎥

⎥⎥

⎥⎥

⎢⎢

⎢⎢

⎢⎢

1 0

1 1

1

1 1 1

0 011

01

0 02 01

2 1

2 22

21

1 12

11

n n

nn n

n

n n

γ γ γ

α λ λ λ

γ γ

γ

γ γ

γ

γ γ

γ

M M

L L

M M O M M

L L

...(2-10)

其中γij =γ(

x

i

x

j)。由式(2-9)解得γi後即可代入式(2-5)以求得 )

(

x

0

Z

之推估值

Z

(

x

0)

。而克利金推估誤差之變異數稱為克利金變 異數(Krining Variance)σk2,可表為如式(2-11)所示。

(38)

第二章 文獻回顧

) ( 0

1 2

i n

i i

k = +∑

x

x

= λγ μ

σ ………(2-11)

2.3 類神經網路

類神經網路是一種計算系統,包括軟體與硬體,它使用大量簡單 的相連人工神經元來模仿生物神經網路的能力。人工神經元是生物神 經元的簡單模擬,它從外界環境或者其它人工神經元取得資訊,並加 以非常簡單的運算,並輸出其結果到外界環境或者其它人工神經元。

它可以利用一組範例(及系統輸入與輸出所組成的資料)建立系統模 型(輸入與輸出之間的關係),有了這樣的系統模型便可用於推估、

預測、決策與診斷[2]。

圖2-2 真實系統 A 與系統模型(類神經網路)B 之比較

(資料來源:葉怡成,2002[1])

就像是一部機器的運作或是一個事件的發生皆有相對應的因果 關係(例如:打開電器用品的開關,電器用品開始運作;腳踩油門使

輸出 輸入 真實系統

A

B

輸出 輸入

系統模型

(類神經網路)

(39)

第二章 文獻回顧

與腳踩油門的動作稱為『系統的輸入』,而電器用品的運作與車子的 速度稱為『系統的輸出』,整個輸入與輸出的關係如圖 2-2 中之 A 圖 所示;在控制領域中,若要精確的分析輸入與輸出之間的關係,則必 須將系統藉由數學的方式做成模型。但是,實際的系統往往是複雜且 非線性的,因此如何以數學的方式簡化系統及線性化,就成為控制學 門中一個重要的課題。

類神經網路的優點在於並不需要瞭解系統的數學模型為何,而 直接以神經網路取代系統的模型,一樣可以得到輸入與輸出之間的關 係。其關係圖如圖2-2 中之 B 圖所示。

2.3.1 類神經網路的原理

人類的大腦大約由一千億個神經細胞(nerve cells)組成,而每個 神經細胞又有104個神經突觸(synapses)與其他細胞互相連結成一個非 常複雜的神經網路。當人類的感官受到外界刺激經由神經細胞傳遞訊 號到大腦,大腦便會下達命令傳遞至相關的受動器(effector)做出反應

(例如:手的皮膚接觸到燙的物體立即放開並感到疼痛等),這樣的 過程往往需要經由反覆的訓練,才能做出適當的判斷,並且記憶於腦 細胞中。如果大腦受到較嚴重的損害(例如腦震盪患者),便需要藉 由復健的方式,重新學習。類神經網路的運作便源於此,藉由不同的 演算法訓練類神經網路使得神經網路的輸出能達到我們所要求的結 果。如圖 2-3 為一生物神經元的模型,圖中神經核(soma)為神經細胞 呈核狀的處理機構,軸索(axon)為神經細胞成軸索狀的輸送機構,樹 突(dendrites)為神經細胞成樹枝狀的輸出入機構;突觸(synapses)則為 神經細胞神經樹上乘點狀的連結機構。

而類神經網路是由許多的人工神經元(artificial neuron)(又稱類神 經元、人工神經細胞、處理單元(processing element)等)所組成。一

(40)

第二章 文獻回顧

個人工神經元的模型顯示如圖2-4 所示,每一個處理單元的輸出以扇 形送出,成為其它許多處理單元的輸入,而處理單元輸出值與輸入值 的關係式如(2-12)式所示,一般用輸入值的加權乘積和之函數來表示 之。圖2-4 與(2-12)式中的參數說明如表 2-2。

圖2-3 生物神經元的模型

(資料來源:鄭錦桐,李錫堤(1996)[23])

神經核(soma)

軸索(axon) 突觸(synapses)

樹突(dendrites)

(41)

第二章 文獻回顧

圖 2-4 人工神經元模型

) (n i j

i ij

j

f W X

Y

= ∑ −θ ……….……….(2-12)

其中 f 為轉換函數,可表為(2-13)式與圖 2-5

e

x

x

f

= + 1 ) 1

( ……….(2-13)

-10 -5 5 10

0.2 0.4 0.6 0.8 1

圖 2-5 隱藏層輸出層非線性轉換函數

Wij

X1

X2

X3

Xi

‧‧‧

θj netj f Yj

(42)

第二章 文獻回顧

(2-12)亦可表示為 )

( j

j

f net

Y

= ………...………….(2-14)

其中

net 為加法單元(summation)

j ,可表為

j i n

i ij

j

W X

net

= ∑ −θ ………..(2-15)

表2-2 人工神經元參數說明一覽表

參數 說明

X

i 稱為神經元的輸入(Input),用來模仿生物神經元模型的輸入 訊號(input signal)。

W

ij

稱為鍵結加權值(weights),類神經網路的訓練就是在調整鍵 結加權值,使其變得更大或是更小,通常由隨機的方式產生 介於+1 到- 1 之間的初始值。其值越大,則代表連結的神經 元更容易被激發,對類神經網路的影響也更大;反之,則代 表對類神經網路並無太大的影響,而太小的鍵結值通常可以 移除以節省電腦計算的時間與空間。用來模仿生物神經元模 型的神經鏈結強度。

θi 稱為閥值(bias),有偏移的效果。模仿生物神經元模型的閥值 (threshold value),又稱偏權值。

net

j 稱為加法單元(summation),此部分是將每一個輸入與鍵結 值相乘後做一加總的動作。

f

又稱之為活化函數(activation function)通常是非線性函數,

有數種不同的型式,其目的是將 netj的值做映射得到所需要 的輸出。用來模仿生物神經元模型的轉換函數(transfer function)。

Y

j 稱之為輸出(output),亦即我們所需要的結果。用來模仿生物 神經元模型的輸入訊號(Output signal)。

(43)

第二章 文獻回顧

將上述的神經元組合起來即成為一個類神經網路(如圖 2-6 為一 典型的BPN 模型)。目前為止,許多的學者針對欲解決問題的不同,

提出許多的 ANN 模型,每一種 ANN 演算法並不相同。常見的網路 有:倒傳遞網路(Back-propagation Network)、霍普菲爾網路(Hopfield Network)、半徑式函數網路(Radial Basis Function Network),這些網路 並非適用所有的問題,須針對欲解決問題選擇適當的網路方法。本研 究選擇ANN 中之 BPN 與 AASN 作為個案分析之方法。

圖2-6 倒傳遞網路(BPN)模型

2.3.2 類神經網路的訓練(training)與學習(learning)

要使得 ANN 能正確的運作,則必須透過訓練(training)的方式,

讓網路反覆的學習,直到對於每個輸入都能正確對應到所需要的輸 出,因此在網路學習前,我們必須建立出一個訓練範例(training pattern) 使網路在學習的過程中有一個參考,訓練樣本的建立來自於實際系統 輸入與輸出或是以往的經驗,例如:洗衣機洗淨衣服的時間,與衣服

‧‧ ‧‧‧ ‧‧‧

輸入向量 輸出向量

輸入層 隱藏層 輸出層

(44)

第二章 文獻回顧

的質料、數量、骯髒的程度有關,因此我們必須先針對不同質料、數 量、骯髒的程度的衣服統計出洗衣所需的時間,建立訓練樣本。不同 衣服的質料、數量、骯髒程度就是類神經網路的輸入,而洗衣所需的 時間則為ANN 的目標值(target),也就是 ANN 的參考輸出。ANN 的 工作性能與訓練樣本有直接的關係,若訓練樣本不正確、太少或是太 相似,ANN 的工作區間與能力將大打折扣。因此,訓練樣本越多、

越正確、差異性越大,ANN 的能力就越強。

ANN 訓練的目的,就是讓類神經網路的輸出越接近目標值。亦 即,相同的輸入進入到系統與類神經網路,得到的輸出值亦要相同。

類神經網路未訓練前,其輸出是凌亂的,隨著訓練次數的增加,類神 經網路的鍵結值會逐漸的被調整,使得目標值與神經網路的輸出兩者 誤差越來越小。當兩者的誤差幾乎不再變化時,我們稱此類神經網路 已收斂(convergence),此時類神經網路便訓練完成。通常我們會定義 一個價值函數(cost function)作為神經網路收斂的指標,價值函數將會 隨著網路的訓練次數越變越小最後幾乎不再變化。

學習率(learning rate),在 ANN 的訓練過程中是一個非常重要的 參數。學習率影響著ANN 收斂的速度,若學習率選擇較大則收斂的 速度將變得較快,反之,較小的學習率會使得收斂速度變慢。選擇太 大或太小的學習率對ANN 的訓練都有不良的影響。

當ANN 經由訓練樣本訓練完成後,雖然神經網路的輸出已經與 我們所要求的數值接近,但對於不是由訓練樣本所產生的輸入,我們 並不知道會得到何種輸出。因此,我們必須再使用另一組類神經網路 從 未 見 過 的 樣 本 進 入 到 類 神 經 網 路 中 , 加 以 測 試 其 推 廣 性 (generalization),看看是否與所要求的值接近,而此樣本則稱之為測 試範例。推廣性亦是 ANN 中的一項優點,當 ANN 訓練完成後,對

(45)

第二章 文獻回顧

於與訓練樣本相近的輸入,ANN 亦能給予一個合理的輸出,但是如 果測試樣本與訓練樣本的差異過大,ANN 仍是無法給予正確的數值。

2.3.3 倒傳遞網路與分析調整綜合網路架構

倒傳遞網路(BPN)[15]的名詞來源其網路的修正網路連結鍵值的 方法,由輸出值與期望值之誤差量經反向傳遞學習後,藉以修正調整 整個網路連結鍵值及處理單元的偏權值,並利用微積分的原理-最陡 坡降法(the gradient steepest descent method)的觀念來將誤差量的誤差 函數予以最小化,並處理誤差反向的傳遞學習之值,為監督式學習網 路。學習過程中必須給定期望輸出值,以修正網路內的權值及閥值。

分 析 調 整 綜 合 網 路(Analysis-Adjustment-Synthesis Networks, AASN)[29,35]是由分析次網路、調整次網路與綜合次網路所組成。分 析次網路是一個將輸入單元連結到展開輸入單元的單層網路(圖 2-8 為分析次網路轉換函數);綜合次網路是一個將輸出單元連結到展開 輸出單元的單層網路(圖2-9 為綜合次網路轉換函數)。介於分析次 網路與綜合次網路的調整次網路是一個扮演學習機制的標準倒傳遞 網路,如圖 2-7 為一典型的 AASN 模型。在網路完成訓練後,在回想 階段中(Recall),綜合次網路接收展開輸出單元的輸出值,並以加權 方式綜合這些值為高度精確的的輸出值,進而顯著改善網路效能及強 化網路架構。其中隱藏層及輸出層神經元之轉換函數為雙彎曲函數。

AASN 之訓練與回想過程敘述如(一)~(二)。

(46)

第二章 文獻回顧

圖2-7 分析調整綜合網路(AASN)模型

(一)訓練步驟(training phase)

(a)輸入單元連結到展開輸入單元的單層網路

1 1

) 2

( ( ) − +

=

=

k k i

d m i X

k ik

e X

f

A

…..……….(2-16)

其中

k =1,2,3,4,5。

X =第 i 個輸入單元值。

i

A =第 i 個輸入單元所連結第 k 個展開輸入單元的輸出值。

ik

m =第 k 個展開輸入神經元的非線性轉換函數之水平平移控制

k

參數。

d =第 k 個展開輸入神經元的非線性轉換函數之斜率控制參數。

k

‧‧‧‧‧

綜合層 輸出層

輸入向量 輸出向量

隱藏層 輸入層

‧‧‧‧‧ ‧‧‧‧‧

分析層

(47)

第二章 文獻回顧

(b)輸出單元連結到展開輸出單元的單層網路

)

1 (

) 1 (

k k j

s u Y j

k jk

e Y

g

B

+

=

= ……….………....(2-17)

其中

k =1,2,3,4,5。

Y =訓練資料的第 j 個輸出值。

j

B =第 j 個輸入單元所連結第 k 個展開輸出單元的輸出值。

jk

u =第 k 個展開輸出神經元的非線性轉換函數之水平平移控制

k

參數。

S =第 k 個展開輸出神經元的非線性轉換函數之斜率控制參數。

k

6 , 1 , , ,

6 ,5 6 ,4 6 ,3 6 ,2 6 , 1 , , ,

3 , 1 , , ,

3 ,2 3 ,1 0 3, , 1 3 , 2

, , ,

5 4 3 2 1

5 4 3 2 1

5 4 3 2 1

5 4 3 2 1

=

=

=

=

s s s s s

u u u u u

d d d d d

m m m m m

(48)

第二章 文獻回顧

-1 -0.5 0.5 1

-1 -0.5

0.5 1

圖 2-8分析次網路轉換函數

0.2 0.4 0.6 0.8 1 0.2

0.4 0.6 0.8 1

圖 2-9綜合次網路轉換函數

參考文獻

相關文件

某項貨物的單位價格是指該項貨物的貿易貨值與其貨量之比。季度單位價格指數是計算當季各

多組樣本重複測量分析方法 多組樣本重複測量分析方法 Repeated measures ANOVA Repeated measures ANOVA..

( )如圖為自民國 79 年到 88 年臺灣地區每人每年平均用紙量(kg)折線圖,請問哪一年間,每

 受試者包括了54 名便秘型大腸激躁症患者以及16 名健康者,共70 位,平均年齡28 .4歲,其中IBSC

如圖是臺北地區民國 81~90 年每人每年平均用紙量(kg)折線圖,請問 90 年比 81 年每人每年平

目前加勁擋土結構於暴雨分析時,多以抬升地下水位之方式模 擬。然降雨對於不飽和土壤強度之影響而言,此種假設與實際狀況未

本研究是以景觀指數進行對 1993 年、2008 年與擴大土地使用三個時期之評 估,其評估結果做比較討論。而目前研究提供研究方法的應用-GIS 與 FRAGSTATS 之使用方法。從 1993 年至

影響水資源之因子有河川流量、蒸發量、溫度等。其中河川流量 及雨量此二因子的影響頗深,且此兩因子所測得之數據較為完整,故