• 沒有找到結果。

森林地表覆蓋分類

在文檔中 中 華 大 學 (頁 48-56)

第四章 實際例題

第五節 森林地表覆蓋分類

本研究以常被用來做為分類演算法測試基準的森林地表覆蓋類型(樹種)分 類問題(Blackard, 1998)為實例。在此資料集中,森林被分割 30 乘 30 公尺的格子,

其實際森林覆蓋類型是由美國森林服務署(USFS) Region 2 資源資訊系統(RIS)資 料決定。獨立變數是從美國地質調查署(USGS)與美國森林服務署(USFS)原始資 料導出。獨立變數包括10 個定量連續變數,及 14 個定性二元變數(4 個自然保護 區和40 種土壤類型)。其中 40 個用來表示土壤分類類型的二元變數,因其數量 龐大,但對分類的影響很小,本研究將其捨去,只取其餘14 個變數,如表 13

所示。原始資料共有58 萬(581012)筆資料,有七種覆蓋類型(樹種)詳述於表 13。

由於各覆蓋類型的資料數目差距極大,本研究採用分層取樣法使各類的資料數目 接近,故實際上只用4000 筆,各覆蓋類型的資料如表 14。其中 3000 筆做為訓 練範例,1000 筆做為測試範例。

本例題的隱藏層的處理單元數目都採用14 個。單層與二層隱藏層的結果如 圖 31、圖 32 所示,表 15 顯示本例題在整個收斂過程的最佳結果。可知六個網 路之中,只二層隱藏層RBFN 表現很差,其餘都有良好的表現,差異不大。其中 以單層隱藏層HTFN 與二層隱藏層 BPN 較佳。

表 13 森林地表覆蓋分類的輸入變數

變數名稱 變數型態 單位 用途

高程 連續變數 公尺 自變數

方位 連續變數 度 自變數

坡度 連續變數 度 自變數

對水體水平距離 連續變數 公尺 自變數

對水體垂直距離 連續變數 公尺 自變數

對道路水平距離 連續變數 公尺 自變數

上午九點陰影 連續變數 0 to 255 自變數 中午陰影 連續變數 0 to 255 自變數 下午三點陰影 連續變數 0 to 255 自變數

對火點距離 連續變數 公尺 自變數

Rawah Wilderness 荒野區 二元變數 0/1 自變數 Neota Wilderness 荒野區 二元變數 0/1 自變數 Comanche Peak 荒野區 二元變數 0/1 自變數 Cache la Poudre 荒野區 二元變數 0/1 自變數

覆蓋類型 分類變數 七分類 因變數

表 14 森林地表覆蓋分類的覆蓋類型

編號 覆蓋類型 原始數目 採用數目

1 Spruce-Fir 211840 580 2 Lodgepole Pine 283301 557 3 Ponderosa Pine 35754 551 4 Cottonwood/Willow 2747 560

5 Aspen 9493 607

6 Douglas-fir 17367 556 7 Krummholz 20510 589

合計 581012 4000

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

0 100 200 300 400 500 600 700 800 900 1000

驗證範例誤判

學習循環

BPN HTFN RBFN

圖 31 森林地表覆蓋分類於單層隱藏層的誤判率收斂圖

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

0 100 200 300 400 500 600 700 800 900 1000

驗證範例誤判

學習循環

BPN HTFN RBFN

圖 32 森林地表覆蓋分類於二層隱藏層的誤判率收斂圖

表 15 森林地表覆蓋分類最佳實驗結果

單層隱藏層 兩層隱藏層

演算法

比較方式 BPN HTFN RBFN BPN HTFN RBFN 驗證誤判率 0.211 0.193 0197 0.192 0.232 0.856 驗證誤差均方根 0.126 0.126 0.124 0.125 0.133 0.210

第六節 混凝土配方強度預測

抗壓強度是混凝土最重要的品質參數,它是其每立方公尺中各材料組成與齡 期的函數。本例題希望根據各材料組成與齡期的實驗數據來建立一個模型,以預 測混凝土的抗壓強度,實驗資料取自文獻(Yeh, 1998)。表 16 共顯示 8 個自變數,

1 個因變數。資料總筆數 1030 筆,其中 800 筆做為訓練範例,230 筆做為驗證範 例。

本例題的隱藏層的處理單元數目都採用8 個。單層與二層隱藏層的結果如圖 33、圖 34 所示,表 17 顯示本例題在整個收斂過程的最佳結果。可知六個網路 之中,只二層隱藏層RBFN 表現很差,其餘都有良好的表現,差異不大,其中以

二層隱藏層BPN 最佳。

表 16 混凝土配方強度預測變數表 變數名稱 變數說明 單位 用途 C 水泥用量 kg/m3 自變數 F 飛灰用量 kg/m3 自變數 S 爐石用量 kg/m3 自變數 W 水用量 kg/m3 自變數 SP SP 用量 kg/m3 自變數 CA 碎石用量 kg/m3 自變數 FA 砂用量 kg/m3 自變數

T 齡期 日 自變數

fc’ 抗壓強度 psi 因變數

0.04 0.05 0.06 0.07 0.08 0.09 0.1 0.11 0.12

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

差均方

學習循環

BPN HTFN RBFN

圖 33 混凝土配方強度預測於單層藏層的誤差均方根收斂圖

0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 0.11 0.12

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

差均方

學習循環

BPN HTFN RBFN

圖 34 混凝土配方強度預測於二層隱藏層的誤差均方根收斂圖

表 17 混凝土配方強度預測最佳實驗結果

單層隱藏層 兩層隱藏層

演算法

比較方式 BPN HTFN RBFN BPN HTFN RBFN 驗證誤差均方根 0.046 0.047 0.048 0.040 0.044 0.098

第七節 總結

為了比較各法的優劣,在此將所有數值例題的在整個收斂過程的誤判率的最 佳結果,以單層隱藏層BPN 的結果做為基準來進行比較,整理如表 18 與圖 35。

為了避免單一例題的影響太大,也將各法在各例題下的優劣給予排名,整理如表 19。由這些圖表可以發現下列結論:

1. 優劣排序:六個網路之中,只二層隱藏層 RBFN 表現很差,其餘都有良好的 表現,差異很小。優劣順序依序是單層RBFN、二層 BPN、單層 HTFN、單 層BPN、二層 HTFN、二層 RBFN。

2. 分類問題:單層隱藏層 RBFN 在四個分類例題中都比單層隱藏層 BPN 更佳,

只有在迴歸例題中表現略差於單層隱藏層BPN,可見單層 RBFN 十分適合於

實際的分類應用中。

3. 迴歸問題:在迴歸問題中,表現最好的是二層隱藏層 BPN,可見二層 BPN 考能較適合於實際的迴歸應用中。

4. 隱藏層層數:單層隱藏層 RBFN 是六個網路之中的最佳方法,但二層隱藏層 RBFN 是最差方法;而單層隱藏層 BPN 卻比二層隱藏層 BPN 較差,可見隱 藏層數目是個重要的因素。

表 18 實際例題比較總結

單層隱藏層 兩層隱藏層

例題名稱 例題代表

BPN HTFN RBFN BPN HTFN RBFN 風險房貸顧客評估 分類 1 1.029 0.986 0.942 0.986 1.42 潛在貸款客戶發掘 分類 1 1 0.987 1.025 1.013 2.696 面板瑕疵判斷 分類 1 0.877 0.863 1 1.014 1.767 森林地表覆蓋分類 分類 1 0.915 0.933 0.91 1.100 4.057 混凝土配方強度預測 迴歸 1 1.044 1.067 0.889 0.978 2.178 平均 1 0.973 0.967 0.953 1.018 2.424

表 19 實際例題效果評比

單層隱藏層 兩層隱藏層

例題名稱 例題代表

BPN HTFN RBFN BPN HTFN RBFN

風險房貸顧客評估 分類 4 5 2 1 2 6

潛在貸款客戶發掘 分類 2 2 1 5 4 6

面板瑕疵判斷 分類 3 2 1 3 5 6

森林地表覆蓋分類 分類 4 2 3 1 5 6

混凝土配方強度預測 迴歸 3 4 5 1 2 6

平均 3.2 3 2.4 2.2 3.6 6

名次 4 3 2 1 5 6

0 0.3 0.6 0.9 1.2 1.5 1.8 2.1 2.4 2.7 3 3.3 3.6 3.9 4.2

BPN單層 HTFN單層 RBFN單層 BPN雙層 HTFN雙層 RBFN雙層

演算法

與單層BPN的誤差相較之相對誤

風險房貸顧客評估 潛在貸款客戶發掘 面板瑕疵判斷 森林地表覆蓋分類 混凝土配方強度預測

圖 35 實際例題綜合比較

在文檔中 中 華 大 學 (頁 48-56)

相關文件