第五章 實證研究結果
第三節 實證研究分析
依據交叉驗證的程序,本研究採取輸入層單元數為7,輸出層單元數為8,訓練資料 及測試資料各依輸出層的八種土地使用現況分類處理之,此外為真實呈現資料的類別因 而採取隨機取樣方式進行分析。採取隱藏處理單元數目、學習循環、學系速率、慣性因 素交叉驗證,建立最佳網路模式。
一、第一隱藏層處理單元數目
本研究依據陳耀茂、殷純淵(2004)對於「第一隱藏層處理單元數目」分別以5、6、7、
8、9、10、15、20作為隱藏層節點數,觀察個別之誤判率。並依據葉怡成所選取隱藏層 處理單元數目原則:
1.隱藏層處理單元數目=(輸入單元數+輸出層單元數)/2=(7+8)/2=7.5 2.隱藏層處理單元數目=(輸入單元數×輸出層單元數)1/2=(7×8)1/2=7.48
表5-5更改隱藏層節點數所得之學習及測試誤判率,比較後當節點數為7時,其誤判 率相對來得低,故調整網路架構成為7×7×1。當屬於複雜的問題通常需要越多的隱藏層,
以及較多的神經元數目,但是目前尚無明確的準則提供參考,通常是以網路系統或資料 的特性進行判斷,Davies (1994)認為沒有絕對的法則可以決定網路中應包含的參數,惟 透過試誤法 (Try and error)才能找到相對較佳的結果。而通常較多的輸入層神經單元數 目可以找到較好的預測模式,但是在訓練時卻需要花費較多時間,在使用上較不方便;
但過少的神經元數目則無法完整地描述輸入和輸出變數間的關係以及得到預期的效 果,大多的層數及神經元數目又會造成過度配適(overfitting)的問題,但此問題仍可藉由 交叉驗證的方法來改善(邱志洲等,2002;楊錦洲等,2005)。而節點函數的變異數值至 今尚未有較佳的理論可作為計算之根據,因此常需藉由人工的方式自行設定(邱志洲 等,2005)。
表5-5 隱藏層節點數所得之學習及測試誤判率
輸入處理單元數 隱藏層節點數 隱藏層 學習誤判率 測試誤判率
7 5 1 0.37474 0.62235
7 6 1 0.36821 0.60153
7 7 1 0.37258 0.55428
7 8 1 0.36944 0.56526
7 9 1 0.38416 0.57244
7 10 1 0.37474 0.58824
7 15 1 0.36211 0.62235
7 20 1 0.38316 0.62745
二、學習循環次數
改變「學習循環次數」,本研究依據陳耀茂、殷純淵(2004)嘗試以300、500、1000、
1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、
8000、8500、9000、9500、10000作為學習循環次數。
表5-6更改學習循環次數所得之學習及測試誤判率,比較後當學習循環次數為10000 時,其誤判率相對來得低,故調整網路學習循環次數為10000次。
網路收斂的標準通常採用MSE或RMSE小於某一臨界值,但是當網路無法到達所給 定的標準時,則可以採用到達某一學習次數時即提早停止的方式,或是等待誤差穩定幾 乎不再下降的時候停止網路學習。類神經網路的模式建立,首先主要是決定網路的大 小,再來是調整學習速率的數值,使網路能夠收斂到一個較佳的最小值,或達到所預期 的誤差門檻,需要對於資料的類型,網路結構的規模以及相關的參數值,與一全面性的 綜合考量(徐永衡等,2004)。
表5-6 學習循環次數所得之學習及測試誤判率
次數 學習誤判率 測試誤判率
300 0.39464 0.52143
500 0.40214 0.58143
1000 0.38286 0.54124
1500 0.40053 0.59815
2000 0.39846 0.60275
2500 0.38246 0.60285
3000 0.40253 0.58246
3500 0.39368 0.62148
4000 0.38214 0.59255
4500 0.36244 0.57222
5000 0.35621 0.55204
5500 0.39428 0.56284
6000 0.40283 0.52148
6500 0.38428 0.52118
7000 0.40218 0.58247
7500 0.38246 0.57482
8000 0.36286 0.58623
次數 學習誤判率 測試誤判率
8500 0.42115 0.59283
9000 0.35218 0.58288
9500 0.36044 0.51248
10000 0.34421 0.50216 三、學習速率
本研究依據陳耀茂、殷純淵(2004)試圖以0.1、0.5、1、5、10之學習速率作為學習速 率初始值,分別進行測試。表5-7為更改學習速率所得之學習及測試誤判率,比較後當 學習速率為0.5時,其測試誤判率相對低,故將學習速率設定為0.5。
學習速率方面,通常學習速率太大或太小對網路收斂性質均不利。較大的學習速率 會使網路的震幅過大,造成數值震盪而難以收斂;而較小的學習速率,則會造成學習訓 練時間過長,易使誤差函數落入局部最小值。因此徐永衡等(2004)認為隨著訓練次數增 加而遞減的可變學習速率,可能是較佳合理解決辦法。
表5-7 學習速率所得之學習及測試誤判率
學習速率(η) 學習誤判率 測試誤判率
0.1 0.37286 0.48214
0.5 0.30247 0.45438
1 0.36148 0.47818
5 0.35144 0.49218
10 0.35218 0.47916
四、慣性因數
本研究依據陳耀茂、殷純淵(2004)嘗試以0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8作 為慣性因數初始值,比較後當慣性因數為0.5時,其誤判率相對來的低,故調整慣性因數 為0.5,參見表5-8,此一結果與葉怡成建議最佳值0.5相符合。
慣性因子可改善網路收斂時震盪的情形,減低對誤差梯度的敏感度,可以避免落入 誤差函數的局部最小值,通常設定值介於0至1之間(徐永衡等,2004)。
表5-8 慣性因數所得之學習及測試誤判率
慣性因數 學習誤判率 測試誤判率
0.1 0.35111 0.53221
0.2 0.37824 0.54328
0.3 0.38219 0.53884
0.4 0.35129 0.47229
0.5 0.30148 0.45438
0.6 0.37213 0.47196
0.7 0.53417 0.51028
0.8 0.32527 0.53124
經過學習測試完畢後,得知於圖5-2中可觀察到訓練及測試範例之誤差率收斂過程 圖,“■”代表訓練範例之誤判率,“▲”代表測試範例之誤判率,觀察可知學習及測試誤 判率稍微偏大。
圖5-2 訓練及測試範例之誤差率收斂過程圖
當RMSE趨於收斂時且越小時為最佳訓練次數,也是網路結構最終的結果,經由不 斷地測試後當第一隱藏處理單元數為7,學習率為0.5,RMSE等於0.45438,表5-9為參數 最佳模型表。此時我們將進一步根據平方根誤差(Root Mean Square Error,RMSE)、平均 絶對誤差(Mean Absolute Error,MAE)、總誤判率或總正確率來判斷模式的最佳與否。由 於本研究屬於分類問題,故採總誤判率或總正確率較為適合。
表5-9 最佳模型之RMSE
模擬次數 第一隱藏處理單元數 學習率 RMSE 訓練樣本辨識率 測試樣本辨識率
10000 7 0.5 0.45438 0.37249 0.47214 對於分類型的應用,可用混亂矩陣作為判斷網路學習效果的好壞。而混亂矩陣的定
義:矩陣中的每一個縱行代表一種目標分類,每一個橫列代表一種推論分類。如,矩陣
中第j縱行第i橫列的元素值,代表應當屬於第j種分類,但被網路模式推論為第i種分類。 5-10示其正判範例數共計有115個28正判範例數。倘若進一步分析表5-10結果,表中第一 縱行第二橫列的元素1,此一數字代表原先應當屬於第一類現況(閒置使用)的空地,經由 Error=0.4363
22 0 7 0 3 12 0 0 44
28 115=22+3+12+20+3+31+10+14
車場、圍籬、市集、綠地、道路、其他使用等八種使用。第二行的測試範例中每一種使 用所具有的正確分類範例數目。第三行則顯示某一類的誤判率。
從表5-11,顯示第三類(停車場使用)、第四類(圍籬使用)與第六類(綠地使用)的誤判 率接近零,亦即準確度為100%,顯示這三種分類模式較適合使用在高雄市空地分類上,
電腦在面對這些使用時,也能夠立即做出判斷。
至於系統在測試範例中第一類(閒置)分類及第五類(市集使用)其誤判率分別為 0.7647及0.7720,這樣的高誤判率是因為許多空地在閒置同時會拿來做綠地或其他使 用,使得電腦在分類上產生困擾,針對此一現象建議日後有二種使用現況的統一合併用 一種分類方式,這樣可以增加其正確率方便日後分類管理維護策略。
表5-11 反尺度化與誤判率
輸出變數 測試範例 誤判率
1 41 0.7647
2 17 0.5500
3 19 0.0000
4 22 0.0000
5 12 0.7720
6 45 0.0667
7 27 0.5000
8 21 0.7500
從圖5-3分類行問題之結果輸出檔判讀,測試範例數為204筆,所以有204個橫列,
每一橫列代表一個空地分類使用;有14個縱行,前六個為尺度化之原始輸出值,後八個 為尺度化之網路預測值。在尺度化下,輸出變數的值越大,則樣本最可能屬於該類別。
如此高雄市之空地有八個分類使用,圖中顯示第一橫列的樣本輸出變數向量是(0.200、
0.201、0.645、0.202、0.192、0.202、0.200、0.206),則樣本最可能屬於第三類別(停車 場),因為第三輸出變數向量值為(0.645)是八個中最大者;另外,第五個輸出變數向量值 (0.192)是八個中最小者,代表樣本最不可能屬於第五類別(市集),故第一橫列所代表的 空地分類為第三種分類使用(停車場)。其餘依序列推,第二橫列的樣本輸出變數向量是 (0.204、0.204、0.204、0.201、0.198、0.204、0.203、0.205),則樣本最可能屬於第八類 別(其他),因為第五輸出變數向量值為(0.205)是八個中最大者;另外,第五個輸出變數 向量值(0.198)是八個中最小者,代表樣本最不可能屬於第五類別(市集),故第二橫列所 代表的空地分類為第八種分類使用(其他),其餘依序列推。這樣的結果符合空地理應為 閒置或是綠地空間,可是確有地主拿來作為商業用途使用,與其實質屬性不符,對於這 一類的空地,市府則也必要嚴加查核以確保其土地容許使用項目是否與其土地使用分區
相符,避免土地雖為市府所有29卻為民眾佔用做商業用途使用,成為都市空間的亂源所 在。
圖5-3 分類行問題之結果輸出檔判讀
29 本次調查的土地所有權均為公有。