• 沒有找到結果。

基於整體學習演算法於航攝正射影像之

N/A
N/A
Protected

Academic year: 2022

Share "基於整體學習演算法於航攝正射影像之"

Copied!
12
0
0

加載中.... (立即查看全文)

全文

(1)

Volume 26, No.3, 2021, pp. 181-192 DOI:10.6574/JPRS.202109_26(3).0004

1 嶺東科技大學資訊科技系 大學生 收到日期:民國 110 年 07 月 05 日

2 嶺東科技大學資訊科技系 教授 修改日期:民國 110 年 09 月 01 日

* 通訊作者, E-mail: titzton@gmail.com 接受日期:民國 110 年 09 月 10 日

基於整體學習演算法於航攝正射影像之 物件分類探索-以海岸廢棄物為例

劉奕洋

1*

萬絢

2

摘要

近年臺灣在氣候變遷及海洋垃圾成長的環境下,多樣化的海岸樣貌正遭受威脅,在海岸廢棄物的議 題上刻不容緩。有鑑於當今 GIS 的蓬勃發展,及遙測技術能夠在短時間內擷取大範圍的量化資訊,能看 到有越來越多取代傳統調查方式的實際應用。本研究屬遙測技術結合機器學習的應用,以整體學習 (Ensemble learning) 之模型訓練方式在海岸廢棄物上進行物件分類實作的可行性,使用隨機森林 (Random Forest) 演算法及極限樹 (Extra Trees) 演算法所建構之模型,探討其分類成效差異,將機器分類後的數據 將資料空間視覺化以繪製出主題圖。研究成果可應用於海岸廢棄物相關環境保育作業上,將為一經濟且 有效的解決方案。

關鍵詞:整體學習、影像物件分類、資料空間視覺化

1. 緣起

本章節概述研究背景與動機並回顧本研究所 參照之文獻的內容,以及探討機器學習當中整體學 習演算法衍生之技術性議題。

1.1 背景

臺灣境內的海岸線全長約莫1,520 km,其海岸 種類包括沙岸、岩岸、珊瑚礁岸。在這看似不大的 範圍內,能蘊藏如此豐富的地形與海岸,是非常珍 貴的大自然資產。根據2019年內政部營建署公告的 資料,臺灣境內自然海岸占海岸長度比例為55.56%,

而本島的部分更是僅僅44.23%而已,其餘大多是被 漁港、消波塊、堤防給覆蓋的人工海岸線。

近年來因眾多海岸管制區的開放以及土地使 用的多元化,部落客接二連三造訪各種「秘境」所 帶起的旅遊風潮,及部分民眾旅遊習性改變,使許 多保有原始生態樣貌的地形,隨著人類的造訪逐漸 被破壞。

1.2 動機

誠如前述,臺灣本島自然海岸線長度占比僅剩 下44.23%,各鄰海縣市的相關單位在面對海岸維護 工程這個議題上,也是相當費心,除了每年不斷投 入上億元在海岸環境的維護上,消耗的大量時間與 人力,成效卻往往都無法達到期望值,也很難有效 率的對遭到破壞的環境進行復育。困境當前,一旦 停下便會使後續的維護工作更加困難,除了持續定 期的清運海岸垃圾,或者時常由相關團體舉辦的一 次性淨灘活動,我們必須開拓一個更有計畫性的現 代解決方案。

本研究欲透過遙測技術結合整體學習的的模 型訓練方式,實際應用於地真資訊辨識,對海岸地 貌的細節進行識別及相關估算。以遙測影像進行地 貌判釋,可節省大區域傳統現地勘查上所需之人力、

時間及經費。其涵蓋面積廣泛與即時性的特性,在 區域性問題監測上提供了很大的幫助,故遙測技術 為一經濟且有效率的地真資訊調查方法。

(2)

1.3 文獻回顧

機器學習通常可以這樣定義:「透過從過往的 資料和經驗中學習並找到其運行規則,最後達到人 工智慧的方法。」 (Nero, 2018) 機器學習包含透過 樣本訓練機器辨識出運作模式,而不是用特定的規 則來設計程式。這些樣本可以在資料中找到。機器 學習是一種它從資料中得到複雜的函數 (或樣本) 來學習以創造演算法 (或一組規則),並利用它來做 預測(Wan et al., 2012)。

對 SPOT 衛星影像資料庫進行分析後,利用資 料挖掘技術當中粗糙集離散化 (Discrete Rough Set) 區隔出不同類別之間的關鍵屬性及分離門檻值,改 善坡地影像的分類準確度之崩塌地研究 (Wan et al., 2010)。

採用小型無人空拍機蒐集地面影像後,以隨機 森林 (Random Forest) 演算法結合紋理資訊分析的 創新方法,對城市裡的植被進行分類,以達到精準 計算出土地覆蓋之面積 (Feng et al., 2015)。

應用高光譜影像的優勢,採用隨機森林演算法 對 64 個光譜波段的資料進行花卉生長週期及生長 空間分布的分類應用,以進行蜂巢生產力及蜂蜜流 量之間的分析,最終達到了解蜜蜂覓食行為及健康 方面之研究 (Abdel-Rahman, et al., 2015)。

以高光譜影像進行數據維度降低後,採用 27 個 光 譜波 段作 為材 料, 使用 支援 向量 機 (Support Vector Machine) 及隨機森林進行樹木種類辨識之 研究,以先進的方法協助森林管理員進行森林規劃 及監測 (Ballanti et al., 2016)。

參照以決策樹 (Decision Tree) (Zhang et al., 2008) 為 基 礎 的 隨 機 森 林 演 算 法 (Cutler et al., 2012),提出整體學習模型對 E 型肝炎在水質與氣象 因素影響下的感染預測 (Peng et al., 2021)。

利用整體學習的策略方法:投票 (Voting)、裝 袋 (Bagging)、增強 (Boosting) 和堆疊 (Stacking) 技術,結合七種基本分類器 (Base Estimator) 成果 的 研 究 , 對 受 試 者 進 行 注 意 力 不 足 過 動 症 (Attention Deficit Hyperactivity Disorder, ADHD) 的 預測 (Luo et al., 2020)。

基 於 臨 床 經 驗 核 映 射 (Empirical Kernel Mapping) 建構之多重視角的整體學習算法,以上海 中醫藥大學附屬曙光醫院之住院紀錄對就診患者 的心臟衰竭 (Heart Failure, HF) 死亡率進行預測 (Wang et al.,2020)。

基於 k-平均演算法 (K-means Clustering) 進行 樣 本 採 樣 , 以 創 新 的 動 態 整 體 學 習 (Dynamic Ensemble Learning) 概念對基本分類器進行多樣化 組合後,對加護病房 (Intensive Care Unit, ICU) 患 者之疾病嚴重程度及生理狀態進行死亡風險的預 測 (Guo et al.,2021)。

以及為近年席捲全球傳染病提出的解決方案,

基於風險預測模型 (Risk Prediction Models) (Tripepi et al., 2013),以整體學習框架進行開發的 SARS- CoV-2 (COVID-19) 預測模型之全球傳染病案例研 究 (Wu et al., 2021)。

在我們翻閱相關先前學者做過的相關研究時,

蒐集到不少學者將各類機器學習方法應用到地球 科學及遙測領域的研究,惟整體學習 (Ensemble learning) 這種模型訓練方式較多應用於醫學領域 的疾病預測上,然而目前在地物識別領域當中,研 究主要所採用演算法多為支援向量機及整體學習 類型的隨機森林。故本研究將探討兩種同為採用整 體學習方法之演算法:隨機森林及極限樹 (Extra Trees),應用於海岸廢棄物分類上的可行性。

而整體學習是一種將數個弱演算法的演算結 果綜合評估,藉此達到顯著提升成效的模型訓練方 式。本研究擬使用分類器為基礎來實作影像分類,

則實現整體學習的基本概念為使用多個基本分類 器或是稱為弱分類器 (Weak Classifier),訓練時將 所有分類器視為一個整體,將所有分類器的分類結 果綜合評估後得出一個平均值,即為該整體的最終 分類結果。

2. 研究材料

眾所皆知的,遙測技術已廣泛被應用於土地利 用調查上,尤其近年與太空科技的整合,更使我們 有能力探測大範圍地區的整體狀況,高解析度影像

(3)

具有廣景的特性,所以能被應用於大範圍土地利用 偵測問題上。

本研究使用無人飛機攜帶傳感器 (CCD 相機) 於選擇研究區域上空晴朗無雲之天候的上午 11 時 進行航拍作業。以離地高 20 m,FOV 為 40°之拍攝 參數進行多光譜影像之拍攝作業,擷取地面解析度 為 10×10 cm 之 RGB 影像。

本章節對取材及實作過程可能發生的狀況總 共列出三個部分:取材策略、特徵萃取、最佳化策 略在實作上的困難。

2.1 取材策略

目前高解析度影像之空間解析力已大幅躍升 至公寸級的精度,仰賴其高空間解析力,將可以突 破以往影像空間解析力不足的限制。因此,如何應 用高解析度的研究中,諸多學者利用了光譜指標、

紋理、多時段影像、雷達影像甚至是結合 GIS 資料,

進行面積的判釋,也都獲至相當良好的成果,但由 於以往研究多是利用 SPOT 衛星影像,雖能得到良 好的分類成果,但由於影像解析度不足,所以無法 進行面積的萃取,而高解析度影像畫質細膩的優點,

恰好可以補足上述的問題。

2.2 特徵萃取

隨著空間測量領域近幾年來的飛躍性成長,無 論是藉由一般光譜或多光譜影像所取得的資訊,都 包含了人眼可觀測範圍以外的資料。但如果是應用 於機器的影像物件分類上,不見得是資訊越多越好,

有些具決策性的資料將會導致機器在物件分類上 的誤判及漏判,也可以稱其為雜訊。而對影像資料 前期的預處理作業,便是影響後續機器實作影像物 件分類之精準度的重要因素之一。

2.3 最佳化策略在實作上的困

由於海岸廢棄物部分是由崩塌地形 (岩石及漂 流木) 所產生, 而崩塌地形的發生是非時序性的,

因此造成海岸垃圾在每一個區塊的發生時間並不 會一致,且所有目標的地表屬性並非都是單一土質,

這些情形會導致在不同時期相同影像在海岸垃圾 範圍內會產生不同的植生反應,本研究中影像物件 分類僅以單一時期拍攝時間內無植生反應之海岸 廢棄物地區塊進行萃取與探討。也正因如此,本研 究所採樣的樣本僅少數有土壤的土質資料,將訓練 樣本導入機器訓練所建構的模型,對應於整體實證 區的驗證作業上,仍有一定程度的不確定性。

3. 研究方法

3.1 研究設計

3.1.1 選址

海廢在空間概念上的廣大汙染場域涵蓋海岸、

海面、海水層、深水層,更有著非點源 (Nonpoint source, NPS) 的汙染特性。相較於一般的氣體汙染 或水質汙染,更不易根究其汙染行為人、汙染源、

汙染場等的直接關聯性。為了在環境要求較謹慎的 條件下得以順利進行研究及方便後續場勘作業,本 研究實證區的研究採樣要點有下列幾項:

(1)必須為有向一般民眾開放且方便進出的地區。

(2)海岸長度最少需要 100 m。

(3)屬開放型海域並且避免常有遊客人潮的觀光地 區。

(4)避免海岸方圓 1 km 內有河口、港口、礁石等危 險地形。

(5)為確保退潮時廢棄物能殘留在海水前緣到路岸 及植被邊緣的部分,故海岸坡度不建議超過 45°。

經過多次勘查,最終將研究區域選擇在新北市 瑞芳區台 2 線的 83.2K 處,經緯度為 25.1212, 121.9054。該處位於新北市內東北方,北濱東海,東 鄰貢寮區,南鄰雙溪區、平溪區,西邊與西北邊分 別相鄰基隆市暖暖區與中正區。瑞芳區在地形上屬 中央山脈最北端的基隆丘陵及臺灣東北角海岸,除 部分濱海地帶及河川沖積地以外,主要為山坡地。

3.1.2 步驟

本段落對研究流程的部分進行步驟拆解及說 明,詳細如下。

(4)

Step.01 將影像素材當中選為實證區的區塊裁切出 來

Step.02 隨機選取訓練資料群與測試資料群 Step.03 在訓練資料中標記類別標籤

Step.04 將標籤資訊導出為.CSV 檔案以便串接程式 資料庫

Step.05 進行文件標頭資訊切割 Step.06 資料套用標準化偏差值 Step.07 分別建立訓練模型

Step.08 使用模型對測試資料進行分類 Step.09 將分類結果串接至誤差計算單元 Step.10 計算該次測試的精度

Step.11 使 用 資 料 視 覺 化 套 件 產 出 誤 差 矩 陣 (Confusion Matrix)

Step.12 評估模型分類成效

Step.13 將數據建置出資料空間將其視覺化 Step.14 繪製主題圖

3.2 研究方法

研究當中本研究使用不同強度的分類器進行 實作及成效評估,由於隨機森林分類器 (Random Forest Classifier) 與 極 限 樹 分 類 器 (Extra Trees Classifier) 皆 是 以 決 策 樹 分 類 器 (Decision Tree Classifier) 為基本分類器的整體學習方法,為探究 其關聯性及整體學習式模型訓練法的差距,所以在 研究過程之初也會使用決策樹分類器進行實作,最 後再與使用整體學習方式訓練出的模型進行比較 及探討。

3.2.1 決策樹分類器

決策樹是透過記錄解題關鍵步驟及各步驟觸 發條件進而發展成樹狀架構的一種監督式學習法。

每個決策或事件 (觸發條件) 都可能衍生出兩個或 以上個分裂點,而產出不同的結果分歧,透過層層 推理以實現最終的分類結果,再將這些決策分歧畫 成圖形後看似很像一棵樹及其枝幹,故被稱作決策 樹。而這種演算法由根結點 (原始資料)、內部節點 (事件)、及葉節點 (決策結果) 所構成,在樹的內部 節點使用其中一個資料的屬性值進行判斷,根據判 斷的結果決定了該實例要進入哪個分裂點,在到達 葉節點處後便得到分類結果。是一種來自 if-then-

else 概念的監督式學習方法。 (Zhang et al., 2008)

3.2.2 隨機森林分類器

隨機森林是基於整體學習概念的一種監督式 學習法,該演算法本身由是由多個「弱演算法」來 建構出來的「強演算法」。其中「隨機」的概念由 Bagging (Bootstrap Aggregation) (Breiman, 1996) 裝 袋算法所達成,藉由重新取樣原有訓練樣本以產生 新的訓練樣本,也就是能從一組訓練樣本群當中自 行產生出多組訓練樣本,隨機因子的概念包括了隨 機模型、隨機特徵、隨機引數及隨機樣本。而「森 林」的概念就由決策樹 (Decision Tree) 擔當,藉由 Bagging 裝袋算法從訓練樣本中隨機取出 N 個樣本,

再將這 N 個樣本導入至決策樹中訓練出 N 個分類 器,最終匯總所有決策樹的預測結果,以投票方式 (Majority vote) 方式決定該案例的類別 (Cutler et al., 2012)。

3.2.3 極限樹分類器

極限樹 (Extra Trees) 演算法跟前面所述的隨 機森林十分相似,兩者都是以決策樹分類器為基礎 構成之整體學習概念的監督式學習法。與前者最關 鍵 性 的 差 別 就 在 於 , 隨 機 森 林 是 應 用 Bagging (Bootstrap Aggregation) (Breiman, 1996) 裝袋算法在 一個隨機子集內得到最佳分叉屬性,從完整資料當 中隨機抽選樣本計算每個特徵的最佳劃分點 (熵),

再分配給決策樹進行訓練。但極限樹當中是在所有 資料當中完全隨機的得到分叉屬性,每一棵決策樹 都是使用完整資料進行訓練,只是自上而下的分裂 點是隨機的,也不計算每個特徵的最佳劃分點,從 而實現決策樹的分叉。故隨機因子的概念上與前者 的差異在於隨機樣本,在極限樹上變成了隨機分裂。

4. 研究成效

4.1 訓練樣本取樣

研究開始之初在實證區的訓練資料取樣區 (圖 1) 當中隨機抽選 148 筆資料作為訓練樣本,其中包 括了 64 筆石頭物件樣本、24 筆草地物件樣本、16 筆海水物件樣本及 44 筆漂流木物件的樣本,其次

(5)

每筆資料取樣的像素大小固定為 5×5 pixels (合計 3700 pixels) ,訓練樣本抽選分布如圖 2 (由於標註 顏色較為鮮豔,故於圖 2 左半部放置 R 波段之影像 以利於辨識標註點) 。

4.2 模型自我測試評估

誠如前述,本文為探究隨機森林分類器與極限 樹分類器這兩種基於整體學習概念的演算法與其 基本分類器的決策樹分類器的關聯性,以及探究使 用整體學習的優勢,本文也進行了決策樹分類器的 模型訓練。

經過從訓練資料取樣區獲得的 148 筆原始訓練 樣本 (共 3700 pixels) 再隨機切割為訓練樣本群 (共 1850 pixels) 及測試樣本群後 (共 1850 pixels),

先將訓練資料使用決策樹分類器進行模型訓練,參 數部分皆為預設。在模型建構完成的第一時間,將 測試樣本導入到該模型當中進行物件分類,計算精 確度後可以得到該模型對於同區域中影像資料的 分類準確度為 84.65% (表 1)。

接下來再將訓練資料分別使用皆為預設參數 的隨機森林分類器及極限樹分類器進行模型訓練。

同樣的,在模型建構完成的第一時間,將測試樣本 導入到該模型當中進行物件分類,分別計算其精確 度後可以得出下列兩張誤差矩陣表。使用隨機森林 分類器訓練之模型對於同區域中影像資料分類的 準確度為 89.24% (表 2);而使用極限樹分類器訓練 之模型對於同區域中影像資料分類的準確度為 90.97% (表 3)。

圖 1 訓練資料取樣區

(6)

圖 2 訓練樣本抽選分布

表 1 使用決策樹分類器訓練之模型對測試資料分 類的誤差矩陣表

表 2 使用隨機森林分類器訓練之模型對測試資料 分類的誤差矩陣表

表 3 使用極限樹分類器訓練之模型對測試資料分 類的誤差矩陣表

這三種同為樹狀的分類器在對於同區域中影 像資料 (測試資料群) 之分類準確度皆高於 80%,

因此在訓練樣本的抽選上,可以肯定該訓練資料組 是具可利用性的。公平起見,訓練過程當中三種分 類器的所有參數皆為預設值。從誤差矩陣表當中可 以觀察到,使用基於整體學習概念的隨機森林分類 器與極限樹分類器進行訓練的模型在準確度上明 顯高於其基本分類器之決策樹分類器進行訓練的 模型。也可以證實在參數皆為預設值的情況下,基 於整體學習概念的分類器所建構出之模型,較單一 演算法之分類器出色。

(7)

圖 3 實證區其它區域之影像

4.3 導入實證區其它區域之影像

僅使用同區域中的影像資料進行模型評估是 無法得知理論與應用的實際差距,故接下來本研究 裁切了該實證區其他區域之影像 (圖 3),並且未對 其實際地貌進行人工標註 (原始圖資),將影像的每 個像素點 (Pixel) 轉換為向量資料逐筆讀入程式碼 當中,套用標準化偏差值後,使用基於整體學習概 念之隨機森林分類器及極限樹分類器建置出之模 型,進行影像物件分類的實際應用。

接下來使用了資料空間視覺化的技術對分類 結果進行主題圖的呈現,黑灰色部分為石頭;綠色 部分為雜草及其他植物;藍色部分為海水及其他被

濕潤的表面;橘色部分為漂流木及垃圾。

使用隨機森林分類器建構之模型對於其他區 域影像的分類結果為圖 4;使用極限樹分類器建構 之模型對於其他區域影像的分類結果為圖 5。

在主題圖的呈現上,較令本研究在意的是在模 型評估步驟時,使用極限樹分類器訓練之模型的準 確度僅高於使用隨機森林分類器訓練之模型 1.73%,

但是在對於其他區域影像物件的分類成果上,卻差 距較大。可以觀察到使用隨機森林分類器建構出的 模型在影像中上段的石頭邊緣部分皆有誤判為雜 草及其他植物的情況,反之使用極限樹分類器建構 出的模型在同樣的部分當中卻分類的相當乾淨,較 沒有邊緣誤判的情況產生。

(8)

圖 4 使用隨機森林分類器建構出的模型實證區其它區塊之影像物件分類的主題圖

4.4 結果與分析討論

為探究模型自我測試階段與導入實證區其它 區塊之影像進行實際應用之間的關聯性,本研究在 將實證區其他區域之影像導入模型進行影像物件 分類後,回頭觀察模型自我測試的評估階段,在誤 差矩陣圖當中很明顯的可以觀察到有三個類別分 類錯誤狀況較為顯著:

(1) 實際地貌:漂流木及垃圾 分類結果:石頭

(2) 實際地貌:石頭

分類結果:漂流木及垃圾 (3) 實際地貌:石頭

分類結果:海水及其他被濕潤表面

本研究的所有資料皆為原始資料,為實證隨機 森林分類器及極限樹分類器之間對於原始圖資的 分類成效,並無事先進行資料分析以篩除雜訊。第 一類分類錯誤的情況多出現在漂流木及垃圾物件 主體的中心紋理區塊;第二類分類錯誤的情況多出 現在石頭邊緣色差及陰影的部分,以上這兩類分類 錯誤的情況都可以透過資料分析進行雜訊篩除來 改善。而第三類分類錯誤的情況在海岸地形上多為 常見,由於濕潤表面及乾燥表面的石頭的影像資料 極為相似,在轉換為向量資料後數值也相當接近,

因此在石頭及岩石的分類訴求上主要為可以明確 判斷該物件是否為石頭或是海水為主,邊緣的界定 上較為模糊。

(9)

圖 5 使用極限樹分類器建構出的模型實證區其它區塊之影像物件分類的主題圖 在本研究將模型套用到實證區其它區塊之影

像的分類上產出主題圖後,分類錯誤的情況更被凸 顯出來,在模型自我測試階段產出之誤差矩陣表當 中兩者差距較不明顯,在這階段則可以體現出極限 樹分類器所建構出模型之優勢所在。可以很明顯的 看出使用極限樹分類器所建構出之模型對於實證 區其它區塊之影像的分類上,第一類及第二類的分 類錯誤狀況較使用隨機森林分類器所建構出之模 型少。而比較值得關注的是隨機森林分類器所建構 出之模型在石頭邊緣的處理上出現部分誤判為草 地的狀況,這點在使用極限樹分類器所建構出之模 型上並沒有出現,故極限樹演算法的設計邏輯更適 合應用在未去除雜訊的原始資料中。

而本研究也對兩種演算法進行較底層原理之 研究,隨機森林演算法在設計上,是藉由 Bagging 裝袋算法從訓練樣本中隨機取出 N 個樣本,再將這 N 個樣本導入至決策樹中訓練出 N 個分類器,換句 話說即是有可能在多次的隨機取出樣本過程當中,

幾乎都是雜訊偏多的狀況,導致最終匯總所有決策 樹的結果進行投票時,因雜訊佔比高而有多數的物 件被錯誤分類。在導入同個實證區當中測試資料組 的準確度評估時,由於區域影像及地貌雷同,故無 法及時明顯的反應出錯誤分類的情況。

而極限樹演算法本身就較無這種困擾,因為該 演算法在訓練其每一棵決策樹時都是使用完整的 資料集進行訓練,只是自上而下的分裂點是隨機的,

(10)

所以就沒有 Bagging 裝袋算法隨機抽取樣本導致可 能出現雜訊資料佔比過高的問題,容錯率也較隨機 森林高。

5. 結論

本研究基於整體學習概念之演算法,運用隨機 森林分類器及極限樹分類器進行影像物件分類的 比較,並與其基本分類器之決策樹分類器的模型分 類準確度相互比較,配合資料空間視覺化的技術來 將導入實證區其它區塊之影像的分類結果渲染為 主題圖以評估理論與實作之差距。光就模型評估階 段本研究已經可以得知,基於整體學習概念之隨機 森林分類器及極限樹分類器所建構出之模型,相較 於單獨使用其基礎分類器之決策樹分類器建構出 之模型較有優勢,以準確度的結果角度來審視,基 於整體學習概念的分類器均高出了決策樹分類器 約 5 個百分點。而在後續的模擬實際應用,可以觀 察到極限樹分類器相較於訓練階段採隨機取出樣 本的隨機森林分類器,在部分物件邊緣的辨識上較 沒有出現因抽選到較多雜訊樣本以致誤判的情形。

故地貌資訊較為複雜且沒有對資料進行關鍵屬性 篩選的情況下,每個基本分類器訓練都使用完整資 料集的極限樹分類器更能完全發揮基於整體學習 概念之演算法的優勢,若要再提升分類準確度,勢 必要使用資料挖掘技術對雜訊進行人工篩除。

致謝

本論文內容由兩位審查委員給予諸多具建設 性及修潤之建議,謹此致謝。

參考文獻

Abdel-Rahman, E.M., Makori, D.M., Landmann, T., Piiroinen, R., Gasim, S., Pellikka, P., and Raina, S.K., 2015. The utility of AISA eagle hyperspectral data and random forest classifier for flower mapping, Remote Sensing, 7(10): 13298–

13318.

Ballanti, L., Blesius, L., Hines, E., and Kruse, B., 2016.

Tree species classification using hyperspectral imagery: A comparison of two classifiers, Remote Sensing, 8(6): 445, DOI:10.3390/rs8060445.

Breiman, L., 1996. Bagging predictors, Machine Learning, 24(2): 123–140.

Cutler, A., Cutler, D.R., and Stevens, J.R., 2012.

Random forests, In: Ensemble Machine Learning:

Methods and Applications, Zhang, C., and Ma, Y.

(Eds.), Springer, Boston, MA, USA, pp. 157–175.

Feng, Q.L., Liu, J.T., and Gong, J.H., 2015. UAV remote sensing for urban vegetation mapping using random forest and texture analysis, Remote Sensing, 7(1): 1074–1094.

Guo, C.H., Liu, M.C., and Lu, M.L., 2021. A Dynamic Ensemble Learning Algorithm based on K-means for ICU mortality prediction, Applied Soft Computing, 103: 107166, DOI:

10.1016/j.asoc.2021.107166.

Luo, Y.Y., Alvarez, T.L., Halperin, J.M., and Li, X.B., 2020. Multimodal neuroimaging-based prediction of adult outcomes in childhood-onset ADHD using ensemble learning techniques, NeuroImage:

Clinical, 26: 102238, DOI:

10.1016/j.nicl.2020.102238.

Nero., 2018. Hello world machine learning [Web blog message], Available at:

https://nerocube.github.io/2018/11/16/hello- world-ml/, Accessed November 1, 2020.

Peng, T., Chen, X.Y., Wan, M., Jin, L.Z., Wang, X.F., Du, X.J., Ge, H., and Yang, X., 2021. The prediction of hepatitis E through ensemble learning, International Journal of Environmental Research and Public Health, 18(1): 159, DOI:

10.3390/ijerph18010159.

(11)

Tripepi, G., Heinze, G., Jager, K.J., Stel, V.S., Dekker, F.W., and Zoccali, C., 2013. Risk prediction models, Nephrology Dialysis Transplantation, 28(8): 1975-1980.

Wan, S., Lei, T. C., and Chou, T. Y., 2010. A novel data mining technique of analysis and classification for landslide problems, Natural Hazards, 52(1): 211–

230.

Wan, S., Lei, T.C., and Chou, T.Y., 2012. A landslide expert system: Image classification through integration of data mining approaches for multi- category analysis, International Journal of Geographical Information Science, 26(4): 747–

770.

Wang, Z., Chen, L.L., Zhang, J., Yin, Y.C., and Li, D.D., 2020. Multi-view ensemble learning with empirical kernel for heart failure mortality

prediction, International Journal for Numerical Methods in Biomedical Engineering, 36(1): e3273, DOI: 10.1002/cnm.3273.

Wu, H.H., Zhang, H.Y., Karwath, A., Ibrahim, Z., Shi, T., Zhang, X., Wang, K., Sun, J.X., Dhaliwal, K., Bean, D., Cardoso, V.R., Li, K.Z., Teo, J.T., Banerjee, A., Gao-Smith, F., Whitehouse, T., Veenith, T., Gkoutos, G.V., Wu, X.D., Dobson, R., and Guthrie, B., 2021. Ensemble learning for poor prognosis predictions: A case study on SARS- CoV-2, Journal of the American Medical Informatics Association : JAMIA, 28(4): 791–800.

Zhang, J., Liu, W., and Gruenwald, L., 2008. A successive decision tree approach to mining remotely sensed image data, In: Data Warehousing and Mining, Wang, J. (Ed.), IGI Global, Hersey, PA, USA, pp. 2978–2992.

(12)

1 Undergraduate Student, Department of Information Technology, Ling Tung University Received Date: Jul. 05, 2021

2 Professor, Department of Information Technology, Ling Tung University Revised Date: Sep. 01, 2021

3 Corresponding Author, E-mail: titzton@gmail.com Accepted Date: Sep. 10, 2021

The Study of Orthophoto Image Classification through Ensemble Learning Based on the Aerial Photos: A Case Study on Coastal

Waste Image Classification

Yi-Yang Liu

1*

Shiuan Wan

2

Abstract

Presently, coastal features of Taiwan are threatened under the environment of climate change and the growth of the marine waste. The issue of coastal waste cannot be delayed any more. The most traditional method of disposing of coastal waste is to organize beach cleaning activities by coastal government agencies. That is, the private environmental groups using a large amount of manpower to manage the coast. The comparison of time cost and implementation efficiency is not ideal. In view of the development of GIS, the ability of remote sensing technology can capture a wide range of data in a short period of time. On the other hands, we can see many practical applications that replace traditional survey methods. This research is based on the application of remote sensing technology combined with machine learning to display the observation of our seashore. In this study, the Ensemble learning model is used to implement object classification. More specifically, Random Forest (RF) algorithm and Extra Trees (ET) algorithm are applied to explore different algorithms. The classification effects of the model constructed by established process are different. The data for the machine learning classification is visualized by the thematic map. The contributions can be applied to coastal waste related environmental studies effectively and practically.

Keywords: Ensemble Learning, Image Object Classification, Visual Data Space

參考文獻

相關文件

For terminating simulations, the initial conditions can affect the output performance measure, so the simulations should be initialized appropriately. Example: Want to

In our AI term project, all chosen machine learning tools will be use to diagnose cancer Wisconsin dataset.. To be consistent with the literature [1, 2] we removed the 16

We will calculate the relationship points as their features and find the maximum relation protein spot pair as basic information for image matching.. If we cannot find any referable

We try to explore category and association rules of customer questions by applying customer analysis and the combination of data mining and rough set theory.. We use customer

本論文之目的,便是以 The Up-to-date Patterns Mining 演算法為基礎以及導 入 WDPA 演算法的平行分散技術,藉由 WDPA

(1999), "Mining Association Rules with Multiple Minimum Supports," Proceedings of ACMSIGKDD International Conference on Knowledge Discovery and Data Mining, San Diego,

Envelopment Analysis,” International Institute for Applied Systems Analysis(IIASA), Interim Report, IR-97-079/October. Lye , “Clustering in a Data Envelopment Analysis

Hogg (1982), “A State-of-the-art Survey of Dispatching Rules for Manufacturing Job Shop Operation,” International Journal of Production Research, Vol.. Gardiner (1997), “A