道路破損檢測

第四章實驗流程與結果討論

4.2 道路破損檢測

4.2.1 實驗流程

道路破損檢測的部分，由於一開始的資料不足，但希望能先評估以類神經網路進行模型建構可能的成效，因此先採用了新北市政府網站上所提供之照片作為訓練資料集。數量上總數為3314 張照片。而根據文獻[23]上之實驗數據，可以預想到使用類神經網路對整張照片進行預測其結果並沒有辦法達到如同閥栓辨識之效果。

分類以 2.2.2 節之中表 2-1 為基準，在將紅黃線與白線破損等以顏色為基準區分開來。由於種類過多，若將種類名稱直接置於表格中將會造成判讀困難，因此以下將種類以縮寫表示。

表 4-15 道路破損種類縮寫對應表

WL White line damaged

P Potholes

RL Red line damaged

CD Crosswalk damaged

YD Yellow line damaged

BC Block crack

TC Transverse crack

AC Alligator crack

LC Longitudinal liner crack

而在本實驗中，由於使用了YOLOv3 的網路架構，原本的實驗設備不足以運行此一網路架構，因此使用了另外一套設備：GPU 為 NVDIA GTX1080Ti 11G、CPU 為 AMD Ryzen5 1600、RAM 配置為 16G。而道路破損部分有分為縱向裂紋和橫向裂紋，因此實驗將不採用隨機旋轉照片進行網路訓練。圖 4-4 是訓練流程圖。

圖 4-4 道路破損模型訓練流程圖

4.2.2 實驗結果與討論

 使用 YOLOv3-tiny 網路

最早依循著先前閥栓巡檢系統的經驗，希望使用YOLOv3-tiny 的網路即可完成模型訓練，並獲得較高之精準度，因此先以此一神經網路進行了神經網路的訓練。TP 為 285，FP 為 245，FN 為 1073。Precision 為 53.77%，Recall 為 20.99%。

表 4-16 YOLOv3-tiny 模型訓練結果

WL P RL CD YL BC TC AC LC None

WL 43 0 0 0 0 0 0 0 0 208

P 0 72 0 0 0 0 0 3 0 161

RL 0 0 7 0 3 0 0 0 0 104

CD 0 0 0 0 0 0 0 0 0 4

YL 0 0 0 0 32 0 0 0 0 243

BC 0 0 0 0 0 0 0 0 0 0

TC 0 0 0 0 0 0 0 0 0 3

AC 0 0 0 0 1 0 0 131 1 331

LC 0 0 0 0 0 0 0 0 0 19

None 73 10 12 0 69 0 0 73 0 x

 使用 YOLOv3 網路

根據上一個實驗結果，可以發現到YOLOv3-tiny 在道路破損偵測這方面表現十分不好，因此再來使用了YOLOv3 網路進行訓練，期望較大型的類神經網路架構可以獲得較好的成果。TP 為 377，FP 為 344，FN 為960。Precision 為 52.29%，Recall 為 28.20%。就實驗結果而言，雖然在Precision 從 53.77%微幅降至 52.29%，但 Recall 從 20.99%大幅提升至 28.20%。由此一結果本研究道路破損的部份決定採用 YOLOv3 作為網路架構。

表 4-17 YOLOv3 模型訓練結果

WL P RL CD YL BC TC AC LC None

WL 73 0 0 0 0 0 0 0 0 178

P 0 113 0 0 0 0 0 3 0 120

RL 0 1 11 0 4 0 0 0 0 98

CD 1 1 0 0 0 0 0 0 0 2

YL 0 0 0 0 54 0 0 0 0 221

BC 0 0 0 0 0 0 0 0 0 0

TC 0 0 0 0 0 0 0 0 0 3

AC 0 0 0 0 1 0 0 143 1 319

LC 0 0 0 0 0 0 0 0 0 19

None 104 12 15 0 72 0 0 111 0 x

 使用 YOLOv3 網路，追加上街景車照片

取得街景車照片後追加進訓練資料。相較於新北市政府網站上之照片，其照片大小固定為4000*6000 pixel，照片解析度極高，由於照片解析度過高會造成進行訓練用之電腦負荷不了，因此需先將照片進行縮放至2000*3000 pixel。TP 為 1486，FP 為 1341，FN 為 5507。Precision 為 52.56%，Recall 為 21.25%。

表 4-18 使用新北市政府網站照片加上街景車照片訓練結果

WL P RL CD YL BC TC AC LC None

WL 110 0 0 0 0 0 0 3 0 997

P 1 627 0 0 0 0 0 1 0 263

RL 0 0 3 0 1 0 0 0 0 87

CD 1 0 0 0 0 0 0 0 0 3

YL 1 0 2 0 72 0 0 0 0 715

BC 0 0 0 0 0 0 0 0 0 0

TC 0 0 0 0 0 0 21 0 1 434

AC 0 1 0 0 0 0 5 658 8 2165

LC 0 2 0 0 0 0 0 2 44 843

None 247 166 12 0 183 0 44 495 119 x

 使用 YOLOv3 網路，使用分割辨識，資料集重設

在使用街景車照片之前提下，檢查結果照片發現相較於整張街景車照片，較小目標(約 50x50 pixel 以下)幾乎無法辨識，因此本研究預計採用一簡單之分割方法，將畫面分為四等分以及九等分。如圖4-5 所示。

圖 4-5 分割示意圖

包含原本圖像，共進行十四次辨識。之所以同時使用四等分與九等分，是為了避免在分割時發生目標物被切割開來之狀況。在分類結果部分，四等分與九等分所辨識出來的區域會先分別計算每個類別中目標框與目標框之間的 IOU。當 IOU 大於 80%時，則會捨棄兩目標框中 Objectness 較低之目標框，用以避免重複判定之情況。並且考量到資料集數量中，Block Crack 數量較少，決定在本次實驗中移除此項。Tranverse Crack 和 Longitudinal Liner Crack 此二項數量也較少，一為縱向一為橫向，將此併為一項 Liner Crack。最後是 Crosswalk Damage 併至 White Line Damage 中，並將 Red Line Damage 跟 Yellow Line Damage 一同併至White Line Damage，重新定義為 Line Damage。最後標籤內容剩下四項Potholes、Alligator Crack、Line Damage、Liner Crack。TP 為 644，FP 為540，FN 為 1646。Precision 為 54.39%，Recall 為 28.12%。

表 4-19 使用分割辨識結果

 使用 YOLOv3 網路，限縮照片區域

本研究檢查上一實驗所產生之結果照片，發現較小目標物被檢測出來，但是來自於其他種類的誤判，如電線桿上之電線，或者是樹枝影子等等，數量也提升許多。為了抑制此一類誤判，因此使用了限縮街景車照片區域之作法，如圖 4-1 所示，將範圍限縮於照片 1/4 的區域，此一區域基本上僅含有道路區塊，且不含有街景車以及天空等不需要之資訊。

TP 為 694，FP 為 389，FN 為 1603。Precision 為 64.08%，Recall 為 30.21%。

圖 4-6 照片區域變更示意圖

P AC LD LC NONE

P 294 0 0 2 568

AC 0 237 0 0 387

LD 1 0 36 2 93

LC 7 0 3 77 598

NONE 186 291 15 33 x

表 4-20 限縮照片區域進行訓練結果

實驗結果整體上而言表現較差，本研究推測出幾種可能會造成此一結果的原因：

(1) 標籤條件不一：由於本次研究，道路破損辨識的部分是與日陞空間資訊合作，標籤的部分是由日陞空間資訊負責，同時請了好幾個人進行標籤，標籤的定義不一。類似的龜裂標籤狀況分成了兩種，一種是標了整塊，一種是分成了好幾塊。

(2) 計算方式與現實狀況不符：計算預測是否為實際標籤的時候，使用的計算是預測與實際標籤的 IOU 大於 80%，但由於第一項所提到的問題，造成預測可能只判斷了某一小塊，而標籤是一大塊，IOU 低於 80%，

因此將此一預測判定為FP 或 FN。

P AC LD LC NONE

P 328 0 0 2 534

AC 0 233 0 0 391

LD 0 0 42 1 90

LC 3 0 3 91 588

NONE 144 191 14 31 x

在文檔中以深度學習為基礎之路面破損與閥栓檢測系統 (頁 51-59)

第四章 實驗流程與結果討論

4.2 道路破損檢測

第四章實驗流程與結果討論