卷積神經網路研究背景

第二章文獻探討

第四節卷積神經網路研究背景

此種方法相較於 k-平均考慮了物體的方向性，在對於方向不固定的物體有較好的效果但是也無法真正解決物體重疊問題，因此在方法的選擇下本研究還是使用 k-平均來實作物體追蹤。

第四節卷積神經網路研究背景

在影像辨識，深度學習中的卷積神經網路有非常強大的學習能力，有非常好的分類結果 [12][13][26][27][28][29][30][31][32]，許多分類模型也是由此作為基礎去延伸，主要包含三層，卷積層 (Convolution Layer)、池化層 (Pooling Layer)、全連接層 (Fully Connected Layer)，並加入激活函數解決一些非線性問題

將複雜問題簡單化。

2.3.1 卷積層 (Convolution Layer)

卷積是一種運算方式，將原始圖片與特定的濾波即為卷積，運算符號為 ，

而影像可視為一個二維像素矩陣，並和核心矩陣卷積，而可以得到一個新的特徵影像，影像卷積運算如圖 2。

(a)卷積運算 (b) 原始影像 (c) 卷積後影像圖 2 : 影像卷積

這種特徵汲取方式會透過核心矩陣的不同有好幾種結果，而卷積層就是透過這種方式，利用大量不同的核心矩陣來獲得原始影像中不同的特徵，圖 3 採用邊界補 0 來維持卷積後的影像大小，若不使用邊界補 0 則長寬皆會減少 2。

2.3.2 激活函數 (Activation Function)

常見的激活函數有四種，加入非線因素，使神經網路可以逼近任意函數，第四種為線性整流函數（Rectified Linear Unit, ReLU），最常被使用於圖像辨識，

將一部分神經元輸出為 0 來減少參數相依性，取值範圍為[0, ∞)其函式為:

𝑓(𝑧) = 𝑚𝑎𝑥 (0, 𝑧) (14) 在本篇研究以線性整流函數為主要激活函數，並在分類時使用 S 曲線函數幫助二分類，由此達到快速收斂的效果。

2.3.3 池化層 (Pooling Layer)

利用最大池化 (Max Pooling) 挑出矩陣當中的最大值，有濾波抗雜訊、保留主要特徵功能，可以適應平移、旋轉與放大縮小，會接在卷積層與激活函數進行運算，其影像池化運算結果如圖 3。

(a)池化運算 (b)卷積後影像 (c)池化後影像圖 3 : 影像池化

池化層後的影像大小會因池化取值矩陣的大小而改變，一般池化取值矩陣會設定為二階方陣。以圖 3 為例，池化取值矩陣為二階方陣，因此輸出的影像結果比起原始影像大小會減半。然而在深度學習中，在接入全連接層之前，卷積層與池化層通常會不只一層，會透過多層次適當地疊加卷積層、激活函數與池化層來擷取大量資料特徵，由此而得到非常好的學習效果，故稱為深度學習，

而在影像方面，通常會先擷取感興趣區域再接入卷積神經網路，以便加快收斂速度與省去大量權重調整的時間 [12][13]，調整權重的時間往往遠大於擷取感興趣區域的時間。

2.3.4 全連接層 (Fully Connected Layer)

在接入全連接層之前，必須先將影像矩陣平坦化成為一維矩陣才可以接到最基本人工神經網路 (Artificial Neural Network, ANN)，亦可稱為多層感知器 (Multilayer Perceptron, MLP)，全連接層會將所有的特徵給予權重並分類，如圖 4，

而前面因為有卷積層的層層疊加緣故，所以整個網路稱為卷積神經網路。

圖 4 : 全連接層

在輸入層會接收影像平坦化的一維資料，並將接收到的所有資料發送給隱藏層中所有的神經元，而隱藏層即是多層感知器的核心，可以結合激活函數來近似任意複雜的函數，並將結果發送給給題目訂定的輸出單元數目。此全連接層作為卷積神經網路的尾端，在此層有許多的參數需要調整，選擇適合訓練模型的最佳化演算法，必然是最重要的事情。

在文檔中基於邊緣計算和深度學習之病媒蚊分類系統 (頁 16-20)

第二章 文獻探討

第四節 卷積神經網路研究背景

第四節 卷積神經網路研究背景

2.3.1 卷積層 (Convolution Layer)

2.3.2 激活函數 (Activation Function)

2.3.3 池化層 (Pooling Layer)

2.3.4 全連接層 (Fully Connected Layer)

第二章文獻探討

第四節卷積神經網路研究背景

第四節卷積神經網路研究背景