• 沒有找到結果。

卷積神經網路研究背景

第二章 文獻探討

第四節 卷積神經網路研究背景

此種方法相較於 k-平均考慮了物體的方向性,在對於方向不固定的物體有較好 的效果但是也無法真正解決物體重疊問題,因此在方法的選擇下本研究還是使 用 k-平均來實作物體追蹤。

第四節 卷積神經網路研究背景

在影像辨識,深度學習中的卷積神經網路有非常強大的學習能力,有非常 好的分類結果 [12][13][26][27][28][29][30][31][32],許多分類模型也是由此作為 基礎去延伸,主要包含三層,卷積層 (Convolution Layer)、池化層 (Pooling Layer)、全連接層 (Fully Connected Layer),並加入激活函數解決一些非線性問題

將 複 雜 問 題 簡 單 化 。

2.3.1 卷積層 (Convolution Layer)

卷積是一種運算方式,將原始圖片與特定的濾波即為卷積,運算符號為 ,

而影像可視為一個二維像素矩陣,並和核心矩陣卷積,而可以得到一個新的特 徵影像,影像卷積運算如圖 2。

(a)卷積運算 (b) 原始影像 (c) 卷積後影像 圖 2 : 影像卷積

10

這種特徵汲取方式會透過核心矩陣的不同有好幾種結果,而卷積層就是透 過這種方式,利用大量不同的核心矩陣來獲得原始影像中不同的特徵,圖 3 採用 邊界補 0 來維持卷積後的影像大小,若不使用邊界補 0 則長寬皆會減少 2。

2.3.2 激活函數 (Activation Function)

常見的激活函數有四種,加入非線因素,使神經網路可以逼近任意函數, 第四種為線性整流函數(Rectified Linear Unit, ReLU),最常被使用於圖像辨識,

將一部分神經元輸出為 0 來減少參數相依性,取值範圍為[0,)其函式為:

𝑓(𝑧) = 𝑚𝑎𝑥 (0, 𝑧) (14) 在本篇研究以線性整流函數為主要激活函數,並在分類時使用 S 曲線函數幫助 二分類,由此達到快速收斂的效果。

11

2.3.3 池化層 (Pooling Layer)

利用最大池化 (Max Pooling) 挑出矩陣當中的最大值,有濾波抗雜訊、保留 主要特徵功能,可以適應平移、旋轉與放大縮小,會接在卷積層與激活函數進 行運算,其影像池化運算結果如圖 3。

(a)池化運算 (b)卷積後影像 (c)池化後影像 圖 3 : 影像池化

池化層後的影像大小會因池化取值矩陣的大小而改變,一般池化取值矩陣 會設定為二階方陣。以圖 3 為例,池化取值矩陣為二階方陣,因此輸出的影像結 果比起原始影像大小會減半。然而在深度學習中,在接入全連接層之前,卷積 層與池化層通常會不只一層,會透過多層次適當地疊加卷積層、激活函數與池 化層來擷取大量資料特徵,由此而得到非常好的學習效果,故稱為深度學習,

而在影像方面,通常會先擷取感興趣區域再接入卷積神經網路,以便加快收斂 速度與省去大量權重調整的時間 [12][13],調整權重的時間往往遠大於擷取感興 趣區域的時間。

12

2.3.4 全連接層 (Fully Connected Layer)

在接入全連接層之前,必須先將影像矩陣平坦化成為一維矩陣才可以接到 最基本人工神經網路 (Artificial Neural Network, ANN),亦可稱為多層感知器 (Multilayer Perceptron, MLP),全連接層會將所有的特徵給予權重並分類,如圖 4,

而前面因為有卷積層的層層疊加緣故,所以整個網路稱為卷積神經網路。

圖 4 : 全連接層

在輸入層會接收影像平坦化的一維資料,並將接收到的所有資料發送給隱藏 層中所有的神經元,而隱藏層即是多層感知器的核心,可以結合激活函數來近 似任意複雜的函數,並將結果發送給給題目訂定的輸出單元數目。此全連接層 作為卷積神經網路的尾端,在此層有許多的參數需要調整,選擇適合訓練模型 的最佳化演算法,必然是最重要的事情。

13

相關文件