• 沒有找到結果。

第二章 文獻探討

第五節 Support Vector Machine

支持向量機(Support Vector Machine)是根據統計學習理論為基礎,所提出的一種機 器學習方法, 最初 SVM 是做為解決二元分類問題的應用,而其實際的應用在分類技術 上,SVM 有著不錯的表現,因此,SVM 成為現在機械學習(machine learning)與資料開 採(data mining)標準工具之一。機器學習:結合了統計、數學與資訊科學等,研究如 何讓電腦具有學習的能力。

二、SVM 的分類概念

支持向量機(Support Vector Machine)是一種應用線性分類(Linear Classification) 的概念,目的在於尋找一個可以使得所有訓練用而且已經分類好的資料在初始特徵空間 (Initial Feature Space)中,透過映射(Mapping)可以將不同類別(class)清楚分開的 超平面(hyperplane),就像是對於及格與不及格的定義,我們可以用和及格與不及格關 聯性最高的分數列為基準,讓支持向量機將此分數列作為分類的重要參考依據。

18

圖 21: 初始特徵空間(Initial feature space)

圖 22: 初始特徵空間映射至高維空間(higher dimensional space)

支持向量機(Support Vector Machine)利用在訓練資料集(Training data set)中的向 量點(vectors)來找到超平面(hyperplane),以用來將資料分類。構成超平面

(hyperplane),最大邊界的訓練資料點,稱為特徵向量(Super vectors),也就是在分 類上給予最多資訊的點。因為需要訓練資料,所以 SVM 也是一種監督式學習(supervised learning)的方法。

19

三、SVM 的多元分類

前面提到最初 SVM 是做為解決二元分類問題的應用,而其實際的分類應用,經常面 對不止兩類的分類。對此本論文所使用多元分類策略為一對一(one against one),對 任意兩個類別進行 svm 分類,以二元樹的概念,進行分類辨識,如圖 23 所示。

圖 23:一對一分類

由樹的底層包含了所有的分類類別,由底層開始,進行分類辨識,第一次的分類結果為 2、3 類別,由 2、3 類別進行分類,最後得出分類結果為 2。

四、Libsvm

本論文將透過數位影像處理所擷取出的手部物件,將其轉換為特徵向量,做為 SVM 運用於 ASL 手語樣板數位影像辨識系統之成效研究。這正是本論文選取 SVM 作為分類辨 識基準的決定因素之ㄧ。對此,本論文是使用臺灣大學林智仁博士等人(Chang& Lin,

2012)所開發的一套 Libsvm,作為分類辨識的基準。對於 Libsvm 分類,林智仁博士有以 下建議流程。

Libsvm 分類流程:

Step01:將資料轉換為 Libsvm 所支持的格式

20

Step02:將訓練資料、測試資料做尺度調整 (Svm scale) Step03:選擇效能較佳的 RBF kernel

Step04:利用交叉驗證 (Cross validation)選擇較佳參數 Step05:使用找到的參數做訓練模型 (Train model) Step06:將測試資料轉化預測資料(Predict data)

libsvm 所支持的格式即為:<Label> <Index1>:<Value1> <Index2>:<Value2> … Label 對於訓練集而言是目標值,對於測試集而言是標記分類的整數,通常為實數。

Index 代表資料的索引,例如:第一筆訓練集的資料或第一筆測試集的資料。Value 代 表資料的特徵值。將資料集做尺度調整 (Svm scale)的原因在於避免特徵值的範圍過大 或者過小,因而造成 svm 的運算困難。對於交叉驗證 (Cross validation),Libsvm 提 供了 grid.py tool 以暴力法進行參數最佳化的測試選擇。RBF kernel 為 Radial basis function 對於映射函數做內積所得到的函數。預測資料 (Predict data)即為 Libsvm 經由訓練(Training) 所得到訓練模型(Train model),對於尚未有所分類的資料,Libsvm 使用先訓練模型(Train model)去建立這筆資料所屬的分類預測資料 (Predict data),

以進行辨識。

第六節 手部數位影像辨識相關文獻 一、應用數位影像處理與辨識技術辨識

近幾年手勢辨識研究(Flasin´& lin´,2010)、(J.W.Han&G.Awad,A.Sutherland,2009)、

(Chang& Chang&Chung,2011)、(H.-D.Yang&S. Sclaroff&S.-W Lee,2009)等研究是應 用膚色保留的方式,先對於整張數位影像進行膚色偵測,將接近膚色的物件保留下來,

再加以判斷是否為手勢,而膚色偵測較常使用的色彩空間,有 YCbCr 與 HSV 等,應用色 彩空間的轉換計算做為膚色偵測的方式,而所應用的辨識技術也不盡相同,以下探討為 近幾年數位影像辨識研究,經常使用的演算法。

21

一、FFT 快速傅立葉轉換(Fast Fourier-Transform)

FFT 快速傅立葉轉換(Fast Fourier-Transform)對於特徵向量的擷取方式,是 經由 FFT 演算法運算之後,將特徵向量轉換為頻率向量後,求出頻率向量中各分量 的強度,最後再取成自然對數,進而成為有著 256 個頻率強度值的特徵向量。在[2]

研究中將類別特徵向量與測試特徵向量中的 256 個特徵值相減之後,取得對於各類 手勢的誤差值,再轉換對各類手勢所代表的機率,並以此機率為辨識基準。

表 1:FFT 三種辨識法手勢目標成功率測試影像非訓練資料與整體成功率 Hand-Pose No.

Overall

2-1 單純貝氏分類器(Naïve Bayesclassifier)

單純貝式分類器(Naïve Bayes classifier)[3]是一種監督式的學習方法,透 過訓練樣本的訓練學習,用以辨識未分類的測試樣本。單純貝氏分類器主要是根據 貝氏定理(Bayesiantheorem)來辨識分類的結果,P(Ai)為邊緣機率即為 A 事件發生 的機率,P(Ai|B)為在 B 事件的條件之下,A 事件會發生的可能性,而單純貝氏分類

22

三、應用影像感測器感測辨識 3-1Microsoft Kinect

Microsoft 所研發的 XBOX360 的遊戲把手 Kinect,具有捕捉深度資訊與人體偵 測的功能,應用影像感測器感測辨識,可以減少許多手勢辨識所需要做的數位影像 處理技術,(Vinayak &Murugappana&Liu&Ramania,2013)從深度資訊辨識手部的形 狀,能簡單的就消除背景與減少雜訊,進而減少辨識手勢所需要花費數位影像前處 理的時間,應用影像感測器感測辨識的缺點為需要增加額外的硬體成本。

圖 24: Microsoft Kinect

23

相關文件