支撐向量機 SVM 理論 [7,22]

控制中心

三、支撐向量機 SVM 理論 [7,22]

支撐向量機是Vapnik[23]等人根據統計學理論提出的一種新的通用學習方法，它是建立在統計學理論的VC維（Vapnik　Chervonenks Dimension）理論和結構風險最小原理(Structural Risk Minimization Inductive Principle)基礎上的，能較好地解決小樣本、非線性、高維數和局部極小點等實際問題[22,…,31]，已成為機器學習界的研究熱門重點之一，並成功的應用於分類、函數逼近和時間序列預測等方面[32,…,35]，而變壓器故障之油中氣體診斷問題也可以看作是一種對油中氣體成分、濃度及其影響因子間的複雜的非線性函數關係的逼近問題，基於上述考慮，本文將以支撐向量機理論引入變壓器故障診斷之中。

支撐向量機 [7,22,36]是建立在機器學習理論的結構風險最小化原則之上，其主要思想是針對二元分類問題，在高維度空間中尋找一個超平面作為二類的分割，以保證最小的分類錯誤率，而且SVM 一個重要的優點就是能處理線性不可分的情況。

從幾何上說，支撐向量機就是要在 n 維空間中尋找最佳決策面，

該決策面能最好的區分正例和反例，使正例和反例之間的分類間隔最大，SVM的基本思想可用正例和反例線性可分的情況來說明，而對於非線性問題，則可以經由非線性變換轉化為某個高維度空間的線性問題，在變換空間中尋找最佳的分類面。

SVM方法具有非常堅實的理論基礎，SVM訓練的本質是在解決一個二次規劃（QP）問題，得到全域最佳解，還使它有著其他統計學習技術難以比擬的優越性。SVM分類器具有非常好的分類效果，是最好的分類器之一。

SVM 利用目前現有的資料作訓練，再利用這些分析出的資料選出幾個支撐向量來代表整體的資料，並將少部份極端值事先剔除，然後將所挑選的支撐向量包裝成模型。

當支撐向量機被運用來估計迴歸方程時有三個比較獨特的特性：

第一：支撐向量機估計迴歸時，使用了定義在高維度空間中之線性方程式的集合。

第二：支撐向量機藉著結構風險最小化的原則實現了迴歸估計的功能，且此結構風險將使用Vapnik 的ε—不敏感損失函數來加以估計。

第三：支撐向量機使用了由經驗誤差和結構風險最小化原則所導出的懲罰項(regularization term)所組合而成的風險函數(Tay and Cao, 2001b)[37]。

3.1 支撐向量機的基本原理[7,22,37]

支撐向量機是從線性可分情況下的最佳分類面發展而來的，也是統計學理論中最實用的部分，其基本思想可用圖3-1的兩維情況說明。

圖中，實心點和空心點各代表兩類樣本，H為分類超平面，H1，H2分別為過各類中離分類超平面最近的樣本，且平行於分類超平面的平面，

它們之間的距離叫做分類間隔（margin），所謂最佳分類面就是要求分類面不但能將兩類正確分開（訓練錯誤率為0），而且使分類間隔最大。距離最佳分類超平面最近的向量稱為支撐向量。

H1 H H2

分類間隔

圖3-1線性可分情況下的最佳分類面

假設若有測試的資料作預測時，SVM 就會將資料歸類，利用將資料分成兩類，判斷式如下定義y值：

設存在訓練樣本有n維向量，某區域的

l

個樣本及其所屬的分類表示為

( x

, y

), … , ( x

, y

), x ∈ R

ⁿ

, y ∈ + − { 1, 1}

l

為樣本數，

n

為輸入維度，

x

_i為訓練樣本，

y

_i為對於

x

_i輸入樣本之分類結果（1或-1）。

在線性可分情況下，存在一個超平面H能將二類樣本完全分隔該平面描述為：

(

w

x

) +

b

= 0 （3-1）

其中w為權重值，b為偏權值

分類方式如圖3-2～圖3-8，其中圖3-3、圖3-5為原始樣本點，在此共有3組不同性質的樣本數據，構成三維空間，圖3-4及圖3-6則為前述樣本點可能的分類超平面：

（3-2）

1 1

i i

w x b y

+ ≥ + = +

+ ≤ − = −

i i

若若

圖3-2 分類超平面

圖3-3 原始樣本點

圖3-4 分類超平面

圖3-5 原始樣本點圖3-6 分類超平面

圖3-7 分類超平面圖3-8 線性分類

從上圖可簡述線性分類的概念，當有一群的資料可以利用直線將資料區分成兩類，此直線的方程式為

( w x i ) + b = 0

，而Support Vector 在直線的左邊為一群，在右邊類公式決定。由這個例子可了解SVM 分類的原理。

可將上述不等式的規範形式合併

的為一群，依分

為如下緊湊型式

( ) 1 1, 2, ,

w x i

+ b ≥ i = … l

y

_（3-3）

（3-4）

的鬆弛變量（Slack variable）

，

式差，C為正值懲罰常數（Regularized 懲罰

3.2.支撐向量機的迴歸算法及其實現

[6,36,37]

在文檔中利用GSM資料收集模組與多層支撐向量機分類器建構電力變壓器故障診斷系統 (頁 48-54)

控制中心

三、 支撐向量機 SVM 理論 [7,22]

l

( x

, y

), … , ( x

, y

), x ∈ R

, y ∈ + − { 1, 1}

l

n

x

y

x

w

x

b

1 1

1 1

w x b y

w x b y

+ ≥ + = +

+ ≤ − = −

i i

若 若

( w x i ) + b = 0

( ) 1 1, 2, ,

w x i

+ b ≥ i = … l

y

3.2.支撐向量機的迴歸算法及其實現

三、支撐向量機 SVM 理論 [7,22]

若若