特徵抽取與統計分析

第三章振鈴現象偵測演算法

3.6 特徵抽取

3.6.2 特徵抽取與統計分析

我們定義一個辨認特徵抽取的範圍，以8 × 8 當作一個區塊(block)，且每一個區塊並不重疊，如圖3-7 區塊分割示意圖。

8

而對於係數值較小的高頻部分較不敏感。所以我們取出亮度Y 的 DC 與 AC 值作為辨認的特徵。由於越往後的 AC 值代表的是越高頻的成分，跟前面的 DC 與 AC 值比起來更像是雜訊，不適合用來當分類依據的特徵。因此為了降低計算量與辨認效能起見，本系統在一個亮度的區塊取出 DC 值與前三個 AC 值，

共四個特徵。假設影像區域共有256 個區塊，則總共可以取出 1024 個特徵值。

將這些特徵值串成辨認的特徵向量 F，如圖 3-9。其中 f_i表示特徵值，i 表示維度，一張影像的最原始被抽出的特徵向量長度為1024 維。

圖3-9 特徵向量示意圖

接下來是特徵的統計分析，由於支持向量機的長處在於將兩個類別的特徵映射到高維度後，線性切割以辨認出兩個類別。所以我們先計算每個類別每個特徵維度的平均值，共有25 種類別。

統計出第1 類別之第 1 個維度的平均值 ，統計出第 1 類別之第 2 個維度₁¹ 的平均值 ，類推到第 1 類第 1024 維的平均值₁² ₁¹⁰²⁴。統計出第 2 類別之第 1 個維度的平均值 ，統計出第 2 類別之第 2 個維度的平均值¹₂  ，類推到第 2 類₂² 第1024 維的平均值 。同理類推到第 25 類的第 1024 維的平均值₂¹⁰²⁴  。其中₂₅¹⁰²⁴

 的 μ 代表平均值，i 代表維度，j 代表類別。 j

計算完平均值後接著計算每個類別之特徵維度的變異數。統計出第1 類別之第1 個維度的變異數 ，統計出第 1 類別之第 2 個維度的變異數₁¹  ，類推到₁²

計出第2 類別之第 2 個維度的變異數 ，類推到第 2 類第 1024 維的變異數₂²  。₂¹⁰²⁴ 同理類推到第25 類的第 1024 維的變異數¹⁰²⁴₂₅ 。其中 的 ν 代表變異數，i 代表ⁱ_j 維度，j 代表類別。ν 代表變異數(variations)。

當我們有了平均值與變異數後，計算同一個維度對不同類別之間的差異。

利用算出的平均值來計算差異值。計算出來的差異值越大表示兩類間差別越大。d_{m n}^k_, 表示平均值相減的平方。我們會得到(25×24) / 2 = 300 個不同兩類間差異的d 向量，如圖 3-10 所示。其中 k 表示所屬的特徵維度，下標的兩個數字 m、

n 表示所要分類的兩個類別。其中 d 的計算方式由(3-8)式得到：

( ) , for 1,...1024 1 , 25,

k k k

m n m n

d k

m n m n

 

  

  

^(3-8)

圖3-10 兩兩之間平均值差異的平方的向量示意圖

計算完d_{m n}^k_, 後，就可以利用剛剛產生的d_{m n}^k_, 與之前計算的變異數來計算可以用來區別兩類的特徵區別值ω，如圖3-11 所示。計算方法如(3-9)式。根據公式來看，若是同類之間的變異數越小，表示兩類之間自己與自己類越相像。而兩類間的d_{m n}^k_, 越大就表示這兩類越不像。因此，若是所計算出來的 ω 值越大，表 示這個值越可以區分出這兩類，這個特徵越重要。

, , /( ), for 1,...1024 1 , 25,

k k k k

m n dm n m n k

m n m n

    

   (3-9)

圖3-11 兩兩之間特徵區別值的向量示意圖

計算完兩類與兩類之間的特徵區別值ω 後，我們就可以知道針對不同的兩 個類別，哪一個特徵維度的特徵值是對於分辨這兩類有幫助的，值越大表示對於分類越有利。經過排序後我們就可以知道，如圖 3-12，使用哪幾個特徵維度是這兩類的最佳分類，其流程如圖3-13 所示。由於是兩類與兩類之間的分類，

針對不同的兩個類別取相對應此兩類的最佳分類特徵維度的做法就會比一般將所有類別一起訓練出一個分類模型的分類效果來的好，而且可以用到更少的特徵。取多少特徵維度來進行分類則是取決於當初訓練時最佳的分類結果是落在哪一個維度。若都很好時則取最少維度以減低計算量。

圖3-12 特徵維度排序

圖3-13 特徵維度選擇流程

在文檔中自動偵測振鈴現象於復原模糊人臉影像 (頁 57-63)

第三章 振鈴現象偵測演算法