第三章 研究設計
第一節 建立階層式辨識結構
為了將多個類別轉換成兩個類別的問題,原先的研究指出在建立階層式辨識 結構時裡使用了最大切集法,在辨識過程中使用支撐向量機辨識器,其效果是 損失了一點點的分類正確率但有較快的運算速度。但若是在最大切集法裡使用 不同的型式來建立階層式辨識結構,是否會對最後的辨識效果有所差別?所以 本研究除了使用原本的方法,並提出兩種切集方式來建立階層式辨識結構。
壹、 使用類別的中心點於最大切集法來建立階層式辨識結構
原先的研究提出,階層式辨識結構是利用資料裡類別的中心點來表示一個類 別,利用每個類別中心點之間的距離來當作其參數,並使用最大切集法來建立 階層式辨識結構。本研究稱此方法為 max-cut based on Euclidean distance method, 簡稱 Max-cut-EDM。
貳、 使用類別間的分散度於最大切集法來建立階層式辨識結構
利用最大切集法來做分割時,當資料裡類別的中心點來代表一個類別,並且 比較類別與類別之間的距離,取出類別間的最大距離來加以分割。但使用最大 切集法時會遭遇到一個問題,當資料的型態是一種非常態的分布時(如圖 2-6),
此方式未免會有失真的情形。所以本研究提出了使用無參數加權特徵萃取內組 內分散度矩陣的反函數乘上組間分散度矩陣的跡數(trace)來取代距離的方式,原
因 就 是 為 了 使 用 類 別 與 散 取 代 類 別 與 類 別 之 間 的距離。稱此方法為 max-cut based on nonparametric weighted separability method, 簡稱 Max-cut-NWSM。
如下圖,以三個類別為例,在高維度資料中常會遇到非常態分布型態 的 情 摺交互驗證法(5-fold cross validation)用以找到最佳的切集。但是可能會找到數
類 別 之 間 的 分 度(separability)來
Class2 Class3
個相同驗證率的切集,所以再加入第二種閾值(threshold),即為無參數加權特徵 萃取的組內分散度矩陣的反函數乘上組間分散度矩陣的跡數,以期有比 87.7%
更高的機率來尋找最佳的切集,並能有效的提升辨識正確率。稱為 Max accuracy based on k-fold cross validation method, 簡稱 Max-acc-CVM。
表 3-1 本研究所使用建立階層式辨識結構方法之簡稱
全名 簡稱 說明
Max-cut based on 利用最大切集法來找尋類
建立階層式辨識結構 Euclidean distance
method,
Max-cut-EDM 別間中心點的最大距離,並 Max-cut based on
WSM
利用最大切集法來找尋類 別間的最大分散度,並建立
階層式辨識結構 nonparametric weighted
separability method
Max-cut-N racy bas
Max Accu ed on k-fold cross validation
method
Max-acc-CVM 利用最大正確率切集法建 立階層式辨識結構
第二節 階層式辨識系統
本研究將特徵萃取、階層式辨識結構及辨識器組合而成的三種不同的階層式 辨識系統,各稱為階層式辨識系統一(hierarchical classification 1, HC 1)、階層式 辨識系統二(hierarchical classification 2,HC 2)及階層式辨識系統三(hierarchical
a 統
融 入 階 層 式 辨 稱 為 階 層 式 最 大 概 似 辨 al maximal kelihood classifier, HML) , 階 層 式 最 近 相 鄰 法 辨 識 器 (hierarchical
器(hierarchical supp
classific tion 3,HC 3)。在階層式辨識系 識 系 統 中 ,
的測試過程中,將三種不同的辨識器 識 器(hierarchic
li
k-nearest-neighbor classifier, HkNN) 及 階 層 式 支 撐 向 量 機 辨 識
ort vector machine classifier)。以下介紹階層式辨識器系統及其演算法流程 圖。
壹、 階層式辨識系統一
首先介紹 HC 1 測試過程(圖 3-3)。利用切集法完成階層式辨識結構之後,將 測試樣本丟入其中。在每一個節點內皆有一個辨識器,並利用辨識器的特性將 測試樣本判給其適合的節點裡。若所分到的節點內所包含的類別數大於一個類 別時,就一直分下去,直到分到的節點裡只剩一個類別時即停止。
圖 3-3 HC 1 的測試過程示意圖
2 5 3
(2) (3) (1)
以下是 HC 1 的演算法,流程圖如圖 3-4。
Step1: 在高維度資料上,在訓練樣本裡利用切集法建立階層式辨識結構。
Step2: 將測試樣本丟入已完成的階層式辨識結構中,其過程如圖 3-3 所 示,最後得到其辨識正確率。即完成 HC 1。
1 4 6 7
(4) (5)
(6)
Hierarchical Classification
Classifier
圖 3-4 HC 1 演算法流程圖
貳、 階層式辨識系統二
圖 3-5 為 HC 2 的測試過程。在根節點內做特徵萃取去降低維度數。HC2 的 主 要 概 念 是 要 將 在 原 始 空 間 下 的 資 料 轉 換 到 特 徵 空 間 之 下 , 其 辨 識 的 結 構 跟 HC1 是相同的。
圖 3-5 HC 2 的測試過程示意圖
1 4 2 5 3 6 7
(4) (5) (6)
(2) (3)
n
Hierarchical Classification FE
Classifier Original training data
Step 1
Using cut methods to build HC Testing data
Step 2 HC 1 testing process
以下是 HC2 的演算法,流程圖如圖 3-6。
Step1: 在高維度資料上,將訓練樣本轉換到以特徵萃取所萃取出的維度空 間中。
Step2: 將轉換以特徵萃取所萃取出的維度空間中的訓練樣本,
建立階層式辨識結構的方法。
Step3: 將測試樣本丟入已完成的階層式辨識結構 HC2 如圖 3-5 所示,並得到最後的辨識正確率。
利用切集法
裡,在測試過程中
圖 3-6 HC 2 演算法流程圖
Original training data
Using cut methods to build HC
HC 2 testing process Feature Extraction
Testing data
Transformed Data Step 1
Step 2
Step 3
參、
圖
將 會 對 測 試 樣 本 做 兩 個 類 別 的 特 徵 萃 取(2-classes feature extraction,2-classes FE),
點內,其包含的類別數大於一個類別時 一
直分下去,直到分到的節點裡只剩一個類別時即停止。
圖 3-7 HC 2 的測試過程示意圖
以下是 HC 3 的演算法,流程圖如圖 3-8。
Step1: 在高維度資料上,將訓練樣本轉換到以特徵萃取所萃取出的維度空 間中。
Step2: 將特徵萃取所萃取出的維度空間中的訓練樣本,利用切集法建立階
階層式辨識系統三
3-7 在 HC 3 測試過程裡,將特徵萃取與辨識器結合,在每一個節點裡都
再使用辨識器來做判別,並將測試樣本判給其適合的節點。若所分到的節
,就依特徵萃取與辨識器結合的方式
1 4 2 5 3 6 7
q r s
o p
n
Hierarchical Classification
2-classes FE
Classifier
層式辨識結構的方法。
Step3 將測試樣本丟入已完成的階層式辨識結構 HC3 裡,在測試過程中 如圖 3-7 所示,最後得到其辨
圖 3-8 HC 3 演算法流程圖
:
識正確率。
Original training data
Using cut methods to build HC
HC 3 testing process Feature Extraction
Transformed Data Step 1
Step 2
Step 3 Testing data