組合多尺度方均根值

第四章特徵擷取方法之特性分析

4.5 多尺度方法

4.5.3 組合多尺度方均根值

另外，白雜訊的 MBSE 計算結果的平均值很固定，而且和其他多尺度分析方法相比，計算結果的標準差也很小，與 4.4.1 的研究結果相符，

但計算 1/f 雜訊時，其計算結果的標準差卻很大，而且會隨著尺度增加而大幅增加，因此多頻帶頻譜熵可能不適合用於處理含有 1/f 雜訊的訊號，至於其他應用是否適合，則需要更多實驗才能得知。

圖 41 白雜訊與 1/f 雜訊之 MBSE 4.6 小結

本章前五節分別討論了樣本熵、頻譜熵、排序熵、RMS 以及多尺度方法的特性，整體而言排序熵與頻譜熵所需要的資料點數最短(表 3)，因此用於多尺度分析時，大尺度計算不準的現象也較不明顯。訊號平均值的部分，

影響較多的演算法為頻譜熵與 RMS，而本論文研究的資料是機台振動的加速度訊號，理論上均值應該為 0，因此在使用頻譜熵與 RMS 相關之演算法時，應先濾除訊號的直流成分，以增加辨識的成功率。振幅影響的部分，除

2 4 6 8 10 12 14 16 18 20

0.75 0.8 0.85 0.9 0.95

scale

entropy

1/f noise-MBSE White noise-MBSE

視感測器增益的誤差，很適合用於機械振動錯誤診斷的領域，而 RMS 的相關演算法則需要較精準的儀器調校，才能得到準確的結果，整理結果如表 4 所示。

多尺度分析的部分， RMS 本身的計算結果雖然不是很集中，但當尺度逐漸增大時，計算結果並不會明顯變差，而 MPE 與 MBSE 則是在小尺度下會有很集中的計算結果，但當尺度增加時，計算結果的標準差也會隨之增加，

最差的情況是出現在 MSE 計算 1/f 雜訊的時候，我們可以看到計算結果相當分散(圖 38)，而本論文提出的組合多尺度的方法，除了 MSRMS 計算 1/f 雜訊時，改善效果不明顯之外，其他的演算法都可以看到改善的成效。

表 3 資料長度影響之比較

資料長度影響

⁄ ⁄

樣本熵 750 點 2200 點

頻譜熵小於 128 點小於 128 點

排序熵小於 100 點 300 點

RMS 250 點 2100 點

表 4 平均值、振幅影響之比較

平均值影響振幅影響

平均值 ⁄ 平均值 ⁄ 樣本熵不影響不影響不影響不影響不影響不影響

頻譜熵降低升高升高不影響不影響不影響

排序熵不影響不影響不影響不影響不影響不影響

RMS 正比不影響反比正比正比不影響

第五章特徵選取與支持向量機

在第五章中，將介紹兩種特徵選取的流程，並比較四種支持項量機的分類架構，找出較適合本文使用的方法。

5.1 特徵選取

在訓練前先進行特徵選取是希望減少特徵的數量，減少特徵數主要有兩個優點，因為訓練辨識模型的時間與所使用的特徵數高度相關，所以減少特徵數可以有效降低訓練辨識模型的時間成本，再者特徵數過多時，會出現 over-fitting 的現象，也就是加入了太多不必要的特徵，反而使得辨識率下降，

本節中將介紹兩個特徵選取的方法，以選出有用的特徵。

5.1.1 Fisher score

Fisher score [26]可以用來計算第 k 個特徵對於辨識第 i 類與第 j 類的 重要性，其公式如式(32)

( )

(32)

∑ ， √ ∑

其中 為第 i 類第 k 個特徵， 為第 i 類第 k 個特徵的平均值，

為第 i 類第 k 個特徵的標準差，為第 i 類狀況的樣本數。計算出每 一個特徵的重要性後，再依重要性排序，並挑選出幾個重要性較高的特徵作為辨識時使用的特徵，圖 42 為特徵選取流程的示意圖。此方法應用於以 SVM 為核心的辨識系統時，可以針對不同的分類模型進行特徵選取，找出每個分類模型適用的特徵，此流程有助於增加辨識率，並且因為特徵數的減少，可以減少訓練模型及辨識所需的時間。

圖 42 特徵選取示意圖

5.1.2 Mahalanobis distance

Mahalanobis distance(MD)是 1936 年由印度的學者 Mahalanobis 所提出的統計方法 [46]，與 Fisher score 不同的是此方法考慮了兩個群體的相關性，並且同時考慮多個特徵的影響，是一個多變量的分析方法，

Mahalanobis distance 的定義為：

(33) 其中 為的 i 類特徵的平均特徵向量，的定義為：

(34)

在此 為第 i 類的樣本數， ， 為第 i 類的協方差矩陣 (covariance matrix)。

在實際應用上，Fisher score 的方法雖然可以單獨選出數個較具鑑別度的特徵，但當這幾個特徵組合在一起時，往往未必是最佳的結果，由於 Mahalanobis distance 是同時考慮多個特徵的鑑別度，因此可以選出較佳的組合，但由於 Mahalanobis distance 需要計算的反矩陣，而又與特徵數有關，若同時考慮多個特徵，則需要計算高階反矩陣，會花費很多 時間，而且若要從 p 個特徵中選出 q 個有用的特徵，其組合的情形共有

個之多，全面檢視所有組合情形的方法並不恰當。因此，本文設計了一 個基於 Mahalanobis distance 的特徵選取流程，若要從 p 個特徵中選出 q 個有用的特徵時，其步驟如下：

1、 令 n = p

2、 計算 n 個特徵所有組合情況的 MD 3、 保留 MD 最大的 n 個特徵

4、 令 n = n - 1

5、 重複步驟 2-4，直到 n = q 為止

利用上述流程，在步驟 2-4 的過程中逐次移除較不重要的特徵，直到特徵數達到設定的目標為止。

5.2 支持向量機

支持向量機最原始的設計想法，是用來解決兩類資料的分類問題，希望能藉由數學方法找出一個最佳的分類面(Hyper-plan)(圖 43)，使兩類資料分 別位於分類面的兩側。若現在要分辨 + 和 - 兩類，並且有 l 筆訓練資料 ，其中 為第 i 個樣本的特徵， ，為 第 i 個樣本的類別， { }，則 SVM 的模型 [29]如式(35)，

∑

{

(35)

其中訓練樣本將被核函數映射至高維度空間，而 C 為損失參數。最小化及意味著要最大化 ‖ ‖，也就是要最大化兩群資料間的裕

用以修正訓練時的錯誤量，因此若參數越大，代表訓練資料會被分離的越徹底，但兩群資料間的裕度便會下降。解方程式(35)後會得到決策函數：

(36)

以上是兩類資料分類時 SVM 的理論，而目前本論文要處理的是多類別的分類問題，因此需要利用複數個 SVM 建構多類別辨識模型，以下介紹三種較常見的多類別辨識模型， (1) One-against-one SVM 如圖 44 ； (2) One-against-all SVM 如圖 45；(3)directed acyclic graph SVM(DAGSVM)圖 46；

(4) Hierarchical SVM 如圖 47。在四個架構中 Hierarchical 的機制所需的分類 器最少，只需要 N-1 個分類器，在辨識時，樣本可能在第一階的分類器就得 到辨識結果，但也有可能要通過 N-1 個 SVM 分類器才能得到正確結果。而 One-against-all 的機制則需要 N 個分類器，但在辨識時 N 個分類器可以平行 處理，因此辨識時間將不受樣本種類影響，可是這兩種架構因為用來訓練分類器的樣本數比較多，而 SVM 分類器的訓練時間正比於樣本數的平方，因 此模型訓練的時間會較長；至於 DAGSVM 架構需要訓練 N(N-1)/2 個分類器，

在辨識時則會需要通過 N 個分類器才會得到結果；One-against-one 需要訓練最多的分類平面( 個)，且辨識時也要通過全部的分類器，再進行投票才會得到結果，但過去的研究顯示，由 One-against-one 的辨識架構，所得到的辨識率是最佳的 [29]，因此在本論文中所有的實驗都會使用 One-against-one 的辨識架構。

圖 43 SVM 分類示意圖

圖 44 One-against-one SVM 架構圖

圖 45 One-against-all SVM 架構圖

圖 46 DAGSVM 架構圖

圖 47 Hierarchical SVM 架構圖

第六章實驗設計與實驗結果

在第六章中，將設計三組實驗，並使用 CWRU 的軸承資料 [47]驗證本論文的辨識系統。

6.1 CWRU 軸承資料

CWRU 軸承資料所使用的儀器如圖 48，包含 2 馬力的馬達，扭矩傳感器、編碼器、測功計與控制電路，實驗軸承是選用 SKF 的深溝球軸承，驅動端軸承的編號為：6205-2RS JEM，風扇端軸承的編號為：6203-2RS JEM，

損壞的軸承是以放電加工製造單點缺陷以模擬不同的錯誤情況，單點缺陷的直徑為 7 mil、14 mil、21 mil，深度為 11 mil，錯誤情況分為六類：

1. 正常(Normal, N)

2. 滾珠損壞(Ball fault, B)

3. 內環損壞(Inner raceway fault, I)

4. 外環損壞於 3 點鐘方向(Outer raceway fault located at 3 o’clock, O3) 5. 外環損壞於 6 點鐘方向(Outer raceway fault located at 6 o’clock, O6) 6. 外環損壞於 12 點鐘方向(Outer raceway fault located at 12 o’clock,

O12)

並且共記錄四種不同負載(轉速)的實驗資料：

1. 負載 0 馬力，轉速 1797 rpm 2. 負載 1 馬力，轉速 1772 rpm 3. 負載 2 馬力，轉速 1750 rpm 4. 負載 3 馬力，轉速 1730 rpm

實驗時損壞的軸承將會被置於驅動端，而加速規則是置於風扇端馬達上，量測到的振動資料是以 16 通道的 DAT 紀錄器透過 Matlab 環境存成 Matlab(*.mat)的格式，數位訊號的取樣頻率為 48000 Hz，而實驗的轉速與馬

力則是由扭矩傳感器與編碼器量測之後以人工方式記錄。資料庫中 51 種不同狀態的振動訊號，其時序的全貌，以及單一的片段的樣貌將呈現於附錄 A 中。

圖 48 實驗設備 [47]

6.2 實驗設計 6.2.1 實驗流程

為了驗證辨識系統，本研究將資料庫中 51 種錯誤狀態整理為 19 種分類情況，用以確認系統在不同狀態下的一致性，但由於資料是一整段的時序訊號，因此必須先將訊號進行切割，第四章中介紹了資料長度對於各種演算法的影響，其中有幾個演算法需要樣本長度超過 2000 個點才能有較好的結果，又因為頻譜熵演算法，有使用到快速傅立葉轉換，資料長度必須為 2 的次方，因此實驗時將樣本長度設定為 2¹¹，也就是將每一類的錯誤訊號都以 2048 個資料點的長度進行切割，分類情況的說明如表 5，切割後的每種錯誤狀態的樣本數如表 6。完成樣本切割之後本論

實驗一是驗證單尺度、多尺度、組合多尺度分析的優劣。

實驗二則是比較第一組實驗中，效果較佳的 CMSE、CMPE 與混合特徵(CMSE、CMPE、CMSRMS、MBSE)的辨識率，以及訓練量對辨識率的影響。

實驗三是測試兩種不同特徵選取方法的優劣，因此會分別以 Fisher score 與 Mahalanobis distance 將特徵依重要性排序，之後固定 SVM 辨識模型使用的特徵數，觀察特徵數增加時對辨識率的影響。

續表 3【分類情況說明】

6.2.2 特徵擷取結果

環境中的白雜訊能量是固定的，因此正常情況下整體的能量就比其他情況

圖 50 Ball fault 之 MSE 與 CMSE 擷取結果

圖 52 O3 之 MSE 與 CMSE 擷取結果

圖 54 O12 之 MSE 與 CMSE 擷取結果

圖 56 Normal 之 MPE 與 CMPE 擷取結果

圖 57 Ball fault 之 MPE 與 CMPE 擷取結果

2 4 6 8 10 12 14 16 18 20

0.75 0.8 0.85 0.9 0.95

entropy

scale N

N-MPE N-CMPE

2 4 6 8 10 12 14 16 18 20

0.65 0.7 0.75 0.8 0.85

entropy

scale B

B-MPE B-CMPE

圖 58 Inner raceway fault 之 MPE 與 CMPE 擷取結果

圖 60 O6 之 MPE 與 CMPE 擷取結果

圖 62 情況 1 六類錯誤 CMPE 擷取結果

圖 64 Ball fault 之 MSRMS 與 CMSRMS 擷取結果

圖 66 O3 之 MSRMS 與 CMSRMS 擷取結果

在文檔中旋轉機械線上監控與異常辨識系統 (頁 57-0)

第四章 特徵擷取方法之特性分析

4.5 多尺度方法

4.5.3 組合多尺度方均根值

第五章 特徵選取與支持向量機

第六章 實驗設計與實驗結果

第四章特徵擷取方法之特性分析

第五章特徵選取與支持向量機

第六章實驗設計與實驗結果