• 沒有找到結果。

組合多尺度方均根值

第四章 特徵擷取方法之特性分析

4.5 多尺度方法

4.5.3 組合多尺度方均根值

另外,白雜訊的 MBSE 計算結果的平均值很固定,而且和其他多尺 度分析方法相比,計算結果的標準差也很小,與 4.4.1 的研究結果相符,

但計算 1/f 雜訊時,其計算結果的標準差卻很大,而且會隨著尺度增加 而大幅增加,因此多頻帶頻譜熵可能不適合用於處理含有 1/f 雜訊的訊 號,至於其他應用是否適合,則需要更多實驗才能得知。

圖 41 白雜訊與 1/f 雜訊之 MBSE 4.6 小結

本章前五節分別討論了樣本熵、頻譜熵、排序熵、RMS 以及多尺度方 法的特性,整體而言排序熵與頻譜熵所需要的資料點數最短(表 3),因此用 於多尺度分析時,大尺度計算不準的現象也較不明顯。訊號平均值的部分,

影響較多的演算法為頻譜熵與 RMS,而本論文研究的資料是機台振動的加 速度訊號,理論上均值應該為 0,因此在使用頻譜熵與 RMS 相關之演算法 時,應先濾除訊號的直流成分,以增加辨識的成功率。振幅影響的部分,除

2 4 6 8 10 12 14 16 18 20

0.75 0.8 0.85 0.9 0.95

scale

entropy

1/f noise-MBSE White noise-MBSE

視感測器增益的誤差,很適合用於機械振動錯誤診斷的領域,而 RMS 的相 關演算法則需要較精準的儀器調校,才能得到準確的結果,整理結果如表 4 所示。

多尺度分析的部分, RMS 本身的計算結果雖然不是很集中,但當尺度 逐漸增大時,計算結果並不會明顯變差,而 MPE 與 MBSE 則是在小尺度下 會有很集中的計算結果,但當尺度增加時,計算結果的標準差也會隨之增加,

最差的情況是出現在 MSE 計算 1/f 雜訊的時候,我們可以看到計算結果相當 分散(圖 38),而本論文提出的組合多尺度的方法,除了 MSRMS 計算 1/f 雜 訊時,改善效果不明顯之外,其他的演算法都可以看到改善的成效。

表 3 資料長度影響之比較

資料長度影響

⁄ ⁄

樣本熵 750 點 2200 點

頻譜熵 小於 128 點 小於 128 點

排序熵 小於 100 點 300 點

RMS 250 點 2100 點

表 4 平均值、振幅影響之比較

平均值影響 振幅影響

平均值 ⁄ 平均值 ⁄ 樣本熵 不影響 不影響 不影響 不影響 不影響 不影響

頻譜熵 降低 升高 升高 不影響 不影響 不影響

排序熵 不影響 不影響 不影響 不影響 不影響 不影響

RMS 正比 不影響 反比 正比 正比 不影響

第五章 特徵選取與支持向量機

在第五章中,將介紹兩種特徵選取的流程,並比較四種支持項量機的分 類架構,找出較適合本文使用的方法。

5.1 特徵選取

在訓練前先進行特徵選取是希望減少特徵的數量,減少特徵數主要有兩 個優點,因為訓練辨識模型的時間與所使用的特徵數高度相關,所以減少特 徵數可以有效降低訓練辨識模型的時間成本,再者特徵數過多時,會出現 over-fitting 的現象,也就是加入了太多不必要的特徵,反而使得辨識率下降,

本節中將介紹兩個特徵選取的方法,以選出有用的特徵。

5.1.1 Fisher score

Fisher score [26]可以用來計算第 k 個特徵對於辨識第 i 類與第 j 類的 重要性,其公式如式(32)

( )

(32)

√ ∑

其中 為第 i 類第 k 個特徵, 為第 i 類第 k 個特徵的平均值,

為第 i 類第 k 個特徵的標準差, 為第 i 類狀況的樣本數。計算出每 一個特徵的重要性後,再依重要性排序,並挑選出幾個重要性較高的特 徵作為辨識時使用的特徵,圖 42 為特徵選取流程的示意圖。此方法應 用於以 SVM 為核心的辨識系統時,可以針對不同的分類模型進行特徵 選取,找出每個分類模型適用的特徵,此流程有助於增加辨識率,並且 因為特徵數的減少,可以減少訓練模型及辨識所需的時間。

圖 42 特徵選取示意圖

5.1.2 Mahalanobis distance

Mahalanobis distance(MD)是 1936 年由印度的學者 Mahalanobis 所提 出的統計方法 [46],與 Fisher score 不同的是此方法考慮了兩個群體的相 關性,並且同時考慮多個特徵的影響,是一個多變量的分析方法,

Mahalanobis distance 的定義為:

(33) 其中 為的 i 類特徵的平均特徵向量, 的定義為:

(34)

在此 為第 i 類的樣本數, 為第 i 類的協方差矩陣 (covariance matrix)。

在實際應用上,Fisher score 的方法雖然可以單獨選出數個較具鑑別 度的特徵,但當這幾個特徵組合在一起時,往往未必是最佳的結果,由 於 Mahalanobis distance 是同時考慮多個特徵的鑑別度,因此可以選出較 佳的組合,但由於 Mahalanobis distance 需要計算 的反矩陣,而 又與特 徵數有關,若同時考慮多個特徵,則需要計算高階反矩陣,會花費很多 時間,而且若要從 p 個特徵中選出 q 個有用的特徵,其組合的情形共有

個之多,全面檢視所有組合情形的方法並不恰當。因此,本文設計了一 個基於 Mahalanobis distance 的特徵選取流程,若要從 p 個特徵中選出 q 個有用的特徵時,其步驟如下:

1、 令 n = p

2、 計算 n 個特徵所有組合情況的 MD 3、 保留 MD 最大的 n 個特徵

4、 令 n = n - 1

5、 重複步驟 2-4,直到 n = q 為止

利用上述流程,在步驟 2-4 的過程中逐次移除較不重要的特徵,直 到特徵數達到設定的目標為止。

5.2 支持向量機

支持向量機最原始的設計想法,是用來解決兩類資料的分類問題,希望 能藉由數學方法找出一個最佳的分類面(Hyper-plan)(圖 43),使兩類資料分 別位於分類面的兩側。若現在要分辨 + 和 - 兩類,並且有 l 筆訓練資料 ,其中 為第 i 個樣本的特徵, , 為 第 i 個樣本的類別, { },則 SVM 的模型 [29]如式(35),

{

(35)

其中訓練樣本 將被核函數 映射至高維度空間,而 C 為損失參數。最 小化 及意味著要最大化 ‖ ‖,也就是要最大化兩群資料間的裕

用以修正訓練時的錯誤量,因此若參數 越大,代表訓練資料會被分離的越 徹底,但兩群資料間的裕度便會下降。解方程式(35)後會得到決策函數:

(36)

以上是兩類資料分類時 SVM 的理論,而目前本論文要處理的是多類別 的分類問題,因此需要利用複數個 SVM 建構多類別辨識模型,以下介紹三 種 較 常 見 的 多 類 別 辨 識 模 型 , (1) One-against-one SVM 如 圖 44 ; (2) One-against-all SVM 如圖 45;(3)directed acyclic graph SVM(DAGSVM)圖 46;

(4) Hierarchical SVM 如圖 47。在四個架構中 Hierarchical 的機制所需的分類 器最少,只需要 N-1 個分類器,在辨識時,樣本可能在第一階的分類器就得 到辨識結果,但也有可能要通過 N-1 個 SVM 分類器才能得到正確結果。而 One-against-all 的機制則需要 N 個分類器,但在辨識時 N 個分類器可以平行 處理,因此辨識時間將不受樣本種類影響,可是這兩種架構因為用來訓練分 類器的樣本數比較多,而 SVM 分類器的訓練時間正比於樣本數的平方,因 此模型訓練的時間會較長;至於 DAGSVM 架構需要訓練 N(N-1)/2 個分類器,

在辨識時則會需要通過 N 個分類器才會得到結果;One-against-one 需要訓練 最多的分類平面( 個),且辨識時也要通過全部的分類器,再進行投票才會 得到結果,但過去的研究顯示,由 One-against-one 的辨識架構,所得到的辨 識率是最佳的 [29],因此在本論文中所有的實驗都會使用 One-against-one 的辨識架構。

圖 43 SVM 分類示意圖

圖 44 One-against-one SVM 架構圖

圖 45 One-against-all SVM 架構圖

圖 46 DAGSVM 架構圖

圖 47 Hierarchical SVM 架構圖

第六章 實驗設計與實驗結果

在第六章中,將設計三組實驗,並使用 CWRU 的軸承資料 [47]驗證本 論文的辨識系統。

6.1 CWRU 軸承資料

CWRU 軸承資料所使用的儀器如圖 48,包含 2 馬力的馬達,扭矩傳感 器、編碼器、測功計與控制電路,實驗軸承是選用 SKF 的深溝球軸承,驅 動端軸承的編號為:6205-2RS JEM,風扇端軸承的編號為:6203-2RS JEM,

損壞的軸承是以放電加工製造單點缺陷以模擬不同的錯誤情況,單點缺陷的 直徑為 7 mil、14 mil、21 mil,深度為 11 mil,錯誤情況分為六類:

1. 正常(Normal, N)

2. 滾珠損壞(Ball fault, B)

3. 內環損壞(Inner raceway fault, I)

4. 外環損壞於 3 點鐘方向(Outer raceway fault located at 3 o’clock, O3) 5. 外環損壞於 6 點鐘方向(Outer raceway fault located at 6 o’clock, O6) 6. 外環損壞於 12 點鐘方向(Outer raceway fault located at 12 o’clock,

O12)

並且共記錄四種不同負載(轉速)的實驗資料:

1. 負載 0 馬力,轉速 1797 rpm 2. 負載 1 馬力,轉速 1772 rpm 3. 負載 2 馬力,轉速 1750 rpm 4. 負載 3 馬力,轉速 1730 rpm

實驗時損壞的軸承將會被置於驅動端,而加速規則是置於風扇端馬達上,量 測 到 的 振 動 資 料 是 以 16 通 道 的 DAT 紀 錄 器 透 過 Matlab 環 境 存 成 Matlab(*.mat)的格式,數位訊號的取樣頻率為 48000 Hz,而實驗的轉速與馬

力則是由扭矩傳感器與編碼器量測之後以人工方式記錄。資料庫中 51 種不 同狀態的振動訊號,其時序的全貌,以及單一的片段的樣貌將呈現於附錄 A 中。

圖 48 實驗設備 [47]

6.2 實驗設計 6.2.1 實驗流程

為了驗證辨識系統,本研究將資料庫中 51 種錯誤狀態整理為 19 種 分類情況,用以確認系統在不同狀態下的一致性,但由於資料是一整段 的時序訊號,因此必須先將訊號進行切割,第四章中介紹了資料長度對 於各種演算法的影響,其中有幾個演算法需要樣本長度超過 2000 個點才 能有較好的結果,又因為頻譜熵演算法,有使用到快速傅立葉轉換,資 料長度必須為 2 的次方,因此實驗時將樣本長度設定為 211,也就是將每 一類的錯誤訊號都以 2048 個資料點的長度進行切割,分類情況的說明如 表 5,切割後的每種錯誤狀態的樣本數如表 6。完成樣本切割之後本論

實驗一是驗證單尺度、多尺度、組合多尺度分析的優劣。

實驗二則是比較第一組實驗中,效果較佳的 CMSE、CMPE 與混合 特徵(CMSE、CMPE、CMSRMS、MBSE)的辨識率,以及訓練量對辨識 率的影響。

實驗三是測試兩種不同特徵選取方法的優劣,因此會分別以 Fisher score 與 Mahalanobis distance 將特徵依重要性排序,之後固定 SVM 辨識 模型使用的特徵數,觀察特徵數增加時對辨識率的影響。

續表 3【分類情況說明】

6.2.2 特徵擷取結果

環境中的白雜訊能量是固定的,因此正常情況下整體的能量就比其他情況

圖 50 Ball fault 之 MSE 與 CMSE 擷取結果

圖 52 O3 之 MSE 與 CMSE 擷取結果

圖 54 O12 之 MSE 與 CMSE 擷取結果

圖 56 Normal 之 MPE 與 CMPE 擷取結果

圖 57 Ball fault 之 MPE 與 CMPE 擷取結果

2 4 6 8 10 12 14 16 18 20

0.75 0.8 0.85 0.9 0.95

entropy

scale N

N-MPE N-CMPE

2 4 6 8 10 12 14 16 18 20

0.65 0.7 0.75 0.8 0.85

entropy

scale B

B-MPE B-CMPE

圖 58 Inner raceway fault 之 MPE 與 CMPE 擷取結果

圖 60 O6 之 MPE 與 CMPE 擷取結果

圖 62 情況 1 六類錯誤 CMPE 擷取結果

圖 64 Ball fault 之 MSRMS 與 CMSRMS 擷取結果

圖 66 O3 之 MSRMS 與 CMSRMS 擷取結果

相關文件