混合式系統(Hybrid System)

六、實驗結果(Experiment)

6.3. 混合式系統(Hybrid System)

本節將針對 Self-Learning 機制的分類器，混合多層級投票的方式後之結果加以討論，並討論影響其結果之因素。

6.3.1 分層

對於分層，這邊主要分為攻擊種類分層與分群分層兩種；對於攻擊種類分層，分別嘗試了分為兩層(DoS+Probe & U2R+R2L)及分為三層(DoS&

Probe& U2R+R2L) 之分類器，而演算法方面，則使用前一節所提到之演算法交叉測試，留下實驗結果最好之數據做為比較；而對於分群分層，對於 K-means 分群法之群數設定，則有 2~ 6 群之不同實驗，並且在每種群數之實驗中，皆會對 Random Seed 取不同之五個值，統計後留下最好的辨識結果作為統計比較。

而從圖 29 及圖 39 之圖表結果，可看出再混合多層機制後，無論是利用攻擊種類多層，或是分群多層、對於分類器的表現並沒有明顯的改進，且雖然在模型建立的訓練時間上，有長有短，並沒有過大的差異，但這並沒將做分群法的額外時間加入，因此若以分群多層，可能還會花去更多時間。

圖 31 混合多層機制下之實驗結果

圖 32 混合多層機制下之實驗結果

藉由這些實驗結果也說明了，分層後，反而會使得 Self-learning 所獲得的大量惡意樣本之優點遭到稀釋，使得整體結果的提昇不如預期，而由圖 31，則可更加驗證此想法，由圖可以看到，從 1~3 層，若未使用 Self-

Learning 的方法，其 Accuracy 在伯仲之間，但在採用 Self-Learning 機制後，反而是單一分類器的準確率提升的最多。

圖 33 混合多層機制下之結果比較

6.3.2 投票

投票機制的用途在於避免 Self-Learning 的過程因分類錯誤導致有過多錯誤樣本，使得最後訓練出之分類器其辨識能力低落的狀況，而在不同的參數設定下，也會導致不同的結果，至於要如何訂定分類器的權重關係以及門檻值，則必須要視情況及目的進行調整，若希望對未知攻擊有高一點的偵測能力，則可以調高 Self-Learning 後期所訓練出之分類器權重，但其同時也必須誤判率較高之風險，相反的，若只是想將 Self-Learning 之後訓練出之分類器作為原始分類器的附加參考依據，則可將後續分類器的權重調低，

並升高門檻值，如此辨識結果便會接近原始分類器的狀況，風險較低，但相對的，其偵測未知攻擊的能力便會較差。

而在表 18，則列出在不同資料集、不同演算法下，原始分類器，Self- Learning 分類器，以及經過 Voting 之辨識結果之 Accuracy 作為統計跟比較，這邊的 Voting 數值是配合不同的參數設定所調整出的結果，想表達的是，若有合適的參數設置，藉由 Voting 方法不僅可以避免最壞狀況，甚至可以調整出比原始分類器以及 Self-Learning 分類器都來的好的辨識結果。但要如何在不知測試樣本標籤的情況下，配合所期望的結果，調整出最佳的參數，則是尚待討論的部分。

Accuracy Statistic (Original – Self-learning – Voting)

J48 Naïve Bayes Random Random RBF

在文檔中針對未知攻擊辨識之混合式入侵偵測系統 (頁 51-54)

六、 實驗結果(Experiment)

6.3. 混合式系統(Hybrid System)

6.3.1 分層

6.3.2 投票

六、實驗結果(Experiment)