63
第六章 結論
本論文提出一般化出現頻率改變點法,採用類 FP-tree 的視窗樣式摘要樹儲
存結構記錄資料流最近的資料項集出現頻率改變點時間之資訊,並訂定維護的方
法及對應的規則,只需掃描新輸入的交易資料,更新結構內的資訊並刪除過時的
資料,不需儲存目前交易視窗中的原始資料,即能砍除出現摘要資訊中過時資
訊,從中探勘出最近常見資料項集。此外我們結合最近常見代表樣式方法,從視
窗樣式摘要樹結構中快速地近似找出資料流最近常見代表樣式,可進一步精簡探
勘結果。由實做 NFCP 演算法之實驗結果顯示,以維護資料項集出現頻率改變點
之摘要資訊,可有效近似探勘出目前交易視窗中的最近常見代表樣式,且保證不
會有資料樣式的漏失。此外,相較於比較對象,NFCP 演算法所需記憶體空間明
顯較少,且所需的維護時間極少,因此若資料流中並非在每個時間點都需進行探
勘,但亦隨時有可能要求進行探勘,則 NFCP 可以很有效率的維護方式,達到隨
時可進行探勘最近常見資料項集的效果,可節省更多的處理成本。
在論文中,視窗樣式摘要樹儲存結構並非為最精簡壓縮的 FP-tree 形式,未
來將進一步探討如何將儲存結構動態調整成 FP-tree,以減少出現摘要資訊的儲
存量,並考慮如何提供可調式儲存結構,以因應記憶體容量有限情況下的儲存處
理。