以經驗法則應用在關聯法則門檻值制定之研究 羅閔隆、李德治
E-mail: [email protected]
摘 要
挖掘關聯法則(Association Rules)是有關資料探勘中的一種重 要技術之一,所謂挖掘關聯規則,就是從交易資料庫中,找出 交易 項目之間的關聯性。由於規則的產生必須大於支持度(Support)及信 度(Confidence)的門檻值,這樣挖掘出的規則才具 有意義。然而門 檻值的大小必須由相關的專家所制定,尚無一定的準則可循。有鑑 於此,本研究企圖以分位數的原理來 制定門檻值,使所挖掘出的規 則較具意義。 在本研究之關聯法則門檻值之制訂方式,我們定義為某百分位 數,也就是使 用者認為其需要前百分多少重要之規則。在這裡我們 假設這些百分位數與算術平均數、偏態係數與峰態係數..等統計參 數 存在某種關係。我們試圖利用這些統計參數找出經驗公式,以便 能快速訂出門檻值,讓進行關聯法則之挖掘時,在門檻值 訂定方面 有所依據。
關鍵詞 : 資料探勘、關聯法則、大項目集合、支持度、信度、經驗 法則、偏態、峰態。
目錄
封面內頁 簽名頁 授權書... iii 中文摘要...v 英文摘
要...vi 誌謝...vii 目錄...viii 圖目 錄...x 表目錄...xii 第一章 緒論...1 1.1 研 究背景與動機...1 1.2 研究目的...3 1.3 研究範圍與限
制...4 1.4 研究流程...5 第二章 文獻探討...7 2.1 資料 探勘之概述...7 2.1.1 資料探勘之定義...8 2.1.2 資料庫知識發現流
程...9 2.1.3 資料探勘之型態... 11 2.2 關聯法則...14 2.2.1 關 聯法則之定義...15 2.2.2 關聯法則之步驟...16 2.3 關聯法則之應用-購物籃分 析...22 2.4 關聯法則門檻值訂定之相關文獻...23 第三章 研究方法...25 3.1 迴歸分析...28 3.2 應用迴歸分析找出門檻值之經驗法則...29 3.3 制定門檻值經驗法 則定義...31 第四章 實驗與結果評估...33 4.1 資料庫產生與分
析...33 4.2 迴歸分析...45 4.3 門檻值訂定方法...49 4.4 結 果說明...51 第五章 結論...53 5.1 結論...53 5.2 未來研究...53 參考文獻...55
參考文獻
[1] 鄧安生,新式探勘方法在關聯法則門檻值制定之研究,大葉大 學資訊管理研究所碩士論文,2003 年。
[2] Agrawal, R., Imilienski, T. and Swami, A., “Mining Association Rules between Sets of Items in Large Databases,” In Proceedings of ACM SIGMOD International Conference on Management of Data, pp. 207-216, 1993.
[3] Agrawal, R. and Srikant, R., “Fast Algorithm for Mining Association Rules,” In Proceedings of the 20th International Conference on Very Large Databases, pp. 487-499, 1994.
[4] Adriaans, P. and Zantinge, D., “Data Mining, Addison Wesley Longman, ” 1996.
[5] Brin, S., Motwani R. and Silverstein, C., “Beyond market baskets: Generalizing association rules to correlations,” In Proceedings of ACM SIGMOD Conference on Management of Data, pp. 265-276,1997.
[6] Chen, M.S., Han J. and Yu, P.S., “Data Mining: An Overview from Database Perspective,” IEEE Transactions on Knowledge and Data Engineering, Volume 8, Number 6, pp. 866-883, 1996.
[7] Fayyad, U.M., “Data Mining and knowledge Discovery: Making Sense Out of data,” IEEE Expert, Volume 11, Issue 5, pp. 20-25,1996.
[8] Fu, Y., “Data mining Tasks, techniques and applications,” IEEE Potentials, Volume 16, Issue 4, pp. 18-20, 1997.
[9] F Han, J. and Kamber, M., “Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, ” San Francisco,2000.
[10] Han, Jiawei and Micheline Kamber , “Data Mining : Concepts and Techniques, ”John Wiley & Son,2001.
[11] Kleissner, C., “Data mining for the enterprise,” In Proceedings of the Thirty-First Hawaii International Conference on, Volume 7, pp.
295-304, 1998.
[12] Kim, Sung-Min, Jong-Dal Kim, Jeong-Hee Hong, Do-Won Nam, Dong-Ha Lee,Jeon-Young Lee , “A System for Association Rule Finding from an Internet Portal Site,”2000.
[13] Michael, J.A. and Linoff, G., “Data Mining Technique: for Marketing, Sales and Customer Support,” Wiley Computer Publishing, New York, 1997.
[14] Olaru, C. and Wehenkel, L., “Data mining,” IEEE Computer Applications in Power, Volume 12, Issue 3, pp. 19-25, 1999.
[15] Simoudis, E., “Reality check for data mining,” IEEE Expert, Volume 11, Issue 5, pp. 26-33, 1996.
[16] Zhang, C. and Zhang, S., “Association Rule Mining: Model and Algorithms, Springer-Verlag Berlin Heidelberg,” New York,2002.