5-1 結論
本研究獨特性為將乳癌資料集利用資料探勘軟體中的分類技術做演算法比較以預 測病患為罹患良性腫瘤或惡性腫瘤,並結合模糊邏輯推論的 JFuzzyLogic 來發展一套乳 癌風險評估系統。本研究以683 筆訓練樣本資料做五種演算法之分類分析,結果得知原 始資料集九個變數採用全樣本訓練資料集在多層感知機(Multi-Layer Perceptron, MLP)的 準確度為最佳,高達98.98%。此外,採用十折交叉驗證法結果是以 Bayes Net 的準確度 為佳,達 97.21%,表示乳癌資料集屬性變數對於分類結果良性腫瘤或惡性腫瘤有重要 性存在。接著,採用的方法分別為屬性計算方式及資料探勘軟體測試,並依照屬性重要 程度與排名次序來刪除不顯著的變數,最後保留七個變數,包含Cell_Size_Uniformity、
Bare_Nuclei 、 Cell_Shape_Uniformity 、 Bland_Chromatin 、 Normal_Nucleoli 、 Marginal_Adhesion、Clump_Thickness,其準確率也有略為提升,因此,從驗證結果中,
運用 JFuzzyLogic 模糊邏輯推論方法來建置乳癌屬於良性腫瘤或惡性腫瘤的模糊專家系 統,並且可以預測其風險程度為何,結果顯示低度風險值為 13.87%、中度風險值為 42.50%與高度風險值為 71.09%,其值是符合原先所預期的結果,而透過這簡易的圖形 化介面,能事先得知其風險程度值的界定範圍,也能讓使用者方便做檢測及盡快就醫治 療;此時,研究貢獻為在醫學上,可以提供給醫師做輔助預測的參考,並且可以有效減
5-2 建議
本研究利用資料探勘軟體做分類比較分析,研究出檢測乳癌在各個分類方法的準確 率都相當高。此外,在排名上由於本研究只使用三種方法來測試,因此在屬性重要程度 排名中,變數排序略為改變,在未來期許能與人工智慧演算法或是其他相關的生理因素 做結合來提升更高的準確率,也期許能有更多的分類方法來提升資料集屬性的重要程度,
並且運用正確的相關數據來進行分析比較才能獲得更多有效的資訊。
連結網址
[1] A+醫學百科(2006),摘自:
http://cht.a-hospital.com/w/%E4%B9%B3%E8%85%BA%E7%99%8C, 擷取日期:
2014.12.28。
[2] 國家行政院衛生福利部,摘自:http://www.mohw.gov.tw/CHT/Ministry/Index.aspx, 擷 取日期:2014.12.26。
[3] 衛生福利部國民健康署,摘自:http://www.hpa.gov.tw/BHPNet/Web/Index/index.aspx, 擷取日期:2014.12.26。
[4] 台灣癌症防治網,摘自:http://cisc.twbbs.org/index.php, 擷取日期:2014.12.28。
[5] 癌症關懷照護網,摘自:http://www.totcare.com.tw/, 擷取日期:2014.12.29。
[6] 中華民國乳癌病友協會,摘自:http://www.tbca-npo.org.tw/, 擷取日期:2014.12.29。
[7] 華 人 健 康 網 , 摘 自 : https://www.top1health.com/Article/311/22366, 擷 取 日 期 : 2015.01.02。
[8] 明 師 中 醫 集 團 , 摘 自 : http://www.drmeans.tw/magazine/93/18.htm, 擷 取 日 期 : 2015.01.02。
[9] 藥學雜誌電子報,摘自:http://www.taiwan-pharma.org.tw/JTP/099/058-063.html, 擷 取日期:2015.01.02。
[10] 資料探勘 CRISP-DM,摘自:http://faculty.stust.edu.tw/~jehuang/DMCourse/index.html, 擷取日期:2015.04.16。
[11] 三軍總醫院—血液腫瘤科,摘自:
http://wwwu.tsgh.ndmctsgh.edu.tw/hem/hema_oncology/cancer_breast.htm, 擷取日期:
2015.05.12。
[12] UCI Machine Learning Repository, from: http://archive.ics.uci.edu/ml/, 擷取日期:
中文部分
[13] 曾憲雄,蔡秀滿,蘇東興,曾秋蓉,王慶堯,資料探勘 Data mining,旗標出版社,
2005。
[14] 楊世瑩,PASW/SPSS 統計分析即學即用,碁峯資訊股份有限公司,2011。
[15] 孫旭東,乳癌保留乳房手術研究進展,青島大學醫學院學報,44(5),2008,468-470。
[16] TCOG 乳癌研究委員會,乳癌診斷與治療共識,國家衛生研究院,2004。
[17] 陳金泉,應用資料探勘找出金融海嘯下台灣股市的避險操作方式,大同大學資訊經 營研究所碩士論文,2010。
[18] 李淑媛,運用資料探勘建構心肺適能預測模型,國立雲林科技大學工業工程與管理 系碩士論文,2014。
[19] 張士瑋,應用資料探勘技術於成人健康檢查之慢性病預防,朝陽科技大學資訊工程 系碩士論文,2014。
[20] 張純蓮,應用資料探勘技術於乳癌復發的預測,南台科技大學企業管理系碩士論文,
2007。
[21] 張昭威,運用資料探勘方法建構乳癌預後模式,朝陽科技大學工業工程與管理系碩 士班碩士論文,2010。
[22] 張雅婷,以資料探勘技術建立輔助乳癌診斷模型,國立台北科技大學商業自動化與 管理研究所碩士論文,2008。
[23] 陳品文,K-means 群集演算法初始化之新方法,國立東華大學企業管理學系碩士論 文,2007。
[24] 吳東桓,以類神經網路為基礎之混合式診斷系統比較以乳癌為例,天主教輔仁大 學資訊管理學系碩士論文,2014。
[25] Berry, M. and Linoff, G., “Data Mining Techniques: For Marketing Sale and Customer Support”, John Wiley and Sons, Inc, 1997.
[26] Cheng S. H., Tsou M. H., Liu M. C., ‘‘Unique Features of Breast Cancer in Taiwan.’’, Breast Cancer Res Treat, Vol. 63, 2000, pp.213-223.
[27] Dunham, M. H., ‘‘Data Mining: Introductory and Advanced Topics.’’, Prentice Hall, Upper Saddle River NJ, 2003.
[28] Fayyad, U., Shapiro, G. P., and Smyth, P., “From Data Mining to Knowledge Discovery in Database”, AI Magazine, Vol. 17, 1996, pp.37-54.
[29] Frawley, W. J., Paitetsky, S. G., and Matheus, C. J., “Knowledge Discovery in Databases: An Overview”, Communications of the ACM, Vol. 39, 1996, pp.1-34.
[30] Ganz, P. A., Rowland, J. H., Desmond, K., Meyerowitz B. E., and Wyatt, G. E., “Life after Breast Cancer: Understanding Women’s Health-Related Quality of Life and Sexual Functioning,” Journal of Clinical Oncology, Vol. 16, No. 2, 1998, pp. 501-514.
[31] Olmeda, I., and Sheldon, P. J., “Data Mining Techniques and Applications for Tourism Internet Marketing,” Journal of Travel and Tourism Marketing, Vol. 11, No. 2/3, 2001, pp.
1-20.
[32] Quinlan J. R., ‘‘C4.5: Programs for Machine Learning’’, Morgan Kaufmann Publishers Inc., 1993.
[33] Quinlan, J. R., ‘‘Expert Systems in the Micro Electronic Age,’’ Discovering Rules from Large Collections of Examples: A Case Study, Edinburgh University Press, 1979.
[34] Tan, P. N., Steinbach, M., and Kumar, V.原著, 施雅月、賴錦慧譯, 資料探勘,臺灣培 生教育,2008。
[35] Vapnik, V. N., The Nature of Statistical Learning Theory, New York: Springer-Verlag, 1995.
[37] Zadeh, L.A., “The Concept of a Linguistic Variable and its Application to Approximate Reasoning- III”, Information Science, Vol. 9, No. 1, 1975, pp. 43-80.