國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
75
的決策。
第二節 建議與未來研究方向
此資料採礦之分類系統目前只能以網頁預覽分析結果報表的方式呈現給使 用者,尚未將系統雲端化,且對於使用者上傳資料仍有諸多限制存在,若欲將實 現雲端系統帄台之概念,則有賴於強大的程式能力之撰寫者,以下建議可供後續 研究者研究參考:
1、 將此資料採礦之分類系統包裝成一個軟體套件,使其線上化成一雲端系 統,供使用者透過網路即可取得,實現雲端運算之概念。
2、 目前使用者的資料只能上傳 Microsoft Office Excel 逗點分隔值檔案(.csv)、
Microsoft Office Excel 工作表 (.xls)及 Microsoft Office Excel 工作表(.xlsx)三 種資料檔至系統,未來可在系統中增設轉檔功能,當使用者上傳文字文件 (.txt) 資料檔,系統可自動將資料檔類型轉成 Microsoft Office Excel 逗點分 隔值檔案(.csv)、Microsoft Office Excel 工作表 (.xls)或 Microsoft Office Excel 工作表(.xlsx)。
3、 此系統對於目標變數為數字類別型的資料,目前只適用於種類為 5 以下,未 來可將此限制放寬或解決此限制。
4、 此分類系統目前只置入了四種模型,未來可再增設分類模型,以提供使用者 更多模型的選擇。
5、 目前此分類系統只能對於現有資料做分類,尚無法對新進資料做分類,未來 可增設此功能。
‧
1、 尹相志(2006),Microsoft SQL 2005 資料採礦聖經,台北市:學貫行銷股 份有限公司。 -hao/yun-duan-yun-suan-ge-wang-yun-suan-yup2p-yun-suan-zhong#TOC-2。
5、 林東清(2003),資訊管理:e 化企業的核心競爭能力(第四版),台北市:
智勝文化事業有限公司。
6、 洪士吉(1999),操作輕鬆巨集通 : Excel VBA 巨集逐步操作指引,台北市:
旗標出版股份有限公司。
7、 洪嘉興(2003),資料挖掘(Data Mining)淺析,華控月刊,2003011,17-25。
8、 桂思強(1995),深造 Excel VBA,台北市:博碩顧問。
9、 曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯(2007),資料探勘 Data Mining,
台北市:旗標出版股份有限公司。
‧
14、 謝邦昌、鄭孙庭、蘇志雄(2009),Data Mining 概述-以 Clementine12.0 為例,新北市:中華資料採礦協會。
15、 曠文琪(2006),帄價超級電腦正接手我們的生活,商業周刊第 972 期。
16、 瀨戶遙(2002),嗯!Excel VBA 我也會 PRO. 2000/2002 對應,新北市:博 碩文化。
17、 蘇芷萱(2011),中華電佈局智慧雲端產業 喊出今年通信業務成長 10 億 元目標,2011 年 2 月 27 日,取自華視新聞網網址。
http://news.cts.com.tw/cnyes/money/201101/201101110650346.html。
二、 英文文獻
1、 Breiman, L. (1984), Classification and regression trees, Wadsworth Internatonal Group.
2、 Breiman, L. (2001), Random Forests. Machine Learning, 45 (1): 5-32.
3、 Crawley, M. J. (2007), The R book. Chichester, West Sussex, England ; Hoboken, N.J.: Wiley.
4、 Fayyad, U., G. P. Shapiro and P. Smyth (1996), From Data Mining to Knowledge Discovery in Database. AI Magazine, 17, 37-54.
5、 Foster, I. and C. Kesselman (2004), The grid : blueprint for a new computing infrastructure. Elsevier Inc.
6、 Frawley, W. J., G. Gregory, P. S. Matheus and C. J. Matheus (1991), Knowledge Discovery in Databases: an Overview in Knowledge Discovery in Databases.
Cambridge, MA: AAAI/MIT, 213-228.
7、 Frawley, W. J., S. G. Paitetsky and C. J. Matheus (1996), Knowledge Discovery in Databases: An Overview. Communications of the ACM, 39, 1-34.
‧
Springer.9、 Han, J. and M. Kamber (2001), Data Mining: Concepts and Techniques. Simon Fraser University, Morgan Kaufmann Publishers.
10、 Hartigan, J. A. (1975), Clustering algorithms, New York: Wiley.
11、 Loh, W.Y. and Y. S. Shih (1997), Split selection methods for classification trees, Statistica Sinica, 7, 815-840.
12、 Maindonald, J. H. (2007), Data analysis and graphics using R : an
example-based approach (2nd ed.). Cambridge, U.K. ; New York : Cambridge University Press.
13、 Mell, P. and T. Grance (2009), The NIST Definition of Cloud Computing [Electronic version]. National Institute of Standards and Technology, 53, 2-3.
14、 Quinlan, J. R. (1979), Discovering rules from large collections of examples: a case study. In Michie. Expert Systems in the Microelectronic Age. Edinburgh,
Scotland: Edinburgh University Press.
15、 Ripley, B. D. (1996), Pattern recognition and neural networks, Cambridge University Press.
16、 Shannon, C. E. and W. Weaver (1949), The Mathematical Theory of Communication. University Illinois Press, Urbana.
17、 Usama, F., G. Gregory, P. S. Matheus and P. Smyth (1996), The KDD Process for Extracting Useful Knowledge from Volumes of Data, Communications of the ACM, 39(11), 27-34.
18、 Westphal, R. C. (1998), Data mining solutions : methods and tools for solving real-world problems, New York : John Wiley & Sons.
19、 Witten, I. H. and F. Eibe (2005), Data mining : practical machine learning tools and techniques, Amsterdam, The Netherlands ; Boston, Mass.
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
79
20、 Zhang, C. Q. and S. C. Zhang(2002), Association rule mining : models and algorithms, Berlin; New York : Springer.
三、 相關網站
1、 台灣雲端運算產業協會 http://www.twcloud.org.tw/Cloud/introduce4.do/。
2、 發展雲端技術應用 中華攜手趨勢領航新時代
http://news.networkmagazine.com.tw/Construction/2010/04/01/18518/。
3、 Slesforce.com http://www.salesforce.com/tw/。
4、 TOP 500 SUPERCOMPUTER SITES http://www.top500.org/。
5、 iThome Online http://www.ithome.com.tw/itadm/channel.php?tab=1/。
6、 Cross Industry Standard Process for Data Mining http://www.crisp-dm.org/。
7、 The Data and Story Library http://lib.stat.cmu.edu/DASL/DataArchive.html/。