• 沒有找到結果。

資料探勘(Data Mining)

在文檔中 中 華 大 學 (頁 56-60)

第三章 資料分析系統架構

3.3 資料探勘(Data Mining)

本節旨在說明本研究如何使用資料探勘技術對水文數據做一分 析。葉怡成(2005)指出,資料探勘可將資料中隱藏的資訊挖掘出來,

幫助使用者從資料庫中擷取出有用的知識,再利用這些知識預測資料 庫裡的實體會產生怎樣的結果。這些過程,是建立在一有系統的資料 庫紀錄中,再經由歸納得到規則,然後透過推演得到結果,因此是屬 於一歸納分析之過程。

3.3.1 資料探勘軟體

目前企業界大部份採用軟體廠商提供之資料探勘系統工具,這些 工具可提供研究人員將各種固定分析模組應用於不同之產業。不同產 業間商品樣式與推廣方式各有不同,商品差異性也大,因此造成研究 人員套用此類分析工具時,常有選擇上之困難。葉怡成(2005)指出,

資料探勘軟體的選擇因素包含:

作業系統:即軟體可在何種作業系統上執行?是否為主從架構?

需留意其以何種方式整合資料探勘與資料倉儲?

資料型態:需了解資料探勘軟體可處理何種資料?如 ASCII 文字 檔、關聯式資料庫、交易資料、空間資料、時間資料、文字資料、

聲音資料、影像資料、或網路資料等。

探勘方法:

1、 探勘工具的類型:可執行何種探勘工作?如敘述探勘、聚勘探 勘、分類探勘、迴歸探勘、關聯探勘等。

2、 探勘工作的工具:每一種探勘工作可使用何種探勘方法?可執行 何 種視 覺化 資料探 勘工 具? 可執行 何種 資料 探勘語 言 (Data Mining Query Language, DMQL)?

3、 探勘工作的尺度:探勘方法可處理多大尺度的探勘工作?一般而 言,大量的變數比大量的記錄更難處理。

3.3.2 資料探勘軟體種類

資料探勘軟體來源可分為以下幾類:

資料分析工具型:從統計或人工智慧軟體的提供切入資料探勘市 場,如 SAS 公司所開發的 Enterprise Miner、SPSS 公司所開發的 Clementine。

資料庫管理系統型:從資料庫管理系統的提供切入資料探勘市 場,如微軟公司所開發的 SQL Server 2005、IBM 公司所開發的 Intelligent Miner。

企業應用軟體型:從企業應用軟體的提供切入資料探勘市場,如 SAP 公司。SAP 不只專精於 ERP(Enterprise Resource Planning)的 領域,過去幾年來,SAP 加入預測方面的技術,將其架上 ERP 加以發展資料探勘。

以下將介紹幾種主要之資料探勘軟體:

SPSS 公司的 Clementine 資料探勘軟體:

Clementine 是 SPSS 所開發的一種資料探勘工具,其中結合了多 種資料探勘方法,說明如下:

聚類探勘(segmentation) 分類探勘(classification) 迴歸探勘(prediction) 關聯探勘(association)

Clementine 提供容易使用之視覺化程式環境來執行這些探勘方 法,使用圖形像徵之方法來建構一個資料探勘流程,亦即使用者可利 用滑鼠自模板(pallet)拖拉合適的「節點」到螢幕上,再加以「連結」,

系統即自動形成一流程。這些結點提供了以下之功能。

資料擷取(data access)

資料處理(data manipulation) 資料視化(data visualization) 機器學習(machine learning) 模型分析(model analysis)

SAS 公司的 Enterprise Miner 資料探勘軟體:

Enterprise Miner 是 SAS 所發行之一種資料探勘工具,其具有強 大的資料整合分析能力、資料庫管理以及支援多種作業平台與各式關 聯式資料庫的功能,且透過圖型化使用介面,提供簡單且視覺化的前 端處理環境,讓沒有統計背景的技術人員,也可以簡易之方式進行資 料探勘。

Enterprise Miner 擁有 SAS 統計模組的許多功能,並增加了許多

的資料探勘演算法,包括決策樹、神經網路等。它的資料探勘流程採 用了 SEMMA(sample,explore,modify,model,assess)的方法論,

內容包括:

資料的取樣(sample data) 資料的探索(explore data) 資料的修改(modify data) 知識的建模(model data) 知識的評價(access data)

微軟公司的 SQL Server 2005 軟體:

微 軟 SQL Server 2005 是 一 完 整 的 商 業 智 慧 (Business Intellegence,BI)平台。除了 SQL Server 2000 已有的聚類、決策樹、

關聯規則外,現在更增加了新的演算法,包括序列聚類、關聯規則、

神經網路、迴歸樹、樸素貝式方類與時間數列。SQL Server 內建資料 探勘的功能,打破資料探勘為大型企業量身訂作的情況,讓中小企業 也可以合理之價格來運用此種技術。

XLMiner:

XLMiner 是一套由 Resampling Stats 公司建構在 Excel 上的資料 探勘軟體,其優點為使用方式簡易,價格便宜,且有試用版可免費下 載供使用者模擬練習。缺點為缺少複雜之功能,如時間序列。XLMiner 為本研究所使用之資料探勘軟體。XLMiner 所包含之功能如下:

資料分割 資料處理 資料視化 聚類探勘

分類探勘 迴歸探勘 關聯探勘

在文檔中 中 華 大 學 (頁 56-60)

相關文件