• 沒有找到結果。

第三章 研究方法

3.2 資料蒐集與處理

3.2.1 合約書內容

合約書是以雙方當事人互相對立合致的意思表示所構成的,其中包括要約及承諾 兩個基本的意思,合約書主要的內容大約如下,合約書範本內容如下圖 3-2、圖 3-3 示:

1. 工程名稱 2. 工程地點 3. 合約總價

4. 交貨期限 5. 付款方式 6. 工程監督

7. 維持交通 8. 材料檢查 9. 材料延期

10. 交貨終止 11. 交貨驗收及接管 12. 逾期賠償

13. 保固期限

圖 3-2:合約書內容 圖 3-3:合約書內容

23

3.2.2 合約書功能

主要了解甲乙買賣雙方之間所簽訂之合約,如有不遵守或毀約之行為可向對 方進行求償。在合約書裡會提到工程範圍、建材說明、施工說明及規定事項、工 程期限等,這些都是需要被遵守的,如未遵守就會合約書訂定相關扣款之罰責,

因此簽訂合約書是要雙方遵守約定的規範。

3.2.3 合約書之選擇

主要選擇合約書的原因為它是雙方所簽署的約束,具有法律上的效力所以營 建商、地點、時間、價目等所蒐集的資料是具有意義的。為何不選擇顧客資料庫 或是出貨單,因為每間公司出貨數量、時間不一致,所以會造成資料選擇上的誤 判。

3.2.4 蒐集資料

蒐集南部某家防火門公司的合約書,至 2008~2013 年所有買賣交易的合約書,

經整理約有 156 本合約書,而萃取出合約書相關資料,以利後續分析。

3.2.5 資料前置處理與資料庫

將蒐集好的合約書,進行初步的分類,作為後續研究資料之分析。表 3-1 為 本研究之工程名稱,在工程名稱表裡可以得知研究合約書的公司名稱、合約項目、

數量及單價等,為工程建案叢聚的關係依據。

24

25

3.2.6 叢聚分析(J-Express)

本研究,使用 MolMine 公司的 J-Express 軟體為本系統進行資料探勘中合約 書之叢聚的工具,此軟體為利用 Java 語言發展,目前最新版本有到 J-Express 2012,

語言使用介面為英文,本研究使用 2011 Multiplatform 作業系統上運作的版本,

此套軟體主要提供的分析工具為叢聚分析。

J-Express 分析方法為階層式叢聚分析及 K-means 分析法,在研究方法中將 會有更深入的探討及研究。

3.2.7 分析結果探討

利用叢聚分析結果,讓企業知道從顧客對企業所提供產品與服務之表現,學 習如何加強提供更佳的產品與服務品質,並以顧客為中心,擬定有效的經營管理 與營運目標,以建立企業與顧客間之關係。最終希望能根據顧客購買行為,提供 顧客量身訂做的服務,以提高顧客滿意度,提升企業利潤。

3.3 研究方法

本研究將建立蒐集好的資料表後,接下來會依據此資料,進行相關聯的叢聚。

本研究在文獻探討有提到,叢聚的方法有分成 5 大類,但主要常用的分類可以分 為階層式叢聚法以及分割式叢聚法,根據本研究的資料特性,是依據建案合約書 為範本資料中尋找叢聚分析來源,因此本研究採用叢聚法中的階層式叢聚法及分 割式叢聚法,探討合約書之間叢聚關係。

在階層式叢聚法方面為一種階層架構的方式,將資 料層反覆地進行分裂或聚 合。在 J-Express 軟體中可以選擇的連結方式有:

26

1. Squared Eculidean(平方歐幾里德距離)

2. Eculidean(歐幾里德距離)

3. Bray Curtis

4. Manhattan(曼哈頓距離)

5. Cosine Correlation(餘弦相關)

6. Pearson Correlation(皮爾森相關)

研究常使用評估的方法為:曼哈頓距離與歐幾里得距離。 Han & Kamber(2000)。

K-means 演算法應用在其它領域資料的分類上,已獲得相當程 度證實,可以 快速且有效的將資料分類出來,我們將其應用在 合約書的分類上,是希望利用 K-means 演算法的優點,將合約書作適性的、客觀的分類。

K-means 在使用上的必須事先設定分群數目 K,但一般較難從原始資 料中去 判斷適當的群數,且在使用者主觀的認定並不斷測試下,容易產生主觀上的偏差 而不夠客觀。因此發展出選取 K-means 選擇最初叢聚中心的方法,在 J-Express 中分為四種 Pena et al.,(1999):

27 用的探勘工具有 Weka、DB2 Intelligent Miner、DB Miner、Clementine、Microsoft SQL Server 以及 J-Express 等。

由於本研究欲利用階層式叢聚法、K-means 以及主要成分分析法來作為研究 中進行合約書叢聚資料型態顯示的技術,因此經過搜尋以及評估現有的工具之後,

本研究決定利用由挪威 MolMine 公司所研發的資料探勘軟體 J-Express 為進行叢 聚的工具,J-Express 所提供的功能包括,階層式叢聚,以 K-means 方法為主的 分割式叢聚法, 主要成分分析法(PCA;Principal Component Analysis),自我 組織圖(SOM)。本研究採用此軟體為工具的主要原因,因為這套軟體對於叢聚

相關文件