• 沒有找到結果。

第五章 案例驗證

5.4 地下連續壁施工工期估算缺漏資料之探勘

5.4.4 結果比較分析

本研究對上述已完成地下連續壁施工工期估算之驗證結果做一比 較及分析,其下便針對資料庫資料量及案例驗證後之精準度作一比較。

ㄧ、資料庫之資料量比較

根據開始之研究動機,資料缺漏的問題往往造成資料探勘過 程中無法保存完整的經驗,而應用人工智慧技術來學習之精度亦 無法提升。這問題的現象主要發生於缺漏的資料被捨棄,而使資 料的經驗累積次數便少,以往曾做過之案例無法全部被保存下 來。因此,針對於上述現象,本研究在案例驗證中設計缺漏資料 模型,用以比較若保留與捨棄的兩者之間資料庫之資料量差異 性。如下表所示:

表 5.26 地下連續壁施工工期估算資料庫保留與捨棄之資料量比較 完整資料 缺漏資料 捨棄後資料 捨棄資料差別 百分比

5%缺漏 27 27 23 4 15%

10%缺漏 27 27 17 10 37%

15%缺漏 27 27 15 12 44%

20%缺漏 27 27 13 14 52%

全缺漏 27 27 0 27 100%

上表 5.23 為整理在地下連續壁施工工期估算之案例中,資料 庫之資料量。在 15%缺漏中,所有資料格數只缺漏 15%的資料量,

可是卻捨棄 15 筆的資料筆數,佔總資料量百分比 44%。上述設計 之缺漏資料,呼應在研究動機中所提到資料捨棄之情況。

二、案例驗證後之精準度比較

根據表 5-23,在不同缺漏資料量的形況下,傳統之捨棄方式 會減少資料庫之資料量,亦減少了能讓系統學習之機會。文獻中 說明直接捨棄之方法在缺漏資料量不多時,並不影響系統學習結 果。因此本研究將具有缺漏資料之資料庫經由修改後之系統學 習,並與傳統直接捨棄之方式作一比較,如下表所示:

表 5.27 地下連續壁施工工期估算資料庫之精度比較 完整資料 學習缺漏 傳統捨棄

5%缺漏 95.94% 89.54% 85.79%

10%缺漏 95.94% 85.06% 76.58%

15%缺漏 95.94% 84.25% 71.67%

20%缺漏 95.94% 82.58% 66.17%

全缺漏 95.94% 83.02% 0.00%

上表顯示若缺漏資料量越多,系統精準度會下降;而捨棄資 料量越多,則系統精準度亦會隨之下降。兩者之精度差異會隨著 缺漏資料量的差異而越趨變大。而缺漏資料庫之精度與捨棄後資 料庫之精度關係如下圖所示:

0.00%

20.00%

40.00%

60.00%

80.00%

100.00%

5%缺漏 10%缺漏 15%缺漏 20%缺漏 全缺漏

保留 捨棄

圖 5.3 地下連續壁施工工期估算資料庫保留與捨棄之精度比較 由圖 5.3,可以驗證在缺漏的地下連續壁施工工期估算資料庫 情形下,保留缺漏資料供系統學習會比直接捨棄資料的結果更 好,精準度更高。

另外,本研究對於完整資料庫學習之精度、缺漏資料庫學習 之精度及捨棄缺漏資料之資料庫精度作差異比較分析,整理為下 表:

表 5.28 完整地下連續壁施工工期估算精度差異性分析

完整資料與學習缺漏 完整資料與傳統捨棄 學習缺漏與傳統捨棄

5%缺漏 6.40% 10.15% 3.74%

10%缺漏 10.88% 19.36% 8.48%

15%缺漏 11.69% 24.27% 12.58%

20%缺漏 13.36% 29.77% 16.41%

全缺漏 12.92% 95.94% 83.02%

上表中,在資料量只有 5%缺漏的情形下,保留缺漏資料學習 精度與完整資料之差異百分比只有 6.4%。若直接捨棄,則差異度 達 10.15%。保留缺漏資料學習精度與完整資料之最大差異度百分 比達 12.92%,遠小於直接捨棄而致無法訓練的結果。藉由表 5.25 之比較,保留缺漏資料之學習方式的精度與完整資料的精度差異 性未有超過 20%,可以驗證本案例中所有缺漏資料庫學習完後之 精度都可以被接受。