• 沒有找到結果。

第五章 案例驗證

5.3 建築結構體工程成本預測缺漏資料之探勘

5.3.4 結果比較分析

本研究對上述已完成建築結構體工程成本預測之驗證結果做一比 較及分析,其下便針對資料庫資料量及案例驗證後之精準度作一比較。

ㄧ、資料庫之資料量比較

根據開始之研究動機,資料缺漏的問題往往造成資料探勘過

程中無法保存完整的經驗,而應用人工智慧技術來學習之精度亦 無法提升。這問題的現象主要發生於缺漏的資料被捨棄,而使資 料的經驗累積次數便少,以往曾做過之案例無法全部被保存下 來。因此,針對於上述現象,本研究在案例驗證中設計缺漏資料 模型,用以比較若保留缺漏資料與捨棄缺漏資料的兩者之間資料 庫之資料量差異性。如下表所示:

表 5.17 建築結構體工程成本預測資料庫保留與捨棄之資料量比較 完整資料 缺漏資料 捨棄後資料 捨棄資料差別 百分比

5%缺漏 22 22 19 3 14%

10%缺漏 22 22 16 6 27%

15%缺漏 22 22 12 10 45%

20%缺漏 22 22 10 12 55%

全缺漏 22 22 0 22 100%

上表 5.14 為整理在建築結構體工程成本預測之案例中,資料 庫之資料量。在 15%缺漏中,所有資料格數只缺漏 15%的資料量,

可是卻捨棄 10 筆的資料筆數,佔總資料量百分比 45%。上述設計 之缺漏資料,呼應在研究動機中所提到資料捨棄之情況。

二、案例驗證後之精準度比較

根據表 5.14,在不同缺漏資料量的形況下,傳統之捨棄方式 會減少資料庫之資料量,亦減少了能讓系統學習之機會。文獻中 說明直接捨棄之方法在缺漏資料量不多時,並不影響系統學習結 果。因此本研究將具有缺漏資料之資料庫經由修改後之系統學 習,並與傳統直接捨棄之方式作一比較,如下表所示:

表 5.18 建築結構體工程成本預測資料庫之精度比較 完整資料 學習缺漏 傳統捨棄

5%缺漏 96.79% 95.42% 84.47%

10%缺漏 96.79% 91.76% 81.29%

15%缺漏 96.79% 90.52% 74.00%

20%缺漏 96.79% 89.82% 72.89%

全缺漏 96.79% 84.49% 0.00%

上表顯示若缺漏資料量越多,系統精準度會下降;而捨棄資 料量越多,則系統精準度亦會隨之下降。兩者之精度差異會隨著 缺漏資料量的差異而越趨變大。而缺漏資料庫之精度與捨棄後資 料庫之精度關係如下圖所示:

0.00%

20.00%

40.00%

60.00%

80.00%

100.00%

120.00%

5%缺漏 10%缺漏 15%缺漏 20%缺漏 全缺漏

保留 捨棄

圖 5.2 建築結構體工程成本預測資料庫保留與捨棄之精度比較 由圖 5.2,可以驗證在缺漏的建築結構體工程成本預測資料庫 情形下,保留缺漏資料供系統學習會比直接捨棄資料的結果更 好,精準度更高。

另外,本研究對於完整資料庫學習之精度、缺漏資料庫學習 之精度及捨棄缺漏資料之資料庫精度作差異比較分析,整理為下 表:

表 5.19 完整建築結構體工程成本預測精度差異性分析

完整資料與學習缺漏 完整資料與傳統捨棄 學習缺漏與傳統捨棄

5%缺漏 1.37% 12.32% 10.95%

10%缺漏 5.04% 15.50% 10.46%

15%缺漏 6.28% 22.79% 16.52%

20%缺漏 6.97% 23.91% 16.93%

全缺漏 12.30% 96.79% 84.49%

上表中,在資料量只有 5%缺漏的情形下,保留缺漏資料學習 精度與完整資料之差異百分比只有 1.37%。若直接捨棄,則差異度 達 12.32%。保留缺漏資料學習精度與完整資料之最大差異度百分 比達 12.30%,遠小於直接捨棄而致無法訓練的結果。藉由表 5.8 之比較,保留缺漏資料之學習方式的精度與完整資料的精度差異

性未有超過 20%,可以驗證本案例中所有缺漏資料庫學習完後之 精度都可以被接受。