結果比較分析

第五章案例驗證

5.3 建築結構體工程成本預測缺漏資料之探勘

5.3.4 結果比較分析

本研究對上述已完成建築結構體工程成本預測之驗證結果做一比較及分析，其下便針對資料庫資料量及案例驗證後之精準度作一比較。

ㄧ、資料庫之資料量比較

根據開始之研究動機，資料缺漏的問題往往造成資料探勘過

程中無法保存完整的經驗，而應用人工智慧技術來學習之精度亦無法提升。這問題的現象主要發生於缺漏的資料被捨棄，而使資料的經驗累積次數便少，以往曾做過之案例無法全部被保存下來。因此，針對於上述現象，本研究在案例驗證中設計缺漏資料模型，用以比較若保留缺漏資料與捨棄缺漏資料的兩者之間資料庫之資料量差異性。如下表所示：

表 5.17 建築結構體工程成本預測資料庫保留與捨棄之資料量比較完整資料缺漏資料捨棄後資料捨棄資料差別百分比

5%缺漏 22 22 19 3 14%

10%缺漏 22 22 16 6 27%

15%缺漏 22 22 12 10 45%

20%缺漏 22 22 10 12 55%

全缺漏 22 22 0 22 100%

上表 5.14 為整理在建築結構體工程成本預測之案例中，資料庫之資料量。在 15%缺漏中，所有資料格數只缺漏 15%的資料量，

可是卻捨棄 10 筆的資料筆數，佔總資料量百分比 45%。上述設計之缺漏資料，呼應在研究動機中所提到資料捨棄之情況。

二、案例驗證後之精準度比較

根據表 5.14，在不同缺漏資料量的形況下，傳統之捨棄方式會減少資料庫之資料量，亦減少了能讓系統學習之機會。文獻中說明直接捨棄之方法在缺漏資料量不多時，並不影響系統學習結果。因此本研究將具有缺漏資料之資料庫經由修改後之系統學習，並與傳統直接捨棄之方式作一比較，如下表所示：

表 5.18 建築結構體工程成本預測資料庫之精度比較完整資料學習缺漏傳統捨棄

5%缺漏 96.79% 95.42% 84.47%

10%缺漏 96.79% 91.76% 81.29%

15%缺漏 96.79% 90.52% 74.00%

20%缺漏 96.79% 89.82% 72.89%

全缺漏 96.79% 84.49% 0.00%

上表顯示若缺漏資料量越多，系統精準度會下降；而捨棄資料量越多，則系統精準度亦會隨之下降。兩者之精度差異會隨著缺漏資料量的差異而越趨變大。而缺漏資料庫之精度與捨棄後資料庫之精度關係如下圖所示：

0.00%

20.00%

40.00%

60.00%

80.00%

100.00%

120.00%

5%缺漏 10%缺漏 15%缺漏 20%缺漏全缺漏

保留捨棄

圖 5.2 建築結構體工程成本預測資料庫保留與捨棄之精度比較由圖 5.2，可以驗證在缺漏的建築結構體工程成本預測資料庫情形下，保留缺漏資料供系統學習會比直接捨棄資料的結果更好，精準度更高。

另外，本研究對於完整資料庫學習之精度、缺漏資料庫學習之精度及捨棄缺漏資料之資料庫精度作差異比較分析，整理為下表：

表 5.19 完整建築結構體工程成本預測精度差異性分析

完整資料與學習缺漏完整資料與傳統捨棄學習缺漏與傳統捨棄

5%缺漏 1.37% 12.32% 10.95%

10%缺漏 5.04% 15.50% 10.46%

15%缺漏 6.28% 22.79% 16.52%

20%缺漏 6.97% 23.91% 16.93%

全缺漏 12.30% 96.79% 84.49%

上表中，在資料量只有 5%缺漏的情形下，保留缺漏資料學習精度與完整資料之差異百分比只有 1.37%。若直接捨棄，則差異度達 12.32%。保留缺漏資料學習精度與完整資料之最大差異度百分比達 12.30%，遠小於直接捨棄而致無法訓練的結果。藉由表 5.8 之比較，保留缺漏資料之學習方式的精度與完整資料的精度差異

性未有超過 20%，可以驗證本案例中所有缺漏資料庫學習完後之精度都可以被接受。

在文檔中類神經模糊系統在營建知識發掘中資料缺漏問題之研究 (頁 80-83)

第五章 案例驗證

5.3 建築結構體工程成本預測缺漏資料之探勘

5.3.4 結果比較分析

第五章案例驗證