第三章 研究方法
第二節 研究流程
本研究擬建立一學校建築物耐震詳細評估資料庫,並對資料庫進行資料探 勘,以建立判斷建築耐震能力之模型。最後依模型建置一套學校建築耐震力快速 評估決策支援系統,提供管理人員或專業人士使用。由於研究中是以資料探勘的 方式達到研究目的,因此在研究步驟的規劃上,以參考第二章文獻回顧中所提到 的 CRISP-DM (Cross-Industry Standard Process for Data Mining) 標準流程內容和 實際的需求修訂而成。現將本研究步驟的內容說明以下:
一、擬定研究主題:
從研究動機開始思考,確定研究的主題與方向。
二、確定研究目的:
依據研究的主題,思考研究的目的、需求與待解決的問題狀態為何?在 理解研究的主題與相關配合的主客觀條件後訂定明確且具體可行的研究目 的,以利於後續研究之進行與操作。
三、相關文獻整理與探討:
整理與本研究主題相關之國內外文獻,從前人的研究中歸納出與本研究 問題相關的知識,以找出達成研究目的的方法。同時也可能依據文獻回顧的 結果修正研究目的,讓研究目的更符合研究的主題。最後依據本步驟的結 果,擬定研究的架構與流程,作為研究執行的圭臬。
四、收集資料與建置資料庫:
此步驟與第三個步驟是同時進行,其性質為資料探勘的前置作業之ㄧ。
本步驟分成三個子步驟,分別為收集臺東縣學校建築物耐震能力詳細評估報 告之紙本資料、規劃建築物耐震能力詳細評估資料庫之欄位與架構和建立資 料庫。主要工作內容為依據研究目的,收集與篩選研究所需的各項資料,將 資料電子化以利後續的資料探勘與分析處理。最後依據資料內容的特性與研 究目的所需規劃出適當的資料庫格式,讓隱含在資料之中有用的資訊能順利
被發掘。
五、資料的前置處理及轉換:
此步驟是依研究目的與資料探勘演算法的需求將待分析的資料進行一 連串的處理,包含如資料表格、紀錄、欄位等的整合、重建關聯、篩選、清 理、轉換格式、正規化等方式,以確保分析與探勘資料的正確性。最後產生 的資料才能成為資料探勘之建模工具(Modeling Tool)所需要的輸入資料集 (Datasets)。
六、建立資料探勘模型:
此步驟為資料探勘的核心部份,分成選擇資料探勘演算法與設定演算法 參數兩個子步驟。在本步驟中,我們依據研究目的選擇並應用各種不同的演 算法,並依據資料特性設定最合適的演算法參數以期能找出最符合研究目的 的探勘模型。在建立模型的過程中,常常需要不斷調整與測試演算法參數的 值,讓演算法能發揮最大的功效,找出符合需求的探勘模型。另外,由於不 同的演算法所需要輸入資料集型態不盡相同,因此在選擇另一種演算法之 前,仍須返回前一資料的前置處理及轉換步驟,調整資料以符合演算法之需 求後再繼續本步驟,以找出最符合研究目的最佳模型。
七、測試與評估資料探勘模型:
上一步驟所建立的模型,是經過參數最佳化調整後所得到的結果,在品 質上已經符合研究目的所需。但是在進入實用化的階段之前,為了取得模型 能符合研究需求的佐證,仍然必須進行模型測試以評估和解釋模型的價值。
如果模型無法通過評估,仍然要將流程返回第五步驟,重新修正現有的模 型。在測試與評估工作完成後,就是確定了研究目的所要採用的資料探勘結 果。
八、使用模型建立自動化評估系統與系統測試:
此步驟以資料探勘所得的模型為核心建立一學校建築耐震力快速評估 決策支援系統,並以資料庫外的測試案例資料進行系統測試,以驗證系統的
穩定性與可用性。
九、撰寫研究結論與建議:
依據研究的結果提出結論與建議事項。
如將本研究的步驟與 CRISP-DM 流程相比較,可發現第一、二步驟對應問 題理解,第三、四步驟對應資料理解,第五、六、七、八步驟分別對應資料預備、
模型建立、評估與解釋和部署與實施。依據前述之研究步驟,將研究流程圖規劃 如圖 3-2。
確定研究目的