• 沒有找到結果。

耐震能力資料庫的建置說明

第四章 資料分析結果

第一節 耐震能力資料庫的建置說明

本研究收集臺東縣各學校建築物耐震能力詳細評估報告,原始資料如圖 4-1 所示,並依據研究的目的進行報告內資料電子化的工作。研究中收集的初步資料 內容如表 4-1 所示。

資料來源:本研究整理

4-1 學校建築物耐震能力詳細評估報告

表 4-1 本研究所篩選學校建築物耐震能力詳細評估報告之資料內容

等分析結果與本研究待探討的目的無關,故不列入收集範圍,以避免因維護過度 複雜之資料而影響研究的成效。

此外,基於尊重各學校的隱私權,本研究不收集各建築物的名稱與所屬的學 校等相關基本資料。但是如此也同時失去了能辨識各筆建築物資料的主索引鍵 (Primary Key)。為了後續資料查詢與建立電子資料庫所需,故建立一名為建築物 編號的欄位,做為資料表的主索引鍵(Primary Key)。之後每新增一筆建築物耐震 評估資料時都會先賦予該筆資料一個唯一性的流水序號,以作為資料辨識與管理 的索引(Index)。

研究中先使用 Excel 軟體依據表 4-1 所列出的報告書資料內容建立電子資料 表。接著分析研究目的與資料探勘的需求,將電子資料表欄位與內容經過前置處 理及轉換後,將資料匯入 SQL 資料庫系統之中,做為資料探勘的分析資料來源。

以下將資料整理與欄位設計的重點分述如下:

一、資料欄位的設計:

為了能讓非專業人員能容易閱讀和理解資料探勘的結果,研究中將資料 欄位名稱以中文命名,並儘可能與原報告中的名稱相同。此外,部分資料因 其包含數種建築結構特性的組合,如結構系統描述的內容。為能更準確的分 析影響建築物耐震能力的因素,故將其內容拆成兩個欄位,分別紀錄獨立的 特性,以符合研究的實際需要。結構系統描述欄位的修改對應方式如表 4-3 所示。除此之外,也有欄位如校舍總靜載重為原報告中各樓層評估用靜載重 值相加後求得的新值,需另外計算欄位值後,再匯入資料庫中。至於在資料 庫正規化的部分,由於本研究的資料只包含建築基本資料與評估結果,沒有 其他實體的相關資料如人員、學校、地域等資料,故無其他的實體關聯資料 表,也因此無須進行正規化的動作。

二、資料型別的設計:

依資料庫設計的原則,資料型別的指定依資料性質而定。就資料探勘的 需求而言,可分成連續性資料與離散性資料。詳細各欄位資料型別設計內容

請參閱表 4-2。

表 4-3 校舍建築結構系統描述欄位的修改對應方式

四、資料的轉換:

所謂的資料轉換,是將資料進行編碼或是型別轉換,以符合不同的資料 探勘演算法所需,部分演算法使用經特殊資料編碼或型別轉換後的資料進行 資料探勘的工作,方能得到更精確的成果,因此資料轉換工作是在資料探勘 循環過程中不斷的進行著(如圖 3-2 所示)。本研究中為了讓部分較適合離散 型資料輸入的資料探勘演算法能建立更符合研究目的預測模型,將原為連續 性資料的建造年度欄位依照文獻探討中提到的不同建築經費補助年代將資 料分組編成 5 種不同的類別(如表 4-5 所示)。另外也運用 SQL 2008 R2 資料 探勘軟體所內建的資料離散化功能,運用集群分析(Cluster Analysis)的功能 將連續性資料欄位如建築總載重、總面積中的資料離散化,以協助找尋出最 佳的預測模型。

表 4-5 資料庫中建造年度欄位分組的方式 分 組 類 別

代表值

建 築 建 造 年 度 ( 西 元)

分 類 原 因

1 1956 年到 1965 年 發布國民中小學「教室設計標準圖」之前 2 1966 年到 1970 年 臺灣省政府教育廳於民國五十五年發布

國民中小學「教室設計標準圖」之後 3 1971 年到 1981 年 運用民國六十到七十年的發展與改進國

民教育五年計畫經費興建

4 1982 年到 1988 年 運用民國七十二到七十七年的發展與改 進國民教育六年計畫經費興建

5 1989 年到 1994 年 運用民國七十八到八十三年的發展與改 進國民教育第二期六年計畫經費興建 6 1995 年到 1999 年 民國八十四年到八十八年之間使用其他

的經費興建

a資料來源:研究者自行整理

五、資料的分群:

本研究共收集 272 棟典型學校建築之基本資料與耐震詳細評估結果資 料。資料除了運用於各種資料探勘演算法中以訓練和建立耐震能力評估的預

測模型,也必須保留足夠的資料做為模型的準確性評估與驗證工作。研究中 使用 SQL 2008 R2 資料探勘軟體以隨機分配的方式將 272 筆資料分成訓練模 型組資料與評估與驗證組資料。其中訓練模型組資料占總資料量的 70%,為 191 筆資料。評估與驗證組資料占總資料量的 30%,為 81 筆資料。