• 沒有找到結果。

系統設計原理以及方法

本章將介紹本研究所使用的方法理論以及系統架構,方法理論有 K-Means 演算法、類神經網路以及 Convex hull 演算法。

3-1 分類演算法介紹

分類是資料分析領域中重要的技術之一,用於發現資料中未知的 分類,分類分析已經有了很長的研究發展歷史,其重要性已經越來越 受到人們的重視與肯定,分類演算法在機器學習、資料採擷和模式識 別等等的研究中常被使用,分類分析主要是用來識別資料物件的內在 關係,具有極其重要的作用,分類演算法主要應用於模式識別中的資 料辨別、機器學習中的圖像分割以及資料處理中的資料壓縮以及資訊 檢視,分類的另一個主要的應用是資料採集、資料庫應用及異常資料 的分析等,此外分類分析在應用於生物學、統計學、地理學、地質學 以及市場行銷等等的方面也有著許多重要的作用,分類分群法其主要 目標是將大量的資料點做資料分割分群,使得相同群聚內的資料點儘 量相似,而所屬不同群聚的資料點有相當的差異程度,並在各個族群 資料中找出具有代表性的中心點,這些具有代表性的中心點為各個群 聚的群聚中心點,這些處理主要包含以下特徵:

1、 資料壓縮:將大量的資料筆數以少數具特徵性的資料點來 代表,以達到資料壓縮的功能。

2、 資料分類:以具有特徵性的代表點來代表特定類別的資料,

可以減少資料筆數來降低資料處理的計算量,並可以避免 或減少雜訊的不良影響。

16

而目前的分類分群法的種類約可概分為兩種,階層式分群法及分 割式分群法:

1、 階層式分群法:階層式分群法是透過資料做層層的階層式 分類的方式,將資料反覆地進行分開或結合,直至目標函 數不再改變為止。

1-1、 階層式聚合演算法:將所有資料作為相異並分類,再 將資料或群聚逐次結合。如圖3-1

1-2、 階層式分裂演算法:將所有資料作為相同並分類,再 將資料或群聚逐次分開。如圖3-2

2、 分割式分群法:必須先指定群聚的個數數量,然後藉著反 覆的疊代運算,逐次降低誤差目標函數的值,直至目標函 數不再改變為止。

2-1、K-Means 演算法:是利用分割式分群法中最基本的 方法,由一個反覆疊代的方式,降低目標函數的誤 差值,直至不再改變為止。

2-2、模糊 C-Means 演算法:於 K-Means 演算法中加入了 模糊的概念,藉由模糊邏輯的概念,進一步提升分群 的效果。

2-3、向量量化:是近年來在降低資料的數量上,最常被提 出的方法之一,在整個向量量化的過程中,最重要的 工作,是以這些挑選出來的編碼向量來代表該空間中 全部的資料向量。

17

本研究選擇應用 K-Means 演算法來進行混凝土配比資料庫的分 析應用,K-Means 演算法的優點是簡單易行且運算快速,並且適用於 處理大規模資料,但是 K-Means 演算法存在著以下缺點,首先是需 要 使 用 者 給 定 初 始 的 群 聚 個 數 並 以 此 決 定 各 群 聚 的 初 始 中 心 , K-Means 演算法對於群聚個數以及初始群聚中心的設定與選擇是很 重要的,若其中任一的設定不當都容易使分類的結果落入局部最佳解 的狀況,所以在本研究中也有提出一些解決的辦法。

3-1-1K-Means 演算法基本架構介紹

1、 決定群組數量並決定初始的群聚中心點。

2、 將所有資料點做群聚分類,將各個資料點分給最靠近自己 的群聚中心,作為該群聚的資料點,由式子(3-1)。

3、 以相同群聚內的資料點來修正該群聚中心點的位置,以修 正過後的資料點作為新的群聚中心點,由式子(3-2)、(3-3)、

(3-4)。

4、 重新將所有資料點分類給離其最近的群聚中心點,做新的 群聚分類。

5、 再修正中心點位置,重復以上(3)、(4)步驟,直至群聚 中心點位置不再改變。

6、 以最終的群聚中心點做為該群聚的特徵資料點。

18

3-1-2K-Means 演算法基本公式介紹

1、 計算各個資料點與各群聚中心的位置並判斷所屬群聚:

19

20

21

本研究選擇應用監督式學習神經網路中的倒傳遞神經網路訓練 並建構混凝土的強度與坍度預測模型,倒傳遞演算法是一個向前饋入、

多層、監督式的神經網路,由於具有簡易及準確度高的性質,是目前 應用最普遍的類神經網路學習模式,在使用此網路前必須有一筆存在 輸入值與其相對應的輸出值的資料庫或案例做為訓練所用。

22

23

24

3-3Convex hull 演算法介紹

由於類神經網路對於與訓練案例相近的未知輸入值,有較佳的預 測結果並能給予一個合理的輸出值,但是如果是與訓練案例差異過大 的未知輸入值,則類神經網路仍然是無法預測出合理的正確輸出值,

因此希望能界定一個有效的未知輸入值的產生方式,讓類神經網路的 預測成果能更準確有效。

如何界定資料庫的有效區域,有許多學者提出不同的想法,其中 Convex hull 演算法是常被使用的方法之一,Convex hull 演算法主要 是在二維座標中,找出可以將資料庫中所有資料點包圍起來的一個凸 多邊形,且此凸多邊形是由資料庫中的資料點所組成,並利用此多邊 形來定義資料庫的有效區域或無效區域。

本研究應用Convex hull 來設定隨機配比組合的有效區域,以此 提高隨機配比的可用性。

25

3-3-1Convex hull 演算法建立有效區域方法介紹

1、 以座標點(0,0)為初始點。

26

3-4 系統整體架構介紹

如圖3-7 所示,首先由使用者依照使用需求,由需求的強度及坍 度作為目標值輸入,並決定資料搜尋範圍的上、下限值,若有符合的 配比資料則進入第一種配比設計程序(系統一),若資料庫沒有符合的 配比資料則進入第二種配比設計程序(系統二)。

3-4-1 系統一介紹

當使用者輸入所需的目標強度以及坍度時,授予目標值一個合裡 的搜索範圍,再比對搜索資料庫內的所有配比資料,當有符合的配比 資料被搜尋到時,便會開始進入系統一的處理程序:

1、 首先將所有符合的配比設計資料找出。

2、 利用 K-Means 演算法將資料做分類的分析,如表 3-8 所示。

2-1、首先將所有的配比資料分作為一群組作為初始值。

2-2、利用 K-Means 演算法進行計算,並找出該群組所代表 的群聚中心的位置,由式子(3-2)、(3-3)、(3-4)。

2-3、將所有群聚內的配比資料點,對其群聚中心的位置做 差異度的計算,由式子 (3-13)、(3-14)。

2-4、檢查所有配比資料點與群聚中心的差異度,是否有大 於所設定的差異許可。

2-5、是,就將資料的分群數量多加一群,再從步驟 2-2 開 始重新找尋各自的群聚中心位置。

2-6、循環以上步驟,直至所有資料點對其所屬群聚的群聚 中心的差異度,皆小於或等於許可的差異度。

27

28

3-4-3 系統二介紹

當使用者輸入所需的目標數值時,授予目標值一個合裡的搜索範 圍,再搜索比對資料庫內的配比資料,當沒有符合的配比資料被搜尋 到時,便會開始進入系統二的處理程序:

1、 首先設定各配比材料含量的上、下限,並以此由電腦隨機 設計出混凝土配比。

2、 由 Convex hull 演算法產生的有效區域,檢測並刪除超出材 料組合有效區域範圍的配比資料。

3、 將合格可用的配比資料,經由類神經網路建構的混凝土強 度模型檢驗判斷,並將符合需求目標的混凝土配比留下。

4、 將符合需求強度的配比資料,經由類神經網路建構的混凝 土坍度模型檢驗,並將符合需求目標的混凝土配比留下。

5、 將所有符合需求強度及坍度目標的混凝土配比資料,經由 K-Means 進行資料分群。

6、 分群後之群聚中心數據,作為使用者需求的目標混凝土的 配比設計。

7、 將產生的混凝土配比設計資料輸出並儲存補充資料庫。

29

相關文件