第四章 實驗設計
第一節 決定模擬範圍、取得綱要、資料與應用
經由實際訪談本研究對象企業以及參考半導體公司專業人士的建議綱要規劃得 知,要滿足多樣化產品、彈性生產製程以及擴充性至少要有下列資料表。茲說明如下:
工單(Working Order)資料
儲存工單的資料,包含工單號碼、工單需求數量、生產產品料號等。
產品(Product)資料
儲存產品資訊,包含產品料號、產品名稱、客戶代號等。
生產製程路徑(Routing)
此資料表儲存每一種產品的生產製程測試路徑資訊,包含產品料號、產測程式、產測 順序等。
產測程式(Test Program)資料
儲存生產測試程式資訊,包含產測程式的 ID、產測程式名稱、測試項目 ID 等。
測試項目(Test Item)資料
儲存測試項目資訊,包含測試項目 ID、測試項目名稱、對應的產測程式等。
測試站(Station)
儲存測試站資訊,包含測試站 ID、測試站名稱、對應產測程式與作業員等。
生產測試紀錄(Production and Test Record)
此資料表真實記錄產品產測過程的所有資料,包含 PCBA 序號、工單號碼、產測程式
ID、測試項目、測試值、測試站 ID、測試人員、測試工時與產測日期等項目。綱要 一採用水平式的設計,截自該企業 2008 年 2 月至 8 月的產測紀錄經過統計之後得知 測試項目有 76 項,故在水平式資料表就需要有 76 個欄位對應這 76 項的屬性;綱要 二是以學界提出的垂直式綱要概念設計,依照企業的生產模式,經過正/反規化之後 產生的資料庫綱要;綱要三是以水平垂直混合式綱要的概念並參考某半導體封測公司 專業人士的建議所產生的資料庫綱要。一般在學界的研究資料庫綱要是以理論式的設 計,且資料筆數不大,在沒有實際運作的情況之下,相對顯得抽象而不具體。在本研 究中,本研究實際取得企業提供的資料庫綱要設計以及 Shop Floor 系統運作的資 料,這也是一般在研究中資料來源最難取得的部份,因涉及商業機密企業通常不願意 提供。在本研究中設計了三種資料庫綱要,故將取得的來源資料分別以三種綱要的型 式存在也是本研究的工作重點項目之一。本研究中的三種綱要,主要的差異在於產測 紀錄(test record)的儲存方式不同,儲存產測紀錄的資料表稱之為生產測試紀錄資 料表。在水平式綱要設計中是在水平式資料表內建立所有測試項目的欄位,以整合所 有產測紀錄所有的屬性;在垂直式綱要設計中是將所有產測紀錄屬性以資料的型態存 在;而水平垂直混合式綱要的設計是結合水平式與垂直式綱要的概念,除了有垂直式 資料表之外並設計一個水平式資料表儲存垂直式資料表中固定不變的屬性並附加彙 總欄位。
為了能更正確的評比三種 schema 模型的效能,擷取該企業在 2005/02~2008/11 的測試資料,水平式綱要的資料筆數為 5,858,066 筆;垂直式綱要資料筆數為 8,704,283 筆。在第二章的文獻探討已經有提過,水平式綱要的設計是所有屬性存在 同一列的 tuple;而垂直式綱要是一個屬性就一列 tuple,故在資料筆數上的差異是 可以接受的。
如前面所述,本研究統計了產測紀錄中的測試項目總共有 76 項加上 2 個固定屬 性(PcbaNo 以及 TestPrgID),設計了含有 78 個屬性的水平式資料表,換句話說,這 個資料表整合了所有產測程式的屬性。由於此資料表含有所有的測試項目,而每一道
產測程式有所屬的測試項目,所以可想而知每一筆產測紀錄並非所有的欄位都是非 Null 值。因此,本研究計算了此生產測試紀錄資料表的稀疏度,得到總稀疏度為 97.71%,符合稀疏資料集的條件,為本研究的效能評估創造有利的實驗環境。
ER-Model 如圖4-1 所示。其中經正規化的程序將Testing Record 資料表重複的 屬性抽離出來成為Testing Result 資料表。之間以Uid 作為參考外來鍵,資料庫綱 要如圖4-2所示。
圖4-1 水平式綱要設計的ER-Model
圖4-2 水平式資料庫綱要