第三章 台灣區花卉資料倉儲資料整合實作
3.2 總資料倉儲整合工作
總資料倉儲的設計關鍵要點,主要是希望能同時顯示出台北、台中、彰化、台南及高 雄五家資料超市的資訊。但是基於此五家超市各為不同設計者所設計,且在於各家資料超 市的資料內容存在些許差異。因此首要工作就是將相關欄位名稱以及資料表內容都先行一 步做整合,如此一來才能使總資料倉儲的資料轉換工作順利地繼續進行。本節共分兩小 節,第3.2.1 節介紹總資料倉儲之設計架構;第 3.2.2 節說明資料整合方式及其結果。
3.2.1 總資料倉儲架構
資訊共享是一種達到雙贏的理念,但是並非所有資訊皆能分享。總資料倉儲為了避免 一些私密性的資料外洩流通在外,以及基於資料傳輸速度考量上和眾多使用者訴求,必定 要刪減不必要的維度。與先前各家資料超市互相比較,總資料倉儲明顯多了特殊節慶以及 市場別的維度,而在供應單位中之所以減少供應人層級部份,目的是為了避免個人資料遭 致外洩的可能,表3.3 為總倉儲與各家資料超市維度架構之比較。
表3.3 總倉儲與各家資料超市維度比較表
維度 總倉儲 各家資料超市
供應單位 無供應人層級 有供應人層級
節慶 有 無
市場別 有 無
供應地區 有 有
日期 有 有
星期 有 有
農曆 有 有
拍賣線 有 有
花卉種類 有 有
花卉等級 有 有
容器 有 有
承銷地區 有 有
判斷 12 有 2 無 10 有 統計 共12 個維度 共10 個維度
3.2.2 資料整合工作
當進行資料轉換服務的前置工作時,必須先將台北、台中、彰化、台南、高雄五家資 料超市的資料表做進一步整合,以制訂出共同標準。此外,除了日期、星期、農曆、花卉 等級四個維度的資料表所屬欄位內容不需加以整合外,以及新增的節慶、市場別維度以 外,其他維度皆需要採取聯集方式進行統整。
表3.4 整合對照表為整合各家資料超市的資料表後的情形,每個欄位所具代表意義各 不相同,如欄位一表示維度類別,然而在最後一列另外加入Fact Table,並非維度之意;欄 位二內容為五家資料超市內的原始資料表,基於方便了解之考量,故以統一代稱命名,不 加贅述;欄位三為總資料倉儲經過聯集整合後的資料所新建立出的資料表;欄位四為因應 整合需求所新建在各家資料超市的轉換資料表如圖3.10 高雄供應類別對應表、圖 3.11 高雄 供應鄉鎮對應表、圖3.12 高雄承銷地區對應表,以高雄資料超市為例,之所以新增了高雄 供應類別對應表,目的是要做為總資料倉儲內供應單位與其對應的高雄資料超市內供應類 別的對照表,以便有效地進行資料轉換的動作。
圖3.10 供應類別對應表
圖3.11 供應鄉鎮對應表
圖3.12 供應地區對應表
表3.4 整合對照表
維度類別 各花市初始資料表 總倉儲最終整合資料表 各花市轉換資料表
供應單位 供應團體資料表、供應類別 供應單位 供應類別對應表
供應地區 供應行政區資料表、供應縣
市資料表、供應人資料表 供應縣市、供應鄉鎮 供應鄉鎮對應表 日期
星期 星期表 星期
農曆 農曆對照表、農曆年、月 農曆對照表、農曆年、月
節慶 節慶範圍資料表、節慶類
別資料表
市場別 市場別
拍賣線 拍賣線資料表 拍賣線
花卉種類 花卉資料表、花卉品名資料 表、花卉種類
花卉種類、花卉品類、
花卉品名 花卉等級 花卉等級略表、花卉等級資
料表 花卉等級、花卉等級二碼
容器 容器資料表 容器
承銷地區 承銷人與承銷區域資料表 承銷地區 承銷地區對應表
事實表 拍賣資料表 總倉儲交易資料表