建構資料模型 - 資料倉儲流程 - Microsoft SQL Server Analysis

Microsoft SQL Server Analysis

3.5 資料倉儲流程

3.5.2 建構資料模型

根據 Kimball(1998)所提出的多維度資料模式，其建立是針對現有的操作資訊系統

（一般稱之為 OLTP 系統）中之綱要及欄位的描述，並考慮事實及系統初始化工作量的部份，再由資料倉儲系統中的事實去創造資料內的維度綱要(Dimensional scheme)，此概念化的設計架構是根據定義維度事實模式(Dimensional fact model)而來的，其中維度事實模式是由事實集合所組合而成的，當中的事實是每一個事實綱要的集合。每一個事實綱要的組合過程均來自於使用者需求，先是根據當中資料屬性的性質，來建立其樹狀的屬性與圖形化的階層，並對屬性做修改及轉化，再來定義其中所含有的量值、維度及維度階層。根據維護策略發展出績效指標(Performance Indicator)及影響要因(Factor)，形成事實資料（Fact Data）與維度資料(Dimension Data)的基礎，並以資料綱要（Data schema）

儲存其關係架構，使資料以多維度立方體（Data cube）的方式儲存於 OLAP 伺服器中。

選定事實資料與維度資料

利用個案對象的決策需求，所對應的績效指標衡量方式，包括績效指標及相關影響因子，尋找其作業性資料庫系統（OLTP系統）的資料來源，依此資訊找出事實資料（Fact data）以及維度資料(Dimension Data)，所謂的「事實」就是待分析的數值資料，「維度」

就是維護管理者分析資料的角度，也是資料方體(Cube)中重要的元件，簡單的說，維度

表 16、影響因子轉換為維度資料

表 18、維護成本事實量度

設備利用率(Availability) Calculate 設備使用時間/ (設備使用時間

＋設備停止時間)×100%

註1、MTBF：Mean Time Between Failure 註2、MTTR：Mean Time To Repair

註3、Availability：MTBF/(MTBF+MTTR) ×100%

維度層級

在找出相關的維度後，我們必須針對這些維度來建立其層級（Hierarchy）關係，先是根據維度資料屬性的性質，來建立其樹狀的屬性與圖形化的階層，並對屬性做修改及轉化，以利在分析資料時可以針對各種不同維度層級對資料做鑽研(如Drill-down、

Roll-up等)分析，如表 20 為本資料倉儲系統設計之維度層級與參數設定。

表 20、維度層級與參數對照

Second Class Fourth

Class

資料移動與轉換

(ETL

，

Extract

、

Transform

、

Load)

根據英孚美(2000)提到整個資料擷取、轉換、下載的過程中，常因為跨平台異質資料庫而產生許多問題，基本上有幾個程序及步驟：

一、萃取(Extraction)：需要從作業資料庫、檔案和外部資料來源獲得資料倉儲所需的資料，快速在短時間內擷取資料，可以是經由查詢作業系統資料、報表、檔案下載、交易記錄、檔案磁帶、客戶程式，諸如此類減少線上資料庫使用度降低的方式。

二、轉換(Transformation)：將來源資料，如作業系統和檔案資料轉換成一種適合分析和支援決策的型式。舉例來說，等級性(Levels)的作業資訊(如庫存數)能被轉換成事件(Event)資訊(如收到數量及傳送數量)，並使粗細度(Granularity)在相同等級(月/季/年、縣市/區域)等。當作業系統移到目標倉儲，它能被聚合，創造儲存價值給經常使用的資訊。接著，使用者會經常要求附加的資料，這樣就能輕易加上新儲存的聚合，讓使用者詢問的結果快速而有效的呈現。

三、清除(Cleansing)：作業資料時常會出現垃圾或不正確的資料，例如：負面價值、

會計平衡、拼字錯誤、錯的歷史資料等。必須清除資料並重新整理以利分析，

並先過濾無效的資料，修正錯誤，建立一貫性。即使中間資料已被檢查，在必要情況下，該資料亦可被轉換成以圖形顯示在倉儲資料表上，或將欄位轉換成相同資料型式。

四、整合(Integration)：當來源資料被清除或定義好之後，協助將資料對應到倉儲目標資料庫概要(schema)中，從數個資料庫中整合重要資訊。例如：一個資料庫建有客戶的名稱和地址，另一個資料庫建該客戶的存貨數量，協助將這些欄位整合並連結到資料庫中。這是整合階段的成功及特殊之處。

五、載入(Load)：必須將擷取、轉換、清理及整合過之資料正確的、快速的載入資料倉儲中，但需注意載入及更新目的端資料庫方式，如先清除資料表(Table)再輸入資料、只輸入資料不清除、完全取代目前的資料或只更新目前的資料。

在文檔中以績效評估建構建築設備維護資料倉儲系統之研究 (頁 64-69)