• 沒有找到結果。

Microsoft SQL Server Analysis

3.5 資料倉儲流程

3.5.2 建構資料模型

根據 Kimball(1998)所提出的多維度資料模式,其建立是針對現有的操作資訊系統

(一般稱之為 OLTP 系統)中之綱要及欄位的描述,並考慮事實及系統初始化工作量的 部份,再由資料倉儲系統中的事實去創造資料內的維度綱要(Dimensional scheme),此概 念化的設計架構是根據定義維度事實模式(Dimensional fact model)而來的,其中維度事實 模式是由事實集合所組合而成的,當中的事實是每一個事實綱要的集合。每一個事實綱 要的組合過程均來自於使用者需求,先是根據當中資料屬性的性質,來建立其樹狀的屬 性與圖形化的階層,並對屬性做修改及轉化,再來定義其中所含有的量值、維度及維度 階層。根據維護策略發展出績效指標(Performance Indicator)及影響要因(Factor),形成事 實資料(Fact Data)與維度資料(Dimension Data)的基礎,並以資料綱要(Data schema)

儲存其關係架構,使資料以多維度立方體(Data cube)的方式儲存於 OLAP 伺服器中。

選定事實資料與維度資料

利用個案對象的決策需求,所對應的績效指標衡量方式,包括績效指標及相關影響 因子,尋找其作業性資料庫系統(OLTP系統)的資料來源,依此資訊找出事實資料(Fact data)以及維度資料(Dimension Data),所謂的「事實」就是待分析的數值資料,「維度」

就是維護管理者分析資料的角度,也是資料方體(Cube)中重要的元件,簡單的說,維度

表 16、影響因子轉換為維度資料

表 18、維護成本事實量度

設備利用率(Availability) Calculate 設備使用時間/ (設備使用時間

+設備停止時間)×100%

註1、MTBF:Mean Time Between Failure 註2、MTTR:Mean Time To Repair

註3、Availability:MTBF/(MTBF+MTTR) ×100%

維度層級

在找出相關的維度後,我們必須針對這些維度來建立其層級(Hierarchy)關係,先 是根據維度資料屬性的性質,來建立其樹狀的屬性與圖形化的階層,並對屬性做修改及 轉化,以利在分析資料時可以針對各種不同維度層級對資料做鑽研(如Drill-down、

Roll-up等)分析,如 表 20 為本資料倉儲系統設計之維度層級與參數設定。

表 20、維度層級與參數對照

Second Class Fourth

Class

資料移動與轉換

(ETL

Extract

Transform

Load)

根據英孚美(2000)提到整個資料擷取、轉換、下載的過程中,常因為跨平台異質資 料庫而產生許多問題,基本上有幾個程序及步驟:

一、萃取(Extraction):需要從作業資料庫、檔案和外部資料來源獲得資料倉儲所需 的資料,快速在短時間內擷取資料,可以是經由查詢作業系統資料、報表、檔 案下載、交易記錄、檔案磁帶、客戶程式,諸如此類減少線上資料庫使用度降 低的方式。

二、轉換(Transformation):將來源資料,如作業系統和檔案資料轉換成一種適合分 析和支援決策的型式。舉例來說,等級性(Levels)的作業資訊(如庫存數)能被轉 換成事件(Event)資訊(如收到數量及傳送數量),並使粗細度(Granularity)在相同 等級(月/季/年、縣市/區域)等。當作業系統移到目標倉儲,它能被聚合,創造 儲存價值給經常使用的資訊。接著,使用者會經常要求附加的資料,這樣就能 輕易加上新儲存的聚合,讓使用者詢問的結果快速而有效的呈現。

三、清除(Cleansing):作業資料時常會出現垃圾或不正確的資料,例如:負面價值、

會計平衡、拼字錯誤、錯的歷史資料等。必須清除資料並重新整理以利分析,

並先過濾無效的資料,修正錯誤,建立一貫性。即使中間資料已被檢查,在必 要情況下,該資料亦可被轉換成以圖形顯示在倉儲資料表上,或將欄位轉換成 相同資料型式。

四、整合(Integration):當來源資料被清除或定義好之後,協助將資料對應到倉儲目 標資料庫概要(schema)中,從數個資料庫中整合重要資訊。例如:一個資料庫 建有客戶的名稱和地址,另一個資料庫建該客戶的存貨數量,協助將這些欄位 整合並連結到資料庫中。這是整合階段的成功及特殊之處。

五、載入(Load):必須將擷取、轉換、清理及整合過之資料正確的、快速的載入資 料倉儲中,但需注意載入及更新目的端資料庫方式,如先清除資料表(Table)再 輸入資料、只輸入資料不清除、完全取代目前的資料或只更新目前的資料。