• 沒有找到結果。

第二章 文獻回顧

2.3 資料倉儲

Mart),並藉由資料通道(Data bus)及制式化維度(Conformed Dimensions)的相關概念,將下 層所有資料超市利用最有效率的方式集結成為一個主要的總資料倉儲。由於花卉資料倉儲 概念建立在由下而上的建置方式,故以下只針對兩種資料倉儲建構之其中一種競箥模式詳 述其內容。

競箥模式:

競箥的資料倉儲模式架構主要是以維度資料建模法(Dimensional Data Modeling)來建 置出資料倉儲。然而,於維度資料建模法中,它採用資料表來做為建構模式的基礎,而非 運用以往傳統式的實體關聯圖。在競箥模型中,其資料表之構成要素包含事物表(Fact Table) 及維度資料表(Dimensional Table)。

事物表內所存放的資料列是大量且不允許重覆的。歷史資料往往都成千上萬筆,較少

分別為圖2.6 的星狀綱要(Star Schema)、圖 2.7 的雪花綱要(Snowflake Schema)、圖 2.8 的星 座綱要(Fact Constellation Schema)[12]。

圖2.6 星狀綱要圖

(Fact Table) 維度資料表 (Dimension Table)

維度資料表 (Dimension Table)

維度資料表 (Dimension Table)

維度資料表 (Dimension Table) 維度資料表

(Dimension Table) 維度資料表 (Dimension Table)

要還要來的低。 Constellation),統稱為星座綱要圖(Fact Constellation Schema)。如圖 2.8 所示。

圖2.8 星座綱要圖

競箥模式之資料倉儲建構概念是由下往上的方式,基於單一的商業流程立足點因而建 事物表

(Fact Table) 維度資料表 (Dimension Table) 維度資料表

(Dimension Table) 維度資料表

(Dimension Table)

維度資料表 (Dimension Table)

事物表

立一個資料倉儲,競箥將此種架構的資料倉儲稱之為資料超市。對許多企業組織而言,其 內部同時包含多個商業流程可能性很高。因此在建置資料倉儲的過程中,需要針對每個不 同商業流程建立所屬的資料超市,爾後再將這些數個資料超市利用最有效率的方式進行向 上整合出一個整體的資料倉儲。

競箥建議最好一次建置單一個資料超市的方式做考量為其發展方法論,並針對單一個 資料超市的建構,分別提出四個維度化設計之流程步驟。即(1).選擇商業流程:競箥賦與商 業流程非常廣泛的定義,其定義可能包含有零售的銷售點、存貨、訂單等。故建議選擇一 個最有影響力的流程作為資料倉儲的首要商業程序的依據,其最有影響力在這裡是指當選 擇此流程對於最迫切的商業問題可以被順利解決。(2).定義資料細度:定義資料細度在此可 以解釋為決定資料倉儲中所包含資料詳細程度的流程。另外最為底層且詳細的資料細度稱 為原子(Atomic),也就表示不能再被細部分割的資料。針對如何才能選擇出最適當的資料 細度是非常重要的一門學問,因為不適當的選擇資料細度,會影響資料倉儲的使用者對於 資料分析上受到非常大的限制,例如某資料倉儲內僅包含每月資料而受限於缺少每月的資 料。(3).選擇維度:完成資料細度的定義後,接下來將選擇適當的維度資料表。在於大量的 屬性維度資料表內,它主要提供使用者進行更多面向的資料查詢。(4).確認事物表中的衡量 值:在於流程的最後一步則是決定事物表中的衡量值。衡量值的選擇對於系統開發者而 言,不僅具有更多的查詢結果同樣地也決定了資料倉儲系統的效能。

以競箥所提倡的維度資料建模法來說,把資料表作為其架構,其主要包含事物表及維 度資料表兩個基本組成要素。另外,競箥重視於流程導向的資料模式,嘗試地去找尋不同 商業流程間存在的交互作用。換而言之,就是找到資料倉儲中重要的衡量值(Measures)與 屬性(Dimensions)。選擇建構一個競箥模式的資料倉儲,花的時間也就比較少,效率也就相 對提升。

2.3.2 線上分析處理

在1993 年 Codd E.F 提出線上分析處理(On-Line Analytical Processing, OLAP)的概念 [13][10],簡單的來說,它是一種應用程式有著能夠直接存取資料倉儲且本身具有資料分析 的功能,而非僅僅只是作為報表工具的替代品。超方體(Cube)為資料倉儲裡資料的表示型 態,使用者透過線上分析處理機制對維度及衡量值進行操作,則可以對資料做適當的加值 應用,藉此獲得一定程度的資訊需求。

線上分析處理的基本十大操作方式,可分為兩個主要層面,第一個層面與維度有關的 操作,例如上捲(Roll-Up)、下挖(Drill-Down)、切片(Slicing)、切丁(Dicing)與轉軸(Pivoting) 五種。第二個層面與衡量值有關的操作,有視覺化(Visualize)、篩選(Selecting)、輸出 (Output)、排序(Sorting)及計算(Computing)五種,整理如表 2.10 所示。

表2.10 OLAP 基本十大操作說明表

層面 操作方式 解說 上捲(Roll-Up) 將維度的單位向上放大 下挖(Drill-Down) 將維度的單位向下縮小 切片(Slicing) 限制某維度的上下限範圍 切丁(Dicing) 限制多維度的上下限範圍 第一層面

(與維度相關)

轉軸(Pivoting) 把水平維度與垂直維度做交換(90 度) 視覺化(Visualize) 把數值化的衡量值利用圖形表達 篩選(Selecting) 限制住衡量值的範圍

輸出(Output) 將衡量值另儲存為檔案並供加值應用 排序(Sorting) 將衡量值由大到小或由小到大排列 第二層面

(與衡量值相關)

計算(Computing) 用特定程式來修改衡量值

線上分析處裡大體上主要可分為三種資料倉儲儲存體的型態,分別為多維度線上分析 處 理(Multidimensional On-Line Analytical Processing, MOLAP)、關聯式線上分析處理 (Relational On-Line Analytical Processing, MOLAP)、混合式線上分析處理(Hybrid On-Line Analytical Processing, MOLAP)。將於下列分別解說其意義,其意義分述如下。

1. ROLAP:利用傳統的關聯式資料庫來存放並彙總資料,其好處是利用現有儲存架 構,因此比較容易完成,但是查詢效率可能較差與所能儲存的空間較小的種種缺 失。

2. MOLAP:真正的多維度資料庫結構來存放彙總資料,好處是查詢效率相對之下比 ROLAP 較高、儲存空間較大、維護成本也低,但其缺點是必須重新開發與系統之 擴充性低。

3. HOLAP:為 ROLAP 與 MOLAP 的混合體,受益於 ROALP 較大的可擴延性和 MOLAP 的快速計算,有效綜合了兩種模式的特性,換句話說,也就是在於前兩 者的優、缺點之間取得一個平衡。