• 沒有找到結果。

一、線上分析處理的意義

線上分析處理就是一種快速擷取多維資訊和了解企業整體概況的工 具,不但不需要設定特定角度和觀點,而且不需要設定資料層級就可以 最快速的方法瀏覽並分析資料。線上分析處理可滿足企業上對大量的多 維度資訊做分析比較或預測模擬之需求,令企業組織可經由線上分析處 理以洞察營運狀況或藉以協助決策分析。

二、多維度資訊的意義(多度空間的資料分析)

多維度的概念令人聯想起愛因斯坦,讓我們想起他所提出的曲線空 間-時間、平行宇宙與數學公式積分等看法。更令人感到興奮的是,

Microsoft SOL Server 2000 的分析服務被認為可以使用快速、彈性且簡便 的方式,分析大量的資料。

針對任一事物所能觀察的角度應是多元的,因此資料應皆具備多度

空間的性質。要對資訊進行通透且全面的分析與處理,即需要兼顧資料 於各個角度各個空間中所呈現象微的價值,利用線上分析處理即能達到 面面俱到的要求。

三、線上分析處理的分析方式

線上分析處理於資料分析的過程中,包括下列的分析方式:

(一) 下探(drill-down)

線上分析處理除了從多維角度瀏覽資料外,亦注重細部資料中所隱含

(二) 上捲(roll-up)

根據維度層級的關係,縮小成摘要性資料。例如圖二下方為某工廠 一~三月產品生產量,甲工廠與乙工廠生產量互有高低,若欲尋找每季各 工廠生產量的趨勢情形,可經由上捲功能查詢第一季至第四季的生產量 摘要(如圖 2-7),便可發現長期以來,乙工廠生產量明顯高於甲工廠。

單位(千個) 第一季 第二季 第三季 第四季

甲工廠 78 45 34 56

乙工廠 90 67 87 91

單位(千個) 一月 二月 三月

甲工廠 30 26 22

乙工廠 28 30 32

圖 2-7 上捲

(三) 切片及切丁(slicing and dicing)

在線上分析處理系統中是以多維度資料的瀏覽來擷取資料,而多維 度的概念可由立方體的模型來比擬。在資料的分析上,同樣的資料對不 同的使用者來說,會因其所持的觀點不同而代表不同的意義。從不同的 觀點來分析資料可比擬為不斷地切割立方體方式來呈現,所以稱為切片 及切丁(S. Chaudhuri and U. Dayal, 1997)。

(四) 轉軸(pivot)

價值的實用資訊,因此線上分析處理與資料倉儲的聯結是最佳組合。另 外,資料倉儲配合線上分析處理系統,從各種不同角度所分析的結果顯 示出相關資料的差異性,如此一來,使用者可以比較並評量不同的策略,

以及決策後會造成什麼樣的結果,達到更多元及宏觀的資訊分析需求。

四、立方體(cube)的意義

立方體是線上分析處理資料庫的主要物件,使用者必須依實際需求 來建立自己的立方體,例如:與銷售有關的立方體和與庫存有關的立方 體等。立方體包含以下元件(方盈,2001)

(一) 資料來源(data source):

用來定義立方體的資料來源並且連接資料來源的資料庫。例如:可 透過 ODBC 介面定義立方體的資料來源為 Oracle 資料庫上的資料。

(二) 維度(dimension):

維度將立方體內的資料映射成不同層次的資料表示方式,而維度不 外分為人、事、時、地、物等。例如:將銷售資料按時間區分的話就可 區分為日、月、季、年等層次;若按顧客的年齡來分析的話則可依每十 歲一個階層來加以分析。

(三) 量值(measure):

量值一般是立方體資料內的數值欄位(亦可為非數值欄位),也是在整 個分析過程中使用者最感興趣的項目。例如:銷售金額、產品價格、庫

存量等。

(四) 分割(partition):

立方體可以實際需求將它儲存在不同的分割下,例如:將每年的銷 售資料分別儲存在不同的分割下。將立方體的資料分成 partition 的最大 好處是為了查詢效能的考量,因為可以將不同的分割存放在不同的硬碟 上,這樣便能增加查詢的速度。

(五) 角色(role):

角色是用來管理使用者存取立方體內資料的權限控制,分析服務是 以 NT 伺服器的使用者和使用群組帳號來建立立方體的角色,因此並不 需要在分析服務外再另建管理使用者帳號。

五、線上分析處理的資料儲存模式

線上分析處理服務提供了多維式(Multi-dimensional OLAP,

MOLAP)、關聯式(Relational OLAP, ROLAP)及混合式(Hybrid OLAP, HOLAP)三種儲存模式,此三種模式分別有其優缺點,其間的差別在於佔 用的儲存體和查詢效能間的抉擇,詳細說明如下(方盈,2001),三者之優 缺點比較請參考表 2-3(林裕仁,1999):

(一) 多維式線上分析處理:

立方體的內部資料和彙總資料皆擺放在線上分析處理的資料庫內,

以多維度的資料架構(multi-dimensional structure)來儲存。這樣的結果雖然

需要耗費大量的儲存容量,但是卻可以提昇查詢的效率。

表 2-3 MOLAP、ROLAP、HOLAP 之優缺點比較(改自林裕仁,1999)

優點 缺點

資料重複性高、專屬性技術與

六、微軟的分析服務軟體(Microsoft Analysis Services)

在 SQL Server 7.0 時稱為線上分析處理服務(OLAP Services)的資料 倉儲系統,在 SOL Server 2000 將其更名為分析服務(Analysis Services),

基本上都是資料倉儲的觀念與應用,其伺服器端架構如圖 2-9 所示。分析 服務將資料倉儲內的資料處理後,轉換成為一多維架構的儲存方式,這 種架構可提供使用者快速且複雜的查詢。例如:當提出以下的查詢問題 時:

「2000 年電腦類的書籍在台北地區的銷售金額為多少?」

此為一多維架構的查詢。以線上分析處理的術語來看,年、產品類 別、地區稱為維度,銷售金額則為量值,如果將(年、產品類別、地區) 當做一個座標,則該座標所對應的量度值就是答案。

使用者透過分析管理員(Analysis Manager)來管理整個線上分析處理 資料庫。另外,如果覺得分析管理員的功能無法滿足需求的話,亦可透 (Pivot Table)

用戶端 客製化應用程式 媒介資料

(Metadata)

HOLAP

ROLAP

ROLAP MOLAP 微軟管理控制台

(Microsoft Management Console, MMC)

相關文件