國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
25
產品間競爭也越激烈;另外,向量標示出市場上消費者對不同啤酒的 感官資訊,如特殊場合適合喝的啤酒特徵是口味偏濃且價格偏高的,
如圖中Beck’s 啤酒,而百威啤酒是男士心中最喜愛的啤酒。
由上例可知,知覺圖可以使管理者能夠將產品市場結構中的關鍵 要素進行歸納和形象化,進而進行策略的思考。
第二節、資料倉儲
W. H. Inmon 定義資料倉儲為支援管理決策過程的、主題導向的
(subject orientation)、整合的(integrated)、穩定的(nonvolatile)、
隨時間不斷變化(time variant)的資料集合(Inmon, 2002)。
另一位學者 Kimball 則提出資料倉儲中的資料是自日常交易系統 中抽取出來的,是一群靜態的、可支援決策的資料庫。
從技術的角度來看,具有下列三種觀點(Kimball, 2004):
資料倉儲是一個過程,而不是一個場所。
資料倉儲是一種架構,並不是一種產品。
資料倉儲是需要建造的,公司無法購買資料倉儲。
資料倉儲集合了企業資料之基礎建設,可視為環境架構的核心,
以便讓使用者能快速、簡單的查詢資訊,以及各種分析來幫助管理者 策略的訂定,甚至更進一步延伸資訊成為企業知識。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
26
1、資料倉儲的特性
1.1、主題導向
資料倉儲是以企業關心的主題為導向進行資料的組織,所對於這 些有興趣的主題儲存、提供相關的資料作為分析及多維度的查詢。“主 題"是一個抽象的概念,主要將企業資訊系統中的資料綜合、歸類並 進行分析,它對應了企業中某一分析領域所涉及的分析對象。
1.2、整合性
資料倉儲的資料來自企業操作型的交易處理系統,再加上如前所 述,資料倉儲存儲資料的方式是以主題為導向,對於每一個主題所對 應的資料來源分散在各個系統資料庫中,有許多重複且不一致的現象,
其中可能包括了上百種不同的資料結構、不同的格式、不同的屬性、
不同的命名等等;另外,資料倉儲在資料的應用上,有許多資料需要 經過加總、轉換的處理而無法直接自來源資料取得。對資料倉儲的建 置而言,整合是一項最重要也最複雜的工程。如下圖 10。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
27
圖 10、資料倉儲特性-整合性
1.3、隨著時間不斷變化(時間差異性)
“時間”在資料倉儲中是重要的元素,可視為資料的戳記,每一筆 資料是在某時刻產生的快照,累積快照使資料倉儲保留了每個時間點 活動和事件的歷史記錄;故資料倉儲往往累積了 5~10 年長時間的資 料,並且以時間為資料表主鍵,一筆正確的快照資料一旦被累積就不 會被修改,如下圖 11 所示。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
28
圖 11、資料倉儲特性-時間的變化性
資料來源:Building the Data Warehouse, William H. Inmon, Wiley, 3 edition, 2002.
1.4、不可更新性
傳統作業處理環境會不斷新增、刪除、修改每筆資料,如顧客基 本資料,但在資料倉儲中只有載入與存取兩種動作。當快照轉換到資 料倉儲內,其內容就不會再被改變,以確保資料所反應當時的狀況。
如下圖 12。
圖 12、資料倉儲特性-不可更新性
資料來源:Building the Data Warehouse, William H. Inmon, Wiley, 3 edition, 2002.
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
29
2、資料倉儲的應用
在應用上,資料倉儲可以作為線上分析處理(Online Analytical Processing,縮寫為 OLAP)和資料採礦(Data Mining)的資料來源。
OLAP 主要功能在於操作靜態資料倉儲的資料,以星狀模型(Star - Schema)方式作為資料儲存的結構,見圖 13,將資料組成資料立 方體(Cube)來做儲存,見圖 14。
星狀架構是由事實資料表(Fact Table)儲存各維度資料表的主鍵,
以及欲觀察的測量值(Measure),這些測量值通常具有可累加的特性;
及一連串記錄各個資料表屬性的維度資料表(Dimension Tables)所 組成。
這樣的資料結構讓使用者可以方便的進行多種組合、多種角度、
動態多維度分析,並提供視覺化操作、上捲(Roll - Up)、下鑽(Drill - Down)、切片及切丁(Slice and Dice)以及轉軸(Pivot)等資料操 作功能與展示介面。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
30
圖 13、星狀模型
資料來源:“An overview of data warehouse and OLAP technology”, S. Chaudhuri and U. Dayal, ACM SIGMOD Record, 1997.
圖 14、資料立方體
資料來源:“An overview of data warehouse and OLAP technology”, S. Chaudhuri and U. Dayal, ACM SIGMOD Record, 1997.
關於資料倉儲於資料採礦的應用詳見下個章節,3、資料採礦與 演算法介紹。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
31