OlAP線上分析處理在資料倉儲的應用
一以技職課程資源網站為例(下)
戴建耘袁贊助蔡志宏 臺灣師大工業教育系副教授研究生研究生 ※本文承接35卷9期 肆、 OlAP的規劃與實施一、使用 Microsoft
Analysis Server
在 SQL
Server
7.0時稱為OLAP
Server的資料倉儲系統,在SOL
Server
2000將其更名為AnalysisServer
'基本 上都是資料倉儲的觀念與應用。Analysis
Server將資料倉儲內的資料處 理後,轉換成為一多維架構的儲存方 式,這種架構可提供使用者快速且複 雜的查詢。例如:當提出以下的查詢 問題時: r2000年電腦類的書籍在台 北地區的銷售金額為多少?J 此為一多維架構的查詢。以OLAP 的術語來看,年、產品類別、地區稱 為維度,銷售金額則為量值,如果將 (年、產品類別、地區)當做一個座 標,則該座標所對應的量度值就是答 當F 7但 使用者透過分析管理員 (Analysis Manager) 來管理整個OLAP資料庫。 另外,如果覺得分析管理員的功能無 法滿足需求的話,亦可透過系統所提 供的程式設計介面,建立自己的管理 介面來管理以及控制AnalysisServer
。 二、事實資料之多維度分析 多維度的概念令人聯想起愛因斯 坦,讓我們想起他所提出的曲線空間 一時間、平行宇宙與數學公式積分等 看法。更令人感到興奮的是,Microsoft SOL Server
2000的分析服務
被認為可以使用快速、彈性且簡便的
方式,分析大量的資料。
資料倉儲的資料是由事實資料
(fact
data) 與維度資料(
dimension
data) 所組成。事實資料是能反應過去 事實的資料,而維度資料是為了更方 便、快速的查詢所建立的索引參考資 料(沈兆陽,民90) 。 以教育部技職課程資源網站的資
料倉儲為例,網址為http://course.tvc.
ntnu.edu.tw
(如圖7) ,此網站已搜集 了技職校院86~90學年度五十幾萬筆的 課程資料,我們可將技職課程資料進 多維度分析,畫出資料倉儲之星狀雪 花式綱要,如圖8所示。然後再利用此 分析結果,將欲查詢的條件於OLAP資 料庫中建立維度。29
月一期 仇。 -A0 年一卷 勻 Jh-n 、 J AU--d m 一吉訶 教 』向足 ,+品可』 叫札 7 4 萬布局 羊肉 生"If)
叫
斗
斗
倒可
.單食品jt(9114111) - t新世紀體草草首飾資培當工作叫聲世界犬不同性較富吾吾先與變化研習 貪L 開 113120J -[f九+一年度各割據種變展中心工作計量 J (草葉) J 個 113113月 -..1鎧盤還接起身L(9113112).
[路可壇上傳注意事項 l (9113161 -..1聾趙金鐘 L[911314J ﹒ I 鑽研公告 1 丸+年度最斬草,祖上iW IIIMl:lf對個 1121261 ﹒丸+l\!:~墅區體新撮 IUI.I重視台區宜昌車會寶貴 t1019 、 16 ‘ 1 81tl當 [9019113月 -If餌 1唱團鎚賀科畫幅位站 itll"lUIH峰上 7· 歡迎爐"人矗學河 f·[9016121J 圖7 技職課程資源網站首頁 -唔這起辜翹起運組-高茍堅二月戶 科 目 學 校 科目頓別C
學校額別C
科目類別編號 N 課程分析事實/
學校類別騙號 N科目名稱
~~
學校鍵c
~ 學校名稱C
科目名稱編號 N、科目i鍵
C
學校名稱偏號 N W 會員鍵C
校制鍵‘、‘
aC
/
學制鍵C
、
、\
會 員 .時間鍵N
'
校 制 會員群組C
f
、
會員代號 N 時間 學 制 校制名C
會員名稱C
校制名編號 N 學年度 N 學制名C
學期N
學制名編號 N 圖8 授職課程資料倉儲之星狀雪花式綱要 2002年 10月 生活科技教育35 卷 10期30
三、建立及處理Cube 當我們建立好維度之後,繼續要
建立Cube' 並選取Cube要和那些維度
搭配處理,以技職課程資源網為例, 假設我們想知道各學校各科系每學年 度開課總學分數的統計情形,可以依 前述多維度分析的結果,將Cube的維 度建立成如圖9的架構,並且將量值設成「學分數 J '即可得一統計結果(如
圖 10) 。 圖 10 內很清楚得知各個開課年度 各校的學分數統計情形,但也發現了 資料庫內有些資料的不正確,例如: 不應該有 0 、 78 、 8 的年度,因此我們 可斷定此為輸入錯誤的資料,進而至 資料庫中將資料做修正。然後,將各 開課年度展開成圖 11 的畫面,即可查 知各級校制的統計概況;若要進一步 得知更細部資訊,即可展開某校制的 集合如圖 12 的畫面。因此,利用 OLAPd
U瓢繳蜓點發
迋j
圖9 技職課程資料倉儲之多維度架構31
2002年 10月 生活科技教育 35卷 10期圖 10 各開課年度的早分數統計 'I育研 圖 11 展開書開課年度的統計情形 仇" 在 r、 J 、、 J 店門 JtJR 戶,何又 「'一盔, 7 。一卡叫凡 , aZEι 寸』 4Fj-t 小 1 守主仁 1 0-γ 仇
mrt
;7
'>2
1甘心 展開 90年價:一 t9 及三 7型的統計情取 技術不但可以對資料倉儲做統計及分 析,還可檢竅資料庫的正確性與完整 性。 {五結論 一個成功的OLAP 系統必須具有高 度的彈性,能夠隨時面對使用者新的 需求。然而,要發揮OLAP的功效,仍 是得依賴其所支援的資料庫,而且具
n
備龐大的資料量與好的資料品質,才 能分析出高價值的實用資訊,因此 OLAP與資料倉儲的聯結是最佳組合。 另外,資料倉儲配合OLAP系統,從各 種不同角度所分析的結果顯示出相關 資料的差異性,如此一來,使用者可 以比較並評量不同的策略,以及決策 後會造成什麼樣的結果,達到更多元 及宏觀的資訊分析需求。 2002作 10}j IF.it有利校教育站在 10則此外,或許大家一定對如何將 OLAP的結果,如何以HTML的形式顯 示於網站上供人查詢感到好奇,大家 可先至http://course.tvc.ntnu.edu.tw網站 查看課程數量統計情形,它就是將 OLAP與網頁結合的一項成果,由於過 程有些複雜,容作者再行另寫文章說 明之,敬請期待。
參考文獻
方盈(民90),
SQL Server
2000中文版 徹底研究。台北,博碩文化。 沈兆陽(民90) ,資料倉儲與AnalysisService-SQL Server
2000的OLAP解
決方案。台北,文魁資訊。 林宏諭(民90) , SQL2000之決策分析 OLAP建置與應用。台北,博碩文 化。 林裕仁(民88) ,資料倉儲應用實例之 建置與系統效能分析之研究。國立 2002年 10月 生活科技教育35卷 10期
34
屏東科技大學資訊管理所碩士論文。
張世敏編譯(民 90) ,輕鬆搞定 SQLServer
2000分析服務。台北,微軟闡 書。 莊雅賽(民87) ,資料倉儲的技術與發 展,美國資訊科學學會台北學生分 會會訊 '11 期。頁79-99 。 資通電腦(民 85) ,資料倉儲系統(Data Warehousing
System) 簡介
(上)。資訊與電腦,第194期。頁
127 。
嚴紀中和古政元(民89) ,資料倉儲與
資料超市之評估與規章,資訊與電
腦, 240期。頁38 。