1
第一章 第一章 第一章 第一章緒論 緒論 緒論 緒論
第一節第一節
第一節第一節 研究背景研究背景研究背景 研究背景
在八0、九0年代,因市場環境單純,企業組織對資訊的需求較不迫切,
一般傳統關聯式資料庫就足以應付企業經營所需要的資訊。但隨著知識與資訊 科技的發達,我們已進入一個資訊爆炸且競爭激烈的時代,此時,企業組織所 面對的已是一個快速變遷的環境,不管是社會及企業國際化的腳步,或是生活 及消費形態的改變,還是產品的推新與多樣化等,企業組織的經營者或管理者 對決策資訊的需要已日益殷切。而傳統資料庫因為架構及系統擴充性等限制,
已漸無法應付使用者多變且要求時效性的需求,而且當決策分析所需的資料分 布在不同且異質的資料庫時,整合這些資料將是複雜且費時的程序,在凡事皆 講求時效的資訊時代中,因為決策分析的缺乏效率,可能使企業組織因而喪失 先機並降低競爭力[1]。
正因如此,身居電信業龍頭的中華電信不例外,近年來也一直致力於各式 資料倉儲的建設-其中,固網通聯記錄原本以分散方式收集於各營運處的資料 庫,長久以來一直存在許多問題,諸如:
1. 整合性之資訊取得(如全區或區分公司),不僅查詢效能不太好,而且資訊 分散在各營運處 32 台資料庫伺服器整合不易,往往需撰寫大量且複雜的 應用程式,造成維護成本增加。
2. 臨時需要的資訊無法即時提供。
3. 同時管理分散在 32 個營運處資料庫伺服器著實不易,也缺乏完善的備援 及回復機制,若發生任何資料庫伺服器掛掉,需重灌、重 Load,嚴重影響 資訊提供的完整性。
4. 設備維護成本如改集中到三區 UMD 設備,則可節省 35 台設備維護合約之 支出。另原本為彙集分散於各營運處 32 台資料庫伺服器資訊的 32條 T1 專
2 線費用,也可省下。
值此之際,適逢汰換年限,擬改集中於中華電信公司北、中、南分公司三 處資料庫。由於每日固網通聯數量非常龐大,原本分散平行處理模式改為集中 處理,每日約有 5 千萬筆通聯記錄,可否載入順暢?還有,通聯記錄需保存半 年,如此總共約有 90 億筆 5 兆位元組資料量,查詢效能究竟如何?如不理想,
該如何調整?為加快查詢速度,將一些查詢需求預存成資料表,要如何快速更 新這些資料?當資料庫發生損毀,如何快速復原?以及各應用系統容錯設計如 何做?以上各項問題皆是本研究的主要議題。
第二節第二節第二節
第二節 研究目的及意義研究目的及意義研究目的及意義研究目的及意義
資料倉儲的建置是一項浩大且費時的工程,它包含了好幾個階段,而且要考 慮的因素也相當多。本研究以電信業固網通聯記錄為對象,旨在設計及實作有效 率、可提供線上查詢的電信業固網通聯記錄的資料倉儲,取代原先舊有的 32 台 營運處資料庫,解決原先資訊難以整合、台數眾多、管理困難…等問題。既有已 開發的一些應用程式,和通聯記錄分析網頁等所需資料需轉由新建置資料倉儲提 供。如何涵蓋這些既有需求,並提供更有效率、更穩定、及更完整的資訊,正是 本研究之焦點所在。
具體而言,本研究目的及意義如下:
1. 本研究整理及歸納出影響資料庫效能的因素,提出一套建置有效率及穩定的 超大型資料倉儲之方法。
2. 以中華電信固網通聯系統為對象進行實作及效能驗證。與現行系統比較執行 效能,證實即使在固網通聯龐大資料量下,但處理效能仍能保持。藉以證明 所設計之方法,確實可以建置一個有效率及穩定的超大型資料倉儲。
3. 本研究所提出之方法,在經過固網通聯龐大資料量的實作考驗及測試數據證 實效能後,期能提供建置超大型資料倉儲系統之參考。