第三章 研究方法
第二節 系統需求與架構
資訊科技改變了全人類的生活步調,而掌握資訊更成為 e 世代成功的 致勝關鍵。如何能在充滿資料、資訊的礦山中,點石成金,提煉出智慧 之金,打造競爭的優勢,自從網際網路 (internet) 和全球資訊網 (World Wide web) 快速發展以來,資訊累積成長的速度可謂驚人。自由時報 (02/11/2003) 報導指出,自 1999 年起,全球所製造的資訊量每年成長 30
%,你看到的是資訊或垃圾? 擁有大量的資料與資訊並不具價值與競爭 力 , 除 非 轉 成 為 知 識 (knowledge)。 知 識 雖 然 經 由 資 料 (data) 、 資 訊 (information) 轉化而來,卻有別於資料與資訊,三者之間的關聯性可簡述 如下:
資料:對事件、物體、活動的客觀紀錄,為尚未處理的文字、數據。
資訊:資料經過有意義的處理與組織,即成為資訊。
知識:資訊進一步加入人類的經驗,並透過思考、分析等過程,在 面對問題時所表現的認知、學習、經驗與專業知識。
由以上得知,單純擁有大量的資訊與資料,是無法使個人、組織、企業 或國家創造價值,如果能將這些收集到的資料與資訊有效地轉化為知 識、創造價值,企業組織或個人才能永續成長,所以知識才是將危機轉 化為轉機的時代新利器,更是成為競爭力提昇與成長的關鍵要素與主要 驅動力。
Nancy and Jerry (2007) 指出,隨著網際網路的風行及資訊科技的進 步,使得資訊的流通變得更通暢,而在這資訊爆炸的時代中,有許多資 訊是相當值得用來作為決策分析之用的,但這些資訊有時候不僅數量龐 大,且會在短時間內更新,因此若要藉由這一類的資訊來進行決策分析 之用,實非易事。建立資料倉儲系統,主要的功能在於儲存歷史性的資 料以做為未來分析提供決策支援之用;除了硬體設備的添購外,最重要
的部分則屬於資料模式的設計,以及資料的擷取及儲存;而為求資料的 完整一致性,往往資料的擷取過程,需要大量的網路資料傳輸以及程式 的過濾及處理。而若要在短時間內完成大量的資料的處理工作,很有效 率的方式進行建置資料倉儲中的工作,快速的將資料從網路上擷取回 來,過濾不必要的部分,存入已經規劃好的資料倉儲中。其主要目的在 於將企業所收集的資訊,及時轉化成瞭解客戶的需求,成為企業應採取 的策略以滿足客戶之需求。
企業開發一個新客戶所發生的成本,是維持一個原有客戶的五倍。因 此,如何掌握企業現有客戶的特性,並加以維持滲透,即成為企業在創 造利潤時重要的任務之一。企業可有效利用各種資訊蒐集、分析等方 式,確實掌握現有客戶的狀況,再擬定行銷策略。而資料探勘與資料蒐 集可由客戶資料庫以及產品資料庫獲得。企業只要在及時系統所收集的 資料能有效率的對這些資料加以建檔,在完整的資訊運用分析下,將更 能發揮資料探勘的效用。客戶資料的獲取方式部份,可透過網際網路入 口網站,直接取得在外部的次級資料,特別是市場面整體的報告,資料 處理最終目的是要支援管理決策的制訂。經由資料探勘可支援諸多管理 決策之制訂,包括銷售預測之分析、生命週期之規劃、營業目標之訂 定、目標市場之界定及產品組合之規劃等。不過,值得注意的是,市場 上流通的資訊包羅萬象,然而真正對企業具有意義的資料往往有限。在 不恰當資料的輸入分析下,自然容易產生垃圾進、垃圾出(Garbage in Garbage out )的不效率情形。因此,如何選擇適當的資料納入資料庫,
乃是企業在實行資料探勘時很重要的一項基本工作。在資料類型的部 份,客戶的歷史資料與產品資料,均是重要的整合項目。長年累積在企 業或組織內部龐大的歷史資料往往是決策者用來做決策的重要資源及依 據,將資料轉換成有用的資訊,進而提供決策者做正確的決策。要將龐 大的資料轉換成為有用的資訊,必須先有效率地蒐集資訊。隨著科技的 進步,功能完善的資料庫系統就成了最好的蒐集資料的工具。從資訊技
術的角度來看,資料倉儲的目標是在企業中,在正確的時間,將正確的 資料交給正確的人。所謂的資料倉儲,是一個支援資訊處理的整合性平 台,可利用歷史與整合性資料從事各項分析工作。簡單地說,就是蒐集 來自其他系統的有用資料,存放在一整合的儲存區內。所以其實就是一 個經過處理整合,且容量特別大的關聯式資料庫,用以儲存決策支援系 統所需的資料,供決策支援或資料分析使用。在目標導向與整合性的特 性下,資料倉儲可做為查詢、報告、分配資源、決策制定及思考的輔助 工具。因應產品之變動與需求,藉此用來調整企業的營運策略,提升競 爭力。由資料載入開始,從巨量的資料庫中,探勘出不同的資訊與知識 出來,作為決策支援之用,必能產生企業的競爭優勢。而且,從龐大的 資料庫中,尋找有價值的隱藏事件並加以分析,獲取有意義的資訊,以 及對資料歸納出有結構的模式,做為決策時之參考依據。資料探勘在各 領域上的應用相當廣泛,只要該項產業有具有分析價值與需求的資料倉 儲或是資料庫,都可以用探勘工具進行有目的的探勘分析。
有效的客戶關係管理,可幫助企業正確的了解客戶、掌握客戶,同時 運用效率性的資料探勘,確實的滿足需求。就企業運作的角度來看,客 戶資料的蒐集、分析、散播與運用,乃是跨越整個客戶滿意的實踐過 程。企業的價值取決於所擁有的客戶數量與品質,當所獲得有價值的客 戶越多,企業獲利的機會也就越高。此外,不同區隔的客戶,所能創造 的利潤大小亦會有所不同,在資源有限的情況下,企業應能選擇最佳的 客戶投注資源,方能在最有效率的情況下獲利。因此,在客戶分析的工 作中,企業應能利用各種相關的指標,評估客戶能為企業帶來的價值為 何,同時並據此選擇真正能創造利潤的客戶,做為主要的目標客群。而 透過資料探勘的分析,企業可以很容易地對客戶進行價值分析,並針對 不同價值客戶客進行不同的資源分配,以及採取不同的行銷策略。本研 究的系統架構中所指的外部資料提供者的部分,即為資料的來源。基本
上,在外部資料提供者的選擇上,盡量以大型的網站為主會比較不容易 在資料擷取的部份發生問題,因為大型的網站通常服務提供中斷的情況 較少發生,在本研究中所提出要處理的資料,並非儲存在資料庫中的資 訊,而是在網際網路上的各種資料,而研究中所要處理的資料有幾項特 點:
一、數量龐大
由於資料量龐大的關係,因此進行分析處理就特別不容易,必須使用 效能強大的電腦,或是在分散式的環境下才有可能進行處理。
二、即時且變動非常快速
這些資訊通常變動的非常快速,可能一分鐘內就變動了好幾次,因此 若要處理這一類的資料,就必須要能夠在短時間內將這些大量的資料 擷取完畢。
三、公開於網際網路上
由於這些資料大多數都可以透過網際網路取得,因此不論是透過瀏覽 器,或是寫程式自動擷取,都可以作為取得資料的途徑。
知識經過審慎的選擇與獲得之後,接下來便是將知識儲存起來,儲存 知識需要可用、安全並以對使用者來說有用的型態存在,要將知識儲存 系統化、標準化、整合建檔,就必須建置成資料庫或知識庫。可將相關 資訊或知識建置成資料庫或知識庫環境,透過資料庫管理系統或知識庫 管理系統,將資訊或知識集中管理,並將輸入的格式一致化,達到資 料、知識整合、統一管理的目的,以便於日後隨時查詢與應用,進一步 達到資源共享的目標。客戶關係管理不再只是針對客戶來討論,而是提 供 一 個 整 合 企 業 內 部 所 遭 遇 問 題 之 廣 泛 解 決 方 法 , 並 且 結 合 人
(People )、產品(Product)與資訊科技(Technology)形成一個革命性 衝擊的新觀念。在這樣的趨勢演變下,隨著企業對顧客的重視日益提
高,資料探勘亦成為當今熱門的企業成功關鍵之一。資料蒐集是資料探 勘過程中一重要憑藉,若無精確的資料來源,再完善的分析規劃亦徒勞 無功。客戶資料來自市場中的各種管道。這些來自各種管道的資料被組 合,應用資料探勘進行處理,從中得到企業用於向特定客戶進行行銷的 決策資訊。資料挖掘 (Data Mining) 是目前在資料分析運用上較新穎的方 法,主要是將一般資料庫中看似無用的資料 (Data) 轉換成有用的資訊 (Information) 與知識 (Knowledge),並找出隱藏之關聯性。所有的方法都 有多項的應用技術,但主要仍以挖掘潛在的資訊與知識為目的。資料挖 掘能做些什麼呢?它能夠避免風險 (Risk) 與欺騙 (Fraud)、預測目標客 戶行為、制定產品方向與瞭解客戶以及業務之推行。由此可知資料挖掘 之應用範圍相當廣泛,並且可以幫助我們找出潛在之隱藏資訊,以利未 來制定策略之推展。
本研究將嘗試應用資料挖掘的觀念與分法,先針對目標客戶資料加以 區分收集,找出所有的特徵屬性,除了與使用者互動外,系統可自動化 的合併目標客戶資訊個數,取出更重要的全體目標客戶特徵屬性。本研 究之貢獻在於利用網際網路經由程式收集與電腦硬體架構儲存,以及輸
本研究將嘗試應用資料挖掘的觀念與分法,先針對目標客戶資料加以 區分收集,找出所有的特徵屬性,除了與使用者互動外,系統可自動化 的合併目標客戶資訊個數,取出更重要的全體目標客戶特徵屬性。本研 究之貢獻在於利用網際網路經由程式收集與電腦硬體架構儲存,以及輸