• 沒有找到結果。

資料探勘的應用

在文檔中 中 華 大 學 (頁 30-33)

第二章 文獻回顧

2.4 資料探勘

2.4.3 資料探勘的應用

陳佳楨(2003)【16】為了減少病患往來醫院的次數,及增加病患可選擇到 院看診的時段,以提升醫院經營效率及服務品質,於是將資料探勘技術的關聯 式法則應用在就診行為與醫師排班的研究。研究對象為埔里基督教醫院民國89 年全年之門診紀錄,篩選相關資料,如病歷碼、看診科別、看診時段、看診日 期,並新增星期別及週別兩欄資料。最後探勘的資料項目有五:流水編號、病 歷號、週別、「醫生代碼」集合(看診診別)、「星期別+時段+醫生代碼」

集合。醫生代碼為病患看診診別集合,而「星期別+時段+醫生代碼」集合是 為了要陳述時間順序的特性。其研究直接選取前200 組最具影響性的關聯法則 來做排班,評估準則為便利度。結果顯示將求診頻率高的醫師組合排在同ㄧ時 段,確實提升病患便利度及醫院服務品質。

陳文杰(2004)【15】為了找出交通意外發生原因以避免事故發生,將資料 探勘應用於交通事故分析,探討高速公路事故發生的主要因素,也將資料探勘 結果與統計結果作ㄧ比較。研究對象為90.01~92.12 共 24 個月內在高速公路發 生事故為對象,透過資料探勘(分類與迴歸樹)與統計方法(負二項迴歸)來進行分 析。結果發現,透過資料探勘可得出當交通流量分別到達4,677 及 2,096 時,有 較高機率會發生事故,而此現象是透過統計方法(負二項迴歸模式)所分析不出 來的。不過,在預測率方面,資料探勘與統計方法的預測率分別為58%及 53%,

差異不大。因此,此研究應證資料探勘技術中的分類樹,不但可以應用在交通 事故分析上,且還能得出統計模式所找不出的特性。

王秀雯(2004)【1】此研究目的是應用資料探勘技術,分析影響事故嚴重程 度的主要原應及影響程度,藉由資料探勘結果與統計模式結果的分析比較,評 估資料探勘在運輸安全應用的可行性,提供改善照是防制工作的參考。研究對 象為90.01~90.12 共 12 個月在台北市發生交通事故的受傷者,透過資料探勘(分 類與迴歸樹)與統計方法(多元羅吉特模式)兩種方法,來比較兩種模式對於影響 事故嚴重程度之變數及預測分類的正確率。結果顯示,在整體預測率而言,資 料探勘技術(分類樹)優於統計方法(多元羅吉特模式)。而在影響事故嚴重程度之 變數,兩者差異不大所找出變數大致相同。因此,資料探勘技術中的分類數是 可以應用在運輸安全領域。

謝文雄(2002)【25】此研究目的是應用資料探勘技術,從龐大的乘客交易 歷史資料庫中,了解客戶的消費行為並根據其行為的不同將其分群,藉此來協 助企業做市場區隔化來辨認目標市場,然後針對這些客戶進行直接行銷,以提 高其忠誠度,並在客戶尚未提出服務之前,就能適時提供適當的資訊給客戶,

進而保留住客戶。研究對象為某五金製造業客戶銷售資料庫,透過資料探勘技 術之群集分析、決策樹分析及關聯式分析等三種方法來探勘。經由群集分析可 將客戶分群,結果顯示僅有14.59%的客戶是屬於忠誠度高且利益高,所以這一 群為目標客戶。而經由決策樹分析可了解大部分顧客交易的頻率及金額多為大 於0.5 次且消費金額小於 2475 元。最後在關聯式分析可發現,忠誠度高的顧客

所購買的產品為四輪車,且若產品有購買風輪架和水泥車,通常也都會在購買 四輪車。

陳麗君(2003)【17】運用資料探勘技術的自我映射組織和模糊決策樹,建 立了信用卡黃金級客戶族群的特徵模式,以瞭解黃金及客戶的特徵組合。接者 利用黃金客戶過去消費的歷史資料,透過資料探勘的方法挖掘黃金及客戶在不 同時間區段其行為改變的趨勢。研究對象為某銀行發卡中心 90.01~91.12 共兩 年的歷史資料,期望發卡銀行可以從模式中,預測出目標客戶,將有限的資源 投注在重要的目標客戶群上,讓行銷效益更為豐碩。且也從顧客行為改變的特 徵模式,幫助企業挽留流失的黃金級客戶。結果分出等級最低、等級下降、有 潛力型及等級最高等四群。並依照四群給予不同的行銷建議。

許哲瑋(2003)【12】透過資料挖掘技術與多變量統計方法,以美妝保養品 為例,進行資料庫行銷的實證工作。研究範圍包括了產品關聯性分析、顧客屬 性特徵挖掘等二大主題。針對產品關聯性分析之研究,作者利用SAS Enterprise Miner 4.1 版軟體挖掘關聯法則規則,過程是在擷取交易明細資料後,分別利用 因素分析和關聯分析,重新規劃產品組合類別,並作為建立產品推薦系統,和 設計聯合銷售方案的參考,最後比較資料挖掘與多變量統計方法,再分析產品 關聯性時的差異,。針對顧客屬性特徵挖掘之研究,使用SQL 語法結合會員資 料與交易明細後,先以使用率做事前區隔把會員分成二群,再嘗試利用決策樹 學習法,描述各個顧客群的特徵屬性,並衡量潛在顧客成為高價值客戶的可能 性。

邱創政(2003)【9】提出一以顧客消費表現為基礎之群集分析演算法,根據 顧客的消費表現,包括曾經購買哪些商品,以及花費在毎各購買商品的消費金 額,作為顧客市場區隔之區隔變數,進行市場區隔。而該研究之顧客群集分析 演算法,是以K-means 演算法之演算流程架構為基礎,融入關聯法則支持度的 概念,以 RFM 指標做為比較顧客間消費表現的基礎,而其運用基因演算法選 取出使顧客群質心之顧客,以得到較佳且穩定的分群結果。研究對象為某一零 售商所提供的顧客交易資料,以實驗的方式證明其所建構之顧客分群法,確實 能有效地讓每位顧客群內之顧客都有較為相似的行為及模式。

張忠琦(2000)【19】為了能讓企業網頁內容客製化,提昇企業電子商務的 經營績效及網站的效能,運用資料探勘的技術針對伺服器網站日誌(Web Server logs)與企業網站內容(Web content)進行分析,以能得到每位使用者網站內容瀏 覽模式(Web Content Access Patterns) 。目的在於藉由網站使用度與網頁內容的 結合,能更有效的讓網站管理者了解使用者瀏覽企業網頁的行為規則,並且依 據網站內容瀏覽規則作為改善企業網站的內容配置與網站架構的參考。作者以 撰寫WAP-mine 演算法來找出瀏覽模式,WAP-Tree 會紀錄 Event Label、Count、

Label link 三件事,而 WAP-mine 演算法概念類似關聯式法則支持度的觀念,最 後再用K-means 的分群技術依照每位使用者的瀏覽特徵分群,做出客製化的網 頁內容。

邱義堂(2000)【10】運用資料探勘技術,針對電信業者發展一客戶流失預 測模式,以協助企業解決客戶流失問題。作者摒棄以往用用客戶基本資料、人 口統計及消費歷史資料等資料來分析,改用電信業者現有的營運資料來研究預 測流失客戶模式(如租用期間、繳費方式、申裝類別),經由對客戶大量通聯 記錄的分析(平均每日使用時間、平均每日使用次數),探索客戶退租前通話 行為變化,從中尋找流失徵兆,進而發展有效的預測模型。作者以C4.5 決策樹 歸納技術,再運用多專家決策(Multi-expert Strategy)分類方法做預測分類。研究 對象為某電信業者2000 年 10 月到 2001 年 1 月的客戶資料,經實驗驗證;該研 究模型選取 10.03%之全體客戶,平均可預測出有 50.64%的客戶會流失;若選 取29.00%全體客戶中,平均可預測出有 68.62%的客戶會流失。

表2.4 資料探勘應用領域相關文獻彙整

研究者 研究主題 應用對象 應用方法

張忠琦(2000) 資料探勘於網站使用度與網

頁內容探索之研究 網頁瀏覽 WAP-Tree 邱義堂(2000 通信資料庫之資料探勘:客戶

流失預測之研究 電信業者

C4.5 決策樹

(分類分析的一 種)

謝文雄(2002) 以資料探勘探討顧客消費之 行為

零售製造

業 群集分析

陳佳楨(2003)

資料探勘應用於就診行為與 醫師排班之研究─ 以埔里基 督教醫院

醫院排班 關聯式法則

邱創政(2003) 以消費表現為基礎之顧客群

集分析 金融業 群集分析

陳麗君(2003) 應用資料探勘技術於信用卡

黃金級客戶之顧客關係管理 金融業

類神經網路

(群集分析的一 種)

許哲瑋(2003)

資料挖掘與統計方法應用於 資料庫行銷之實證研究─以 美妝保養品業為例

化妝品 關聯法則

陳文杰(2004) 應用資料挖掘技術於高速公

路交通肇事次數之研究 交通預測 分類+迴歸樹

王秀雯(2004) 應用資料挖掘技術於交通事

故傷亡嚴重程度之研究 交通預測 分類+迴歸樹 資料來源:本研究整理

在文檔中 中 華 大 學 (頁 30-33)