• 沒有找到結果。

應用資料探勘技術於分析電信網路障礙查修資料 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "應用資料探勘技術於分析電信網路障礙查修資料 - 政大學術集成"

Copied!
122
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學資訊科學系 Department of Computer Science National Chengchi University 碩士論文 Master’s Thesis. 政 治 大. ‧. ‧ 國. 學. 立 應用資料探勘技術於分析電信網路障礙 查修資料 Applying Data Mining Techniques to Analyze Troubleshooting Data in a al Telecom Network v ni n. er. io. sit. y. Nat. Ch. engchi U. 研究生:陳心睿 Hsin-Jui Chen 指導教授:徐國偉 Kuo-Wei Hsu. 中華民國一百零四年四月 Apr 2015.

(2) 應用資料探勘技術於分析電信網路障礙查修資料 Applying Data Mining Techniques to Analyze Troubleshooting Data in a Telecom Network. Student: Hsin-Jui Chen 治 政 大 指導教授:徐國偉 Advisor: Kuo-Wei Hsu 立 研 究 生:陳心睿. 碩士論文. ‧. ‧ 國. 資訊科學系. 學. 國立政治大學. Nat. n. er. io. sit. y. A Thesis submitted to Department of Computer Science al National Chengchi University iv n C h e n g cofhthe in partial fulfillment i URequirements for the degree of Master in Computer Science. 中華民國一百零四年四月 Apr 2015.

(3) 摘要 現今維修部門不僅是技術導向,還趨向服務型態,更是行銷的利器,背後潛在之價值 更難以估計,客戶也願意選擇較專業且迅速維修的品牌。欲使維修人員績效更佳,客戶感 覺良好,進而得到口碑,以留住老客戶並吸引新客戶。此研究將以電信障礙查修資料為例, 著重於探勘電信數據網路之修復記錄,修復記錄包含客服人員判斷之申告原因、各區域測 量台人員進行之測試內容及查修人員至現場實際修復回報結果。. 政 治 大. 網路服務為現代人生活不可或缺的一部份,若遇到線路障礙時,可能會對客戶造成生. 立. 活上之不便,也因此當線路障礙時如何儘速修復並縮短復原時間便相當緊急,處理過程中. ‧ 國. 學. 相關人員若能即時判斷並可迅速分析問題,便能減少問題的重覆和延伸,也可以確切命中 核心要點,讓客戶感受到服務之迅速及高效率。. ‧. 本研究透過不同資料探勘技術分析如:分類技術、關聯法則及分群技術,冀能從中找. y. Nat. 到一種最適合本障礙查修資料之分析方式,並針對該資料做更深入分析,找到障礙原因及. io. sit. 查修結果間之聯結。進一步可以透過實驗結果,提供客服人員有利資訊,可有效的於客戶. n. al. er. 進線申告障礙時,即快速判斷障礙原因並提供協助以解決縮短客訴時間,更進而降低公司 查修成本。. Ch. engchi. 關鍵字: 資料探勘、障礙查修、顧客服務. I. i n U. v.

(4) Abstract Today, the maintenance department is not only technique-oriented but also service-oriented, and it not only helps marketing but also provides great potential for the company. The customers would like to choose the brand that can offer professional and prompt maintenance service. In order to retain existing customers, attract new customers, and gain the public praise, the maintenance staff must perform better and the customers feel better. This study provides an example of analyzing telecom troubleshooting data with the focus on applying data mining. 政 治 大. techniques to the repair data of a telecom network, including problem descriptions from customers, testing results from the engineering units, and the results of repair.. 立. The network service is part of modern's life. When network problems occur, they might. ‧ 國. 學. inconvenience customers’ life. Therefore, it is important to solve the problem as soon as possible. If the maintenance staff can immediately determine and diagnose problems, they will be able to to the customers.. ‧. reduce chance that the problem occurs again becomes worse, and they can bring efficient services. y. Nat. sit. This study evaluates several data mining methods, such as classification, association rule. er. io. mining, and clustering methods. The goal is to find the most appropriate method that can help us. al. analyze the data and further to find the relationship between causes of problems and results of. n. v i n C h customer service repair. The results of experiments provide useful information that can help the engchi U maintenance staff quickly determine what the problem is and quickly solve it.. Keywords: Data mining, Troubleshooting, Customer Service. II.

(5) 誌謝 歷經多個寒暑,終於完成了這件人生大事,首先感謝我親愛的母親、太太及女兒,讓 我可以無後顧之憂的完成碩士學位,於修業期間給予我無限的包容和支持,每當拖著疲累 的身心回家時,看到可愛女兒的笑容,就是最好的安慰劑,也是支持我繼續努力下去最大 的動力,謝謝你們我可愛的家人~~ 本論文可以順利完成,皆承蒙徐國偉教授三年半來於研究過程中遇到停滯不前時不斷. 政 治 大. 給予提點,得以讓我有繼續往前的動力,於論文寫作上遇到困難時,也能適時建議及提醒, 讓論文得以逐步成形。再多文字也難以表達感激之意,謹此再向恩師表達衷心的敬意及謝. 立. 忱。另於口試期間,也承蒙張宏慶教授及黃信貿教授撥冗審閱本論文,並提供許多寶貴意. ‧ 國. 學. 見,強化本論文的完整性,謹此表達誠摯謝意。. 最後,感謝工作同事的支援,適時給予研究之建議及解惑,讓我可以更深入了解相關. ‧. 資訊,以利研究推進,也藉此表達我無盡的感謝。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 陳心睿 謹誌 國立政治大學 資訊科學研究所 民國 104 年 4 月. III.

(6) 目錄 摘要 .................................................................................................................................................. I ABSTRACT .................................................................................................................................. II 誌謝 ............................................................................................................................................... III 目錄 ............................................................................................................................................... IV 表目錄 ........................................................................................................................................... VI. 政 治 大. 圖目錄 ........................................................................................................................................ VIII. 立. 第 1 章 緒論 .................................................................................................................................. 1. ‧ 國. 學. 研究背景與動機 .............................................................................................................. 1. 1.2. 研究目的 .......................................................................................................................... 3. 1.3. 論文架構 .......................................................................................................................... 5. ‧. 1.1. Nat. sit. n. al. er. 電信網路服務 .................................................................................................................. 6. io. 2.1. y. 第 2 章 背景知識及文獻探討 ...................................................................................................... 6. i n U. v. 2.1.1 專線 ............................................................................................................................ 6 2.1.2 ADSL ......................................................................................................................... 8 2.1.3 FTTx ........................................................................................................................... 9 2.2 顧客關係管理 ................................................................................................................. 11 2.3. Ch. engchi. 資料探勘技術 ................................................................................................................ 15. 2.3.1 2.3.2 2.3.3. 資料探勘定義 .......................................................................................................... 15 資料探勘架構 .......................................................................................................... 16 資料探勘功能與技術 .............................................................................................. 20. 第 3 章 資料初步檢視 ................................................................................................................ 24 3.1. 資料說明 ........................................................................................................................ 24. 3.2. 資料分佈 ........................................................................................................................ 28 IV.

(7) 3.3. 資料探討 ........................................................................................................................ 34. 第 4 章 資料進階分析 ................................................................................................................ 36 4.1. 實驗工具 ........................................................................................................................ 36. 4.2. 分類技術 ........................................................................................................................ 36. 4.2.1 J48 演算法分析........................................................................................................ 39 4.2.2 JRIPPER 演算法分析 .............................................................................................. 43 4.2.3 小結 .......................................................................................................................... 45 4.3 關聯法則 ........................................................................................................................ 47 4.3.1 4.3.2. 立. 分群技術 ........................................................................................................................ 56. ‧ 國. 4.4.1 4.4.2. 學. 4.4. 政 治 大. Apriori 演算法分析 ................................................................................................. 48 小結 .......................................................................................................................... 55 DBSCAN 演算法分析 ............................................................................................. 56 K-means 演算法分析 ............................................................................................... 61. ‧. y. sit. er. al. n. 4.6. 分類技術 .................................................................................................................. 73 關聯規則 .................................................................................................................. 76 分群技術 .................................................................................................................. 77 小結 .......................................................................................................................... 81. io. 4.5.1 4.5.2 4.5.3 4.5.4. Nat. 4.4.3 小結 .......................................................................................................................... 72 4.5 資料子集實驗 ................................................................................................................ 73. Ch. engchi. i n U. v. 建模分析 ........................................................................................................................ 81. 第 5 章 結論與未來研究方向 .................................................................................................... 87 5.1. 結論 ................................................................................................................................ 87. 5.2. 未來研究方向 ................................................................................................................ 89. 參考文獻 ....................................................................................................................................... 90 附錄一 ........................................................................................................................................... 94. V.

(8) 表目錄 表 1-1 線路阻斷月租費減免表 ...................................................................................................... 5 表 2-1 專線費率表 .......................................................................................................................... 7 表 2-2 ADSL 費率表 ....................................................................................................................... 9 表 2-3 光世代費率表 ..................................................................................................................... 11 表 2-4 KDD、SEMMA 及 CRISP-DM 對應表 ........................................................................... 20. 政 治 大. 表 3-1 颱風資料 ............................................................................................................................ 25. 立. 表 3-2 申告代碼一覽表 ................................................................................................................ 25. ‧ 國. 學. 表 3-3 遠端測試代碼一覽表 ........................................................................................................ 26. ‧. 表 3-4 現場查修回報代碼一覽表 ................................................................................................ 26 表 3-5 資料範例 ............................................................................................................................ 27. y. Nat. er. io. sit. 表 4-1 混亂矩陣表 ........................................................................................................................ 37 表 4-2 分類處理屬性資料表 ........................................................................................................ 38. al. n. v i n Ch 表 4-3 J48 實驗項目 1 評估數據 ................................................................................................. 39 engchi U 表 4-4 J48 實驗項目 2 評估數據 .................................................................................................. 40 表 4-5 J48 實驗項目 3 評估數據 .................................................................................................. 40 表 4-6 J48 實驗項目 4 評估數據 .................................................................................................. 41 表 4-7 J48 實驗項目 5 評估數據 .................................................................................................. 41 表 4-8 J48 實驗項目 6 評估數據 .................................................................................................. 42 表 4-9 J48 各實驗評估數值表 ..................................................................................................... 42 表 4-10 JRIP 實驗項目 1 規則結果 ............................................................................................. 43 VI.

(9) 表 4-11 JRIP 實驗項目 2 規則結果.............................................................................................. 43 表 4-12 JRIP 實驗項目 3 規則結果 ............................................................................................. 43 表 4-13 JRIP 實驗項目 4 規則結果 ............................................................................................. 44 表 4-14 JRIP 實驗項目 5 規則結果 ............................................................................................. 44 表 4-15 JRIP 實驗項目 6 規則結果 ............................................................................................. 44 表 4-16 關聯規則處理屬性資料表 .............................................................................................. 48. 政 治 大 表 4-18 Apriori 實驗項目 2 規則結果 .......................................................................................... 50 立 表 4-17 Apriori 實驗項目 1 規則結果 .......................................................................................... 50. ‧ 國. 學. 表 4-19 Apriori 實驗項目 3 規則結果 .......................................................................................... 51 表 4-20 Apriori 實驗項目 4 規則結果 .......................................................................................... 51. ‧. 表 4-21 Apriori 實驗項目 5 規則結果 .......................................................................................... 52. Nat. sit. y. 表 4-22 Apriori 實驗項目 6 規則結果 .......................................................................................... 53. n. al. er. io. 表 4-23Apriori 實驗項目 7 規則結果 .......................................................................................... 53. i n U. v. 表 4-24 Apriori 實驗項目 8 規則結果 .......................................................................................... 54. Ch. engchi. 表 4-25 分群處理屬性資料表 ...................................................................................................... 56 表 4-26 DBSCAN 分群測試實驗一數據 ..................................................................................... 58 表 4-27 DBSCAN 分群測試實驗二數據 ..................................................................................... 59 表 4-28 K-means 實驗 1 各項分群測試數據 ............................................................................... 61 表 4-29 K-means 實驗 2 各項分群測試數據 ............................................................................... 66 表 4-30 JRIP 各實驗規則結果(排除 ALU 代碼)......................................................................... 76 表 4-32 各資料探勘技術實驗結果比較表 .................................................................................. 82 VII.

(10) 圖目錄 圖 1-1 客戶障礙申告處理流程簡圖 .............................................................................................. 1 圖 1-2 客戶障礙申告處理流程圖 .................................................................................................. 2 圖 2-1 專線架構圖 .......................................................................................................................... 7 圖 2-2 ADSL 架構圖 ....................................................................................................................... 8 圖 2-3 FTTx 示例 ........................................................................................................................... 10. 政 治 大. 圖 2-4 知識發掘程序 .................................................................................................................... 16. 立. 圖 2-5 CRISP-DM 流程 ................................................................................................................ 18. ‧ 國. 學. 圖 2-6 SEMMA 示意圖 ................................................................................................................ 18 圖 2-7 資料分類程序 .................................................................................................................... 21. ‧. 圖 3-1 申告代碼次數統計圖 ........................................................................................................ 28. y. Nat. io. sit. 圖 3-2 申告類別次數統計圖 ........................................................................................................ 29. n. al. er. 圖 3-3 遠端測試代碼次數統計圖 ................................................................................................ 29. Ch. i n U. v. 圖 3-4 遠端測試類別次數統計圖 ................................................................................................ 30. engchi. 圖 3-5 現場查修回報代碼次數統計圖 ........................................................................................ 31 圖 3-6 現場查修回報類別次數統計圖 ........................................................................................ 31 圖 3-7 退費等級次數統計圖 ........................................................................................................ 32 圖 3-8 申告類別退費等級次數統計圖 ........................................................................................ 32 圖 3-9 申告原因暨現場查修結果退費次數統計圖 .................................................................... 33 圖 3-10 各查修單位申告統計圖 .................................................................................................. 33 圖 3-11 各查修單位現場查修結果統計圖 .................................................................................. 34 VIII.

(11) 圖 4-1 J48 實驗 1 評估數據趨勢圖 ............................................................................................. 39 圖 4-2 J48 實驗 2 評估數據趨勢圖 ............................................................................................. 40 圖 4-3 J48 實驗 3 評估數據趨勢圖 ............................................................................................. 40 圖 4-4 J48 實驗 4 評估數據趨勢圖 ............................................................................................. 41 圖 4-5 J48 實驗 5 評估數據趨勢圖 .............................................................................................. 41 圖 4-6 J48 實驗 6 評估數據趨勢圖 ............................................................................................. 42. 政 治 大 圖 4-8 以中心點為基礎的密度估計 ............................................................................................ 57 立 圖 4-7 各實驗規則數統計圖 ........................................................................................................ 49. ‧ 國. 學. 圖 4-9 核心點、邊緣點與雜訊點 ............................................................................................... 57 圖 4-10 DBSCAN 實驗 1 群數統計圖 ......................................................................................... 59. ‧. 圖 4-11 DBSCAN 實驗 1 雜訊點統計圖 ..................................................................................... 59. Nat. sit. y. 圖 4-12 DBSCAN 實驗 2 群數統計圖 ......................................................................................... 60. n. al. er. io. 圖 4-13 DBSCAN 實驗 2 雜訊點統計圖 ..................................................................................... 60. i n U. v. 圖 4-14 實驗 1 K=10 分群分佈結果_1 ........................................................................................ 63. Ch. engchi. 圖 4-15 實驗 1 K=10 分群分佈結果_2 ........................................................................................ 63 圖 4-16 實驗 1 K=15 分群分佈結果_1 ........................................................................................ 64 圖 4-17 實驗 1 K=15 分群分佈結果_2 ........................................................................................ 64 圖 4-18 實驗 1 K=20 分群分佈結果_1 ........................................................................................ 65 圖 4-19 實驗 1 K=20 分群分佈結果_2 ........................................................................................ 65 圖 4-20 實驗 2 K=10 分群分佈結果_1 ........................................................................................ 68 圖 4-21 實驗 2 K=10 分群分佈結果_2 ........................................................................................ 68 IX.

(12) 圖 4-22 實驗 2 K=10 分群分佈結果_3 ........................................................................................ 69 圖 4-23 實驗 2 K=15 分群分佈結果_1 ........................................................................................ 69 圖 4-24 實驗 2 K=15 分群分佈結果_2 ........................................................................................ 70 圖 4-25 實驗 2 K=15 分群分佈結果_3 ........................................................................................ 70 圖 4-26 實驗 2 K=20 分群分佈結果_1 ........................................................................................ 71 圖 4-27 實驗 2 K=20 分群分佈結果_2 ........................................................................................ 71. 政 治 大 圖 4-29 J48 決策樹規模數統計圖(排除 ALU 代碼) ................................................................... 74 立 圖 4-28 實驗 2 K=20 分群分佈結果_3 ........................................................................................ 72. ‧ 國. 學. 圖 4-30 J48 實驗 1 評估數據趨勢圖 (排除 ALU 代碼) .............................................................. 74 圖 4-31 J48 實驗 2 評估數據趨勢圖 (排除 ALU 代碼) .............................................................. 74. ‧. 圖 4-32 J48 實驗 3 評估數據趨勢圖 (排除 ALU 代碼) .............................................................. 74. Nat. sit. y. 圖 4-33 J48 實驗 4 評估數據趨勢圖 (排除 ALU 代碼) .............................................................. 74. n. al. er. io. 圖 4-34 J48 實驗 5 評估數據趨勢圖 (排除 ALU 代碼) .............................................................. 75. i n U. v. 圖 4-35 J48 實驗 6 評估數據趨勢圖 (排除 ALU 代碼) .............................................................. 75. Ch. engchi. 圖 4-36 Apriori 各實驗產製規則數統計圖 ................................................................................. 77 圖 4-37 DBSCAN 實驗 1 群數統計圖 (排除 ALU 代碼) ........................................................... 77 圖 4-38 DBSCAN 實驗 1 雜訊點統計圖 (排除 ALU 代碼) ....................................................... 77 圖 4-39 DBSCAN 實驗 2 群數統計圖 (排除 ALU 代碼) ........................................................... 78 圖 4-40 DBSCAN 實驗 2 雜訊點統計圖 (排除 ALU 代碼) ....................................................... 78 圖 4-41 實驗 1 K=10 分群分佈結果(排除 ALU 代碼)_1 ........................................................... 78 圖 4-42 實驗 1 K=10 分群分佈結果(排除 ALU 代碼)_2 ........................................................... 79 X.

(13) 圖 4-43 實驗 2 K=10 分群分佈結果(排除 ALU 代碼)_1 ........................................................... 79 圖 4-44 實驗 2 K=10 分群分佈結果(排除 ALU 代碼)_2 ........................................................... 80 圖 4-45 實驗 2 K=10 分群分佈結果(排除 ALU 代碼)_3 ........................................................... 80 圖 4-46 關聯規則資料處理流程圖 .............................................................................................. 83. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. XI. i n U. v.

(14) 第1章 1.1. 緒論. 研究背景與動機 電信業除了將產品推銷給客戶外,更重要如何持續提供客戶高品質售後服務,在電信. 業競爭激烈的時代,若無法積極營建與客戶的關係,那客戶可能會因此而投入競爭者的懷 抱,也因此現今電信維修部門已不僅僅是技術導向,更需趨向服務導向,除此之外更是產 品行銷的利器,若能深耕查修服務其中潛在的價值是不可限量,客戶也因此願意選擇更專. 政 治 大 好,進而得到其口碑宣傳或現身說法,為電信業者招攬新客戶;據統計資料企業得到一位 立 新客戶所花的成本是維繫一位老客戶的數倍代價。因此在競爭的市場,投資分析師會去計 業、能迅速維修的電信品牌。若能使維修人員績效更佳,客戶可於查修服務過程中感覺良. ‧ 國. 學. 算「客戶取得成本(SAC,subscriber acquisition cost)」。通常以打廣告或以優惠補貼措施 來吸引新客戶,都是耗費成本又未必能有成效的促銷方式;故與老客戶建立良好關係,對. ‧. 於公司來說,其實是一種最經濟有效的行銷策略;本研究將以電信障礙查修資料為例,著. Nat. sit. y. 重於探勘電信數據網路修復相關記錄因素之探討,其記錄主要包含三大因子,如下圖 1-1. er. io. 及圖 1-2 所示,首先為客服人員根據客戶進線申告判斷障礙原因、其次為各區遠端測量台. al. v i n Ch 料皆採用上述各階段所產出之數據,以連貫客戶障礙申告處理所有流程。 engchi U n. 服務人員進行相關測試內容記錄、最終為查修人員至現場實際修復回報結果,本次研究資. 客服受理用戶 障礙報修記錄. 遠端監控測試記錄. 圖 1-1 客戶障礙申告處理流程簡圖. 1. 查修人員維修回報 結果.

(15) 客戶申告. 障礙受理平台 (記錄申告代碼). 簡易測試. 立. 政 治 大. ‧. ‧ 國. 學. 障礙可否排除 或說明原因. sit. io. 測量台測試 (記錄測試代碼). n. al. er. Nat. y. NO. YES. Ch. engchi. 障礙可否排除. NO. i n U. v. 轉派查修人員. YES 查測機房段至住家間 線路及各設備狀況 (記錄查修代碼). 回報修復. 結案. 圖 1-2 客戶障礙申告處理流程圖 2.

(16) 網路服務為現代人生活不可或缺的一部份,若遇到線路障礙時,可能會對客戶造成 生活上之不便,也因此當線路障礙時如何儘速修復縮短復原時間便為緊急,處理過程中相 關人員若能即時判斷並可迅速分析問題,便能減少問題的重覆和延伸,也可以切確命中核 心要點,讓客戶感受到服務之迅速及高效率。. 1.2. 研究目的 電信網路服務提供 ADSL(Asymmetric Digital Subscriber Line)、專線(Lease Line)及. 治 政 大 定需求客戶(如網路券商、網路銀行、電子商務網站等)等需要高品質網路之產品,本服務 立 可達而頻寬保證,並利用數據專線,達到二十四小時全年無休與網際網路相連,以專線電. FTTX 光纖等服務,客戶可依自身的需求選擇適合的產品,專線服務可符合企業客戶及特. ‧ 國. 學. 路提供各式的網路應用服務。以目前多種上網方式來說,專線上網的連線品質是最穩定的, 可靠度最高。FTTB 光纖服務結合光纖到大樓(FTTB)與乙太網路技術,提供用戶於同一市. ‧. 內通信營業區域內之點對點通訊,提供 2M、4M、5M、10M、50M、100M、1G 等傳輸速. sit. y. Nat. 率,用戶可依其需求作多方面之應用,另 ADSL 可提供一般家庭用戶使用網路服務,現行. er. io. 可提供上行速率 64Kbps ~ 640Kbps,下行速率 2Mbps ~ 8Mbps。. al. v i n Ch 若修復時間拖長不僅造成避免客戶的損失及遭致客戶責難,也會影響電信公司的營收及信 engchi U n. 現代使用網路客戶族群對於網路品質皆有相當程度的要求,所以當發生線路障礙時,. 用,因此如何迅速回應客戶之申告問題,做出適當處置方式,便相當重要;若第一線人員 無法立即解決問題,二線人員至現場處理也需快速排除問題,以降低整體修復時間,爭取 時效。因此希望藉由近幾年的報修資料及其查修結果,從中分析該電信公司網路障礙事件 間關聯性,進而提出因應對策。故本研究預期希望可達到以下潛在效益: 研究效益一:本研究乃據資料面驅動而成,因目前尚未有明確探討本障礙查修資料之分析 模型,因此本研究將透過採用了多種探勘技術分析該類型資料,以確認這種 真實資料可以較適用於何種探勘技術,希望藉由本研究可以提供企業於處理 該類型資料一個分析方向。 3.

(17) 研究效益二:希望透過本研究可提升客服人員線上解決問題比例,如此便可減少後續維修 人員到府處理的次數,但並非所有案件客服人員皆可於線上排除,因此另期 望也可以降低維修人員至現場查修整體時間。假設現況客服人員單位成本為 1,每次客服人員平均處理時間為 10 分/次,查修人員因需至發生障礙設備之 交接箱或至客戶家中查修,其平均處理時間約為 90 分/次(含交通時間及查修 時間),如此查修人員與客服人員所花費成本比約為 9:1;另客服人員解決障 礙申告比例約 20%,另 80%比例需由查修人員處理,經加權平均計算後,障礙. 治 政 大 20%提升至 25%,經加權平均計 降至 80 分/次,及將客服人員解決申告比例由 立 算後障礙查修成本應可由 7.4 降至 6.25,如此一來可節降約 1.15 的成本(佔 查修成本約為 7.4。若可以透過本研究將查修人員平均處理時間由 90 分/次. ‧ 國. 學. 原成本 15.54%)。. 研究效益三:提升障礙維修效率因與客戶之申裝合約載明因系統設備障礙、阻斷,以致發. ‧. 生錯誤、遲滯、中斷或不能傳遞時,其停止通信期間依下表 1-1 所列之時間,. sit. y. Nat. 酌以減收當月 5%至 100%之月租費。就目前資料統計障礙案件之連續阻斷時. er. io. 間大多介於 12-48 小時,若阻斷時間可以從 12-24 小時降至 12 小時內或從. al. 24-48 小時降低至 12-24 小時區間,月租費扣減比例便可從 5%降至 0%及從. n. v i n Ch 5%,對企業而言便可減少 i U e n g c h5%以上的月租費營收損失,另因維修時間. 10%降至. 縮短也可提升客戶滿意度。. 4.

(18) 表 1-1 線路阻斷月租費減免表1 連續阻斷時間(小時) 12 以上-未滿 24. 當月月租費減收 5 %. 24-未滿 48. 當月月租費減收 10 %. 48-未滿 72. 當月月租費減收 20 %. 72-未滿 96. 當月月租費減收 30 %. 96-未滿 120. 當月月租費減收 40 %. 120 小時以上. 立. 論文架構. 治 政 當月月租費全免 大 學. ‧ 國. 1.3. 租費扣減下限. 本研究共分五章,第一章緒論,說明研究動機、目的及論文架構;第二章為背景知. ‧. 識及文獻探討,說明與本研究相關之相關知識及研究本論文之相關文獻,包含電信網路服 務說明、顧客關係管理及資料探勘相關技術;第三章為研究資料初步檢視,本章初步分析. y. Nat. sit. 本研究之障礙資料並進行相關探討;第四章為資料進階分析,本章利用不同資料探勘技術. n. al. er. io. 對障礙資料進行分析,並找出其中合適之探勘方法以建立模組,再根據所選之技術再將所. i n U. v. 得資料進行更進一步分析處理;第五章結論與未來研究方向,對本研究做一個結論,並探 討未來可能的研究方向。. 1. Ch. engchi. 資料來源 http://www.cht.com.tw/personal/hinet-internet-term.html 5.

(19) 第2章. 背景知識及文獻探討. 本章節將對本研究相關文獻進行探討,由於本研究為希望透過解決電信網路線路障 礙來建立與客戶間良好信賴關係,其中主要會透過資料探勘技術來分析電信網路障礙問題 處理之間關聯性,希望從中找到可以提升客戶對電信公司滿意度之方法,因此本研究會針 對現行電信網路服務、顧客關係管理及資料探勘相關文獻進行探討,第一節首先針對個案 電信公司提供之電信數據服務簡要說明,第二節介紹顧客關係管理之相關理論,第三節針 對各種資料探勘技術進行探討。. 立. 電信網路服務. 學. ‧ 國. 2.1. 政 治 大. 現行個案電信公司市場上提供之網路服務大多以專線(Lease Line)、ADSL(Asymmetric Digital Subscriber Line)、FTTx(Fiber To The x)為主,共約有 455.3 萬戶,截至 102 年 12 月. ‧. 底,該公司國內數據電路市占率約 66%,以下就該公司提供之數據服務進一步說明2。. er. io. sit. y. Nat. 2.1.1 專線. 專線(Leased Line)是用戶端直接與網絡供應商連接網路(圖 2-1),其優點是工作容易查. al. n. v i n Ch 修方便,且其服務性能與可靠度均相當高。專線其缺點為頻寬使用度不佳,仍因採用分時 engchi U 多工技術(Time-Division Multiplexing,TDM),頻寬配置先行指定。若配置之專線無人使 用時,也無法轉至他人利用。故就頻寬利用度而言是相當沒有效率的。也因此申請專線費 用會比其它數據通訊服務來的昂貴,更與通訊距離遠近成正比,目前該電信公司提供之速 率及費用如下表 2-1 所示。. 2. 資料來源 http://www.cht.com.tw/ir/stockit-annualreport.html 6.

(20) 圖 2-1 專線架構圖(本研究整理). 治 政 表 2-1 專線費率表 大 3. 電路月租費. 4,600. 512Kbps. 4,600. Nat. sit. 12,700(台北台中高雄三大都會區) /. ‧. 128Kbps. 網路月租費. T1(1.544Mbps). 10,000 20,000. y. 傳輸速率. 學. ‧ 國. 立固接專線上網之每月月租費. 50,000. n. al. er. io. 14,000(其他地區). i n U. v. 12,700(台北台中高雄三大都會區) /. E1(2.048Mbps). Ch. e n g14,000(其他地區) chi. T3(45Mbps). 30,000/1Mbps. 以上. 專案報價 單位:新台幣/每月. 3. 資料來源 http://www.cht.com.tw/enterprise/hinetfaxline-rate.html 7. 65,000.

(21) 2.1.2 ADSL ADSL 全名為非對稱數位式用戶線路(Asymmetric Digital Subscriber Line),是一種利 用傳統電話線(亦稱為雙絞線)採用高頻(4KHz 以上)以 CAP 或 DMT 編碼方式來提供高速網 際網路上網服務的調變/解調變技術,ADSL 主要觀念是在於其上傳與下載的頻寬是不對稱 的,也就是從網路端到用戶端(亦稱下載速率)的頻寬比用戶端傳輸到網路端上(亦稱上傳速 率)的頻寬來的較高,所以稱為非對稱數位式用戶線路。 ADSL 比起傳統的電話服務來講,在現有的電話銅線上利用了更多的頻寬。ADSL 利 用的是高於 4000Hz 的頻帶,因此比起傳統的類比數據機,它可以傳送更多的資料,達到. 政 治 大. 更快的速率。為了達到這個目的,ADSL 的設備必須安裝於銅線兩端,一端在用戶端,一. 立. 端在電信機房內,而且整條銅線上必須都能使用這些更高的頻帶,ADSL 下行的速率最高. ‧ 國. 學. 可達到 12Mbps(1Mbps~12Mbps),上行可達到 640kbps(256kbps~640kbps),ADSL 電路服 務係遵循 ITU-U 國際電信聯合建議書所訂定之標準提供服務,各服務速率系指最高可提供. ‧. 之線路速率(Line Rate),用戶實際上網傳輸資料速率(Data Rate)會因上網終端設備之軟硬. sit. y. Nat. 體、距離,用戶所在位置環境及訪問網站之連外頻寬、加值服務使用等因素影響而有所變. io. al. n. 2-2 所示。. er. 化,因此提供上網服務時依國際標準網路品質分類歸屬為 Best Effort 模式,其架構如下圖. Ch. engchi. i n U. v. 圖 2-2 ADSL 架構圖4 4. 資料來源 http://www.cs.nccu.edu.tw/~lien/NIIslide/ADSL2/hardcopy.htm 8.

(22) 另 ADSL 相較於傳統的撥接方式,用戶可在同一條電話線上同時進行連線上網際網 路與撥打或接聽電話,而且可以持續不間斷使用高速網際網路接取服務等優點,也因此 ADSL 為電信公司解決數據撥接長時間佔據交換機造成系統負荷過度問題,目前該電信公 司提供之速率及費用如下表 2-2 所示。 表 2-2 ADSL 費率表5 上網費牌價(元/月). 速率別. 傳)bps. 網路型. 立 --. 8M/640K. (元/月) 121. 總金額 (元/月). 275. 119. 2,300. 700. 219. 329 2,629(1,029)/548. 3,550. 1,130. 348. 389 3,939(1,519)/737. 396/240. ‧. Nat. 2.1.3 FTTx. 非固定制. 學. 5M/384K. ‧ 國. 2M/64K. 政(3IP) 治 大 多機型. (8IP). 月租費. y. (下載/上. 電路. 固定制. n. al. er. io. 模式,常見的 FTTx 模式有:. sit. FTTx 為「Fiber To The x」之縮寫,其中「x」,表示固網業者提供之各種光世代連線. i n U. v. . FTTN(Node/節點):與住家間距離 > 300 公尺. . FTTC(Cabinet/光化箱,或 Curb/街角):與住家間距離 < 300 公尺. . FTTB(Building/社區大樓). . FTTH(Home/住家). Ch. engchi. 「x」就是目前光世代網路各種「最後一哩(last mile)」的解決方案即光纖線路的目的 地。較詳細的「Fiber To The x」圖例如圖 2-3 所示。. 5. 資料來源 http://www.cht.com.tw/personal/adsl-rate.html 9.

(23) 光纖網路相較於傳統 ADSL 使用之電話銅纜(Copper)電路,有許多明顯優勢,如: . 不受天候潮濕而影響通訊效能. . 減少交換機配置、降低營運成本. . 大幅增加通信距離,可高達數百公里. . 可提供較高連線頻寬,增加寬頻網路應用服務. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 2-3 FTTx 示例6 綜合上述優點,FTTx 已成為目前寬頻上網之主流服務,目前該電信公司提供之速率 及費用如下表 2-3 所示:. 6. 資料來源 http://zh.wikipedia.org/zh-tw/FTTx 10.

(24) 表 2-3 光世代費率表7 上網費牌價 速率別. (元/月). (下載/上傳)bps. 固定制(6IP). 總金額. (元/月). (元/月). 300M/100M. 2,079. 816. 883. 2,962/1,699. 100M/100M. 1,799. 624. 675. 2,474/1,299. 100M/40M. 1,400. 466. 563. 1,963/1,029. 60M/20M. 1,380. 496. 1,876/955. 445. 1,693/858. 政 治459 大 413. 970. 341. 學. 6M/2M. 立1,248. 342. 1,312/683. ‧. ‧ 國. 20M/5M. 2.2. 非固定制. 電路月租費. 顧客關係管理. y. Nat. sit. 本節會藉由文獻研究探討顧客關係管理,進而構思電信業者如何透過提升障礙處理. n. al. er. io. 之服務品質進而鞏固公司與顧客間之關係,並強化顧客對公司之信賴感。從以往研究中發. i n U. v. 現,服務品質會影響顧客滿意度,對服務品質滿意的顧客在接觸公司所提供的商品時會有. Ch. engchi. 較高的重複購買意願,進而使公司有較高的獲利能力;另當一家公司擁有的忠誠顧客越多, 其獲利亦會隨之增加。隨著國內網際網路使用人成長已趨近飽和,致國內電信市場競爭日 益激烈,各電信業者如何保有既有顧客,維持與顧客間的關係,進而再提升顧客滿意度與 顧客忠誠度,建立與顧客間長久關係以增加經營績效,仍是各電信業者及網路服務業者需 加以深入了解之重大議題。據此,各電信業者無不想藉由提升服務的品質,再提升顧客之 滿意度,因當顧客滿意度高時除能持續與舊有顧客維持關係,還可將其轉化成忠實客戶, 並 為 公 司 建 立 口 碑 行 銷 , 最 終 為 公 司 帶 入 營 收 。 客 戶 關 係 管 理 (CRM, Customer. 7. 資料來源 http://www.cht.com.tw/personal/hinet-rate.html 11.

(25) Relationship Management),是著重以客戶為中心的關係管理作為。最先發展於美國對於 客戶關係管理運用,主要透過資訊科技建立維繫與客戶關係的目標,相關資訊科技運用可 橫跨與客戶互動完整階段包含前、中、後三階段,例如企業與客戶主要溝通工具─電話客 服中心,通常整合了電信系統與資料庫,透過直接並即時互動,以適時掌握客戶反應並提 升滿意度,至今已由電話客服中心演進到網路客戶中心,隨著資訊科技演進,讓客戶關係 管理有了更廣的應用與發展空間,可更進一步提供客戶量身訂做的服務,以提高客戶的忠 誠度和企業營運效益。. 治 政 大 品與服務、定價、推廣、通路)、銷售及客戶服務等,其中以客戶資料為核心,透過此與 立 客戶間建立並保持良好關係,使企業通路與後勤等任何一個可能與客戶接觸的部門,能對. 所以客戶關係管理其實就是企業管理與客戶關係間的動態互動流程,其中包含 4P(產. ‧ 國. 學. 客戶有更深切的觀察力,進而將交易轉換成以關係為基礎的商業模式。 企業為了贏取新顧客與鞏固既有客戶並提高顧客利潤貢獻度,其中有報告發覺將客. ‧. 戶留住與公司利潤間有高度關聯性,若將留住客戶比率每往上增加百分之五,就能使各項. sit. y. Nat. 業 務 淨 現 值 從 百 分 之 二 十 提 升 至 八 十 五 (F. F. Reichheld and W. E. Sasser, Jr.,. er. io. 1990),進而改善企業獲利,除此之外 IBM 也表示,必須以六到八倍於留住舊客戶的代價,. al. 才能拉進一個新的客戶。這些數字都說明著,當客戶忠誠度不高時,企業的獲利狀況就會. n. v i n Ch 面臨到威脅,故如何強化客戶忠誠度,來贏得客戶信賴,以提升企業的競爭力與獲利力, engchi U 便需審慎的處理。. 因為真正的顧客、有忠誠度的顧客是需要時間培養的,而且是透過一段時期經常性 與企業間互動所累積的接觸記錄。Neil Raphel 與 Murray Raphel(1995)認為依據忠誠度 的不同,可將顧客分為五個階層,若將每一階層的顧客加以良好經營,使其能夠更上一層, 則是企業成功之道。 . 潛在顧客(Prospect):潛在顧客為有興趣向你購買某樣商品的人。. . 購物者(Shopper):有興趣並至少向企業購買一次產品或服務的人。. . 顧客(Customer):向某家企業購買某樣產品或服務的人。 12.

(26) . 老客戶(Client):定期到貴公司購物的人。. . 廣告代言人(Advocator):向所有的人述說貴公司有多好的人。. 另外學者 Wayland & Cole(1997)認為客戶關係管理的主要目的有下列三點: 1. 有價值客戶的獲取 亦即企業要思考如何利用資料的分析找出有價值的好客戶,並加以吸引及獲取。 當企業在進行客戶關係管理時,需清楚瞭解 20/80 法則,將有限的資源配置在策略 性、重要性與獲利性高的客戶身上,並且要特別注意其未來長期的潛力。. 治 政 大 企業對於目前的老客戶,應想盡辦法提升其對於己公司的荷包貢獻率(Wallet 立 Ration),主要方式要以交叉銷售與進階銷售來吸引老客戶採購公司其他的產品,以 2. 客戶的發展. ‧ 國. 學. 擴大其淨值貢獻,並在適當的時機向客戶促銷公司更新、更好、更貴的同類型產品。 3. 客戶的保留. ‧. 客戶關係管理的第三個目的,在於如何留住有價值的老客戶而不讓其流失,利. y. sit er. io. 失率。. Nat. 用量身訂製的產品與服務及愉快的整體購物經驗來提升客戶的滿意度,以降低其流. al. 所以顧客關係管理重點在於找到老的忠誠客戶,並想辦法維繫住兩方之間的關係,為. n. v i n Ch 何維持舊客戶的成本會高於開發新客戶,以下 i U e n g c6h個因素可以加以說明留住老客戶的重要性 (林東清,2006): 1.. 顧客的取得成本 一般而言,企業必須花費不少的取得成本在新客戶身上,例如廣告、促銷、試. 用、應酬等等的費用,對於老客戶而言,這些花費並不需要。 2.. 基本利潤 指客戶支付的產品服務價格大於公司成本的部分,由於老客戶的存續時間長,. 因此,基本的利潤也比較多,顧客淨值較高。 3.. 顧客平均盈收成長率 13.

(27) 客戶對企業認識越深,就對企業越有信心,因此當企業對其進行交叉銷售與進 階銷售時,交易成功的機會就會越高。 4.. 營運成本 營運成本包括顧客的開發成本與保留成本,開發一個新的客戶,公司必須花費. 比舊客戶多出很多的時間來對新客戶做解說及提供各種服務,因此成本相對就會提 高許多,相對而言老客戶因為已對公司非常熟悉,則不會有此種花費存在。 5.. 口碑推薦. 治 政 大 因此口碑推薦是相當不錯的行銷方式。 立 6. 溢價的優勢. 依據統計,一個覺得滿意的客戶平均會向 5 個朋友推薦,且其推薦的成功率高,. ‧ 國. 學. 對老客戶來說,對價格的敏感度較低,而且較不受價格波動的影響,對新顧客 而言則是相反,新顧客對於價格相對於老客戶較為挑剔,也容易受到其他品牌價格. ‧. 的影響。. sit. y. Nat. 根據 Ravi Kalokota 和 Marcia Robinson(1999)的理論,客戶關係管理架構乃以客戶. er. io. 生命週期(獲取、增進、維持)為主要依據,配合不同階段下各異的功能性解決方案,產生. al. 整合性的客戶關係管理應用。. n. v i n Ch 取得新的顧客:藉由在便利與創新上的突破,將產品與服務提升到的新境界,以 engchi U. 1.. 鸁得新的顧客。因為對顧客而言,價值仍來自優異產品,再加上卓越的服務。. 2. 增進現有客戶的收益性:藉著鼓勵卓越的交叉銷售向上銷售,增進現有顧客的關 係。這可以深化與顧客的關係。對於顧客而言,如何以低廉的成本提供其最大的 便利,是最重要的。 3. 維持有助於獲利的顧客:維持顧客的重點在於服務的調整能力提供顧客想要的, 而不是市場想要的產品。價值來自於建立能預先反應的關係,以顧客的最佳利益 為考量。現今各大企業對於維持顧客關係的重視,遠甚於吸引新的顧客。原因不 外是想增加各多的營收,就得先把持優良顧客的心。 14.

(28) 綜合上述文獻,本研究整理出客戶關係管理,即是企業和客戶之間的互動過程,運 用資訊科技將行銷服務結合,提供客戶個人化服務,進而增加客戶滿意度與忠誠度,進而 可以保留老客戶建立口碑,最終達成增加企業經營效益目的。. 2.3. 資料探勘技術. 2.3.1 資料探勘定義 隨著人類知識技術的全面發展,資料庫管理系統及資料倉儲技術被廣泛地應用在所. 政 治 大 H., et al., 2008;Clifford, Lynch, 2008)。在這知識時代,如何從海量資料中取得有意義的知 立 識模式為領導決策提供有力支援的課題,致使研究者須具備更有效的資料解析處理能力。. 有產業,導致人們獲取資料的能力日益提高,進而不斷地積累海量且複雜的資料(Doug,. ‧ 國. 學. 資料探勘乃從資料庫中挖掘出潛在、明確有用的資訊的過程,利用統計、機器學習 等演算法,從大量資料中找尋出隱藏且具有商業價值的知識及規律(Moss and Arte, 2003),. ‧. 作為商業策略應用,其內容包含相關性、特徵及趨勢等等,也就是資料庫之知識發掘. Nat. sit. y. (Knowledge Discovery in Database, KDD),知識發掘技術乃經由資料庫技術、統計學、知. er. io. 識工程學及人工智能學等多領域學科交叉結合成的成果,其中心思想主旨為於資料庫中發. al. v i n Ch Selection):從資料庫選擇與主題相關的資料,建立目標資料集。 engchi U n. 掘出有價值的潛在知識之進程,執行步驟與流程如圖 2-4 所示,說明如下: 1. 資料選擇(Data. 2. 資料前置處理(Data Preprocessing):去除雜訊、錯誤及不一致資料,定義資料 型態。. 3. 資料轉換(Data Transformation):將資料依群組屬性進行編碼作業及轉換為統一 格式。 4. 資料探勘(Data Mining):利用一種或多種資料探勘方法萃取出資料特徵。 5. 特徵解釋評估(Interpretation/Evaluation):依資料探勘所得模型,決定結果呈 現方式,並對其解釋及評估,找出具有價值的特徵,最後轉換成知識。. 15.

(29) 其中資料探勘(Data Mining)步驟最為重要,而根據資料探勘技術進程(Hui, S. C., & Jha, G.., 2000)之 定 義 , 包 括 建 立 探 勘 目 標(Establishing the Mining Goals)、 選 擇 資 料 (Selection of Data)、資料前置處理(Data Pre-Processing)、資料轉換(Data Transformation)、 資 料 倉 儲(Data Warehousing)、 模 型 探 勘(Model Mining)、 評 估 探 勘 結 果(Evaluating the Mining Results)、報告與使用(Reporting and Use)(Richard, Roiger, & Michael, Geatz, 2002)等 八大標準步驟。. 立. 政 治 大. ‧. ‧ 國. 學. Nat. sit er. io. 2.3.2 資料探勘架構. y. 圖 2-4 知識發掘程序(Fayyad, U, 1996). al. n. v i n Ch 資料探勘過程會依研究領域不同而有所變化,各種資料探勘技術也有各自特性,因 engchi U 此會影響資料探勘於不同領域間運用流程上產生差異,即便是同一產業,也會因不同分析 技術結合不同商業知識,而有所差異,故如何將資料探勘過程標準化就相當重要,所以為 了更有系統化及標準化進行探勘的流程,業者與軟體開發業者提出了一些資料探勘過程的 參考模型或標準,來幫助其使用者能達到目標。 其中最具代表性之一的跨產業、跨商業問題,同時跨工具的資料探勘標準化流程資 料探勘標準作業程序為 CRISP-DM(Cross-Industry Standard Process for DM),該程序為 1996 年 SPSS 與 NCR 利用成功案例的過程定義出跨產業與商業問題的標準化流程並於 1997 年於阿姆斯特丹正式誕生。CRISP-DM 標準流程分為商業理解(business understanding)、 16.

(30) 資 料 理 解(data understanding)、 資 料 準 備(data preparation)、 建 模(modeling)、 評 估 (evaluation)、部署(deployment)等六個階段(如圖 2-5 所示),各個階段的順序不是嚴格限制, 各階段有可能依需求來回移動,必須視各階段的產出結果、工作的進行,來確認下一個執 行階段,其各階段說明如下: 1. 商業理解(business understanding):初始階段的重點是了解該專案的商業目標 和需求,將知識轉換成資料探勘問題的定義,並初步規劃及設計應達成之目標, 再根據此目標規劃所需收集資料範圍、如何分析資料及呈現目標的報告形式。. 治 政 大 獲得重要的數據並確定數據質量問題,以發掘資料隱藏有趣之訊息。 立 3. 資料準備(data preparation):作為探勘使用資料必須經過測試以確保資料品質, 2. 資料理解(data understanding):資料理解階段從最初的數據收集和商業活動,. ‧ 國. 學. 同時也需過濾掉對此次探勘工作無用的資料,以提高工作效率。其準備資料應涵 蓋了所有活動準備階段的最後資料集(資料將被輸入到建模工具)。數據準備工作. ‧. sit. Nat. 的選擇,並依照建模工具來轉換和清理資料。. y. 很可能被執行多次,而不依任何規定的順序進行。任務包括資料表、記錄和屬性. er. io. 4. 建模(modeling):在這個階段,選擇不同的建模技術與應用,以及它們的參數進. al. 行校準以求最佳值。通常會有幾種技術來處理相同的資料探勘問題的類型。有些. n. v i n Ch 技術已經具體要求的格式化的資料,因此回溯資料準備階段往往是必要的。 engchi U. 5. 評估(evaluation):解讀其建模過程得到之模型結果,並從中獲取隱藏知識,確 認其知識對企業的價值,並運用視覺化工具讓探勘結果與價值清楚地被顯現出來。 6. 部署(deployment):建立模型通常不是專案的結束,建模的目的是為了解並獲得 需要的知識加以組織整理,以供使用者運用。根據不同的要求,部署階段可以簡 單或複雜的報告來說明執行一個重複的資料探勘過程。在許多情況下,將是使用 者或客戶進行部署步驟,而不是資料分析師。不過,即使分析師將不進行部署工 作,重要的是客戶預先了解哪些資訊將需要進行研究,以實際利用創建完成的模 型。 17.

(31) 立. 政 治 大. 圖 2-5 CRISP-DM 流程(Chapman et al.,2000). ‧ 國. 學. 另一個為 SAS 公司提出了 SEMMA(Sample-Explore-Modify-Model-Assess),強調結合 其工具 Enterprise Miner 中的應用方法,代表資料探勘的五個步驟(如圖 2-6),說明如下:. y. ‧. Nat. n. er. io. al. sit. Sample. Access. Ch. engchi. iv n U Explore. SEMMA. Model. Modify. 圖 2-6 SEMMA 示意圖8 8. http://en.wikipedia.org/wiki/SEMMA 18.

(32) 1. 資料抽樣 (Sample) 資料經過適當條件的篩選與過濾,可減少處理的資料量,進而節省系統資源與增 進處理效率,而且經過資料篩選,可以突顯資料的規律性。 2. 資料探索 (Explore) 資料探索就是一般進行深入調查的過程,當分析人員拿到了一個樣本資料集後, 會進行以下特徵探索: . 資料是否達到原來設想的要求. . 其中有沒有什麼明顯的規律和趨勢. . 它們可區分成怎樣一些類別. ‧ 國. . 學. . 治 政 大 有沒有出現從未設想過的資料狀態 立 變數之間有什麼相關性. 這都是需要探索的內容,達到瞭解各個變數之間的複雜關係之目的。. ‧. 3. 資料調整 (Modify). sit. y. Nat. 透過上述兩個步驟的操作,對資料的狀態和趨勢可能有了進一步的瞭解,對企業. er. io. 原來要解決的問題,可更明確的想法,這時要盡可能量化所要解決的問題,因為. al. 原來的問題很可能是諸如質量不好、生產率低等模糊的問題,若沒有將問題定義. n. v i n Ch 得更明確,根本無法進行有效的資料探勘操作。因針對問題的需要,可能要對資 engchi U 料進行增刪,也可能按照對整個資料探勘過程的新認識,要整合或者增加一些新 的變數,以對現實狀態進行有效的描述。 4. 建立模型 (Model). 此階段是資料探勘工作的核心環節。當分析人員進行到此時,對應採用的技術已 有了較明確的方向,資料結構和內容也有了充分的適應性。這時就可以運用統計 方法,來建立資料模型和發現知識。不過使用哪一種方法,主要取決於資料集的 特徵和所要實現的目標。實際上資料探勘技術的選擇不一定只能有一種,析人員 可以多試幾種方法,從不斷實驗的過程中選出最適合的方法。 19.

(33) 5. 評價 (Assess) 從上述過程中將會得出一系列的分析結果、模式或模型。若能得出一個直接的結 論當然很好,但更多的時候,會得到對目標問題側面的描述,這時就要綜合它們 的結果,提供合理的決策支援資訊。所謂合理,指的就是要在企業所付出的代價 和達到預期目標的可靠性二者之中,作出對企業最有利的選擇。. 相較於 KDD 及 SEMMA(見下表 2-4),CRISP-DM 模型強調完整的資料探勘過程且是. 治 政 大 CRISP-DM 較其餘二種模型會更 行瞭解及最後模式應用,本研究所探討問題處理模式選用 立 貼近及反饋企業需求,故以 CRISP-DM 模式之流程進行後續資料探勘處理。 因應產業需求所建構,除針對資料了解、整理、分析建模及評估外,還包含對企業需求進. ‧ 國. 學. 表 2-4 KDD、SEMMA 及 CRISP-DM 對應表(Azevedo, A. & Santos, 2008) SEMMA. io. n. al. Ch. y. Sample Explore Modify Model Access ----------. Data Understanding. sit. Selection Pre processing Transformation Data mining Interpretation/Evaluation Post KDD. ‧. ----------. Nat. Pre KDD. CRISP-DM Business Understanding. Data preparation Modeling Evaluation Deployment. er. KDD. engchi. i n U. v. 2.3.3 資料探勘功能與技術 Hui and Jha(2000)研究指出,資料探勘可以有效地運用在產品銷售和顧客關係管理方 面,是提升企業競爭力的重要工具之一,在資料探勘的領域中,包含許多的功能,依據 Berry and Linoff(1997)之 觀 點 資 料 探 勘 主 要 是 針 對 資 料 作 分 類 (Classification)、 推 估 (Estimation)、預測 (Prediction)、關聯規則 (Association Rules)、群集分析(Clustering)和描述 及視覺化(Description),來挖掘其隱藏相關資訊,提供給決策者參考使用,其各項功能及 目的如下: 20.

(34) 1. 分類(Classification): 分類的工作為將每一個群集的特徵清楚地定義,並且透過訓練資料建立出模型 (圖 2-7),按照資料中的屬性先區分類別加以定義,並透過訓練一定數量的資料後, 依據所得到的規則或特徵來建立類別(Class),再利用各種類別的資料特徵,對於其他 未分類或新進的資料來做預測,建立出一個樣式,將欲歸類的資料做指派的工作。 Training Data. 立. 政 治 大 Classification Algorithm. ‧ 國. 學 Classification Rules. y. ‧. Nat. n. er. io. al. New Data. sit. Test Data. Ch. i n U. v. Class label. engchi. 圖 2-7 資料分類程序. (Han. J. & Kamber. M, 2001) 2. 推估(Estimation) 透過已知的屬性來推估未知的連續數值的走向與趨勢。分類所得到的結果是不連 續,利用推估所產生的結果,是連續性的數值,利用既有連續性數值之相關屬性之資 料建立模型,可以獲得某一屬性未知之值,或根據對象屬性之過去觀察值來推估該屬 性未來值。例如依據信用卡申請者之職業、年齡、教育程度來推估其未來刷卡量。. 21.

(35) 3. 預測(Prediction) 利用對象屬性的歷史資料作為觀察值來建立樣式,用以預測未來的數值、趨勢或 行為,預測、分類與推估的功能是非常相似的,預測是用以推估未來的數值和趨勢, 且用來進行分類及推估的技術皆能經過修正後,利用已知變數數值的訓練組資料來加 以求得其數值,可以運用從前的歷史資料,然後建立樣式以觀察最近觀察值的變化情 形,將現有新的資料做為輸入,即可以產生有關於未來變化的預測值,如透過顧客的 職業、年齡、收入等人口屬性特質及其消費行為來預測可能的流失率。. 治 政 大 主要目的是從大量的交易資料中,尋找出令決策者所感到有興趣項目組合與關聯 立 性,而這些關聯通常以規則來表示,主要描述在龐大資料庫中資料項目間彼此的關聯 4. 關聯規則(Association Rules). ‧ 國. 學. 性。關聯規則之探勘過程主要包含兩個階段:第一階段必須先從資料集合中找出所有 出現頻率大於或等於最小支持度(Minimum Support)的頻繁項目集(Frequent Itemsets),. ‧. 第 二 階 段 再 由 這 些 頻 繁 項 目 集 找 出 信 心 度 大 於 或 等 於 最 小 信 心 度(Minimum. sit. y. Nat. Confidence)的規則。. er. io. 5. 群集分析(Clustering). al. 屬非監督式學習(unsupervised learning),依據資料之間的相似程度分成若干個程. n. v i n Ch 度相似的群集,使每個群集內的資料具有相當程度的相似性及同質性,可為群集內同 engchi U. 質、群集間異質,群集與分類最大的不同在於群集並未預先定義好類別,且在處理過 程中,並不需要事先定義該如何分類,也不需要事先區分訓練組資料,如一群住在附 近的人,駕駛相同的汽車,使用相同家電,並且食用相同的食物。而另一群從事相同 行業的人,家庭成員人數接近,年收入接近,出國次數也很接近。透過觀察資料為何 被群集在一起的,可以更了解資料間的關係性。 6. 描述及視覺化(Description) 描述的功能可以很容易從雜亂無章的資料中解釋出一種現象或狀態,透過此項功 能,可以描述一個複雜的資料庫特性,以協助企業對於顧客的服務、產品及流程有更 22.

(36) 多的了解,對於顧客的消費特徵可以有更完整的敘述,以作為輔助企業制訂決策時的 參考依據。 上述為資料探勘最常被使用之功能,經由資料探勘分析過程,即可從交易資料中發現 新的資訊或潛在的知識,但在進行探勘過程之前,必須先對欲探勘資料先進行整理與過濾, 處理完後再應用至資料探勘技術。資料探勘與過去使用資料庫查詢方式有相當程度的不同, 其處理目標在於分析海量且複雜的資料庫,通常其服務對象為高階管理者,主要為其決策 提供有力之分析資料外,並可透過圖表方式讓決策者更容易解讀。因此近年來資料探勘已. 治 政 大 究採用其中分類、關聯法則、群集分析等功能進行障礙查修資料分析,並透過描述及視覺 立 化功能說明分析後之結果,如關聯法則之規則說明、群集分析之群聚圖。. 成了各不同專業的研究熱點之一,由其隨著大資料的時代來臨其重要性更不可或缺,本研. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 23. i n U. v.

(37) 第3章 3.1. 資料初步檢視. 資料說明 本研究資料主要來至於某電信公司南部地區網路服務障礙修復資料,資料發生區域. 涵蓋南部某都會區,分析資料抽取時間為民國 99 年 1 月 1 日至 102 年 12 月 31 日間客戶 進線申告障礙之處理記錄,每一次客戶進線申告線路障礙至障礙排除即視為一筆有效記錄, 經過剔除不完整資料後共計 56,672 筆記錄。 原始資料欄位包含用戶申告時間、用戶申告代碼(以下簡稱申告代碼)、遠端測試代碼. 政 治 大. (以下簡稱測試代碼)、現場查修回報代碼(以下簡稱查修代碼)、查修完成時間及查修單位,. 立. 其中透過用戶申告時間及查修完成時間經計算後,取得連續阻斷時間及月租費扣減與否資. ‧ 國. 學. 料,並依申告時間對照中央氣象局颱風資料庫此三年間所發佈颱風警報時間(如表 3-1), 增加申告案件是否落於颱風襲台期間欄位資訊,以做為後續資料分析使用。其中申告代碼. ‧. 共有 56 種(該代碼包含客服判斷用戶申告說明之障礙狀況,如:中網中斷、設備問題及速率. y. Nat. 降低等)、測試代碼共有 26 種(該代碼包含各種遠端測試情形,如:AP 損壞、上網中斷及連. sit. 線速度慢等)、查修代碼共有 81 種(該代碼包含各種查修結果,如:配合道路工程、用戶設. n. al. er. io. 備及光纜問題等),另針對各種代碼之屬性歸屬至對應群組,經歸類後申告代碼可分為 10. i n U. v. 大類別、遠端測試代碼分為 13 大類別、現場查修回報代碼 15 大類別,各類別之代碼及群. Ch. engchi. 組如表 3-2、表 3-3 及表 3-4 所示,另資料範例如表 3-5。. 24.

(38) 表 3-1 颱風資料9 編號 中文名稱 英文名稱. 警報開始期間. 警報結束期間. 2013. 1323. 菲特. FITOW. 20131004. 20131007. 2013. 1319. 天兔. USAGI. 20130919. 20130922. 2009. 906. 莫拉菲. MOLAVE. 20090716. 20090718. 2009. 903. 蓮花. LINFA. 政 治20090619 大. 20090622. …. 年份. 項次 類別代碼. 申告代碼. 3AE,3BE,3LK,3LP,3NO,3OS,3VD,FLK,. ‧. FOS,SER,2BW,2ER,2LK,2NO,2OS,2VD, INT,L2F,NOL,OBN,SPL,9BW,9ER,9LK,. io. sit. y. 申告:FTTB 類. 9NB,9OS,9VD,9VE,ALU,DMG,LDK,NLD,. er. C01. 類別代碼說明. Nat. 1. 表 3-2 申告代碼一覽表. 學. ‧ 國. 立. al. v. n. PNF,ROB,RTB,SDK,VDK,VLS,VTR. 2. C06. i n C 申告:FTTB_Jh 類e hi U n g cRAS,FOK. 3. C08. 申告:FTTB_VPN 類. 3LI,3RI. 4. C15. 申告:WLAN 類. AIS,ALL,APA,APF,APO,APP,AWL,WCF. 5. C20. 申告:數據類. BAU,CRC,MOD,OPS,SAL. 9. 資料來源 http://rdc28.cwb.gov.tw/TDB/ntdb/pageControl/ty_warning 25.

(39) 表 3-3 遠端測試代碼一覽表 項次 類別代碼. 類別代碼說明. 遠端測試代碼. 1. T03. 測試:DSU 障礙. DSU. 2. T08. 測試:FTTB 障礙. VD,2LK,E,NOL,SPL,9LK,9NB,VTR,RAS. 3. T09. 測試:WLAN 類. APF,AIS,APA,APO,APP,AWL,WCF. 4. T10. 測試:不派修. DC,TOK. 5. T11. 測試:終端數據. SN. 6. T12. 測試:無法測試. 7. T13. 8. T14. 9. T16. NULL 政 治 大 測試:傳輸派測 PCM,PCN 立. ‧. ‧ 國. INB,MDF,SC. y. 表 3-4 現場查修回報代碼一覽表. 現場查修回報代碼. sit. 類別代碼說明. al. F01,F02,F03,F04,F06. er. 代客維修. n. 2. F04. 學. 測試:線路派測. io. F03. MOD. Nat. 項次 類別代碼 1. 測試:數據機不良. 用戶設備. Ch. i n U. v. 610,614,622,630,631,639,641,649,. e n g c652,659,660,662,678,679,689,700, hi 701,706,707 F13,F14,F15,F17,F20,F24,F26,F27,. 3. F05. 自備設備障礙. F39,F40,F41,F43,F52,F58,F61,F62, F94,F96,F97,F98. 4. F06. 5. F07. 局方因素. D34,D35,D36,D37,D38,D60,D66,D97. 局端總配線架及局端傳 輸設備. 26. 26T,316,31P.

(40) 項次 類別代碼. 類別代碼說明. 現場查修回報代碼 D03,D04,D06,D20,D23,D32,D33,D52,. 6. F10. 客戶因素. 7. F11. 屋外設備. 564,573,574. 8. F12. 電信室及配線箱. 515. 9. F13. 線路電纜. 413,423,433,443. 10. F14. 機房. 039,03Z,136. 11. F15. 轉派:DSLAM 機房. 12. F16. 13. F23. 14. F25. E04. 轉派:電纜維修班. E06. ‧. ‧ 國. 轉派:裝機中心. 學. 表 3-5 資料範例. y. 申告原因群組 測試結果 測試結果群組 查修單位 查修回報. INT. C03. io. al. 查修回報時間. F04. 2010/1/1 1535. n. 查修回報群組. INB. 颱風警報期間 退費等級. Ch. N 0..12 engchi U. 27. sit. 申告原因. T16. er. 2010/1/1 0829. E12 政 治 轉派:FTTB 網管機房 E31 大 立. Nat. 申告時間. D87,D89,D99. HH. 退費與否. 季節. N. spring. v ni. 706.

(41) 3.2. 資料分佈 根據前置處理過的資料,以查修單位、各類代碼(申告代碼、遠端測試代碼及現場查. 修回報代碼)、連續阻斷時間及月租費扣減與否等欄位資料依不同需求,透過統計及樞紐 分析,取得以下的資料分佈情形如圖 3-1、圖 3-2、圖 3-3、圖 3-4、圖 3-5、圖 3-6、圖 3-7、 圖 3-8、圖 3-9、圖 3-10 及圖 3-11 所示。 從圖 3-1 及圖 3-2 可以看出申告代碼次數是不平均的偏斜的分佈,其中 ALU(ALM 燈 亮)及 INT(上網中斷/瞬斷)發生次數最高佔所有筆數約 59%,將申告代碼歸類後,其分佈. 政 治 大. 仍相當不平均,約 90%資料落於 C01(申告:FTTB 類)。. 立. ‧. ‧ 國. 學. 20000 18000 16000 14000 12000 次 10000 數 8000 6000 4000 2000 0. n. er. io. sit. y. Nat. al. Ch. i n U. 申告代碼. engchi. v. 圖 3-1 申告代碼次數統計圖(僅列 300 次以上代碼). 28.

(42) 60000 50000 40000 次 30000 數 20000 10000 0 C01. C15. 立. C06. C20. C08. 申告類別 政 治 大. C07. 圖 3-2 申告類別次數統計圖. ‧ 國. 學. 從圖 3-3 及圖 3-4 可以看出遠端測試代碼以 NULL(無法測試)及 INB(上網中斷)及最多 佔所有筆數約 70%,將代碼歸類後 T12(測試:無法測試)及 T16(測試:線路派測)二類所占比. y. sit. io. al. n. 20000. er. 25000. Nat. 30000. ‧. 例 70%最多。. 次 15000 數 10000. Ch. engchi. i n U. v. AIS. APF. 5000 0 NULL. INB. RAS. SN. 9LK. 9NB. 遠端測試代碼. 圖 3-3 遠端測試代碼次數統計圖(僅列 100 次以上代碼). 29.

(43) 30000 25000 20000 次 15000 數 10000 5000 0 T12. 立. 治 政 T16 T04 T11 大 遠端測試類別. T09. T14. ‧ 國. 學. 圖 3-4 遠端測試類別次數統計圖. 從圖 3-5 及圖 3-6 可以看出現場查修回報代碼,其中 706(FTTB 用戶終端設備;T1/E1. ‧. GW)、D03(客戶稱已修復)、D04(檢機線正常)、D99(其它問題)及 614(屋內設備 ;屋內線)發. y. sit. io. n. al. er. 戶設備)群組中。. Nat. 生比例較高占所有筆數約 59%,將該代碼歸類後約 90%資料落於 F10(客戶因素)及 F04(用. Ch. engchi. 30. i n U. v.

(44) 9000 8000 7000 6000 次 5000 數 4000 3000 2000 1000. 政 治 大 現場查修回報代碼. 706 D03 D04 D99 614 F96 D37 700 423 03Z 564 515 652 F14 F17 316 D06 F13 641 610 E04 D20 630 413. 0. 立. ‧ 國. 學. 圖 3-5 現場查修回報代碼次數統計圖(僅列 300 次以上代碼) 25000. ‧. 20000. y. sit. al. n. 5000. io. 10000. er. 15000. Nat. 次 數. Ch. engchi. i n U. v. 0 F10 F04 F05 F06 F13 F14 F11 F12 F07 F23 F25 F15 F03 F16 現場查修回報類別. 圖 3-6 現場查修回報類別次數統計圖 從圖 3-7 觀察達 74%案件會於 48 小時內完成障礙處理,其中有 51%案件會於 24 小時 內完成,需減免月租費比例為 0%~20%,另有 26%案件需花 48 小時以上時間處理,需減 免月租費比例為 20%~100%。. 31.

(45) 18000 16000 14000 12000 次 10000 數 8000 6000 4000 2000 0 0..12. 12..24. 立. 24..48. 48..72. 72..96. 96..120. 120... 退費等級 治 政 大 圖 3-7 退費等級次數統計圖. ‧ 國. 學. 從圖 3-2 已得知當申告類別為 C01 時發生次數佔比最高,從圖 3-8 觀察當申告類別為 C01 時都是退費等級以 12..24 最多占 38%。. ‧. n. al. er. io. sit. y. Nat. Ch. engchi. i n U. v. 12..24 24..48 48..72 72..96 96..120 120.. 12..24 24..48 48..72 72..96 96..120 120.. 12..24 24..48 48..72 72..96 96..120 120.. 12..24 24..48 48..72 72..96 96..120 120.. 12..24 48..72. 18000 16000 14000 12000 10000 8000 6000 4000 2000 0. C01. C15. C06. C20. C08. 退費等級 申告類別. 圖 3-8 申告類別退費等級次數統計圖(僅列 12 小時以上等級) 圖 3-9 以申告代碼及最後處理之現場查修回報代碼搭配統計,以申告代碼發生比例最 高的 INT 及 ALU 來看,當申告代碼為 INT 且查修代碼為 D04 及 706 時退費比例達 39%, 當申告代碼為 ALU 且查修代碼為 D03 及 706 時退費比例亦達 39%。. 32.

(46) 2500 2000 退 1500 費 次 數 1000. N Y. 500. 政 治 大. D04 706 D03 D99 614 D03 706 614 D04 D99 D03 D04 706 F96 D99 D04 D03 F96 D99 706 706 700 D04 D03 D99 D99 D04 652 706 D03 D04 D99 652 706 D03 F96 D03 706 D04 D99 706 D04 D52 D99 D03. 0. INT. ALU. 立. NOL. SPL. DMG. APF. AIS. LDK. VDK. 現場查修 回報代碼 申告代碼. 圖 3-9 申告原因暨現場查修結果退費次數統計圖(僅列次數前 5 項資料). ‧ 國. 學. 圖 3-10 以查修單位來看 E1 及 E2 發生障礙的比例最高約 25.4%,該二單位又以發生. io. 2500. sit. y. Nat. 3000. n. al. er. 3500. ‧. ALU 及 INT 的次數最多,各占 76%及 75%。. 1500. Ch. engchi. i n U. v. 合計. 1000 500 0. ALU INT NOL SPL ALU INT NOL SPL ALU INT NOL SPL ALU INT NOL ALU INT NOL INT ALU NOL ALU INT ALU INT INT ALU ALU INT. 次 數. 2000. E1. E2. HH. E4. E3. N2. SH. E7. E5. 圖 3-10 各查修單位申告統計圖(僅列 500 次以上資料). 33. 申告代碼. KM 查修單位.

(47) 圖 3-11 從另一角度來看每個查修單位其處理障礙的結果以何種情形最多,以發生障 礙的比例最高的 E1 及 E2 來看,其最後處理結果都以 D03 及 D04 所佔比例最高,分別各 占其總筆數之 38.6%及 56.9%。 2500. 2000. 1500. 政 治 大. 次 數 1000. 立. ‧ 國 E1. E2. HH. E4. ‧. D03 D04 706 D37 D99 F96 614 D04 D03 706 614 03Z 706 D99 D03 D04 614 D04 D03 706 614 D99 D03 706 D03 D99 D03 D03 706 706 706. 0. 學. 500. 合計. N2. SH. E7 E5KM 查修單位. Nat. y. E3. 現場查修 回報代碼. al. n. 資料探討. er. io. 3.3. sit. 圖 3-11 各查修單位現場查修結果統計圖(僅列 500 次以上資料). Ch. engchi. i n U. v. 初步根據原始資料的統計分析來看,其中申告代碼 ALU(ALM 燈亮)17,757 筆、 INT(上網中斷/瞬斷)15,681 筆、NOL(無法上網)6,137 筆及 SPL(連線速度慢)4,575 筆總計 44150 筆,占客戶申告總次數 56,672 筆中 79.5%;若以申告類別來看以 C01(申告:FTTB 類)51,496 筆次數最多,占客戶申告總次數 90%,從中可以推測客戶申告障礙大多以光纖 網路異常為大宗其中又以數據機燈號異常最常發生。當受理障礙後,測量台進行遠端測試 又以 NULL(無法測試)24,429 筆、INB(上網中斷)15,729 筆及 RAS(用戶端測 L3 SW 正常仍 無法上網)6,781 筆三種次數最多占總次數 82%,表示許多情形仍無法透過遠端測試解決, 需查修人員至客戶住家或該數據設備所屬交換箱處進行實地查測;從現場查修回報資料來 看其中以 706(FTTB 用戶終端設備;T1/E1 GW)8,163 筆、D03(客戶稱已修復)8,106 筆、 34.

參考文獻

相關文件

你是 Dora 公司裡的 IT Expert,日前收到Dora的委託架設內部 dora.local 網路,最近 Dora 公司業績長紅,Dora 的合作夥伴 Diego 想要拓展分公司,但是搗蛋鬼不相信你的技術所 以想要說服

由於較大型網路的 規劃必須考慮到資料傳 輸效率的問題,所以在 規劃時必須將網路切割 成多個子網路,稱為網 際網路。橋接器是最早

《小偵探》 :小朋友,你知道誰是歐巴馬嗎?請你查一查他的資料,與全班分

審查整理呈現資料:蒐集到的資料應先審核 是否完整、正確、合理與一致,然後利用敘

搜集 / 分析 再作探究 資料.. 一起試教

• 不過,如果是為調查及懲處嚴重不當行為(並不限於罪案)的目的而使用 的個人資料,則受《 私隱條例》第58條所豁免 ,以致有關資料不受保障資

有關資料可參閱教城

資料二 資料三 國內集散產品 淮南沿海食鹽/南方茶葉/四川蜀錦/江西木材 資料四 國際貿易 發達(形容詞),外商會到揚州貿易