• 沒有找到結果。

摘要

N/A
N/A
Protected

Academic year: 2022

Share "摘要"

Copied!
76
0
0

加載中.... (立即查看全文)

全文

(1)
(2)
(3)
(4)
(5)

摘要

近年來由於資訊科技的發達與電子商務的興起改變了市場競爭的環境,企業體發 現過去傳統的經營模式已無法應付快速變遷的環境,唯有透過以客戶為導向的電子服務 方能抓住客戶。以客戶為導向的電子服務也就因此成為電子商務的研究主流。企業體也 紛紛利用網際網路來與使用者進行交易、聯繫與詢問的相關動作。

在客戶服務的過程中,回覆客戶所提出的問題除了需要耗費許多人力,為了提昇客 戶服務的效率並節省客服人員的人力。本論文中提出一套自動化客戶服務系統。這個系 統能自動地將顧客的問題分類,並且擷取出正確的解答傳送給顧客,使服務顧客的效率 及滿意度大幅提昇。當顧客不滿意系統給予的解決方法時,系統再透過客服人員分派模 組將問題分派給適當的客服人員來處理顧客的問題。實驗上證明本系統所擷取的解答有 87.3%以上的正確率,而 90.8%以上的顧客問題可由客服人員支援系統所提供的前五個 最有可能的解答中得到解答。由此可知,此系統可以滿足企業減少人事費用之需求並提 高客服人員的品質與效率。

關鍵詞:客戶關係管理、客服系統、文件比對

(6)

Abstract

The popularity of computers and networks has changed the business style in recent years. Enterprises have recognized that e-service will eventually replace the traditional way of customer service. Hence, the study of personalized on-line service has become one of the most important issues in the researches of e-commence. While the Internet is used by enterprises for contacting with customers, network-based customer services with e-mail or web-based interfaces have been developed to replace the traditional call centers with telephone interfaces. However, most existing network-based customer services heavily rely on man powers to handle e-mail or on-line requests submitted by customers, which not only increases the cost of providing customer services, but also delay the response time to complete the service procedure.

To cope with this problem, this thesis proposes an automatic customer service system which can automatically handle the requests of the customers by analyzing the contents of the requests and then finding the most feasible answers from the Frequently-Asked Question (FAQ) database. Moreover, if a customer is not satisfied with the answer given by the system, the system will forward the enquiry to the proper service personnel for further processing. An assistance model is also developed to help the service personnel to find suitable answers from the FAQ database.

To evaluate the performance of the system, some experiments have been conducted.

The experiments showed that the ratio of replying correct answer to customer is over 87.3%, and for 90.8% cases, the correct answers can be found in the top-five possible answers selected by the system. Therefore, we conclude that the system can significantly reduce the service cost and provide more efficient customer service.

Keyword: Customer Relationship Management, Customer Service System, Document

Matching

(7)

致謝辭

這篇論文得以完成,首先要感謝我的指導老師:曾秋蓉教授。感謝老師這兩 年來對學生孜孜不倦的教誨與指導,對於問題思考方向的啟發以及專業知識觀念 的引導,在在使得學生不論在學業上或是在追求學問的態度上都不斷成長。

另外,我要感謝在資工所所有協助我的師長、學長、同學、學弟妹,感謝您 們對我的支持與照顧。感謝你們耐心地與我一同討論並給予建議和幫助。也因為 你們的鼓勵讓我得以度過種種困難與難關。

當然,也要感謝我的家人:媽媽、乾爹、乾媽、弟弟,謝謝你們在我背後默 默地支持,讓我在研究的路上無後顧之憂地專心研究。也謝謝你們對我的包容與 鼓舞,讓我有更多的信心來面對研究上的難關。

最後,僅將此篇論文獻給我的母親,一位平凡卻又偉大的人。

(8)

目次

摘要...i

Abstract...ii

致謝辭...iii

目次...iv

圖目錄...vi

表目錄...ix

第1 章 簡介...1

第2 章 相關文獻探討...4

2.1 傳統客戶服務系統...4

2.1.1 常見問題集...4

2.1.2 電子信件...6

2.1.3 電話服務中心...7

2.2 自動客戶服務系統...9

2.3 自動客戶服務系統運用技術...13

第3 章 系統架構...15

3.1 資料庫設計...15

3.2 模組設計...17

3.2.1 問題分析模組...17

3.2.2 答案判定模組...18

3.2.3 答案擷取模組...18

3.2.4 滿意度回覆分析模組...19

3.2.5 客服人員分派模組...20

3.2.6 客服人員支援模組...21

(9)

第4 章 演算法...22

4.1 問題分析演算法...22

4.2 答案判定演算法...26

4.2.1 使用內積法(Inner Product method) ...27

4.2.2 使用歐基理德法(Euclidean Distance method)...28

4.3 服務人員分派演算法...29

第5 章 系統實作...32

5.1 系統發展環境...32

5.2 網站介面...32

5.2.1 管理端網站介面...33

5.2.2 使用端網站介面...36

5.3 遭遇之困難與解決方案...38

第6 章 實驗與結果探討...39

6.1 實驗設計...39

6.2 回覆最佳答案(best answer)之實驗分析...40

6.2.1 Yahoo!奇摩 Q&A ...40

6.2.2 神達電腦公司 Q&A...44

6.3 回覆前五名答案(top 5 answer)之實驗分析 ...48

6.3.1 Yahoo!奇摩 Q&A ...48

6.3.2 神達電腦公司 Q&A...52

6.4 結果探討...57

6.4.1 效能探討...57

6.4.2 答案判定演算法探討...58

第7 章 總結與未來工作...60

參考文獻...62

(10)

圖目錄

圖2.1:Yahoo!奇摩常見問題查詢流程(一)………....5

圖2.2:Yahoo!奇摩常見問題查詢流程(二)………....5

圖2.3:Yahoo!奇摩常見問題查詢流程(三)………....6

圖3.1:自動化客戶服務系統架構圖………..13

圖3.2:問題分析模組之流程圖………..15

圖3.3:答案判定模組之流程圖………..16

圖3.4:答案擷取模組之流程圖………..17

圖3.5:滿意度回覆分析模組之流程圖………..18

圖3.6:客服人員分派模組之流程圖………..18

圖3.7:客服人員支援模組之流程圖………..19

圖4.1:內積法與歐基理德法比較意示圖………..26

圖5.1:專業關鍵詞建立介面………..31

圖5.2:常見問題之建立介面………..32

圖5.3:各常見問題之特徵向量檢視介面………..32

圖5.4:服務人員之建立介面………..33

圖5.5:服務人員特徵描述之建立介面………..33

圖5.6:難解問題處理之介面………..34

圖5.7:接受顧客問題之介面………..35

圖5.8:接受顧客問題之介面………..35

圖6.1:使用未分類 Yahoo!奇摩 Q&A 資料回覆最佳答案之正確率比較-實驗一(顧客問 題類似FAQ 問題)………..39

圖6.2:使用未分類 Yahoo!奇摩 Q&A 資料回覆最佳答案之正確率比較-實驗二(顧客問 題不類似FAQ 問題)………..39

(11)

圖6.3:使用未分類 Yahoo!奇摩 Q&A 資料回覆最佳答案之正確率比較-實驗三(顧客問 題由實驗一、二任意混合)………40 圖6.4:使用分類 Yahoo!奇摩 Q&A 資料回覆最佳答案之正確率比較-實驗一(顧客問題

類似FAQ 問題)………..40 圖6.5:使用分類 Yahoo!奇摩 Q&A 資料回覆最佳答案之正確率比較-實驗二(顧客問題

不似FAQ 問題)………..41 圖6.6:使用分類 Yahoo!奇摩 Q&A 資料回覆最佳答案之正確率比較-實驗三(顧客問題

由實驗一、二任意混合)………41 圖6.7:使用未分類 Mitac Q&A 資料回覆最佳答案之正確率比較-實驗一(顧客問題類

似FAQ 問題)……….43 圖6.8:使用未分類 Mitac Q&A 資料回覆最佳答案之正確率比較-實驗二(顧客問題不

似FAQ 問題)……….43 圖6.9:使用未分類 Mitac Q&A 資料回覆最佳答案之正確率比較-實驗三(顧客問題由

實驗一、二任意混合)………...44 圖6.10:使用分類 Mitac Q&A 資料回覆最佳答案之正確率比較-實驗一(顧客問題類似

FAQ 問題)………..44 圖6.11:使用分類 Mitac Q&A 資料回覆最佳答案之正確率比較-實驗二(顧客問題不似 FAQ 問題)………45 圖6.12:使用分類 Mitac Q&A 資料回覆最佳答案之正確率比較-實驗三(顧客問題由實

驗一、二任意混合)………45 圖6.13:使用未分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案之正確率比較-實驗一

(顧客問題類似FAQ 問題)………47 圖6.14:使用未分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案之正確率比較-實驗二

(顧客問題不似FAQ 問題)………47 圖6.15:使用未分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案之正確率比較-實驗三

(顧客問題由實驗一、二任意混合)………47

(12)

圖6.16:使用分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案之正確率比較-實驗一(顧 客問題類似FAQ 問題)………48 圖6.17:使用分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案之正確率比較-實驗二(顧

客問題不似FAQ 問題)………48 圖6.18:使用分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案之正確率比較-實驗三(顧

客問題由實驗一、二任意混合)……….49 圖6.19:使用未分類 Mitac Q&A 資料回覆 5 個最可能答案之正確率比較-實驗一(顧客

問題類似FAQ 問題)………51 圖6.20:使用未分類 Mitac Q&A 資料回覆 5 個最可能答案之正確率比較-實驗二(顧客

問題不似FAQ 問題)………51 圖6.21:使用未分類 Mitac Q&A 資料回覆 5 個最可能答案之正確率比較-實驗三(顧客

問題由實驗一、二任意混合)………52 圖6.22:使用分類 Mitac Q&A 資料回覆 5 個最可能答案之正確率比較-實驗一(顧客問

題類似FAQ 問題)………52 圖6.23:使用分類 Mitac Q&A 資料回覆 5 個最可能答案之正確率比較-實驗二(顧客問

題不似FAQ 問題)………53 圖6.24:使用分類 Mitac Q&A 資料回覆 5 個最可能答案之正確率比較-實驗三(顧客問

題由實驗一、二任意混合)………53 圖6.25:三維空間中內積法與歐基理德法比較之意示圖………..57

(13)

表目錄

表2.1:問題類別………...19

表2.1:專業關鍵詞………...19

表2.3:使用者提出的問題………...20

表2.4:關鍵詞出現在使用者問題的權值………20

表4.1:問題類別………21

表4.2:問題類別的解答………22

表4.3:專業關鍵詞及其總出現次數………....22

表4.4:使用者問題………....24

表4.5:顧客問題出現的關鍵詞及其權重………24

表5.1:系統發展環境………30

表6.1:中英文分類關鍵字之對應表格………37

表6.2:實驗設計………38

表6.4:使用 Yahoo!奇摩 Q&A 資料回覆最佳答案實驗之正確率平均值………...42

表6.5:使用神達電腦公司 Q&A 資料回覆最佳答案實驗之正確率平均值………46

表6.6:使用 Yahoo!奇摩 Q&A 資料回覆 5 個最有可能答案實驗之正確率平均值……...50

表6.7:使用神達電腦公司 Q&A 資料回覆 5 個最有可能答案實驗之正確率平均值……54

(14)

第1章 簡介

Peppers & Rogers[20](1993)研究指出大部份的企業每年平均流失 25%的顧客,

而開發一個新顧客所需要的成本,卻超過保有一個現有顧客高出五倍以上。另外,

Reichheld,Sasser[22](1990)研究指出當一個顧客與企業的往來關係增長時,其獲利 也會跟著增加。甚至只要保留5%的顧客便可以增加 60%以上的獲利空間。在「20/80 法 則」中我們也可得知,企業中 20%的顧客貢獻了企業全體收益的 80%,因此企業如何 深入分析找出最重要的20%顧客,然後針對這些客戶加強服務便是現在企業經營的一個 重要課題。由此可知,企業與顧客之間建立良好的溝通關係不但具有開創顧客價值,更 有降低搜尋、交易成本等好處。

為了得到以上的好處,企業可以藉由善用資訊技術來有效地掌握特定顧客的需 求 , 以 提 供 顧 客 互 動 性 及 個 人 化 服 務 。 而 客 戶 關 係 管 理 (Customer Relationship Management,CRM)便是一種整合並且支援企業提供給客戶各種相關服務的商業應用 工具,其主要的目的是要協助企業體提供以顧客為導向的服務,且使其能將心力花在對 企業具有高價值與高發展潛力的客戶上﹔也可以說是主動積極找尋商機,『適時』、『適 量』、『適切』的提供客戶個人化產品[7]。

一客戶關係管理解決方案包括四大區塊:客戶互動管道管理(如電話服務中心、

網際網路及電子信件)、營運面的客戶關係管理(如銷售自動化及一對一行銷)、決策面 的客戶關係管理(如即時線上分析及資料探勘)以及後端財務或物流系統的串連與整合 [7]。在這四大區塊中,客戶互動管道管理是聯繫企業體與客戶良好溝通關係的一個重 要的媒介。也就是說客戶服務中心顧客關係管理中極具重要性的一環,是企業接觸客戶 最重要的管道。目前常見的客戶服務中心的種類大致上分做樣本信件自動回函,常問的 回函範本,常見問題集,服務專員處理,問題解答知識庫,以及電話服務中心等類別。

WorldTalk Corporation[25]一份報告中就估計在 1999 年全球就已經有超過六千萬的

(15)

商務人士使用電子信件(E-mail)來處理工作事務,相信現在使用電子信件處理工作事 務的人遠遠超過這個數字。在經濟部技術處小組一份調查結果中顯示[12],企業界使用 電子郵件服務客戶的普及程度到96%。相信現在這個普及程度有愈來愈高的成長率。從 這點可以預見以後由電子郵件為客戶服務的量將會急遽增加,而如何快速地答覆顧客的 詢問將是提高顧客服務滿意度最基本的課題。但是以目前企業體利用電子郵件回覆客戶 問題的效率而言,人事成本不僅龐大而且無法立即而迅速的提供客戶滿意的答覆。一份 在1998 年 Data Monitor 的研究報告指出[17],65%的消費者都曾經歷過以電子郵件向廠 商詢問問題,卻沒有任何回應;而獲得回應的消費者當中,有63%的等待時間都超過 5 天以上。由此可知,以電子郵件服務為媒介的客服系統品質尚有極大的提升空間。因此,

提供一個快速又具有一定服務品質的機制或系統來協助企業處理客服信件,在提昇客戶 關係管理品質中是一個很重要也很有價值的課題。

以電子信件為基礎的客戶服務系統方面,分別有Hoch[22]、Cohen[25]、Cooper[15]

等人的研究。其中,1994 年 Hoch 提出的一套 INFOCLAS 系統[22]來對德國的商業信件 做分類,將判斷每個信件類別的關鍵詞作為分類的依據。但這個系統無回覆的功能。

Cohen 在 1996 年 [25] 也 提 出 的 一 套 電 子 郵 件 分 類 方 法 - 焦 點 關 鍵 詞 規 則

(keyword-spotting rules),發現在分類的正確性上比起一般傳統的方法要來得準確。由 於這套分類方法主要的目的在於提供電子郵件的分類,因此也未提供有關於信件的適當 回覆。另外,1996 年 Cooper 提出一套 FAQfinder[15] 運用 Lisp 語言函數技術的系統。

它的缺點是當使用者的問題在現有的知識庫中找不到滿意的解答,使用者便無法進一步 得到滿意的答覆。而在 2002 年李孟瑜,曾秋蓉[3]提出智慧型自動化網路客服系統

(Intelligent Network-based Customer Service System,以下簡稱 INCSS 系統),使用權重 關鍵詞集(Weighted Keyword Set,WKS)來代表每一個問題,進而計算兩個問題之間 的相似度。雖然它修正了之前信件回覆及現有知識庫找不到解答的問題,但是有權重關 鍵詞集需要管理者手動設定此一耗費人力的問題。另外,問題分類的正確率十分不穩定。

本研究論文提出一套自動化客戶服務系統(Automatic Customer Service System,

(16)

ACSS),這套系統改良自 2002 年李孟瑜,曾秋蓉提出的 INCSS 系統,可讓使用者可以 透過電子郵件來詢問問題,然後系統將問題自動歸類,並自動給予符合使用者問題的解 答,使客戶服務的效率大幅提昇。我們運用了向量空間模型的概念,以特徵向量為基礎 [4][16][24]設計一套新的文件分類法[15][25],此文件分類法為每一個問題自動地計算一 個特徵向量,並為每一客服人員定義一個特徵向量。系統將自動地對客戶的問題分類,

擷取正確的解答傳送給客戶。當客戶不滿意系統給予的解決方法或者系統未找出相似問 題類型時,系統會透過客服人員分派模組,將問題分派給適當的客服人員,才由客服人 員來回答客戶的問題。客服人員除了回傳解決方法外,並將該問題及回傳的解決方法寫 入問題解答資料庫中以累積系統回覆問題的實力,讓各種客戶的問題都能夠得到滿意的 解答。

透過本研究論文提出的自動化客戶服務系統不僅達到高效率的客戶服務,還提高 問題分類的正確率以及其穩定性。也因為手動設定部分比 INCSS 系統更少,進一步地 減輕了客服人員的負擔,減少客戶等待的時間,並且透過知識的累積來提昇解決客戶問 題的準確度。如此,顧客對企業體的向心度不僅提高,更降低企業客服部門的成本,使 企業體的競爭力大幅提昇。另外,本論文中所提出以特徵向量為基礎的文件分類法並不 侷限在電子商務的客戶服務應用上。只要是透過電子郵件為媒介的應用,如網路教學系 統中,學生發出電子郵件向教師詢問課程問題,也同樣可以運用本系統所提出的方法來 解決﹔甚至於互動介面亦可從電子郵件轉移到以網頁為基礎的問答系統中作為線上助 教系統。也能運用討論區或電子佈告欄(BBS)的界面上作為即時回應系統。綜合以上,

可以知道本系統之應用範圍十分多元,相信在應用上有無窮限量的潛力。

(17)

第2章 相關文獻探討

在這個章節中,我們會分別對於傳統客戶服務系統、自動客戶服務系統、自動客 戶服務系統所運用之技術做一發展與現況論述。在2.1 節中我們將介紹傳統客戶服務系 統,2.2 節中介紹自動客戶服務系統,2.3 節中則為自動客戶服務系統運用技術的介紹。

2.1 傳統客戶服務系統

企業體在處理客戶服務問題的選擇方案上,在傳統的客戶服務系統主要有常見問 題集(FAQ)、電子信件(E-mail)、電話服務中心(Call Center)這三大種選擇。我們 分別以2.1.1 小節介紹常見問題集及其應用,2.1.2 小節介紹電子信件及應用發展,而 2.1.3 小節為使用電話服務中心作為傳統客戶服務系統的介紹。

2.1.1 常見問題集

目前大多的網站多以常見問題集(FAQ)來協助處理客戶的問題(如 Yahoo!奇摩、

Mitac 神通電腦、台灣微軟、中華電信等)。主要的原因在於常見問題集在架設技術上不 需要複雜的技術。在架設上也較為節省人力以及客戶服務人員的訓練經費。所以大部分 的網站大多都有常見問題集的設置。以Yahoo!奇摩為例,圖 2.1 至圖 2.3 顯示了查詢常 見問題的流程。首先,通常會進入常見問題的分類畫面(如圖2.1),再由該分類畫面中

(如圖2.2)選取想要詢問的問題,在看到結果後如果發現資訊不足以解答則由圖 2.1、

圖2.2 的程序再選擇一次,或者填寫建議表格向客服人員做進一步詢問。如此,通常使 用者在透過常見問題集(FAQ)尋求協助時,往往需要花費大量的時間才能找到自己想 要的解答,即使向客服人員作進一步的詢問也得花一段時間才能得到回覆。如此不僅沒 達到高效率的客戶服務,而且客戶服務的滿意度很低。

(18)

圖2.1:Yahoo!奇摩常見問題查詢流程(一)

圖2.2:Yahoo!奇摩常見問題查詢流程(二)

(19)

圖2.3:Yahoo!奇摩常見問題查詢流程(三)

2.1.2 電子信件

目前使用電子郵件來協助處理客服信件的系統,以其所提供的功能來做區分,大 致上可分成下面幾類:

(1) 樣本信件自動回函:當客戶傳送一封詢問的郵件到系統時,系統會立即自動回 傳一封樣本信給顧客,這封樣本信的內容是告知客戶系統已接收到客戶的詢 問,並且會儘快解決的字樣回傳給客戶。而實際的解答還是靠客服人員以人工 的方式處理。

(2) 建立常問的回函範本:事先建立一些常問問題解決方法,當客戶傳送詢問問題 的信件來時,由客服人員從這些回函範本裡找出最適當的回函回覆給客戶。若 回函範本裡並沒有客服人員所要的問題解答時,客服人員則先以人工解決客戶 問題之後,再將此次的回覆寫入系統內,以便利以後的客服人員搜索資料。

(20)

(3) 建立常見問題集:此法搜集了一些客戶常詢問的問題及解答,放在企業的網站 上供客服人員自行經由分類或是關鍵詞搜尋的方式做查詢。若查詢不到再自行 回覆。

(4) 分配專人處理問題:通常分配的方式有兩種。一是當客戶傳送詢問的問題時,

必須自行判別其問題的類別,所以當問題傳送至系統時,就直接分配給負責該 問題類別的客服人員。但是一般的客戶要對問題做精確的分類並不容易,因此 另一種方式是由系統根據關鍵詞來做問題的分配。在比對問題中的關鍵詞時,

一旦出現某個重要的關鍵詞便直接分配給負責服務有關該關鍵詞問題的客服 人員去處理,不過只碰到第一個關鍵詞就立刻決定分配給那位客服人員去處 理,並不十分客觀,也是無法做到百分之百正確的分配。

(5) 建立問題解答資料庫:將客服人員曾經回答過的問題及解答都寫入資料庫裡,

當客戶傳送詢問的問題到系統時,系統會先查詢以前是否有詢問過相同的問 題,若是有查詢到則將解答自動回傳給客戶,若未查詢到則分配給客服人員處 理。

2.1.3 電話服務中心

關於電話服務中心(Call Center)的應用始於一些消費性產品,大約在 1985 年前 後許多企業逐漸進入服務導向的階段,當時由一些較有客戶服務概念的企業(例如統一 企業)開始設立服務專線,但僅是一支080 電話專線,因此不能稱為正式的電話服務中 心(Call Center),不過企業自此開始注重客人的建議、詢問及抱怨,並逐漸發展出客戶 服務中心。在演進大致上有下列幾個階段:

消費者服務專線:最早略具客戶電話服務中心雛形者首推一些消費性產品公司,

例如洗髮精、食品、家電用品等。稱之為「消費者服務熱線」,其目的是為提供客戶抱 怨及建議之管道,但往往只是隸屬於公關或行銷部門之下,且服務時間只限於正常上班

(21)

時間內。

航空公司訂位組:較大型的電話服務中心肇始於航空公司之訂位組單位,業務內 容單純(以訂位為主,較少客戶抱怨處理)、流程固定(查日期時間班次→問客戶姓名

→問連絡人電話→給訂位代號),但此時服務時間仍停留於正常上班時間內。

金融、信用卡業:近年來政府放寬金融機構的設立,金融、信用卡、保險業、證 券業者激烈競爭下使客戶服務概念有了更進一步的詮釋,其中尤以信用卡業為最。大型 廿四小時營運的電話服務中心乃正式產生,並且以客戶服務為主要訴求。

電信業者:民營行動電話系統業者成立之後,三百至五百人次、廿四小時運行的 大規模電話服務中心,將電話服務中心於台灣之發展推到了最高點。電信業者從業人員 所需的專業知識從帳單、各種廠牌型號手機功能、促銷方案內容、網路訊號申告、客戶 資料線上更改、加值服務(例行動數據、無線應用通訊協定(WAP)、語音信箱等),

以及一般客戶抱怨申訴。由於專業知識複雜,因此電信業客服人員的訓練時間往往須長 達三週至一個月,亦必須佐以不間斷的在職訓練,故人才養成的成本極高。

電話服務中心電腦系統的演進及應用:由早期只提供一條專線,到 080 免費服務 電話,再到自動話務分配系統(Automatic Call Distribution,ACD)、自動語音查詢系統

(Interactive Voice Response,IVR),以至最先進的電腦電話整合系統(Computer Telephony Integration,CTI)將電腦與電話線路整合在一起,不似傳統之架構為兩者分 開。台灣的電話服務中心也開始由早期所謂「消費者服務熱線」,走向世界先進的電腦 電話整合系統,惟目前於台灣仍只有極少數的業者採用(如泛亞電信)。[5][6]

由以上 2.1.1 到 2.1.3 三小節介紹可以發現,不論使用常見問題集、電子信件或者 是電話服務中心作為媒介的客戶服務系統不是讓使用者需要花費大量時間自行尋找答 案,就是企業體需要花費大量人力與金錢來處理客戶問題。所以建置一個企業體可以節 省人力與金錢,同時使用者又能快速得到服務的自動化客服系統可見有其重要性、迫切 性。

(22)

2.2 自動客戶服務系統

企業體在處理客戶服務問題的選擇方案上,在以電子信件為基礎的自動客戶服務系 統方面,分別有Hoch[21]、Cohen[25]、Cooper[15]以及李孟瑜,曾秋蓉[3]等人的研究。

1994 年 Hoch 提出了一套 INFOCLAS 系統[21],運用一般傳統的資訊擷取技術來 對德國的商業信件做分類,它主要的目的是將一般信件掃瞄進電腦後再作分類。此方法 將判斷每個信件類別的關鍵詞依其對該類別的相關程度分成三個集合,系統可以調整關 鍵詞存在的集合,但無法對每個關鍵詞個別對該類別的相關程度做權重比率的調整。此 外,此套系統可以將信件正確的分類,但它卻無回覆的功能。

Cohen 在 1996 年 也 提 出 的 一 套 電 子 郵 件 分 類 方 法 [25]- 焦 點 關 鍵 詞 規 則

(keyword-spotting rules),並且將這套方法與一般傳統的資訊擷取方法做比較,發現焦 點關鍵詞規則在分類的正確性上比起一般傳統的資訊擷取方法要來得準確,尤其是在測 試的資料量較多時。但是在 Jason Rennie[17]指出這個系統在現實世界裡由於這套分類 方法主要的目的在於提供電子郵件的分類,讓使用者可以很方便又迅速的管理個人的電 子郵件,因此它也未提供有關於信件的適當回覆。

另外,1996 年 Cooper 提出一套 FAQfinder 系統[15],在使用者提出問題時,系統 會先比較系統內是否已有類似的問題及解答存在,若有則顯示這些言語表達方式最相近 的問題及解答在Web 界面上給使用者觀看,並且透過 Lisp 語言的函數定義了在問題符 合時的每個參數應該被加權或合併,來決定兩個問題之間的相似度。由於FAQfinder 並 未將系統無法回覆或顧客不滿意的回覆轉給客服人員處理,因此若使用者的問題在現有 的知識庫中找不到滿意的解答,使用者便無法得到滿意的答覆。2000 年 Segal, Kephart[23]

運用了文件分類的技術來對電子郵件做分類,但是僅提供電子郵件文件夾分類的建議。

2002 年李孟瑜,曾秋蓉[3]提出了一套智慧型自動化網路客服系統(Intelligent Network-based Customer Service System),它使用權重關鍵詞集(Weighted Keyword Set,

(23)

WKS)來手動設定並代表每一個問題,進而計算兩個問題之間的相似度。

FKS(Qi) = {(K1

| W

i1), (K2

| W

i2) …(Kn

| W

in) } , 代表常問問題類型 Qi 的模糊關鍵 詞集,其中(Kj

| W

ij) 代表第 j 個關鍵詞 Kj

在 Q

i中所佔的權重是Wij;n 代表系統內的 專業關鍵詞的個數。舉例來說,假設在處理電腦週邊的客服系統中包含有4 個常問的問 題類型 (如表 2.1) 及 21 個統計獲得的專業關鍵詞 (如表 2.2) 。

表2.1:問題類別

編號 問題類型名稱

Q1 鍵盤無反應

Q2 音效硬體

Q3 音效軟體

Q4 顯示器無法顯示畫面

表2.2:專業關鍵詞

編號 關鍵字 編號 關鍵字 編號 關鍵字 編號 關鍵字

K1 M722 K7 音效 K13 印表機 K19 色彩

K2 M722H K8 音效卡 K14 連接埠 K20 顯示器

K3 聲音 K9 喇吧 K15 無聲 K21 卡紙

K4 數據機 K10 音樂 K16 電源

K5 鍵盤 K11 風扇 K17 裝置

K6 雜音 K12 映像管 K18 設備

其中問題類型與關鍵詞的關係定義如下:

FKS(Q1)= {(K5

| 0.6), (K

14

| 0.4)}

FKS(Q2)= {(K6

| 0.1), (K

8

| 0.3), (K

15

| 0.05), (K

17

| 0.3), (K

18

| 0.25)}

FKS(Q3) = {(K6

| 0.25), (K

7

| 0.2), (K

9

| 0.2), (K

3

| 0.15), (K

10

| 0.05), (K

15

| 0.15)}

(24)

FKS(Q4)= {(K12

| 0.3), (K

14

| 0.2), (K

16

| 0.2), (K

20

| 0.3)}

對於使用者所提出的問題Q,我們亦可用一模糊關鍵詞集 FKS(Q)來表示:

FKS(Q) = {(K1

| W

1), (K2

| W

2) ……(Kn

| W

n)}

其中(Kj

| W

j)代表關鍵詞 Kj在Q 中所佔的權重為 Wj,也就是第 j 個關鍵詞在使用者 問題Q 裡出現的頻率,計算方式如下:

其中fij為第 j 個關鍵詞在問題 Qi裡出現的次數;Σk=1,n fik代表出現在此問題裡的關 鍵詞的次數總和;n 代表系統內專業關鍵詞的個數。假設使用者提出的問題如表 2.3 所 示,可算出關鍵詞出現在使用者問題的權值如表2.4 所示。

表2.3:使用者提出的問題

問題 我於三個月前買一台筆記型電腦 M722 PIII650MHZ,使用上大致上沒有問

題,只有音效常常發生沒有聲音,使用Winamp 時只有一秒鐘後就沒有動

作。每次要到系統裡把音效卡移除後再重新設定才正常工作。一共發生數

十次以上。今天又發生無聲就到貴公司網站download M722 Audio Drvier

R03 for Win 98 後執行 setup 無效, 只有到系統裡把音效卡移除後再重新

設定才正常工作。

表2.4:關鍵詞出現在使用者問題的權值

關鍵詞 出現次數 Wj

音效 1 0.2

聲音 1 0.2

音效卡 2 0.4

無聲 1 0.2

fij

Wij =

Σk=1,n fik

(25)

因此代表使用者問題的模糊關鍵詞集為FKS(Q) = {(K7

| 0.2), (K

3

| 0.2), (K

8

| 0.4),

(K15

| 0.2)}, 此模糊關鍵詞集即可用來代表使用者問題的特性。

接 著 INCSS 系 統 以 解 答 判 定 演 算 法 演 算 法 將 使 用 者 問 題 的 模 糊 關 鍵 詞 集 FKS(Q),會同資料庫中常問問題的模糊關鍵詞集 FKS(Qi)作模糊運算。定義使用者問題 Q 與常問問題 Qi的相關程度Di為:

Dik=1,n (Wk * Wik)

以先前的例子計算使用者問題Q 與資料庫中常問問題 Qi的相關程度Di如下:

D1 = 0.2*0 + 0.2*0 + 0.4*0 + 0.2*0= 0 D2 =0.2*0+0.2*0+0.4*0.3+0.2*0.05=0.13 D3 = 0.2*0.2+0.2*0.15+0.4*0+0.2*0.15=0.1 D4 = 0.2*0 + 0.2*0 + 0.4*0 + 0.2*0= 0

其中相關程度最高者為D2,於是系統將判定使用者問題與常問問題Q2最接近。

雖然INCSS 系統修正了之前研究中信件沒有自動回覆以及現有資料庫找不到解答 便沒有進一步動作的問題,但是回覆問題的正確率卻會隨著中、英文以及分類、未分類 資料的不同而不穩定。另外,由於權重關鍵詞集為手動設定,所以會受到管理人員素質 的優劣而影響系統判斷的效能。再者,當有新的常見問題增加時也容易因為權重關鍵詞 集設定過於主觀,而有與舊有常見問題權重關鍵詞集相似或衝突的狀況,所以在漸增性 上有所顧慮。由此可知 INCSS 系統還存留著許多改善的空間。故本系統改以更為客觀 的方法並且自動運算特徵向量來改善這些問題。

以上介紹的客戶服務系統,不難看出目前熱門的方式是以即時回應機制與自然語 言詢問為主。國內使用這類技術的還有張育銘,黃國禎[10]所提出的自我調適能力之智 慧型網路客戶服務系統,此系統利用此一機制使得使用者可以得到迅速的回答而不需要

(26)

人為的幫助。另外,網際智慧公司也提供這種技術服務,它主要利用口語化的中文句子 或關鍵字輸入查詢相關資訊,同時呈現快速而精準的查詢結果。在國外的應用方面,

Ask Jeeves 是一個以網頁介面為基礎的常見問題查詢系統,它將生活資訊分作若干類 別,使用者可以使用自然語言來查詢並立即得到回應。

2.3 自動客戶服務系統運用技術

而本篇提出的自動化客戶服務系統所運用到的核心技術,分別有關鍵詞擷取技術 以及客戶問題與常見問題相似度計算技術。

在關鍵詞擷取技術方面,曾元顯[11]在一篇研究中指出,關鍵詞擷取的技巧主要有 三種方法。在比較各種方法的擷取成效上,因為關鍵詞的認定牽涉到個人的主觀判斷,

且相同的詞彙在不同的主題下也有不同的認定。在此情況下,要比較各種方法的擷取成 效,並不容易。不過一些文獻對此問題仍有初步的探討,以下便針對這三種方法作一介 紹:

(1)詞庫比對法:即利用已建立的詞庫,來比對輸入文件將文件中出現在詞庫中的片 語擷取出來。此種方法製作簡單,但並不保證所有關鍵詞都能被擷取出來。除此 之外,其缺點還包括:需要耗費人力、時間維護詞庫以容納各個領域的專業用語 與新生詞彙,無法應付未曾預料的專有名稱。

(2)文法剖析法:透過自然語言處理技術剖析出文件中的名詞片語,再運用一些方法 與準則,過濾掉不適合的詞彙。可以擷取出未曾被詞庫、語料庫出現的詞彙片語。

但大部份的剖析程式需要藉助已經建立的詞典或語料庫,因此其缺點也和詞庫比 對法一樣。Arppe[14]以文法剖析方式試驗其擷取成效,結果發現大約 80%-99%

的關鍵詞為名詞片語,然而具代表性的名詞片語不到總數的 50%,因此仍需要依 據其他特徵以過濾掉不要的詞彙。

(27)

(3)統計分析法:透過對文件的分析,累積足夠的統計參數後,再將統計參數符合某 些條件的片語擷取出來。最簡單的統計參數是計數詞彙發生的頻率,即詞頻,將 詞頻落在某一範圍的詞彙取出。會有擷取錯誤的情況發生,得到無意義或不合法 的詞彙。此外,統計參數不足的關鍵詞無法被選到。Godby [18] 比較文法剖析法 與統計分析法的優劣,發現統計分析法除了可以跟文法剖析法做得一樣好之外,

亦具備簡單、不受語文國別與句法的限制、以及可同時過濾不具代表性片語的優 點。

在相似度計算技術方面,因為我們將問題的特徵視做一向量空間模型,所以在計算 各個向量的相似度上有相當多理論以及先進的學術研究可供參考。好比正投影法

(Orthogonal Projection Method)(或稱內積法)、歐基理德距離法(Euclidean Distance Method)、餘弦測量法(Cosine Measure Method)、K 均值法(K-mean Method)、類神經 網路分類法(Neural Network)、決策樹(Decision Tree)等方法,相信大家都相當熟悉。

本篇論文中因為採用特徵向量作為分類的依據,以及考量為了達到即時回應所涉及的運 算時間以及系統中FAQ 資料庫的不斷漸增特性,我們選擇內積法與歐基理得法兩種最 為常見的技術作為相似度計算的方法。在第4.2 節中我們將詳細說明採用這兩種方法之 原因以及在系統中應用的方式與範例。

以上,我們在2.1 到 2.3 節中得知了由傳統客戶服務系統,自動客戶服務系統與自 動客戶服務系統運用技術的相關研究。可以知道不論是傳統客戶服務系統或是現存的自 動客戶服務系統都有其缺陷,往往還是需要耗費人力與物力來處理客戶所提出的問題,

有許多可以改進的空間。所以我們提出一套在提昇正確率的同時還能進一步節省人力和 物力的系統-自動化客戶服務系統來作為解決方案。

(28)

第3章 系統架構

本研究所提出的自動化客戶服務系統的架構如圖3.1﹕

發問

答案判定模組 問題分析模組

滿意度

回覆 答案擷取模組

滿意度回覆 分析模組

客服人員分派模組 答案

回覆

自動化客戶服務系統

客服人員支援模組

專業關鍵詞庫

特徵向量資料庫

客服人員 資料庫 問題解答

資料庫 使用者

答案 回覆

圖3.1:自動化客戶服務系統架構圖

系統主要是由專業關鍵詞庫、特徵向量資料庫、問題解答資料庫與客服人員資料 庫等四個資料庫以及問題識別模組、解答判定模組、解答擷取模組、滿意度分析模組與 客服人員分派模組等五個模組所構成。以下各節將分別說明各個資料庫、模組的內容以 及各模組與資料庫之間的關係。

3.1 資料庫設計

本系統使用到的資料庫有專業關鍵詞庫、特徵向量資料庫、問題解答資料庫以及

(29)

客服人員資料庫等四個資料庫。分別介紹如下:

(1)專業關鍵詞庫

專業關鍵詞庫[9]主要由系統管理者以企業體的屬性以及顧客有可能詢問的問題內 容為依據所定義出來。在顧客所提出的問題當中所出現的專業關鍵詞作為問題特徵向量 的參數,系統會依據這一組特徵向量來作為分類的依據。關於問題特徵向量的計算方 式,我們先利用中研院所發展的一套 CKIP 中文自動斷詞系統[10]將電子郵件的內容加 以斷詞後,再與此專業關鍵詞庫作比對來找出該電子郵件中能代表其問題屬性的關鍵 詞,藉以建立該電子郵件問題的特徵向量。

(2)特徵向量資料庫

這個資料庫記錄了來代表每個常見問題特性的特徵向量,以便將來與顧客提出的 問題的特徵向量做比對動作。這個系統裡所定義的特徵向量是以各個關鍵詞和其出現的 頻率比例來代表該問題屬性的一個集合(詳細說明請參考第 4 章)。對於顧客所提出的問 題也會計算出一個特徵向量來表示之。系統在得到問題的特徵向量後會同系統內常見問 題的特徵向量做相似度運算,以得知顧客問題與系統常見問題中何者較為相似。

(3)問題解答資料庫

在問題解答資料庫裡,記錄著內定的常見問題以及其對應的解答。當系統計算得知 顧客提出的問題與哪一個常見問題有較高的相似度時,便可以在此資料庫中找出其解答 來回覆。

(4)客服人員資料庫

客服人員資料庫包含的是系統管理員針對每位客服人員所設定的特徵向量,代表 著每位客服人員所負責的問題類型。當問題要分派給客服人員時,便依據此客服人員資 料庫裡的每位客服人員的特徵向量與該詢問問題的特徵向量來做相似度運算,如此便能 得知應該負責解答此問題類型的客服人員。

(30)

3.2 模組設計

在以下個小節裡我們將介紹問題分析模組、答案判定模組、答案擷取模組、滿意 度回覆分析模組、客服人員分派模組、客服人員支援模組等六個模組之間的關係,以及 模組運用資料庫的關聯。下面的3.2.1 小節我們將介紹問題分析模組的工作流程。3.2.2 小節中介紹答案判定模組的工作流程。3.2.3 小節介紹答案擷取模組的工作流程。3.2.4 小節介紹滿意度回覆分析模組的工作流程。3.2.5 小節介紹客服人員分派模組的工作流 程。而3.2.6 小節介紹的則是客服人員支援模組的工作流程。

3.2.1 問題分析模組

當顧客以電子郵件提出問題時,首先進入的便是問題分析模組。此模組的流程圖 如圖 3.2。此模組主要的功能在於計算顧客所提問題的特徵,模組透過顧客所提出問題 與專業關鍵詞庫中各個關鍵詞做比對的動作,來產生代表顧客問題特徵的特徵向量。此 一特徵向量將傳遞至下個模組─答案判定模組─進行與系統內常見問題之特徵向量資料 庫作相似度比對的處理。

取得 使用者問題

取得關鍵字與 計算關鍵字頻率

產生該問題 之特徵向量

專業關鍵詞庫

特徵向量 資料庫

圖3.2:問題分析模組之流程圖

(31)

3.2.2 答案判定模組

在得到顧客問題的特徵向量後,此模組會把特徵向量資料庫裡代表每個常見問題 的特徵向量與該問題的特徵向量做相似度的運算以得到一個最佳的答案解。圖3.3 顯示 此模組之流程圖。

圖3.3:答案判定模組之流程圖

顧客問題對於每個常見問題都會產生一個相似度的數值。接下來,系統便可藉由 這些數值中的最大者來判定顧客問題與哪一個常見問題較為相似﹔或者是藉由與系統 設定的一個問題相似度臨界值做比較,當數值最大者大於或等於此臨界值時表示與此數 值對應的常見問題與顧客問題的相似。如果有對應的常見問題出現時,系統會進入答案 擷取模組來取得與該顧客問題最為相似之常見問題的解答。然而,如果沒有對應的常見 問題出現時,即最大的相似度數值小於臨界值,表示顧客問題與全部常見問題沒有超過 一定程度之相似性,系統便會進入客服人員分派模組來判斷顧客所提出的問題應該屬於 哪一個類別,再由負責該類別之客服人員回答此問題並將該問題寫入資料庫中,以增加 系統回覆顧客問題之實力。

3.2.3 答案擷取模組

當系統運算後得知顧客問題在系統中有對應的常見問題時,系統會進入此模組。

(32)

這代表著答案判定模組判斷出資料庫中有一個常見問題與顧客問題擁有最高的相似 度,此一模組便負責將該對應的常見問題從問題解答資料庫中擷取出答案以回覆給顧 客。此模組的流程圖如圖3.4。

圖3.4:答案擷取模組之流程圖

3.2.4 滿意度回覆分析模組

系統對於顧客在收到信件後所填寫之滿意回覆設定了一個滿意度臨界值,以作為 判斷顧客對於系統的解答是否滿意的依據。當系統傳送問題的解答給顧客時,顧客可以 對該問題的解答來勾選對於該解答是否滿意的評分然後傳回系統。系統在得到顧客回覆 的滿意度後會與系統的滿意度臨界值做一比較動作。如果顧客的滿意度數值小於滿意度 臨界值時,即表示顧客對於該問題的解答滿意度不夠高,系統便進入客服人員分派模 組。該模組會將顧客的問題分派給負責該類型問題的客服人員來處理;然後將此問題寫 入系統資料庫中以提昇本系統回覆問題的實力。圖3.5 顯示的為滿意度回覆分析模組之 流程圖。

(33)

圖3.5:滿意度回覆分析模組之流程圖

3.2.5 客服人員分派模組

在系統裡針對每一個客服人員所負責回覆的問題類別個別以一特徵向量來描述,

包括客服人員所負責的關鍵詞及其權重比值。當系統對於最大的相似度數值小於臨界值 而產生沒有對應的常見問題出現時便會進入此模組。圖3.6 顯示的為此客服人員分派模 組之流程圖。此一模組會將每一位客服人員的模糊關鍵詞集與顧客問題的模糊關鍵詞集 作比對,計算出兩者之間的關係程度,再將問題分派給與此問題關係程度最高的客服人 員。

圖3.6:客服人員分派模組之流程圖

(34)

3.2.6 客服人員支援模組

對於分派給客服人員的問題,代表該問題與系統中的常見問題皆沒有超過一定相 似度,或者代表顧客對於系統找出該問題之解答不滿意。系統對於此類狀況之問題會提 供五個答案給負責的客服人員作為建議支援之用。而這些答案是藉由答案判定模組取得 相似度數值為前五大者所對應的常見問題,接著透過答案擷取模組得到。客服人員可以 自行撰寫答案,或者藉由這個模組所建議的五個答案中挑選來回覆給顧客。如此便可以 減輕客服人員的負擔。圖3.7 顯示的為此客服人員支援模組之流程圖。

圖3.7:客服人員支援模組之流程圖

在以上3.1 和 3.2 節中我們得知了系統四個資料庫與六個模組的相關資訊。在 3.2.1 到 3.2.6 小節中進一步得知了六個模組是如何與資料庫搭配進行顧客問題的處理。如 此,對整個系統的架構有一個完整的認知。

(35)

第4章 演算法

在大多的文件分類方法中,常常只以關鍵詞在一文件中出現的頻率來作為分類的 依據[21],這種方類的方式只能描述某關鍵詞是否存在文件類別的關鍵詞集合中,而無 法詳細的表達其存在的比例。另外,在 INCSS 系統中需要由該系統應用領域之專業人 士來設定各個常見問題的專業關鍵詞關係權值,這種做法在常見問題集很大量時需要大 量的人力資源來達成。因此,我們嘗試以向量空間為基礎概念,將文件視為空間中的一 點並為其計算出特徵向量,提出一以特徵向量為運算依據的文件分類法來做為本論文中 判定顧客問題特性的依據。而本論文這個新的文件分類法可以公正的計算每個專業關鍵 詞與全部各類文件的關係權值,系統在常見問題的特徵向量設定上便可以做到自動化。

以下 4.1 節中我們將介紹問題分析演算與其範例。4.2 節中介紹答案判定演算法及其範 例。而4.3 節中介紹的是服務人員分派演算法。

4.1 問題分析演算法

在系統的資料庫中,我們已事先由專業人員定義了一組與應用領域相關的關鍵 詞,透過這些關鍵詞和其所佔有的權值組合來描述不同的問題類型。每個問題類型可能 與一個或多個關鍵詞有關,而這些關鍵詞在全部問題類型中分別佔有不同的出現比率。

問題分析演算法的功能在於針對常見問題與顧客提出的問題進行分析,產生用來描述該 問題的特徵向量 (Character Vector,CV)。常見問題的特徵向量表示式為﹕

( ) ( Q

i

{ K W

i

) ( K W

i

) ( K

j

W

ij

) ( K

n

W

in

) }

CV

= 1, 1 , 2, 2 ... , ... ,

其中,

CV ( ) Q

i 代表常問問題類型Qi 的特徵向量。而

( K ,

j

W

ij

)

代表第 j 個關鍵詞

K

j

Q 中所佔的權重是

i

W ;式子中的 n 代表系統內的專業關鍵詞的個數。

ij

(36)

K 在

j

Q 中所佔的權重

i

W ,其計算公式如下:

ij

=

=

m

k kj ij ij

f W f

1

其中

f 為第 j 個關鍵詞在常見問題 Q

ij i裡出現的次數;

= m

k

f

kj 1

代表第 j 個關鍵詞在全 部常見問題裡出現次數的總和;m 代表系統內常見問題的數量。

[範例 4.1]

舉例來說,假設系統資料庫中其中 4 個常見問題類型與解答分別如表 4.1、表 4.2 所示,全部的專業關鍵詞及其總出現次數如表4.3 所示。

表4.1:問題類別

編號 常見問題類型名稱

Q1 電子報訂報或辦報要費用嗎?

Q2 取消訂閱電子報的流程。

Q3 使用奇摩分類網站排序優先服務的費用?

Q4 網站類目後面加個"@"代表什麼意義?

(37)

表4.2:問題類別的解答

編號 常見問題類型解答

Q1 Yahoo!奇摩電子報為服務性質,不論訂報或辦報皆免費。

Q2 在您的個人電子報管理介面,也就是「我的電子報」,在 您想要取消訂閱的電子報前勾選「取消訂閱」。您也可以 在每封電子報最下方找到我要取消訂閱的連結,點下去後 輸入您的Yahoo!奇摩帳號和密碼,這樣系統也會自動幫您 取消訂閱。

Q3 分類網站排序優先服務的月費費率依分類目錄之不同而 訂定,價格表在您送出您要申請排序優先網站之網址之 後,會有線上說明您網站所屬類別下網站排序優先的價 格,價格大約在每月新台幣3,000~20,000 元(含稅)之間。

Q4 當您在瀏覽Yahoo!奇摩分類時,如果看到"@"就表示這個 類目會同時現在不只一個地方。比方說:您可以同時在生 活資訊和休閒天地的目錄下,找到時尚流行這個類目。又 比方說:如果您要找查詢系統,不管是在網路指南或生活 資訊下都找得到。

表4.3:專業關鍵詞及其總出現次數

編號 關鍵字 總次數 編號 關鍵字 總次數

K1 電子報 3 K12 奇摩 4

K2 訂報 2 K13 奇摩分類 2

K3 辦報 1 K14 排序 1

K4 訂閱 2 K15 搜尋引擎 0

K5 取消訂閱 1 K16 設定 0

K6 試閱 0 K17 大摩域 1

K7 費用 2 K18 網站類目 2

K8 流程 1 K19 @ 1

K9 即時 0 K20 會員檔案 0

K10 登入 0 K21 帳號 1

K11 Yahoo 6

(38)

根據公式,各個常見問題的特徵向量(CV)如下﹕

⎭⎬

⎟⎫

⎜ ⎞

⎩⎨

⎧ ⎟

⎜ ⎞

= ⎛

⎭⎬

⎟⎫

⎜ ⎞

⎩⎨

⎧ ⎟

⎜ ⎞

⎟ ⎛

⎜ ⎞

= ⎛

⎭⎬

⎟⎫

⎜ ⎞

⎟ ⎛

⎜ ⎞

⎩⎨

⎧ ⎟

⎜ ⎞

⎟ ⎛

⎜ ⎞

= ⎛

⎭⎬

⎟⎫

⎜ ⎞

⎟ ⎛

⎜ ⎞

⎩⎨

⎧ ⎟

⎜ ⎞

⎟ ⎛

⎜ ⎞

= ⎛

1 ,1 2 ,

,1 )

(

1 ,1 2 ,

,1 4 ,

,1 )

(

1 ,1 1 , ,1 2 , ,1 3 , ,1 )

(

2 ,1 1 , ,1 2 , ,1 3 , ,1 )

(

19 18

4

14 13

12 3

8 5

4 1

2

7 3

2 1

1

k k

Q CV

k k

k Q

CV

k k

k k

Q CV

k k

k k

Q CV

對於顧客所提出的問題Q,我們亦用一特徵向量CV

( )

Q 來表示:

( ) ( Q { K W ) ( K W ) ( K

j

W

j

) ( K

n

W

n

) }

CV

= 1, 1 , 2, 2 ... , ... ,

其中,

( K ,

j

W

j

)

和常見問題的特徵向量一樣,代表第 j 個關鍵詞在問題中所佔的權 重是

W 。

j

W 的計算公式如下:

j

=

= m

k kj j j

f W f

1

其中

f 為第 j 個關鍵詞在顧客問題 Q 裡出現的次數;

j

= m

k

f

kj 1

代表第 j 個關鍵詞在全 部常見問題裡出現次數的總和;m 代表系統內常見問題的數量。

[範例 4.2]

承範例 4.1。假設顧客提出的問題如表 4.4 所示,可算出在顧客問題中各個關鍵詞 出現的權值如表4.5 所示。

(39)

表4.4:使用者問題

問 題

客服人員您好。我先前訂閱了一份星座分析的電子報,但是現在已 經不需要了。但是我在網頁上沒有找到取消訂閱或試閱的連結,請 您告知連結位置或是步驟流程。謝謝!

表4.5:顧客問題出現的關鍵詞及其權重

關鍵詞 出現次數 Wj

訂閱 1

2 2

電子報 2

1 3

取消訂閱 1

1 1

試閱 1

1 2

流程 1

1 1

因此我們可以得到代表顧客問題特性的特徵向量如下﹕

⎭⎬

⎟⎫

⎜ ⎞

⎟ ⎛

⎜ ⎞

⎟ ⎛

⎜ ⎞

⎩⎨

⎧ ⎟

⎜ ⎞

⎟ ⎛

⎜ ⎞

= ⎛

1 ,1 2 , ,1 1 , ,1 2 , ,1 3 , ,1 )

(

Q k

1

k

4

k

5

k

6

k

8

CV

4.2 答案判定演算法

此演算法主要在利用問題分析演算法所計算出之特徵向量,將顧客問題的特徵向量

( )

Q

CV 與資料庫中常見問題的特徵向量

CV ( ) Q

i 作相似度的運算,以找出與顧客問題最 接近的常見問題。我們在先前提過,我們將每個問題視為空間中的一點,那麼特徵向量 即是它們的座標值。如此一來我們便可以藉由顧客問題和常見問題的座標值來判斷顧客 問題接近哪個常見問題。本篇論文採用了兩種判斷顧客問題接近哪個常見問題的答案判

(40)

定演算法,下面4.2.1 小節介紹使用內積法此一演算法而 4.2.2 小節介紹使用歐基理德法 之演算法。

4.2.1 使用內積法(Inner Product method)

為了判斷顧客問題接近哪個常見問題,我們首先想到內積法(Inner Product Method) 來計算空間中兩個向量相似度。內積法的概念是求得一向量對於另一向量的正投影量,

兩個向量愈接近則正投影量愈大,反之則正投影量愈小。如此,我們可以定義出顧客問 題Q 與常見問題 Qi的相似程度Di為:

( )

=

= n

k

ik k

i

W W

D

1

其中,n 代表系統設定的專業關鍵詞數量,

W 代表顧客問題 Q 中各個關鍵詞的權

k 值,

W 代表第 i 個常見問題中各個關鍵詞的權值。

ik

那麼以「範例4.1」和「範例 4.2」為例,我們可以得到:

( ) ( ) ( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( ) ( ) ( )

( 1 3 0 ) ( 1 2 0 ) ( 1 1 0 ) ( 1 1 0 ) ( 0 1 2 ) ( 0 1 1 ) 0 1 0

0 1 1 2 4 0

0 1 1 0

0 1 1 1 2 0

0 1 1 3

69 28 1 1

1 1 1 1 1 1 1 2 1 2 1 3 1 3

1 9 1 0

2 1 0 1 1 0

0 1 1 2 1 1 2 0

0 1 1 3 1 3

4 3 2 1

=

∗ +

∗ +

∗ +

∗ +

∗ +

=

=

∗ +

∗ +

∗ +

∗ +

∗ +

∗ +

=

=

∗ +

∗ +

∗ +

=

=

∗ +

∗ +

∗ +

∗ +

∗ +

∗ +

=

D D D D

這其中我們可以發現D2具有最大值,這表示常見問題 Q相較於其他常見問題而 言和顧客問題擁有最大的相似程度,也就是說顧客問題Q 與常見問題 Q接近。於是系 統將判定使用者問題與常問問題Q2最接近,解答擷取模組將依此判定決定Q2的解答為

“在您的個人電子報管理介面,也就是「我的電子報」,在您想要取消訂閱的電子報前勾 選「取消訂閱」。您也可以在每封電子報最下方找到我要取消訂閱的連結,點下去後輸 入您的Yahoo!奇摩帳號和密碼,這樣系統也會自動幫您取消訂閱。”

(41)

4.2.2 使用歐基理德法(Euclidean Distance method)

在分析內積法時我們想到的另一個計算空間中兩個向量相似度的方法—歐基理德 法(Euclidean Distance method)。此方法在理論上的分析上應該會有更佳的表現。以圖 5.1 為例:

圖4.1:內積法與歐基理德法比較意示圖

圖左為內積法,圖右為歐基理德法。其中 Q 為顧客問題,B 為與顧客問題相似之 常見問題,A 為與顧客問題不相似之常見問題。答案判定演算法應該要判斷出常見問題 B 與顧客問題 Q 較為相似。當以內積法計算時 a1 的長度大於 b1,系統會判斷出常見問 題A 相似顧客問題,此結果是錯誤的﹔而相同的情況下在使用歐基理德法計算時 b2 的 長度小於 a2,系統判斷與顧客問題 Q 相似的為常見問題 B,此結果為正確的。所以,

使用歐基理德法對於內積法會造成誤判的狀況仍能判斷出正確的結果,理論上應該比使 用內積法為佳。

使用歐基理德法來定義出顧客問題Q 與常見問題 Qi的相似程度Di如下:

( )

=

= k n k ik

i

W W

D

1, 2

其中,n 代表系統設定的專業關鍵詞數量,

W 代表顧客問題 Q 中各個關鍵詞的權

k 值,

W 代表第 i 個常見問題中各個關鍵詞的權值。

ik

那麼以「範例4.1」和「範例 4.2」為例,我們可以得到如下的結果:

(42)

( ) ( ) ( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( ) ( ) ( )

( )

13 0

( ) ( ) ( ) ( ) ( )

12 0 11 0 11 0 0 12 0 11 13036 144

1 529 0 1 12 4 0

0 1 1 0

0 1 11 2 0

0 1 13

1 0 1 1 1 1 1 1 2 1 2 1 3 1 3 1 1

154 1 0

2 1 0 1 1 0

0 1 12 11 2 0

0 1 13 13

2 2

2 2

2 2

4

2 2

2 2

2 2

2 3

2 2

2 2

2

2 2

2 2

2 2

2 1

=

− +

− +

− +

− +

− +

=

=

− +

− +

− +

− +

− +

− +

=

=

− +

− +

− +

=

=

− +

− +

− +

− +

− +

− +

=

D D D D

根據歐基理德法的定義,愈近的兩個向量則距離愈近,也就是說顧客問題Q 與常 見問題Qi的相似程度Di值會愈小。這其中我們可以發現D2具有最小值,也就是說顧客 問題Q 與常見問題 Q接近。系統會判定使用者問題與常問問題Q2最接近,解答擷取 模組將依此判定決定Q2的解答為“在您的個人電子報管理介面,也就是「我的電子報」,

在您想要取消訂閱的電子報前勾選「取消訂閱」。您也可以在每封電子報最下方找到我 要取消訂閱的連結,點下去後輸入您的Yahoo!奇摩帳號和密碼,這樣系統也會自動幫 您取消訂閱。”

我們由4.2.1 和 4.2.2 小節得知了兩種相似度運算的演算法。系統在計算顧客問題與 常見問題的特徵向量相似度時便會分別使用這兩種演算法,我們在實驗中可以進一步比 較這兩種方法的差異。

4.3 服務人員分派演算法

系統會使用服務人員分派演算法的時機有二。一是當系統對於顧客問題的計算沒 有結果或者是結果沒有通過系統設定的林介值而無法得到解答時﹔另一是使用者對於 先前系統提供的解答給予滿意度回覆時,滿意度小於系統設定的滿意度臨界值時。此 時,服務人員分派演算法會根據該顧客問題的特徵向量與客服人員的特徵向量做相似度 運算,將問題分配給適當的客服人員處理。當客服人員處理之後,該問題與解答將納入 系統的常見問題中來提昇系統的實力。以下說明客服人員分配的演算法。

系統針對每一客服人員 Pi應負責處理問題類型也以一特徵向量 CV(Pi)來表示。其

參考文獻

相關文件

• Submit your lab0 AND hw0 by next Thursday (or you will not be admitted to this course). • wn@csie.ntu.edu.tw is the e-mail

On another level, though, the similarities to the research world are strong: you succeed by building networks, the glue that holds relationships together is the values that you

Error bounds for the analytic center pOCP soln when distances have small errors... Decrease µ by a factor

5.14 With regard to children aged 0 to 3 attending DCs/DNs, we recommend that financial assistance should continue to be available to those with social needs attending

SDP and ESDP are stronger relaxations, but inherit the soln instability relative to measurement noise. Lack soln

This study proposed the Minimum Risk Neural Network (MRNN), which is based on back-propagation network (BPN) and combined with the concept of maximization of classification margin

According to this viewpoints, the concept of marketing is not confined to external marketing & sale for external customers only, it adds the concept of ”making employee

The purpose of this study was to investigate if providing consumers with a general dietary guidance or impose a cash punishment policy on customers for not finishing their food on