第三章、 複合式電子服務平台概觀
4.4 Data Mining Module
4.4.2 Data Mining for Composite e-services
針對在 Service Plan Collecting & Building Module 所蒐集建置出的 Services Database,進行資料探勘的分析,如圖 4.8 所示,先對資料進行分群,之後在每 一群中找尋屬性間的關聯。
圖 4.8:Data Mining for Composite e-services 分析流程
4.4.2.1 Clustering Composite e-services
由於複合式電子服務是由多個單一電子服務(basic e-service)所組成,根 據前面 4.3.1 節的定義,複合式電子服務擁有其包含的單一電子服務屬性集合,
以電腦課程選課服務的模擬案例來說,我們假設每一個單一電子服務至少會隸屬 於一個的複合式電子服務,因此此處僅對複合式電子服務來進行分群,單一電子 服務則會跟隨複合式電子服務歸屬到該分群結果。
底下以電腦課程選課服務的模擬案例來說明分群的步驟:
1.轉換為 Vector model:
前面 4.3.1 節中我們擷取出每個單一選課服務的 meta information,共有 6 個 屬性,分析這些屬性值,可整理成如表 4.8。
Provider Category Location
MitacP1
Network_OSC1
TaipeiL1
UcomP2
Database_MC2
HsinchuL2
PCSchoolP3
OfficeC3
TaichungL3
ProgrammingC4
KaohsiungL4
TimePeriod Instructor Difficulty
MorningT1
JohnI1
BasicD1
AfternoonT2
DavidI2
AdvancedD2
EveningT3
MikeI3
ExpertD3
VacationT4
NancyI4
Jessie
I5
表 4.8:描述每個單一選課服務的 6 個屬性
因此每個選課服務屬性便可用位元向量模式(bit vector model)來表示,表 4.9 代表 M_N1 這個單一選課服務的屬性值向量模式,其 Provider 的屬性值為
「Mitac」,根據表 4.8 代號為 P1,所以其 P1 值為 1,P2、P3 值皆為 0,其餘向 量值依同理產生。
表 4.9:單一選課服務 M_N1 的屬性向量表示法
複合式電子服務的屬性為其包含的所有單一電子服務屬性的集合,若以向 量模式來表示,則為所有單一電子服務的位元向量值,做 Or 運算而得,表示只 要所包含的單一電子服務具有某屬性值(位元向量值為 1),則複合式電子服務 便有該屬性值。表 4.10 顯示 CS_1 這個複合式選課服務的屬性向量表示法。
表 4.10:複合式選課服務 CS_1 的屬性向量表示法 2.計算複合式電子服務間的距離:
複合式電子服務間的距離(差異),以兩個 Vector 間的 Euclidean distance 來表 示,底下公式代表第 i 與第 k 個 Vector 間的距離。 結果中 Cluster A 的代表群中心,其擁有 P1、C2、D1、D2、L1…等屬性特徵。
表 4.11:分群結果中 ClusterA 的代表群中心
4.4.2.2 Mining associations among services attributes
在每一個分群結果中,利用 Apriori 演算法,找出服務屬性間的關聯,此處 分別對單一電子服務與複合式電子服務分別進行 Apriori 演算法,如圖 4.9 所示。
Composite e-services
Association among services attributes Association
Rule Mining Basic e-services
Association Rule Mining
圖 4.9:Mining associations among services attributes 分析流程
1.單一電子服務屬性關聯分析結果:
可以找出如下的關聯種類:
Location TimePeriod
例如:Taipei Vacation,表示台北的課程經常開在假日。
Instructor Location
例如: Mike Hsinchu,表示 Mike 講師經常在新竹開課。
Instructor Provider
例如:Mike Ucom,表示 Mike 經常在 Ucom 這家服務提供者開課。
Provider Difficulty
例如:PCSchool Basic,表示 PCSchool 通常開入門(Basic)的電 腦訓練課程。
Instructor Category
例如:Nancy Database_M,表示 Nancy 經常開資料庫管理的課程。
2.複合式電子服務屬性關聯分析結果:
由於複合式電子服務是由多個單一電子服務所組成,因此對其做關聯規則 分析,可以找出在單一電子服務中所沒有發掘到的規則,如下列所示:
Category Category
例如:Network_OS Database_M,表示網路作業系統與資料庫管理 的選課服務通常會被安排在預設的複合式選課服務組合中。
Provider Provider
例如:Ucom Mitac,表示 Ucom 與 Mitac 提供的選課服務,通常會 被安排在預設的複合式選課服務組合中。
前一點由單一電子服務所發掘到的規則,只能找到不同服務屬性間屬性值 的關聯。根據複合式電子服務屬性關聯分析,可以更進一步瞭解到同一服務屬性 內不同屬性值的關聯。