• 沒有找到結果。

第一章 圖形識別與類神經網路於 2006 年世界盃足球賽球隊實力之分類

1 介紹

隊實力之分類

摘要

群聚分類理論在資料分析中佔有相當重要的角色,我們利用2006 年世界盃足球賽 官方統計數據的各項技術指標及圖形識別中的非監督式分類法來將球隊作分類,所用的 方法有K-Means 分類演算法、Fuzzy C-Means 分類演算法、Hierarchical 分類演算法、及 Self-Organizing Feature Map 類神經網路,根據競賽規則的特性把球隊分成 4 類,分類結 果顯示各種分類法於2006 年世界盃足球賽的分類正確率約介於 46.87 % ~ 68.75 %。我 們再利用Basic Sequential Clustering,Modified Basic Sequential Clustering 為基礎的有效 性驗證法,及以K-Means 為基礎的 Pseudo F-Statistic 公式,共 3 種分類有效性驗證法,

針對 2006 年世界盃足球賽統計數據的最佳分類個數進行有效性驗證,驗證結果顯示 2006 年世界盃足球賽官方數據以分成 2 類或 3 類為較佳之分類個數,最後我們將 2006 年世界盃足球賽資料經過主分量分析 (PCA) 後,把原始資料投影到前四個主分量軸上 後,再重新分成2 類及 3 類的情況下,明顯地看出強隊與弱隊可被區分開。

1. 介紹

2006 年世界盃足球賽會內賽開幕前,黃國源、張生平、陳楷儒、董安晉、…等等,

曾根據會前賽的統計數據提出以類神經網路的方法分析 2006 年世界盃足球賽球隊的 實力 [1],而 2006 年德國世界盃會內賽結束後,從官方網站 [2] 中,我們可獲得由世 界足球聯盟組織(FIFA) [3] 針對球隊的攻守數據之統計而得到各項足球技術的統計資 料,例如:球隊進球數、失球數、控球時間、十二碼罰球數、紅牌數…等等,共 17 項,每一項統計資料皆代表一項技術指標,而這些技術指標對球賽最終結果都具有影 響力,因此針對這些統計資料,我們利用圖形識別與類神經網路中的非監督式分類法,

將資料分為數個類別,如圖 1-1 的非監督式圖形識別系統所示,我們所要處理的第一 個問題為分類的問題,第二個問題為分類個數有效性的問題。根據2006 年世界盃足球 賽64 場比賽的賽程表 [2] 及圖 1-2 所示,由於進入會內賽共有 32 隊,從比賽開始到

比賽結束分成五個階段共64 場比賽,我們從這 64 場比賽的原始資料擷取出 32 隊各自

GER SWE ARG MEX ENG ECU POR NED

ITA AUS SUI UKR BRA GHA ESP FRA

GER ARG ITA UKR ENG POR BRA FRA

GER ITA POR FRA

GER

Stage 1 Group Match Stage 2 Round of 16 Stage 5 Finals

Stage 4 Semi-Finals

Stage 3 Quarter-Finals

Third Place Game GER63 POR ITA FRA

圖1-2. 2006 年世界盃足球賽 64 場賽程表.

群聚分類方法甚多,在相關學術發表及著作有很多討論 [4] - [6],根據 Rui Xu 及 Donald Wunsch II 於 2005 年 IEEE 上發表一篇針對各種分類理論法及分類有效性的驗證 法 [7],我們採取了非監督式分類法如圖 1-3 所示,有:K-Means 分類演算法、Fuzzy C-Means 分類演算法、Hierarchical 分類演算法、及 Self-Organizing Feature Map (SOFM) 類神經網路,經由這些分類法來將2006 年世界盃足球會內賽的 32 個隊伍進行分類,區 分哪些隊伍應該是屬於同一類別,其也就是相對的找出強隊族群或弱隊族群,然後比較

「分類結果」與「比賽結果」的分類正確率。此外針對2006 年世界盃足球賽的比賽數 據分類數作有效性的分析,我們採取如圖1-4 所示的 3 種分類有效性的方法,其為 Basic Sequential Cluster Criterion、Modified Basic Sequential Cluster Criterion、及 Pseudo F-Statistic Criterion。

圖1-3. 所採用的非監督式分類法.

Cluster Validity

Pseudo F-Statistic Validity Criterion Modified Basic Sequential

Clustering (MBSC) Validity Criterion

Basic Sequential Clustering (BSC) Validity Criterion

圖1-4. 所採用的分類有效性驗證法.

相關文件