• 沒有找到結果。

第二章 文獻探討

2.2 NBA 數據分析相關研究

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

(Dimension)也就越來越多,但是不一定代表每個維度都可於進行 Data Mining 時,從中提供有用的結果或相關資訊,或是可足以代表資料中的特徵。

此時,Data Mining 中的特徵選取(Feature Selection)可幫助我們,過濾一些 無直接相關的維度,建立更簡單且更容易理解的模型,幫助瞭解、清理與準備數 據資料,找出與所希望獲得的結果有比較直接相關性的資料或可代表資料的特徵,

並且把經過特徵選取後的資料再去進行分類或分群,提高了 Data Mining 在執行 上的效率,可獲得更明顯的結果,也可協助進行更進一步的分析那些維度是有直 接相關,或是影響性較大,其中間的相關性又是如何。因此,本文後續在進行 Data Mining 時,也會加入此一流程,幫助從各項統計數據中,找出球員表現與 合約薪資的相關性。

2.2 NBA 數據分析相關研究

運動領域中各項數據的收集,包含每個球員、球隊、比賽和球季,進而產生大量 的數據資料,以籃球運動為例,一個球員在每場比中的籃板、助攻、抄截、阻攻...

等,這些相關數據可能都會被完整的記錄下來,做為球隊或對手的在比賽前的球 探報告,許多統計分析也試圖從中找出是否有相關的關連性或是可做為球員分析 的代表性數據指標,因此,在此一領域實行 Data Mining 技術和分析,是非常適 合的。

過去在運動數據分析領域有許多不同的團隊進行研究,其中 NBA 一直是很熱門的 一項研究議題,各球隊都有內部專業人員在進行統計和分析,以找出未來發展方 向和適合及有潛力的球員,在學術領域中,也有許多研究者進行從各個不同的角 度來進行分析及探討,通常是由從四個不同面向來進行,如下圖 2.2 所示。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 2.2:相關研究面向圖

常見的是探討利用相關數據進行總冠軍的預測,如王彥智提出以統計的方式,將 NBA 例行賽的各項數據整理分類,以 B-Spline 進行建模,來配置出每個球隊的 實力曲線,再根據下列三種不同概念的指標,進行排名積分法和最適加權法來融 合這三種不同指標分數,預測當年度總冠軍[4]:

一、DIFF(Difference):比賽得失分差。

二、GmSr(Game Score):自身球隊的效率分數,表示球隊攻擊能力。

三、AntiGmSr(Anti-Game Score):比賽對手的效率分數,表示壓制對手的能力。

在球員表現與合約的部份,如王浚宇提出採用資料包絡分析法,利用球員效率與 NBA 官方網站效率值來探討其對球員薪資之關聯性[2]。研究除探討外籍球員與 美國籍球員間效率及高薪球員與低薪球員間效率差異,並同時比較資料包絡分析 法(DEA)所計算之效率值與 NBA 官方網站所提供之效率值,何者與薪資之關聯性 較高。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

邱咏平提出使用資料包絡分析法衡量 NBA 球員之績效值,探討球員在簽訂複數年 合約前後與績效之關聯性,並進而比較 NBA 官方提供績效值與 DEA 法計算出之球 員績效值,何者對於球員薪資具有較佳的解釋能力[3]。

在資訊科技領域方面,使用 Data Mining 此一門技術來進行 NBA 相關探討的,則 有邱楚翔提出使用了統計學習的技術,並加入以社會網絡的理論去分析團隊成員 的合作關係,以 NBA 籃球聯盟為例,對聯盟中的團隊表現進行研究,利用團隊成 員的個人能力、團隊的風格、以及團隊中球員彼此的合作關係作為依據,進行三 種不同層面的籃球運動團隊表現預測,分別是團隊排名預測、任意對戰組合的團 隊勝負預測、以及特定成員組合的表現預測[5]。

在國外的論文中,研究與 NBA 相關探討的論文也很常見,Ramaswamy 使用 NBA 相 關數據做為研究資料,針對 Outliers Mining,找出具有良好效率的演算法[27]。

如 Na Wei 提出以貝式分類(Naïve Bayes),將 2005-2011 年的 NBA 比賽的統計數 據,並考慮主客場的影響條件,用來檢查和預測球隊在季後賽的成績,並預測當 年度總冠軍可能為芝加哥公牛隊[28]。Loeffelholz 、Bernard 年提出,收集了 620 場 NBA 的比賽相關數據,以類神經網路(Neural Networks) 的技術,進行總 冠軍的預測,類神經網路是一種模仿生物神經網絡的結構和功能的數學模型或計 算模型,而他們的最後研究結果可高達 74.33%的準確率[29]。

我們可以發現,在熱門的 NBA 運動中,每場比賽產生出大量的數據,並且有豐富 的歷史資料,可激勵我們去發掘出隱含的知識,在前述的相關研究中,使用 Data Mining 進行個人表現與薪資合約相關分析部份,是較為少見的,所以,這部份 是我們此次希望可運用此一門技術,將許多相關的球員數據,以及利用許多不同 的統計指標,希望可以藉由這些球員各項不同表現的統計指標數據,來找出與薪

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

資之間的相關性及分析,進一步希望發現不限於現行的統計數據中的新知識。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第三章 資料擷取與前置處理

相關文件