‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
7. 以分類結果而言,球員表現並不一定就足以代表其薪資情形,有時因為球員 的經紀人,依球員上一份合約年度內的表現,替球員爭取較高的新合約,但 簽約後,有可能因為年紀變化或是轉換不同球隊,球員不一定能維持相同的 表現水準,造成高薪低就或是薪資無法反映在球員的表現上之情況。
5.2 未來展望
在本研究中,我們搜集了球員例行賽和季後賽的相關數據記錄,也參考了一些統 計指標,搭配 Data Mining 中的幾個步驟,如預測、特徵選取、分類,希望透過 相關數據和統計指標,找出與薪資之關聯性,但找出具有相關性的指標並不在多 數,因此後續的研究中,我們可給與以下幾點不同的建議方向:
1. 可再多增加不同的統計指標或其他相關數據,藉以找出更多不同的關聯性,
比如說,可將進攻的相關指標和防守的相關指標,搭配上場時間找出球員的 貢獻度…等,希望可使用更多的統計指標,在進行預測和特徵選取時可得到 更好的結果。
2. 在特徵選取的部份,我們使用的是基因演算法(Genetic Algorithm),在未來 可考慮除了基因演算法,再搭配不同的特徵選取方式,藉以找出不同的特徵 組合,或是比較不同演算法的結果差異,差異原因為何。
3. 在分類的部份,首先我們是將薪資欄位分成四種分類,此部份也可嘗試不同 的分類方式,或是進行更多種的分類,可使球員薪資差異更為明顯。
4. 在分類器的部份,後續建議可嘗試搭配不同的分類器,或是針對某個明顯的 特徵進行權重的設置,以找出更好的分類方式,使正確率可再往上提昇。
5. 本文研究方向是球員個人為出發點,如果可再加上一些團隊相關的條件,比 如整體團隊薪資上限或是球隊中高薪球員佔團隊薪資比例,也許可以發現不 同的薪資影響條件。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
隨著科技演進及全球化,未來 NBA 的相關數據可望有更多及更詳細的記錄,搭配 更大的資料儲存空間和不同的演算法,可望找出更多球員表現和薪資的背後,所 隱藏的一些特性,加上日漸不同的籃球觀念,從以往傳統的球員身高和距離籃框 愈近得分愈容易,到現今的三分投射和團隊整體搭配,如能將更多不同特性找出,
可讓我們在研究觀察此一運動賽事,有更多不同的看法和樂趣。
‧
[1] http://www.basketball-reference.com/
[2] 王浚宇,"NBA 外籍球員薪資與效率衡量之關聯性研究."政治大學會計研究
[6] Usama Fayyad, Gregory Piatetsky-Shapiro, and Padhraic Smyth. "From data mining to knowledge discovery in databases." AI Magazine, 17.3 (1996): 37.
[7] https://en.wikipedia.org/wiki/Statistical_significance [8] https://en.wikipedia.org/wiki/John_Hollinger
[9] https://en.wikipedia.org/wiki/Data_mining
[10]Han, Jiawei, Micheline Kamber, and Jian Pei. Data mining: concepts and techniques: concepts and techniques. Elsevier, 2011.
[11]Kohavi, Ron, and George H. John. "Wrappers for feature subset selection."Artificial Intelligence,97.1 (1997): 273-324.
[12]Guyon, Isabelle, and André Elisseeff. "An introduction to variable and feature selection." The Journal of Machine Learning Research,3 (2003): 1157-1182.
[13]Kira, Kenji, and Larry A. Rendell. "A practical approach to feature selection." Proceedings of the Ninth International Workshop on
‧
Machine Learning. 1992.
[14]Yang, Yiming, and Jan O. Pedersen. "A comparative study on feature selection in text categorization." International Conference on Machine Learning. Vol. 97. 1997.
[15]Jain, Anil, and Douglas Zongker. "Feature selection: Evaluation, application, and small sample performance." IEEE Transactions on Pattern Analysis and Machine Intelligence,19.2 (1997): 153-158.
[16]Dash, Manoranjan, and Huan Liu. "Feature selection for
classification." Intelligent Data Analysis, 1.1 (1997): 131-156.
[17]J.Weston, S.Mukherjee, O.Chapelle, M.Pontil, T.Poggio, V.Vapnik.
"Feature selection for SVMs." NIPS. Vol. 12. 2000.
[18]Liu, Huan, et al. "Feature Selection: An Ever Evolving Frontier in Data Mining."FSDM, 10 (2010): 4-13.
[19]朱啟源,資料前處理之研究: 以基因演算法為例; Feature and Instance Selection Using Genetic Algorithms: An Empirical Study. 中央大學資 訊管理學系學位論文 (2011): 1-62.
[20]Haupt, Randy L., and Sue Ellen Haupt. Practical genetic algorithms.
John Wiley & Sons, 2004.
[21]Cios, Krzysztof J., Witold Pedrycz, and Roman W. Swiniarski. Data Mining and Knowledge Discovery. Springer US, 1998.
[22]Michael, J. A., and S. Linoff Gordon. "Data mining technique: For marketing, sales and customer support." New York: John Wiley&Sons Inc. 445 (1997)
[23]Cabena, Peter, et al. Discovering data mining: from concept to implementation. Prentice-Hall, Inc., 1998.
[24]Safavian, S. Rasoul, and David Landgrebe. "A survey of decision tree
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
classifier methodology." IEEE transactions on systems, man, and cybernetics, 21.3 (1991): 660-674.
[25]蔡佳玲, 洪新原, and 袁繼銓. "以決策樹模型探討未開立慢性病連續處方 之影響因子." 資訊管理學報, 18.4 (2011): 139-164.
[26]Fawcett, Tom. "An introduction to ROC analysis." Pattern recognition letters, 27.8 (2006): 861-874.
[27]Ramaswamy, Sridhar, Rajeev Rastogi, and Kyuseok Shim. "Efficient algorithms for mining outliers from large data sets." ACM SIGMOD Record. Vol. 29. No. 2. ACM, 2000.
[28]Na Wei, "Predicting the outcome of NBA playoffs using the naïve bayes algorithms." Department of Biomedical Engineering, College of Engineering, University of South Florida, Tampa, FL 33620, USA (2011).
[29]Loeffelholz, Bernard, Earl Bednar, and Kenneth W. Bauer. "Predicting NBA games using neural networks." Journal of Quantitative Analysis in Sports, 5.1 (2009).
[30]https://en.wikipedia.org/wiki/Ordinary_least_squares