• 沒有找到結果。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

7. 以分類結果而言,球員表現並不一定就足以代表其薪資情形,有時因為球員 的經紀人,依球員上一份合約年度內的表現,替球員爭取較高的新合約,但 簽約後,有可能因為年紀變化或是轉換不同球隊,球員不一定能維持相同的 表現水準,造成高薪低就或是薪資無法反映在球員的表現上之情況。

5.2 未來展望

在本研究中,我們搜集了球員例行賽和季後賽的相關數據記錄,也參考了一些統 計指標,搭配 Data Mining 中的幾個步驟,如預測、特徵選取、分類,希望透過 相關數據和統計指標,找出與薪資之關聯性,但找出具有相關性的指標並不在多 數,因此後續的研究中,我們可給與以下幾點不同的建議方向:

1. 可再多增加不同的統計指標或其他相關數據,藉以找出更多不同的關聯性,

比如說,可將進攻的相關指標和防守的相關指標,搭配上場時間找出球員的 貢獻度…等,希望可使用更多的統計指標,在進行預測和特徵選取時可得到 更好的結果。

2. 在特徵選取的部份,我們使用的是基因演算法(Genetic Algorithm),在未來 可考慮除了基因演算法,再搭配不同的特徵選取方式,藉以找出不同的特徵 組合,或是比較不同演算法的結果差異,差異原因為何。

3. 在分類的部份,首先我們是將薪資欄位分成四種分類,此部份也可嘗試不同 的分類方式,或是進行更多種的分類,可使球員薪資差異更為明顯。

4. 在分類器的部份,後續建議可嘗試搭配不同的分類器,或是針對某個明顯的 特徵進行權重的設置,以找出更好的分類方式,使正確率可再往上提昇。

5. 本文研究方向是球員個人為出發點,如果可再加上一些團隊相關的條件,比 如整體團隊薪資上限或是球隊中高薪球員佔團隊薪資比例,也許可以發現不 同的薪資影響條件。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

隨著科技演進及全球化,未來 NBA 的相關數據可望有更多及更詳細的記錄,搭配 更大的資料儲存空間和不同的演算法,可望找出更多球員表現和薪資的背後,所 隱藏的一些特性,加上日漸不同的籃球觀念,從以往傳統的球員身高和距離籃框 愈近得分愈容易,到現今的三分投射和團隊整體搭配,如能將更多不同特性找出,

可讓我們在研究觀察此一運動賽事,有更多不同的看法和樂趣。

[1] http://www.basketball-reference.com/

[2] 王浚宇,"NBA 外籍球員薪資與效率衡量之關聯性研究."政治大學會計研究

[6] Usama Fayyad, Gregory Piatetsky-Shapiro, and Padhraic Smyth. "From data mining to knowledge discovery in databases." AI Magazine, 17.3 (1996): 37.

[7] https://en.wikipedia.org/wiki/Statistical_significance [8] https://en.wikipedia.org/wiki/John_Hollinger

[9] https://en.wikipedia.org/wiki/Data_mining

[10]Han, Jiawei, Micheline Kamber, and Jian Pei. Data mining: concepts and techniques: concepts and techniques. Elsevier, 2011.

[11]Kohavi, Ron, and George H. John. "Wrappers for feature subset selection."Artificial Intelligence,97.1 (1997): 273-324.

[12]Guyon, Isabelle, and André Elisseeff. "An introduction to variable and feature selection." The Journal of Machine Learning Research,3 (2003): 1157-1182.

[13]Kira, Kenji, and Larry A. Rendell. "A practical approach to feature selection." Proceedings of the Ninth International Workshop on

Machine Learning. 1992.

[14]Yang, Yiming, and Jan O. Pedersen. "A comparative study on feature selection in text categorization." International Conference on Machine Learning. Vol. 97. 1997.

[15]Jain, Anil, and Douglas Zongker. "Feature selection: Evaluation, application, and small sample performance." IEEE Transactions on Pattern Analysis and Machine Intelligence,19.2 (1997): 153-158.

[16]Dash, Manoranjan, and Huan Liu. "Feature selection for

classification." Intelligent Data Analysis, 1.1 (1997): 131-156.

[17]J.Weston, S.Mukherjee, O.Chapelle, M.Pontil, T.Poggio, V.Vapnik.

"Feature selection for SVMs." NIPS. Vol. 12. 2000.

[18]Liu, Huan, et al. "Feature Selection: An Ever Evolving Frontier in Data Mining."FSDM, 10 (2010): 4-13.

[19]朱啟源,資料前處理之研究: 以基因演算法為例; Feature and Instance Selection Using Genetic Algorithms: An Empirical Study. 中央大學資 訊管理學系學位論文 (2011): 1-62.

[20]Haupt, Randy L., and Sue Ellen Haupt. Practical genetic algorithms.

John Wiley & Sons, 2004.

[21]Cios, Krzysztof J., Witold Pedrycz, and Roman W. Swiniarski. Data Mining and Knowledge Discovery. Springer US, 1998.

[22]Michael, J. A., and S. Linoff Gordon. "Data mining technique: For marketing, sales and customer support." New York: John Wiley&Sons Inc. 445 (1997)

[23]Cabena, Peter, et al. Discovering data mining: from concept to implementation. Prentice-Hall, Inc., 1998.

[24]Safavian, S. Rasoul, and David Landgrebe. "A survey of decision tree

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

classifier methodology." IEEE transactions on systems, man, and cybernetics, 21.3 (1991): 660-674.

[25]蔡佳玲, 洪新原, and 袁繼銓. "以決策樹模型探討未開立慢性病連續處方 之影響因子." 資訊管理學報, 18.4 (2011): 139-164.

[26]Fawcett, Tom. "An introduction to ROC analysis." Pattern recognition letters, 27.8 (2006): 861-874.

[27]Ramaswamy, Sridhar, Rajeev Rastogi, and Kyuseok Shim. "Efficient algorithms for mining outliers from large data sets." ACM SIGMOD Record. Vol. 29. No. 2. ACM, 2000.

[28]Na Wei, "Predicting the outcome of NBA playoffs using the naïve bayes algorithms." Department of Biomedical Engineering, College of Engineering, University of South Florida, Tampa, FL 33620, USA (2011).

[29]Loeffelholz, Bernard, Earl Bednar, and Kenneth W. Bauer. "Predicting NBA games using neural networks." Journal of Quantitative Analysis in Sports, 5.1 (2009).

[30]https://en.wikipedia.org/wiki/Ordinary_least_squares

相關文件