• 沒有找到結果。

NBA台灣運彩大數據分析與預測 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "NBA台灣運彩大數據分析與預測 - 政大學術集成"

Copied!
49
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學應用數學系 碩士學位論文. NBA 台灣運彩大數據分析與預測 Analyze the big data of Taiwan NBA lottery and predict it. 碩士班學生:黃茂源 指導教授:吳柏林. 撰 博士. 中華民國 107 年 6 月 1 日.

(2) 誌 謝 能順利地寫出這篇論文並順利通過口試,首先真的非常感謝我的指導教授:吳 老師。吳老師在一次又一次的討論中,不斷的給予我最重要的信心與耐心,並 給出許多重要的方向讓我進行研究,而又不會太限制我的發揮,真的太感謝吳 老師的信任與指導。 另外也非常感謝兩位口試委員:曾老師和楊老師。在口試結束時提供了非常具 體實際的建議,讓我之後若想做更深的研究或尋找更多的數據時,能更有方向 和想法。 最後我想感謝自己的家人和重要的幾個好友。在寫論文負能量滿滿時,有著 一些窗口能夠讓我放鬆,接著繼續投入研究,我想如果沒有那些適時的輕鬆時 刻的話,我是無法有這麼多想法整理起來的。 在此,真摯誠心的祝福所有在撰寫論文期間,幫助過我的所有人事物,真的 感謝你們。.

(3) Abstract Motivation and purpose of this study: In the era of big data, provide NBA basketball fans with some analysis and models of basketball data, so that they can win more chances and fun when purchasing Taiwan NBA lottery. Method: NBA basketball data analysis is performed through correlation coefficient and regression. Innovation and promotion: After the correlation coefficient and regression analysis come out, it is combined with NBA lottery application to generate strategies. Conclusion: The prediction data part is the most difficult and it is necessary to find out the method of strategy matching the prediction data.. Keywords: NBA lottery strategy, Regression, Predicting. I.

(4) 摘要 研究動機與目的:在大數據的時代,為 NBA 籃球運彩迷們提供一些籃球數據的 分析與模型,使其在購買台灣運彩時,能多些中獎的機率與樂趣。 研究方法:透過相關係數、迴歸來進行 NBA 籃球數據分析。 創新與推廣:相關係數與迴歸分析出來後,與 NBA 運彩應用結合,產生策略。 結論:預測數據部分最為困難,必須找出策略搭配預測數據之方法。. 關鍵字: NBA 運彩策略、迴歸、預測. II.

(5) 目錄 第一章 前言................................................................................................................ 1 1.1 動機......................................................................................................... 1 1.2 相關研究與文獻..................................................................................... 2 第二章 研究方法........................................................................................................ 4 2.1 台灣 NBA 籃球運動彩卷基本名詞與玩法 .......................................... 4 2.2 NBA 基本名詞介紹 .............................................................................. 6 2.3 NBA 基本結構及賽制介紹 .................................................................. 7 2.4 相關係數與分組相關係數分析............................................................. 8 2.5 迴歸分析............................................................................................... 13 2.6 球隊得分的逼近分配估計................................................................... 17 2.7 Regular season 與 playoff 之預測結合買運彩策略 ........................... 18 第三章 實證.............................................................................................................. 21 3.1 相關係數與分組................................................................................... 21 3.2 迴歸分析與預測.................................................................................. 21 3.3 季後賽預測........................................................................................... 23 3.4 買運彩策略........................................................................................... 29 3.5 運彩玩法分析前後比較....................................................................... 30 3.6 整合式資料處理................................................................................... 33 第四章 結論與建議.................................................................................................. 35 附錄一.......................................................................................................................... 37 附錄二.......................................................................................................................... 41 參考文獻...................................................................................................................... 43. III.

(6) 第一章. 前言. 1.1 動機 美國職業籃球聯盟 (National Basketball Association, NBA)是目前全球最熱門 的運動之一,根據中廣新聞網 2016/06/22 的資料顯示: 2016 年 NBA 總冠軍賽 第七場克里夫蘭騎士隊封王戰寫下了美國十年來最高收視率,而受限於時差問 題,第七戰在台灣的轉播雖然碰上星期一上午的尷尬時段,轉播收視率也仍然 保持 1.34 的高水準,而剛好碰上端午連假的第四戰,更是寫下了 1.98 的超高 收視率,總計七場系列賽有三場收視率大幅超越在晚間比賽的中華職棒,七場 比賽有三場收視率破一。而 2017 年的 NBA 總冠軍賽,雖然單場而言收視率比不 上 2016 年的總冠軍賽第七場,但總共五場比賽,全美平均收視人數 2040 萬, 比 2016 年總冠軍賽七場平均多了 20 萬。 NBA 有著大規模觀眾對比賽的熱情,更在前 NBA 主席史騰(David Stern)極力 將 NBA 推向國際的背景下,具備娛樂全球人口、聯繫各國觀眾感情的作用。 而為了能夠讓觀眾們更加有參與感,因此有了 NBA 籃球運動彩劵這項娛樂出 現。 自 2008 台灣引進 NBA 籃球運動彩卷起,台灣的 NBA 迷們也因為 NBA 運動 彩卷多了許許多多的觀賽樂趣,NBA 運彩對於一般人來說都非常方便購買,金 額也並不大,100 元就可以購買一張彩卷,而且 NBA 是非常國際化的運動產 業,數據在很多網站上都有,只要願意花一些時間去查,很多數據都可以被搜 尋的到,甚至直接變成 Excel 檔下載下來分析(著名 NBA 籃球網站:basketball reference),因此對於眾多喜愛 NBA 籃球的球迷朋友們來說,分析數據進而提 高中獎的機率,成了一條相當可行的辦法,看著喜愛的 NBA 同時也有機會賺 進一些財富。本文秉著這樣的一份精神,希望為這些 NBA 籃球迷甚至是一般 1.

(7) 大眾,提供一些基本的分析,讓其能在購買 NBA 運彩時,有更高的機率能夠 贏錢,為生活多出一份興趣和熱情來。. 1.2 相關研究與文獻 有關 NBA 大數據分析與預測文獻並不多見,而在那些文獻中,又以研究 勝分差(point spread)或是戰績預測為大宗。勝分差預測旨在預測一支球隊會贏 過另一支球隊幾分。戰績預測則分為常規賽和季後賽的預測,常規賽預測旨在 預測最後 82 場比賽總戰績,季後賽戰績預測旨在預測最後總冠軍。 Eric Scot Jones(2016)提出利用總投籃命中率的差距、三分球投籃命中率的差 距 、罰球投籃命中率的差距、進攻籃板的差距、助攻數的差距、失誤的差距、 罰球出手數的差距,7 項數據,經過逐步選擇法(Stepwise selection)後,當作自 變數,將勝分差當作因變數,配置出一迴歸式,對勝分差進行預測。 王景南(2002)提出利用三分球命中次數的差距、二分球命中次數的差距、罰 球命中次數的差距、進攻籃板球的差距、助攻次數的差距、犯規次數的差距,6 項數據做為自變數,而勝分差透過語言變數,變為模糊應變數,應用模糊迴歸 分析於勝分差預測。 江支璋(2011)提出運用卡方近似檢定與正規馬可夫鏈轉移矩陣,來驗證 NBA 聯盟球隊戰績排名變化的收斂過程。 林忠程;陳建勳;陳智明(2014)透過研究 NBA2012-2013 年球季,進而分析 該賽季 NBA 各球隊對運動彩卷盤口所開出的讓分、大小過關率情形。 Evan Heit,Paul C. Price,Gordon H. Bower(1994)分析各項可能影響隊伍強度之 2.

(8) 因素,並建構出一:隊伍強度之數學算式模型,再運用此隊伍強度模型,來預測 隊伍的勝敗與勝分差。 值得注意的是關於大小分的研究文獻非常稀少,也促使本文嘗試分析它,並 將它與預測結合。. 3.

(9) 第二章. 研究方法. 2.1 台灣 NBA 籃球運動彩卷基本名詞與玩法 首先介紹一下本文將要分析的,目前 NBA 運彩大小盤的玩法。以 2018/05/08,多倫多暴龍對上克里夫蘭騎士這場比賽為例,我們希望預測這場 比賽的大小分,並購買它的彩卷。 NBA 運彩中,大小分的買法可以分成 3 種:大小[總分]、大小[客隊]、大小 [主隊],如圖 2.1,在開打前一天 2018/05/07,我們已可前往台灣各個運彩站 購買,要購買時,運彩站的電腦上可連到如圖 2.1 的網頁,上面有各種運彩資 訊及玩法,多倫多暴龍是客場,克里夫蘭騎士是主場(此網站固定都是客場球隊 @主場球隊)。 大小[客隊]中的分數(104.5)是莊家開出的分數,如果我們預測這場比賽,多 倫多暴龍會得 105 分以上(含 105),我們就買大,如果預測會得 105 分以下(不 含 105),我們就買小,如果想買克里夫蘭騎士的大小分,可以在大小[主隊] 買,方法同大小[客隊],而大小[總分]玩的是兩隊加起來的總分,如果我們預 測這場比賽,兩隊加起來會得 214 分以上(含 214),我們就買大,如果預測會 得 214 分以下(不含 214),我們就買小。. 4.

(10) 圖 2.1 台灣彩卷之 NBA 彩卷網頁玩法圖. 其他 NBA 運彩玩法與名詞: 1. 勝分差:指一支球隊贏過另一支球隊的分數。 2. 讓分:如圖 2.1,騎士隊讓分盤為-5.5,表示若購買此彩卷,則騎士隊必須 贏暴龍隊 6 分以上(含 6 分),此彩卷才算贏,反之皆輸,另一方面,暴龍隊 讓分盤為+5.5,表示若購買此彩卷,則暴龍必須輸 5 分以內(含 5 分),此彩 卷才算贏,反之皆輸。例:若這場比賽最終比賽結果為 100(騎士):99(暴 龍),則買騎士-1.5 彩卷者輸,而買暴龍+1.5 彩卷者贏。 3. 不讓分:單純玩哪支球隊會贏,例:若暴龍對上騎士的比賽,我們覺得暴龍會 贏,則彩卷買暴龍贏,我們覺得騎士會贏,則彩卷買騎士贏,等實際結果出 來,預測對的人贏的彩卷。 4. 賠率:台灣 NBA 運彩玩法中,每種玩法皆有賠率,即贏錢後獲利多少的數字 訊息。如圖 2.1 中,大小[總分]、大小[主隊]、大小[客隊]的賠率一律為 1.75。表示花 100 元購買這些彩卷:若贏,則可賺 75 元;若輸,則會賠 100 元。也就是以贏錢的期望值要為正來說,則賠率為 1.75 的運彩勝率需達 5.

(11) 58%以上。另外值得注意的是,這三種大小分的玩法賠率為 1.75 歷史已相當 久,算是已經固定下來,不會變動的賠率。而讓分盤的賠率會微幅在 1.75 上下跳動。不讓分盤賠率跳動最為不穩定,可以透過觀察不讓分盤之賠率, 清楚判斷出對戰之兩支球隊近況孰優孰劣。. 2.2 NBA 基本名詞介紹 1.二分球投籃次數(2PA) : 比賽中在三分線內出手投籃的次數。 2.二分球命中次數(2P) : 比賽中在三分線內出手投籃的命中率。 3.三分球投籃次數(3PA) : 比賽中在在三分線外出手投籃的次數。 4.三分球命中次數(3P) : 比賽中在在三分線外出手投籃的命中率。 5.罰球投籃次數(FTA) : 比賽中以罰球方式投籃的次數。 6.罰球命中率(FT) : 比賽中以罰球方式投籃的命中率。 7.進攻籃板球(ORB) : 進攻方出手投籃不中,但進攻方球員搶到的籃板球稱為 進攻籃板球。 8.防守籃板球(DRB) : 敵隊進攻投籃不中,本隊球員搶到的籃板球稱為防守籃 板球。 9.助攻(AST) : 進攻方為達成有效的中籃行為,運用巧妙的傳球技巧,協助自 己的隊友輕鬆的直接上籃或投籃得分稱為助攻。 10.抄截(STL) : 防守球員以合法動作,從進攻方搶奪球成功,由守轉攻的動 作。 6.

(12) 11.阻攻(BLK) : 進攻方球員投籃時,防守方球員以合法動作將其試投出手之 球予以破壞或封阻。 12.失誤(TOV) : 進攻方進攻傳球中被對方抄截,或因違例未能控制住球而喪 失進攻權。 13.犯規(PF) : 違反與對方身體接觸的原則或有違反運動道德的行為。. 2.3 NBA 基本結構及賽制介紹 NBA 為 National Basketball Association 的縮寫,現為北美 4 大運動之一。 NBA 一共有 30 支球隊,分為東西兩區,東西區各 15 支球隊,每個區又分為 3 個組,每個組有 5 支球隊。賽事以一季(season)做為單位,每一季約從每年 10 月初 左右開始,10 月開始熱身賽至 10 月底,10 月底 11 月初左右開始常規賽,常規賽 至 4 月中左右結束,開始季後賽,季後賽最後一輪約在 6 月中結束,最終獲勝的球 隊即為當季總冠軍。 熱身賽無固定場次,多在美國海外舉行,吸引國際球迷,常規賽每一季為 82 場,30 支球隊皆須完成 82 場比賽一共 2460 場常規賽事,其中有主客場之分,值 得注意的是常規賽中的明星賽,明星賽為每年 2 月左右,常規賽進行了約 60 場比 賽後,所舉辦的比賽。明星賽當週為明星週,30 支球隊皆不進行比賽,除了被選 為明星隊、新秀隊及志願參加三分球大賽、灌籃大賽、技術挑戰賽的球員必須出 賽,其餘球員可得到約一週的休息時間,也因此,明星賽常被視為一個賽季中的分 水嶺,明星賽後,約 20 場左右便要進入至關重要的季後賽,許多球隊狀態驟變, 開始認真打完常規賽事。 常規賽 82 場比賽打完後,由東西區各選出戰績最好的 8 支球隊,一共 16 支球隊 參加季後賽,東西區 8 支球隊依常規賽戰績最好─最壞依序排程 1~8 種子,依下列 7.

(13) 方式進行比賽:. 圖 2.2. NBA 季後賽對戰賽制. 如圖 2.2 所示,總共需進行 4 輪的比賽,每一輪的對戰皆採 7 戰 4 勝制,戰績較 好的球隊有主場優勢,即:2-2-1-1-1,以 NBA 2018 年季後賽東區,克里夫蘭騎士 對上印第安那溜馬為例,克里夫蘭騎士戰績較佳,則騎士隊將在此輪對戰中的前二 場、第五場、第七場在主場進行作戰。. 2.4 相關係數與分組相關係數分析 首先,我們希望在眾多籃球數據中,尋找可能有關係的兩組資料之線性相關 性,我們使用最直觀的相關係數開始分析。使用 JAVA 程式,從 https://www.playsport.cc/(玩運彩)網站中,將從 2008 年以來的每支球隊的每場 8.

(14) 比賽分數下載至 Excel 中,接著使用 Excel 軟體隨機抽樣出 70 場比賽。令隨機 抽樣出 70 場某球隊的某場比賽得分為 Y=( y1,y2...y70),被隨機抽樣到的該支 球隊,在該場比賽前 3 場的場均得分為 X=( x1,x2…x70)。 例:隨機抽樣抽到多倫多暴龍 2014/11/25 的比賽,比賽分數為 104,而這場 比賽前 3 場得分為:96,124,110,因此平均分數為 110 分。兩組數據就是 104 與 110。我們使用 Excel 軟體,對 X 與 Y 進行相關係數分析。 而在 NBA 得分紀錄中:2014-2015 年,有 13 支球隊整季平均得分在 [100,105]區間;2015-2016 年,有 18 支球隊整季平均得分在[100,105]區間; 2016-2017 年,有 16 支球隊整季平均得分在[100,105]區間。顯示近三年來, 多數球隊平均得分皆在[100,105]區間內,這區間給了我們一些參考。我們認 為,可藉由分組相關係數來使整體分析更有意義。令隨機抽樣出 70 場某球隊的 某場比賽得分為 Y=(y1,y2...y70),被隨機抽樣到的該支球隊,在該場比賽前 3 場的場均得分為 X=(x1,x2…x70)。令 Z 為一元素為 X,Y 的集合. i.e.Z={X,. Y},Rz 為 X,Y 的相關係數,我們對 Z 進行分組。令 A={X1, Y1},B={X2, Y2}, X1UX2=X,Y1UY2=Y,Ra 為 X1,Y1 的相關係數,Rb 為 X2,Y2 的相關係數。詳細分組實 例情況將在 3.1 節之中探討。在實例探討之前,這邊我們先使用 GGB 的模擬資 料,來討論分組相關係數的一些可能的現象。使用 GGB,模擬出資料 A、B、Z, 其中 Z={X, Y},│X│=│Y│=30;A={X1, Y1},│X1│=│Y1│=15;B={X2, Y2},│ X2│=│Y2│=15,││代表集合的個數。如表 2.1 和表 2.2。. 9.

(15) 表 2.1. 表 2.2. 模擬資料數據 A 與 B. 模擬資料數據 Z. 10.

(16) 1. 討論是否存在. 1. (Ra+Rb)≦Rz ?. 2. 根據表 2.1 和表 2.2 結果:Ra=0.281,Rb=-0.083, 1. (Ra+Rb)=0.099<Rz=0.858,顯示確實存在這種結果的資料。. 2. 我們再透過 GGB 模擬出另外一組資料 A*、B*、Z*,其中 Z*={X*, Y*},│X* │=│Y*│=30;A*={X1*, Y1*},│X1*│=│Y1*│=15;B*={X2*, Y2*},│X2*│=│ Y2*│=15,││代表集合的個數。如表 2.3 和表 2.4。. 表 2.3. 模擬資料數據 A*和 B*. 11.

(17) 表 2.4. 模擬資料數據 Z*. 2. 討論是否存在一組集合 A*,使得 Ra*>Rz* ? 根據表 2.3 和表 2.4 結果: Ra*=0.132,Rb*=-0.031,Ra*=0.132>Rz=0.013 且 Rb*=-0.031<Rz=0.013。顯示確實存在這種結果的資料,值得注意的是若 將 b*數值帶入 a*,也存在 Ra*<Rz*的結果。. 兩個模擬結果顯示出分組相關係數,與為分組前的相關係數並不存在特定關 係,仍需視資料型態而定。 12.

(18) 2.5 迴歸分析 隨機抽取 70 場比賽 : 見附錄二。在籃球比賽中,會被記錄下來的數據 有:(1)二分球投籃次數,(2)二分球命中率,(3)三分球投籃次數,(4)三分球命 中率,(5)罰球投籃次數,(6)罰球命中率,(7)進攻籃板球,(8)防守籃板球, (9)助攻,(10)抄截,(11)阻攻,(12)失誤,(13)犯規。將以上數據與得分,用 Excel 軟體做出迴歸後,以逐步選擇法(stepwise selection procedure),挑出 p value <0.05 的數據,如表 2.5。這幾個數據分別是:二分球命中率、三分球命 中率、罰球出手數、助攻數、進攻籃板,整體用 Excel 軟體做出回歸後, R2=0.735,而且各自變數的 VIF 都介於 1.136~1.418 中間,沒有共線性的問 題,算是相當不錯的迴歸模型。. 表 2.5. 使用 Excel 經過逐步選擇程序後,跑出之迴歸表. 但在做迴歸時,必須檢查誤差項符合 4 項假設: 1.誤差項的變異數是常數 2.誤差項的平均等於 0 3.誤差項是常態分佈 13.

(19) 4.誤差項是獨立的. 觀察圖 2.3~2.7,誤差皆落在[-20,20]之間,無特殊圖形出現,說明了誤差 變異數是固定且誤差是獨立的,條件 1,4 符合。並且因為誤差均勻分布於 0 的 兩側,且經過 Excel 計算誤差的算術平均數,為 1.218E-15,約等於 0,說明了 條件 2 符合。最後觀察圖 2.8,雖然在標準化後誤差區間(-1.114,-0.264)頻率 看起來偏高,但經 Excel 確實計算後,1 個標準差內之誤差項有 71.43%,2 個標 準差內之誤差有 94.29%,我們認為仍遵守大致的常態分佈,因此條件 3 也符 合。. 2分球命中率(%) 殘差圖 20. 殘差. 10 0 0. 20. 40. 60. -10 -20. 2分球命中率(%). 圖 2.3. 二分球命中率(%)殘差圖. 14. 80.

(20) 3分球命中率(%) 殘差圖 20. 殘差. 10 0 0. 20. 40. 60. 80. -10 -20 3分球命中率(%). 圖 2.4. 三分球命中率(%)殘差圖. 罰球出手數 殘差圖 20. 0 -10. 0. 10. 20. -20. 30. 40. 50. 罰球出手數. 圖 2.5. 罰球出手數殘差圖. 助攻數 殘差圖 20 10. 殘差. 殘差. 10. 0 0. 10. 20. -10 -20. 助攻數. 圖 2.6. 助攻數殘差圖. 15. 30. 40.

(21) 進攻籃板數 殘差圖 20. 殘差. 10 0 0. 5. 10. 15. 20. 25. -10 -20. 進攻籃板數. 圖 2.7. 圖 2.8. 進攻籃板殘差圖. 標準化殘差圖. 因為假設已確認完畢,我們列出該迴歸線方程式: Y=0.954*X1+0.335*X2+0.456*X3+0.776*X4+0.856*X5+3.044. 2.1. X1 為二分球命中率,X2 為三分球命中率,X3 為罰球出手數,X4 為助攻數,X5 為進攻籃 板數,Y 為得分。. 16.

(22) 2.6 球隊得分的逼近分配估計 本節我們試著觀察球隊每一年的常規賽得分,是否符合某些統計定理或模 型。 絕對規律性條件(absolute regularity condition):令{Xi,-∞<i<∞}是在機率空間 (Ω,A,P)上的時間序列,整數 a,b(a≦b),令𝑀ab 為由事件 Xa,…,Xb 生成的σalgebra,那麼如果:. ∞. k β(n)=supE{P(A│𝑀−∞ )-P(A)│: A ∈ 𝑀k+n }↓0 當 n→0,則{Xi}是絕對規律。 k. 我們假設β(n)以指數速率快速遞減到零。這個假設相對較弱。事實上,許多 時間序列β(n)以指數速率衰減到零都符合絕對規律條件。這些包括 Pham 和 Tran(1985)和 Pham(1986)分別給出的自迴歸移動平均時間序列模型和雙線 性模型。對於假設β(n)以指數衰減率的絕對規律時間序列的一些統計應用,可 參閱 Chan 和 Tran(1992)。絕對規律性條件弱於許多其他相依條件,例如: mdependence、∅混合、Ψ混合、但強於強混合條件。在更嚴格的假設下,結果可 以擴展到強混合情況,混合係數以多項式速率衰減到零。 接著我們檢視球隊的得分紀錄,運用 Minitab 14.0 軟體,對 2014-2017 最近 三年,30 支球隊每一場常規賽進行自迴歸分析 ACF 與偏自迴歸分析 PACF,結 果如圖 2.9:. 17.

(23) 圖 2.9. NBA2016-2017 賽季勇士隊常規賽得分紀錄 ACF 與 PACF 圖. 發現其符合 ARMA 趨勢,而 ARMA 過程滿足絕對規律性條件,因此也符合 強混合條件,因此我們最後可以確定,球隊得分也符合廣義中央極限值定理。. 2.7 Regular season 與 playoff 之預測結合買運彩策略 透過隨機抽樣的比賽,為總得分配置出來回歸式 2.1 後,接著我們希望它能 夠去預測隨機抽樣出的 N 場比賽得分,雖然迴歸式已配置出來,但實際的二分 球命中率、三分球命中率、罰球出手數、助攻數、進攻籃板數數據在該 N 場比 賽開打之前仍是未知的,因此我們考慮使用 3 移動平均去估計我們該場比賽的 數據。 但考量到籃球賽畢竟是兩隊在打的運動,在預測某場比賽的某支球隊得分 時,單單參考該支球隊的前 3 場數據也許是不夠的,假設在該場預測的比賽之 前 3 場,該支球隊遇到的都是較弱的隊伍,數據都會很好看,而在該場預測的 比賽,該支球隊卻遇到防守很強的球隊,造成數據下滑十分嚴重,這也是很常 18.

(24) 見的。另外,如今的 NBA 各隊調整的也相當的快,因此我們認為若以前 3 場 比賽數據無法準確估計第四場比賽數據,則試用 NBA 整個賽季的季平均也許 會更加穩定。 季後賽中,每一場比賽的二分球命中率、三分球命中率、罰球出手數、助攻 數、進攻籃板數各項數據將使用球隊整季的季平均去看,如此相對於 3 移動平 均來說會更趨穩定,而預測的對象,也從某場比賽的某支球隊得分變為某場比 賽兩隊相加的總得分。 具體步驟:進入 NBA 數據網站 https://www.basketball-reference.com/,將想分 析的年份、球隊季後賽對戰組合確認後,將對戰的兩支球隊:A 球隊與 B 球隊找 到,這裡必須注意,除了找出這兩支球隊自己各項數據的季平均,讓對手得到 多少的數據也必須找到。 A 球隊:二分球命中率(A1)、三分球命中率(A2)、罰球出手數(A3)、助攻數 (A4)、進攻籃板數(A5);讓對手得到的各項數據季平均:2 分球命中率(A1*)、3 分球命中率(A2*)、罰球出手數(A3*)、助攻數(A4*)、進攻籃板數(A5*)。 取(A1+B1*)/2,(A1+B2*)/2,(A3+B3*)/2,(A4+B4*)/2,(A5+B5*)/2 代入式 2.1 中的 X1~X5,算出來的就是 A 球隊的單場預計得分,令為 Ya。 B 球隊: 二分球命中率(B1)、三分球命中率(B2)、罰球出手數(B3)、助攻數 (B4)、進攻籃板數(B5);讓對手得到的 2 分球命中率(B1*)、3 分球命中率 (B2*)、罰球出手數(B3*)、助攻數(B4*)、進攻籃板數(B5*)。 取(B1+A1*)/2,(B2+A2*)/2,(B3+A3*)/2,(B4+A4*)/2,(B5+A5*)/2 代入式 2.1 中的 X1~X5,算出來的就是 B 球隊的單場預計得分,令為 Yb。. 19.

(25) 以下為三種預測法: 1:令 Z1=Ya+Yb,我們將會使用 Z1 去與過去幾年 NBA 季後賽運彩中,莊家所開出 的:大小[總分]的盤口分數做比對,並買大或買小,觀察預測的結果。 2:令 A 球隊季平均得分為 C,讓對手季平均得分為 C*;B 球隊季平均得分為 D,讓 對手季平均得分為 D*。取 C+D 為 Z2,將使用 Z2 與莊家所開出的:大小[總分] 的盤口分數做比對,並買大或買小,觀察預測的結果。 3:令 A 球隊季平均得分為 C,讓對手季平均得分為 C*;B 球隊季平均得分為 D,讓 對手季平均得分為 D*。取(C+D*)/2+(D+C*)/2 為 Z3,將使用 Z3 莊家所開出 的:大小[總分]的盤口分數做比對,並買大或買小,觀察預測的結果。我們將 使用以上三種方法去預測。 預測方法確立之後,我們希望能找到一些策略與預測方法搭配來買運彩,以 達到更高的中獎率。NBA 運彩在大小分的賠率一律都是 1.75,也因此若贏錢 期望值要為正,則中獎率需達到 58%以上,我們將以此為目標進行策略篩選。 NBA 運彩中,莊家所開出的:大小[總分]之盤口分數,我們認為也含有一些意 義,若迴歸或其他方法跑出來的預測分數,與之相差太遠,則認定該場比賽分 數不穩定,不適合購買該場比賽之彩卷。 策略:Z1,Z2,Z3 分數計算出後,若距離運彩所開出的分數 W,相差超過 D 分, 即│Z1-W│>D 或│Z2-W│>D 或│Z3-W│>D,則該場比賽不買。. 20.

(26) 第三章. 實證. 3.1 相關係數與分組 用 Excel 從 2014-2015,2015-2016 賽季隨機抽樣出 70 場比賽(Y)後,將這 70 場比賽與這 70 場比賽各自的前三場場均得分(X),用 Excel 算出相關係數為 0.525。 接著使用分組相關係數,將 X 分為 100 分以下的組 A:A<100 以及組 B:B≥100。組 A 相關係數為 0.088,組 B 相關係數為 0.37。若再更進一步對組 B 再分組為組 B1:100≤B1≤105 以及組 B2:B2≥106。組 B1 相關係數為 0.407,組 B2 相 關係數為 0.233,以上能看出前三場場均得分(X)在區間[100,105]時,和第四 場得分之相關性高於其他組別。 但因整體相關係數僅有 0.525,且分組後,未如預期有相關係數>0.7 之相關 性出現,因此判斷前三場場均與第四場得分無明顯線性相關,亦不適合用來作 迴歸分析與預測。 單一自變量 X,與應變量 Y 無明顯相關,接著我們希望透過將自變量增加, 分散各個自變量對於 Y 的影響,藉此觀察是否能有較顯著相關性出現。. 3.2 迴歸分析與預測 透過 Excel 隨機抽樣 2010~2013 的 70 場比賽後,為總得分配置出來迴歸式 2.1,接著我們希望它能夠去預測 2014~2016 隨機抽樣出的 100 場比賽。 雖然迴歸式已配置出來,但在我們希望預測的該場比賽之實際數據(2 分球命 21.

(27) 中率、3 分球命中率、罰球出手數、助攻數、進攻籃板數)開打前是未知的,因 此我們將會使用 3 移動平均去估計該場比賽的各項數據,與上一節不同的是, 我們將 3 移動平均的數據從單純得分,分散成五個不同的數據去做分析,結果 如表 3.1:. 表 3.1. 預測分數與實際分數的比對. 隨機抽取 100 場比賽,結果並不理想,圖中藍色代表預測分數與實際分數差 距 5 分以內,紅色表示預測分數與實際分數差距 7 分以內,差距 7 分以內場次 僅 38 場,差距縮到 5 分以內更是剩下 29 場,結合 3.1,因此判斷,3 移動平均 並不適合用來代替第四場的任何數據。 畢竟籃球賽是兩隊在打的運動,而且單單參考一支球隊的前三場數據也許是 不足以代表該球隊第四場的現象的,例如在該場預測的比賽之前四場,有可能 該支球隊遇到的都是較弱的隊伍,數據都會很好看,而在該場預測的比賽,該 支球隊卻遇到防守很強的球隊,造成數據下滑十分嚴重,另外,如今的 NBA 22.

(28) 各隊調整的也相當的快,在這個狀況下,我們必須尋找 NBA 中更穩定的代表 性數據。. 3.3 季後賽預測 季後賽中,每一場比賽的 2 分球命中率、3 分球命中率、罰球出手數、助攻 數、進攻籃板數將使用球隊整季的季平均去看,如此相對於 3 移動平均來說會 更趨穩定,而且預測的對象,也從單場得分變成兩隊相加的大小分。 以 NBA2015-2016 東區季後賽第一輪:克里夫蘭騎士 VS 底特律活塞為例。首 先於網站 basketball refference(https://www.basketball-reference.com)分別找到兩球 隊自己(team)整季平均數據和讓對手(opponent)的整季平均數據,如表 3.2 和表 3.3:. 表 3.2. NBA 克里夫蘭騎士隊 2015-2016 賽季各項數據平均. 23.

(29) 表 3.3. NBA 底特律活塞隊 2015-2016 賽季各項數據平均. 24.

(30) 我們希望能夠盡量準確預測兩隊在這一輪對戰所有比賽中,兩隊加起來的得 分是多少,以下為三種作法: 1. 將騎士整季的季平均數據(team,2 分球命中率、3 分球命中率、罰球出手 數、助攻數、進攻籃板數)和活塞隊讓對手得到多少的數據(opponent, 2 分 球命中率、3 分球命中率、罰球出手數、助攻數、進攻籃板數)取算術平均 數,接著帶入式 2.1,當作預測的騎士隊單場分數 Ya,接著活塞隊比照辦 理,預測出活塞隊的單場分數 Yb,最後兩預測出來的分數 Ya+Yb 令為 Z1, 然後和當時實際開出的 NBA 運彩:大小[總分]比對並觀察:依照此法算出來 的 Z1 分數去比對當時實際 NBA 運彩:大小[總分]後,去購買彩卷大小,觀 察贏的機率有多少。 以 NBA2015-2016 東區季後賽第一輪:克里夫蘭騎士 VS 底特律活塞第一輪 為例,如表 3.4 和表 3.5:. 表 3.4 紅色數字為透過迴歸式 2.1 預測的兩隊得分。取兩紅色數字相加當作季 後賽預測的兩隊相加得分。. 25.

(31) 表 3.5. 黑色部分為當時 NBA 運彩:大小[總分]的盤口分數與結果大小,紅色 部分為預測的兩隊相加得分和比對盤口分數後之輸贏結果。. 完全按照此法購買彩卷,並買下 2015-2016 及 2016-2017 的所有季後賽,輸 贏結果: 2015-2016,2016-2017 季後賽共 166 場,可贏得其中 88 場,約 53.01%。. 26.

(32) 2. 將騎士的季平均得分和活塞季平均得分相加,令為 Z2,然後和當時實際開出 的 NBA 運彩:大小[總分]比對並觀察:依照此法算出來的 Z2 分數去比對當時 實際 NBA 運彩:大小[總分]後,去購買彩卷大小,觀察贏的機率有多少。 同樣以 NBA2015-2016 東區季後賽第一輪:克里夫蘭騎士 VS 底特律活塞第 一輪為例,如表 3.6 和表 3.7:. 表 3.6. 藍色數字為兩隊各自季平均得分,取兩隊季平均得分相加當作季後賽 預測的兩隊相加得分。. 表 3.7. 黑色部分為當時 NBA 運彩:大小[總分]的盤口分數與結果大小,藍色 部分為預測的兩隊相加得分和比對盤口分數後之輸贏結果。. 完全按照此法購買彩卷,並買下 2015-2016 及 2016-2017 的所有季後賽,輸 贏結果: 2015-2016,2016-2017 季後賽共 166 場,可贏得其中 83 場,為 50%。. 27.

(33) 3. 將騎士季平均得分和活塞隊讓對手季平均得分取算術平均數,當作預測的騎 士隊單場分數 Ya*,接著活塞隊比照辦理,預測出活塞隊的單場分數 Yb*, 最後兩預測出來的分數 Ya*+Yb*令為 Z3,然後和當時實際開出的 NBA 運彩: 大小[總分]比對並觀察:依照此法算出來的 Z3 分數去比對當時實際 NBA 運 彩:大小[總分]後,去購買彩卷大小,觀察贏的機率有多少。 同樣以 NBA2015-2016 東區季後賽第一輪:克里夫蘭騎士 VS 底特律活塞第 一輪為例,如表 3.8 和表 3.9:. 表 3.8. 騎士自己整季平均得分與活塞讓騎士整季平均得分取算術平均;活塞. 自己整季平均得分與騎士讓活塞整季平均得分取算術平均便是綠色的兩數字。. 表 3.9. 黑色部分為當時 NBA 運彩:大小[總分]的盤口分數與結果大小,綠色 部分為預測的兩隊相加得分和比對盤口分數後之輸贏結果。. 完全按照此法購買彩卷,並買下 2015-2016 及 2016-2017 的所有季後賽,輸 贏結果:. 28.

(34) 2015-2016,2016-2017 季後賽共 166 場,可贏的其中 85 場,約為 51.2%。. 3.4 買運彩策略 NBA 運彩在大小分的賠率一率都是 1.75,也因此若贏錢期望值若要為正, 則預測率需達到 58%以上,在 3.3 節中,若過去兩年每一場季後賽都購買彩 卷,所有方法皆沒達到此一標準,因此,必須對比賽進行適當的篩選。 策略一: 根據迴歸式 2.1,算出 Z1 分數後,若距離 NBA 運彩:大小[總分]的盤口分數 W 相差超過 5 分,即│Z1-W│>5,則該場比賽不買,反之,則購買。 例:如兩隊根據迴歸式 2.1 算出 Z1 分數為 198,而運彩:大小[總分]的盤口分 數為 204 以上或 192 分以下,則這場比賽我們跳過不買,反之,只要 5 分以內 的差距,一律購買彩卷。依照此法,2015-2017 年的季後賽中,我們可購買其 中 56 場的 NBA 運彩,其中 34 場會贏,勝率約為 60.71%。 策略二: 算出 Z2 分數後,│Z2-W│>5,則該場比賽不買,反之,則購買。依照此法, 2015-2017 年的季後賽中,我們可購買其中 59 場的 NBA 運彩,其中 30 場會 贏,勝率約為 50.85%。 策略三: 算出 Z3 分數後,│Z3-W│>5,則該場比賽不買,反之,則購買。依照此 法,2015-2017 年的季後賽中,我們可購買其中 101 場的 NBA 運彩,其中 55. 29.

(35) 場會贏,勝率約為 50.85%。 此種策略是為避免我們估計出的分數和真實狀況差距過大,造成預測失真, 因此將 NBA 運彩開出的分數也納入考量,讓預測更加準確。. 3.5 運彩玩法分析前後比較 根據 3.4 節最後選擇策略一之結果,在 NBA 賠率大小為 1.75 的:大小[總 分]玩法中,我們預測成功率可到達有贏錢標準之 60.71%(高於 58%),現在,我 們希望探討其他運彩玩法的預測成功率與賠率關係之實例。 在 NBA 運彩不讓分盤玩法中,有一種相當普遍的玩法,即:相信賠率的玩 法。運彩莊家在兩支球隊對戰前,於不讓分盤中開出的賠率往往非常有參考價 值,賠率低的球隊幾乎都是近況優於另一支球隊,有稍微在關注戰況的玩家都 會知道,賠率較高的,幾乎都是不被看好的那一隊,但運動彩卷迷人的一點便 在於:比賽開打前,甚麼事都是不確定的,即使有 99%的信心相信近況好的一支 球隊會獲勝,比賽打完仍有狀況較差的球隊獲勝之可能,因此衍生出了不讓分 盤中,兩種常見玩法:全買賠率低或全買賠率高。 買賠率低者相信雖然有被較弱球隊翻盤的可能,但長期買下來,狀況好的球 隊勝率畢竟比較穩定,因此整體應該能贏錢。而買賠率高者則相反,認為靠著 翻盤的那幾場比賽的高賠率,也許能夠補足沒有翻盤的那些比賽。 因此這邊,我們運用 Excel 隨機抽樣並檢驗結果。表 3.1 為隨機抽取 2016~2018 日期,並將抽到日期當天比賽的球隊比分、球隊輸贏結果、球隊輸 贏賠率共 90 場的數據:. 30.

(36) 表 3.10. 2016~2018,球隊輸贏結果、球隊輸贏賠率表. 31.

(37) 32.

(38) 棕底代表賠率低的球隊獲勝的場次,為 58 場,約為 64.44%,灰底代表賠 率高的球隊獲勝的場次,為 32 場,約為 35.56%,單從比率,確實賠率低的球 隊勝出場次多很多場,買賠率低的球隊獲勝有較高機率會贏得彩卷,但考慮每 場賠率狀況的話,以此樣本而言,若每場花 100 元全買賠率低球隊,最後結果 卻會賠 1205 元,而若反其道而行,每場花 100 元全買賠率高球隊,最後結果也 會賠 1090 元。 最後,針對此樣本中所有低賠率球隊取所有賠率之算術平均數,為 1.36, 因此賠率低之球隊勝率需達到約 73.53%,才可能贏錢。而所有賠率高的球隊之 賠率算術平均數為 2.61,因此賠率低之球隊勝率需達到約 38.31%,才可能贏 錢。. 3.6 整合式資料處理 本文經由 NBA 運彩數據分析,整理出了從找到了想分析的樣本開始,一連 串的作法流程:. Step1 檢視資料的線性相關性,若資料呈線性相關,則跳到 step4 Step2 以分組相關進行分析 Step3 找出最佳分組點 Step4 迴歸分析 Step5 找出預測的最佳方法 Step6 代入迴歸式與策略 Step7 結論 33.

(39) Step1 檢視資料的線性相關性,若資料 呈線性相關,則跳到 step4. Step2. 以分組相關進行分析. Step3 找出最佳分組點 Step4. 迴歸分析. Step5 找出預測的最佳方法. Step6 代入迴歸式與策略. Step7 結論. 34.

(40) 第四章 結論與建議 在本篇文章中,首先運用 Excel 軟體配置出自變數為 2 分球命中率、3 分球 命中率、罰球出手數、助攻數、進攻籃板數 5 項 NBA 比賽數據;應變數為得 分的迴歸線。此迴歸線能夠很好的解釋約 74%的得分現象。接著我們希望透過 預測 2 分球命中率、3 分球命中率、罰球出手數、助攻數、進攻籃板數,並代 入迴歸式中,來達到預測得分的目標。主要方法有 3 移動平均、整季之季平均 兩方法。發現,使用整季之季平均分數較 3 移動平均的場均分數穩定,再搭配 上和 NBA 運彩:大小[總分]開出的盤口分數相差 5 分以內皆購買彩卷的策略, 能夠在過去兩年 NBA2015-2016 和 2016-2017 賽季,贏得 60.71%的 NBA 運 彩。也因為 NBA:大小[總分]這種玩法,賠率一律是 1.75,因此 60.71%的運彩 勝率有達到贏錢的期望值。而在理論方面,使用軟體 Minitab 觀察分析球隊得 分紀錄時,發現了球隊得分符合 ARMA 過程。而 ARMA 過程滿足 absolute regularity condition 條件,因此也符合強混合條件,得到球隊得分記錄符合廣義 中央極限定理之結論。 現實中,NBA 瞬息萬變,本研究雖研究出一套方法能夠有 60.71%之運彩 勝率,但全文以數據為主。事實上,每一次買運彩時,更須考慮到球隊勝敗近 況、傷兵進出、主客場、連續背靠背作戰、明星賽前後、球員心理等等眾多狀 況。本文提供一個角度切入大小分之分析,未來也許可以考慮將以上因素也納 入,提高分析之預測率。 而在本文整個實作過程中,收集數據的部分是最困難的。程式設計並不好 的我,在整個過程用到的軟體僅有 Excel 和 Minitab,其中 Minitab 僅用於確認 球隊得分為 ARMA 過程,其餘部分皆由 Excel 軟體獨立完成。有時候從網站上 抓資料下來到後製成適合分析的表格,就要 3-4 天,效率並不好。也因此,所 能收集的數據相對於 NBA 網站上提供的數據,仍相當有限。如果程式能力能 35.

(41) 更好一點,觀察的年份可以增加;抽的樣本也可以抽得更多;也能夠收集並觀 察更多的 NBA 進階數據如: APM、Game score、eFG%、TS%、Per 等等。另 外,在策略方面,本文採取的方法較偏向觀察與經驗法則的結果,理論層面較 薄弱。若能收集更龐大的 NBA 運彩:大小[總分]之盤口分數的歷史紀錄,並分 析它與該場得分或是它與該場比賽前三場比賽平均得分等等之關係,或許能有 更理論的研究方法能找出該最佳策略。. 36.

(42) 附錄一 NBA2016-2017 賽季 30 支球隊常規賽,得分標準化圖:. 37.

(43) 38.

(44) 39.

(45) 40.

(46) 附錄二 2.5 節中抽樣出的 70 場比賽:. 41.

(47) 42.

(48) 參考文獻 英文期刊、論文: Chan, N. H. and Tran, L. T. (1992). Nonparametric tests for serial dependence, J. Time Ser. Anal., 13, 19-28. Evan Heit and Paul C. Price and Gordon H. Bower(1994).A model for predicting the outcomes of basketball games, Applied cognitive psychology,8,621-639. Eric Scot Jones,(2016) .Predic outcomes of NBA basketball games, Unpublished doctoral dissertation,North Dakota State University,Fargo,North Dakota. Lanh Tat Tran and Berlin Wu,(1993). Order statistics for nonstationary time series, Ann. Inst. Statist. Math,45, 665-686. Pham, D. T. and Tran, L. T. (1985). Some mixing properties of time series models, Stochastic Process. Appl., 19, 297-303. Pham, D. T. (1986). The mixing property of bilinear and generalized random coefficient autore- gressive models, Stochastic Process. Appl., 23, 291-300.. 中文期刊、論文: 王景南,(2002)。不對稱樣本的模糊迴歸分析與應用在籃球比賽攻防技術之應 用。中國統計學報,40,483-506。 江支璋,(2011)。美國職籃 NBA 球隊排名變動性之研究。明新學報,37,101110。 林忠程、陳建勳、陳智明(2014)。2012-2013 年 NBA 各隊讓分、大小盤口過關. 43.

(49) 率之分析。嘉大體育健康休閒期刊,13,123-132。. 英文網路資料: Basketball Reference,Retrieved May,6,2018,from: https://www.basketballreference.com/teams/DET/2016.html Basketball Reference,Retrieved May,6,2018,from: https://www.basketballreference.com/teams/CLE/2016.html. 中文網路資料: 台灣運動彩卷(民 107 年 5 月 7 日)。多倫多暴龍對上克里夫蘭騎士運彩玩法。 民 107 年 5 月 7 日,取自: https://www.sportslottery.com.tw/zh/web/guest/sportsbetting#m160731/next/s-442/c/t-4102,t-4104/278/1。 陳楷(民 105 年 6 月 22 日)。NBA 季後賽 台美收視創新高。中廣新聞網。民 107 年 5 月 7 日,取自: https://tw.news.yahoo.com/nba%E5%AD%A3%E5%BE%8C%E8%B3%BD%E5%8F%B0%E7%BE%8E%E6%94%B6%E8%A6%96%E7%8E%87%E5%89%B 5%E6%96%B0%E9%AB%98-052820381.html。 陳楷(民 106 年 6 月 14 日)。NBA 總冠軍平均收視率 20 年來最高。中廣新聞 網。民 107 年 5 月 7 日,取自: https://news.cnyes.com/news/id/3837897。. 44.

(50)

參考文獻

相關文件

推理論證 批判思辨 探究能力-問題解決 分析與發現 4-3 分析文本、數據等資料以解決問題 探究能力-問題解決 分析與發現 4-4

逸中、玟靜兩個人數學小考的平均分數為80分,若昊星的小考成績比逸

 就算身處軍營中,很多男兒都還是相當關心 NBA 自己

[r]

初中考核心篇章 額外字體分數 額外寫作大綱分數

母體分配 樣本平均數 的抽樣分配 抽樣誤差與 非抽樣誤差 樣本平均數 的平均數與. 變異數

分佈域 平均數 眾數 中位數 上四分位數

在【逐步解析 1】中,共需要輸入 2 個答案,為了避免「後面 輸入的答案(數學分數)」取代「前面的答案(國文分數)」,我 們要利用 2 個不同的變數來區別兩者,並以變數