• 沒有找到結果。

網絡分析中的擴散性演算法於排名傑出女子職業網球選手之應用

N/A
N/A
Protected

Academic year: 2021

Share "網絡分析中的擴散性演算法於排名傑出女子職業網球選手之應用"

Copied!
47
0
0

加載中.... (立即查看全文)

全文

(1)國立臺中教育大學教育測驗統計研究所理學碩士論文. 指 導 教 授:楊志堅 博士. 網絡分析中的擴散性演算法於排名 傑出女子職業網球選手之應用. 中. 華. 研. 究. 生:吳南逸. 民. 國. 一. ○. 撰. ○ 年. 六. 月.

(2) 致謝 終於到了要寫致謝的時候了,回顧這兩年的研究所生涯,多采多姿,非 三言兩語可道盡,而此刻的我,滿懷著感謝的心情。 首先,要感謝的是指導教授楊志堅老師,在我對研究感到不順之時,開 拓了我的興趣,讓我轉向自己感興趣的網絡分析相關研究,雖研究過程屢遇 挫折,但我卻甘之如飴,熱情不減,真的非常感謝老師的包容,指導與鞭策; 另外,老師除了研究議題與論文寫作之外,帶給我們的是嚴謹且合乎禮節的 處事原則,面對問題時正面且積極的態度,使我受益良多。在您的面前,總 是感到自己的渺小,以及那種想盡快成長的原動力,您是我的尤達大師。 接著,要感謝的是良庭學長,學長總是坐鎮在研究室裡,給予大家關於 生活、投稿、研究議題與論文寫作等許多方面直接的建議與協助,且不吝於 分享自身的經驗,使我們少走了許多岔路,感謝學長一直以來的關懷。 當然,還要感謝實驗室夥伴亭堯、逸豪與珮慈,不論是上課、寫作業, 趕投稿,辦研討會,與論文奮戰,中午大夥出門吃飯或是一同出遊等等,在 實驗室裡一起甘苦與共的日子將是我最美好的回憶。 還有,感謝我的臨時 RA 繼成,在我的研究過程中,協助處理資料與改 善程式,你對於改善程式的熱情真是令人驚訝,你是個鬥士。 最後,感謝我的父母,感謝你們的支持,使我能在回歸學校的這兩年, 有再度成長茁壯的機會,我愛你們。. 南逸 2011.07.25. II.

(3) 摘要 本研究利用網絡分析(Network Analysis)中的擴散性演算法(Diffusion Algorithm),在非贏即輸(win-or-loss)的比賽型態中來評估女子職業網球競. 賽球員的表現。在所有體育競賽裡,非贏即輸的系統違反了統計中 i.i.d (identically independent distributed, 各隨機變數間分配相同且獨立)的關鍵假設, 因此本研究在有方向性(Directed)及加權性(Weighted)的網路系統下,採用 Radicchi (2011)提出的擴散性演算法,以 1968 年到 2010 年女子職業網球組 織(WTA, Women's Tennis Association)中所記錄所有最具代表性的大滿貫賽的 單打資料進行實例分析,在避免違反統計中的 i.i.d 假設下,評估所有女子職業 網球選手的表現;藉由網絡分析來排名與評估這些年來傑出的女子職業網球選 手,試圖定義出大滿貫賽中史上最佳(GOAT, the Greatest Of All Time)的女子 網球選手。依據本研究的排名方法,Martina Navratilova 為大滿貫賽事史上最佳 的職業女子網球選手;新提出的選手排名與評估結果將與歷史紀錄來做比較。 本研究透過分析運動科學中常見的互斥與內在相關的資料集,提供了引導策略 來做結論。 關鍵詞:網絡分析、表現評估、非贏即輸、擴散性演算法. I.

(4) Abstract The paper proposes a diffusion algorithm of network analysis in assessing win-or-loss player performance in professional female tennis competitions. The win-or-loss systems in all competitive sports tournaments severely violate the critical i.i.d. (identically independent distributed) statistical assumptions.. The study. employs a diffusion algorithm using a directed and weighted network (Radicchi, 2011) to assessing and evaluating overall female tennis player performance without the iid assumptions. Empirical illustrations analyze Grand Slam matches of Women’s Tennis Association (WTA) from years of 1968 to 2010. The most elite professional lady tennis players in these years will be assessed and ranked by the network analysis. According ranking technique of this study, Martina Navratilova is the best player in Grand Slams of history of women professional tennis. Results of the newly proposed ranking and evaluating method will also be compared with historical score books. The study is concluded by providing guidelines for analyzing the class of mutual exclusive and intercorrelated datasets often seen in the sports science.. Keywords: Network Analysis, Performance Assessment, Win-or-Loss, Diffusion Algorithm. II.

(5) 目錄 中文摘要 ................................................................................................................................ I Abstract ................................................................................................................................. II 目錄...................................................................................................................................... III 表目錄 .................................................................................................................................. IV 圖目錄 .................................................................................................................................. IV 第一章 緒論 ....................................................................................................................... 1 第一節 研究動機 .......................................................................................................... 1 第二節 研究目的 .......................................................................................................... 3 第三節 論文架構 .......................................................................................................... 3 第二章 文獻探討................................................................................................................ 4 第一節 傑出的女子職業網球選手 ............................................................................. 4 第二節 WTA 排名系統 .............................................................................................. 5 第三節 運動競賽的資料型態與討論 ........................................................................... 6 第四節 網絡分析(Network Analysis) .................................................................. 10 第三章 研究方法.............................................................................................................. 23 第一節 研究程序 ............................................................................................................... 23 第二節 資料來源與處理 ............................................................................................ 23 第二節 擴散性演算法與聲望值 ................................................................................. 26 第四章 研究結果.............................................................................................................. 28 第一節 職業女子網球選手聲望值排名 ..................................................................... 28 第二節 聲望值與歷史記錄的比較 ............................................................................. 31 第五章 結論與建議 .......................................................................................................... 33 第一節 研究結論 ........................................................................................................ 33 第二節 未來建議 ........................................................................................................ 34 參考文獻 ............................................................................................................................. 36 附錄一 1968 年至 1980 年大滿貫賽聲望值排名前三十選手列表.................................... 38 附錄二 1981 年至 1990 年大滿貫賽聲望值排名前三十選手列表.................................... 39 附錄三 1991 年至 2000 年大滿貫賽聲望值排名前三十選手列表.................................... 40 附錄四 2001 年至 2010 年大滿貫賽聲望值排名前三十選手列表.................................... 41. III.

(6) 表目錄 表 1 圖論與網絡分析的相關表示法 ...................................................... 12 表 2 大滿貫賽事中史上網球聲望值排名 TOP 30 .................................. 30. 圖目錄 圖 1 無方向性與有方向性的網絡 .......................................................... 13 圖 2 不同連結度(連結數量)的節點 .................................................. 13 圖 3 外連結與內連結 ............................................................................. 14 圖 4 無加權性的網絡與有加權性的網絡............................................... 15 圖 5 聲望的概念圖 ................................................................................. 17 圖 6 無尺度網絡示意圖.......................................................................... 18 圖 7 曾奪得 WTA 冠軍的 20 位女子選手之間構成的對戰網絡圖 ....... 20 圖 8 網球對戰簽表與選手對戰矩陣的轉換方式 ................................... 25 圖 9 聲望值排名與勝場數排名的關係圖............................................... 31. IV.

(7) 第一章. 緒論. 本研究採用網絡分析中的擴散性演算法,分析職業女子網球選手在史上所 有大滿貫賽的競賽資料;具非贏即輸規則的網球競賽記錄資料集,彼此之間具 有強烈的關聯特性,所以任何選手的競賽紀錄都無法直接被比較,造成統計推 論的困難;網絡分析法適用於此類具相關性的資料集,且將所有選手的表現納 入同一個網絡中,進行跨年代的評估,而新提出的排名與評估結果將與傳統歷 史紀錄來做比較。. 第一節 研究動機 GOAT: the Greatest Of All Time GOAT(the Greatest Of All Time)指的是「史上最佳」,在各種職業運動 中,如何定義「史上最佳」這個夢幻的稱號,是職業運動迷們長久以來的熱門 討論話題。當前的各種討論均嘗試使用該運動規則中不同的計分項目來做為判 斷或定義的標準,例如:勝場總數、勝率的高低、奪得冠軍的次數,或者是只 採取某個時段的記錄(例如九零年代),而沒有跨年代的將所有記錄一起比較。 這些評比標準大部分都牽涉到一個重要的問題,就是由運動競賽所產生的 資料集,彼此之間屬於非獨立(non-independence)的狀態。因為每位選手或每 支球隊的戰績都是與其他不同的對手競賽之後得來的,也就是說,獲勝與否, 強烈的受到同場對手實力強弱的影響;由於競賽記錄所產生的資料集彼此之間 具有高度牽連的特性,若任意選取不同的選手或球隊的表現做比較,將會產生 統計推論的盲點,因為資料集非獨立的狀態下,不同的資料是無法直接做比較 的。所以,當採用運動競賽所產生的記錄,成為評斷選手或球隊表現的指標時, 顯然的不是完全公平且客觀的方法,導致評比結果總是備受爭議。 1.

(8) Radicchi 在 2011 年在男子職業網球競賽資料上,採用網絡分析(Network Analysis)的方式,回應了這個問題。網絡分析的目的在於探討不同個體與連結 之間的關係,在資料之間具有關聯性的狀況下進行分析,且能將所有被研究者 關注的目標同時納入考慮。利用網絡分析的這兩項主要特性,用來分析運動競 賽資料上是可行的,因為從運動競賽所產生的資料與網絡分析的資料具相同特 徵,也就是資料之間高度的相關性;此外,若將所有選手跨年代的競賽資料加 以結合,再進行分析,便能處理"傳統的競賽計分指標無法被跨年代比較"這長 久以來的爭議。 而職業網球運動並不如同其他大型職業運動,如職業棒球,職業籃球,傴 由男性選手所主導。在職業網球的世界裡,女子職業網球的規模與男子職業網 球分庭抗禮,賽制、場地、參與的選手數量,甚至受歡迎的程度,絲毫不遜於 男子職業網球;另外,職業網球中最著名的賽事為大滿貫賽(Grand Slam), 又稱四大公開賽,每年分別在澳洲、法國、英國和美國舉行,這四場職業網球 界最大規模的競賽,吸引著全世界網球迷的目光。 因此,本研究根據 Radicchi 在 2011 年的研究,利用網絡分析中的擴散型演 算法,產生"聲望值"這項指標,嘗試將史上所有女子職業網球選手做排名,觀 察每位有資格被認為是 GOAT 的選手的排名狀況,以及這些選手在不同的時空 環境及對戰組合下跨年代比較的結果;接著,將該排名結果,和歷史記錄做對 照,提供與傳統比較方式不同的新看法;除了以上,本研究還會將網絡分析中 著名的理論與分析結果做綜合的討論。. 2.

(9) 第二節 研究目的 本研究採用 1968 至 2010 年女子職業網球協會(WTA, Women's Tennis Association)記錄的所有大滿貫賽(Grand Slam)單打競賽資料,再以 Radicchi 在 2011 年所提出的的擴散演算法(diffusion algorithm)為基礎,將所有參與職 業網球中最具代表性的大滿貫賽的女子網球選手進行跨年代的排名,並試圖推 論出大滿貫賽事中史上最佳的女子職業網球選手,接著,再與傳統的競賽歷史 記錄做比較,最後將分析結果與網絡分析中的指標與理論加以綜合討論。. 第三節 論文架構 本篇論文的架構與撰寫的順序如下: 第一章為『緒論』,提出本研究的研究動機與研究目的,第二章為『文獻 探討』,在此討論影響本研究的相關學術文章,以及背景知識,包含了傑出的 女子網球選手、WTA 的排名系統、非贏即輸的比賽型態、i.i.d 的基本統計假設 和網絡分析的相關內容與討論。第三章為『研究方法』,說明資料來源與處理、 擴散性演算法與聲望值的內容。第四章為『研究結果』,將顯示出依據本研究 的方法而將女子職業選手排名出來的結果,以及與歷史記錄的比較。第五章為 『結論與建議』,內容關於研究結果的討論與未來研究的建議。. 3.

(10) 第二章. 文獻探討. 本章將概述著名女子網球選手的表現以及職業網球的排名與規則,接著介 紹關於運動競賽在非贏即輸的規則下所產生的資料型態,與統計推論的盲點, 最後談到網絡分析的特性與其相關的指標,如何與研究動機做對應,以及如何 回應這些的問題。. 第一節. 傑出的女子職業網球選手. 職業女子網球運動中,有許多選手是常常被提及有資格稱為史上最偉大 (GOAT, the Greatest Of All Time)的女子選手。包含 Martina Navratilova, Steffi Graf, Billie Jean King, Martina Hingis, Kim Clijsters, Serena Williams, Justine Henin, Maria Sharapova 等等。 Martina Navratilova 最著名的是她維持著比其他選手還要長時間的職業生 涯,她在大滿貫賽贏得 18 次單打冠軍、31 次雙打冠軍與 10 次混合雙打冠軍。 她擁有自開放年代(1968 年以後,業餘選手可開始加入競技)以來,最多的單 打(167 次)與雙打(177 次)冠軍;WTA 的創辦人 Billie Jean King 在 2006 年 曾說:Martina Navratilova 是史上最強的單打、雙打與混和雙打選手。 Stefanie Graf 為一位德國球后,在 1988 年,她成了歷史上唯一完成「金滿 貫」(同年贏得四大滿貫賽以及奧運冠軍)成就的職業網球選手(包含所有男 子與女子選手);直到今天,金滿貫仍是任何一位網球選手皆無法達成的傲人 成就。她在 WTA 的積分排名中,連續 377 週佔據世界第一,也是所有職業網 球選手中持續時間最長的紀錄;另外,她還擁有 8 個年終排名第一,是開放年 代後所有職業選手裡最多的。 Kim Clijsters 是一位著名的比利時職業選手,為了組織家庭,在 2007 年宣 布退休,退休前,她已擁有非常豐富的網球成就,包含她的單打與雙打排名都 4.

(11) 曾達到世界冠軍,然後在 2009 年復出後,在短短的時間內,已奪下了兩座大滿 貫賽的冠軍,以及 2010 年 WTA 年終賽(年終排名前八強可參與)的冠軍,現 在的她仍然在球場上繼續發光發熱,目前(2011 年 5 月 16 日結算)單打排名 為世界第二。 除了上述所提的選手外,還有許多本文章未提及知名的女子網球選手在其 職業生涯裡,都有傑出的表現,而在現有的比賽積分制度下,的確可以觀察每 年度的積分與排名,來了解該年度,或是該年代的最佳選手,但似乎很難評論 或以特定的條件來推論究竟哪位選手才是縱貫網球史上最偉大的女子選手。. 第二節. WTA 排名系統. 壹、WTA (Women's Tennis Association) 的簡介 女子網球協會(WTA, Women's Tennis Association)成立於 1973 年,是女子 職業網球選手積分排名制度的管理單位,也是女子世界網球巡迴賽(Premier tournaments)的主辦機構。除了 WTA 本身舉辦的眾多競賽之外,並將國際網球 聯合會(ITF, International Tennis Federation)所舉辦最知名的四大滿貫賽(Grand Slam)的排名積分列入計算,每年的尾聲以積分的多寡來決定年度排名。WTA 與負責為男子選手舉辦巡迴賽與計算積分排名的職業網球協會(ATP, Association of Tennis Professionals)為職業網壇世界巡迴賽的兩大主辦單位。. 貳、WTA 的排名規則 WTA 的排名規則是一個持續 52 週的系統,每週皆結算一次最新的積分排 名;這個排名系統為一個保衛積分制,在任何競賽獲得的排名或分數,會在 52 週後歸零,選手必頇採用更新的競賽積分來參與排名。決定一位球員的排名是 根據其 16 個單打競賽與 11 個雙打競賽的最高排名與積分。在 52 週的時間內, 5.

(12) 所有的競賽的最高排名與積分將會被計算。這些排名與積分必頇包含積分最高 的大滿貫賽(Grand Slam)、次一級的主要巡迴錦標賽(Premier Mandatory tournaments)與 WTA 年終冠軍賽。前 20 強的選手,她們在五站巡迴錦標賽(杜 拜、羅馬、辛辛那提、蒙特婁/多倫多、東京)中,挑選最佳兩站的成績併入計 算。所有的球員至少要參加 3 個競賽,或最少擁有 10 個單打或雙打的排名積分, 才能在 WTA 裡參與排名。 WTA 的排名競爭是非常激烈的,在每場 WTA 舉辦的競賽中,能持續擊敗 對手,挺進到更後面的回合(round),所得的積分越高;每挺進一個回合,積 分增加的比率也就更高。所以在一個完整的賽程裡,當疲勞感不斷的累積下, 還能維持自身實力的穩定度,擊敗越來越高層次的對手,是個十分困難的任務。 而本研究所關注的大滿貫賽,在所有網球賽事中賽程最長,參與每場大滿貫賽 的單打選手每次共有 128 名,所以在嚴格的單淘汰賽制中,必頇連續贏得七個 回合,也就是擊敗七位不同的選手,才能獲得大滿貫賽的冠軍,所以難度最高, 競爭也最激烈,積分與獎金也是所有的職業網球賽事中最高的。 WTA 的年度排名制度能了解在經過整年度的激烈競賽後,表現最佳的球員, 以及其他傑出球員的排名狀況;其系統固然完善,但如果要進行跨年代的比較, 或是想深入了解某些特定條件與選手之間的關係(例如特定場地、特定公開賽 或巡迴賽),甚至與某特定選手競賽表現是否與平時表現有差異等等,除了網 球競賽積分排名這樣實際的比較,需要一個更靈活且通用的分析來比較所有網 球選手的表現。. 第三節 運動競賽的資料型態與討論 壹、非贏即輸(Win-or-Loss)的競賽規則 在運動競賽中,非贏即輸(Win-or-Loss)為常見的比賽規則,例如:籃球 6.

(13) 比賽、棒球比賽、足球比賽…等,皆是在比較兩個球隊同場競賽時得分的多寡, 多者為勝,少者為敗;在這種同場比賽競賽規則下,雙方的表現會互相影響, 所以賽場上的表現,與對手原本的實力強弱以及臨場表現有非常大的相關;遇 上實力較差的對手,獲勝機率自然提高,但遇上實力較強的對手,獲勝機率自 然降低。這與其他非同一時間競賽(例如:測量秒數的短跑比賽,測距離的標 槍比賽…等),分別記錄個人的表現,最終再加以排名的運動不同。非同一時 間競賽運動大部分為非球類競賽,這類的比賽沒有同場競爭,而是選手單獨完 成競賽項目後,再做排名;不同的選手之間的表現看似獨立且不會互相影響, 不過實際上,還是有『心理因素』的影響因子;因為無論選手上場的排序如何, 先上場的選手有著必頇拿出最佳表現,否則將會被其他選手超越的壓力;而後 上場的選手,在排序在自己前方選手的成績已公開下,承受必頇跨越該門檻的 壓力。因此,這種非同一時間競賽的比賽,所有選手間似乎也並不是完全獨立 的。 而非贏即輸(Win or Loss)的比賽,是與對手在同一時間內的同場競爭之 後,才能分出輸贏,對於雙方選手的互相影響更是深遠。運動競賽常見的單淘 汰賽的賽制中,在非贏即輸的比賽狀態下,不論選手能力差距多少,獲勝者可 晉級繼續更高層次的比賽;落敗者遭受淘汰。也就是說,假設參與比賽的兩位 選手都十分傑出,且雙方實力十分接近,即使落敗的一方也是實力堅強的選手, 但因為單淘汰賽制(輸一場即淘汰),所以無法再進到更高等級的對戰,來證 明自己的實力,因此,就結果來看,單淘汰賽制已無法客觀的給予落敗的一方 關於實力正面的評價。 在職業網球比賽大部分皆為單淘汰賽制的制度下也常發生這樣的情況:在 對於評斷職業網球選手們實力高低的方式,為看似能力相近的網球選手在賽程 裡淘汰表現較差的選手後,持續到較後段的比賽時,彼此成為對手(在等級較 高的比賽碰頭),然後分出勝負,一般認為由於兩位選手實力相當,比賽結果 7.

(14) 足以做為雙方實力高低的參考,當然賽程越到後段,所留下來的選手實力也越 強,比賽強度也越高;但事實上會有兩個常見的狀況,第一種狀況是因為賽程 或排位的關係,兩個在選手群中實力評價都很高的選手,在未進入更高等級的 賽程時,就已要進行比賽分出勝負,造成所謂頂尖選手的超出預期的提早淘汰, 第二種狀況為實力其實是很堅強但排名不高的選手,老是提早遇到排名較前的 選手,即使實力傴差對方一些,也遭淘汰;這兩種狀況的問題在於被淘汰的選 手,即使本身的實力堅強,卻已無法用再繼續比賽來表現自身的實力,這是評 價一位選手的表現時常遇見的問題。 根據以上的討論,可以得知:運動競賽的結果在不同程度上,都建立在『選 手或球隊之間的互相影響』之上;但相對之下,同場競賽的運動與非同場競賽 的運動項目比較起來,前者更是直接的受到雙方實力與臨場表現的互相影響, 所以非贏即輸的比賽系統下所產生的競賽資料,嚴重的違反了統計中 i.i.d (identically independent distributed,各隨機變數間分配相同且獨立)的假設。 即使是最簡單的 T 考驗也無法在這樣的情境下被使用,造成了統計推論上的困 難。. 貳、各隨機變數分配相同且獨立 i.i.d(identically independent distributed,各隨機變數間分配相同且獨立)是 統計中常用的假設,i.i.d 這樣的性質在機率論與統計學被廣泛的使用。在機率 論或統計學中,若一個序列或用其他型態收集的一組觀測值(隨機變數)具有 i.i.d 的性質,表示其每個觀測值(或稱隨機變數)必頇是互相獨立的,且有相 同的機率分配;『各隨機變數間分配相同且獨立』的假設有兩個優點,第一是 在觀測值彼此之間互相獨立前提下,能確定檢定觀測值之間的差異,不是因為 互相影響而造成;第二是觀測值的可交換性(Exchangeable);換句話說,如果 遺失了某筆資料,可以再到母體中,任意抽取一個樣本來取代該筆資料,因為 8.

(15) 該筆資料與其他資料之間是相互獨立的,且機率分配相等,所以它的存在與否, 不會影響到其他資料。假設或要求觀測值為 i.i.d,使得資料收集過程,或是比 較在不同群體之間的差異時,在統計推論上是非常簡易且容易了解的。然而, 在統計模型的實例應用中,i.i.d 的假設情況可能為真,或是非真實的狀態。 而運動競賽所產生的資料在統計的意義上顯然是違背了 i.i.d 的基本假設, 因為『觀測值』即為不同選手或隊伍的競賽成績,而一個選手或隊伍的競賽表 現被其餘的不同對手影響著,所以『觀測值』屬於非彼此獨立的狀態,而不同 的觀測值之間的互相影響在非贏即輸的同場競賽運動更是直接;另外,『觀測 值』是不能被交換的,因為實際上選手在每次比賽中遇上不同的對手時,完全 無法用先前與看似能力相同的對手的比賽結果,來推測該場比賽的勝負。所以 i.i.d 的統計假設,似乎不適合用來分析運動競賽的資料。 關於運動競賽與 i.i.d 之間的爭論,已經有文獻提出討論,例如 Klaassen 在 2001 年的文獻中提到,網球比賽中,贏得前一次得分對於要贏得這次的得分, 有著正面的影響;要贏得關鍵分數(例如:賽末點)比非關鍵分數還要困難。 另外,實力較弱的選手比實力強的選手還要容易違反 i.i.d 的假設,還有,雖然 在統計上有足夠證據顯示網球前後得分之間的關係已背離 i.i.d 的假設,但不是 非常的明顯。 在運動競賽的資料型態與背景下,為了描述或比較不同選手的強度或特性, 以及彼此之間的關聯性,需要一種統計方法,可以在個體間彼此具有強烈的相 關性下進行分析;這樣的條件下,網絡分析(Network Analysis)似乎是較適當 的方法。. 9.

(16) 第四節. 網絡分析(Network Analysis). 壹、網絡分析的簡介與使用動機 網絡是許多不同元素之間具有某種連結的一種系統(Wasserman, 1994), 網絡分析的目的為用來探索不同個體之間的關係與連結,以及尋找由不同個體 形成的網絡中,最重要的部分或特徵。網絡分析已應用在相當廣泛的學科當中, 例如:社會學、經濟學、生物學、電腦科學、人類學、醫學等等,特別是社會 科學領域,將個人、族群、組織或國家等等視為不同的個體,衍生出社會網絡 (social network)的概念;因此,在網絡分析這樣的關鍵技術導入後,社會網 絡分析(social network analysis)變成流行的研究議題。社會網絡分析主要是研 究社會各實體之間的關係連結以及這些連結關係的模式、結構與功能。社會網 絡分析同時亦可用來探討社群中個體之間的關係以及由各提間關係所形成的結 構以及其意涵(吳齊殷、莊庭瑞,2004)。網絡資料具有複雜的特徵,他們不 是由獨立的觀測值所構成的,一條連結的發生,創造或終止,高度的依賴著其 他連結的存在(Snijders, 2008)。 換而言之,職業運動選手或球隊可視為一個單獨的個體,選手或球隊之間 的競賽為彼此的連結,比賽結果就為彼此的關係,而整個競賽或職業聯盟包含 了許多的選手或球隊,所有不同的選手或球隊都會依賽程經歷許多競賽,這樣 複雜且具有強烈相關的連結關係,便可視為一個網絡。因此,將網絡分析應用 在職業運動的競賽資料上,是可行的且有意義的。 另外,網絡的資料具有不可取代性,換而言之,在每筆資料都有不同程度 的相關下,如果失去了某筆資料,等於是破壞了整個網絡的結構,對整個網絡 的影響是無法預估的。 因此,本研究將採用網絡分析的方式,應用在職業女子網球的競賽資料上, 來分析運動競賽這樣有高度內在關聯的資料型態,網絡分析為分析不同個體的 10.

(17) 關聯性提供了一個好的界面。而網絡分析的新趨勢不在於注意某個體的行為, 是在於為了發現整體的網絡規律與連結的法則,而宏觀整個網絡的特性與統計 性質。在這個前提下,職業運動的競賽資料成為最佳的資料來源(Radicchi, 2011)。 本研究因而將網絡分析應用在女子職業網球的體育競賽中。研究者將球員或球 隊視為不同的『個體』,以比賽結果視為個體之間的『連結』,來觀察選手彼 此之間的『關係』,整個競賽聯盟即成為一個『網絡』,除了能關心單一位選手 的表現外,還能觀察選手之間的對抗所產生的勝負消長,以及整個網絡的趨勢 和特徵。. 貳、網絡的呈現方式 使用圖(graph)來呈現網絡是一個直覺且直接的方法,而網絡分析與圖論 (Graph Theory)有著相當密切的關係。圖論,即是用來描述有關『點與點之間 連結』所形成的圖案。最簡單的圖論概念,是談論那些構成一個圖所用到的『個 別的點與線』的性質,而這些點與線組成逐漸擴張的區塊,變成圖形結構上更 複雜的部分(Scott, 2006)。至於為什麼使用圖論來表示網絡?基於社會網絡分 析的觀點有以下三點(Wasserman, 1994): 一、圖論提供一個使用範圍能使用標記或表示出許多社會架構的特質。 二、圖論對於許多能被量化或測量的性質能給與研究者關於數學性質的操 作和想法。 三、在給予這些使用範圍和數學性質後,圖論給與研究者利用圖來證明理論的 能力,藉此表達社會架構的特徵。 圖論的概念,與網絡分析的資料表示型態不謀而合,圖論中關於圖的定義, 表示一個圖必頇包含三個部分,頂點的集合(Vertex set) ,邊的集合(Edge set), 以及結合兩個頂點與一個邊的一種關係,稱之為終點(endpoints) (West, 2000)。 而圖論中的頂點與邊,在圖案上可用點(point)跟線(line)來表示,終點指的 11.

(18) 便是兩點之間用一條線相連起來的圖。在網絡分析中,可以使用同樣的概念, 將資料圖像化;用『點』表示不同的個體,稱為節點(Node),用『線』來連 接不同的點,來辨認不同點之間的關聯,稱為連結(Tie),點與線連結起來, 在網絡中便可表示了兩點之間的關係(Relationship)。. 表 1 圖論與網絡分析的相關表示法 圖案的表示 ●. ●. ●. 圖論. 網絡分析. Vertex. Node. Edge. Tie. Endpoint. Relationship. 圖論在社會網絡分析中,其中一種最主要的功用是在網絡中辨識出最重要 的個體(Wasserman, 1994)。這與網絡分析的目的相符合,所以,用將網絡圖 像化,可協助研究者直覺的觀察網絡中的個體,連結和網絡架構的特性。. 參、網絡分析中的測量指標 間單來說,一個網絡裡,含有節點、連結、與彼此之間的關係,這些元素 必頇被觀察與測量,成為網絡分析中的不同的測量指標,以下本研究將回顧在 文獻中,以及在以往的研究中常使用的網絡測量指標。. 一、無方向性(undirected)與有方向性(directed)的網絡 節點之間的連結在網絡分析中有兩種表示方法,分別是無方向性的連結, 與有方向性的連結。無方向性的網絡中,只關心節點之間的連結是否有出現, 而有方向性的網絡中,除了注意連結是否有出現外,還頇關心分別為起點與終 點的節點,是有方向性的傳遞關係,在網絡的圖示上,常使用連結線上的箭頭 12.

(19) (arrowhead)指向來表示關係的方向(如圖 1),例如行動電話的撥出與接聽,網 站的連結或公司之間的貿易。. 圖 1 無方向性與有方向性的網絡. 二、連結度(Degree) 兩個點被一條線連接起來,可說成此兩點彼此『相鄰』(adjacent)。 相 鄰是圖形理論上的表示方法,由彼此直接相關或直接連結的點來表示。某個點 與其他特定的點相鄰可稱為彼此有鄰近關係(neighborhood),而該點所有鄰近 關係的數量,便稱為 degree,嚴格來說,應稱為連結度(degree of connection), 簡單來說,就是節點本身的連結數量(如圖 2)。. 圖 2 不同連結度(連結數量)的節點. 13.

(20) 依連結的方向性,又可以分成內連結度(in-degree)與外連結度(out-degree) 兩種(如圖 3),內連結度指的是由其他的節點指向本身的連結數量,外連結度則 相反,指的是由該節點指向其他節點的連結數量。內連結度越高,表是本身收 到其他參與者的回應越多,外連結度越高,表示本身主動與其他參與者產生的 互動越多(張淳矞,2009)。. 圖 3 外連結與內連結. 三、未加權性(unweighted)與加權性(weighted)網絡 在所有的真實網絡裡,並非所有的連結都具有相同的能力,其實連結常常 伴隨著權重(weight) ,來區別這些連結的實力、強度或能力(Barrat et al., 2004) 。 網絡分析的圖示中,常在連結上標示數字代表該連結的次數,能表現出不同連 結的強度(如圖 4)。例如,個人行動電話的撥出與接收,其中根據不同的對象次 數與方向性皆不同,與親戚朋友的電話往來比較頻繁,而偶爾才會接收或撥出 給其他較不相關的對象,例如廣告業務或客服中心等。. 14.

(21) 圖 4 無加權性的網絡與有加權性的網絡. 四、中心性(Centrality) 關於中心性,在社會學計量中最直接的原始概念稱為『明星』,例如在群體 中,最受歡迎的一個人,或是總是受到其他人注意或成為眾人注目焦點的人(Scott, 2006),中心性在網絡分析中代表的意義,為某個體的連結狀況,比網絡中其他 的個體更特別的引人注目時,便被認為是在網絡中的一個突出個體(prominent actor) ,突出的個體廣泛的參與了與其他個體的關係(Wasserman, 1994) ,而這樣 的關係,表示該個體在網絡中佔據重要的地位。所以中心性表示該節點在網絡中 的重要程度。中心性的種類有以下幾類,分為程度中心性(Degree Centrality) 、 接近中心性(Closeness Centrality)和居間中心性(Betweenness Centrality)。. (一)、程度中心性(Degree centrality). 程度中心性為節點本身的連結數除以網絡中其他節點的數量,表示該節點的 對於網絡的影響範圍的大小,對網絡來說表示該節點接近網絡中心的程度,節點 的連結數越高,中心性也越高,在網絡中即扮演重要的角色,若節點的連結數越 低,表示該節點中心性越低,為網絡中位於較邊緣的區域或扮演不重要的角色。 (二)、接近中心性(Closeness Centrality). 接近中心性為該節點本身與網絡中其他節點距離總合的長短,所以,距離總 和越短,表示該節點與其他節點接近的程度越高,能越快產生交互作用,概念為 15.

(22) 該個體是否能快速的與其他個體交互作用的程度。 (三)、居間中心性(Betweenness Centrality). 網絡中兩個不相鄰節點的最短路徑中,經過某特定節點的比例,由於該節點 能控制兩個節點之間的交互作用,網絡中以居間中心性表示該特定節點的重要性。 以交通為例,旅客必頇要到本地的車站搭車,才能到其他車站去,本地的車站在 交通運輸中就扮演了十分重要的角色。. 肆、聲望(Prestige) 中心性跟聲望都能用來測量在網絡中重要或突出角色。顯然聲望比起中心 性來說,是個更精確的概念,且不是總是能被測量的(Wasserman, 1994)。 聲望的最簡單的概念為在網絡中『有聲望的個體』往往會收到許多來自其 他個體的提名與選擇。有聲望的角色被定義為該角色為網絡中參與廣泛連結的 個體,但該角色專注的扮演『接收者』 。所以聲望的測量必頇以有方向性的網絡 為基礎,且焦點放在節點接收到的連結數,也就是內連結度之上;該節點的接 收到的連結數越多,也就是內連結度越高,在網絡中的聲望也越高,此部分與 中心性十分雷同。 但聲望的概念不傴是如此,對於網絡中的個體來說,聲望與內連結度的不 同,在於有聲望的個體,除了是由於其他個體的選擇或提名而產生的之外,該 個體本身的外連結選擇也必頇具有聲望;也就是說,這些通常接收其他外來連 結,導致內連結度很高的節點,一旦要從自身發出連結到其他目標節點時,該 目標節點也將債向為一個連結度很高的節點(如圖 5)。 在網絡中,若某個體的影響區域充滿著有聲望的個體,該個體的聲望也會 變高,但如果個體的影響區域傴在周邊,或是不太重要,該個體的聲望排名一 定不高(Wasserman, 1994)。還有,如果某個體接收到高排名個體的選擇,其. 16.

(23) 聲望排名就會增加。例如,一篇好的學術文章,不應該單單只是考慮其被引用 數的多寡,而更可以考慮該文章是否被其他著名的文章引用(Radicchi, 2011)。. 圖 5 聲望的概念圖. 伍、無尺度網絡現象 無尺度網絡(Scale-Free Network)的現象是由Barabasi 以及Albert兩位學者 在1998年所提出,內容指的是在一個網絡系統中,能發現兩個重要的事實,即為 成長與擇優連結(growth & preferential attachment)的兩種現象。網絡的規模由於 新節點的加入而擴大,稱為成長(growth)。而在原網絡中具有較良好連結的節 點,會更容易吸收到新節點的連結,稱為擇優連結(preferential attachment)。舉 例來說,若節點A的連結數是結點B的兩倍,則一個新節點連結到結點A的機率就 會是連結到結點B的兩倍,這是就是網絡結構中,節點的一種擇優連結的行為。 這種行為會造成網絡中,某些原本較少數且具有優良連結的節點,經由網絡的擴 張而獲得更多的連結數,遠遠超過其餘的節點(如圖6),而產生『無尺度』的 現象。. 17.

(24) 圖 6 無尺度網絡示意圖 『無尺度』的現象就像是在茫茫人海中,突然出現若干身高數百米巨人一樣 令人吃驚;巨人的身高之大,已不能用普通人高度的尺度來度量(蔡文翊,2007)。 在許多真實世界的網絡中,皆能發現成長與擇優連結這兩個重要的事實,例如網 際網路(WWW),友誼關係(friendship),皆隨著時間成長;每天都會有新的 網頁被放到網路上,每天都有某人結交新朋友。一個新網站中比起放入其他私人 網頁的連結,更債向於插入像google這樣知名的網頁,某些已經有許多朋友的人, 比起朋友較少的人,更容易認識新朋友,這些都是擇優連結的例子。在這些自然 狀態下,以網絡的觀點來看,某些已被高度連結的節點比起少數連結的節點更常 被連結,也稱為富者越富(the rich get richer)的現象(Brandes, & Erlebach, 2005). 真實世界中的確具有這樣無尺度網絡的性質,在這樣的性質下,本研究推論,連 結狀況好的節點有如實力較強的選手,更有可能得到新的連結,也就是獲得勝利, 而原本連結狀況較差的節點有如實力較差的選手,能獲得新連結的機會可能會持 續的偏低。. 18.

(25) 陸、結構洞 結構洞的概念由Burt在1992年所提出,內容跟居間中心性類似,此重要概念 在網絡分析的研究中經常的被引用與討論,在社會網絡的層次中,其實是由許多 子團體,在大量的團體內互動與少量的團體間互動的情況下所構成,而位居不同 團體間橋梁的重要角色,便是處在結構洞的位置上(李宗榮、吳齊殷,2009)。 簡單來說,在有結構洞性質的網絡中,重要個體在該網絡中的重要性不是因為其 連結度高,而是因為其位居重要的位置,這樣的位置通常位於不同團體之間的連 結路徑上,也就是連結的重要性,與一般強調連結度多寡的「程度中心性」有所 不同。 網絡分析的理論中,結構洞的概念恰好與無尺度網絡現象互相對應,無尺度 網絡指的是網絡中強勢的角色,更容易接受到更多新的連結,而結構洞的概念表 示,個體的重要性不是依據連結度的多寡,而是連結度的重要性。 在結構洞理論的性質下,本研究推論,在女子職業選手對戰紀錄所構成的網 絡中,位於「結構洞」位置的選手,應該具有擅長擊敗優秀選手的特質,也就是 從較強的選手身上取得連結;雖然戰績同為一勝,但比賽內容與強度比起其餘的 比賽還要更高。而結構洞理論,與先前提到的「聲望」指標互相呼應,皆是以是 否接受重要的聯結為判定優劣的指標,也較符合本研究依據聲望這項指標排名的 概念。. 柒、本研究的網絡 綜合以上網絡結構的指標,本研究所採用的職業女子網球競賽資料,依網 絡分析的表示方法,是將每位選手視為節點(node) ,將單打比賽看成兩位選手 的一個基本連結(tie) 。假設目前有兩位選手,i 選手與 j 選手。每次當 i 選手與 j 選手進行單打比賽,且 i 選手贏了 j 選手,在網絡中便可以畫出一條(一個單 位)有方向性(directed)的連結從節點 j 到結點 i,表示 j 選手輸給了 i 選手。 19.

(26) 網絡的表示採用了加權(weighted)的連結方式,也就是每個節點接受或發出 的連結不傴只有單次(一位選手可能贏或輸給某位選手許多次) ,節點本身可以 接受許多朝自身方向的聯結(贏了許多對手的球員),在網絡中稱為內連結度 (in-degree) ,也可以從自身發出連結向外擴散(輸給了其他不同的球員) ,便 是所謂的外連結度(out-degree)。例如,若 i 選手贏了更多其他不同的選手,i 選手本身這個節點就會接受到來自其他選手的連結;j 選手輸給其他不同選手時, 也從本身發出連結到其他曾贏過他的選手身上,這些有方向且有加權的連結, 構成了一個女子職業網球競賽的網絡。網絡分析可以涵蓋的資料範圍靈活,能 運用不同特定條件的資料構成網絡,分別用特定的時段(例如 90 年代)、場地 (例如草地球場)或對象(例如史上所有 WTA 的冠軍)等等條件來構成不同 的網絡是可行的,使得分析更加多元化。 將網絡圖像化是一種直覺的方式,可以藉由將網絡繪製成網絡圖,來了解 整個網絡的連結狀況與結構,WTA 提供的職業女子選手間單打對戰資料也能使 用這樣的網絡圖來表示;圖 7 為曾拿過 WTA 排名冠軍的 20 名女選手之間的所 有對戰紀錄所構成網絡圖;. 圖 7 曾奪得 WTA 冠軍的 20 位女子選手之間構成的對戰網絡圖 20.

(27) 在網絡分析中,常常會將整個網絡圖像化(視覺化),將研究議題所關心 的個體(人、族群、組織或國家)當成節點,用點來表示;節點之間的連結與 關係用兩節點之間的線段連結作表示。但網絡分析所關心的節點常常數量眾多, 且彼此之間的連結量也十分龐大,因此在有限的空間中,將整個網絡視覺化, 會產生非常非常複雜的網絡圖,且常常難以判讀;如上圖,在考慮網絡中具有 加權性以及方向性的連結下,由 20 名頂尖職業女子選手所構成的網路已如此複 雜,而本研究關心的議題為跨年代將女子網球選手排名,歷年來參加的女子選 手眾多,彼此的對戰組合更是數量龐大,若將其圖像化,很難在如此複雜的網 絡圖中,觀察網絡的型態與結構更是困難,更何況是利用網絡分析的理論或指 標,找出關鍵的個體;這是網絡分析中,將大量資料圖像化常常面臨的問題 。 所以,若要將大量的資料納入網絡分析中,需要一種特定網絡指標,來找出網 絡中重要的個體。 而由於真實網路中會產生無尺度網絡的現象,網絡中特別的突出的這些頂 尖選手,極有可能是具有 GOAT 資格的選手們,因為這些常被討論且認為是排 名頂尖的選手們,就像是無尺度網路中的那些有良好連結的強勢節點,她們的 網球實力較強,取得勝場(獲得連結)的機會較其餘的選手要高,隨著時間, 這些選手們(節點)累積了更多的勝場數(內連結度),所以,是否使用內連 結度的高低,也就是「程度中心性」這個指標就能找出這些頂尖選手? 本研究 認為這樣的推論還不夠嚴謹,因為如果在網絡中,發現兩個或兩個以上具有相 同內連結度的個體時,如何判定哪個才是網絡中最重要的個體? 網絡分析中,中心性與聲望兩種指標都可以協助研究者找到網絡中最重要 的個體,但聲望的概念顯然更適用於網球選手之間的能力比較。排名較前或實 力較強的職業網球選手,因為贏了許多不同的選手,在網絡中,表示吸收了許 多指向自己的連結,此時內連結度會很高,能將其視為聲望(Prestige)較高的 21.

(28) 選手,當這些選手不幸輸球,在網絡中,必頇由自身發出連結到其他選手身上 時,這樣的連結傴會債向發到那些同樣具有實力的選手身上,也就是說,頂尖 的選手輸給與自己同等級或是更強選手的機會較高。然而,聲望的概念不傴如 此;若一位排名低或較不知名的選手,擊敗了聲望較高的選手,其知名程度也 會增加。所以選手的聲望,不傴是在於擊敗了多少數量的選手,也考慮到擊敗 選手的品質,擊敗越強的選手,即使數量不多,也表示著本身具有相當的實力, 聲望的排名也會提高,這樣的概念也與結構洞理論互相對應。 因此,本研究將試圖使用網絡分析中「聲望」這個指標,來比較這些「收 集許多連結」的優秀選手們,並且將她們排名。. 22.

(29) 第三章. 研究方法. 本章將介紹基於緒論與文獻探討之後,本研究的研究方法,包含了研究程 序,資料的來源與處理,職業網球競賽資料的轉換方式,以及擴散性演算法與 聲望值的內容與細節。. 第一節 研究程序 本研究的程序將會先收集女子職業網球選手在從1968年至2010年,歷年所有 大滿貫單打競賽資料,再採用Radicchi在2011年發展的一種適用於網絡分析的擴 散型演算法,此種擴散型演算法提供了一個重要的指標稱為聲望值 (prestige score),能將所有曾經參加過四大公開賽的職業女子選手依據此聲望值的高低做 排名,試圖找出大滿貫賽中史上最佳的女子職業網球選手,最後,再與網球歷史 紀錄來做比較。. 第二節 資料來源與處理 壹、 實驗資料 本研究收集了從 1968 年到 2010 年,女子職業選手在最具代表性的大滿貫賽事 中 所 有 的 單 打 對 戰 資 料 。 資 料 來 源 為 職 業 女 子 網 球 協 會 ( WTA, www.wtatennis.com)與國際網球聯合會(ITF, www.itftennis.com)的網站;這 兩個網站皆有提供自開放年代開始以來(1968 年起),所有大滿貫賽事的對戰 簽表;本研究的資料涵蓋範圍共有 43 個年份(1968~2010) ,1710 位職業女子 網球選手,172 個大滿貫賽事,以及 18156 場的對戰紀錄。. 23.

(30) 貳、大滿貫對戰簽表資料轉換 從 WTA 與 ITF 的網站下載的資料型態為每場大滿貫賽的選手對戰簽表 (Draws) ,這樣的資料型態必頇轉換成矩陣的型態,才能清楚利用轉換後矩陣 中的數值,清楚的觀察每位不同選手之間的勝敗紀錄所產生的網絡連結狀況, 以及大略的網絡結構,方便做資料分析。 圖 8 以 2010 年美國公開賽前八強選手對戰簽表為例,將此前八強選手的對 戰紀錄轉換成矩陣;在該矩陣中,每位選手擁有直行的與橫列的資料區,左上 到右下的對角線元素均為 0(因為選手不會與自身對戰) ,從每個選手所屬的直 行看下來,出現的數字表示擊敗該對應橫列的選手次數,矩陣中的數字為 1, 代表該對應橫列的選手,輸給該對應直行的選手 1 次,例如冠軍選手 Kim Clijsters,自八強賽開始,分別擊敗了 Samantha Stosur、Venus Williams 和 Vera Zvonareva 三位選手,才獲得冠軍;在網絡分析的意義上,表示這三位選手在網 絡中,各自傳送了一次有方向性的連結給 Kim Clijsters。 在同一場職業網球公開賽中,由於是嚴格的單敗淘汰賽制,不同的選手只 會對上一次,但當史上所有公開賽場次的資料集合起來之後,不同選手之間的 對戰就不傴一次,也就是不同選手間傳送的連結次數不傴一次,這便是加權性 的網絡連結方式。本研究將 1968 年到 2010 年歷年來所有參加四大公開賽的女 子職業選手對戰簽表轉換成對戰矩陣,再將這些矩陣資料加以整理與分析。. 24.

(31) WOZNIACKI. CIBULKOVA. KANEPI. ZVONAREVA. SCHIAVONE. WILLIAMS. STOSUR. CLIJSTERS. WOZNIACKI. 0. 0. 0. 1. 0. 0. 0. 0. CIBULKOVA. 1. 0. 0. 0. 0. 0. 0. 0. KANEPI. 0. 0. 0. 1. 0. 0. 0. 0. ZVONAREVA. 0. 0. 0. 0. 0. 0. 0. 1. SCHIAVONE. 0. 0. 0. 0. 0. 1. 0. 0. WILLIAMS. 0. 0. 0. 0. 0. 0. 0. 1. STOSUR. 0. 0. 0. 0. 0. 0. 0. 1. CLIJSTERS. 0. 0. 0. 0. 0. 0. 0. 0. 圖 8 網球對戰簽表與選手對戰矩陣的轉換方式. 25.

(32) 第二節 擴散性演算法與聲望值 Radicchi在2011年的研究中,認為每位網球選手皆有其聲望值,提出了一種 擴散性演算法,與用來將網際網路上的網頁做排名的PageRank (Brin, & Page, 1998)演算法類似。Radicchi提出擴散性演算法如下:. (. ). 公式1中, 代表整個競賽網絡中,總共有 位選手,其中所有的選手 ,表示所有從結點 敗場數總和;. 的發出的外連結數總和,也就是. (公式1). ; 這位選手的. 是一個調節係數,介於0到1之間,本研究的 q 值設定為0.15,. 這個值是源自於PageRank的演算法。 在PageRank演算法中表示,網路使用者在不同網頁的連結中持續前進(從不 點選回上一頁),達到瀏覽目的後停止,或是直到連結到一個無向外連結的網頁 或令人感到無趣的網頁,有85%的機會(. = 0.85),使用者將會再從一個隨. 機的網頁開始瀏覽(Brin, & Page, 1998)。 本研究網球選手所構成的網絡中,連結的擴散行為也有可能到達一個從未發 出外連結的選手,也就是為因傷痛而退出比賽,在對戰紀錄中使對方直接晉級, 實際上未曾輸給對手的選手時,可以因為. 這個控制參數,從這種未具有外連. 結的節點身上,再將連結傳送出去,繼續整個網絡的擴散流程。最終, 即為 i 選 手的聲望值,是一個與整體的網球聲望相比的分數;由於 為一個機率函數,所 以. (總和機率為1)。. 26.

(33) 接著本研究將公式1擴散性演算法的公式拆解成三個部分(公式2、公式3與 公式4),仔細的探討該演算法在網絡分析中的擴散效果,前半段的公式如下: (公式2) 公式2中的. 表示在所有從結點. 句話說,這個比例表示. 選手從. 擴散的連結中,連結到節點. 的比例,換. 選手身上所有擴散出去的連結中所取得的連. 結比例,此階段表示該選手的聲望值在網絡的擴散過程中所獲得的部分分數。 接下來中段的公式3,此步驟為將調節係數. 平均分配給每個節點。 (公式3). 最後段為公式 4,這個部分在處理若遇到完全沒有外連結的節點時,由於 節點間擴散的程序可能因此終止,當遇到這樣的狀況時,將 (. )的值指定. 為 1(若無此狀況的話維持為 0)。. (. ). (公式4). 在演算法中可發現, 選手的聲望值必頇要依賴的網絡中其餘選手的聲望 值的參與才能計算出來,這表示擴散性演算法需要不停迭代(iterative),所以 必頇將不同節點的連結轉換成資料矩陣,尋求正規化矩陣(normalized Matrix) 的主要特徵向量(principal eigenvector)(Brin, & Page, 1998)。 此種擴散性演算法的重點在於藉由整個網絡連結的擴散行為來測量個體的 連結度(Radicchi, 2011),本研究將女子網球選手對戰簽表所轉換成的對戰矩 陣,利用此演算法,來求得所有選手的排名。. 27.

(34) 第四章. 研究結果. 本章將呈現將史上所有參與大滿貫賽的女子選手納入同一網絡中後,根據 擴散性演算法所產生的聲望值的高低,所產生的跨年代排名結果,以及從排名 與網球競賽記錄發現的新觀點,接著,此排名結果將會與歷史記錄做比較。. 第一節 職業女子網球選手聲望值排名 根據本研究所採用的網球聲望值排名系統,表 2 列出了史上所有大滿貫比 賽所包含的女子選手排名的前三十名選手,以及其所對應的聲望值做為參考。 此三十位選手中,傴有七位選手未拿過大滿貫賽的冠軍;排名結果表示, Martina Navratilova 為大滿貫賽事史上最佳的職業女子網球選手。理由可能歸因 於 Martina Navratilova 維持著非常長時間,且勝場數多與勝率高的職業生涯。 依聲望值的排名可以發現,排名史上前三的選手,聲望值明顯的比第四名 與以後的選手高出許多,所以能推論,此三位選手(Martina Navratilova, Chris Evert & Steffi Graf)為網絡中最突出的個體,以實際情況來描述,能推論此三位選. 手為大滿貫賽中表現最佳的選手。 值得注意的選手還有排名第五的西班牙女將 Arantxa Sánchez Vicario,雖然 傴拿過四次大滿貫賽的冠軍,但她分別在 1989 年的法國網球公開賽以及 1994 年的美國公開賽都擊敗了聲望值史上排名第三的 Steffi Graf,這是她在擁有較少 的冠軍獎杯,卻能在聲望值排名系統獲得較高名次的原因之一。 另外,排名第四與排名第六,目前在女子職業網壇之中極負盛名的 Venus Williams 與 Serena Williams,Venus Williams 雖然拿下的冠軍次數比 Serena Williams 還少,但因為生涯起步稍為較早,較有機會擊敗具有實績的球星,所 以聲望值排名較前;Serena Williams 雖然擁有較多的大滿貫冠軍,但她在大滿 貫賽中遇上的選手,屬於新生代或尚未擁有較高實績的選手的機會較高,所以 28.

(35) 整體聲望值排名會稍微低一些。排名前三十名雖有七名未擁有大滿貫賽的冠軍, 但她們在大滿貫賽事中,除了 Amanda Coetzer 外,其餘選手均挺進到過冠軍決 賽然後敗北,距離冠軍獎杯傴一步之遙。排名第二十七且擁有三個冠軍的 Maria Sharapova,雖然排名在這些選手的後面,但其職業生涯起步的早,目前仍然在 世界排名中名列前茅,未來聲望值排名還有持續上升的機會。. 29.

(36) 表 2 大滿貫賽事中史上網球聲望值排名 TOP 30 排名. 選手. 聲望值. 冠軍次數. 國籍. 起始年份 結束年份. 1. Martina Navratilova. 0.031597. 18. 美國. 1975. 2004. 2. Chris Evert. 0.030673. 18. 美國. 1971. 1989. 3. Steffi Graf. 0.027679. 22. 德國. 1983. 1999. 4. Venus Williams. 0.016687. 7. 美國. 1997. 2010. 5. Arantxa Sánchez Vicario. 0.016192. 4. 西班牙. 1987. 2002. 6. Serena Williams. 0.014919. 13. 美國. 1998. 2010. 7. Billie Jean King. 0.014845. 8. 美國. 1968. 1983. 8. Monica Seles. 0.014652. 9. 美國. 1989. 2003. 9. Lindsay Davenport. 0.013292. 3. 美國. 1991. 2008. 10 Margaret Court. 0.011873. 11. 澳洲. 1968. 1975. 11 Hana Mandlíková. 0.011842. 4. 澳洲. 1978. 1990. 12 Martina Hingis. 0.011272. 5. 瑞士. 1994. 2007. 13 Jennifer Capriati. 0.010349. 3. 美國. 1990. 2004. 14 Gabriela Sabatini. 0.009766. 1. 阿根廷. 1984. 1996. 15 Conchita Martínez. 0.008831. 1. 西班牙. 1988. 2005. 16 Kim Clijsters. 0.008720. 4. 比利時. 1999. 2010. 17 Jana Novotná. 0.008682. 1. 捷克. 1986. 1999. 18 Justine Henin. 0.008590. 7. 比利時. 1999. 2010. 19 Mary Pierce. 0.008583. 2. 法國. 1990. 2006. 20 Evonne Goolagong. 0.008102. 7. 澳洲. 1968. 1983. 21 Amélie Mauresmo. 0.007944. 2. 法國. 1995. 2009. 22 Virginia Wade. 0.006955. 3. 英國. 1968. 1985. 23 Zina Garrison. 0.006829. 0. 美國. 1980. 1996. 24 Wendy Turnbull. 0.006802. 0. 澳洲. 1970. 1989. 25 Helena Suková. 0.006494. 0. 捷克. 1981. 1998. 26 Pam Shriver. 0.005829. 0. 美國. 1978. 1996. 27 Maria Sharapova. 0.005751. 3. 俄羅斯. 2003. 2010. 28 Amanda Coetzer. 0.005677. 0. 南非. 1989. 2004. 29 Natasha Zvereva. 0.005569. 0. 白俄羅斯. 1987. 2002. 30 Nathalie Tauziat. 0.005184. 0. 法國. 1984. 2001. 30.

(37) 第二節 聲望值與歷史記錄的比較 職業網球的記錄中,冠軍次數與勝場數為最常拿來比較的資訊,本研究將 表 2 中聲望值史上排名前三十的選手勝場數做排名,將聲望值排名與勝場數排 名結合,來觀察這三十位頂尖選手聲望值與勝場數多寡的趨勢。. 30. ZVEREVA.N. 25. TAUZIAT.N. SHRIVER.P. SUKOVA.H. COETZER.A SHARAPOVA.M. TURNBULL.W GARRISON.Z. WADE.V MAURESMO.A. 20 NOVOTNA.J. 聲 望 15 值 排 名 10. MARTINEZ.C SABATINI.G HINGIS.M MANDLIKOVA.H DAVENPORT.L SELES.M. 0 0. 5. 10. CLIJSTERS.K CAPRIATI.J COURT.M. KING.B. WILLIAMS.S SANCHEZ-VICARIO.A WILLIAMS.V GRAF.S EVERT.C NAVRATILOVA.M. 5. GOOLAGONG.E. PIERCE.M HENIN.J. 15. 20. 25. 30. 勝場數排名. 圖 9 聲望值排名與勝場數排名的關係圖 圖 9 為聲望排名前三十名的選手以及其本身累積的勝場數排名的關係圖, 圖的中間有一條左下往右上的趨勢線,表示聲望值排名與勝場數排名的相對位 置,這條線將此三十位選手大略分成三種類型的選手。 第一類為被標記在趨勢線附近的選手,也就是聲望值排名與勝場數排名相 近的選手,這些選手的特性在於不論對手的實力為何,皆有一定的機會擊敗對 方;換句話說,即使對手的實力或名聲高過自己,還是有可能擊敗對手,所以 31.

(38) 當累積的勝場數越多,聲望值也相對的提高,在前三十名頂尖選手中,此類的 選手占了較多數。 第二類為被標記在偏向趨勢線左上方的選手,表示聲望值排名比大滿貫賽 勝場數排名還低,表示這類的選手實力維持的相當穩定,擊敗了許多比起自身 實力略遜的選手,或是職業生涯較長,累積了許多勝場數,但是在賽事中與較 強的選手交手時,獲勝的機率稍微偏低;或者是參與的賽事中,遇上了較強選 手提早淘汰,而面對較多看似名氣較低但實力卻堅強的選手,就會造成這樣的 狀況;圖表中較明顯的例子為 Helena Suková 。 第三類為被標記在偏向趨勢線右下方的選手,表示聲望值排名比大滿貫賽 勝場數排名還高,此類選手的特性為勝場數較少,或是職業生涯較短,但因為 為擊敗了較多名列前茅或實力堅強的選手,所以聲望值的排名會較高,選手本 身因本身實力成長較快,或球技較為成熟,在相對較短的時間內就成了有名氣 的選手。另外,圖表中 Billie Jean King、Chris Evert 和 Evonne Goolagong,這三 位選手的活躍年代與排名第一的 Martina Navratilova 為同一時期,她們都擊敗過 Martina Navratilova 而獲得大滿貫的冠軍,所以即使她們的勝場數排名整體相較 起來並不名列前茅,但聲望值排名卻大於勝場數排名許多。 最後,在附錄中列出了從 1968 年至 2010 年這 43 年的資料,分成四個十年, 分別結算出來的威望值排名列表前三十名,提供四個以十年為單位的不同年代 中,頂尖選手的威望值排名情形以供參考。. 32.

(39) 第五章. 結論與建議. 本章將在研究結論中,討論本研究達成的目標,與如何回應傳統比較方法 與複雜網絡的問題,以及跟文獻討論之間的連結;最後在未來建議裡,提供關 於本研究方法未來的改善方向與應用。. 第一節 研究結論 複雜的網絡難以使用圖像化來尋找網絡中重要的角色,本研究將龐大的職 業女子網球對戰資料做轉換,再採用的網絡分析中的擴散性演算法,同時考慮 整個網絡中節點的交互作用,將複雜且具有強烈相關性的接觸網絡加以分析, 利用聲望值的排名系統,來比較整個網球競賽所構成的網絡中,不同選手(個 體)對該網絡的重要程度,提供了一個網絡分析應用的實例。 網絡分析協助本研究中達成了三個目標,第一,在資料之間具有強烈關聯 性,也就非 i.i.d 的情況下進行分析,避免了一般統計推論的盲點。第二,將一 個涵蓋龐大資料量的網絡,利用聲望這個指標將網絡中的個體與連結進行分析, 轉換成能簡易判讀的個體排名列表,能快速的掌握網絡中的重要個體,以及其 影響網絡的程度。第三,當史上所有參與大滿貫賽的女子職業選手之間的對戰 資料被納入同一個網絡時,代表了此分析結果是跨越了所有時間,也就是所有 的選手能夠跨時間的同時被比較,避免了傳統的網球計分記錄,不能客觀的跨 時間比較的缺點。 本研究發現,女子職業網球選手聲望值的高低,雖然與勝場數有一定的關聯, 但是否能擊敗更優質的選手,為聲望值是否能增加,排名是否能上升的關鍵。所 以除了勝場數多寡之外,更需要考慮取得勝利的品質(Radicchi, 2011),換句話 說,擊敗的選手實力優劣,影響著聲望值的高低;另外,由於擊敗聲望值排名越 高的選手,自身的聲望值增加的越多,若是擊敗一位球技尚未成熟的選手,而該 33.

(40) 位選手逐漸成長,未來成為排名較高或聲望較高的頂尖選手時,在所有選手的對 戰組合都必頇同時考慮下,此項當時看似重要性不高的對戰紀錄,隨著時間的推 移,未來也會成為將自身聲望值提高的元素之一。 另外,本研究還發現選手特性與著名的網絡分析理論之間有些許的對應關係; 在本研究結果中,勝場數量多,但聲望排名不高的選手,偏向於無尺度網絡中強 勢角色的概念,也就是較容易接收到新的連結,以網球競賽的例子來說,該選手 的優點即為能容易的擊敗剛參加職業競賽,或是職業生涯剛起步的選手,而累積 勝場數。另外,聲望排名比勝場數排名高的選手,則偏向於結構洞理論中重要角 色的概念,指的是連結數不高,但這些連結均為重要聯結,也就是雖然勝場數較 少,但擅長擊敗實力堅強的選手,吸收來自重要選手的連結,雖然在歷史記錄的 勝場數部分,較不突出,但此類選手在本研究的排名系統裡較受到肯定。. 第二節 未來建議 本研究發現,聲望值排名較高的頂尖選手,大部分皆已完成其輝煌的職業 生涯,所以橫跨歷史上的排名,對於目前現役未完成生涯的選手並不公平;因 為這些現役的優秀選手,在未來的時間裡,還有持續提升戰績的機會,會擊敗 更多甚至更強的選手,威望值也會繼續升高,強化自身在歷史上的地位;若未 來能在演算法或在排名的評價上,設法增加現役優質選手的權重,將她們的評 價提升,在排名上會更顯公平。 由於網絡分析的靈活性,可根據不同的資料涵蓋範圍網絡,本研究的網絡 涵蓋範圍為參與大滿貫賽的女子職業網球選手,未來可根據研究者所需要的特 定條件來進行選手間聲望值的分析,例如針對特定的網球場地材質比賽的選手, 或特定國家的選手之間所構成的網絡加以分析,或是推廣至其餘具有非贏即輸 特性的職業運動加以分析,例如籃球比賽,棒球比賽等等的運動,尋求該特定. 34.

(41) 屬性的體育競賽網絡中,聲望值最高的選手或隊伍,再與該運動的其餘的歷史 紀錄做比較。 除了體育競賽所構成的網絡,未來本研究也能應用在其他具有強烈內在關 聯性的接觸網絡,例如網路社交網絡等,能依據網絡分析提供新的觀點,尋找 出網絡結構中最重要的個體或特質。. 35.

(42) 參考文獻 中文部分 吳齊殷、莊庭瑞(2004)。超連結網絡分析: 一項分析網路社會結構的新方法。 資訊社會研究, 6, 127-14。. 李宗榮、吳齊殷(2009)。探索青少年友誼網絡結構洞的成因與影響。台灣青少 年成長歷程研究第三次學術研討會,中央研究院。 張淳矞(2009)。以動態網絡分析探討網路社群口碑與購買態度之關係:以批踢 踢nb_shopping 板為例。 蔡文翊(2007)。小世界社會網絡演化模型:階段性需求於社交網絡拓樸動態的 影響。. 英文部分 Brandes, U., Erlebach, T. (2005). Network Analysis: Methodological Foundations(1st ed.). Germany, Berlin; New York, NY: Springer. Barrat, A., Barthelemy M., Pastor-Satorras R., Vespignani A. (2004) The architecture of complex weighted networks. Proc Natl Acad Sci USA 101: 3747–3752. Brin, S., Page, L. (1998). The anatomy of a large-scale hypertextual web search engine. Computer Networks & ISDN System, 30: 107–117. Barabási, A. L., Albert, R. (1999). Emergence of scaling in random networks, Science, 286, 509-512. Burt, Ronald S. 1992. Structural holes : the social structure of competition. Cambridge, Mass.: Harvard University Press. Klaassen, F.J.G.M. (2001). Are Points in Tennis Independent and Identically Distributed? Evidence From a Dynamic Binary Panel Data Model. Journal of the 36.

(43) American Statistical Association, 96: 500-509. Newman, M.E.J. (2003). The structure and function of complex networks. SIAM review, 45(2):167-256. Radicchi, F. (2011). Who Is the Best Player Ever? A Complex Network Analysis of the History of Professional Tennis. PLoS ONE, 6(2): e17249. doi:10.1371/journal.pone.0017249. Scott, J. (2006). Social Network Analysis: A Handbook (2nd ed.). London, England: Sage Publications Ltd. Wasserman, S. (1994). Social network analysis: methods and applications (1st ed.). New York, NY: Cambridge University Press. West, D. (2000). Introduction to graph theory (2nd ed.). New Jersey, NJ: Prentice Hall. 37.

(44) 附錄一 1968 年至 1980 年大滿貫賽聲望值排名前三十選手列表. 排名. 選手. 1. EVERT,C. 2. KING,B. 3. COURT,M. 4. GOOLAGONG,E. 5. WADE,V. 6. NAVRATILOVA,M. 7. CAWLEY,E. 8. RICHEY,N. 9. CASALS,R. 10. MELVILLE,K. 11. JONES,A. 12. AUSTIN,T. 13. JAUSOVEC,M. 14. STOVE,B. 15. MOROZOVA,O. 16. TURNBULL,W. 17. TEGART,J. 18. HELDMAN,J. 19. GOURLAY,H. 20. BUENO,M. 21. FROMHOLTZ,D. 22. CHANFREAU,G. 23. TEEGUARDEN,P. 24. DURR,F. 25. BOWREY,L. 26. BARKER,S. 27. RUZICI,V. 28. NIESSEN,H. 29. HUNT,L. 30. MANDLIKOVA,H. 38.

(45) 附錄二 1981 年至 1990 年大滿貫賽聲望值排名前三十選手列表. 排名. 選手. 1. NAVRATILOVA,M. 2. EVERT,C. 3. GRAF,S. 4. MANDLIKOVA,H. 5. GARRISON,Z. 6. SHRIVER,P. 7. SUKOVA,H. 8. KOHDE-KILSCH,C. 9. SABATINI,G. 10. HANIKA,S. 11. TURNBULL,W. 12. DURIE,J. 13. LINDQVIST,C. 14. SANCHEZ-VICARIO,A. 15. MALEEVA,K. 16. JORDAN,K. 17. FERNANDEZ,G. 18. AUSTIN,T. 19. JAEGER,A. 20. ZVEREVA,N. 21. HORVATH,K. 22. MCNEIL,L. 23. POTTER,B. 24. BASSETT,C. 25. TANVIER,C. 26. REGGI,R. 27. NOVOTNA,J. 28. MINTER,A. 29. MALEEVA-FRAGNIERE,M. 30. PORTMAN,J. 39.

(46) 附錄三 1991 年至 2000 年大滿貫賽聲望值排名前三十選手列表. 排名. 選手. 1. GRAF,S. 2. SANCHEZ-VICARIO,A. 3. SELES,M. 4. HINGIS,M. 5. DAVENPORT,L. 6. NOVOTNA,J. 7. PIERCE,M. 8. MARTINEZ,C. 9. SABATINI,G. 10. COETZER,A. 11. FERNANDEZ,M. 12. WILLIAMS,V. 13. TAUZIAT,N. 14. ZVEREVA,N. 15. HUBER,A. 16. CAPRIATI,J. 17. RUBIN,C. 18. MAJOLI,I. 19. SPIRLEA,I. 20. SCHNYDER,P. 21. LABAT,F. 22. DATE,K. 23. DECHAUME-BALLERET,A. 24. SAWAMATSU,N. 25. PITKOWSKI,S. 26. VAN ROOST,D. 27. MCNEIL,L. 28. APPELMANS,S. 29. HABSUDOVA,K. 30. HALARD,J. 40.

(47) 附錄四 2001 年至 2010 年大滿貫賽聲望值排名前三十選手列表. 排名. 選手. 1. WILLIAMS,S. 2. WILLIAMS,V. 3. HENIN,J. 4. CLIJSTERS,K. 5. MAURESMO,A. 6. DAVENPORT,L. 7. SHARAPOVA,M. 8. CAPRIATI,J. 9. PETROVA,N. 10. JANKOVIC,J. 11. KUZNETSOVA,S. 12. HANTUCHOVA,D. 13. DEMENTIEVA,E. 14. IVANOVIC,A. 15. ZVONAREVA,V. 16. SCHIAVONE,F. 17. HINGIS,M. 18. SUAREZ,P. 19. PIERCE,\M. 20. SAFINA,D. 21. STOSUR,S. 22. VAIDISOVA,N. 23. MATEVZIC,M. 24. SREBOTNIK,K. 25. LIKHOVTSEVA,E. 26. BARTOLI,M. 27. PENNETTA,F. 28. SELES,M. 29. DECHY,N. 30. SCHNYDER,P. 41.

(48)

參考文獻

相關文件

(一)除第二款另有規定,一律採網路報名。請於報名期間至文化部全球資 訊網

莊子美學中所呈現的「開放性系統」, 試圖來彌合菁英系統與庶民 系統之間的落差, 因為社會的穩定維繫於庶民教育體系的建立。毫

1.第52 屆造園景觀職類中區賽,經檢視技檢中心系統計有9組(18人),所需建置競賽場地為 9組,每組工作區為面寬300cm、縱深300cm、填土高度40公分,造園景觀競賽區內,土方

由於ICT是屬於發展中的產業,相對應的嶄新工作職務相應而生,2019年8月在俄

競賽使用白色乒乓球 10 個、黃色 乒乓球 10 個、及網球一個,作為 拾取物。場地上並設置三個集球

四、有關球員資格,須於賽前 20 分鐘提出,比賽結束後不得異議。如比賽中球員冒名違 規之申訴,得先以口頭提出申訴, 「拍照存證」

四、有關球員資格,頇於賽前 20 分鐘提出,比賽結束後不得異議。如比賽中球員冒名違規 之申訴,得先以口頭提出申訴, 「拍照存證」

路徑 I 是考慮空氣的阻擋效應所算出的運動路徑。球在真 空中的運動路徑 II 是以本章的方法計算出的。參考表 4-1 中的資料。 (取材自“ The Trajectory of a Fly Ball, ” by