賽局理論 (Game Theory),又稱為博弈理論或對策論,屬應用數學的一個分
支,目前廣泛應用於經濟學、軍事戰略及計算機科學。廣義來說,賽局理論主要 利用已公式化的數學模型來研究參與者間彼此競爭或合作的狀態。參與者間可能 各自具有不同的利益與目標,且每位參與者所做的決策也將影響其他人的利益,
因此為了使自己得到最佳的利益,各方必須考慮對手的各種可能行動方案,並力 圖選 取 對 自 己 最 有 利 或 最 為 合 理 的 決 策 。 其 中 一 個 著 名 的 例 子 是 囚 徒 困 境 (Prisoner’s Dilemma)。
警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據起訴兩人,於是警方將兩人分 開囚禁,並分別向兩人提出下列選擇:
招供吧!並作證指控另一名嫌犯,那麼你將被立即釋放。
如果你不招供但另一名嫌犯來指控你,那你將被判監十五年。
若你們兩個都不招供,警方仍有部分證據足以讓你們兩人各被判監一年。
若你們兩個都招供,則各判監五年。
由上述的選擇,我們可以歸納出表2.2。表格中的數對 (x, y)表示嫌犯甲、乙各需 服刑的年數。
表表
表表 2.2 囚囚囚囚徒困境徒困境徒困境徒困境
乙 乙 乙乙
招供 不招供 招供 (5, 5) (0, 15) 甲
甲甲 甲
不招供 (15, 0) (1, 1)
由表2.2得知最好的結果是甲、乙兩人都選擇不招供,那麼兩人都只需入獄一 年,然而,當甲在思考是否招供時,他會認為若選擇招供,則不論乙的選擇為何,
甲需服刑的年數都比不招供來得少,因此甲會選擇招供;同樣地,當乙在做決定
時也有相同的想法,最終將導致兩人都選擇招供,也就是兩人皆需服刑五年。然 而,這也就是個人理性 (Individual Rationality) 與團體理性 (Group Rationality) 的 衝突,當個別參與者都選擇對自己最有利的決策時,卻會使整體而言得到較差的 利益。因此,賽局理論就是在研究類似上述的例子中兩方的決策都將互相影響的 情況下,參與賽局的人所做的決策對個別參與者及整體將造成何種結局。
賽局 (Game) 是賽局理論中最重要的元件,而一個賽局是由下列三個部分所
組成:
參與者集合 (Player set):賽局中所有參與者所形成的集合,即囚徒困境中 的甲和乙。
策略集合 (Strategy set):賽局中參與者所有可選擇策略的集合,即囚徒困 境中的「招供」和「不招供」。
報酬函數 (Payoff function):表示參與者在賽局中所能得到之報酬,即囚 徒困境中嫌犯被判監的年數。在此例中,參與者將追求使報酬函數極小 化。在其它的例子中,通常是以極大化報酬函數為目的。
所有參與者所選擇的策略之清單稱為「策略組態」(Strategy Profile)。如囚徒 困境中共有(招供,招供)、(招供,不招供)、(不招供,招供)及(不招供,不招供) 等四種組態。若一個組態中每一個參與者皆無法單獨改變自己的策略而使本身獲 得更大之利益,則此組態稱為「納許平衡」(Nash Equilibrium; NE)。上例中的(招 供,招供)和(不招供,不招供)均為納許平衡組態。
賽局可根據其中的參與者是否為了共同目標或利益合作而分為合作賽局 (Cooperative Game)和非合作賽局 (Non-cooperative Game)。而非合作賽局又可根據 不同條件而分為下列幾種類型:
靜態賽局 (Static Game)
動態賽局 (Dynamic Game)
完全資訊賽局 (Complete-Information Game)
非完全資訊賽局 (Incomplete-Information Game)
零合賽局 (Zero Sum Game)
非零合賽局 (Non-zero Sum Game)
若一賽局中所有參與者同時決定策略,則此賽局即為靜態賽局;反之,若參 與者決定策略具有時間先後關係即稱為動態賽局。若賽局中參賽者知道自己及其 他參與者選擇任一個策略將造成什麼影響即為完全資訊賽局;反之即為非完全資 訊賽局。若賽局中有兩參與者A和B,且A所得到的利益都恰好為B的損失,也 就是兩方的損益相加為零,則此種類型的賽局即為零合賽局;若兩方損益相加不 為零則稱為非零合賽局。
賽局理論也被廣泛地應用在無線網路的研究上。Yongkang 等學者[13]提出 Fairness Game,用以改善802.11中DCF機制所引發的不公平現象。將彼此間存在
Session的 WS 視為同一群組,且群組內的WS 運行合作賽局,不同群組間的WS
則使用非合作賽局,並改變原有的Binary Exponential Backoff演算法,讓干擾較少 的群組獲得較多傳送機會,藉此提升網路效能。
Chen等學者[14]則是利用賽局理論來分析WLAN中WS如何調整自己的訊號 功率。如同2.1 節所提及,AP可經由調整本身訊號覆蓋範圍來達到負載的控制,
類似的作法,WS也可藉由增強訊號發射功率來提升與AP間的連線速率,而使系 統產出量上升,然而,此舉的代價是必須消耗較多電能,且當鄰近的 WS 也增強 訊號發射功率時會導致干擾程度增加。因此,Chen等學者提出Non-cooperative Rate
Control Game來分析 WS 彼此間使用不同訊號強度等級所造成的競爭,並討論當
此賽局達到納許平衡時是否為最佳狀態。
我們發現WS選擇AP的行為也可以用賽局理論來分析。若將系統中所有WS 視為賽局中的參與者集合,每個WS所能偵測到的AP則視為該WS的策略集合,
而報酬函數即為WS與AP聯結後所得之產出量。如此,我們即可以利用賽局理論 來分析無線基地台的聯結選擇機制。詳細內容將在第三章闡述。
第三章 第三章 第三章
第三章 無線基地台選擇賽局的分析與設計 無線基地台選擇賽局的分析與設計 無線基地台選擇賽局的分析與設計 無線基地台選擇賽局的分析與設計
如2.3節所提,賽局可分為合作賽局與非合作賽局。合作賽局中所有參與者在 一個具有約束力的協議下共同追求整體利益最佳化。例如藉由WS之間彼此協調,
使所有WS所選擇的AP未必能讓WS本身獲得最大產出量,但卻能使整體產出量 為最高。非合作賽局則是指參與者之間存在競爭關係,且每個參與者不在乎最終 整體利益為何,只力圖使本身獲得最佳報酬。在本章中,我們將針對非合作無線 基地台選擇賽局進行探討。