• 沒有找到結果。

社會網路對於合作行為演化的影響 - 使用反覆囚犯困局

N/A
N/A
Protected

Academic year: 2021

Share "社會網路對於合作行為演化的影響 - 使用反覆囚犯困局"

Copied!
55
0
0

加載中.... (立即查看全文)

全文

(1)

資訊科學與工程研究所

社 會 網 路 對 於 合 作 行 為 演 化 的 影 響

- 使 用 反 覆 囚 犯 困 局 模 型

Influence of Social Network on the Evolution of Cooperation –

using the Iterated Prisoner’s Dilemma

研 究 生:林東鴻

指導教授:孫春在 教授

(2)

社會網路對合作行為演化的影響-使用反覆囚犯困局

Influence of Social Network on the Evolution of Cooperation

– using the Iterated Prisoner’s Dilemma

研 究 生:林東鴻 Student:Tung-Hung Lin

指導教授:孫春在 Advisor:Chuen-Tsai Sun

國 立 交 通 大 學

資 訊 科 學 所

碩 士 論 文

A Thesis

Submitted to Institute of Computer and Information Science College of Electrical Engineering and Computer Science

National Chiao Tung University in partial Fulfillment of the Requirements

for the Degree of Master

in

Computer and Information Science Oct 2005

(3)

社會網路對於合作行為演化的影響

-使用反覆囚犯困局模型

學生:林東鴻 指導教授:孫春在 教授

國立交通大學資訊科學研究所

摘要

合作的行為不只出現在人類的社會當中,它在許多人工社會(多重代理人系 統)以及虛擬社會(線上遊戲)當中,同樣也扮演著重要的角色。在這些世界中, 大多數的個體皆為自利的個體,因此當他們在面臨追求本身的利益與維持群體的 利益時,便會面臨著一個兩難的抉擇。此時,個體合作行為的演化便是一個值得 我們去深入研究的問題。這個問題不只是電腦科學領域的學者感到興趣,也牽涉 到不少社會學、政治學、經濟學以及生態學等領域的範疇。 隨著社會的演進以及電腦技術的發達,不管是在真實社會、在人工社會或是 在虛擬社會中,我們不但觀察到各種不同型態的社會網路,其結構也越趨複雜。 因此,近年來也有許多學者將社會網路的觀念導入合作行為演化的研究中。在不 同的社會網路裡,對於整體的合作行為演化勢必會產生不同層面的影響。本論文 提出一個系統性的分析,讓往後想研究在不同社會網路中合作行為演化的學者, 對於其模型的社會網路內各種不同參數應如何設定,提供一個大概的方向。 關鍵字: 社會網路、合作行為演化、反覆囚犯困局模型

(4)

Influence of Social Network on the Evolution of

Cooperation-Using the Iterated Prisoner’s

Dilemma

Student: Tung-Hung Lin Advisor: Dr. Chuen-Tsai Sun

Institute of Computer and Information Science

National Chiao Tung University

ABSTRAT

The emergence of cooperation not only appears in the human societies, but also plays an important role in artificial societies (e.g., multi-agent systems) or virtual societies (e.g., on-line games). In these societies, most individuals are selfish, minding their own benefits. They will face a difficult choice while they encounter a situation to decide to seek their own benefits or to pursue the group benefits. Therefore, the evolution of cooperation has become an issue worthy for us to study. The evolution of cooperation has attracted not only the scholars in the field of computer science but also the scholars in the field of economics, political science, sociology, bionomics and so on.

Social networks have become varied and more complicated, not only in real societies but also the artificial societies or the virtual societies, along with the evolution of the societies themselves and the rapid development of the computer technology. Therefore, several scholars have introduced the concept of social networks into the research of the evolution of cooperation in recent years. Different social networks inevitably influence the evolution of cooperation of the entire society. In the thesis, a systemized analysis of how different social networks influence the evolution of the cooperation is proposed. We expect that these analyzed results to help the scholars in related fields to save modeling efforts on the detail setting of the social networks in their studies.

(5)

致謝

碩士班的生活很快的即將結束了,這也是我人生當中最後的一段學生生活, 對於即將進入人生下一個里程碑的我來說,是充滿期待又感到有點依依不捨的。 首先必須要感謝我們指導教授-孫春在教授,在這兩年當中您對我的教誨, 讓我在面臨各種問題時,都能夠以不同的觀察角度冷靜、客觀的分析,對於做學 問的態度上,也有了更深刻的體會。其次,要感謝我的學長們,對於我的論文所 付出的心力,尤其是黃崇源學長對於釐清我論文的關鍵問題上給了很大的幫助, 真的相當的感謝,對於其他實驗室的同學我也不會忘記我們在這兩年當中互相砥 礪、相互扶持所建立下來的深厚情誼,謝謝你們。 最後,當然要感謝我的家人給我的支持,是你們的鼓勵與愛護,帶給我繼續 努力的原動力,我會帶著更堅強的意志力,步向我人生的下一個目標的。

(6)

目錄

摘要 ... 1

ABSTRAT... 2

致謝 ... 3

目錄 ... 4

圖表目錄 ... 6

1

緒論... 8

1.1 研究動機...8 1.2 問題描述...9 1.3 研究重要性與方向... 11 1.4 論文架構...12

2

相關研究... 13

2.1 囚犯困局理論...13 2.1.1 囚犯困局的基本理論...13

2.1.2 反覆式囚犯困局(Iterated Prisoner’s Dilemma) ...15

2.2 社會網路...16

2.2.1 社會網路的基本分類...16

2.2.2 個體分支度的不同造成區域網路的差異...20

2.3 在社會網路上的囚犯困局模型...21

(7)

3.1 模型基本設定...24 3.2 個體的策略空間以及收益表...27 3.3 模型的社會網路...28 3.3.1 社會網路的基本設定...28 3.3.2 個體分支度的不同造成區域網路的差異...31 3.4 個體的適應程式...33 3.5 成果測量...34

4

實驗結果... 36

4.1 收益表內容的影響...38 4.2 平均分支度的改變...43 4.3 個體分支度的不同造成區域網路的差異...47

5

結論... 50

參考文獻 ... 51

(8)

圖表目錄

圖 2.1.1 收益表(Payoff Table) ...14 圖 2.2.1 一維正規網路示意圖...18 圖 2.2.2 一維的小世界網路...19 圖 2.2.3 一維的隨機網路,個體平均分支度為 2...20 圖 2.2.4 三種社會網路的分隔度以及群聚度的特性...20 圖 3.1.1 實驗流程圖...25 圖 3.2.1 收益表...27 圖 3.3.1 建構社會網路流程圖...29 圖 3.3.2 二維的正規網路...30 圖 3.3.3 二維的小世界網路...31 圖 3.3.4 無尺度網路示意圖...33 圖 4.1.1 在正規網路中,T 值對應的平均收益值曲線圖 ...39 圖 4.1.2 在小世界網路(SWN33)中,T 值對應的平均收益值曲線圖 ...39 圖 4.1.3 在小世界網路(SWN66)中,T 值對應的平均收益值曲線圖 ...40 圖 4.1.4 在隨機網路中,T 值對應的平均收益值曲線圖 ...40 圖 4.1.5 在正規網路中,T 值對應的比較圖表 ...41 圖 4.1.6 在小世界網路(SWN33)中,T 值對應的比較圖表 ...41 圖 4.1.7 在小世界網路(SWN66)中,T 值對應的比較圖表 ...41 圖 4.1.8 在隨機中,T 值對應的比較圖表 ...41 圖 4.1.9 當平 T 值由 3.6 增加至 5.4 時,社會網路對應的比較圖 ...41 圖 4.2.1 平均分支度為 12 時,平均收益值曲線圖...44 圖 4.2.2 平均分支度為 24 時,平均收益值曲線圖...44 圖 4.2.3 平均分支度為 12 時,社會網路對應的比較圖表...45

(9)

圖 4.2.5 當平均分支度由 12 變成 24 時,社會網路對應的比較圖表...45 圖 4.3.1 在小世界網路中,不同的捷徑設定方法對應的平均收益值曲線圖....47 圖 4.3.2 在隨機網路中,不同的捷徑設定方法對應的平均收益值曲線圖...48 圖 4.3.3 在小世界網路中,捷徑設定方法對應的比較圖表...48 圖 4.3.4 在隨機網路中,捷徑設定方法對應的比較圖表...48

(10)

1 緒論

1.1

研究動機

在以往的社會,如農村社會之中,我們只需要和自己的鄰居或村子內的人互 相合作,互補不足,便可以達到自給自足的社會。但隨著社會的演進,我們對於 其他人的依賴越來越重,不管是最基本的食、衣、住、行或是育、樂等,幾乎都 需要透過與他人的互動以及互助合作才能夠達成,人與人之間的互動關係也相對 的越來越頻繁。再加上近代科技的發達,我們可以互動的對象,不只可以透過地 緣關係,與我們居家附近的鄰居互動,更可以透過通信、電話、網際網路等各種 管道,來與我們遠方的人們建立起互動的關係。人類的社會網路也因為我們生活 型態的改變而變的越來越複雜,而這些改變勢必會對於我們的生活產生不小的影 響。 近年來,隨著電腦技術的發達,各種不同的人工社會(Artificial Society)以 及虛擬社會(Virtual Society),也漸漸出現。人工社會,是指完全由人工的代理 人所組成的社會,而主要的目的是用來模擬真實社會的某些現象[1,2]或是用來尋 求解決某些特定的問題的方法。多重代理人系統(Multi-Agent System)便是其 中的一個有名的例子,在此人工社會中,裡面的個體是由許多不同類型的代理人 所組成的,而它們分別被放置在符合我們需求的社會網路中,並且被我們期待可 以發展出一些互動行為,尤其是合作的行為,藉此解決某些問題或是達到某個個 體或整體的目標。另一種是虛擬社會則是指在一個由電腦技術創造的虛擬的環境 中,有著許多個體,而這些個體可能是由其行為由人類所控制的個體,或是由人 工代理人所組成。舉例子來說 Multiple User Dungeon (MUD) System 跟 Online Games 便是在一個電腦技術所創造出來的虛擬環境,主要的目的在於提供人類 在上面互動[3]或達到學習的效果[4]。而組成此世界的個體,可能是由人所控制 的個體或者是由人工代理人所組成。這些個體可以在這個虛擬世界中,做各種不

(11)

同類型的互動,例如說可以互相戰鬥,一起解謎團,建立虛擬婚姻[5],或是在 虛擬市場中進行買賣的行為等。不管是人類與代理人之間的互動、人類與人類之 間的互動、或是代理人與代理人之間的互動,都是值得我們去探討的問題。在人 工社會或是虛擬社會中,我們也可以發現他們的社會網路擁有比真實社會中的型 態更多,有些甚至於更加的複雜。 由於社會網路的種類繁多,再加上有許多細部變數差異都可能造成的影響, 因此我們便想提出一個較有系統的分析方法,去探討以及分析各種類型的社會網 路對於整體合作行為演化的影響。

1.2

問題描述

不管是在現實世界、人工世界、或是虛擬世界中,個體通常為自利的,為了 自己的利益或是生存在努力,當他們與其他的個體在互動時,便會面臨到合作或 者背叛的抉擇。此時,他們可能選擇與其他個體合作來完成某項工作與其分享利 益,也可能選擇背叛對方想要獨占所有的利益,而其對手也是一樣會遇到這種兩 難的局面。

在 1950 年,Melvin Dresher 和 Merrill Flood 便利用一個遊戲來描述這種個體 在面臨選擇背叛對方的利己行為或是採取合作來尋求整體利益的矛盾關係,這個 遊戲就是所謂的囚犯困局(Prisoner Dilemma Game)。囚犯困局是一個相當具有 一般性且精簡的模型,其研究的應用所涉及的領域相當廣,不只是在我們的電腦 科學研究中友所提到,舉凡經濟學[6]、政治學[7]、生物學[8]等,都可以看到它 的影子。舉個在商業上的例子來說,假設市面上有兩家互相競爭的公司想要推出 同樣的商品來販售,而他們都知道應該要互相維持有利潤的價格來販售。但是, 當商品真正上市販售時,他們又會想要訂立一個比對手更有競爭力的價格來吸引 較多的消費者。此時他們便都面臨到一個兩難的局面,是要維持原本有利潤的定

(12)

價,還是要殺價來競爭。如果他們都選擇了維持一定的價格的話,彼此所得到的 整體利益一定是最大的;如果他們若是一方選擇維持一定的價格,另一方卻選擇 殺價競爭,則消費者都會被殺價的一方搶走;若是他們都選擇殺價競爭,在惡性 循環下,彼此都得不到好處,所得到的整體利益必定是最低的。 而為了將囚犯困局模型應用的範圍繼續提升,之後便有許多研究者試著對它 再做一些延伸及變型,如加入記憶機制[9]、標籤機制[10]、名聲機制[11]等。本 論文所使用的反覆囚犯困局(Iterated Prisoner’s Dilemma)也是其中的一個重要 延伸,主要的差別是在於反覆囚犯困局它讓參賽者之間重複進行著不只一次的囚 犯困局比賽,也因此參賽者可以記住與對手過去交手的資訊,並在下一次交手時 根據本身的互動策略以及此一資訊,決定自己此次的行動。 在反覆囚犯困局中,參賽者與對手的互動流程主要如下。在尚未開始比賽之 前,必須先決定參賽者的策略空間 (如利用記憶對手前次行動、或對手名聲), 以及不同的行動組合後所得的利益(採取背叛或合作的所有組合),接下來必須 選擇與自己比賽的對手,最後再所有比賽結束之後,根據個體的適應程序 (adaptive process)來調整自己的策略以適應目前它所在的社會。因此,能夠影 響反覆囚犯困局模型結果的因素,我們可以把它分為以下幾點因素: (1) 個體的策略空間以及收益表: 個體的策略空間是指個體的行動策略是以對手過去的行動記錄,或是以對 手的名聲,或是基因相似度等,來決定這次的行動,而兩名個體在互動結 束後所得到的利益便由收益表(payoff table)的內容來決定。 (2) 模型的社會網路: 在以往的實驗當中,個體的互動對象多以隨機產生,主要是因為技術上的 限制或對於社會網路特性的不了解,但是這明顯的不符合實際狀況。因此 我們便想把社會網路的觀念加入反覆囚犯困局當中,利用網路中的連結來

(13)

選擇互動的對象,每一名個體都必須也只能夠和自己有連結的個體互動, 因此社會網路的結構便決定了個體互動的對象。舉例來說,在農村社會中 個體的互動對象只限自己鄰近的個體,它的社會網路便可以用正規網路 (Regular Network)來模擬,而現代社會除了鄰近的個體之外,也有能力 利用各種交通工具或是電話、網際網路等和遠方的個體互動,因此較趨近 於小世界網路(Small-World Network)的架構。 (3) 個體的適應程式: 個體在經過多次的比賽之後,應該可以想辦法去調整自己的策略,讓自己 的策略更加的適應這個社會,而其中最簡單的調整方法,就是去學習那些 較有優勢個體的策略。 而第二點的社會網路,便是我們這次的研究重點。每一種社會網路的類型都 可能對於合作行為有著不同層面的影響。針對目前在現實社會、人工社會、以及 虛擬社會主要的社會網路,分析其主要特徵,根據其組成網路的形式加以分類。 最後,分析每一類型的社會網路對於個體之間合作行為演化的影響,這就是本篇 論文的主要目標。

1.3

研究重要性與方向

以往的學者,在合作行為演化的研究上,大多沒有加入社會網路的觀念,而 是以隨機的方式決定互動的對象,主要的原因是因為當時電腦技術不夠發達而無 法建構出龐大的社會網路結構,或者是對於想要探討的社會網路的特性不夠了 解,如現代社會網路的特性(高群聚度、低分隔度)便是在 1967 年由 Milgram 所提出的[12],而真正符合這些特性的社會網路模型(小世界網路)則是在 1998 年才由 Watts & Strogatz 所建構出來的[13]。近年來也漸漸的許多學者將社會網路 的觀念導入他們的研究之中,但是在他們的研究大部份是針對某個特定型態的社

(14)

會網路在探討,就算是在同樣的社會網路下,不同的學者在設定他們模型時,也 可能有著許多細部的參數差異,而整個實驗很可能就因為這些細部的差異而出現 不同的結果。若想避免掉這些情形,便需要考慮到每一個模型中細部的設定,不 斷的調整,不斷的重複做類似的實驗,既費時又費工。另外,當他們想要把他們 的研究套用在不同的社會網路中時,也必須要重新再做一次實驗並重新設定各種 不同的參數的差異來探討它們的影響。 因此我們便希望能夠事先把各種不同社會網路的特性做個分析,並針對每一 個社會網路的主要參數差異做一個比較性的探討。讓這些學者不需要對於他們模 型細部參數太傷腦筋,只需針對那些我們分析出來對結果有較有影響的參數來設 定即可。而在他們想將他們的研究應用在其他種類的社會網路上時,也可以預先 知道變更網路型態可能造成的影響。如此一來這些學者便可以省下不少的時間與 精神,而只需要把焦點針對到他們真正想研究的東西上即可,這便是本研究的主 要的目標與貢獻。

1.4

論文架構

本論文主要是在反覆囚犯困局的架構下,探討不同的社會網路對於合作行為 演化的影響,因此我們在第二章的第一個部份,便先介紹近年來囚犯困局理論的 發展,以及它的一些重要延伸,在第二章的第二部份,便介紹一些目前最常見的 社會網路的種類以及特性,而在第二章的最後一個部份,便是介紹目前在囚犯困 局與社會網路結合的研究進展,以及本研究與其他研究的分別。接下來,第三章 的部份,主要是在介紹本篇論文所使用的模型架構做完整的細部說明以及使用它 的原因。第四章,主要是在看我們最後實驗結果以及我們針對此一結果的分析。 第五章,是結論的部份,為本篇論文畫上一個句點。

(15)

2 相關研究

第二章將會介紹本篇論文所涉獵的主要研究領域。在第一節中,主要介紹囚 犯困局理論的發展,以及一些重要的延伸和本篇論文所使用的反覆囚犯困局模 型。在第二節中,將會介紹目前較為常見的社會網路以及由於個體分支度的不同 產生的區域網路差異。最後,第三節將介紹目前囚犯困局在社會網路上的研究發 展,以及本篇論文和他們的主要差異。

2.1

囚犯困局理論

2.1.1

囚犯困局的基本理論

合作或者背叛,是在我們的日常生活之中,常常會遇到許多選擇兩難的抉 擇。不管在面臨大大小小的事情上,都可能遇到這種抉擇。舉例來說,垃圾分類 是每個人都知道一個觀念,為了我們自己及後代子孫著想,在我們丟垃圾時,若 能事先花費一點點小小的努力將它分類,如此一來處理垃圾所需花費的社會成本 便可以降低,燃燒垃圾所造成的汙染也會較不嚴重,因此,在我們面臨是否該做 垃圾分類的抉擇時,便會面臨到如此的一個兩難的局面,為了長遠的整體利益來 說,當然是大家都採取合作的態度做好垃圾分類比較好,但是對於個人來說,如 果不做垃圾分類的話,累積下來便可以省下不小的時間。

在 1950 年,Melvin Dresher 和 Merrill Flood 利用一個遊戲來描述這種個體在 面臨選擇背叛對方的利己行為或是採取合作來尋求整體利益的矛盾關係,稱之為 囚犯困局(Prisoner Dilemma Game),而在一個最典型的囚犯困局模型描述如下。 假設有兩名囚犯 Allen 及 Bob,他們因為共同合謀一件罪行而被逮捕,而警方將 他們分別隔離偵訊,他們犯案前約定好被抓時什麼都不跟警方說。當他們被偵訊 時他們便有兩種選擇,一種是選擇與對方合作,按照事前約定什麼都不說,另一

(16)

種選擇是背叛對方,把罪行全部推到對方身上。另外,由於雙方是隔離偵訊的, 所以當他們再做決定時,他們是無法得知對方的選擇的,因此,可能的狀況便只 有以下三種:第一種,Allen 及 Bob 都不肯承認罪名,而警方只能根據目前所掌 握到的證據對他們分別判處一年的徒刑。第二種,他們其中一人選擇與對方合 作,但是另外一人卻背叛了對方,則選擇合作的一方將承擔所有的罪刑,被判處 十年的徒刑,而另外一方則被無罪釋放。第三種,雙方都選擇了背叛出賣了對方, 則雙方皆需承擔一部分的罪刑,而分別被判處三年的徒刑。在上述例子當中的兩 個囚犯 Allan 及 Bob,在面對偵訊的時候都面臨到的一個兩難的困局,他們彼此 都知道互相合作可以讓兩人的平均刑期最低,但是若是選擇與對方合作,卻又要 承擔被對方背叛的風險,而坐十年的牢。因此,背叛似乎是個較佳選擇,選擇背 叛可能是坐三年的牢或是釋放,平均是一年半,但若是選擇合作則可能是坐十年 或是一年的牢,平均是五年半。 個體B 個體A C(合作) D(背叛) C(合作) R R S T D(背叛) T S P P 圖 2.1.1 收益表(Payoff Table)

而 Robert Axelrod 使用了一個收益表(Payoff Table)[9]來表示囚犯困局,如 圖 2.1.1 所表示。其中R代表 Reward,T代表 Temptation,P代表 Penaty,S代 表 Sucker,分別代表兩個囚犯採取不同選擇時所得到的收益值。而這個收益矩陣 必須符合以下三個條件,才能稱之為是囚犯困局:

(17)

(1) T > R > P > S,代表背叛所得到的利益是大於合作的利益的,且互相背叛的 利益大於被背叛的利益。

(2) 2R > ( T + S ),代表兩人都合作所得到的整體利益大於背叛以及被背叛的總 和,也是所有的組合當中整體利益最大的。

(3) 個體在決定此次行動時,是無法得知對手的行動的。

2.1.2 反覆式囚犯困局(Iterated Prisoner’s Dilemma)

反覆式囚犯困局,是囚犯困局的一個很簡單卻又很重要的延伸,主要的差別 是在於它讓參賽者之間重複進行多次的囚犯困局比賽,而由於參賽者與其對手不 只進行一次的比賽,所以雙方可以記住其對手過去的行為,而根據自己的互動策 略以及此一資訊,來決定此次的行動。由於每一個參賽者對於對手行動記錄的反 應並不一定相同,因此便衍生出許多有趣的策略,舉例來說,著名的 Tit-for-Tat 策略便是其中一種,而此一策略的基本精神就是以牙還牙、以眼還眼,若對方上 次對我們好,我們也對他好,若是他上次背叛我們,我們便也背叛他。而原本的 只互動一次的囚犯困局模型中,背叛是最佳的策略,但是由於現在參賽者之間互 動不只一次,若是這一次的比賽當中,我們背叛了對方,則在下一次的比賽,便 很有可能遭到對方的報復,因此一味的背叛對方在反覆式囚犯困局當中,便可能 不是最佳的策略。 Robert Axelrod 曾經舉辦過兩次的反覆式囚犯困局競賽,許多在社會學、經 濟學、政治學及數學等領域的遊戲理論研究者都加入比賽的行列,共有六個國家 的參賽者以及超過 60 種的策略參加競賽。而在這些策略之中,有些只是很簡單 策略,有些卻相當的複雜,然而最後得勝的卻都是一個十分簡單的策略 Tit-for-Tat,而此一策略的基本精神只是簡單的以牙還牙、以眼還眼,若對方上 次對我們好,我們也對他好,若是他上次背叛我們,我們便也背叛他。在兩次的

(18)

競賽之後,Robert Axelord 分析出擁有下列幾點特性的策略將佔優勢: (1) niceness:在雙方第一次互動時便採取合作的態度,此時並沒有任何對方策略 的資訊。 (2) reciprocity:也就是 Tit-for-Tat 策略的主要性質,以牙還牙、以眼還眼,若對 方上次對我們好,我們也對他好,若是他上次背叛我們,我們便也背叛他。 (3) clear:策略簡單不過於複雜,事實上太複雜的策略並不一定會佔到優勢,相 反的在它的兩次競賽當中,複雜的策略反而會因會考慮的太多,而做出不對 的選擇。

2.2

社會網路

2.2.1 社會網路的基本分類

一個社會,是由許多的不同種類的個體所組成的,兩名個體之間若是有連結 (Link),便代表著它們之間存在著互動關係,而許許多多的連結交織而成的互 動關係網路,我們便稱之為社會網路(Social Network)。另外,分支度資訊(vertex degree information)便是代表個體的連結數量,如個體 A 和另外三名個體 B、C、 D 有連結,那便表示,個體 A 的分支度為 3。而依照其連結形成的方式的不同, 也產生了許多不同類型的社會網路,我們可以大致上可以將目前較常見的社會網 路分為三種,正規網路(Regular Network)、小世界網路(Small-World Network)、 隨機網路(Random Network)。

另外,我們藉由社會網路的兩種特性,分隔度(degree of separation)以及群 聚度(degree of clustering)這兩種特性的高低,來探討上述三種網路之間的分別。 兩名個體之間是指在兩個體之間最短的路徑長度,也就是最短需要經過多少個連

(19)

度的平均值,以現代人類社會為例,任兩人之間平均只要透過六個人,便可以找 到他們之間的交集,平均分隔度為 6。群聚度則是用來測量區域特性的大小,若 是群聚度高便表示,個體與通常與其鄰近個體相連,並且它鄰居互相連結的機率 也會很高,以數學上的定義來說,假若個體 A 連結到其他 n 名個體,則在這 n 名個體之間最多可能的連結數量為 n*(n-1)/2 也就是在 n 名個體中取兩名個體的 所有可能數量,個體 A 的群聚度則為這 n 名個體間真正連結數量除以最多可能 的連結數量,一個網路的群聚度則為所有個體群聚度的平均值。圖 2.2.4 為這三 種網路的群聚度以及分隔度的比較圖表,我們可以看到群聚度最高的是正規網 路,分隔度最低的是隨機網路,而小世界網路則同時擁有這兩種特性,低分隔度 與高群聚度, 接下來便分別介紹這三種常見的網路: (1) 正規網路(Regular Network) 在人類古早某些較未開化的社會當中,例如農村社會裡,人們的生活相當 單純,生活簡單而且通常可以自給自足,就算有和別人互動,也只是一些 簡單的互動,通常只和自己的鄰居有所互動,對於每一個人來說他們的世 界是很小的。在這種網路之中,每一名個體皆只與其距離最近的幾名個體 有連結,我們可以給它一個變數稱之為 radius 代表可以和距離幾步的人相 連,若是 radius 設為 2,在一維的網路中便代表的他與自己前面兩個以及 後面兩個人相連,因此個體的平均分支度便是 4。另外它的群聚度也是三 種社會網路之中最高的。圖 2.2.1 為一維正規網路示意圖,radius 設為 2, 個體平均分支度為 4。

(20)

圖 2.2.1 一維正規網路示意圖

(2) 小世界網路(Small-World Network)

在近代的人類社會裡,人們的互動越來越頻繁,我們不只和我們的鄰居有 所互動,也可以透過各種不同的管道如電話、網際網路、郵件等,和我們 遠方的朋友互動。由於小世界網路是目前最貼近真實社會的網路,因此在 近年來研究小世界網路的學者越來越多,他們基本上是以 Walt & Strogatz 在 1998 年提出的模型為主[13],並發展出一些的延伸及變形[14,15]。在這 種網路之中,每一名個體,不只會和其鄰近的個體連結,更可以利用一些 特別的連結稱為捷徑(Short Cut)來連向群體中的其他個體。在小世界網 路當中,同時擁有高群聚度以及低分隔度的特性,這兩樣特性也是我們現 代社會的社會網路中之兩個重要特性。圖 2.2.2 為一維的小世界網路示意 圖,radius 設為 2,個體平均分支度為 6,其中 33%的連結為捷徑。

(21)

圖 2.2.2 一維的小世界網路 (3) 隨機網路(Random Network) 在現在越來越風行的網際網路上,有著許多我們原本人類社會沒有的社會 網路,如當我們透過某個交友網站在交友時,他可能會自動幫你配對出你 的交友名單,因此我們並不知道我們會認識哪些人,他們可能與你來自不 同的國度,也可能與你近在咫尺,在這種網路之中,每一名個體只能透過 捷徑與其他個體連結,而捷徑所連結到的對象通常是隨機選擇的,因此他 們可能與你距離很遠,也可能與你距離很近。隨機網路是三種網路當中分 隔度最低的網路,任意兩名個體之間的連結距離都很小。

(22)

圖 2.2.3 一維的隨機網路,個體平均分支度為 2 正規網路 小世界網路 隨機網路 分隔度 高 低 低 群聚度 高 中 低 圖 2.2.4 三種社會網路的分隔度以及群聚度的特性

2.2.2 個體分支度的不同造成區域網路的差異

在小世界網路以及隨機網路之中,個體的連結,除了可能有與鄰近的個體相 連之外,另外還有一些可以連結到遠方的捷徑,在過去的研究當中,產生這些捷 徑的方法通常是使用隨機的方式所產生,每一名個體產生捷徑的機率都是相等 的,然而這種產生捷徑的方式是否符合真實的狀況呢?這是一個很大的疑問。以 我們現在所處的社會為例子,每個人交朋友的能力都不盡相同,有些人很會交朋 友,他們與別人的互動的機會便很多,有些人比較木訥,交的朋友便會比較少,

(23)

與他人互動的機會也會比較少。因此,捷徑的設定方法,便會影響到個體分支度 的差異,也會造成形成區域網路在結構上的差異,而這些差異會對我們的實驗模 型造成什麼樣子的影響便是本論文其中的一個研究目標。曾經有某些大眾傳播領 域的學者也發現了這個存在於真實社會中的問題,他們是採用問卷調查以及統計 的方式,發現了區域網路差異的確是對合作行為的演化有所影響,但卻無法做進 一步的實驗,而我們的實驗模型正好可以利用電腦模擬來探討此一問題,深入分 析它在不同的社會網路上的影響。

2.3

在社會網路上的囚犯困局模型

在過去的囚犯困局理論研究當中,多半是沒有社會網路的觀念的,個體在選 擇互動對象的時候多半是隨機選擇幾名個體來互動,或者是直接和群體之中的每 一名個體來互動的。但是缺乏社會網路的實驗的模型,它所做出來的結果是否能 夠代表我們想要探討的議題,便可能有某種程度上的差異。因此,為了讓我們的 實驗結果更具代表性,以及實驗模型更貼近真實的情況,便開始有人將社會網路 的觀念,帶入到囚犯困局模型的討論之中。 1988 年,Pollock 開始探討在一維以及二維空間上探討對反覆囚犯困局模型 的影響[16],發現在有空間觀念的結構之下,Tit-for-Tat 策略可以更穩定的發展。 1992 年 Nowak & May 提出空間版本的囚犯困局模型[17](沒有任何記憶,純粹 模仿自己所知的最佳策略),探討它在二維空間的環境下的演化情形,並加入一 些可能影響實驗結果的變數,如隨機的錯誤、空白的空間等效果。1994 年,Mark 等人探討了加入選擇機制的囚犯困局模型在社會網路上的合作行為演化[18]。 1998 年,Watts & Herz 探討在空間觀念下,策略 Win-Stay、Lost-Shift(個體保持 其狀態直到它的收益值低於某個標準)所帶來的影響[19]。1999 年,Cohen & Riolo & Axelrod 在二維空間下,探討正規網路與隨機網路對於囚犯困局的影響[20],

(24)

他們發現在隨機網路下是較不利於合作演化的。2001 年,Abramson & Kuperman 探討空間版本的囚犯困局模型在小世界網路之下的差異[21]。2003 年,Bazzan & Cavalheiro 探討一維以及二為小世界網路對於空間版本的囚犯困局模型的影響 [22]。由以上這些人所做的研究可以知道,在囚犯困局模型的研究中,加入社會 網路觀念是一種趨勢,也是一個相當重要的議題。 在過往的這些研究當中,往往缺乏完整以及有系統的探討,而在囚犯困局模 型的類型上也由於電腦技術的限制使用較為簡單的版本,如空間版本的囚犯困局 便是沒有記憶能力的囚犯困局模型,或者他們所使用的囚犯困局模型是為了拿來 解決某些特定問題而設計的,因此便不夠一般性,不足以代表真實的狀況。因此 本研究當初的主要目標,便是將過往研究中比較不足的地方加以補強,而主要的 特色可以分為以下幾點: (1) 在我們的世界之中,我們在和別人互動所採取的互動策略當中,最常見也是 最容易的方法便是依照對手先前與我們的交手狀況來決定我們這次的行動, 因此我們所採用的是擁有一次記憶的反覆囚犯困局模型,個體可以藉由與其 對手上次交手的狀況來決定這次的行動。而一次記憶的反覆囚犯困局模型, 但提供了簡單明瞭的策略來讓個體使用,但仍足以表現出許多種不同類型且 有趣的策略,如 Tit-for-Tat 策略(以牙還牙策略)、All C 策略(濫好人策略)、 All D 策略(一律背叛策略)。 (2) 本研究所設計的實驗皆是在一致條件之下(相同個體平均分支度、相同收益 表)同步進行的,用以分析目前常見的三種社會網路下(正規網路、小世界 網路、隨機網路)對於反覆囚犯困局模型的影響。因此,我們可以更客觀的 比較出它們之間的不同,所做出來的結果也較具有一般性。 (3) 探討完社會網路對於反覆囚犯困局合作演化的影響之後,接下來我們便把我 們的研究重點放在探討由於捷徑形成方式不同而造成的區域網路差異所造成

(25)

的影響。這一點是在以往的研究中大多忽略它而沒有考慮他可能帶來的影 響,在我們的研究中則會針對這一點做個詳細的分析及探討。

(26)

3 實驗模型設計

這個章節主要是在介紹本論文的實驗模型設計的細節部分。3.1 節為模型的 基本設定。3.2 節為個體的策略空間及收益表。3.3 節介紹所使用的社會網路。3.4 節介紹個體的適應程式。3.5 節為成果測量的方法。

3.1

模型基本設定

在本論文的反覆囚犯困局模型之中,個體與個體之間每次的互動,是以一次 兩名個體之間的互動為主,而非一次多人的模型[23]。另外,每一名個體的互動 對象,和它所在的社會網路有很大的關係,因為唯有和本身有連結(Link)或捷 徑(Short Cut)的個體才有與之互動的權利。所有型態的社會網路都是建構在一 個二維(32 x 32)的棋盤上,而每一個位置便代表著一名個體,因此便會有 32 x 32 = 1024 名個體。這便是總人口(Population)的大小,我們稱之為一個世代 (Generation),之後再根據不同的社會網路來建構個體與個體之間的連結。每一 個體擁有 1 次記憶的能力,可以記住與對手上次比賽狀況的資訊,並根據自己的 互動策略以及此一資訊來決定這次的行動。個體與個體之間互動時,他們之間進 行反覆數次的比賽,而次數設為四次,主要的原因是在於,我們希望個體之間藉 由增加未來共事的重要性而學習到合作的重要性,另外個體的第一次互動的策略 也佔有一定的重要性,因此次數不能設定太大也不能設定太小。另外,由於個體 記憶的大小是一次,所以個體無法利用比賽的次數來取得優勢(在一些研究中顯 示,若是個體之知道比賽的次數,則最後一次的比賽往往是採取背叛的行為,因 為他們知道已經最後一次的比賽,所以不會受到報復性的處罰)。 實驗模型的主要流程如下。第一,決定個體策略空間以及收益表的內容。第 二,選擇社會網路的類型,並根據網路型態的不同來產生連結與捷徑。第三,所

(27)

有個體分別與自己有連結的個體互動,並根據收益表的內容,得到總和收益值, 並算出其平均的收益值。第四,所有個體分別進入適應程式以調適自己適應社 會,將自己的策略進化成更有利生存的策略,當所有的個體皆完成他們的適應程 式之後便產生出一個新的世代。本實驗總共會進行 1000 個世代的演化。

(28)

本實驗所使用的社會網路下反覆囚犯困局模型的虛擬碼如下:

for 1 to Number_of_Generations

for all Individual I in Population i

for number_of_LinksItarget

et t

I arg = Individual that links to I i

Interation(I , i Itarget) next Link

next Individual

for all Individual I in Population i

Adaptive_Process(I ) i

next Individual next Generation

(29)

3.2

個體的策略空間以及收益表

個體與個體之間在互動時,將會遇到一個兩難的抉擇,要與對方合作或是背 叛對方,其中我們以 C 代表合作(Cooperation),D 代表背叛(Defection)。本論 文是採用一次記憶的反覆囚犯困局模型,個體在互動的時候可以根據與對方上一 次的互動紀錄來決定這次的互動。個體的策略空間的設計如下: 1、首次互動所採取的對策(first move),當一名個體要與一個完全陌生的個體互 動時,第一次互動所採取的策略。我們給他一個代號叫做 i,它的值可能是 C 或是 D。 2、當上次與對手互動時,對方採取的是合作的態度,則自己這一次所採取的態 度。我們把它的代號設為 p,它的值可能是 C 或是 D。 3、當上次與對手互動時,對方採取的是背叛的態度,則自己這一次所採取的態 度。我們把它的代號設為 q,它的值可能是 C 或是 D。 因此每一名個體便都有著一組向量來決定它的策略(i, p, q),而其中每一個向 量都只可能是 C 或是 D,屬於離散的策略空間,而整體策略空間的大小便是 2 x 2 x 2 = 8,總共有八種不同的策略所組成。另外,當個體之間互動後所得到的收 益便由圖 3.2.1 這個收益表決定。 個體B 個體A C(合作) D(背叛) C(合作) R= 3 R=3 S= 0 T=5 D(背叛) T= 5 S=0 P= 1 P=1 圖 3.2.1 收益表

(30)

圖 3.2 是我們模型預設的收益表,然而其內容設定仍必需符合囚犯困局的基 本精神,也就是 T > R > P > S,以及 2R > T + S。個體與個體若有互動關係,他 們之間便會有四次的比賽,所得到的分數便是一個 4 次收益值加總的分數。舉個 例子來說,以(i, p, q) = (C, C, D)與(D, D, D)這兩種策略的互動情形為例,他們所 得到的分數分別是 0 + 1 + 1 + 1 = 3(依序採取 CDDD 策略)與 5 + 1 + 1 + 1 = 8 (依序採取 DDDD 的策略)。 在我們的實驗當中我們也將探討根據收益表內容的不同,而產生的差異。我 們將 R、P、S 的值固定,而只改變 T 的值來觀察整體合作演化的影響,T 值的 設定在符合囚犯困局的基本精神下,其大小將為 3 ~ 6 之間的數字。

3.3

模型的社會網路

3.3.1 社會網路的基本設定

不同的社會網路,決定了每一名個體與其他個體之間是否有互動關係。我們 所採用來做實驗的社會網路主要類型有三種正規網路、小世界網路、隨機網路。 在決定好使用的社會網路類型之後,便要設定此一模型之中個體的平均分支度 (average number of vertex degree),這個值是代表在這個社會之中,個體的平均 連結數量。而連結的類型有兩種,一種是連向鄰近個體的連結,另一種便是捷徑。 對於連向個體鄰近的連結,我們同樣以 radius 來設定,在二維的網路之中,radius 我們把它當作是兩名個體之間的絕對距離,在 radius 值內的個體都有連結,舉例 來說若是 radius 的值為 1.5 則表示個體與其東、南、西、北、東北、西北、東南、 西南八名個體有連結。若是連結的類型若是屬於捷徑的話,則必須再額外決定捷 徑設定方法來產生,便可以藉由不同的捷徑設定方法(詳見 3.32 節)來產生出 不同的網路結構。圖 3.3.1 為建構社會網路的流程圖。

(31)

圖 3.3.1 建構社會網路流程圖 接下來便開始設定本實驗所使用的社會網路: (1) 正規網路(Regular Network) 在這個網路之中,所有的個體皆只和離自己最近的幾名個體有連結,因此 我們便只需要設定 radius 的值便可以將此網路設定完成。例如,一個 radius 為 2 正規網路其平均分支度為 12,除了周圍八個之外,還增加了東、南、 西、北四個方向中距離為 2 的連結。圖 3.3.2 為 二維的正規網路示意圖, radius 設為 1,個體平均分支度為 4。

(32)

圖 3.3.2 二維的正規網路

(2) 小世界網路

在這個網路之中,每一名個體,不只會和其鄰近的個體連結,更可以透過 捷徑(short cut)與遠方的個體連結。因此我們除了 radius 之外還需要另 外一個參數便是捷徑占整體連結的比例,我們稱之為捷徑比。以平均分支 度為12的小世界網路來說,若是其捷徑比為 66%便表示有4個連結是連 向它的鄰近的東、南、西、北四名個體因此其 radius 是 1,另外還有8個 捷徑便需依照我們決定的捷徑設定方法來連向其他的個體。在我們的實驗 當中,使用到了兩種的小世界網路,分別為捷徑比為 33%以及 66%的兩 種小世界網路以區分捷徑占整體連結多寡的差異。圖 3.3.3 為二維的小世 界網路示意圖,radius 設為 1,個體平均分支度為 8,捷徑比為 50%

(33)

圖 3.3.3 二維的小世界網路 (3) 隨機網路 在這個網路之中,所有連結都是捷徑的類型,因此平均分支度的值也代表 著個體平均的捷徑數量,而其設定的方法同樣是依造捷徑設定演算法來決 定。由於在隨機網路中不會連向鄰近個體,不需設定 radius,也沒有方向 性的觀念,因此不管在一維或是二維的網路之中,對隨機網路來說,是沒 有任何差別的。

3.3.2 個體分支度的不同造成區域網路的差異

在我們的模型當中所使用的捷徑設定演算法是為了模擬不同的區域網路型 所設計的。首先我們會為每一名個體設立一個互動傾向資訊值,這個值越高,便 代表這名個體與他人互動的機率也越高,例如互動傾向資訊值分別為 3 以及 6 的兩名個體 A、B,便代表著 B 比 A 擁有多一倍的與他人的互動機會。因此,我

(34)

們只需改變設定互動傾向資訊值的方法,便可以產生出不同的捷徑設定方法。在 我們的模型之中所設定的區域網路型態主要有下列幾種: (1) Constant:在這個社會之中,每一名個體的互動傾向資訊值皆相同,代表著所 有個體與他人互動的傾向都相同。因此,這種設定方法跟以往研究中的隨機 選取的方法並沒有什麼不同。 (2) Uniform[3:6]:設定互動資訊值的方法為隨機選取 3、4、5、6 其中的一個值, 在這個社會當中,每個人的互動傾向並不會相去太遠,好互動個體的互動傾 向是不愛互動個體的兩倍。 (3) Normal[5:1]:在真實的社會之中,每個人喜好交朋友的傾向大多不相同,而 大部分的人交朋友的傾向是相去不遠的,但是也有少數人是屬於超外向超愛 交朋友,或是比較內向朋友很少的。我們針對這種區域網路型態的設定方法 便是由常態分佈亂數中心值 5 標準差 1 取出的整數設定,所設定的值可能為 1 到 9 之間的數字,多數的個體的互動傾向資訊值會被設定會 4、5、6 的值, 而僅有少數的個體會被設定為 1 或 9 的值。 (4) Scale-Free:無尺度網路的觀念是最近幾年才發展起來的,它的主要概念便是 富者越富的概念。以網站的超連結網路為例,通常越有知名度的網站,他被 其他網站所連結的機率也越大,因此當一個網站還沒什麼知名度時,別人連 結它的意願也相對較低,知名度提升的速度是相當的慢的,但是當這個網站 開始有點名氣之後,知名度提升的速度會愈來越快,它被別人連結的數量也 會呈現幾何的成長。最後,網站的超連結網路當中的大部分的連結都會與那 些有名有影響力的網站連結,而剩下來少數的連結才會連向其他較沒有名氣 的網站。我們便把這個觀念加入來形成一種新型態的區域網路,此時,個體 的連結數量便是它的互動傾向資訊值,連結多的人,它增加新連結的速度也 會越來越快。圖 3.3.4 為無尺度網路示意圖,在圖形的中央部份,可以觀察

(35)

到有一些非常有影響力的個體,另外在這些連結多的個體之間通常互相也有 連結。 圖 3.3.4 無尺度網路示意圖

3.4

個體的適應程式

當社會上所有個體皆完成所有的互動的程式(與每一個有連結的個體互動並 得到收益值)之後,他們便會進入適應程式(adaptive process)。適應程式便是 個體在學習如何能夠更適應這個社會,並讓自己的策略進化到成較具有競爭優勢 的方法。以學生讀書的例子來說,當我們看到別人有好的讀書方法時,最簡單的 方法便是把直接它學起來,按照那些功課好的人的讀書方法來讀書。而適應程式 便是個體在學習適應目前環境的過程,在空間版本的反覆囚犯困局當中,便採用 了一個最簡單的適應程式-模仿策略(imitation strategy),直接拷貝其互動對象 中最佳的策略。

(36)

在我們的模型中所使用的個體適應程式是採用模仿策略以及基因演算法的 混合方法。基因演算法(genetic algorithm)是一套擁有適應性和啟發方式的搜尋 演算法,由 John Holland 在 1960 年提出,主要的概念是模擬自然界中生物利用 交配(crossover)以及突變(mutation)的機制來演化出新的子代,並藉由物競 天擇的過程來達到進化與適應環境的效果。我們的方法是先選出個體互動對象之 中分數最高的個體,若是自己的分數為最高則不用進入演化的階段,若不是則進 入演化的階段,先讓自己與分數最高的個體交配產生新的子代,最後再用突變的 機制來避免演化陷入區域最佳策略而無法演化出真正整體最佳的策略。 個體的策略有三個向量(i, p, q)因此我們便把這三個向量當成擁有三個基因 的基因串,當個體 A(a, b, c)與個體 B(d, e, f)在交配時,它們將產生一個的新子代 C(x, y, z),而其中 x 的值各有一半的機率繼承自個體 A 或 B,所以其值將是 a 或 者 d,同理 y 的值可能是 b 或 e,z 的值可能是 c 或 f。當交配完了之後,便進入 突變的過程,每一個基因都有一定的機率突變成不同的值,若是原本的值為 C 則變為 D,D 則變為 C。我們發現突變的機率若是設的太低則容易陷入區域最佳 策略,若是設的太高則整體便不容易收斂成一個穩定的狀態,在經過多次的實驗 後,發現千分之一是最適合我們模型的突變率。

3.5

成果測量

個體的收益值代表著他與別人互動之後的成果,因此觀察個體的平均收益值 似乎是最能夠代表目前的社會策略演化的方向。在我們的收益表設定當中,群體 利益最大的是雙方皆合作,此時平均的收益值為 3,而群體利益最低的是雙方皆 背叛的狀況,平均收益值為 1,因此再每一個世代的個體平均收益值皆在 1 ~ 3 之間的範圍,若是在模型中大部分的個體皆是傾向合作的,則此值將會接近 3, 若是大部分的個體皆是傾向背叛的,則此值則將會接近 1。

(37)

我們發現在我們的實驗當中,經過多次的世代演化之後,整個社會往往會演 化至一個收斂的狀態,此時社會當中的平均收益值才是我們所關心的部份。因 此,為了避免受先前尚未完全演化至最佳狀態世代的影響,我們便將最後 100 個世代的平均收益值紀錄下來,並將其平均值紀錄下來,稱之為收斂平均收益值。 我們也發現在世代的演化當中,整個社會往往會先陷入完全背叛的狀態,之 後經過一定時間的醞釀,再演化至大部份皆合作的收斂狀態。因此,我們便想將 世代演化到合作狀態的時間記錄下來,我們以 2 為標準,當平均收益值由接近 1 慢慢演化到超過 2 時,便把此時間記錄下來,稱之為收斂時間。 最後,我們便以每一個世代平均收益值的紀錄圖表、收斂收益值以及收斂時 間這三種數據,作為我們成果測量的觀察重點。

(38)

4 實驗結果

在第三章中我們設計好反覆囚犯困局模型的互動方式,也設計了三大類的社 會網路(正規網路、小世界網路、隨機網路)的產生方式,以及區域網路差異的 設計,在本章節當中,我們便要透過各個實驗模型的實際執行結果,來觀察有關 於社會網路的差異對於整體合作演化的影響。另外,為了避免實驗的誤差,所以 我們每一種的實驗,它的結果皆為 20 次的平均結果。 能有影響我們實驗模型的主要因素有哪些方面呢?回顧我們在 1.2 節所提到 的事情,主要分為以下三點, (1) 個體的策略空間以及收益表, (2) 模型的社會網路, (3) 個體的適應程式, 在我們的模型當中,我們的研究重點是在社會網路對於合作行為演化的影 響,個體的策略空間則是固定使用擁有 1 次記憶的策略模式,而個體的適應程式 亦固定使用基因演算法混合模仿策略的方法,剩下的變數便只剩下收益表的影響 以及我們實驗的重點-模型的社會網路的影響。 因此,首先在 4.1 的實驗當中,便會先觀察改變收益表的內容對於不同的社 會網路所造成的影響。接下的在 4.2 的實驗當中,我們將觀察社會網路中個體的 平均分支度以及社會網路類型所造成的影響。最後在 4.3 的實驗當中,將會觀察 個體分支度差異所造成的區域網路的不同對於整體合作行為演化的影響。

(39)

以下是各實驗模型所使用到的共同參數設定,以及代號說明: 收益表(預設):T = 5、R = 3、P = 1、S = 0, 個體策略空間:使用擁有1次記憶個體, 個體數量:Pn = 32 x 32 = 1024 個, 反覆囚犯困局次數:Move = 4 次, 基因突變率:Mt = 0.01, 演化世代數:Gn = 1000, 個體平均分支度:Al = 12 or 24(預設為 12), 捷徑占所有連結的百分比(捷徑比):Ps = 33% or 66%, 收斂平均收益值:Cp, 收斂時間(世代):Ct, 正規網路:RGN, 小世界網路:SWN 小世界網路(Ps = 33% or 66%):SWN33 or SWN66 隨機網路:RDN

(40)

4.1

收益表內容的影響

收益表的內容可以影響個體合作或者是背叛的傾向,當你將合作或背叛所得 到的收益值提升時,個體想要合作或背叛的意願也會相對的提升,反過來說降低 這兩種收益值也會讓個體合作或是背叛的意願降低。本實驗選擇改變背叛對方所 得到的收益值來觀察在不同社會網路中的影響,由於個體合作與背叛的意願是呈 現反比的,所以只需觀察其中一種即可。為了降低模型的複雜度以及專注在我們 想要觀察的部份,所以本實驗將把收益表中 R、P、S 的值固定,而只針對 T 值 的改變來改變個體對於背叛的意願,而 T 的設定範圍仍需符合囚犯困局的基本 精神,也就是 T > R 和 2R > T + S,因此可以得到 R < T < 2R,T 的值可以是 3 到 6 之間的數值,我們取 3.6、4.2、4.8、5.4 為 T 值,以增加背叛傾向的方式來 觀察社會網路的影響。我們所使用的社會網路分為三種,正規網路、小世界網路 以及隨機網路,其中小世界網路又分為兩種,為捷徑比為 33%以及 66%的兩種 小世界網路,用來區分捷徑在總連結的多數或是少數。圖 4.1.1~圖 4.1.4 分別是 代表改變收益表的內容對 RGN、SWN33、SWN66、RDN 四種社會網路的平均 收益曲線,圖 4.1.5~圖 4.1.8 為收斂時間和收斂收益值的比較圖表。另外,所有 的網路之平均分支度設定為預設值 12。

(41)

1

1.5

2

2.5

3

1

101 201 301 401 501 601 701 801 901

世代

平均收益值

3.6

4.2

4.8

5.4

圖 4.1.1 在正規網路中,T 值對應的平均收益值曲線圖

1

1.5

2

2.5

3

1

101 201 301 401 501 601 701 801 901

世代

平均收益值

3.6

4.2

4.8

5.4

圖 4.1.2 在小世界網路(SWN33)中,T 值對應的平均收益值曲線圖 T 值 T 值

(42)

1

1.2

1.4

1.6

1.8

2

2.2

2.4

2.6

2.8

3

1

101 201 301 401 501 601 701 801 901

世代

平均收益值

3.6

4.2

4.8

5.4

圖 4.1.3 在小世界網路(SWN66)中,T 值對應的平均收益值曲線圖

1

1.5

2

2.5

3

1

101 201 301 401 501 601 701 801 901

世代

平均收益值

3.6

4.2

4.8

5.4

圖 4.1.4 在隨機網路中,T 值對應的平均收益值曲線圖 T 值 T 值

(43)

T = 3.6 T = 4.2 T = 4.8 T = 5.4 收斂平均收益值 2.81 2.76 2.77 2.75 收斂時間 66.95 73.45 78.5 85.15 圖 4.1.5 在正規網路中,T 值對應的比較圖表 T = 3.6 T = 4.2 T = 4.8 T = 5.4 收斂平均收益值 2.91 2.89 2.87 2.82 收斂時間 54.15 97 90.65 101.45 圖 4.1.6 在小世界網路(SWN33)中,T 值對應的比較圖表 T = 3.6 T = 4.2 T = 4.8 T = 5.4 收斂平均收益值 2.91 2.90 2.88 2.83 收斂時間 66.25 112 111.95 125.35 圖 4.1.7 在小世界網路(SWN66)中,T 值對應的比較圖表 T = 3.6 T = 4.2 T = 4.8 T = 5.4 收斂平均收益值 2.92 2.90 2.88 2.83 收斂時間 68.75 86.85 101.25 128.15 圖 4.1.8 在隨機中,T 值對應的比較圖表 RGN SWN33 SWN66 RDN 收斂平均收益值變化(%) -2.1 -2.7 -2.8 -3.1 收斂時間變化(%) 127 187 189 186 圖 4.1.9 當 T 值由 3.6 增加至 5.4 時,社會網路對應的比較圖

(44)

我們發現收益表的改變所帶來的影響不管在哪一個網路當中,它的影響似乎 都沒有我們原本想像中的大,尤其是在正規網路中,更是影響不大,幾乎沒有什 麼變化。另外在小世界網路以及隨機網路中,T 值越大是會造成收斂的速度變 慢,而收斂平均收益值則是些微降低的。以詳細的數據來說,T 值由 3.6 增加至 5.4 時,在不同的社會網路上的影響如圖 4.1.9 所示,可以發現其收斂時間皆增加 為原來的 1.2~1.8 倍,而在收斂收益值的變化皆在 3.1%以內。我們分析其個體策 略演化發現當 T 值增加時,也就是整體的背叛傾向增加,因而造成整個世代中 的 All C 策略(濫好人策略)將會越難生存,他們少部分將會轉化為一些背叛性 較強的策略,而大部分則會轉化為一種防禦性比較強的策略 Tit-for-Tat(以牙還 牙),因此便需要多花一點時間將 All C 策略演化 Tit-for-Tat 策略來抵抗背叛性強 的策略,但不管背叛的傾向增加到多大,Tit-for-Tat 策略仍能有效的阻止背叛性 強的策略繼續成長,所以最後的收斂收益值也不至於被拉到太低。 我們可以發現,當 T 值增加時,除了將有助於 All C 策略演化至 Tit-for-Tat 策略以及造成收斂速度稍微變慢之外,基本上影響仍是不大的,因此往後學者在 設定他們的社會網路的時候,可以比較不用關注在這項參數的設定而只需要讓收 益表的內容符合囚犯困局的基本精神就可以了。 在 2.3 節所提到的空間版本的囚犯困局[21]也有做過類似的實驗,而他的實 驗結果則是收益表影響相當顯著,只要改變一點點收益表的值,如增加或減少背 叛所得到的收益值,則整個演化的結果就可能完全不同。而本研究的模型與空間 版本的囚犯困局主要的差別在於我們是採用記憶次數為 1 的策略空間,而空間版 本的則是沒有記憶的。在一次記憶的版本當中,可以發展出具有防禦性且可以有 效抵抗背叛性強的策略(如 Tit-for-Tat)。

(45)

4.2

平均分支度的改變

平均分支度在模型中所代表的意義便是個體互動對象的數量,以人際關係網 路為例,在一個人們喜愛交朋友的社會中,與一個人們習慣獨來獨往的社會裡, 人們接觸的對象多寡的差異會否會影響合作行為的演化便是本實驗想去探討 的。因此本實驗便分別在平均分支度為 12 以及 24 的情況下,以分支度相差一倍 的方式分別測試對於正規網路、小世界網路(捷徑比為 33%以及 66%)以及隨 機網路中的影響。首先,圖 4.2.1 是在平均分支度為 12 的情況下,四種網路的每 一個世代的平均收益值走向,圖 4.2.2 是則為此狀況的收斂平均收益值以及收斂 時間之比較圖表。圖 4.2.3 以及 4.2.4 則是在平均分支度為 24 的情況下,所得到 的實驗結果。另外,由於在平均分支度為 24 時,由於收斂速度較慢,所以我們 便做了 1500 個世代的演化以避免實驗的誤差。

(46)

1

1.2

1.4

1.6

1.8

2

2.2

2.4

2.6

2.8

3

1

96

191 286 381 476 571 666 761 856 951

世代

平均收益值

RGN

SWN33

SWN66

RDN

圖 4.2.1 平均分支度為 12 時,平均收益值曲線圖

1

1.2

1.4

1.6

1.8

2

2.2

2.4

2.6

2.8

3

1

143 285 427 569 711 853 995 1137 1279 1421

世代

平均收益值

RGN

SWN33

SWN66

RDN

圖 4.2.2 平均分支度為 24 時,平均收益值曲線圖

(47)

RGN SWN33 SWN66 RDN 收斂平均收益值 2.72 2.78 2.76 2.76 收斂時間 26.85 42.25 66.55 66.25 圖 4.2.3 平均分支度為 12 時,社會網路對應的比較圖表 RGN SWN33 SWN66 RDN 收斂平均收益值 2.83 2.90 2.91 2.91 收斂時間 69.6 311.85 324.8 405.75 圖 4.2.4 平均分支度為 24 時,社會網路對應的比較圖表 RGN SWN33 SWN66 RDN 收斂平均收益值變化(%) +4.0 +4.3 +5.4 +5.4 收斂時間變化(%) +259 +738 +488 +612 圖 4.2.5 當平均分支度由 12 變成 24 時,社會網路對應的比較圖表 分析結果: (1) 當平均分支度增加時,不管社會網路的類型是什麼,平均的收斂時間也都跟 著提高了。推測原因是因為,當平均分支度增加了,表示個體所接觸到的對 象也增多了,因此一名個體的背叛對於整體的傷害較低也不易受到報復,因 此在剛開始的時候便更容易陷入背叛的狀態,必須要等到比較多人演化成為 防禦性強的策略(如 Tit-for-Tat)後,整體才會在有機會收斂到較為合作的 狀況。舉個例子來說,在學校會亂丟垃圾的學生,回到了宿舍可能就不敢這 麼做,因為若在學校亂丟垃圾對於整體環境的損傷並不會很大,其他同學也 不太會制止他的行為,但若在宿舍中也不愛清潔,則必定會造成整間宿舍的

(48)

環境髒亂而被其他室友所唾棄。 (2) 在相同平均分支度的情況下,比較這四種網路的收斂速度,發現 RGN > SWN33 > SWN66 > RDN,剛好與模型的分隔度的大小成反比,所以正規網 路是其中收斂最快網路。一個網路的分隔度若是很低,表示任兩名個體之間 的不用透過太多人,便有機會互相影響,因此分隔度越低,則會被越多人所 影響,如此一來要演化至收斂的狀態便需要耗費較多的時間。舉例來說,若 是一個政治家要在一個鄉村裡推廣一個好的政治理念,則應該很快便能推廣 開來,被大家所接受,但是你若是想在大城市裡推廣他的政治理念,由於人 們資訊取得相當的容易,管道也是相當多元,因此人們在參考你的理念的同 時也會受到其他資訊(如其他政治人物)的影響,便沒那麼容易就推廣出去 了。 (3) 當正規網路收斂時,其收斂平均收益值可以明顯的發現,它比其他三種網路 還要來的低。由於正規網路的分隔度很高,代表個體不易受到別人的影響, 因此策略之間的競爭也比較沒那麼激烈,所以許多個體便可能只是演化成對 區域最佳策略,便可能是一些背叛性強的策略而不是真正對整體最佳的策 略。若是個體的策略受到的挑戰很多,則在多學習多比較的情況下,更可能 會演化成一個更好的策略,因為若不是真正的最佳的策略便隨時都可能生存 不下去,。 (4) 當平均分支度增加時,其收斂平均收益值也越高,這個現象在四個網路之中 都有發現。它的理由也跟第三點差不多,當個體需要隨時都要經過更多的挑 戰以及接受更多的磨練時,它最後所演化出的來策略必定是要趨近於完美的 才可以生存的下來。

(49)

4.3

個體分支度的不同造成區域網路的差異

接下來我們想知道若是設定個體分支度的方法不同,所形成不同的類型的區 域網路結構對整體的合作演化有什麼影響。由於在正規網路之中,每一名個體的 分支度是固定連向它鄰居的,因此我們便藉由改變小世界網路及隨機網路當中的 捷徑設定方法來達到個體分支度的變化。接下來本實驗將針對四種捷徑設定方法 Constant、Uniform[3:6]、Normal[5:1]、Scale-Free 來分別探討他們在這兩種網路 中的影響。另外,由於在捷徑比為 33%的小世界網路當中,其捷徑數量在所有連 結之中的比例較小,所以改變捷徑設定方法並不會對其區域網路結構產生太大的 影響,因此本實驗的小世界網路將使用捷徑比為 66%的小世界網路。個體的平均 分支度我們設定為 12。

1

1.5

2

2.5

3

1

117 233 349 465 581 697 813 929

世代

平均收益值

Constant

Uniform [3:6]

Normal [5:1]

Scale-Free

圖 4.3.1 在小世界網路中,不同的捷徑設定方法對應的平均收益值曲線圖

(50)

1

1.2

1.4

1.6

1.8

2

2.2

2.4

2.6

2.8

3

1

97

193 289 385 481 577 673 769 865 961

世代

平均收益值

Constant

Uniform [3:6]

Normal [5:1]

Scale-Free

圖 4.3.2 在隨機網路中,不同的捷徑設定方法對應的平均收益值曲線圖

Constant Uniform[3:6] Normal[5:1] Scale-Free 收斂平均收益值 2.87 2.87 2.87 2.87

收斂時間 66.55 65.1 63.7 40.45 圖 4.3.3 在小世界網路中,捷徑設定方法對應的比較圖表

Constant Uniform[3:6] Normal[5:1] Scale-Free 收斂平均收益值 2.87 2.87 2.87 2.87

收斂時間 66.25 51.45 42.8 25.3 圖 4.3.4 在隨機網路中,捷徑設定方法對應的比較圖表

(51)

建構出不同的區域網路結構效果之後,發現只對於收斂的速度有所影響,而 對於收斂平均收益值則是完全沒有改變的。這四種捷徑設定方法的收斂速度為 Scale-Free >> Normal[5:1] > Uniform[3:6] > Constant。另外,由於捷徑數是隨機網 路大於小世界網路,所以在隨機網路當中此一現象會比在小世界網路當中還要來 的明顯。以 Scale-Free 的方式建立捷徑,是以富者越富的觀念來建立的,所以會 產生數個很有影響力(連結數量多)的個體,而這些個體之間互相有連結的機會 也很大,所以在這種網路型態當中,大部分的個體所接觸到的都是這些影響力大 的個體,因此在演化初期這些個體會先各自與他們所連結的對象演化至區域最佳 策略,而由於這些影響力強的個體之間有所連結,接下來它們之間也會根據彼此 的區域最佳策略來互相競爭進而演化出一個全域最佳策略,之後透過他們的影響 力很快的就可以將這個全域最佳策略散播到整個網路之中,因此透過這種方式來 進行策略演化便會比其他的方式更有效率,而以 Uniform 及 Normal 的方式建立 捷徑會比 Constant 更快速收斂的原因也是一樣,只是它們的效果沒有 Scale-Free 那麼明顯罷了。 我們可以發現使用 Scale-Free 來建構網路,不但可以讓整體的策略演化更有 效率而且最後個體的策略狀態也能夠維持在全域的最佳策略,因此使用這種方式 所造成的區域網路特性對於合作行為的演化是有相當正面的效應的。

(52)

5 結論

合作的行為不只出現在人類的社會當中,也在許多人工社會(多重代理人系 統)以及虛擬社會(線上遊戲)當中扮演著重要的角色。本篇論文以電腦模擬的 方式,並使用反覆囚犯困局模型描述出當自利的個體面臨公利與私利之間抉擇時 的矛盾關係,並探討加入社會網路的元素之後會產生些什麼影響。 在以往囚犯困局模型的研究當中,多注重於有關個體策略空間的設計,加入 標籤、名聲、基因相似度等機制,卻往往忽略掉社會網路的設定,主要是因為當 時電腦技術的限制或是對於社會網路特性的不了解而沒有照真實的情況來設定 網路。本論文主要研究在社會網路觀念中加入反覆囚犯困局後,針對模型的流 程,分析出社會網路可能影響結果的變數,並分別對它們做探討。以社會網路常 見的種類來說,可以針對其網路形成的方式,分為正規網路、小世界網路、隨機 網路這三種,接下來再分別對這三種社會網路的細部變數如收益表的內容以及平 均分支度來做更深入及完整的分析。本研究希望能替往後想要研究在社會網路上 合作行為的學者,提供一個基本的方向以及模型參數設定參考的依據,也能夠清 楚那些參數是需要仔細設定的,而那些參數又是可以忽略不計的,讓他們不再需 要多花費不必要的時間在不重要的細節上面。 最後,除了基本對於三種常見的社會網路的參數設定之外,我們也研究了區 域網路差異所造成的影響。主要是在探討個體分支度的差異,其造成的區域網路 結構的差別對於整體合作演化也是有一定程度的影響的,尤其是在作有關策略演 化的收斂速度的實驗時,更是要仔細小心。但是對於演化到最後的狀態則是沒有 什麼差別的,所以若是演化的時間夠長則不需要花費太大的心力在這項設定上。

(53)

參考文獻

[1] R. Axelrod, ”Advancing the art of simulation in the social science in Simulating Social Phenomena,” Berlin: Spring, pp.21-40, 1997.

[2] E. Brent, “Sociology: Modeling Social interaction with autonomous agents,” Social Science Computer Review, vol.17, pp.313-322, 1999.

[3] C. Castelfranchi and Y.H. Tan, “The role of Trust and Deception in Virtual Societies,” presented at Proceedings of the 34th International Conference on System Sciences, Hawaii, 2001.

[4] J. Zola and A. Ioannidou, “Learning and teaching with interactive simulations,” Social Education, vol.63, pp.142-145, 2000.

[5] P. Curtis and D. A. Nichols, “ MUDs grow up: Social virtual reality in the real world,” presented at The 1994 IEEE Computer Conference, 1994.

[6] E. Sober, “Stable Cooperation in Iterated Prisoner’s Dilemma,” Economics and Philosophy, vol. 8, pp.127-139, 1992.

[7] J. Bendor and D. Mookherjee, “Institutional Structure and the Logic of Ongoing Collective Action,” American Political Science Review, vol. 81, pp.129-154, 1987.

(54)

Based on Predator Inspection in Fish,” Journal of Theoretical Biology, vol.142, pp.123-135, 1990.

[9] R. Axelord, “The Evolution of Cooperation,” Basic Books, New York, 1984.

[10] R. L.Riolo, “The Effects and Evolution of Tag-Mediated Selection of Partners in Populations Playing the IPD,” ICGA, pp.378-385, 1997.

[11] G. Pollock and L. A. Dugatkin, “ Reciprocity and the Emergence of Reputation,” J.Theor. Biol., vol.159, pp25-37, 1992.

[12] S. Milgram, “Models of Social Processes on Small-World Networks,” AIP Conference Proceeding, vol.658, pp.60-67, 1967.

[13] D. J. Watts and S. H. Strogatz, “Collective dynamics of Small-World Networks,” Nature, vol.393, pp.440-442, 1998.

[14] X. F. Wang and G.. Chen, “Complex Networks: Small-World, Scale-Free and Beyond,” IEEE Circ. Syst.Mag., pp.6-20, 2003.

[15] M. E. J. Newman and D.J. Watts, “Renormalization Group Analysis of the Small-World Network Model,” Physics Letters A, vol.263, pp.341-346, 1999.

[16] G. B Pollock, “Population Structure, Spite, and the Iterated Prisoner’s Dilemma,” Amer. J. Phys. Anthro, vol.77, pp.459-470, 1988.

參考文獻

相關文件

refined generic skills, values education, information literacy, Language across the Curriculum (

好了既然 Z[x] 中的 ideal 不一定是 principle ideal 那麼我們就不能學 Proposition 7.2.11 的方法得到 Z[x] 中的 irreducible element 就是 prime element 了..

volume suppressed mass: (TeV) 2 /M P ∼ 10 −4 eV → mm range can be experimentally tested for any number of extra dimensions - Light U(1) gauge bosons: no derivative couplings. =&gt;

For pedagogical purposes, let us start consideration from a simple one-dimensional (1D) system, where electrons are confined to a chain parallel to the x axis. As it is well known

The observed small neutrino masses strongly suggest the presence of super heavy Majorana neutrinos N. Out-of-thermal equilibrium processes may be easily realized around the

incapable to extract any quantities from QCD, nor to tackle the most interesting physics, namely, the spontaneously chiral symmetry breaking and the color confinement.. 

(1) Determine a hypersurface on which matching condition is given.. (2) Determine a

• Formation of massive primordial stars as origin of objects in the early universe. • Supernova explosions might be visible to the most