行政院國家科學委員會專題研究計畫 成果報告
以代理人基礎塑模來探討組織中個人知識分享行為(第 2
年)
研究成果報告(完整版)
計 畫 類 別 : 個別型
計 畫 編 號 : NSC 96-2416-H-004-015-MY2
執 行 期 間 : 97 年 08 月 01 日至 98 年 07 月 31 日
執 行 單 位 : 國立政治大學資訊管理學系
計 畫 主 持 人 : 楊亨利
計畫參與人員: 博士班研究生-兼任助理人員:賴正育
博士班研究生-兼任助理人員:趙逢毅
博士班研究生-兼任助理人員:楊學隆
博士班研究生-兼任助理人員:蕭淑玲
博士班研究生-兼任助理人員:楊筱芳
博士班研究生-兼任助理人員:吳俊德
報 告 附 件 : 出席國際會議研究心得報告及發表論文
公 開 資 訊 : 本計畫涉及專利或其他智慧財產權,2 年後可公開查詢
中 華 民 國 98 年 08 月 03 日
行政院國家科學委員會補助專題研究計畫期末報告
以代理人基礎塑模
來探討組織中個人知識分享行為
計畫類別:個別型計畫
計畫編號:NSC 96-2416-H-004 -015 -MY2
執行期間: 96 年 8 月 1 日至 98 年 7 月 31 日
計畫主持人:楊亨利 教授
計畫參與人員:吳俊德、賴正育、趙逢毅、楊學隆、楊筱芳、蕭
淑玲
成果報告類型:精簡報告
處理方式:二年後可公開查詢
執行單位:國立政治大學 資訊管理學系
中 華 民 國 98 年 7 月 31 日
行政院國家科學委員會專題研究計畫期末報告
以代理人基礎塑模來探討組織中個人知識分享行為
計畫編號:NSC 96-2416-H-004 -015 -MY2
執行期限:96 年 8 月 1 日至 98 年 7 月 31 日
主持人:楊亨利 教授 國立政治大學 資訊管理學系
計畫參與人員:吳俊德、賴正育、趙逢毅、楊學隆、楊筱芳、蕭淑玲
一、中文摘要
組織中經理人總是在尋求有效的
政策以促進員工彼此分享知識。在組
織中激勵知識分享的政策帶來的效果
並不是容易的掌握,因為同時存在著
人為與組織的複雜的因素為會影響組
織的成員知識分享的行為。對於不同
的組織激勵的政策或手段,欲通過田
野調查或實驗設計來評估不同的政策
所帶來效果及對組織中個別行為的影
響,在實務上並不容易實現。因此,
本研究嘗試運用一項新穎的研究策略-代 理 人 基 礎 塑 模 (Agent-based
Modeling),藉以建構一個人造的世界
來模擬組織成員知識分享的行為。為
了探索組織成員知識分享的行為,在
這個人造的社會中,研究者考慮了知
識 分 享的 報酬 、組 織 成員 的行 為 策
略、行為策略的學習與適應機制、不
同 組 織的 群體 能力 水 準 、互 動 的網
路、知識的選擇模式與不同的組織激
勵政策設計等變數,藉以設計相關的
實驗。模擬的結果產生了的幾項有趣
的發現: (1) 當分享知識的報酬愈高
時,代理人知識分享行為會愈多,無
論是在那一種的互動網路、群體能力
或分享知識的選擇模式的情況之下。(2)
代理人的互動網路是一項重要影響因
素,互動網路扮演著知識流通與行為
策略學習的管道,它同時會影響個體
知識分享的報酬與行為策略的學習。
它可能促成不分享的策略的擴散,可
能會提升組織激勵的效果,也可能會
增強激勵所帶來的副作用。(3) 個體的
知識分 享與吸收的 能 力如果 存有差
異,則能力較好的代理人將會局部地
吸引能力較差的互動對象採用他的策
略,即使他所用的不是可以獲致最佳
報酬策略。(4) 為促進組織成員分享知
識,定期審視固定獎勵的作法可以導
致比較好的效果,不但可以提升分享
知識的行為,也使代理人比較願意採
用傾向分享知識的策略,促成組織信
任的氣氛。但是,在某些情況下,可
能造成反效果。
關鍵詞:知識分享、代理人基礎塑模、
組織激勵政策、賽局理論、組織
行為
Abstract
Managers are always seeking
effective
policies
that
encourage
employees to share their knowledge with
others
in
an
organization.
The
appropriate organizational incentives are
difficult to investigate due to human
factors
and
other
institutional
complexities affecting sharing behaviors
of individuals. Conducting laboratory or
field experiments to evaluate the
effectiveness of various organizational
incentive policies is unrealistic. This
modeling approach to simulate the
actions of knowledge sharing between
actors in an organization. This study
considers some parameters including the
payoff of knowledge sharing, the
strategies of members, the learning and
adaption
mechanism
of
strategies,
collective
capabilities,
interactive
network, the selection methods of
sharing
knowledge
and
incentive
policies to design experiments in the
agent-based model. The results of
simulations produced some interesting
findings: (1) the higher the payoff of
sharing knowledge, the more the actions
of sharing knowledge is in spite of any
kind of interactive networks, collective
capabilities, and the selection methods
of sharing knowledge. (2) Interactive
Network of agents is an important factor,
which plays a role of channel of
knowledge
transition
and
strategy
learning. It simultaneously affects the
payoff of knowledge sharing and
learning of strategy. It maybe results in
the diffusion of strategy of not sharing
knowledge, or enhances the effect and
side effect brought by incentive policies.
(3) Because of difference between
agents’ capabilities, agents with better
capabilities will locally attract the ones
with worse capabilities to learn their
strategies, which even are not the best.
(4) To enable sharing knowledge
between members in an organization,
periodic reward will get better results. It
does not only increase the action of
sharing knowledge, but also make
agents to adopt the strategies trending
toward sharing knowledge. Periodic
reward is helpful to form a trustful
organization climate. However, in some
circumstances, it may get minus effects.
Key
Words:
Knowledge
Sharing,
Agent-based
Modeling,
Organizational
Incentive
Policy,
Game Theory, Organization Behavior.
二、計畫緣由與目的
在許多的組織中,知識扮演著重
要的角色。在最近的幾十年,經理人
已經體認到知識可為組織所帶來的競
爭優勢。為保持與獲取組織的競爭優
勢,許多的組織投入了大量的資源來
建構知識管理系統及促進組織中成員
的知識分享。然而許多的知識管理系
統最終還是無法有效地成組織中成員
的知識分享的行動而失敗收場。根據
以下的分析,對這個問題的一個可能
的解釋。假如一項特定的知識對組織
而言是一項重要的競爭的優勢與策略
性的資源,對於擁有該項知識的成員
而言,也是他在組織權力與利益的來
源。該成員因為這些獨特的知識在組
織享受某些利益與地位。如果這項知
識分享與他人則將可能損害他在組織
中所享有的利益。因此,組織中的知
識 的 分 享 涉 及 了 “ 社 會 因 境 ”
【Dawes 和 Messick,2000】與個別成
員、群體、組織政策間複雜互動。
本研究主要是探索在自私(或者
說自利)為基礎的人類行為與不同的
組織激勵知識分享的政策如何交互影
響。從過去相關的研究來看,許多的
實證研究與概念模型已經廣泛地運用
數理的模式建構出來。但是這些研究
所面臨的共同困境是不容易進行分析
性的推論。因為複雜的社會互動並不
容易利用數學的函式表示。組織成員
知識的吸收與傳遞的能力不同,亦會
使分析更加地困難。在本研究中運用
代理人基礎塑模的方法,設計不同的
個體的特徵與組織的激勵措施,經由
模擬組織中成員的互動,以探索組織
中 知 識分 享的 現象 。 經由 此模 擬 系
統,經理人可了解組織複雜的知識分
享現象與不同組織激勵政策的效果。
組織中推動知識管理的主要目的
之一,就是要改善或是促成個人間知
識分享與部門之間的知識移轉。如果
組織的成員能夠利用與分享他工作上
的知識,則組織與個人都會成長。如
果知識在組織中不能被有效地分享,
知 識 在 組 識 有 就 會 逐 漸 地 消 失
【Teece,1998】。為了促進組織成員
知識分享許多不同的影響因素需要被
確認。這些因素可被簡單地歸類成三
個 層 次: 組織 、個 人 與 知識 的 層次
【Yang 和 Chen,2007】。個別來看在
組 織 層次 被指 出來 的 因素 包括 了 文
化、權力、技術、組織的能力、組織
的氣候與社會的結構。在個人的層次
上影響因素包括了動機、信任、社會
資本、自我效能、產出的預期、吸收
能力等【Sun 和 Scott,2005;Bock 等
人,2005;Levy 等人,2003;Hsu 等
人,2007;Wasko 和 Faraj,2005;Angel
等人,2006;Chou,2005;Snejina 和
Kenneth,2004】。在知識的層次上,
知 識 的特 徵將 會影 響 知識 分享 的 結
果。從知識的層次來看,我們發現了
一個有趣的現象,甚少有研究從個人
知識的經濟價值出發來探討組識知識
分享的行為,大部份的研究將焦點置
於內隱知識移轉上。
從經濟理論的觀點,知識的稀少
性將會決定知識本身的經濟價值,而
不是由知識是外顯或是內隱來決定其
經濟價值。知識本身的內隱程度是與
其轉移的成本相關。組織所需的知識
愈稀有,其對組織的經濟價值愈高。
如果個人所擁有知識對組織來講是稀
少且重要的,其將可將從組織中取得
重大的利益。也就是說,當他們將這
些知識分享與他人時,他們在組織中
的優勢與利益可能受到損害,在這樣
的情況下,組織成員為什麼要將他們
所有特有且對組織有用的知識分享與
他人呢?對於這個問題,目前我們所
知甚少。
根據以上的討論,當在探索組織
中成員知識分享的行為時,知識依其
經濟的 價值來分類 是 有其必 要性。
Becerra-Fernandez
【Becerra-Fernandez 等人,2004】 等
人所提出來的架構,有助於吾人區別
不同經濟價值的知識。依照他們的論
點,知識可分為一般性知識與特定的
知識。一般性的知識被廣大群眾所擁
有,且容易在個體之間移轉。例如,
標準作業流程可視為一般性的知識。
相對地,特有的知識只被少數人所擁
有,而且不容易移轉。特定的知識可
以是技術性知識,也可以是情境性知
識。技術性的特定知識是對某一特定
領域的深層知識。這類的知識包括了
對工具與技術的知識,在特定的領域
中用以解決某些問題。例如醫師、工
程師等。情境性的特定知識則是關於
在特定的時空條件之下讓工作可以被
執行的知識。
三、研究架構與系統建構
本節將敘述本研究的目標與本研
究所用代理人基礎模型【Axelrod,
1997;Axelrod,1984】的特徵。
(一). 研究問題與目標
在本研究運用 Repast【Collier
等人,2006】工具箱配合 JAVA 程式語
言來發展與實做代理人基礎模型,建
構一個代理人基礎模型,在此模型中
將呈現(1)組織中成員的行為規則,(2)
知 識 在成 員之 間分 享 產生 的個 人 報
酬,(3)組織成員對知識分享與吸收的
能力,(4)代理人知識分享網路之構形
與(5)組織的激勵成員分享知識的政
策。雖然還有許多的因素會影響組織
成員的知識分享行為,這個簡化過的
模型是一個好的開始。
所以原則上在此模型中總體層次
所浮現出來的現象是來自於在個體層
次的軟體代理人的互動。以下有三個
問題是在本研究要處理的:(1)根據不
同類型的知識分享所產上報酬,在沒
有任組織的措施介入的條件下,組織
中成員可用的策略的組合,將如何影
響組織的行為、氣候【Schneider,
1975】與知識分享的績效?(2)給定不
同類型的知識分享的報酬,配上不同
知識分享的激勵政策,將如何影響組
織的行為、氣候與知識分享的績效?
(3)代理人所處之知識分享網路之構
形將如何影響組織的行為、氣候與知
識分享的績效?
在個體的層次上,有四個問題是
在本研究中要處理的。(1)不同類型的
知 識 如何 影響 代理 人 的知 識分 享 行
為?(2)組織的激勵政策如何影響代
理的知識分享行為?(3)不同的知識
分享與吸收的能力如何影響代理人的
行為?(4)不同知識分享網路之構形
將如何影響代理人的行為?
(二). 知識分享的報酬
假設每一單位的知識對每一個代
理人而 言都具有相 同 的價值 或是效
用,並且每一代理人都具有一些其他
代理人所沒有的知識。在此條件下,
對每一個代理人而言知識分享的效用
由以下三種元素所構成:
1. 對每一個知識的接收者而言,所得
的知識具有一定水準的基本價
值,在此定義為 R,R≧0;
2. 因為彼此相互分享知識所帶來的綜
效,是分享者雙方都可以獲得,
在此定義為 S,S≧0;
3. 因為分享知識給對方而感受到的自
我效用的損失的程度,這種損失
來自於自身因知識所享有的獨特
利益部份被移轉到他人身上,當
代理人 A 將某項知識分享與代理
人 B 時,代理人 A 所感受到的效
用的減損,定義為-L
A;當代理人 B
將某項知識分享與代理人 A 時,
代理人 B 所感受到的效用的減
損,定義為-L
B,但是這些效用的
損失並不會超出本身的基本價
值,0≦L
A,L
B≦R.
假設每一個代理人知識的分享與
吸收的能力都相同,在每一次雙方進
行知識分享的互動時可以獲得效用,
取決於對手的行為。舉例來說,假如
代理人 A 與 B 相互分享知識,他們會
因為從對方身上得到一項知識而提升
他們的效用(R),也會因彼此在知識的
互 動 過 程 中 得 到 一 個 額 外 效 用 ( 綜
效,S),但是因為雙方都有拿出其知
識分享與他人,使其所享有的知識獨
佔的利益受到某種程度的減損(-L
A,
-L
B)。第二種情形是一方分享知識,但
是另一方並未分享知識,例如代理人 A
分享他的知識與 B,而代理人 B 沒有分
享知識給 A,這種情況下,代理人 A 將
受到損失(-L
A),而代理人 B,從 A 身
上得到新的知識,提升其效用(R),而
因為只有單方分享知識並不會產生綜
效(S)。如果雙方都沒有分享知識,則
雙方都不會有效用的提升或是減少。
表 一描述了互動的雙方在一次知識
分享的互動可能得到的報酬的情況。
表 一. 報酬矩陣(每一個人的知識分享與吸收的能力是屬於優異)
Player A 分享知識 不分享知識 Player B 分享知識 R+S-LA R+S-LB R -LB 不分享知識 -LA R 0 0 Legend R: 從對手所得知識的基本價植, R≧0. S: 相互分享知識所得之綜效, S≧0. -LA:因為獨特知識分享與他人造成 Player A 認知的效用損失, 0≦LA≦R. -LB: 因為獨特知識分享與他人造成 Player B 認知的效用損失0≦LB≦R.接下來考慮有組織有實施知識分
享的激勵政策的條件下,每一個分享
知識與他人的代理人都會得到組織的
獎勵,對每一個代理而言,這獎勵產
生的效用(定義為 I,I≧0)是一樣的,
組織的獎勵多少可以彌補分享知識的
一方其效用的損失。表 二加入了組織
的激勵政策所帶來的雙方在進行知識
分享時報酬的變化。
表 二. 報酬矩陣(每一個人的知識分享與吸收能力都是優異且組織有提供獎勵)
Player A
分享知識
不分享知識 Player B 分享知識 R+S-LA+I R+S-LB+I R -LB+I不分享知識 -LA+I R 0 0 Legend R: 從對手所得知識的基本價植, R≧0. S: 相互分享知識所得之綜效, S≧0. I: 組織給予的獎勵效用, I≧0. -LA:因為獨特知識分享與他人造成 Player A 認知的效用損失, 0≦LA≦R. -LB: 因為獨特知識分享與他人造成 Player B 認知的效用損失0≦LB≦R.
表 三呈現了不同的知識分享與
吸收能力的條件下,雙方在進行知識
分享互動時報酬的變化。知識分享的
能力(定義為 Cs)與知識吸收的能力
(Ca)指出了在知識移轉與吸收時因為
能力的差異,造成無法完整地傳遞與
吸收知識。這是在真實世界中常見的
現象。 像有些人可 能 擁有豐富的知
識,但是他不見得可以將他的知識完
整地傳遞給他人。或者是有些人想要
努力地學習某項新知識,但是不一定
可以完 整地將新知 識 學習起 來。所
以,知識的分享與學習的能力將會調
節知識分享的效果。
表 三. 當代理人知識的分享與吸收的能力存有差異時之報酬矩陣
Player A
分享知識
不分享知識 Player B 分享知識 R*CsB*CaA+S+I -LA*CsA*CaB R*CsA*CaB+S+I -LB*CsB*CaA R*CsB*CaA -LB*CsB*CaA+I 不分享知識 -LA*CsA*CaB+IR*Cs
A*Ca
B0
0
Legend: R: 從對手所得知識的基本價植, R≧0. S: 相互分享知識所得之綜效, S≧0. I: 組織給予的獎勵效用, I≧0. -LA:因為獨特知識分享與他人造成 Player A 認知的效用損失, 0≦LA≦R. -LB: 因為獨特知識分享與他人造成 Player B 認知的效用損失0≦LB≦R.. CsA, CsB: player A 或 B 知識分享的能力,0≦CsA, CsB≦1. CaA, CaB: player A 或 B 知識吸收的能力, 0≦CaA, CaB≦1.(三). 實驗設計
在本節將對各項不同的參數設計
與配置的方式進行說明,包如知識分
享報酬矩的設計、代理人的策略、組
織的激勵政策、成員的知識分享與吸
收 能 力、 代理 人的 學 習與 適應 的 機
制、與系統運作的方式進行說明。
1. 知識分享的報酬矩陣
依據上節對代理人知識分享的報
酬分析,另外考慮不同的知識類型,
在本模型中設計了三種報酬矩陣來進
行相關的模擬實驗:
第一種類型知識分享報酬矩陣:分享與
他人對原來的知識擁有者會有效用的
減損,但是相互分享卻不會產生綜
效。為了能在模擬系統中操作此現
象,依據上述的報酬矩陣令 R=5,L=2
且 S=0。其報酬矩陣如表四所示。
第二種類型知識分享報酬矩陣:分享與
他人對原來的知識擁有者不會產生效
用的減損,但是相互分享也不會產生
綜效。因此,令 R=5,L=0 且 S=0。其
報酬矩陣如表五所示。
第三種類型的知識分享報酬矩陣:分享
與他人對原來的知識擁有者會有效用
的減損,但是相互分享也會產生綜
效,如產生新的有用知識。因此,令
R=5,L=2 且 S=5。其報酬矩陣如表六
所示。
表 四
. Type I 報酬矩陣
Player A
分享知識
不享知識
Player
B
分享知識
3
3
5
-2
不分享知識
2
5
0
0
表 五. Type II 報酬矩陣
Player A
分享知識
不分享知識
Player
B
分享知識
5
5
5
0
不分享知識
0
5
0
0
表 六
. Type III payoff matrix
Player A
分享知識
不分享知識
Playe
r B
分享知識
8
8
-2
5
不分享知識
-2
5
0
0
2. 代理人的策略
在此模擬系統中,每一個代理人
都會採用一種策略。策略說明了代理
人的行動,及如何回應其他代理人行
動的規則。在模擬系統的運作的過程
中,不同的時間點上各種策略被採用
的次數將以時間序列的方式呈現,我
們將可藉此猜測整個組織氣候是否傾
向 於 信 任 的 氣 氛 。 根 據 文 獻
【Axelrod,1997;Axelrod,1984;
Yang 和 Wu, 2006 ; Chiong 等 人 ,
2006】,本研究中代理人策略的選擇,
分別可為「完全合作」、「以牙還牙」、
「欺善怕惡」、「完全不合作」與「不
信任」。藉由代理人採用策略的變化
來研究對代理人行為與組織績效的影
響。以下是五種策略規則的說明:
(1) 完全合作(Cooperative):不管對手
的行為為何,代理人總是會分享知
識與他人。
(2) 以牙還牙(Tit-for-tat):第一次互動
時分享知識給對方,之後根據對手
的上一次的行動而行動,也就是對
手上次分享知識,代理人就分享知
識,上一次互動對手沒有分享知
識,這次就不分享知識與對手。
(3) 欺善怕惡(Bullying):第一次互動時
不分享知識給對手,之後根據對手
的行動採行相反的行為,也就是上
次對手分享知識,這次我就不分享
知識;上次對手不分享知識,我就
分享知識。
(4) 完全不合作(Uncooperative):從一
開始不管對手如何做,代理人就是
不會分享知識。
(5) 不信任(Mistrustful):第一次互動時
不會分享知識給對方,之後根據對
手的上一次的行動而行動,也就是
對手上次分享知識,代理人就分享
知識,上一次互動對手沒有分享知
識,這次就不分享知識與對手。
以上的策略存在著一個假設:每
一個代理人只有一步的記憶。意指每
一個代理人只會記著對手上一次的行
動,更之前的對手行為並不會影響代
理人的決策。代理人的行動策略在此
模擬系統中是一個外生的變數,在進
行實驗時,我們設計了四種的策略組
合 來 模擬 組織 成員 的 相互 信任 的 狀
況,此四種組合分別為:{完全合作,
以牙還牙,欺善怕惡,完全不合作}、
{完全合作,以牙還牙,欺善怕惡,完
全不合作,不信任}、{以牙還牙,欺
善怕惡,完全不合作,不信任}、{完
全合作,欺善怕惡,完全不合作,不
信任}。每一個代理人在一個時間點上
只能使用一種策略,在模擬系統在一
開始會以隨機的方式帄均將不同的策
略指定給代理人。不同的策略也分別
表現代理人對其他成員的信任程度。
3. 成員的知識分享與吸收能力
知識分享與吸收的能力將會影響
代理人在進行知識分享的報酬水準,
也有可能影響代理人的行為。在設計
實驗時,研究者以不同的機率分配函
數來描述組織成員知識分享與吸收的
能力。四種類型的群體知識分享與吸
收的能力的條件,應用在此研究中,
分別是:
(1) 優異(
Uniformly intelligent
):全部的組
織成員可以完整地分享與吸收知
識;
(2) 聰明(
Smart distribution
):組織成員知
識吸收與分享的能力呈現為左傾
(left-skewed)的貝他機率分配函
數,參數
α=5,β=2。
(3) 普通(
Normal distribution
):組織成員
知識吸收與分享的能力呈現為常態
機率分配函數,參數
μ(mean)=0.5 ,
σ
2(variance)=0.16.
(4) 駑鈍(
Stupid distribution
):組織成員
知識吸收與分享的能力呈現為右傾
(right-skewed)的貝他機率分配函
數,參數
α=2,β=4。
4. 組織的激勵政策
在實驗中設計了三種類型的組織
激勵政策以探討組織激勵政策對組織
成員的知識分享行為產生的短期與長
期的效果。另外,不同的獎勵的水準
代表了對代理人分享知識的效用損失
的彌補程度。不同的激勵政策與獎勵
水準設計如下:
(1) 不獎勵:對組織成員知識分享的行
為不給予任何的獎勵。
(2) 即時對每一個知識分享的行動給
予獎勵:當組織成員分享知識與他
人時,馬上可以得到的組織的獎
勵。另外,假設了兩種不同類型的
獎勵水準:(1)組織所給予的獎勵只
能夠部分彌補分享知識所損失的效
用。在系統中,研究者運用演算法
的設計,隨機在 0 與 2 之間(表示為
[0,2])取一個浮點數做獎勵的水準。
(2)組織所給予的獎勵水準其效用超
出分享知識所造成的效用損失。系
統將在 2 與 5 之間(表示為[2,5])隨機
取一個浮點數做為獎勵的水準。
(3) 定期審視給予獎勵:組織會定期地
審視個別代理人知識分享的互動,
如果分享知識行動的比例超過其全
部行動 50%,則組織給予一個固定
的獎勵值。在系統中設計十種獎勵
的水準來實驗其效果,分別為: 30,
50, 70, 90 和 110。
5. 代理人知識分享的網路
代理人知識分享網路的構成方式
及變動的頻率對代理人的知識分享的
行為會造成何種影響?及如何影響組
織知識分享效果?在本研究中,根據
相關的文獻研究者分別實驗了七種網
路的構成方式。每一週期內,代理人
之間一對一的互動共會進行四次的互
動。代理人的知識分享的互動網路,
表現了三點特性:
1. 代理人互動的關係是長期或是
短暫的,代理人是否只與特定
互動對手互動,或是經常更換
互動的對手。
2. 代理人所連結的互動對象是在
自身附近的範圍,或者是會較
跟較遠的對象互動。
3. 代理人之間的互動是否相應的
(Reciprocal) 、 對 稱 的
(Symmetrical),代理人之間
是否會相互主動進行知識分
享的互動,例如代理人 A 會主
動找代理人 B 分享知識,而代
理人 B 也會主動找代理人 A
分享知識,或者代理人之間互
動
是
不
對
稱
的
(Asymmetrical),例如代理人
A 會主動找代理人 B 分享知
識,但是代理人 B 不會找代理
人 A 分享知識。
以下是針對本研究中所使用知識
分享的互動網路建構的規則的說明。
1. 2DK (2-Dimensions, Keeping
locations for entire run):
在整個模擬的過程中,代理人只
與位於其上下左右四個代理人
互動。代理人與互動對手是對稱
的 (Symmetrical) , 也 就 是 若
A、B 兩個代理人在進行知識分
享時,A 主動會找 B 分享知識,
B 也會主動找 A 分享知識。
2. FRNE(Fixed Random Network of
Neighbors):分成兩個步驟來建
構代理人之間的知識分享互動
網路。首先,建立一 2DK 的網
路。而後在每一個代理人的四個
互動對象中,隨機選一個與其他
代理人(隨機選出)的互動對象
交換。一但網路建立後,在整個
模擬的過程中,代理人的互動對
象都不會改變,而代理人與對手
的互動是對稱的。
neighbors):在初始時每一個代
理人隨機選擇四個代理人做為
其互動的對象。在整個模擬過程
中 代 理 人 不 會 更 換 互 動 的 對
象。另外,代理人與對手的互動
是不對稱的(Asymmetrical)。
4. 2DS(2-Dimensions):每一個代理
人以其上下左右位置的代理人
做為互動的對象,但是模擬過程
中每一個階段,每一個代理人的
互 動 對 象 都 會 重 新 洗 牌
(Shuffle)一次。此外,代理人
與對手的互動是對稱的
5. PN(Programmed Network) :此類
型的知識分享互動網路分兩個
階段建構,第一階段先建構一個
2DK 的網路。第二階段,以 10%
的機率值為門檻對每一個代理
人所有的互動對象,測試是否要
需要更換新互動的對象,如果
是,就重新隨機抽取一個新的對
手,否則就維持原來的互動對
象。互動的網路一但建立之後,
整 個 模 擬 的 過 程 中 將 不 會 改
變,而代理人與對手的互動是不
對稱的。
6. SOUP:代理人在模擬過程中每一
個階段都會重新隨機選擇四個
互動對手。在此類型的網路構形
中,代理人之間的互動也是不對
稱的。
7. SOCIAL TAG:每一個代理人都設
有 一 個 社 會 標 簽 (social
tag),其值為介於[0,1]間浮點
數。另外,系統設有一個代表社
會 差 異 程 度 的 參 數
(SOCIAL_DIFF)其值為 0.01。此
知識分享的互動網路建立規則
如下:每一個代理人嘗試搜尋四
個知識分享互動的對象,代理人
將從其他代理人中隨機挑選一
個代理人,而後與其比較兩者代
理人身上社會標簽之值相減,取
其絕對值,若其值小於或等於系
統所設定的社會差異之參數值
(0.01),則可選為正式的互動對
象,否則再重新挑選一個新代理
人來進行以上檢核。每一個代理
人在挑選互動對象時有四次選
擇的機會,若挑選四次之後,都
沒有符合條件的對象,則將最後
一 個 所 選 的 代 理 人 為 互 動 對
手。上述規則反覆執行,直至四
個互動對手選齊而止。此知識分
享的互動網路,代理人間的互動
是不對稱的。
6. 代理人學習與適應的機制
在系統中每一個代理人所用的策
略並非是一成不變的,假設代理人可
以在每一輪互動周期中觀察到與其互
動的所有代理人的策略及所得到的帄
均報酬水準,假如與所有跟他互動的
代理人相較,有一個代理人他的策略
所得到的帄均效用水準是最高,則他
可能學習(模仿)他所用策略,但是這
種學習並非是絕對會發生,系統中設
計了 20%機率代理人會改變原來的策
略,學習贏家的策略。
7. 模擬系統的運作
圖一呈現了本研究的模擬架構與
所涉及的相關參數,代理人的活動空
間由一個 500x500 的二維空間所組成
(圖 二所示),每一次模擬將產生 625
個代理人。進行模擬實驗時,將不同
知識報酬矩陣、代理人分享與吸收之
群體能力類型、代理人知識分享網路
之類型、組織的激勵政策類型相關參
數之組合來進行實驗,其參數組合在
有 672 種(=3*4*7*8) 。 總共 要 進行
6,720 次實驗(=672*10)。系統根據給
定的知識分享網路與互動過程,代理
人依所給定的行為規則,與每一個互
動對象每個回合進行 4 次知識分享的
互動,在一個回合(Tick)下來全部的
代理人都完成互動之後,各自計算其
所得帄均報酬,依系統所設計行為策
略學習與調應(Adaption)規則,代理
人各自進行為策略的調整。然後再重
複進行互動。每一個模型,每一組參
數,在每一次模擬,將進行 500 回合
的互動,其演算法如圖三所示。系統
會在每 一個週期中 收 集代理 人的行
動,所用的策略、報酬的統計等資料,
且相關的變數的變化會顯示於監控之
畫面中,如圖四所示。最後,研究者
將此十次最終的實驗結果計算其帄均
值,做為資料分析之依據。
圖 一 模擬的架構圖三 模擬的演算法
圖二 代理人互動的空間在每一次(Run)模擬:
{
初始化組織激勵政策;
While(代理人數量<=625) //初始化 625 個代理人
{設定代理人行為策略;
設定代理人知識分享能力值;
設定代理人知識吸收能力值;
設定代理人社會標簽;
};
初始化代理人知識分享的互動網路;
While (Tick<=500):
{
更新前階段互動的相關資訊。
每一個代理人與其所連結的對象,進行四次互動;
計算在互動中所得之帄均報酬。
依調適的規則,代理人進行策略調整。
調整代理人知識分享的互動網路。
}
}
(1)
(2)
(3)
(4)
圖四系統運作時相關變數之監測(1)各種策略代理人數量變化,(2)組織累積報酬與激勵成本,
(3)各種策略代理的帄均報酬之變化與(4)代理人分享與不分享行為統計量之變化。
表 七.模擬參數組態摘要表 參數名稱 類型 值 說明 WorldSize 625 代理人的數量 Neighborhood 4 系統初始時每一個代理人所設定互動對象的數量。 MaxIter 4 每一回合代理人兩兩互動時的次數。 RewiringPro 0.1 用於建構 PN 類型的 Topology 所用的重新選擇對手的機率值 Topology FRN 0 代理人知識分享之網路類型 FRNE 1 PN 2 2DK 3 2DS 4 SOUP 5 SOCIAL_TAG 6 Payoff Type1 1 Type 2 2 Type 3 3 Strategy ALLC 0 TFT 1 ATFT 2 ALLD 3 MIST 4 CapCode INTELLIGENT 0 代理人群體能力 SMART 3 NORMAL 1 STUPID 2 IncentiveMode NO 0 組織激勵政策 [0,2] 1 0<= I <=2 [2,5] 2 2<= I <=5 30 30 50 50 70 70 90 90 110 110 pAdapt 0.2 代理人改變策略的機率。