第三章 :模型架構與設計
3.1 二分關聯網路
我們將人與人之間的社會距離轉換成群組的概念,每個人都會屬於幾個群 組,而群組在我們的模型中就是所謂的場所,透過這種轉換方式得到二分關聯網 路。例如:在二分關聯網路中,志朋和小白是同一間公司的員工,他們兩個同處 一個脈絡,兩人就當作是有關聯。所以我們將二分關聯網路當作是實際社會網路 運作的平台,如果兩人之間沒有同時隸屬於同一個群組或場所,表示他們之間缺 乏關聯性,那麼兩人之間接觸的機會就很小,流感透過他們之間的關聯來傳染可 能性就很低。
圖 7. 二分關聯網路示意圖。上層節點代表個體、下層節點代表場所。
對於二分關聯網路而言,我們必須考慮兩個因素:
1)場所容納人數(每個場所可以容納多少人)。
將場所的容納人數取Power-law的分佈 [17],例如:住家、辦公室等,這些 場所的容納人數少,但場所數多;而像餐廳、公司室內休閒運動場、超級市場、
大賣場、電影院 (竹科人員下班或休假也會去這些場所),這些容納人數多,但 是場所數卻遠小於住家、辦公室的個數。例如:一般人選擇餐廳吃飯,大部分可 能會找一些已經有人用餐的餐廳,而不會去找一間沒人的餐廳。依照這樣的假設
個體
場所
也符合真實社會環境,一些熱門的場所總是會吸引很多人進入。
場所分佈可分為常態分佈(uniform)與無尺度分佈(power- law)兩種不同 的分佈。
1. 常態分佈:根據平均值,不管比平均值高或低,數值離平均值差距越多,所 發生的機率越低。
例如:調查某公司 1550 位工作人員平均年齡,如果 1550 人的平均年齡是 30-39 歲,年齡離 30-39 歲越遠的人,所占比例越少。所以在平均值發生的機率 是最高,隨著與平均值的距離,曲線隨指數快速下降。
0 200 400 600 800
15~19歲 20~29歲 30~39歲 40~49歲 50歲以上 年齡
人數
圖 8. 常態分佈圖
2. 無尺度分佈:又稱為冪次律,連接次數越低而產生的機率越高,但連接數越 高所發生的機率隨指數下降。美國科學家 A.L.Barabasi 等人用統計物理學的實驗 方法發現絕大多數網站的連接數都很少,但卻有極少數網站擁有高於普通網站百 倍、千倍甚至萬倍的連接數,由原先正態分佈的隨機模型轉變為冪次分佈的無尺 度模型 [17] 。
圖 9. 網站的連接數呈無尺度分佈圖。
2)個體分身點數(每個人的分身點數該如何分配)
為了讓人口與個體的社會分身點數量可以更貼近竹科,我們依竹科行業人 口比例進行抽樣問卷調查,依照問卷統計值決定分身點數。為了讓模型可以更符 合真實的竹科,考慮了固定分身點和隨機分身點。(圖 10∼12)
固定分身點:表示個體每天上班固定會去的場所,例如:家庭、工作場所等,
個體選擇此類場所以完全隨機的方式選擇,不考慮目前場所的容納人數多寡。
隨機分身點:表示個體假日或平日下班會去的的場所,例如:、電影院、超 級市場、百貨公司、KTV、服飾店等,通常個體會選擇熱門的場所,根據場所目 前容納人數的多寡,來判斷對個體的吸引力。在竹科問卷中,很多人上班日都只 會去 1∼2 處場所(業務人員除外為 7∼9 處),這或許是竹科上班工作壓力大,
因此下班後就很少去消費娛樂。而休假日會去的場所為 3∼4 處居多,顯示竹科 人員假日會回家或出門消費,因為問卷顯示竹科來自外地人口(非新竹縣市)佔 了 63%。我們依行業人口比例進行抽樣的問卷調查,樣本數為 1630,扣掉 28 份 無效問卷,有效問卷數為 1602 份,以竹科管理局 20080313 公布的資料看,男女 比例為 55:45,而我們問卷男女比例為 55.2:44.8,以竹科目前少數公開的統計 資料來看是蠻符合實際狀況的,至於其他資料,如各職務分類的男女比例,外地 人口比例..等等,因為目前沒有相關的實際資料,所以目前無法驗證這些項目問 卷和實際竹科社會網路的相關度。
線上人員
佔竹科總人口 職務分類 的比例
固定式 社會分身點
隨機式 社會分身點
男 女 業務人員 1~8 常態分佈 0~80 無尺度分佈 0.076 0.014 行政人員 1~3 常態分佈 0~50 無尺度分佈 0.018 0.092 工程人員 1~3 常態分佈 0~50 無尺度分佈 0.32 0.06 線上人員 1~2 常態分佈 0~50 無尺度分佈 0.03 0.26 其他 1~3 常態分佈 0~50 無尺度分佈 0.108 0.0022
表格 1. 根據職務分類有不同的分身點配置。
業務人員:固定會去的場所(例如:家中、工作場所等)因為工作關係較其 他職務分類的人員多,平均固定分身點為 1~8 處。
行政、工程、其他人員:平均固定分身點為 1~3 處。
線上人員:由於線上人員有一項特殊的工作場所:無塵室,考量到無塵室因 為有負壓將微塵向下吸,再加上人員都穿無塵衣戴口罩,會隔離飛沫及接觸傳 染,因此在無塵室即使短距離(2 公尺內)所接觸人員也難以傳染流感,由於線 上作業人員的工作場所不會感染因此忽略而減一個場所,因此我們設為 1∼2 平 均固定分身點。
而關於隨機式社會分身點的配置,基本上隨機分身點為下班後或假日會去的 場所,以 0~50 的無尺度分佈來表達某些特殊的情況,例如:有些人假日那兒都 不去,而極少數個個體假日甚至下班後到處游走,而業務人員下班後有可能要陪 客戶交際應酬,所以隨機分身點的上限也較多,我們設定 0∼80,基本上幾乎不
會到 80 個分身點,最多大概在 50 左右,但在無尺度分布上,數字越大發生的機 率雖然越低,但並不能肯定絕對沒有,基於一天的時間只有 24 小時,所以隨機 分身點也有個上限。隨機分身點的上下限點採取一個 power- law 的分佈曲線。
在本論文中所提出的二分關聯網路應用於新竹科學園區,有二點看法:
(1) 上下層節點數不同,竹科的員工不少(上層節點),因廠房不少,因此場所 數也不少(下層節點)。
(2) 竹科平日的隨機式社會分身點的數目普遍較少。可能由於竹科工作較繁忙,
下班通常較晚,比較不會再去別的場所而直接回家休息,通常假日才會去一些地 方或回家,因為問卷調查結果有 63%的外地人口,判斷假日才有較多隨機式社會 分身點的發生。
我們的建立二分關聯網路的目的是在於轉換成電腦模擬底層的日常生活接 觸網路與新型流感監測系統專用的場所關聯網路。日常生活接觸網路主要是利用 人與人之間的關聯強弱,來建立人對人的網路,再深入去探討流感在竹科的動態 傳播以及公衛政策的制定;而場所關聯網路是提出一個新式的疾病監測系統。以 下小節將深入去說明日常生活網路與場所關聯網路。
圖 13 . 二分關聯網路的轉換圖。
日常生活接觸網路 二分關聯網路
場所關聯網路
3.2 日常生活接觸網路