四、 研究方法
4.2 流行病風險指標效益評估
4.2.2 根據模型計算命中率評估
每當新興流行病來臨時,如果能夠準確的預估出高風險的行政區將會更有助於預 防政策的實施,有效降低新興流行病帶來的殺傷力。因此除了知道各行政區的染 病風險程度排序能夠提供衛生單位政策實施的參考,若能夠再針對實際流行病資 料中危險程度較高的行政區,進一步分析本模型對於這些高風險地區的命中率,
也將有助於驗證本模型的計算結果。
依據標準差的組距觀念,本研究將實際資料中前 50%的高風險行政區分為前 17.5%以及 17.5%~50%兩個組距,並且觀察本模型計算結果所預估的前 50%高風 險行政區,於此兩個組距與實際資料的重疊性來計算染病人數命中率與行政區命 中率。以下將詳細介紹染病人數命中率與行政區命中率計算方式。
以表 4-1 中危險程度前 17.5%組距的行政區為例,染病人數命中率的計算方 式為:
28
本模型命中之行政區染病人數總和
實際資料之行政區染病人數總和 = 30 + 26 + 20
30 + 26 + 20 + 10≅ 0.88
表 4-1 染病人數命中率
因此本模型計算結果於危險程度前 17.5%組距的染病人數命中率約為 88%,此外 參考圖 4-4,行政區命中率的計算方式為:
重疊之行政區數
實際資料之行政區數+計算結果之行政區數 − 重疊之行政區數
= 3
4 + 4 − 3=3
5= 0.6
由此範例計算方式可得本模型於危險程度前 17.5%組距的行政區命中率為 60%,經由比較本模型計算結果於兩個組距的染病人數命中率與行政區命中率,
提供有別 4.2.1 節所述相關係數檢定的方式,進而驗證本模型計算結果的正確 性。
29
圖 4-4 行政區命中率概念圖
30
4.3 基因演算法
在本文中使用基因演算法來幫助模型搜尋計算遞移特性的各項參數,每條染色體 都代表一組可能的參數解,並且以 4.2 節的驗證方法為適應函數(Fitness Function)
來求解適應值最高的參數組合。以下將先以圖 4-6 的流程圖呈現概念,接著詳述 本研究於基因演算法各步驟的詳細設定方式,後再以表 4-1 的步驟設定來整理基 因演算法的各個變項設定:
圖 4-5 基因演算法流程圖
(1) 染色體編碼方式(Encoding):
根據 4.1 節所述,本模型計算公式中包含 d、dayTime、w1、w2、w3、w4六 個觀察遞移特性的參數,各參數皆從 0~1 呈實數分佈並且都使用十個二進位的數 字來編碼,因此染色體一共包含六十個二進制的數字,其內容為:
31
(d d ⋯ d , dayTime dayTime ⋯ dayTime ,
w1 w1 ⋯ w1 , w2 w2 ⋯ w2 , w3 w3 ⋯ w3 , w4 w4 ⋯ w4 ) 以下列式子為例,在本文中將二進位編碼轉換為真正代表參數數值的方式為 將各個參數由二進位制轉換成十進位制之後再除以(2 − 1)以進行染色體編 碼的轉換:
1000000001 = 513 513 / (2 − 1) ≅ 0.5015 如此便可獲得各項參數實際值與染色體內表示法的轉換。
(2) 初始化與群體大小設定(Population、Initialization):
在初始值方面,本模型使用隨機亂數的方式來產生基因以構成染色體,並且 設定原始群體內的染色體數為 100 條。
(3) 適應函數(Fitness Function):
在適應值方面,使用本文 4.2.1 節所述驗證方式做為基因演算法的適應函數
(fitness function),以評估每條染色體的適應值。
(4) 挑選染色體方式(Selection):
本模型中使用競賽挑選(Truncation selection)與輪盤式挑選(Roulette Wheel selection)來從交配池中挑選欲交配的母代染色體。
在使用競賽挑選時,將從交配池(mating pool)中隨機搜尋兩條染色體以進 行下一步的演化動作,意謂每條染色體無論適應值高低,被挑選出來的機率皆相 等。而在使用輪盤式挑選時,會依據每條染色體的適應值高低決定被挑選出來的 機率,意即適應值越高其被挑選出來的機率就越高,此種作法的缺點在於適應值 高的染色體可能被大量複製,造成群體及早產生收斂的情形。
32
本模型使用兩種挑選模式進行比較,觀察就兩種挑選模式所搜尋出來的解是 否根據其挑選的特性能夠搜尋出不同的解集合,比較適應值以及染色體的演化狀 況,並且將以表現狀況較佳的模式為主。
(5) 交配方式與突變方式(Crossover、Mutation):
在經過挑選模式選出欲交配的染色體後,本模型使用兩點式交配(Two-point Crossover)來使母代交換六項參數的基因組成以期產生適應值更高的子代。在交 配過程中,隨機選擇兩個交配點將染色體分成三段,並將兩條母代染色體交換中 間段的基因產生兩條子代以達到基因交換。
接著本模型將交配後的兩條子代染色體的基因進行突變操作,突變的方式採 bit-by-bit 並設定突變率為 0.001。突變進行的方式是從子代染色體中的六十個二 進位數字,從最高位元至最低位元一個個位元根據突變率決定是否產生突變。當 完成突變操作時會將子代放入新的交配池中,一旦新的交配池中染色體數目足夠,
將捨棄舊的交配池並以新的交配池再進行下個回合的演化。
(6) 終止條件與結果篩選(Termination condition):
基因演算法演化達到 X 個世代後若染色體的適應值曲線達到平穩即停止演 化,其中 X 初始設定為 1000。
本模型設定基因演算法模擬共十回合,每回合在經過 X 個世代的演化結束 後,將保留所有染色體中適應值最高的十條染色體,如此演算法在十個回合結束 後便可獲得 100 條染色體。接著便分析所有染色體中六項參數的分佈、中位數及 平均數,觀察六項參數於各染色體的變化以及異同之處。
33
Genetic Algorithm Variables Setting
Encoding Binary Population & Initialization 100~200、Random
Selection
Truncation Selection、
Roulette Wheel Selection Crossover Two-point Crossover Crossover Rate 0.8
Mutation Bit-by-bit Mutation Rate 0.001 Simulation Round 10
Termination condition 1000 Generations 表 4-2 基因演算法參數設定
34
5 五、實驗結果
本研究以流行病在台灣 353 個鄉鎮市以及 22 個縣市間的傳播來進行網路遞移的 實驗模擬,並收集真實流行病病例資料進行驗證比對。本章節分成四個部分,第 一個部分設定總交通旅運網路的構成參數以及模型其餘參數,並以敏感度分析探 討實驗結果與真實資料驗證的正確性。第二部分使用基因演算法搜尋模型中的參 數組合,設定總交通旅運網路由短程網路以及台鐵網路所構成並以短程網路為主 體架構(短程網路權重為百分之百),觀察何種參數組合會使實驗結果與真實 H1N1-A 型流感、71 型腸病毒病例驗證相關性最高並分析參數組成及驗證結果是 否能反映現實情況。第三部分加入高鐵及航空等長程交通旅運網路探討流病經由 長程網路的傳播能力。第四部分只採取高鐵及航空兩種長程交通旅運網路與第二 及第一部分做出比較驗證。第五部分則是將總交通旅運網路去除以短程網路為主 要架構的設定,改為所有本研究所調查的旅運網路搭配而成,進行模擬並分析實 驗結果。其中基因演算法所搜尋到的各項參數在本章節將取出最佳解染色體進行 分析,而所有的染色體參數解分佈則收於附錄。