第二章 文獻回顧
第三節 物種分布模式
一、概述
物種分布模式(Species distribution models, SDMs)是透過已知的物種分布資料 與環境特徵,以了解或推估生物在地理景觀中的分布狀況。回歸方法、自然地理 學與地理資訊系統的發展,使物種分布模式模擬與繪圖的功能更為完備(Elith &
Leathwick, 2009)。
回歸方法常使用多元線性回歸和判別函數分析(Stauffer, 2002),處理的資料形 式屬於出現-未出現( presence-absence)。在廣義線性模型出現後(Generalized linear models, GLMs),使基於回歸方法的物種分布模式更具有複雜性與真實性,GLMs 中的數學方法,如:非常態分布(non-normal distributions)、加法項(additive terms)、
非線性擬合函數(nonlinear fitted functions)等,也是目前許多模式的關鍵基礎。而在 實際情況下,常因為物種偵測率或是種間競爭等原因,不容易取得正確的不存在 資 料 , 能 夠 處 理 出 現 (Presence-only) 資 料 的 模 式 因 此 被 發 展 出 來 , 例 如 : GARP(Genetic Algorithm for Rule-set Prediction)(Stockwell, 1999)與 MaxEnt(Phillips et al., 2006)。
空間資訊科學的發展提供了新的資料與方法如:數值高程模型、內插的氣候
最大熵原理(maximum-entropy principle) 最初起源於統計力學,已在多個領域 中利用不完整的資料進行預測或推估,能確保在有限資料下建立的近似分布,能 滿足目標未知分布中任何已知的限制條件,並且在這些限制下所建立的近似分布,
應具有最大熵值(Jaynes, 1957)。
MaxEnt 是目前被廣泛使用,而且也證實模式的表現優於其他物種分布模式 (Elith, Graham, et al., 2006)。MaxEnt 將研究區的網格定義為機率分布空間,已知物 種存在記錄的網格為樣點,輸入變數為氣候資料、高程等的環境變量,進行物種
值(convergence threshold)或是達到迭代次數。使用的要素越多,Gibbs 機率分布也 會越複雜,也更可能產生過度擬合(overfitting)。為避免權重 Ci無限制增大,MaxEnt 中使用正則化(regularization)設定一個較寬鬆的限制,使分布點位上的期望值接近 樣區的平均,而非完全等於平均值。
模式的評估方法,可分為閾值依賴 (threshold-dependent evaluation)與非閾值依 賴 (threshold-independent evaluation)。閾值依賴是選擇適當的閾值,區分物種出現 機率,出現機率大於閾值的區分為有物種分布,小於閾值的區分為無物種分布,
並依閾值產生誤差矩陣 (confusion matrix)(表 1)。
表 1 評估模式準確度之誤差矩陣 (改自 Manel et al., 2002)
依 據 誤差 矩陣 的 4 種情 況, 可以定 義 出不 同的 指標 (表 2) ,如 敏 感度 (sensitivity)、特異度 (specificity)、TSS (true skill statistic)(Allouche et al., 2006)和 Kappa 值等指標,其中敏感度、特異度,和整體預測成功率可以代表 SDM 預測與 實際分布之間的一致性(Manel et al., 2002)。
非閥值依賴,如:接受者操作特徵曲線 (receiver operating characters curve, ROC),當閥值上升時,敏感度下降,特異度上升。根據這個特性,以 1–特異度
表 2 由誤差矩陣推導之模式表現評估因子表 (改自 Manel et al., 2002) 殖族群量(Guinet et al., 1995);美國 Theodore Roosevelt 國家公園應用三種高光譜影 像偵測入侵的乳漿大戟(Euphorbia esula),偵測率可高達 80%(Root et al., 2002)。
評估因子 計算公式 / 敘述
整體預測成功率 ( TP +TN) / ( TP +FP+FN+TN) 敏感度 (sensitivity) TP / ( TP +FN)
特異度 (specificity) TN / (FP+TN) TSS (true skill statistic) 敏感度+特異度–1
Kappa 值