• 沒有找到結果。

共有物種數的無母數估計探討 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "共有物種數的無母數估計探討 - 政大學術集成"

Copied!
110
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學統計學系 碩士學位論文. 共有物種數的無母數估計探討. 政 治 大 A Non-parametric 立 Estimate for the Number of Shared Species ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 研究生:洪志叡 指導教授:余清祥 博士. 中 華 民 國 九 十 九 年 六 月.

(2) 謝誌 兩年時光匆匆的過去,在這期間學習了許多以前所不會的東西,在政大這高 度的競爭的環境下也讓我快速的成長。 能完成本篇論文最感謝的是指導老師余清祥老師,從一開始尋找題目到解決 問題,中間遇到許多的困難,但在老師耐心指導之下,一一克服和解決了問題。 在老師身上不僅僅學到如何解決學術上的問題,讓我學到更多的是往後遇到任何 問題要以何種態度去解決。也非常感謝口試委員張春桃老師、沈宗荏老師和潘宏 裕老師對本篇論文珍貴的建議。最後感謝一路陪我走過來和幫助過我的朋友們,. 政 治 大. 因為有你們的支持與陪伴讓我堅持下來完成我的論文。在此獻上由衷的感謝。. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i. i n U. v.

(3) 摘要 在生態學、生物學、和比較文學的研究中,物種個數通常是評估生物多樣性 的重要指標,單一群落物種數的估計已有非常豐富的相關研究。較為知名者包括 Good (1953)提出未出現物種的機率,作為估計物種數的參考,往後 Good 的想法 被大量延伸,推演出不少新的估計方法,像是 Burnham and Overton (1978)的 Jackknife 估計法,Chao and Lee (1992)利用涵蓋機率的估計。相對而言,兩群落 共有物種數的研究較少,現有研究中較為知名的有 Chao et al. (2000)的估計式。. 政 治 大 的共有物種(一階 Jackknife 立估計),推估未出現共有物種機率,並且仿造 Burnham 本研究延伸 Good 想法,探討 Jackknife 估計法在兩群落的應用,以出現一次. ‧ 國. 學. and Overton 的想法,建立共有物種數的估計值及變異數。本文除了以電腦模擬, 也使用實例(包括:金庸武俠小說、台灣野生水鳥、巴拿馬螃蟹和巴洛科羅拉多. ‧. 森林)檢驗本文的 Jackknife 估計法,利用涵蓋機率角度發現抽出某特定比例樣. y. sit. n. al. er. io. 計值比較。. Nat. 本時,估計值涵蓋母體共有物種數之機率值達到九成以上,且也與 Chao 提出的估. Ch. engchi. i n U. v. 關鍵詞:生物多樣性、共有物種數、Jackknife 估計、涵蓋機率、電腦模擬. ii.

(4) Abstract The number of species is frequently used to measure the biodiversity of a population in ecology, biology, and comparative literature. There are quite a lot of studies related. to estimating the number of species. Among these studies, Good (1953) proposed a famous estimate (Turing’s estimate) for the probability of unseen species. Subsequently, many methods have been proposed for estimating the number of species based on Good’s idea. For example, the Jackknife estimator by Burnham and. 政 治 大 famous estimates for the number 立 of species. In contrast, there are not many studies for Overton (1978) and sample coverage probability by Chao and Lee (1992) are two. ‧. ‧ 國. the only one.. 學. the number of shared species in two communities, and Chao et al. (2000) is probably. This article extends Good’s idea and the Jackknife method to estimate the. sit. y. Nat. number of shared species in two communities. Similar to Burnham and Overton, we. n. al. er. io. establish the estimate and its estimated variance, based on the number of species. v. appearing exactly once. We also use computer simulation and real data sets (Jin-Yong. Ch. engchi. i n U. martial arts novels, Taiwan wild birds, Panama crustacean, and Barro Colorado Island forest) to evaluate the proposed method. We found that the coverage probability for confidence interval covering the true number of shared species is more than 90%. In addition, we compare the proposed method with Chao’s method.. Key words: Biodiversity, Number of share species, Jackknife estimated, Coverage probability, Computer simulation. iii.

(5) 目錄 第一章 緒論 ........................................................................................................ 1 第二章 文獻回顧與模式簡介 ............................................................................. 3 2.1 抽樣方法與模式假設 ........................................................................ 3 2.2 符號定義 ........................................................................................... 4 2.3 未出現物種機率─Good 估計式 ........................................................ 6 2.4 單一群落物種數估計 ........................................................................ 7 2.4.1 物種數估計─Burnham and Overton 估計式 .............................. 7 2.4.2 物種數估計─Chao 估計式 ........................................................ 9 2.5 共有物種數估計─Chao 估計式 ...................................................... 10 第三章 研究方法 .............................................................................................. 14 3.1 未出現共有物種機率─Yue 估計式 ................................................. 14 3.2 共有物種數估計─Yue 估計式 ........................................................ 15 3.3 未出現共有物種機率估計式 .......................................................... 17 3.4 共有物種估計式 .............................................................................. 17. 立. 政 治 大. ‧ 國. 學. ‧. 第四章 電腦模擬驗證 ...................................................................................... 19 4.1 未出現共有物種機率電腦模擬探討 ............................................... 20 4.2 共有物種數電腦模擬探討 .............................................................. 22 4.3 模擬驗證變異數數值 ...................................................................... 27. sit. y. Nat. n. al. er. io. 第五章 實際資料驗證 ...................................................................................... 31 5.1 資料簡介 ......................................................................................... 31 5.2 四個實例之未出現共有物種機率探討 ........................................... 33 5.3 四個實例之共有物種數探討 .......................................................... 36 5.4 四個實例之涵蓋機率探討 .............................................................. 40. Ch. engchi. i n U. v. 第六章 結論與建議 .......................................................................................... 45 6.1 結論 ................................................................................................. 45 6.2 建議 ................................................................................................. 46 參考文獻 ............................................................................................................ 48 附錄 .................................................................................................................... 50. iv.

(6) 圖目錄 圖 4-1 共有物種分佈 ......................................................................................... 19 圖 4.1-1 共有物種數為 20 下估計機率與真實機率比值 ..................................... 21 圖 4.1-2 共有物種數為 50 下估計機率與真實機率比值 ..................................... 21 圖 4.2-1 共有物種為 20 下 Sˆ12 ( v1) 和 Sˆ12 ( v 2 ) 估計值................................................. 23 圖 4.2-2 共有物種為 50 下 Sˆ12 ( v1) 和 Sˆ12 ( v 2 ) 估計值 ................................................. 23 圖 4.2-3 均勻分配共有物種數 80 Sˆ12 (v1) , Sˆ12( v 2) , Sˆ12 (Chao1) 和 Sˆ12 (Chao 2) 估計值 ....... 24 圖 4.2-4 幾何分配共有物種數 20 Sˆ12 ( v1) , Sˆ12 ( v 2 ) 和 Sˆ12 (Chao 2) 估計值 ........................ 25. 治 政 圖 4.2-5 幾何分配共有物種數 50 Sˆ , Sˆ 和 Sˆ 大 估計值 ........................ 26 立 12 ( v1). 12 ( v 2 ). 12 ( Chao 2 ). ‧ 國. . 學. 圖 4.2-6 均勻分配和幾何分配共有物種數為 80 Sˆ12 ( v1) , Sˆ12 ( v 2 ) 和 Sˆ12 (Chao 2) 估計值 . 27. . ‧. 圖 4.3-1 Var ( Sˆ12 ( v1) ) 與估計值變異數比較 ........................................................... 28. y. sit. . Nat. 圖 4.3-2 Var (Sˆ12 (v 2) ) 與估計值變異數比較 ........................................................... 29 . 5.2-1 5.2-2 5.2-3 5.2-4 5.2-5 5.3-1 5.3-2 5.3-3 5.3-4 5.4-1 5.4-2 5.4-3 5.4-4. al. n. 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖. er. io. 圖 4.3-3 Var ( Sˆ12( v1) ) , Var (Sˆ12 (v 2) ) 與 Sˆ12 (Chao 2) 估計值變異數比較 .......................... 30. v. 金庸小說共有物種分佈情形 .................................................................. 33 台灣野生水鳥、巴拿馬螃蟹共有物種分布情形 ................................... 34 巴洛科羅拉多島森林共有物種分佈情形............................................... 34 抽出不放回下估計機率與真實機率比值............................................... 35 抽出放回下估計機率與真實機率比值 .................................................. 36 抽出不放回下金庸小說和台灣野生水鳥共有物種數估計 .................... 37 抽出不放回下巴拿馬螃蟹和巴洛科羅拉多島森林共有物種數估計 .... 38 抽出放回下金庸小說和台灣野生水鳥共有物種數估計........................ 39 抽出放回下巴拿馬螃蟹和巴洛科羅拉多島森林共有物種數估計 ........ 39 抽出不放回下金庸小說和台灣野生水鳥涵蓋機率 ............................... 41 抽出不放回下巴拿馬螃蟹和巴洛科羅拉多島森林涵蓋機率 ................ 42 抽出放回下金庸小說和台灣野生水鳥涵蓋機率 ................................... 42 抽出放回下巴拿馬螃蟹和巴洛科羅拉多島森林涵蓋機率 .................... 43. Ch. engchi. v. i n U.

(7) 表目錄 表 1 四組實際資料母體特性 ............................................................................. 32 表 2 信賴區間包含真實值最小抽樣百分比 ...................................................... 44 附表 1 共有物種數 20 下 v1 (n) 未出現共有物種機率 ........................................... 50 附表 2 共有物種數 50 下 v1 (n) 未出現共有物種機率 ........................................... 51 附表 3 共有物種數 20 下 v2 (n) 未出現共有物種機率........................................... 52 附表 4 共有物種數 50 下 v2 (n) 未出現共有物種機率........................................... 53 5 共有物種數 80 下均勻分配共有物種數估計值 ........................................ 54 6 共有物種數 20 下幾何分配共有物種數估計值 ........................................ 55 7 共有物種數 50 下幾何分配共有物種數估計值 ........................................ 57 8 共有物種數 80 下均勻和幾何分配共有物種數估計值 ............................. 59 9 共有物種數 20 下幾何分配共有物種數估計變異數................................. 60 10 共有物種數 50 下幾何分配共有物種數估計變異數............................... 64 11【雪山飛狐】對【笑傲江湖】(抽出不放回)........................................... 68 12【雪山飛狐】對【笑傲江湖】(抽出放回) .............................................. 70 13【射鵰英雄傳】對【神鵰俠侶】(抽出不放回)....................................... 74 14【射鵰英雄傳】對【神鵰俠侶】(抽出放回) .......................................... 78 15 台灣野生水鳥(抽出不放回) .................................................................... 82 16 台灣野生水鳥(抽出放回) ........................................................................ 84 17 巴拿馬螃蟹(抽出不放回) ........................................................................ 86 18 巴拿馬螃蟹(抽出放回) ............................................................................ 88 19 巴洛科羅拉多島森林 A 對 AB(抽出放不回) ......................................... 92 20 巴洛科羅拉多島森林 A 對 AB(抽出放回) ............................................. 94 21 巴洛科羅拉多島森林 D 對 AB(抽出不放回) ......................................... 98 22 巴洛科羅拉多島森林 D 對 AB(抽出放回) .............................................100. 立. 政 治 大. ‧. ‧ 國. 學. n. al. er. io. sit. y. Nat. 附表 附表 附表 附表 附表 附表 附表 附表 附表 附表 附表 附表 附表 附表 附表 附表 附表 附表. Ch. engchi. vi. i n U. v.

(8) 第一章. 緒論. 隨著科技快速發展及持續進步,對地球資源所需也日益增加,人們享受著便 利的高科技生活時,卻讓環境付出慘痛的代價,像是工業排放出廢水汙染河川及 海洋,造成了生物死亡,甚至物種的滅絕。台灣著名的鎘米事件就是塑膠工廠大 量排放廢水到灌溉農田的水源中,導致稻米中含有重金屬。近年全球暖化和溫室 效應,使得許多生物無法生存、甚至導致物種的滅絕,人類也因暖化造成海平面. 政 治 大 資源,破壞生物棲地、使得許多生物因此滅亡,近幾年極端氣候的頻繁出現,也 立 上升而受害,例如大溪地等低窪國家有滅頂之虞。人們任意砍乏森林、浪費自然. 有科學家認為這是人類破壞山林的惡果。因為地球環境污染日漸嚴重,人們對環. ‧ 國. 學. 保議題日益重視。. ‧. 與環保相關的議題─「生物多樣性」(Biodiversity) ,近年也因而成為熱門. sit. y. Nat. 議題。生物多樣性最先由 Thomas Lovejoy 於 1980 年提出,來源是由 biologica(生. io. er. 物)前三個字母和 diversity(多樣性)組合而成。生物多樣性為一個抽象的名詞, 經量化後成為「生物多樣性指標」,較為簡單的指標為物種個數,透過物種數的. al. n. v i n Ch 多寡決定生物多樣性指標的高低。但在廣大的海洋或森林中,我們無法全盤調查 engchi U. 出所有的物種數有多少,有時受限於某些地區人類無法到達,像是深層的海溝, 有時受限於人力、物力或成本的考量,或是某些物種具危險性或不易被觀察到。 因此藉由抽樣方法來估計物種總數,向來是統計學熱門研究的議題,Bunge and Fitzpatrick (1993)回顧文章中整理出物種數估計相關文獻。估計物種數的概念也 不僅僅用於生態學上,也被廣泛的應用於其他領域,例如在文學中莎士比亞是全 球公認的偉大作家,我們想要知道莎士比亞到底知道多少詞彙,藉由抽取莎士比 亞部分作品,再由樣本資訊推估莎士比亞知道的詞彙有多少(Efron and Thisted, 1976)。 1.

(9) 兩個群落(或兩個母體)的比較在生態學上也是一門重要的議題,可以視為 多個群落比較的特例。在兩個群落比較相似程度,最簡單的想法為看共有物種數 多寡,透過共有物種數多寡可以決定其相似程度的高低。兩個群落的比較也不僅 僅應用在生態學上,其概念也被應用在其他領域上,像是不同單位蒐集吸毒犯的 資料,由兩筆資料中吸毒再犯的共有人數資訊,估計有多少吸毒犯戒毒後會再回 去吸毒(Chao et al., 2008)。但有關共有物種估計相關文獻較少有人討論,其最著 名為 Chao et al. (2000)所提出,相關文獻中也鮮少有人以理論模擬和實際資料為 驗證。本研究延伸 Burnham and Overton 想法並以一階摺刀法(first order Jackknife),. 治 政 在於能以抽取較少的樣本數即能得到最佳的估計。大 立. 提出共有物種數估計式及其估計變異數,並且做理論模擬和實際資料驗證,目的. 後續各章內容依序為:第二章首先定義本研究所使用符號,接著回顧相關單. ‧ 國. 學. 一群落物種未出現機率、物種數估計和兩群落的共有物種數估計文獻。本文所提. ‧. 出的未出現共有物種機率估計式、共有物種估計式和其估計變異數會在第三章進. y. Nat. 行討論。第四章為理論模擬探討,利用電腦模擬且設定兩群落分配下探討本研究. er. io. sit. 所提出之未出現共有物種機率估計式、共有物種估計式和其估計變異數是否合理 且可行。接著在第五章利用金庸小說、台灣野生水鳥、巴拿馬螃蟹和巴洛科羅拉. al. n. v i n 多島(Barro Colorado Island)森林實際例子進行驗證。最後第六章結論與建議除了 Ch engchi U 綜合以上結果,並且提出未來研究方向。. 2.

(10) 第二章. 文獻回顧與模式簡介. 過去研究有不少類型的物種數估計方法,基於使用方便的考量,本文將焦點 放在無母數方法,而在提出本研究的估計方法前,先回顧較為知名的無母數方法, 包括 Good (1953) 、Chao and Lee (1992)、Chao et al. (2000)和 Burnham and Overton (1978)。 本章包含五部份,依序為抽樣方法和模式假設、符號定義、單一群落未出現 物種機率估計、單一群落物種數估計和兩群落共有物種數估計。首先介紹本文使. 政 治 大. 用的抽樣方法和模式假設,再者定義單一群落和兩群落相關符號,接著回顧單一. 立. 群落未出現物種機率估計和物種數估計相關文獻,最後在兩群落下將介紹共有物. ‧. ‧ 國. 學. 種數估計。. sit. y. Nat. 2.1 抽樣方法與模式假設. n. al. er. io. 在生態研究中,有興趣的議題可能是一座森林有多少種類植物或有多少種類. i n U. v. 的動物,或者想了解某海域水生動物種類數。由於受限於物種存在空間太大、物. Ch. engchi. 種隨季節遷移、人力、時間和金錢等種種考量,大多時候無法對所有母體的物種 數進行統計,但可藉由抽樣的方式,從抽樣中獲得的資訊來推估物種數或共有物 種數。 在單一群落下假設物種種類數為 S,以隨機抽樣且抽出放回方式進行抽取 n S. 個樣本。物種出現的機率為 P  ( p1 , , p S ) 、  p i  1 , X i (n) 表示第 i 物種在 n i 1. S. 次抽樣中出現次數,. X. i.  n 。S 個物種出現次數會服從多項分配即. i 1. ( X 1 , , X S ) ~ Multinomia l (n, p1 ,  , pS ) 。 在兩群落下假設群落一物種種類數為 S1,群落二母物種種類數為 S2,以隨機 3.

(11) 抽樣且抽出放回方式進行在兩群落各抽取 n1 個及 n2 個樣本。 S1. 群落一物種出現的機率為 P  ( p1 ,  , p S1 ) 、  p i  1 , X i (n1 ) 表示第 i 物種 i 1 S1. 在 n1 次抽樣中出現次數,  X i  n1 。S1 個物種出現次數會服從多項分配即 i 1. ( X 1 , , X S ) ~ Multinomia l (n, p1 ,  , pS ) 。 S2. 群落二物種出現的機率為 Q  (q1 ,  , q S 2 ) 、  qi  1 , Yi ( n 2 ) 表示第 i 物種在 i 1 S2. n2 次 抽 樣 中 出 現 次 數 ,  Yi  n 2 。 S2 個 物 種 出 現次數 會 服 從 多項 分 配 即 i 1. (Y1 ,  , YS 2 ) ~ Multinomial ( n2 , q1 ,  , q S 2 ) 。. 立. ‧ 國. 學. 2.2 符號定義. 政 治 大. 單一群落相關符號. ‧. S :物種種類個數。. y. Nat. er. io. sit. S 0 :樣本中出現物種種類個數。. pi :第 i 個物種出現機率, i  1,2,, S ; p1    pS  1 。. n. al. Ch. engchi. i n U. v. X i (n) :第 i 物種在 n 個樣本中出現個數, i  1,2,  , S 。 fi :恰出現 i 次物種種類個數。. 4.

(12) 兩群落相關符號. N1 :群落一母體個數。 N 2 :群落二母體個數。 S1 :群落一物種種類個數。 S 2 :群落二物種種類個數。 S12 :共有物種種類個數。. ~ S12 :樣本中共有物種種類個數。. pi :群落一第 i 個物種出現機率, i  1,2, , S1 ; p1    p S  1 。 1. 政 治 大. q i :群落二第 i 個物種出現機率, i  1, 2, , S 2 ; q1    q S  1 。. 立. 2. ‧ 國. 學. X i (n) :群落一中第 i 物種在 n 個樣本中出現個數, i  1,2,, S1 。 Yi (n) :群落二中第 i 物種在 n 個樣本中出現個數, i  1,2,, S 2 。. ‧. S12. y. i 1. Nat. f1   I [ X i (n)  1, Yi (n)  0] :群落一恰出現一次且在群落二出現過一. al. er. io. S12. sit. 次的共有物種種類數。. n. f 1   I [ X i (n)  0, Yi (n)  1] :群落二恰出現一次且在群落一出現過一 i 1. Ch. 次的共有物種種類數。. engchi. i n U. v. S12. f ij   [ I ( X k  i, Yk  j )]:在群落一出現 i 次且在群落二出現 j 次的共有物 k 1. 種種類數。 n. n. n. f i   [ I ( X j  i , Y j  i  1)]   [ I ( X j  i - 1, Y j  i )]   [ I ( X j  Y j  i)]:樣 j 1. j 1. j 1. 本中在其中一個群落出現 i 次的共有物種種類個數。. 5.

(13) 2.3 未出現物種機率─Good 估計式 Good (1953)以物種出現次數的方法,進而推估出在下次抽樣出現新物種機 率,Clayton and Frees (1987)提出以無母數方法估計未出現物種機率,Mao and Lindsay (2002)推廣 Good 方法至更一般化,並且應用在找出未出現基因之機率。 Good 提出恰出現 r 次(r>0)的物種個數其近似期望值 E ( f r ) 為. E( f r ) . 1 (r  1) f r 1 n fr. (2.1). (2.1)式可推廣至 m 階近似動差 E ( f rm ) 為. E ( f rm ) . 政 治 大. 1 ( r  m) ( m ) f r  m , (r  1,2,; m  0,1,2,; fr nm. 立. t. ( m). (2.2).  t (t  1) (t  m  1)). ‧ 國. 學. (2.1)式可縮減近似為. (r  1) f r 1 n. ‧. E( fr ) . (2.3). y. Nat. 在樣本所有物種中,出現 r 次或大於 r 次物種個數(r>0),其近似期望值為. sit. n. a2l f. 2.  3 f3   f 1 1 n n. Ch. 因此未出現物種的機率可近似為. engchi. u ' ( n) . er. io. (r  1) f r 1  (r  2) f r  2   ,所以在樣本中所有物種出現的機率為 n. i n U. v. f1 n. (2.4). (2.5). (2.2)式亦可表示為 E ( f rm )  E ( f r ) E ( f r 1 )  E ( f r  m1 ) , ( r  1,2,  ; m  0,1,2, ). (2.6). 其近似變異數 Var ( f r ) 由(2.6)式為. Var ( f r ) . (r  1)(r  2) f r  2 1 f  ( r 1 ) 2  E ( f r )[ E ( f r 1 )  E ( f r )] , r  1 2 fr n fr n. 6. (2.7).

(14) 2.4 單一群落物種數估計 此小節分為兩部份,第一部分為 Burnham and Overton (1978)利用 Jackknife 方法中譯為摺刀法,由抽樣中物種出現次數的資訊估計物種種類個數。第二部份 為 Chao and Lee (1992)提出,利用樣本覆蓋率(sample coverage)概念估計物種種類 個數。. 2.4.1 物種數估計─Burnham and Overton 估計式 摺刀法最早由 Quenouille (1949)提出,目的在修正原始估計量偏誤,此方法. 政 治 大 複的計算過程已可以交由電腦處理,使摺刀法成為統計分析常用的方法。以下以 立. 沒有任何的模型假設,但需要多次且重覆運算,隨著電腦科技日益進步發展,繁. ‧ 國. 學. 一階摺刀法為例,介紹摺刀法基本概念及計算方法。假設估計某參數 θ,其估計 值 ˆ  T ( x1 , x 2 ,, xn ) 為 ( x1 , x2 ,, xn ) 的觀測值函數,其摺刀估計量依序執行以下. ‧. 三個步驟:. Nat. sit. y. (1) 移除一個觀測值 xi. n. al. er. io. (2) ˆ( n1),i 為移除觀測值 xi 後的函數, ˆ( n 1),i  T ( x1 , x 2 , , xi 1 , xi 1 , , x n ). Ch. i n U. (3) 計算虛擬值(pseudo value) ˆi  nˆ  (n  1)ˆ( n1),i. engchi. v. 假設有 n 個觀測值,且每次移除一個觀測值,重覆執行上述步驟 n 次,則一階摺 刀估計式 Jˆ n1 ( ) 為 1 n Jˆ n1 ( )   ˆi  nˆ  (n  1)ˆ( n1) n i 1. 其中 1 n ˆ( n 1)   ˆ( n 1),i n i 1 ^. 一階摺刀估計變異數 Var ( Jˆ n1 ( )) 為. 7. (2.8).

(15) n ^ ( Jˆ 1 ( )  ˆi ) 2 Var ( Jˆn1 ( ))   n n(n  1) i 1. (2.9). Quenouille (1956)進一步提出二階摺刀法,與一階摺刀法不同之處在於,二階摺 刀法一次剔除兩個觀察值(xi,xj),且重複上述三個步驟可得二階摺刀估計式。 Schucany ea al. (1971)推廣至高階摺刀法,雖然高階摺刀法可修正更多偏誤,但 存在著產生更大的變異數的缺點。 Burnham and Overton 延續摺刀法概念,將摺刀估計式寫為物種出現次數之 線性組合。Burnham 在自己論文和 Sharot (1976)將 k 階摺刀估計式 Jˆ nk ( ) 表示為. 政 治 大. k  1 k Jˆ nk ( )   (1) i  (n  i) k ˆ( n i ) k! i  0 i . 立. (2.10). ‧ 國. 學. 以一階摺刀法為例且令 ˆ  S 0 ,重複上述三個步驟。定義 z1i  1 為第 i 次抽樣恰. ‧. 出現新物種, z1i  0 為第 i 次抽樣為之前出現過之物種,步驟二之 ˆ( n1),i  S 0  z1i. y. sit. n. al. er. io. 估計式 Sˆ J 1 為. Nat. 1 n 1 n 1 ,且 ˆ( n 1)   ˆ( n1),i  S 0   z1i  S 0  f1 ,k=1 帶入(2.10)式可得一階摺刀 n i 1 n i 1 n. n 1 Sˆ J 1  S 0  f1 n. Ch. 並且可將 ˆ( n j ) 可寫成一般化型式. engchi. n ˆ( n  j )  S0     j. 1 j. i n U. n  r .   j  r  f r 1. v. . . r. 一到五階摺刀估計式如下: n 1 Sˆ J 1  S 0  f1 n. 2n  3 (n  2) 2 Sˆ J 2  S 0  ( ) f1  ( ) f2 n n(n  1) 3n  6 3n 2  15n  19 (n  3) 3 ) f3 Sˆ J 3  S 0  ( ) f1  ( ) f2  ( n n(n  1) n(n  1)(n  2) 8. (2.11).

(16) 4n  10 6t 2  36t  55 4n 3  42n 2  148n  175 Sˆ J 4  S 0  ( ) f1  ( ) f2  ( ) f3 n n(n  1) n(n  1)(n  2) (. ( n  4) 4 ) f4 n(n  1)(n  2)(n  3). 5n  15 10n 2  70n  125 10n 3  120n 2  485n  660 Sˆ J 5  S 0  ( ) f1  ( ) f2  ( ) f3 n n(n  1) n(n  1)(n  2) (. ( n  4) 5  ( n  5) 5 (n  5) 5 ) f4  ( ) f5 n(n  1)(n  2)(n  3) n(n  1)(n  2)(n  3)(n  4). n. n. 將 S 0   f i 帶入 Sˆ Jk 整理,摺刀估計式可簡化為 f i 的線性組合,即 Sˆ Jk    ik f i 。 i 1. i 1. n. n. n 1 n 1 以 Sˆ J 1 為例: Sˆ J 1  S 0  f 1  (1  ) f 1   f i    i1 f i ,且其變估計異數 n n i 2 i 1 . 式 Var ( Sˆ Jk ) 為. 政 治 大 ˆ ˆ. 立 Var (S. n. 2 Jk )    iJ f i  S Jk. (2.12). i 1. 學. ‧ 國. . 2.4.2 物種數估計─Chao 估計式. ‧. Chao and Lee (1992)以樣本涵蓋率(sample coverage)的概念來推估物種種類. y. Nat. S. io. sit. 數。樣本涵蓋定義為 C   pi I [ X i (n)  0] ,即觀察到物種機率總合,但實際上 i 1. n. al. er. 我們無法得知樣本中出現的各個物種機率為何,但以 Good (1953)的想法,假設. i n U. v. f 抽取 n 個樣本,可以利用(2.5)式來估計樣本覆蓋率 Cˆ  1  1 。若每種物種出現 n. Ch. engchi. 機率皆相等,可得物種數估計式 Sˆ 為. S Sˆ  0 Cˆ. (2.13). 此估計式最早發展於 Darroch and Ratciliff (1980)。但在實務上,各個物種出現機 率相等的情形可以算是特例,有時物種間被觀察到的機率會有很大落差,即有些 物種很容易被觀察到像是麻雀,有些物種極難被觀察到像台灣黑熊。所以在此況 利用變異系數 ˆ 2 來衡量物種間的變異情形,則物種數估計式 SˆChao1 為. S f SˆChao1  0  1 ˆ 2 Cˆ Cˆ 9. (2.14).

(17) 其中.   S ˆ 2  max  0 ˆ C . n.  i(i  1) f.    1,0  . i. i 1. n(n  1). 但當部份物種出現次數較多時(2.14)式會有高估的情況,所以 Chao et al. (1993) 僅用樣本中出現次數不超過 κ 次以上物種來做修正,Chao et al.建議使用 κ=10。 10. 定義 Sˆ rare   f i 、 Sˆ abun  S 0  Sˆ rare 、 Cˆ *  1  i 1. f1. ,因此在所有物種出現機率相. 10.  if. i. i 1. 等下(2.13)式可修改為. 立. 治 政 Sˆ ~ ˆ S S  大 Cˆ abun. rare *. (2.15). ~ Sˆ f S Chao1  Sˆabun  rare  1* ~ 2 * ˆ ˆ C C. 學. (2.16). er. io. sit. Nat. 10   i (i  1) f i   Sˆ  i 1 ~ 2  max  rare  1 , 0  10 ˆ * 10  C ( if i )( if i  1)    i 1 i 1. y. ‧. 其中. ‧ 國. 但當各物種出現機率不相等時,(2.14)式可修改為. al. n. v i n 利用此方法修正可以清楚了解,出現較多次的物種往往帶有較少的未出現物種訊 Ch engchi U 息,而出現次數較少的物種則帶有較多的未出現物種訊息。. 2.5 共有物種數估計─Chao 估計式 在文獻上共有物種的估計較少被探討,而最著名的共有物種估計為 Chao et al. (2000)提出,其承襲了 Chao et al. (1993)做法,以樣本覆蓋率想法,和分開出 現次數較多和出現次數較少的共有物種,以出現較少次數的共有物種來估計未出 現的共有物種數。在兩群落下共有物種的樣本涵蓋率定義為 10.

(18) S12.  I[ X. i. (n1 )  0, Yi (n 2 )  0] pi qi. i 1. C12 . S12. pq i. i. i 1. 假設群落一樣本數為 n1,物種種類數為 S1,S1 個物種出現機率為 P  ( p1 ,  , p S1 ) , S1. X i ( n1 ) 表示第 i 物種在 n1 次抽樣中出現次數,  X i  n1 。S1 個物種出現次數服 i 1. 從多項分配,即 ( X 1 , , X S ) ~ Multinomia l (n, p1 ,  , pS ) 。 群落二樣本數為 n2,物種種類數為 S 2 , S 2 個物種出現機率為 Q  (q1 ,  , q S 2 ) 、 S2. S2. q.  1 , Yi ( n2 ) 表示第 i 物種在 n2 次抽樣中出現次數,  Yi  n 2 。S2 個物種出. 政 治 大 現次數服從多項分配,即 (Y ,  , Y ) ~ Multinomial ( n , q ,  , q 立 i. i 1. i 1. 1. S2. 2. 1. ‧ 國. 學. ~ 設前 S12 為共有物種,樣本中出現之共有物種數為 S12 。. ) 。不失一般性假. S2. S12. ‧. 首先定義母體中稀有共有物種 S12 ( rare )   I [0  X i (n1 )  10,0  Yi (n2 )  10] 、 i 1. sit. y. Nat. 母體中豐富共有物種 S12 ( abun )  S12  S12 ( rare ) 。. n. al. er. io. 接 著 把 兩 群 落分 為 兩 個 子群 落 (sub-community) , 子 群 落 一 物 種 種類 數. i n U. v. S1*  S1  S12( abun) , 且 S1* 個 物 種 出 現 機 率 為 P *  ( p1* ,  , p S* * ) , * i. p . Ch. epn g c h i. 1. S1*. , pi*  1, 1  { p i I [ X i (n1 )  0, Yi (n 2 )  10]  pi I [ X i (n1 )  10, Yi (n2 )  0]} i 1 i. S12. i 1. S1*. X ( n ) 表示在子群落一第 i 物種出現個數,子群落一樣本數為  X i*  n1* 。 * i. * 1. i 1. 子群落二物種數 S 2*  S 2  S12 ( abun ) , S 2* 個物種出現機率為 Q *  (q1* , , q *S * ) , 2. * i. q . S 2*. qi. , qi*  1 , 1  {q i I [ X i (n1 )  0, Yi (n 2 )  10]  qi I [ X i (n1 )  10, Yi (n 2 )  0]} i 1 S12. i 1. 11.

(19) S 2*. Yi (n ) 表示在子群落二第 i 物種出現個數,子群落二樣本數為  Yi*  n2* 。 *. * 2. i 1. S12 ( rare ). 兩子群落共有物種數為 S. * 12 ( rare ).  I [0  X. . * i. (n 1* )  10,0  Y i* (n *2 )  10]. i 1. ~ 兩子群落樣本共有物種數為 S12* ( rare ) . * S12 ( rare ).  I [0  X. * i. ~ (n *1 )  10,0  Y i* (n *2 )  10]  S12*. i 1. 在定義完兩子群落後,接著定義兩子群落共有物種樣本覆蓋率 C12* S *12 ( rare ).  I[ X. C12* . i 1. (n1* )  0, Yi* (n2* )  0] pi* qi*. 政 治 大 p q * * i i. i 1. 在兩子群落下共有物種樣本覆蓋率的估計 Cˆ 12* 為. (n1* ) I [Yi * (n 2* )  1]  I [ X i* (n1* )  1]Yi* (n2* )  I [ X i* (n1* )  Yi * (n 2* )  1]. io. 在 p1* q1*    p S* *. q S* *. * i. (n1* )Yi * (n 2* ). i 1. 下共有物種估計式 Sˆ12 (Chao1) 為. al. 12 ( rare ). n. 12 ( rarw ). X. (2.18). y. Nat. ~* S12. sit. i 1. * i. ‧. Cˆ12* . X. er. ~* S12. (2.17). S *12 ( rare ). 學. ‧ 國. 立. * i. Ch. engchi. ~ Sˆ12 (Chao1)  S12 ( abun). i n U. ~ S12* ( rare )  Cˆ *. v. (2.19). 12. 但在 pi* qi* 不相等下, i  1,  , S12* ( rare ) 共有物種估計式 Sˆ12 (Chao 2) 為. Sˆ12 (Chao 2). ~ S12* ( rare ) ~ 1  S12( abun )   * ( f1 ˆ1  f 1ˆ 2  f11ˆ 12 ) * Cˆ12 Cˆ12. 其中 ˆ1 . Nˆ 120 n1*T21 1 (n1*  1)T10 T11. , ˆ 2 . 12. Nˆ 120 n 2*T12 1 (n2*  1)T01T11. (2.20).

(20) ˆ12 . n1* n 2* ( Nˆ 120 ) 2 T22 Nˆ 120 T11 ˆ   1  ˆ 2 * * T T (n1  1)(n 2  1)T01T10 T11 01 10. 而. Nˆ 120 . ~* ~* ~* ~ S12 S12 S12 S12* ( rare ) * * * * , T10   X i (n1 ) , T01   Yi (n2 ) , T11   X i* (n1* )Yi * (n 2* ) * ˆ C i 1 i 1 i 1 12. ~* S12. * i. * 1. * i. * 1. *. ~* S12. * 2. T21   X (n )( X (n )  1)Yi (n ) , T12   X i* (n1* )Yi * (n2* )(Yi * (n2* )  1) i 1. i 1. ~* S12. 政 治 大. T22   X i* (n1* )( X i* (n1* )  1)Yi * (n2* )(Yi * (n2* )  1). 立. i 1. ‧ 國. 學. Good 提出估計未出現物種機率其結果呈現高估情形,摺刀法這類型的無母. ‧. 數方法多半也有高估現象。. sit. y. Nat. 下一章我們將仿造單一群落的物種估計方法,可視為 Burnham and Overton. io. 其變異數,再與 Chao et al. (2000) 的方法相比較。. n. al. Ch. engchi. 13. er. (1978)由單一群落的概念直接延伸推廣至兩群落上,建立共有物種數估計方法和. i n U. v.

(21) 第三章. 研究方法. 本研究採用無母數方法,即不需任何分配假設下即可使用,亦考慮到實際使 用時的方便性,在計算時少了繁複的運算過程。之後再以假設分配和實際例子, 驗證研究方法的可行性。 此章分為兩部份,第一部分為 Yue (2009)提出未出現共有物種機率估計式, 其為延伸 Burnham and Overton (1978)的一階摺刀法,建立共有物種數估計式及 估計變異數。第二部份為本研究所提出之方法,利用 Good (1953)概念,建立未. 政 治 大. 出現共有物種機率估計式,亦延伸 Burnham and Overton 一階摺刀法,建立共有. 立. 物種數估計式及估計變異數。. ‧ 國. 學 ‧. 3.1 未出現共有物種機率─Yue 估計式. Nat. sit. y. 在單一群落下 Good (1953)提出未出現物種機率估計式。抽取 n 個樣本後, S. i 1. n. al. Ch. er. io. 下次抽樣為新物種的期望機率為 E (u (n))   pi (1  p i ) n ,其估計式 u (n) . i n U. v. f1 n. (2.5 式)。即下次若抽到新物種其出現次數為 1,所以利用 n 次抽樣中出現一次物. engchi. 種個數除以抽樣個數,來估計下一次抽樣為新物種的機率。 以此想法推廣至兩群落,於兩群落中各抽 n 個樣本,未出現的共有物種有三 種情況:第一為共有物種在兩群落各抽 n 個樣本後都未被抽取到,再者未出現共 有物種於群落一抽到而在群落二未抽到,最後未出現共有物種於群落一未抽到但 S1. 在群落二抽到。假設群落一物種出現機率為 pi , i  1,2,  , S1 ;  p i  1,群落二物 i 1 S2. 種出現機率為 qi , i  1,2,  , S 2 ;  qi  1 ,在兩群落各抽取 n 個樣本後,未出現的 i 1. 共有物種機率為. 14.

(22) S12. v (n)   pi q i  I [ X i (n)  Yi (n)  0] i 1. (3.1). S12.  { pi  I [ X i (n)  0, Yi (n)  0]  q i  I [ X i (n)  0, Yi (n)  0]} i 1. 其期望值可近似為 S12. n. n. S12. E (v(n))   pi (1  pi ) qi (1  qi )   pi (1  p i ) n [1  (1  qi ) n ] i 1. i 1. S12.   qi (1  qi ) n [1  (1  p i ) n ] i 1 S12. S12. n. S12.   pi (1  pi )   qi (1  qi )  [(1  pi ) n (1  qi ) n ( pi qi  pi  qi )] i 1. i 1. S12. S12. n. i 1 S12. n. n.   pi (1  pi )   qi (1  qi )  [(1  pi ) n1 (1  qi ) n1  (1  pi ) n (1  qi ) n ]. 政 治 大  E (u (n))  E (u (n))   E{I [ X (n  1)  Y (n  1)  0]  I [ X (n)  Y (n)  0]} (3.2) 立 i 1. i 1. i 1. S12. 1. i. 2. i. i. i. i 1. ‧ 國. 估計式 v1 (n) 為. 學. 利用 Good 未出現物種機率估計式(2.5 式),帶入(3.2)式可得未出現共有物種機率. i 1. Nat. (3.3). io. sit. y. I [ X i (n)  0, Yi (n)  1] S12 I [ X i (n)  1, Yi (n)  0]   n n i 1 i 1. er. S12. I [ X i (n)  1] S12 I [Yi (n)  1] S12 I [ X i (n)  Yi (n)  1]   n n n i 1 i 1. ‧. S12. v1 (n)  . al. n. v i n Ch e n g c 估計式 hi U 3.2 共有物種數估計─Yue. Burnham and Overton (1978)在單一群落下,以物種出現次數並利用摺刀法估 計物種個數,其一階摺刀估計式 n 1 Sˆ J 1  S 0  f1 n. (3.4). n. n. S 0   f i 為樣本中出現物種個數,n 為樣本數, f i   I ( X j  i ) 為抽取 n 個樣 i 1. j 1. 本中恰好出現 i 次的物種個數。可將(3.4)式化為 f i 線性組合 n. n. n 1 n 1 Sˆ J 1  S 0  f1  (1  ) f1   f i    i f i n n i 2 i 1 15. (3.5).

(23) 其估計變異數估計式 n. . Var ( Sˆ J 1 )    i2 f i  Sˆ J 1. (3.6). i 1. 延伸 Burnham and Overton 單一群落一階摺刀估計式概念。在兩群落中各抽 取 n 個樣本,且一次剔除一組樣本,共有 n 組樣本。例如:在群落一剔除樣本 1 在群落二也剔除樣本 1。定義 z1i. z1i  I [ X i (n)  1]  I [Yi (n)  1]  I [ X i (n)  Yi (n)  1]  I [ X i (n)  0, Yi (n)  1]  I [ X i (n)  1, Yi (n)  0] ~ 可得 Sˆ12( v1),( n 1),i  S12  z1i n. 政~ 1治 大 ~ 1   S  z  S  f n. 1  Sˆ12 (v1),( n 1)   Sˆ12 (v1),( n 1),i n i 1. n. 1i. 12. n. i 1. 1. (3.7). ‧ 國. 學. 其中. 立. 12. S12 S12  S12 f1   I [ X i (n)  1]   I [Yi (n)  1]   I [ X i (n)  Yi (n)  1] i 1. i 1. S12. ‧. i 1. S12. Nat.   I [ X i (n)  0, Yi (n)  1]   I [ X i (n)  1, Yi (n)  0] i 1. y. i 1. n. al. er. io. 計式. sit. ~ 套入一階摺刀估計式 Sˆ12 (v1)  nS12  (n  1) Sˆ12( v1),( n 1) 帶入(3.7)式,可得共有物種估. Ch. n 1  ~ Sˆ12 ( v1)  S12  f1 n. engchi. i n U. v. (3.8). 亦可把 Sˆ12( v1) 寫成 f i 線性組合 n n ~ n  n 1  Sˆ12( v1)  S12  f1   f i  f1   ai f i n n 1 i 1 i 1. 其中. a1 . (n  1)( f1  2 f 11 )  1 , a 2    an  1 nf1. 由 Burnham and Overton (1978)變異數推導過程可得 Sˆ12( v1) 估計變異數為 . n. Var ( Sˆ12( v1) )   ai2 f i  Sˆ12 (v1) i 1. 16. (3.9).

(24) 3.3 未出現共有物種機率估計式 Good (1953)提出未出現物種機率估計,可由之前抽樣出現一次的物種個數 除以樣本數來估計未出現物種的機率。 延伸此想法,在兩群落各抽取 n 個樣本後,未出現的共有物種的情況有三種: 第一為共有物種在群落一未出現,但在群落二出現一次以上;再者為共有物種在 群落二未出現,但在群落一出現一次以上;最後為共有物種在群落一和群落二都 未出現。下次抽樣出現新共有物種亦分為三種,第一為共有物種在群落一出現一 次,且在群落二出現一次以上;再者為共有物種在群落二出現一次,且在群落一. 政 治 大. 出現一次以上;最後為共有物種在群落一出現一次且在群落二亦出現一次。利用. 立. 抽樣中共有物種出現一次的資訊估計未出現共有物種機率,其估計式 v2 (n) 為. ‧ 國. S12. 學. S12.  I[ X (n)  1, Y (n)  0]  I[ X (n)  0, Y (n)  1]. v2 (n) . i. i. i. i 1. . n. i. i 1. n. (3.10). ‧. Nat. er. io. sit. y. 3.4 共有物種估計式. 本節參照上一節做法,延伸 Burnham and Overton (1978)單一群落一階摺刀. al. n. v i n 估計式概念,在兩群落中各抽C n 個樣本,一次剔除一組樣本,共有 n 組樣本。例 hengchi U 如:在群落一剔除樣本 1 在群落二也替除樣本 1。定義 z1i. z1i  I [ X i (n)  1, Yi (n)  0]  I [ X i (n)  0, Yi (n)  1] ~ 可得 Sˆ12 ( v 2),( n 1),i  S 12  z1i 1 n 1 n 1 ~ ~ ~  Sˆ12 ( v 2 ),( n1)   Sˆ12 (v 2),( n 1),i  S 12   z1i  S 12  f 1 n i 1 n i 1 n. (3.11). S12 ~ S12 其中 f 1   I [ X i (n)  1, Yi (n)  0]   I [ X i (n)  0, Yi (n)  1] i 1. i 1. ~ 套入一階摺刀估計式 Sˆ12( v 2)  nS12  (n  1) Sˆ12 (v 2),( n 1) 帶入(3.11)式,可得共有物種估 17.

(25) 計式 n 1 ~ ~ Sˆ12 (v 2 )  S12  f1 n. (3.12). 亦可把 Sˆ12( v 2) 寫成 f i 線性組合 n n ~ n 1 ~ n 1 ~ Sˆ12 (v 2)  S12  f1   f i  f 1   bi f i n n i 1 i 1. 或 n n ~ ~ n 1 ~ n 1 ~ Sˆ12 (v 2)  S12  f1   f i  f 1   ci f i n n i 1 i 1. 其中. 政 治 大. (n  1)( f 1  f 11 )  1 , b2    bn  1 nf 1. b1 . 立. ‧ 國. 學. ~ ~ ~ ( nn1 f 1  f1  f11 ) f i  f ii c1   1 , c  ~ ~ , i  2, , n i f1 fi. n. . y. Var ( Sˆ12 (v 2) )   bi2 f i  Sˆ12 (v 2). (3.13). io. sit. i 1. al. n. n  ~ Var ( Sˆ12 ( v 2 ) )   ci2 f i  Sˆ12 ( v 2 ). Ch. i 1. engchi. er. Nat. 或. ‧. 由 Burnham and Overton 變異數推導過程可得 Sˆ12( v1) 估計變異數為. i n U. v. (3.14). 利用(3.14)式計算出的估計變異數有時會不合理的負值產生,後續 Sˆ12 ( v 2) 之變異數 估計皆使用(3.13)式。 上述的理論推導,仿造 Burnham and Overton (1978)單一群落的方式進行, 結果也與單一群落類似。接下來,將以電腦模擬驗證本章的結果,以及使用者實 證上的建議,模擬分為兩個部份:給定兩群落分配下,驗證本研究所提出方法「機 率值」、「期望值」及「變異數」,和實際資料驗證,在實際資料驗證上除了驗證 機率值、期望值與變異數外,亦運用涵蓋機率方式,找出抽取特定比例樣本即能 準確估計到真實共有物種數。 18.

(26) 第四章. 電腦模擬驗證. 為了驗證本研究所提出方法,此章首先採用理論模擬的方法進行驗證,著重 於估計值的「期望值」與「變異數」和大樣本下的性質,實際資料驗證則會在下 一章進行探討,因為兩群落的相關研究不多,本研究模擬驗證主要比較對象為 Chao et al. (2000)。此章模擬方法採用 Monte Carlo Method(蒙地卡羅法),各個 估計值為取 1000 次蒙地卡羅的平均。主要比較共有物種數估計,哪一種估計式 最快趨近於真實值。. 0.20. 共有物種分佈. ‧ 國. y 40. 60. io. 物種代號. n. al. sit. 20. i n U. 圖 4-1、 共有物種分佈. Ch. engchi. 80. 100. er. 0.10 0.05 0.00. ‧. Nat. 0. 群落一 群落二. 學. 物種出現機率. 0.15. 立. 政 治 大. v. 共有物種在兩群落的分佈可以分成三種狀況,第一為 S12 個共有物種在兩群 落出現機率各為前 S12 大的物種;第二為 S12 個共有物種在其中一個群落出現機 率為前 S12 大的物種,在另一群落為出現機率最小的 S12 個物種;最後 S12 個共有 物種在兩群落出現機率各為最小的 S12 個物種。為了更符合實際情況的應用此章 採用第一種情況下進行模擬,並假設兩群落物種出現的機率各服從某分配下進行 探討。例如:在情況一下,兩群落服從參數為 0.1 和 0.2 的幾何分配,物種數各 為 100,共有物種數為 20,共有物種在兩群落出現機率為圖 4-1 的斜線區域。 本章編排依序如下:本研究所提出未出現共有物種機率與實際值比較、各個 共有物種估計式優劣比較,最後為本研究提出變異數合理性探討。 19.

(27) 4.1 未出現共有物種機率電腦模擬探討 在此假設兩群落物種皆服從參數為 P 的幾何分配,其機率密度函數為. f ( x)  p(1  p) x1 , x  1,2,,且兩群落皆抽一樣的樣本數。共實驗了幾何分配參 數為 0.1 至 0.4,兩群落物種數 S1  S 2  100,共有物種數為 20 和 50 共 8 種情況。 可明顯的發現用本研究發展出的兩個估計式 v1 (n) 和 v2 (n) (3.3 式和 3.10 式),估 計效果都不錯離真實機率值很接近,但 v2 (n) 的估計效果會比 v1 (n) 更為準確一些。 為了更清楚的比較 v1 (n) 和 v2 (n) 與真實機率值的差距,使用了估計機率值和真實 機率值的比值即. 估計機率值 ,比值越接近 1 表示估計值越準確,遠大於 1 或接 真實機率值. 政 治 大 近 0 的比值代表估計的越不準確。從圖 4.1-1 和圖 4.1-2 可發現,在四種幾何分 立. ‧ 國. 學. 配參數設定下不管樣本數為多少, v1 (n) 幾乎呈現高估狀態,但估計機率值和真. 實機率值的比值卻都在 1.5 之下,不會有很大的偏誤產生。 v2 (n) 在四種幾何分. ‧. 配參數設定下且不管樣本數為多少,其估計機率值和真實機率值的比值都很貼近. sit. y. Nat. 1,從圖 4.1-1 和圖 4.1-2 可清楚看出其比值都在 1 附近很小幅度的震盪,代表. io. er. 著 v2 (n) 估計未出現共有物種機率蠻準確,且帶有不偏性的訊息,但 v2 (n) 是否為 不偏估計量有待理論證明之。. n. al. Ch. engchi. 20. i n U. v.

(28) 1.0. P=0.4 P=0.3. 0.6. ratio. 1.4. v'1(n) 與真實機率比值. 0. 2000. 4000. 6000. 8000. P=0.2 P=0.1 10000. sample size. 1.0. P=0.4 P=0.3. 0.6. ratio. 1.4. v'2(n) 與真實機率比值. 0. 2000. 4000. 6000. 8000. P=0.2 P=0.1 10000. sample size. 政 治 大. 圖 4.1-1、 共有物種數為 20 下估計機率與真實機率比值. 立. 學. ‧ 國. P ~ Geom( P) , Q ~ Geom( P), S1  100, S 2  100, S12  20 註:真實數值見附表 1 和附表 3. y. sit. n. 0.6. io. al. er. 1.0. 1.4. Nat. ratio. ‧. v'1(n) 與真實機率比值. 0. 10000. Ch. 20000. 30000. size esample ngchi. i n U. v. P=0.4 P=0.3 40000. P=0.2 P=0.1 50000. 1.0. P=0.4 P=0.3. 0.6. ratio. 1.4. v'2(n) 與真實機率比值. 0. 10000. 20000. 30000. 40000. sample size. 圖 4.1-2、 共有物種數為 50 下估計機率與真實機率比值. P ~ Geom( P) , Q ~ Geom( P), S1  100, S 2  100, S12  50 註:真實數值見附表 2 和附表 4. 21. P=0.2 P=0.1 50000.

(29) 4.2 共有物種數電腦模擬探討 假設兩群落物種皆服從參數為 P 的幾何分配,且兩群落皆抽取一樣的樣本 數。共實驗了幾何分配參數為 0.1 至 0.4,兩群落物種數 S1  S 2  100 ,共有物種 數為 20 和 50 共 8 種情況。在共有物種數為 20,幾何分配參數為 0.1 至 0.3 情況 下,樣本數少時會呈現低估狀況,但隨樣本數增加估計值會從低估情形變成高估 最後趨近於真實值,從圖 4.2-1 可明顯看見不管是 Sˆ12( v1) 或 Sˆ12( v 2) 都有此特性。 但在共有物種數為 50 下只有幾何分配參數為 0.1 擁有這種性質,其原因是 分配假設所造成。幾何分配參數 P 越大時其分配下降速度會非常快,造成抽樣. 政 治 大. 時出現的物種只集中在前面幾項物種,後面的共有物種出現機率很低物種相對較. 立. 難被抽取到。又因為 Sˆ12( v1) 和 Sˆ12( v 2) 都是利用樣本中共有物種出現一次的訊息,來. ‧ 國. 學. 估計所有共有物種數,但在幾何分配參數為 0.4 下,因很難從樣本中看到共有物. ‧. 種出現一次的訊息。若跟幾何分配參數 0.1 相比,由圖 4.2-2 可清出看出,幾何. sit. y. Nat. 分配參數 0.4 不論是 Sˆ12( v1) 或 Sˆ12( v 2) 估計值一直呈現低估狀況,要再抽取更多的樣. n. al. er. io. 本才能準確估計到真實值。. i n U. v. 縱觀上述性質,本研究所提出 Sˆ12( v1) 和 Sˆ12( v 2) 估計式會受限於兩群落的分配不. Ch. engchi. 同,需要抽取不同樣本數才能準確估計實際共有物種數,而不是只抽取一定樣本 數就能準確估計不同分配下的共有物種數。. 22.

(30) 10 15 20 25 5. P=0.4 P=0.3 P=0.2. P=0.1 real number. 0. Share species. ^ S 12v1 估計值. 0. 2000. 4000. 6000. 8000. 10000. 10 15 20 25. ^ S 12v2 估計值. 5. P=0.4 P=0.3 P=0.2. P=0.1 real number. 0. Share species. sample size. 0. 2000. 4000. 6000. 8000. 10000. sample size. 政 治 大. 圖 4.2-1、 共有物種為 20 下 Sˆ12 ( v1) 和 Sˆ12 ( v 2 ) 估計值. 立. ‧ 國. 學. P ~ Geom( P) , Q ~ Geom( P), S1  100, S 2  100, S12  20. 10000. y. 50 30. sit er. Ch. n U esample hi n g csize. 20000. 30000. iv. P=0.4 P=0.3 P=0.2. 40000. P=0.1 real number. 50000. 30. 50. ^ S 12v2 估計值. P=0.4 P=0.3 P=0.2. 0 10. Share species. al. n. 0 10. io. 0. ‧. ^ S 12v1 估計值. Nat. Share species. 註:真實數值見附表 6. 0. 10000. 20000. 30000. 40000. sample size. 圖 4.2-2、共有物種為 50 下 Sˆ12 ( v1) 和 Sˆ12 ( v 2 ) 估計值. P ~ Geom( P) , Q ~ Geom( P), S1  100, S 2  100, S12  50 註:真實數值見附表 7 23. P=0.1 real number. 50000.

(31) 接著用本研究所提出方法與 Chao et al. (2000)所提出估計式做比較。首先假 設兩群落物種皆服從均勻分配參數為 0.01,兩群落物種數各為 100,共有物種數 為 80,四種方法 Sˆ12(v1) 、 Sˆ12( v 2) 、 Sˆ12 (Chao1) 和 Sˆ12 (Chao 2) 一開始從低估到高估,當樣 本數夠多時四種方法都會趨近於真實值。在此兩群落分配假設符合 Sˆ12 (Chao1) 假設 前提,即 p1 q1    p S12 q S12 ,所以 Sˆ12 (Chao1) 很快的趨近到真實值, Sˆ12 (Chao 2) 雖然 跳動幅度很大,但也比本研究所提出之兩種方法快趨近於真實值,而 Sˆ12(v1) 和. Sˆ12( v 2) 幾乎同一時間趨近於真實值(如圖 4.2-3)。. 政 治 大. Under Uniform(0.01) S1  S2=100 S12  80. ‧ 國. 100 80 60. ‧ y. sit. al. 500. 0. ^ S12v1 ^ S. ^ S12Chao1. real number. 12Chao2. n. 0. ~ S12 ^ S. er. io. 20. 40. Nat. Share species. 學. 120. 140. 立. Ch. 1000. engchi sample size. i n U. v. 1500. 12v2. 2000. 圖 4.2-3、 均勻分配下共有物種數 80 Sˆ12(v1) 、 Sˆ12( v 2) 、 Sˆ12 (Chao1) 和 Sˆ12 (Chao 2) 估計值 註:真實數值見附表 5 在共有物種數為 20 分配為幾何分配參數 0.2 的情況下, Sˆ12(v1) 和 Sˆ12( v 2) 估計 式會從低估到高估最後會趨近於真實值,而 Sˆ12 (Chao 2) 隨著樣本數增加會趨近於真 實值,中間高估的傾向不會太明顯。在此設定下 Sˆ12 (Chao 2) 估計式會估計的較好, 但 Sˆ12(v1) 、 Sˆ12( v 2) 也絲毫不遜色(如圖 4.2-4 右)。 24.

(32) 若共有物種數少但在幾何分配參數為 P 較大時(如圖 4.2-4 左),或在共有物 種數較多時(如圖 4.2-5),Sˆ12(v1) 估計效果會比 Sˆ12( v 2) 和 Sˆ12 (Chao 2) 來的好,而 Sˆ12( v 2) 也 比 Sˆ12 (Chao 2) 估計效果來的要好,換而言之即是抽取較少的樣本,估計值就可較快 接近真實共有物種數。但如果抽取樣本數夠多時,三個估計式都會趨近於真實 值。 綜合上述結果,Chao et al. (2000)所提出估計式在分配較均勻時有較好的估 計效果,本研究所提出方法在分配較均勻時雖比 Chao 估計式差一點,但差距也 不算太大。在分配較不均勻時,或在比較平滑的幾何分配但共有物種數較多時,. 政 治 大. 本研究所提出方法估計效果會比 Chao 估計式來的好。不管兩群落物種分配是否. 立. 為均勻分配用本研究提出方法來估計共有物種數,其結果都還算不錯。. ‧ 國. 學. 0. 6000. sit er. 15. Share species. 20. y. 25. 4000. v. 5. engchi. i n U. ~ S12 ^ S12Chao2 ^ S12v1. ^ S12v2 real number 0. 5. 10. n 2000. Ch. 10. 25 15. io. Share species. 20. Nat. al. ~ S12 ^ S12Chao2 ^ S12v1 0. Under Geom(0.2) S1  S2=100 S12  20. ‧. Under Geom(0.4) S1  S2=100 S12  20. 8000. 10000. 0. sample size. 2000. 4000. 6000. ^ S12v2 real number. 8000. sample size. 圖 4.2-4、幾何分配共有物種數為 20 Sˆ12 ( v1) 、 Sˆ12 ( v 2 ) 和 Sˆ12 (Chao 2) 估計值 註:真實數值見附表 6. 25. 10000.

(33) 10000. 20000. 40 30 10. ~ S12 ^ S. ^ S12v2. 30000. 40000. sample size. ^ S12v2. 12Chao2. real number. 50000. real number. ^ S12v1. 0. 0. ~ S12 ^ S12Chao2 ^ S12v1. 0. 20. Share species. 40 30 20 10. Share species. 50. Under Geom(0.2) S1  S2=100 S12  50. 50. Under Geom(0.3) S1  S2=100 S12  50. 0. 10000. 20000. 政 治 大. 30000. 40000. 50000. sample size. 圖 4.2-5、幾何分配共有物種數為 50 Sˆ12 ( v1) 、 Sˆ12 ( v 2 ) 和 Sˆ12 (Chao 2) 估計值 註:真實數值見附表 7. 立. ‧ 國. 學. 上述分配假設條件皆假設兩群落為相同分配下進行討論,接下來在兩群落分. ‧. 配不相同下進行討論。在上述結果中可清楚看到 Chao 估計式在均勻分配和幾何. y. Nat. 分配參數 0.2 以下,表現皆比本研究提出之估計式來的好一些。所以在此假設群. er. io. sit. 落一服從均勻分配參數為 0.01,而群落二服從參數為 0.1 的幾何分配,且設定兩 群落物種數各為 100,共有物種數為 80。在此假設條件設定下,一開始樣本數較. n. al. 少時相較之下 Sˆ12 ( v1) 和 Sˆ12 ( v 2 ). v i n C h Sˆ 估計值都比 U e n g c h i估計值來的準確,但樣本數增加 12 ( Chao 2 ). 到一定程度時,在 Chao 設定下的稀有共有物種資訊會不存在造成 Cˆ 12*  0 。即使 做 1000 次蒙地卡羅,若樣本數大到一定程度 1000 次模擬的 Cˆ 12* 都會為 0,因而 無法使用 Sˆ12 (Chao 2) 來估計。但本研究所提出的方法不管兩群落分配為何,不會發 生像 Chao 估計式一樣的情況。由圖 4.2-6 Sˆ12( v1) 和 Sˆ12( v 2) 兩條線幾乎重疊,估計 式從樣本數少時低估,到樣本抽取到一定程度而趨近於真實值。 若兩群落分配皆為均勻分配,或兩群落皆為幾何分配參數 0.1 至 0.2 之間, 26.

(34) 且共有物種數較少情況下,Chao 估計式表現的皆不錯,但在個群落分配為幾何 分配參數為 0.1,另一群落為均勻分配參數為 0.01 下,若共有物種數較少時 Chao 估計式估計的效果還算不錯,但在共有物種數多時 Chao 估計量就會發生不可估 計的情形,但本研究所提出的方法不會受限於兩群落的分配為何。概括性來說, 若兩群落分配在抽樣時會造成 Chao 假設的稀有共有物種資訊不存在時,其估計 式就無法使用,但本研究所提出之方法不會受限於此種狀況。所以不論兩群落分 配為何,都可使用本研究所提出方法來估計共有物種數。. 60. 立. 政 治 大. ^ S12 v2. 10000. 20000. 30000. io. sample size. n. al. sit. y. real number. 40000. 50000. er. 40 20 0. ~ S12 ^ S12Chao2 ^ S12v1. Nat. 0. ‧. ‧ 國. 學. Share species. 80. Under Uniform(0.01) Geom(0.1) S1  S2=100 S12  80. i n U. v. 圖 4.2-6、均勻分配和幾何分配共有物種數為 80 Sˆ12 ( v1) 、 Sˆ12 ( v 2 ) 和 Sˆ12 (Chao 2) 估計值 註:真實數值見附表 8. Ch. engchi. 4.3 模擬驗證變異數數值 在此利用 1000 次蒙地卡羅法計算出的估計值取其變異數,與本研究所提出 估計變異數做比較,驗證本研究提出之變異數估計式的合理性與可行性。 假設兩群落皆服從幾何分配參數為 P,兩群落物種數各為 100,且共有物種 數為 50。由圖 4.3-1 得知 Sˆ12( v1) 的變異數估計量(3.9 式),在四個幾何分配參數假 27.

(35) 設下其估計值皆比估計值變異數要來的高,但差距並不大。由圖 4.3-2 得知 Sˆ12 ( v 2) 的變異數估計量(3.13 式),在四個幾何分配假設下會非常接近估計值變異數,在 . 幾何分配參數 0.4 至 0.2 下, Var (Sˆ12 (v 2) ) 會比估計值變異數些許的低一些,但在 幾何分配參數為 0.1 下,Sˆ12 ( v 2) 估計變異數會比估計值變異數來的些許的高一些。 當估計值趨近於真實值時,理論上變異數會非常小甚至會接近 0。由圖 4.3-1 和圖 4.3-2 參數為 0.1 的幾何分配,當估計值 Sˆ12( v1) 和 Sˆ12 ( v 2) 趨近於真實值時,不 . . 論是 Var ( Sˆ12( v1) ) 或者是 Var (Sˆ12 (v 2) ) 皆會趨近於 0,符合理論上假設。由上述討論. 政 治 大. 可證實本研究所提出之變異數估計式確實可行。. 立. 10000. 20000. 20 15 10. variance. 5 0. 30000. 40000. 12v1. 50000. 0. 10000. 20000. 30000. 40000. 50000. sample size. sample size. Under Geom(0.2) S1  S2=100 S12  50. Under Geom(0.1) S1  S2=100 S12  50. 5 0. 0. 10000. 20000. sit. y 40000. 20. 30. er. 40. 30000. variance. 10. 15. n. Ch. engchi 10. 20. io. al. ^ Var(S12v1 )(Est. value variance) ^ ^ Var S12v1. ^ Var(S12 v1)(Est. value variance) ^ ^ VarS12v1 . i n U. v. 0. 25. Nat. variance. ‧ 國. 0. 0. ^ Var(S12 v1)(Est. value variance) ^ S ^ Var . ‧. 5. 10. 15. 20. ^ Var(S12v1 )(Est. value variance) ^ ^ Var S12v1. 學. variance. 25. Under Geom(0.3) S1  S2=100 S12  50. 25. Under Geom(0.4) S1  S2=100 S12  50. 50000. 0. sample size. 10000. 20000. 30000. sample size . 圖 4.3-1 、 Var ( Sˆ12 ( v1) ) 與估計值變異數比較 註:真實數值見附表 10. 28. 40000. 50000.

(36) 0. 10000. 20000. 30000. 40000. 10 5. variance. 50000. 0. 10000. 20000. 30000. 40000. 50000. sample size. Under Geom(0.2) S1  S2=100 S12  50. Under Geom(0.1) S1  S2=100 S12  50. 0. 10000. 20000. 30000. 40000. 20 15 5 0. 5. ^ Var(S12v2 )(Est. value variance) ^ ^ Var S12v2. ^ Var(S12 v2)(Est. value variance) ^ ^ VarS12v2 . 10. 10. variance. 25. 15. sample size. 0. variance. ^ Var(S12 v2)(Est. value variance) ^ ^ Var S12v2. 0. 5. 10. ^ Var(S12v2 )(Est. value variance) ^ ^ Var S12v2. 0. variance. 15. Under Geom(0.3) S1  S2=100 S12  50. 15. Under Geom(0.4) S1  S2=100 S12  50. 50000. 0. sample size. 10000. 20000. 30000. 40000. 50000. sample size. 治 政 ˆ 大 圖 4.3-2 、 Var (S ) 與估計值變異數比較 立 . 12 ( v 2 ). 註:真實數值見附表 10. ‧ 國. 學. 接著用本研究提出的變異數估計式和 Sˆ12 (Chao 2) 的估計值變異數做比較。在估. ‧. 計值未趨近於真實值前,本研究所提出之估計變異數會較穩定,而 Sˆ12 (Chao 2) 估計. y. Nat. io. sit. 值變異數在不同樣本數下,震盪幅度會比本研究所提出估計變異數來的大,但在. er. 估計值趨近於真實值時, Sˆ12 (Chao 2) 估計值變異數趨近到 0 的速度會比本研究所提. al. n. v i n 出之估計變異數來的快。由圖C4.3-3 兩群落分配為幾何分配參數為 0.4 下,樣本 hengchi U 數到 50000 時三個估計式 Sˆ12( v1) 、 Sˆ12( v 2) 和 Sˆ12 (Chao 2) 皆離真實值很遠,本研究所提. 出之變異數在未趨近到真實值前皆很平穩,而 Sˆ12 (Chao 2) 估計值變異數震動幅度相 較之下卻比較大。但在兩群落為參數 0.1 幾何分配下,樣本數 4000 左右三個估 計式皆會趨近至真實值,但 Sˆ12 (Chao 2) 估計值變異數趨近至 0 的速度卻比本研究所 提出之變異數估計式來的快。 在此也應證了 4.2 節的結果,在兩群落分配較均勻下,例如幾何分配參數 0.1, 估計式 Sˆ12 (Chao 2) 會比本研究所提出之方法來的要好一些,其估計值 Sˆ12 (Chao 2) 趨近至 29.

(37) 接近真實值時, Sˆ12 (Chao 2) 估計值變異數趨近至 0 速度會比本研究所提出之估計變 異數來的快。但在兩群落分配較不均勻情況下,例如幾何分配參數 0.4,本研究 所提出估計式 Sˆ12( v1) 和 Sˆ12 ( v 2) 估計效果會比 Sˆ12 (Chao 2) 來的好,且其估計變異數 . . Var (Sˆ12 (v 2) ) 和 Var ( Sˆ12 ( v1) ) 也比 Sˆ12 (Chao 2) 估計值變異數來的平穩。. Under Geom(0.1) S1  S2=100 S12  50. 25. Under Geom(0.4) S1  S2=100 S12  50. 40. ^ S ^ Var 12v1 ^ ^ VarS12v2 ^ Var(S12chao2)(Est. value variance). 政 治 大. 20000. 20. variance. 10 0. 30000. 40000. 50000. 0. 10000. 20000. 30000. y. 10000. Nat. 0. ‧. 0. 5. ‧ 國. 10. 15. 立. 學. variance. 30. 20. ^ S ^ Var 12v1 ^ ^ VarS12v2 ^ Var(S12chao2)(Est. value variance). 40000. 50000. sample size. io. . sit. sample size . n. al. er. 圖 4.3-3 、 Var ( Sˆ12( v1) ) 、 Var (Sˆ12 (v 2) ) 與 Sˆ12 (Chao 2) 估計值變異數比較 註:真實數值見附表 10. Ch. engchi. i n U. v. 本研究所提出之方法,在估計未出現共有物種機率上 v2 (n) 會非常接近真實 機率值,且不管兩群落分配和樣本大小,其估計結果皆非常接近真實值。在估計 共有物種數上,不管兩群落分配為合 Sˆ12( v1) 皆比 Sˆ12( v 2) 快趨近於真實值,且在樣本 數夠大時兩估計式皆會趨近於真實值。在估計變異數上,本研究所提出的兩估計 變異數與估計值取其變異數皆非常相近,確定本研究提出估計變異數確實可行。 以上為兩群落給定分配下電腦模擬結果,但本研究方法著重於應用在實際資料, 這部分的探討在下一章。. 30.

(38) 第五章. 實際資料驗證. 接續上一章給定分配下的模擬驗證,本章利用實際資料驗證本研究所提出之 方法應用在實際資料上的估計效果。使用的資料有文學作品中的金庸小說,以及 物種資料台灣野生水鳥、巴拿馬螃蟹和巴拿馬巴洛科羅拉多島森林資料。並且與 Chao et al. (2000)所提出方法做比較 在此章驗證方式為在兩群落下各隨機抽取 n 個樣本,且每個樣本點分別做 500 次模擬,其估計值為 500 次模擬取其平均。本研究方法變異數採用本研究所 提出估計變異數計算得之,Chao 估計值採用 Sˆ12 (Chao 2) ,其變異數為取 500 個. Sˆ12 (Chao 2). 政 治 大 估計值變異數。本章編排順序為:資料簡介、以抽出放回和抽出不放回 立 ‧. ‧ 國. probability)。. 學. 兩種方式討論未出現共有物種機率 、共有物種數估計和涵蓋機率(Coverage. Nat. sit. n. al. er. io. 金庸小說. y. 5.1 資料簡介. Ch. engchi. i n U. v. 金庸本名查良鏞,生於 1924 年,浙江海寧人。其作品最早於 1955 年在【新 晚報】連載的【書劍恩仇錄】 ,到 1972 年封筆小說【鹿鼎記】 ,共發行了 12 部膾 炙人口的武俠小說,是近代中國文學重要作者之一。 本章採了【射鵰英雄傳】對【神鵰俠侶】和【笑傲江湖】對【雪山飛狐】四 部金庸小說來做探討。. 台灣野生水鳥 此資料為 Chao (1995)和 Chao et al. (2000)文中用來驗證其結果的台灣野生水 鳥資料。地點位於新竹的客雅溪和中港溪,兩嚴重汙染的河流入海口。資料由新 31.

(39) 竹野生鳥協會,每個禮拜一次且為期一年的收集。. 巴拿馬螃蟹 此資料為Smith et al. (1996)文中所提及巴拿馬螃蟹(decapod crustacean (crab)),地點在巴拿馬的奇里基海灣烏瓦島礁(Uva Island reef in the Gulf of Chiriqui),和巴拿馬灣珍珠島(Pearl Island in the Gulf of Panama)的珊瑚礁群落。. 巴拿馬巴洛科羅拉多島森林1 巴洛科羅拉多島(Barro Colorado Island)森林位於巴拿馬運河中間的人造加 通湖(Gatun Lake),占地50公頃。在這50公頃的森林裡,調查每一棵胸徑大於等. 政 治 大. 於1公分的植物,記錄其位置、種類和大小且為長期調查,並且將此森林分為四. 立. 800567. 4070. 笑傲江湖. 420546. 3690. 2457. 2591. a l 群落一 85257 155 v i n C h 59666 U 149 群落二 engchi. n 巴拿馬螃蟹. 3649. er. 106628. sit. 神鵰俠侶. 雪山飛狐. 共有物種數. 4210. ‧. io 台灣野生水鳥. 物種種類數. y. 射鵰英雄傳 759086. 學. 母體數. Nat. 金庸小說. ‧ 國. 個區域A、AB、D、P,本章採用了A對AB和D對AB三個區域做探討。. 群落一. 1107. 55. 群落二. 4724. 50. A區. 242083. 308. 111. 31. 207 AB 區. 5883. 207. AB 區. 5883. 207. D區. 19870. 258. 巴洛科羅拉多島森林. 200 表 1、四組實際資料母體特性 1. 感謝中興大學沈宗荏老師提供此筆資料。 32.

(40) 5.2 四個實例之未出現共有物種機率探討 首先先來探討四個實例共有物種分佈情形。在四個實例中,物種分佈情形類 似於上一章所設定的幾何分配。且四個實例中共有物種分佈幾乎為兩群落出現機 率大的物種,這就是上一章理論模擬採用兩群落物種機率為前 S12 大當共有物種 的原因,是為了使時理論模擬狀況更符合實際資料情況下做驗證。圖 5.2-1 至圖 5.2-3 為各個物種或文字在自己群落出現的機率,左右(紅色和綠色)互相對應到相 同的物種或文字,為了讓圖能更清楚的顯示其差異,把物種或文字在自己所屬群 落出現機率開根號繪成圖 5.2-1 至圖 5.2-3。. 政 治 大. 金庸小說【神雕俠侶】對【射鵰英雄傳】其兩群落共有字數出現機率蠻相似. 立. 的,【笑傲江湖】對【雪山飛狐】兩群落共有字數出現機率差異性就大了些。巴. ‧ 國. 學. 拿馬螃蟹兩群落共有物種出現機率相較於其他資料差異是最大的,台灣野生水鳥 兩群落共有物種出現機率也算蠻相似的。巴洛科羅拉多島森林 D 區對 AB 區兩. Nat. n. al. er. io. sit. y. ‧. 群落共有物種出現機率的差異會比 A 區對 AB 區大一些。. Ch. engchi. i n U. v. 圖 5.2-1 、金庸小說共有物種分佈情形. 33.

(41) 巴拿馬螃蟹. 台灣野生水鳥. 3. 2. 1. 0. 1. 2. Group1. 3. 3. Group2. 2. 1. 0. 1. 2. Group1. 3. Group2. 政 治 大. 圖 5.2-2、 台灣野生水鳥、巴拿馬螃蟹共有物種分布情形. 立. 巴洛科羅拉多島森林. 巴洛科羅拉多島森林. ‧. ‧ 國. 學 er. io. sit. y. Nat. n. al. 2. 1.5. A區. 1. 0.5. 0. 0.5. 1. Ch 1.5. engchi 2. 2. AB區. 1.5. i n U 1. v. 0.5. 0. 0.5. D區. 1. 1.5. 2. AB區. 圖 5.2-3 、巴洛科羅拉多島森林共有物種分佈情形 接著以抽出放回和抽出不放回兩種抽樣方式,來看本研究所提出未出現共有 物種機率估計式的估計效果。為了更明顯看出其差異,採用跟上一章一樣的方式 進行比較,用估計機率值和真實機率值的比值即. 估計機率值 ,比值越接近 1 表 真實機率值. 示估計值越準確,遠大於 1 或接近 0 的比值代表估計的越不準確。 在抽出不放回下,不管是 v1 (n) 或是 v2 (n) 都呈現高估狀況即比值大於 1,隨 34.

(42) 著樣本數增加高估情況更為嚴重, v2 (n) 高估的情況會雖比 v1 (n) 來的好一些,但 若樣本大時高估情形也會很嚴重。由圖 5.2-4 六種實際情況皆為如此。 在抽出放回下,其估計結果就比抽出不放回好上許多,雖然 v1 (n) 亦呈現高 估的情形但其比值卻不超過 1.5,高估情況不會算太嚴重,隨著樣本數增加其比 值有趨近於 1 的趨勢。而 v2 (n) 不管樣本數為多少其比值皆在 1 附近做很小幅度 的震盪估計效果非常準確(圖 5.2-5)。其結果與上一章理論模擬的結論一樣,理 論模擬建立在抽出放回的情況下, v2 (n) 在理論模擬中不管樣本數為何,其比值 也在 1 附近小幅度震盪,在實際資料驗證上也是如此。從理論模擬和實際資料來. 政 治 大. 看 v2 (n) 在抽出放回下確實有不偏估計式的趨勢存在。. 立 20. 8. v'2(n). 6. ratio 0e+00. 2e+05. 8e+05. 1.0. 200. 400. 600. 800. sample size. 1000. 10000. 20000. 30000. 40000. 50000. 60000. sample size. sit. 4. Ch. 0.5. 0. 0. 3.0. engchi. i n U. 1200. v'1(n). v'2(n). v. 3. 2.5 2.0. v'2(n). 0. 0.0. 0.0. 0.5. 1.0. 1.5. ratio. 2.0. n. al. v'1(n). 1.5. 3.0 2.5. io. v'2(n). 6e+05. 巴 洛科 羅拉 多島 森林 估計值 與真 實值 比值 巴 洛科 羅拉 多島森 林估 計值 與真 實值 比值 A區 VS AB區 D區 VS AB區. 巴 拿馬螃 蟹估 計值 與真 實值 比值 v'1(n). 4e+05. sample size. y. 1e+05. er. 8e+04. 2. 6e+04. sample size. ratio. 4e+04. v'2(n). 1. 2e+04. v'1(n). 0. 2. 10 0. 5. ratio. 15. v'1(n). 4. ‧ 國. 2.0 1.5 0.5 0.0. v'2(n). Nat. 0e+00. ratio. 台 灣野 生水 鳥估計 值與 真實 值比 值. ‧. 1.0. ratio. 2.5. 3.0. v'1(n). 金 庸小 說估 計值 與真 實值比 值 射 鵰英雄 傳 VS 神鵰 俠侶. 學. 3.5. 金 庸小說 估計 值與 真實 值比 值 笑 傲江 湖 VS 雪 山飛 狐. 0. 1000. 2000. 3000. 4000. sample size. 5000. 6000. 0. 1000. 2000. 3000. 4000. 5000. sample size. 圖 5.2-4、 抽出不放回下估計機率與真實機率比值 註:真實數值見附表 11、附表 13、附表 15、附表 17、附表 19、附表 21. 35. 6000.

(43) 金 庸小 說估 計值 與真 實值比 值 射 鵰英雄 傳 VS 神鵰 俠侶. 150000. 200000. 2.0 0.5. 0e+00. 2e+05. sample size. 4e+05. v'2(n) 6e+05. 8e+05. 0. 40000. 50000. 60000. 2.0. ratio. 1.5. 2.0. 0.5. 1.0. ratio. 0.5. 2000. 2500. sample size. 0. 2000. 4000. 6000. 8000. v'2(n) 10000. v'1(n). 0.0. v'1(n). 0.0. v'2(n). 1500. 30000. sample size. 1.5. 2.0 1.5 1.0. 1000. 20000. v'2(n). 巴 洛科 羅拉 多島 森林 估計值 與真 實值 比值 巴 洛科 羅拉 多島森 林估 計值 與真 實值 比值 A區 VS AB區 D區 VS AB區. 0.5 0.0. v'1(n) 500. 10000. sample size. 巴 拿馬螃 蟹估 計值 與真 實值 比值. 0. v'1(n). 0.0. v'1(n). 1.0. 100000. 1.0. ratio. 1.5. 2.0 1.5 1.0. ratio 50000. v'2(n). 0.0. 0.0. v'1(n) 0. ratio. 台 灣野 生水 鳥估計 值與 真實 值比 值. 0.5. 1.0 0.5. ratio. 1.5. 2.0. 金 庸小說 估計 值與 真實 值比 值 笑 傲江 湖 VS 雪 山飛 狐. 12000. 0. 5000. sample size. 10000. v'2(n) 15000. 20000. sample size. 政 治 大. 圖 5.2-5、抽出放回下估計機率與真實機率比值. 立. 註:真實數值見附表 12、附表 14、附表 16、附表 18、附表 20、附表 22. ‧ 國. 學 ‧. 5.3 四個實例之共有物種數探討. Nat. sit. y. 以下共有物種數或共有字數探討,採取抽出不放回和抽出放回兩種方式,利. n. al. er. io. 用本研究所提出之兩種估計式 Sˆ12( v1) 、 Sˆ12( v 2) 與 Chao 估計式 Sˆ12 (Chao 2) 做比較。並且. Ch. i n U. v. 用本研究所提出之估計變異數計算其 95%信賴區間,而 Chao 估計式 95%信賴區. engchi. 間,則是由模擬中 500 個 Sˆ12 (Chao 2) 估計值的變異數計算所得。 因本研究抽樣設定是在兩群落抽取相同的樣本數下進行估計,在抽出不放回 下,樣本抽完的情況表示在比較小的群落母體的所有觀測個體全部都被抽取到。 以下抽出不放回樣本抽取完皆為其意思。在抽出放回中,抽 100%樣本並不代表 真的把群落中全部的觀測個體都抽到,因抽出放回的關係,所以有些個體會被重 複抽取到,但為了敘述的方便以下也用抽取多少百分比的樣本來敘述,其百分比 會超過 100%。之後討論抽取多少百分比的樣本,皆以較小群落為基準。 在抽出不放回下,六個案例中 Sˆ12( v1) 都是最快達到真實共有物種數或共有字 36.

(44) 數,即抽取的樣本比 Sˆ12( v 2) 和 Sˆ12 (Chao 2) 要少就可以先到達真實值,而六個案例中. Sˆ12 (Chao 2) 需要最多樣本才會達到真實值。在金庸小說【笑傲江湖】對【雪山飛狐】 下,幾乎全部的樣本快被抽取完 Sˆ12 (Chao 2) 才接近真實值(圖 5.3-1 左)。在巴拿馬螃 蟹例子中樣本快抽完時只有 Sˆ12( v1) 接近真實值,Sˆ12( v 2) 和 Sˆ12 (Chao 2) 皆未接近真實值, 但 Sˆ12( v 2) 會比 Sˆ12 (Chao 2) 靠近真實值一點(圖 5.3-2 左)。其他四個案例中金庸小說【射 鵰英雄傳】對【神鵰俠侶】、台灣野生水鳥和巴洛科羅拉多島兩個案例,其估計 值到達真實值後並不會趨近於真實值,而是一直往上高估(圖 5.3-1、圖 5.3-2 中. 120. 4000. 4e+04. sit. y. 100 80 60. er. 12v2. ~ S12 ^ S. 40. engchi U 12Chao2. ^ S 12v1 ^ S. v ni. 12Chao2. ^ S 12v1 ^ S. 20. ~ S12 ^ S. 12v2. real number. real number. real number. C.I.. C.I.. C.I.. 6e+04. sample size. 8e+04. 0. 0. 2e+04. share species. 3000 2000. Ch. 12v2. 0e+00. 台灣 野生水鳥共 有物種數估 計. 1e+05. 0e+00. 2e+05. 4e+05. sample size. 6e+05. 0. 1000 500. al. n. 12Chao2. ^ S 12v1 ^ S. share species. 1500. io ~ S12 ^ S. 1000. 2000. 金 庸小說共有 物種數估計 射 鵰英雄傳 VS 神鵰俠侶. ‧. 2500. 3000. 金庸小 說共有物種 數估計 笑傲江湖 VS 雪山飛狐. 學. ‧ 國. 立. Nat. share species. 政 治 大. 140. 右)。. 8e+05. 0. 10000. 20000. 30000. 40000. 50000. sample size. 圖 5.3-1 、抽出不放回下金庸小說和台灣野生水鳥共有物種數估計 註:真實數值見附表 11、附表 13、附表 15. 37. 60000.

(45) 巴 洛科羅拉多 島森林共有 物種數估計 巴洛 科羅拉多島 森林共有物 種數估計 A區 VS AB區 D區 VS AB區. 200 150 100. share species. 150 100. share species. 20. ~ S12 ^ S12Chao2 ^ S12v1 ^ S12v2. 400. 600. 800. 1000. ^ S 12v1 ^ S. ^ S 12v1 ^ S. 50. 12Chao2. 1200. 0. sample size. 1000. 2000. 3000. 12v2. real number. real number. C.I.. C.I.. 4000. 0. 0. 0. C.I. 200. ~ S12 ^ S. 12v2. real number. 0. ~ S12 ^ S. 12Chao2. 50. 10. share species. 30. 200. 40. 巴拿馬 螃蟹共有物 種數估計. 5000. 6000. 0. 1000. 2000. sample size. 政 治 大. 3000. 4000. 5000. 6000. sample size. 圖 5.3-2 、抽出不放回下巴拿馬螃蟹和巴洛科羅拉多島森林共有物種數估計. 立. 註:真實數值見附表 17、附表 19、附表 21. ‧ 國. 學. 在抽出放回中類似在無限母體抽取樣本,其概念跟第四章理論模擬驗證情況. ‧. 相同。在六個案例中其情況跟抽出不放回一樣, Sˆ12( v1) 是最先達到真實值,接著. sit. y. Nat. io. al. er. 是 Sˆ12( v 2) 最後為 Sˆ12 (Chao 2)。但在抽出不放回中,抽取的樣本數要比抽出放回的樣本. v. n. 數要少就能先到達真實值,三個估計式情況都為如此。三個估計式到達真實值後,. Ch. engchi. i n U. 隨著樣本數增加會趨近於真實值,這是與抽出不放回不同之處,其趨近特性與第 四章理論模擬的情況一致。值得一題的是本研究所提出之估計式在這六個抽出放 回案例中,會隨著樣本數增加從低估到高估最後會趨近於真實值,而 Chao 估計 式則是隨著樣本數增加而趨近於真實值,這兩種情況與第四章理論模的結果還蠻 一致的(圖 5.3-3、圖 5.3-4)。. 38.

參考文獻

相關文件

以下簡單介紹魔術三角形: 如圖 1, 若三角形每邊有 三個數且數字和都是定值, 稱為 3 階 (傳統) 魔術三角形; 如圖 2, 若每邊有三 個數且較大兩數和減最小數的差都是定值, 稱為

對於給定的一個 x 值,經過某一對應方式後得到「唯一」的 y 值,這種對應方式我們稱 為函數,其中 x 是自變數,y 是應變數。. 而在表

估計兩母 體平均數 差時樣本 數的選擇 估計兩母 體比例差

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006... 了解大樣本與小樣本母體常態、變異數已知與未知 下,單一母體平均數區間估計的方法。知悉

請利用十分逼近法計算出 √14 的近似值到小數點底下第

階段一 .小數為分數的另一記數方法 階段二 .認識小數部分各數字的數值 階段三 .比較小數的大小.

逸中、玟靜兩個人數學小考的平均分數為80分,若昊星的小考成績比逸

明龍計算一題兩個數相加的數學題目,不小心算成了相減,所得到的答