數量 (Hudson, Slatkin, and Maddison, 1992)。而 Nm 值則表示推估的每世代族群遷 徙個體數,該值可間接評估基因交流的大小 (Slatkin, 1985)。Nm 是由該公式估算:
Fst=1/(1+2Nm)
若 Nm 值為 1,表示地區性族群間每世代平均有 1 個個體交流,足以防止個別族群 基因漂變 (genetic drift) 產生的遺傳分化。所以當 Nm 值小於 1,即表示族群間的
16
基因交流較弱,無法抑制漂變所產生的遺傳分化。
此外,以 DnaSP 計算 Tajima’s D test,以檢測族群間的變異是否只受到隨機基 因漂變而不是天擇的影響,並進行1000 次 permutation。Tajima’s D test 主要利用 核苷酸變異出現的頻率 (π) 和核苷酸變異位置的數量 (θ) 相關性作為計算依據,
利用有變異的核苷酸位置數與兩兩序列的核苷酸差異平均數兩者估算的θ值差異。
由於此檢測的虛無假設 (null hypothesis) 為檢測的序列均來自有效族群量穩定 (constant effective population size) 的族群,該段序列的突變也都是中性突變 (selective neutrality)。如果檢測的族群 (序列) 違反任一項假設,檢測的結果就會偏 離 0 拒絕虛無假設。在偏離0 的情況下,如果 Tajima’s D 值為負,表示曾經歷族群 擴張或是平衡選汰 (balancing selection),產生大量的低頻度基因單型。而如果 Tajima’s D 值為正,顯示過去的遺傳變異大多已經消失,表示族群曾經歷瓶頸效應 (bottleneck effect) 或是定向選汰 (directional selection)。所以 Tajima’s D test 也可以 用來推論族群發生的歷史事件。
2.3.3 建構親緣地理網狀圖及親緣地理關係分析
利用統計簡約 (statistical parsimony) 的概念,TCS ver.1.21 (Clement, Posada, and Crandall, 2000) 軟體建構不同基因單型間的最小關聯網狀圖。親緣地理網狀圖 的結構,可以根據以下條件決定各個序列中可能的祖先基因單型。整體來說,祖 先型的判定通常依據以下幾項準則:頻率最高、分布範圍最廣、位於結構中心的 基因單型多,以及與外群關係最近的基因單型,而TCS 程式推定的祖先型則是選 擇位於網狀結構中心的基因單型 (Castelloe and Templeton, 1994; Clement, Posada, and Crandall, 2000; Posada and Crandall, 2001)。
親緣地理網狀支系分析 (Nested Clade Phylogeographic Analysis, NCPA) 用以 推測演化途徑的原則有以下3 項:1. 新的基因單型是由古老的基因單型所衍生。
2. 若缺乏基因交流,則新發生的突變傾向留在原有的地理區。3. 如果所使用的特
17
徵不受演化影響,nested clade 中內部的 clades (internal clades) 會比末端 (tip clades) 古老。再把地理資訊與分子遺傳資料放進GEODIS ver.2.5 (Posada, Crandall, and Templeton, 2000),根據遺傳變異與族群地理位置提供的資訊,我們可以了解不同 族群間的遺傳變異程度與它們地理位置間的關係。經計算clade distance (Dc) 與 nested clade distance (Dn) 來了解每一個 clade 內地理分布的情形,與每個 clade 與 上一階層地理分布距離的值,與這些值統計上是否顯著來評估不同基因單型的傳 播能力,再配合Temploton (2004) 提出的檢索表 (inference key) 來了解遺傳變異 的空間分布以地理關係的了解,並進一步推測過去族群可能發生的歷史事件。
藉由比較相鄰小族群間的遺傳距離,軟體 BARRIER ver. 2.2 可以顯示不同族 群的空間關係,進而了解我們對族群的區分是否符合遺傳上差異。BARRIER 利用 Delaunay triangulation (Manni, Guerard, and Heyer, 2004) 演算法將不同個體間的遺 傳距離矩陣,以及採集時紀錄的地理座標加以分析,並偵測出可能的遺傳屏障出 現在何處。
18
3 結果
3.1 序列變異分析
本研究在東亞、東南亞及大洋洲地區共取得 123 個族群共 516 份 DNA 樣本,
並成功定序571 條 ITS 片段與 516 條葉綠體 ndhF-rpl32 區間,其中由於部分個體 的ITS 片段是由國家生物科技資訊中心 (National Center of Biotechnology
Information, NCBI) 取得、部分個體 PCR 失敗以及部分個體 concerted evolution 不 完全,因此較另一片段為多 (圖 3)。
ITS 片段總長為 596 bp(base pair, bp),總共有 9 個多態位點 (polymorphic sites),
可整理出9 個基因單型(圖 4),其中 4 個地區有其獨有的基因單型。1 個分布於中 國廣西,1 個是台灣的獨有型,分布在台灣的中北部。另外,大洋洲也有 2 個獨有 的基因單型,1 個廣泛分布於遠、近大洋洲,1 個則只分布在夏威夷 (表 9)。
而 ndhF-rpl32 片段總長為 1196 bp,有 41 個多態位點,可建出 40 個基因單型 (圖 5)。有 32 個是與地理分區明確相關的獨有基因單型,包括中國各省與台灣分別 獨有14 個基因單型,越南 1 個,菲律賓 1 個及遠大洋洲 2 個基因單型(表 10)。
3.2 族群遺傳變異分析
3.2.1 ITS 片段遺傳歧異度分析
將所有取得的構樹族群依照地理分區歸為台灣、日本、中國福建、廣東、海 南島、廣西、雲南、四川、上海、北京,東南亞菲律賓、越南、印尼、位於印度 洋上的留尼旺群島、大洋洲的遠大洋洲以及近大洋洲等16 個族群,利用程式 DnaSP 計算總體與各族群之核苷酸歧異度 (nucleotide diversity, π) 及基因歧異度
(hsplotype diversity, h)(表 3),構樹的核苷酸歧異度π值為 0.00133,基因歧異度 h 值為0.613。所有族群的基因歧異度介於 0 到 0.58788 間,而核苷酸歧異度則是介
19
於0 到 0.00204 之間。東亞及大洋洲各族群中,基因單型多樣性最高的是夏威夷 h= 0.58788,其次是菲律賓 (0.53030) 與台灣 (0.50772)。
另計算以上分群間的遺傳分化指數 (Fst) 與基因交流指數 (Nm) (表 5)。根據分 或是菲律賓(0.55),顯示構樹分布似乎不符合距離隔離模式 (isolation by distance)。
以軟體DnaSP 以 1000 次 permutation 計算所有構樹族群與各地理區的 Tajima’s D 值(表 3)。結果顯示整體的 Tajima’s D=-0.67,而各地區不管是整體的或是不同地 理區域,Tajima’s D 值均偏離 0,但是統計上並不顯著(P> 0.1),這樣的結果顯示在 ITS 片段沒有偵測到族群變動,序列也符合中性假說的預測。
3.2.2 ndhF-rpl32 片段遺傳歧異度分析
利用程式DnaSP 計算 ndhF-rpl32 片段中總體與各族群之核苷酸歧異度及基因
20
的遺傳分化。東亞與南島語族分布區族群間基因交流指數唯一大於1 的存在於台 灣與遠大洋洲間,顯示遠大洋洲跟台灣間雖然有海洋隔閡但依舊有一定程度的基 因交流。
運用軟體DnaSP 以計算所有構樹族群,與各地理區的 Tajima’s D 值(表 4),結 果顯示不管是整體的Tajima’s D=-1.15,除了某些地區只有一個基因單行或是個體 數少於4,其他地區不管是整體的或是不同地理區域,Tajima’s D 值均偏離 0,但 是統計上並不顯著 (P> 0.1),顯示這樣的偏離結果可能不是單純受天擇選汰所造成,
而是受到族群歷史,像是族群擴張或是瓶頸效應的影響。值得注意的是,整個大 洋洲地區的Tajima’s D 值顯著大於 0 (P< 0.05),顯示構樹的母本可能在大洋洲經 歷過瓶頸效應。