• 沒有找到結果。

1.1 研究動機

水平基因轉移的現象在原核與真核生物中都經常發生,且與相關基因的來源

與功能都有重要的關係。本研究的主體 Stigmatella aurantiaca 屬於黏球菌目

(Myxococcales),是一種「兼性補食菌」(facultative predatory bacteria),這類細菌

棲息在土壤、水中、與人體內,以共同(或單獨)溶解並捕食其它的細菌維生,對

象極廣且不論死活[1]。此類細菌之基因體大小較大,相較於一般細菌 Genome

大小介於 1Mb~9Mb 間[2],Stigmatella aurantiaca (NC_014623) 的 Genome 有

10.26Mb 之多[3]。這樣基因體大小的差距是為了對抗獵物的防禦機制,自行變異

並保留的?或起因於其補食的特性,使其較易發生水平基因轉移現象,從而得到

補食對象的廣泛選擇能力,便是值得討論的課題。

本實驗室之前已確認一組由 Aspergillus clavatus 與 Stigmatella aurantiaca 構

成水平基因轉移的例子─基因「STAUR_2131」,但基因的來源與 Stigmatella

aurantiaca 是否還有其它的基因受到水平基因轉移現象的影響則屬未知,因此本

實驗希望能對 Stigmatella aurantiaca 全基因進行掃描,找出可能發生水平基因轉

移現象的其它基因,判斷其來源以試著解答基因體大小異常的原因,並且發展出

一套新方法以利後續對其它的物種進行水平基因轉移現象的研究。

2

1.2 水平基因轉移

水平基因轉移(Horizontal Gene Transfer, HGT)又被稱做 Laterial Gene

Transfer(LGT),是指遺傳物質在物種間水平轉移的特定現象。在達爾文理論基礎

的遺傳學中,基因物質轉移應該是一代一代在演化樹的枝幹(clade)上發生,即垂

直基因轉移(Vertical Gene Transfer),但在一些情況下,遺傳物質的轉移是枝幹對

枝幹的(clade to clade),尤其是在原核生物中更為明顯[4],這樣的水平基因轉移

現象可以大大加速演化的速率、讓原核生物得到新的特性(比如抗生素的抵抗)。

事實上,水平基因轉移的速率往往高於我們能觀察到的[5],且是原核生物基因

體變異性的一個很重要影響因子─大約有 81 ± 15%的基因都曾發生過水平基因

轉移現象[6],顯示出雖然某些特定的水平基因轉移有其限制(如與宿主相關的毒

性基因),但大部分的基因都是可以被轉移的[7]。水平基因轉移在原核生物中可

以經由轉形(transformation)、結合(conjugation)、轉導(transduction) [8],和細菌

間的 Nanotube[9]來達成,另外一些海生的 Rhodobacter 可以自行吐出類似噬菌體

的結構來隨機轉移自己的某部分基因序列給其它 Rhodobacter,即 GTA(Gene

transfer agent)[10, 11],這樣的基因轉移是完全隨機挑選與隨機插入的,因此驅

動變異的速度非常的快[12]。而真核生物則可藉由吞噬作用(phagocytosis)或內共

生(endosymbiont)的交互作用造成。

在近期關於海洋細菌的研究中,一個特殊的水平基因轉移現象「GTA」,解

釋了海洋細菌如何快速得到新的特性以有彈性的與環境進行互動,如代謝環境中

3

的化學物質、溫室氣體,製造特殊的養分和扮演海洋生物鏈中的特殊功能,其基

因交換的頻率比起以往所預測的高出了驚人的 47%之多[12]。真核生物方面最近

也有研究指出,真菌類雖然因為有細胞壁且失去了胞吞作用的能力,但仍然能經

由水平基因轉移取得新的基因[13]。

之前的研究對於真核生物的起源與真細菌(Eubacteria)和古生菌(Archaea)之

間的關係有不同看法,比如將真核生物視為古生菌的 sister group、將真核生物分

在古生菌內、或認為古生菌與真細菌都是由一種類似真核生物的祖先

(Eukaryote-like ancestor)來的[14]。而最近關於水平基因轉移的研究協助我們了解

真核生物的基因組成是一種合成的形式(Chimeric),包含了細菌與古生菌特徵的

基因。進一步由演化樹分析,解決了多序列 alignment 的問題之後,可以建立出

網路形式的演化樹[15],得到真核生物中由古生菌而來的多半是訊息類

(informational)的基因,而自真細菌來的多半是功能性(operational)基因的結論。

訊息類的基因雖然數量比較少,可是在 protein-protein interaction 中扮演著重要

的角色,且這樣的蛋白質更容易和相同源的蛋白質交互作用[16]。所以自水平基

因轉移現象為起始的研究不只可以探究生物的新特性從何而來,甚至可以探究起

源與基因功能性的領域。

4

1.3 水平基因轉移之特徵

水平基因轉移現像可以藉由演化分析上的不一致與相關基因組成的不一致

觀察到。所謂演化分析上的不一致指的是有水平基因轉移現象的基因所呈現出的

演化樹分類(pattern),和拿來做為對照的標準演化樹分類會有明顯的不同。舉例

來說,當我們把一群有類似功能(或同源)但不同物種的基因 align 在一起之後建立

演化樹,再將此樹拿來和其他基因或者物種的演化樹(細菌中通常是利用小核醣

體 RNA─16S rRNA[17]來建)做比較,如果可以發現不一致的分類─通常是距離比

較遠的物種在水平基因轉移現像發生的演化樹中被插進原本近似的物種群中,就

可以直接證明水平基因轉移現像[18]。另一方面,基因組成的不一致也可以做為

水平基因轉移的現象的證據(Composition-based methods),比如 GC 含量(G+C

content)、二聯核苷酸相對豐富度(Dinucleotide Relative Abundance, DRA)、和密碼

子偏性(Codon usage bias)等。

二聯核苷酸相對豐富度是 1995 年由 Karlin S.和 Ladunga I.提出的,表示兩兩

核苷酸共同出現的相對機率,假設序列是完全隨機的,該值應為一常數,所以一

條序列的值相對於該常數的偏差;同 GC content 一樣,可以做為該條序列的特徵

[19]。因此檢測 HGT 候選基因的這些數值,與相鄰基因、HGT 可能來源基因做比

較,較接近後者的結果便預示了水平基因轉移的可能性。密碼子偏性則是基於

tRNA pool,由於大部分的胺基酸都是被一個以上的密碼子定義的,不同的物種

對於同一個胺基酸所喜好使用的密碼子比例甚至密碼子的組成可能不相同,距離

5

越遠的物種其差距會越大,且基因內 coding sequences 的密碼子組成會反映此一

偏性,才能使基因內容有效率且無誤的轉譯出來,因此研究密碼子的組成與使用

頻率便可以相當程度代表該 coding sequences 是來自哪個物種[19],從而得知與

水平基因轉移有關的訊息。

但是關於水平基因轉移之基因組成分析,都會受到轉移現象發生之後慢慢與接受

者的基因體同化現象的影響,而造成判斷上的困難。比如久遠以前的轉移或是接

受者的演化速率較快,都會造成比對原始來源與現今觀察者基因組成時,可能與

原始來源已較不相像的情況發生。因此,本實驗所利用的方法之一便是將每個基

因之同源基因都與另一條同源基因進行比對,用相對比較並找出歧異點的方法來

解決直接比較組成會碰到的問題。

6

1.4 檢測水平基因轉移現象的方法

由於 BLAST 本身即是兩序列同源性的應用,因此傳統針對單一基因之水平基

因轉移檢測可以經由全基因組或蛋白資料庫的 BLAST 結果,過濾掉相同或相近的

同源基因,找出序列近似度高但物種關係很遠的基因來當做水平基因轉移現象的

候選者,並進行接下來的演化與基因組成分析。

但是這樣的分析速度較慢且必須耗費人力去確認”關係很遠的物種”,因此有些檢

查 HGT 現象的方法便被開發了。

有別於傳統達爾文演化觀念中樹狀的表示法,在原核與真核生物中廣泛發生

的水平基因轉移現象會使演化樹變成網路的形式─即 Phylogenetic network。

Phylogenetic network 的建立讓我們能一目瞭然的知道基因的來源,而其建立法主

要分為:利用 SPR distance 與 Maximum Parsimony[20]。SPR 是一種融合重建演化

樹的方法,將兩棵或以上的樹以最少的移動次數(即 SPR distance)接在一起並建立

internal node 形成 network 的形式,而 Maximum Parsimony 則是在序列改變次數

最少的前提下嘗試加入 inter node 以使一個圖可以符合眾多分類法。但這樣改變

樹的型態的方法的前提都必須是原圖的不一致性是起因於演化上如基因轉移現

象,建樹的基因選擇困難[20],且無法廣泛的針對 Genome 進行檢測。因此我們

嚐試開發一套方法流程完成廣泛的水平基因轉移現象檢測。

7

相關文件