• 沒有找到結果。

3.1 tBLASTn 的適用性

本實驗承接何宜佩的發現[32],Stigmatella aurantiaca 基因 STAUR_2131 (YP

003951762.1)與 Fungi 類有水平基因轉移現像[Figure.6]。此實驗與前述的其他方

法大部分都是利用 BLASTp 做為研究發現的基礎,因此要利用 Stigmatella

aurantiaca 來開發使用 tBLASTn 為基礎的新方法勢必要確認 tBLASTn 也能找到

BLASTp 可以找到的結果。

由於本方法目標是掃描全 Genome,而 Figure.4 中只有 A.oryzae、S. aurantiaca、

A.fumigatus、A.nidulans、N.crassa (紅色與藍色邊框)有完整的基因組。利用 Figure.4

中的蛋白為 query 進行 tBLASTn 對應本實驗的 database 後,可以發現 Figure.4

該有的 hit 都可以被找到,但同樣以核酸為 database 的 BLASTn 就只能掃到

STAUR_2131 了 [Table.1],這表示蛋白序列所含有的資訊較核酸多,因此本方法

選用 tBLASTn 做為研究基礎。

3.2 Mahalanobis 距離輸出與排序

由於同樣值點的 Mahalanobis 距離在不同的比較組中,其大小會不相同,因

此單純按照距離大小排序並不足以判斷水平基因轉移現像的顯著性。事實上,序

15

列太相似的比較組(常是同一種菌的不同品系),只要序列稍微不同就會造成相當

大的 Mahalanobis 距離。

序列間微小的差異不是此方法研究的重點,且這樣的輸出結果會大大增加研

究者篩選可能的轉移現象的時間。為了避免這樣的誤判我們對比較組的基因體相

似程度做了限制,在基因體相似度<70%時,前幾名的 Mahalanobis 距離輸出結果

之序列差異與比較組物種的差異才比較接近可能為水平基因轉移現象的結果。

另外,為了節省運算時間,我們也想找到 Mahalanobis 距離能成為 outlier 的最低

點。在所有輸出結果中有距離為 10 的基因點的比較組是 NC_014844.1 對

NC_014148.1 蛋白點名稱為「YP_003951646」,如[Figure.7]可以看出圖上已有更

明顯的 outlier「YP_003956356」,而該點的 Mahalanobis 距離為 39.83429,其餘

圖上明顯的 outlier 皆介於此值之間,因此我們先設定輸出的 outlier 閾值必須大

於 10。

如此,最後輸出的 Stigmatella aurantiaca 水平基因轉移現象候選基因一共有

3733 個。

3.3 STAUR_2131 散布圖分析

最終結果中與 STAUR_2131 有關係的比較組一共有六組,如[Table.2]所示,

其中三點的散布圖[Figure.8],皆可以看出 STAUR_2131 在這樣的比較組中是明顯

的 outlier(圖上箭頭位置),且圖形大致上呈線性分布,因此此方法確實能有效的

16

將有水平基因轉移現象的點規類為 outlier。但當比較組中的物種較遠時,比如

NC_015957(Bacteria)和 NW_001884672(Fungi),由於本身序列差異就比較大,因

此有共同對 Stigmatella aurantiaca 基因的 Hit 自然就很少,點數少的情況下看起

來線性的狀態就不佳,但 Mahalanobis 距離大的點仍然可以看出是

outlier(STAUR_2131)。

3.4 STAUR_2131 演化樹分析

將表二的六組比較組融合成 STAUR_2131 的候選基因群組,便可以建立一組

含有八組物種的群組,其演化樹為[Figure.9]。YP_003951762.1 (STAUR_2131)被分

在 Fungi 群中,最接近的是 NC_017850.1(M.oryzae)。在外面則是前述演化樹中被

認為最接近 STAUR_2131 的 NC_007198 (A.fumigatus)。此數整體的分類和前述演

化樹一樣是將 STAUR_2131 分累入了真菌群(藍色條)內,是明顯的水平基因轉移

現象,此外,圖上的另外兩個細菌類(紅色條)則 group 在一起後成為 outgroup,

間接說明此分類的正確性。

我們仍應檢視樣版演化樹,但此候選基因群組其物種間差異太大,因此

STAUR_2131 的候選基因群組中只有一個共同基因「YP_003951700」,這樣建出來

的樣版演化樹[Figure.10]或許沒有很強的效力,但仍然可以看到預想的結果─細

菌群與真菌群被完整的分離開來,且 Stigmatella aurantiaca 的位置是在細菌群內

的。而一般狀況下無法連接共同基因來建立樣版演化樹時應該要利用小核醣體

17

RNA,但此處的問題是 Fungi 類並沒有此一基因,因此無法利用小核醣體 RNA

建立樣版演化樹。

3.5 其餘的水平基因轉移現象候選基因

此次實驗篩選出了 3733 個水平基因轉移現象的候選基因,前一千組資料,

Mahalanobis 距離最大前三名分別為 YP_003950678.1、YP_003955618.1、

YP_003954354.1、YP_003953284.1,分數分別為 405、308、303、295 分。其演

化樹及樣版演化樹都顯示出分類上不一致的地方。

首先 YP_003950678.1 [Figure11.up] 的演化樹呈現了其與 NC_009328.1

(Geobacillus thermodenitrificans)、NC_006510.1(Geobacillus kaustophilus)演化距離

的差距,但在樣版演化樹上此差距變得相當小,顯示 YP_003950678.1 可能與

NC_009328.1 有水平基因轉移現象。

YP_003955618.1 [Figure12.up] 則呈現了更極端的現象,顯示 YP_003955618.1

與 NC_007973.1(Cupriavidus metallidurans)分類在一起,而樣版演化樹則是正常的

Cupriavidus 屬:NC_007973.1 與 NC_010528.1 (Cupriavidus taiwanensis)分類在一

起,足見 YP_003955618.1 與 NC_007973.1 有水平基因轉移現象。

YP_003954354.1 [Figure11.below]與 NC_003869.1(Caldanaerobacter

subterraneus)分類在一起,但樣版演化樹顯示 Caldanaerobacter subterraneus 的分 類應與 NC_010320.1、NC_014964 等 Thermoanaerobacter 屬的較為接近,事實

18

上,連在原演化樹中看似 outgroup 的 NC_014538.1 都是屬於

Thermoanaerobacteraceae 科的,和 Stigmatella aurantiaca 在分類上「門」的位階

就不同,因此樣版演化樹的結果應是可信,如此一來原演化樹極有可能是由

Thermoanaerobacteraceae 科的細菌水平基因轉移入 Stigmatella aurantiaca 的

YP_003954354.1 結果。

YP_003953284.1 [Figure12.below] 則是另一個水平基因轉移的例子,

YP_003953284.1 與 NC_017067.1(Marinobacter hydrocarbonoclasticus)群組在一起,

而未與其餘的 Marinobacter NC_008740.1、NC_017506.1 合在一起,似乎是水平

基因轉入的現象。

綜合以上的觀察我們可以說此方法確實在一定程度內能自動且大範圍的檢測出

水平基因轉移現象候選基因。

19

相關文件