• 沒有找到結果。

第二章、 文獻探討

2.3 核醣核酸資料庫

由於核醣核酸的相關研究蓬勃發展,已知的核醣核酸序列及結構資料量快速 地成長,於是有許多相關的生物資料庫收集了分散在各個文獻的資料,以各自設 計的方法系統化地將核醣核酸的資料分門別類整理,公開提供給所有相關的研究 人員使用。目前核醣核酸相關的資料庫有許多,以下則簡單介紹幾個常用的資料 庫。

2.3.1 Rfam [Griffiths-Jones et al., 2003]

(http://www.sanger.ac.uk/Software/Rfam/)

Rfam(RNA families database of alignments and CMs)資料庫儲存了多數家族的核 醣核酸資料,包含家族成員各自的鹼基資料、家族的多重序列排比結果、以及家 族二級結構的共同結構元等,是一個廣泛被使用的資料庫。其中每個家族的排比 結果分為兩組資料,"SEED"集合裡的排比結果是以手動的方式完成,參與排 比的序列有高度的相似性;而另一組"FULL"集合裡的排比結果則是以共變模 型(covariance model, CM)的方法[Eddy SR and Dubrin R, 1994]所產生。

2.3.2 The RNase P Database [Brown, 1999]

(http://www.mbio.ncsu.edu/RNAseP/home.html)

資料庫收集了 Ribonuclease P 家族序列的資訊,含有家族序列排比資訊、各

序列摺疊的二級結構、以及部分序列的 3D 摺疊立體結構。其中的序列與二級結 構則以生物有機體做為分類,每條序列皆有連結可連至 NCBI(National Center for Biotechnology Information)網頁查詢較完整的資訊,而二級結構則有 4 種檔案格 式可供使用。

2.3.3 tRNA Compilation 2000 [Sprinzl et al., 1996]

(http://www.staff.uni-bayreuth.de/~btc914/search/)

資料庫收集了大量的轉錄核醣核酸序列,亦包含了明確的結構資訊。資料庫 中提供了查詢的功能,可在 11 個界(kingdom)中選擇適當的分類,再從界之下的 有機體(organism)分立中做選擇,最後再查詢是攜帶哪一種胺基酸的轉錄核醣核 酸,這比較適合有生物背景的使用者使用。

2.3.4 RAG [Gan HH et al., 2004; Fera D et al., 2004]

(http://monod.biomath.nyu.edu/rna/rna.php)

RAG(RNA-As-Graphs web resource)是一個存放 RNA 二級結構的資料庫,利用 圖學理論(Graph Theory)的結果,提供了一個量化的方法可以對 RNA 二級結構的 拓撲(topology)進行分類,相較於其他 RNA 的資料庫,RAG 容易用於比較相異二 級結構的相似與相異處。

RAG 提供了兩種二級結構拓撲的表示法:RNA tree graphs 及 RNA dual graphs,此兩種表示法可以列舉出所有可能的 RNA 二級結構元。

Æ

圖 4. RNA tree graph 與 RNA dual graph 示意圖

RNA tree graphs:

將突起結構與所有環狀結構都視為一個點(vertex),而莖幹結構則視為一個邊 (edge),如此便能將一個 RNA 二級結構表示成一個 RNA tree graph。但此表示法 無法表示擬結結構。

RNA dual graphs:

將莖幹結構視為一個點,而突起結構或環狀結構的單股(single strand)則視為 一個邊,如此便能將一個 RNA 二級結構表示成一個 RNA dual graph。此表示法可 以表示所有可能的 RNA 二級結構,包含了擬結結構。而 RAG 的接續下來的研究 [Kim N et al., 2004]也都著墨在 RNA dual graphs 的特性。

RAG 提供了圖學中圖形拓撲的表示法,然而擁有同一種拓撲的相異 RNA,

其二級結構還是很有可能會有很大的不同,因為缺少了每個點跟邊的長度資訊,

即使在每個點跟邊都只有些微差異的情況下,累積起來的差異依舊不小,這對尋 找 RNA 二級結構的共同結構元影響頗大。這是目前 RAG 的圖形拓撲表示法較為 不足的地方。

2.3.5 RNABase [Murty et al., 2003]

(http://www.rnabase.org/)

RNABase(The RNA Structure Database)資料庫整合了 Protein Data Bank(PDB)與 Nucleic Acid Data Base(NDB)兩者的核醣核酸資料,再依功能與結構的不同來做分 類。此資料庫的主要特色是能提供核醣核酸的 3D(three-dimensional)結構圖,另外 還能執行結構的分析與檢測。

2.3.6 SCOR [Klosterman et al., 2002; Tamura et al., 2004]

(http://scor.lbl.gov/)

SCOR(Structural Classification or RNA)提供了核醣核酸共同結構元的階級分 類,分別以生物功能、二級結構元和三級立體結構為依據,提供了三種不同的 分類方法。而生物功能類別則分別以分子功能、結構元功能與結構模型向下細 分;二級結構元類別則分類成髮夾結構和內部環狀結構,而各類別底下再依據結 構的形狀做更小的細分;三級立體結構類別則以各種形狀不同的相互作用作為細 分的依據。

2.3.7 其他常見資料庫

PseudoBase [Batenburg et al., 2000]

(http://wwwbio.leidenuniv.nl/~Batenburg/PKB.html)收集了擬節結構的核醣核酸相關 資料,包含了序列、結構與生物功能三類資訊。

5S ribosomal RNA database [Szymanski, 2002] (http://rose.man.poznan.pl/5SData/) 專門為 5S 的核醣體核醣核酸所建置,提供了這些序列的排比資訊與二級結構。

另外也提供了與這些核醣核酸結合蛋白質資訊。

miRBase(http://microrna.sanger.ac.uk/)收集了微核醣核酸序列,可依物種分類瀏 覽,此資料庫亦包含了各微核醣核酸的先質(precursor),也有提供搜尋介面,使 用者可根據序列片段、編號或名稱進行搜尋。

相關文件