由於核醣核酸的相關研究蓬勃發展,已知的核醣核酸序列及結構資料量快速 地成長,於是有許多相關的生物資料庫收集了分散在各個文獻的資料,以各自設 計的方法系統化地將核醣核酸的資料分門別類整理,公開提供給所有相關的研究 人員使用。目前核醣核酸相關的資料庫有許多,以下則簡單介紹幾個常用的資料 庫。
2.3.1 Rfam
(http://www.sanger.ac.uk/Software/Rfam/)
Rfam(RNA families database of alignments and CMs),是由多重序列排比與共變 模型所建立的資料庫,其中儲存了多數家族的核醣核酸資料,包含家族成員各自 的鹼基資料、家族的多重序列排比結果、以及家族二級結構的共同結構元等,是 一個廣泛被使用的資料庫。
2.3.2 tRNA Compilation 2000
(http://www.staff.uni-bayreuth.de/~btc914/search/)
此資料庫收集了大量的轉錄核醣核酸序列,亦包含了明確的結構資訊。資料 庫中提供了查詢的功能,可在 11 個界(kingdom)中選擇適當的分類,再從界之下 的有機體(organism)分立中做選擇,最後再查詢是攜帶哪一種胺基酸的轉錄核醣 核酸,這比較適合有生物背景的使用者使用。
2.3.3 RNABase
(http://www.rnabase.org/)
RNABase(The RNA Structure Database)資料庫整合了 Protein Data Bank(PDB)與 Nucleic Acid Data Base(NDB)兩者的核醣核酸資料,再依功能與結構的不同來做分 類。此資料庫的主要特色是能提供核醣核酸的 3D(three-dimensional)結構圖,另外 還能執行結構的分析與檢測。
2.3.4 SCOR
(http://scor.lbl.gov/)
SCOR(Structural Classification or RNA)提供了核醣核酸共同結構元的階級分 類,分別以生物功能、二級結構元和三級立體結構為依據,提供了三種不同的 分類方法。而生物功能類別則分別以分子功能、結構元功能與結構模型向下細 分;二級結構元類別則分類成髮夾結構和內部環狀結構,而各類別底下再依據結 構的形狀做更小的細分;三級立體結構類別則以各種形狀不同的相互作用作為細 分的依據。
2.3.5 RAG
(http://monod.biomath.nyu.edu/rna/rna.php)
RAG(RNA-As-Graphs web resource)是一個存放 RNA 二級結構的資料庫,利用 圖學理論(Graph Theory)的結果,提供了一個量化的方法可以對 RNA 二級結構的 拓撲(topology)進行分類,相較於其他 RNA 的資料庫,RAG 容易用於比較相異二 級結構的相似與相異處。
RAG 提供了兩種二級結構拓撲的表示法:RNA tree graphs 及 RNA dual graphs,此兩種表示法可以列舉出所有可能的 RNA 二級結構元。
RNA tree graphs:
將突起結構與所有環狀結構都視為一個點(vertex),而莖幹結構則視為一個邊 (edge),如此便能將一個 RNA 二級結構表示成一個 RNA tree graph。但此表示法 無法表示擬結結構。
RNA dual graphs:
RNA tree graph 與 RNA dual graph 示意圖:
Æ
RAG 提供了圖學中圖形拓撲的表示法,然而擁有同一種拓撲的相異 RNA,
其二級結構還是很有可能會有很大的不同,因為缺少了每個點跟邊的長度資訊,
即使在每個點跟邊都只有些微差異的情況下,累積起來的差異依舊不小,這對尋 找 RNA 二級結構的共同結構元影響頗大。這是目前 RAG 的圖形拓撲表示法較為 不足的地方。
2.3.5 其他常見資料庫
PseudoBase(http://wwwbio.leidenuniv.nl/~Batenburg/PKB.html)收集了擬節結構 的核醣核酸相關資料,包含了序列、結構與生物功能三類資訊。
5S ribosomal RNA database(http://rose.man.poznan.pl/5SData/)專門為 5S 的核醣體 核醣核酸所建置,提供了這些序列的排比資訊與二級結構。另外也提供了與這些 核醣核酸結合蛋白質資訊。
miRBase(http://microrna.sanger.ac.uk/)收集了微核醣核酸序列,可依物種分類瀏 覽,此資料庫亦包含了各微核醣核酸的先質(precursor),也有提供搜尋介面,使 用者可根據序列片段、編號或名稱進行搜尋。