• 沒有找到結果。

核醣核酸共同結構尋找的相關方法

第三章 文獻探討

3.3 核醣核酸共同結構尋找的相關方法

目前已知,具有相同生物功能的核醣核酸,並非在序列上擁有相似的片段,

而是在結構具有一致性。然而,核醣核酸共同結構的尋找卻比去氧核醣核酸分析 來得困難 ,因 為核醣核酸整體結構相同並不代表序列內容相同, 因為共變 (covariation)的現象使得序列的突變也不至於造成結構的改變。這種自然的特 性,使得鑑定核醣核酸二級結構的發展較為遲緩,儘管如此,依舊吸引許多學者 紛紛加入此研究領域。

過 去 預 測 核 醣 核 酸 二 級 結 構 的 方 法 有 很 多, 大 致 可 分 為 熱 力 學 模 型 (thermodynamic)與序列比較分析(comparative sequence analysis)兩大類。若 能取得同源的核醣核酸序列,則序列比較分析方法所預測出來的結構會比能量最 佳化的結果來得可靠。因此,常用來建立已知是同家族的核醣核酸序列的結構。

傳統的做法是,在一組已排比完成同源的序列中,偵測出有代表性的雙股區域,

有些區域甚至可能會出現互補性突變。主要關鍵是,利用χ2統計量(Chi-square statistics)(Chiu et al., 1991) 或 互 見 訊 息 (mutual information) 的 多 寡 (Gutell et al., 1992) 作為每個鹼基對共變的證據,量測發生共變的位置,再 找出共同的二級結構。

此類方法雖然可以辨認出擬節結構,但最大的困難在於,如何獲得良好的序 列排比結果。有些核醣核酸序列只有些微相似,但結構上卻是一致的,因此,良 好的序列比較分析方法,應該容許序列的差異卻保有結構上的相同,故序列排比 時,應該考慮結構的資訊。然而,諸如 CLUSTALW(Thompson et al., 1994)這類 做排比的工具,並不能執行結構的排比。現在許多演算法做排比時會一起考慮序

列與結構資訊(Kim et al., 1996; Notredame et al., 1997),或是排比與結構 的預測同時進行(Eddy et al., 1994; Gorodkin et al., 1997; Hofacker et al., 1998; Gorodkin et al., 2001)。但這些方法受限於序列的長度,只能處理較短 的序列或者要求其中某一個序列的結構是已知的。共變現象的可靠度必須參照親 屬遠近關係,故亦一併考慮序列的親緣關係(Gulko et al., 1996; Akmaev et al., 1999; Parsch et al., 2000)。

基因演算法是一種隨機最佳化的方法,運用的是達爾文的『適者生存』的 概念,已廣泛地應用在各個領域中。在核醣核酸二級結構預測的議題中,亦可利 用基因演算法搭配熱力學模型(Chen et al., 2000)來尋找共同結構元。熱力學 的 觀 點 是 以 結 構 的 自 由 能 (free energy) 當 作 適 應 度 評 估 標 準 (fitness criterion)。雖然不須要做序列的排比,但自由能的計算也有它不足之處。因為 這須要參考核醣核酸結構的相關知識,即使考慮了細部的條件,有些結構,利用 這些能量模型的計算規則與參數(Mathews et al., 1999)計算出來的能量並非是 最小的(最穩定)。且能量計算公式與參數值只是實驗估計值,無法完整考慮細節 部份,更不能代表生物體內的實際狀態,例如熱力學模型假設核醣核酸的結構處 在熱力平衡的狀態,與環境條件無關。然而,許多核醣核酸會與蛋白質結合,而 造成自由能的改變。

第 三 類 用 來 尋 找 核 醣 核 酸 二 級 結 構 元 的 方 法 是 從 正 規 語 言 的 角 度 出 發 (Sakakibara et al., 1994; Kundsen et al., 1999; Kundsen et al., 2003)。

不同於蛋白質序列,核醣核酸每個鹼基之間並非完全獨立

兩個位置若能形成 配對,則這兩個鹼基便有很高的相依性,而隨機式前後文無關性文法(Stochastic context-free grammars , SCFG)可以描述序列上遠距離的相依關係,恰能表示核 醣核酸序列獨有的共現特性。這種機率模型在訓練完成後即代表此核醣核酸家族

的共同結構,故可再用於資料庫的搜尋,但訓練過程中須要序列排比的資訊,因 此它的成效受制於排比的結果;除此之外,它最令人詬病的是,此種方法不能偵 測出擬節結構(此於 4.2.1 核醣核酸結構描述語言將有詳細介紹)。

相關文件