• 沒有找到結果。

1.1 研究動機

核醣核酸(RNA)在生命體中扮演很重要的角色,其中最為人知的信使核醣核 酸(mRNA)傳遞核醣核酸的資訊到核糖體,合成所需要的蛋白質。其他常見的還 有轉錄核醣核酸(tRNA)、核糖體核醣核酸(rRNA)、微核醣核酸(microRNA)等。這 些 RNA 會褶疊成特定的形狀來輔助生命機制,如催化化學反應及調控基因表現 等等。

從已知的生物知識可知,褶疊形狀相似的核醣核酸很有可能也會有相似的功 能。因此,若能由已知的核醣核酸序列來預測其褶疊而成的二級結構,進而猜測 其功能,將能更迅速的瞭解生命運作的機制。

然而,在生物實驗室裡進行實驗來決定一個核醣核酸的結構是很費時的,單 用人工的方式實驗非常沒有效率。因此,我們希望利用已知序列上的資訊,加入 能量預測二級結構的資訊,藉由電腦的輔助以提供一個快速的方法,希望能預測 出核醣核酸的結構,更進一步的從一個家族的核醣核酸序列中,預測出他們的共 同結構元(motif),因為這些共同的結構在生物演化上可能是有意義的,他們可能 控制著一種重要的生物機能,所以在經過長時間的演化之後,這些結構仍然保留 至今。

研究核醣核酸二級結構預測(RNA secondary structure prediction)的方法有很 多,例如使用動態程式規劃(dynamic programming)的方法尋找化學上能量最為穩 定的結構;或是以排比(alignment)的方式,利用一條已知二級結構核醣核酸序列 上的資訊,去預測另外一條結構未知的相關核醣核酸序列;以及用基因演算法 (genetic algorithm)的方式尋找二級結構和摺疊路徑(folding pathway)等。以上的方法 都是只針對單一條核醣核酸序列提供唯一的最佳二級結構預測結果,或是包含多 個次佳解的結果。

近年來,對於核醣核酸二級結構的研究主題多在預測同一核醣核酸家族的共 同結構元,目前常見的方法有三大類[Paul PG et al., 2004]:

(1)先對所有核醣核酸序列做多重排比(multiple sequence alignment),再將 排比好的序列利用單一核醣核酸序列的二級結構預測系統進行摺疊 (folding),最後所得的摺疊結構即為該家族的預測共同結構元。

(2)以 Sankoff algorithm 為基礎,使用動態程式規劃同時考慮序列排比與 摺疊的資訊來預測同一家族序列的共同結構元。

(3)利用單一核醣核酸序列的二級結構預測系統,對此家族的每一條核醣 核酸序列各自進行單一序列的摺疊,再對所有產生的結構進行結構排 比(structure alignment)。

本研究與上述的第三類方法有點相似,在前半段使用單一核醣核酸序列的二級結 構預測系統作為前處理器,來預測單一核醣核酸序列的完整二級結構。然而在後 半段,也是最主要的核心部分,我們並非只是對其產生的結構進行排比,而是將 其預測的結構轉換成圖形表示語言,再利用基因規劃法(genetic programming)預測 出此家族序列的共同結構元。

1.2 研究假設

關於核醣核酸二級結構的預測,本研究設定了兩個合理的基本假設:

假設一:同一家族的核醣核酸序列有共同的二級結構。

一群核醣核酸序列之所以會被視為同一家族,就是因為他們有類似的功能。

由化學的角度來看,當結構有些許改變就很有可能影響分子結合的能力,因而影 響其功能,所以我們認為,一群功能相同的核醣核酸序列行使功能之區域,其二 級結構必定極為相似。

本研究假設一群被歸類為同一家族的相關核醣核酸序列中,從在某些共同的 結構,而這些共同的結構則是決定此家族核醣核酸所行使的功能。

假設二:行使功能的共同結構元不容易出現在隨機產生的序列中。

本研究要尋找的共同結構應該具有演化上的意義,在演化的過程中,核醣核 酸的序列及結構可能會經過多次的突變,但是其重要結構仍被保留下來,表示這 些結構在演化的過程中必定扮演很重要的假設。

因此我們假設這樣的結構應該不是偶然形成,也就是說在我們隨機產生的核 醣核酸結構中不應該會經常出現。

1.3 研究目的

在過去的研究中,預測核醣核酸二級結構的共同結構元用到許多不同的方 法,包含動態程式規劃、隱藏式馬可夫模型(Hidden Markov Model)、序列排比、

圖論方法以及演化式計算等等。每一個研究所切入的角度都不太一樣,對於不同 的家族的共同結構元預測能力也不太相同,但目前的系統大多只能預測出長度較 短的共同結構元。

而在本研究中,我們同樣使用基因規劃法,試圖找出同一家族的共同結構 元,加入能量的資訊縮小搜尋空間以節省搜尋時間,而資料結構的表示法則以圖 形(graph)的概念表示,希望可以藉此找出較長或者是更複雜的共同結構元。

1.4 論文架構

本篇論文包含六個章節:

第一章為前言,介紹本研究的動機、背景、此研究所使用的方法及其基本假設,

以及主要的研究目的。

第二章為文獻探討,將介紹核醣核酸的背景知識,以及此研究過去的發展。

第三章為研究方法,是本篇論文的核心,詳細介紹本研究設計的方法流程與細節。

第四章為實驗結果,整理所有實驗的內容與實驗的結果。

第五章為結論與討論,分析本實驗的優缺點。

第六章參考文獻,則列出本研究參考的相關文獻。

相關文件