• 沒有找到結果。

1.1 研究動機

人類基因定序是生物科技發展上的一大躍進,伴隨而來的難題是,該如何分 析這麼大量的資料。計算式演算法陸續地提出來,希望藉由電腦的補助,發掘隱 藏在這巨量資料中的重要訊息,如演化發展史中親嗣關係、蛋白質功能的確認、

基因與蛋白質之間的相互影響,在生物體中所引起的一連串效應,而最終的目標 還是期望能找出遺傳疾病產生的主因。

生命體內複雜的生化反應或生物的特徵等主要是由蛋白質來控制、決定,而 蛋白質的產生則是依據去氧核醣核酸(DNA)序列中所隱含的遺傳密碼經由轉錄到 核醣核酸(RNA)序列,再透過轉譯的過程形成蛋白質產物。藉著分析去氧核醣核 酸、核醣核酸與蛋白質序列,生物學家便能更了解蛋白質的特性,甚至於整個生 命系統運作的機制。

將生物物質分門別類收集,是一種常用來減低研究複雜度的方式。例如,蛋 白質的分類是生物資訊領域中一個重要的議題,其主要目的在於明瞭蛋白質的功 能、縮短藥物發明的時間。相同的,若希望能更快速地知道核醣核酸的功能特性,

亦可先從分群的工作著手。而大部份蛋白質的分類方法,是根據序列間的相似度 或是相似片段。儘管標記出蛋白質序列中共同片段的方法已發展成熟,這些演算 法卻不適用於核醣核酸序列的分析,因為核醣核酸的生物功能是由它所形成的結 構來決定(Pley et al., 1994; Scott et al., 1995; Ekland et al., 1996),

因此,核醣核酸的分類必須架構在擁有相同二級結構的條件上。

由於核? (ribozyme)的發現,顛覆了生物學家對核醣核酸的刻板印象,也颳 起了一股研究熱潮。然而,那些議題大多著眼於核醣核酸結構的預測。本研究以 不同的角度切入此領域,研究目的主要定位於核醣核酸的分群。我們認為,每個 家族的核醣核酸都具備其代表性的二級結構元,故可利用此結構元來搜尋屬於此 家族的核醣核酸。以此觀點為基礎,我們希望能針對一群核醣核酸序列進行分 群,並預測每一個家族共同的二級結構。

1.2 研究假設

在設計整體架構,作業流程時,我們以兩個基本假設為出發點,來設計演算 來解決我們所定義的問題:

【假設一】 相同家族的核醣核酸之間,存在某些共同的特徵,其中二級結構元 是一項重要的指標。

既然決定核醣核酸功能的主要因素為其結構 (Pley et al., 1994; Scott et al., 1995; Ekland et al., 1996),則擁有相似功能的核醣核酸應具備相同的 二級結構元;因此,我們可以利用此特點來判別哪些核醣核酸是屬於相同家族 的,達到分群的目的。

【假設二】 決定核醣核酸功能的結構元,不會出現在隨機產生的序列中。

這是一個合理的假設,因為在演化過程中,雖然可能產生結構的突變,但為 了確保核醣核酸其功能與價值,這種關鍵性的位置與形狀,會一直被保留下來。

因此,若是具有演化意義的結構應當不會出現在任意的序列中。此假設也被應用 在 GPRM 的研究上(Hu 2002)。

1.3 研究目的

2002 年,本實驗室提出 GPRM 系統(Hu 2002),主要是利用基因規畫方法來 尋找核醣核酸的共同結構。GPRM 的特色是,不必具備專業領域的知識(domain knowledge),並且能夠直接以二級結構當作演化的目標,同時省去了基因演算法 中編碼、轉碼等瑣碎工作。這種方式不但簡單亦能達到良好的預測結果。再加上 使用的結構表示語言十分具有彈性,除了基本的核醣核酸二級結構外,亦可以偵 測出擬節結構。而本研究欲針對一群未排比的核醣核酸序列,但序列之間的關係 及本身的二級結構皆是未知的,能取得的資訊只有序列的內容,根據上述的假 設,設計一套有系統的流程,同時進行核醣核酸的分群與其結構元的預測。

1.4 系統功能

藉由此篇論文,我們希望能提供下列功能:

(1) 提出新的研究方向

核醣核酸相關研究是一個熱門的領域,但至今,尚未有核醣核酸分群的相關 討論。本篇論文希望能由不同的方向切入此領域,提出新的研究議題,使得核醣 核酸的實驗研究能夠更加充足與豐富。

(2) 整理核醣核酸資料

大量的生物資料無法單純以人力整理與分析,這樣的做法亦不夠精確與客 觀,因此,發展一套自動化的分析系統是刻不容緩的。我們以資訊科學的方法,

設計一套處理程序,以核醣核酸的二級結構為分群依歸,將混雜的核醣核酸資料 分門別類後,能夠更清楚地看出資料中隱含的相同與相異處。

(3) 助於生物學家進行相關實驗

若能取得分析整理過後的資料,生物學家便能專注於主要的實驗探討,而且 對這些統整後的資料,生物學家可以只取感興趣的部份,不必受其它無關的資訊 所影響,產生預期外的結果,故能快速且正確地進行核醣核酸相關的實驗。

(4) 提供方便使用的介面

除了核心系統外,我們還設計一個方便使用的網頁介面,其它研究者可利用 此工具分析他們輸入的資料,以助其實驗研究的進行。

1.5 論文架構

此篇論文包含六大章節,第一章為前言,主要介紹此議題的研究動機、此流 程方法的基礎假設,以及主要的研究目的。第二章則是簡單地介紹核醣核酸的結 構、種類。在第三章,整理了目前預測核醣核酸二級結構常用的方法,針對不同 的演算法,點出其優缺點。第四章是本篇主要重點,詳細介紹本研究針對核醣核 酸分群與結構元預測同時進行所提出的解決方案。在第五章,則整理本研究所進 行的實驗結果。最後,第七章是本研究所參考的相關文獻。

相關文件