• 沒有找到結果。

基因轉殖作物外來基因比對資料庫之建立

N/A
N/A
Protected

Academic year: 2021

Share "基因轉殖作物外來基因比對資料庫之建立"

Copied!
15
0
0

加載中.... (立即查看全文)

全文

(1)

基因轉殖作物外來基因比對資料庫之建立

The establishment of BLAST Database for foreign gene in

transgenic plant

王昭能

1

施仁國

1

許承瑜

1

王經篤

1

葉錫東

3

范宗宸

2*

1.亞洲大學生物資訊學系

2.亞洲大學生物科技學系

3.中興大學植物病理學系

*通訊:亞洲大學 生物科技學系 台中縣霧峰鄉柳峰路 500 號

[email protected]

摘要

全球基因轉殖作物的栽培正蓬勃發展,支持與反對基因轉殖的論述彼此爭論不休,建立可辨識基因 轉殖或非基因轉殖生物的檢測方法,以讓大眾能有知道權利及選擇性是非常需要的。本研究的主要研究 目的,為建立能基因轉殖作物外來基因(foreign gene)的 BLAST 資料庫,以提供快速的序列同源性比對, 提供做為基因轉殖作物檢測系統所需的資訊。

本研究以基因轉殖作物外來基因(foreign gene)為研究對象,利用 AGBIOS 之 GM Database 取得已通 過評估可釋放於環境之 GM 作物外來基因等資訊,且以 BioPerl 設計操作指令群對 NCBI Genbank 送出字 串查詢核酸序列,以自動取得相關的核酸序列建立本機 BLAST 資料庫,使用 B2D Linux Server 平台及 WWWBLAST 介面,提供國內研究人員快速且有效率的比對出所研究的序列是否為 GMO 外來基因。本研究建 已立特定基因之 GMO BLAST 資料庫,並且可自行擴充資料庫,可於網際網路使用。

(2)

The establishment of BLAST Database for foreign gene in

transgenic plant

Chao-NengWang

1

, shih-jen-kuo

1

,Phillip C-y Sheu

1,

Jing-Doo Wang

1

, Ming-Jen Fan

2

*

1. Department of Bioinformatics

2. Department of Biotechnology

3. Department of Plant Pathology

Addressed :

ASIA UNIVERSITY Department of Biotechnology

500, Lioufeng Rd., Wufeng, Taichung 41354, Taiwan

[email protected]

Abstract

The cultivation area in global scare of transgenic crop is increased rapidly. The open ion between support and opposition about the GMO is argued continuously. The mythos to recognize the GMO and NON-GMO are needed very necessary forconsumer’sright.

The goal of this research is to constructed a GMO BLAST Database system which can provide rapid sequence comparison. Established a GMO foreign gene database which can be as a part of GMO inspection system.

The GM database in AGBIOS, which content those

authorization

GM crop has been to through as appraisal and release to the environment, is the origin source of those GMO foreign gene come from. The BioPerl was used to design group operating instructions sent to NCBI GenBank to query and BLAST nucleotide sequence string interested . The free fee and stable B2D Linux Server platform was used to generated a local BLAST database which can automatically generate the associated nucleotide sequences for GMO Database. This platform also include a graphic WWWBLAST interface which can improve operational convenience and provide fast and efficient sequence alignment for GMO DNA sequencing.

(3)

前言

全球基因轉殖作物的開發正蓬勃發展,目前全 球已有百種以上的基因轉殖作物品系,涵蓋作物種 類 有 數 十 種, 基 因 轉殖 作物 外 來 基 因(foreign gene)的數量也不斷的增加。基因轉殖作物為人類 帶來許多利益與貢獻,如:減少農藥的使用量、降 低地下水的污染、增加產量、容易管理、節約能源 及人力成本、減少整地與土壤沖蝕、提供新的工業 原料等 但 根 據 世 界 衛 生 組 織 的 官 方 說 法 (WHO , 2004),「到目前為止,國際市場上已通過風險評 估的基因轉殖食品,可能不會對人類健康產生危 險」,亦即 WHO 並沒有對基改食品的長期性安全下 斷言。基改產品所引發的問題有三,一是食品安 全,二是環境安全,三是田間種植規範。現在支持 與反對基因轉殖作物栽培及食用的論述彼此爭論 不休,而在這仍屬於未定且需要長時間證明的情形 下,可將基因轉殖與非基因轉殖生物區分開來並加 以辨識的方法,使大眾可以有選擇的權利是非常需 要的,基因轉殖作物外來基因種類不斷的增加,繼 而可能產生如基因變化與基因遭人為修改以逃避 檢驗的情形,增加了分子檢測的難度。因此需要建 立一個外來基因資料庫,來輔助基因轉殖作物檢測 的所需的資訊。 基因轉殖食品之鑑別檢驗方法目前主要以聚 合酵素鏈鎖反應(polymerase chain reaction,PCR) 方法應用最廣,可供定性與定量分析。經 PCR 方 法反應後之產物,可再行確認檢驗,常用方法如核 酸 定 序 、 核 酸 內 切 酵 素 圖 譜 、 探 針 雜 交 等 (Wolfram,1997)。而核酸定序後的序列比對工作 正是序列比對資料庫可應用之處。

本研究目的為建立 GMO BLAST Databasem 用以 比 對 及 預 測 是 否 為 以 基 因 轉 殖 作 物 外 來 基 因 (foreign gene),利用 AGBIOS 之 GMO Database 取得已通過評估,可釋放於環境之基因轉殖作物所 含之外來基因等資訊,並以 BioPerl 設計操作指令 對 NCBI Genbank 送出查詢字串,自動獲得所需的 核酸序列,用以建立本機 BLAST 資料庫,並使用圖 形化的 BLAST 介面提高操作便利性。可為 GMO 檢測 後的核酸定序比對工作,提供一個免費快速且有效 率的。BLAST Database 比對系統以提供研究人員 所需的資訊。 本研究已建立 GMO BLAST 核酸資料庫與進行比 對檢驗所需的序列來源,與運用的程式套件。並以 Papaya Ring Sport Virus Coat Protein 之 coden gene 為例,此 GMO BLAST Databas 系統平台可提 供國內研究人員快速且有效率的比對出有興趣的 序列是否為 GMO 外來基因之序列。

研究材料及方法

一、

材料 (一)GMO 序列材料 GMO 作物其外來基因眾多,本研究以 Agbios 網站上各國已核准釋放於環境的外來基因為依據。

Agbios 網站外來基因(foreign gene)選項欄 共計 42 種基因。基因轉殖作物中一般使用最常使 用的啟動子為花椰菜嵌紋病毒(Cauliflower mosaic virus,CaMV)35S Promoter,也列入本研 究的第 43 種目標基因。

此外,鞘蛋白(coat protein,CP)基因視其 抗病毒的標的植物而使用不同病毒的鞘蛋白基 因;在 Agbios 網站上分為 5 種,分別為木瓜輪點 病毒(Papaya ringspot potyvirus,PRSV)、黃瓜 嵌紋病毒(Cucumber mosaic virus,CMV) 、矮南 瓜黃化嵌紋病毒 (Zucchini yellow mosaic virus,ZYMV)、西瓜嵌紋病毒 2 號(Watermelon mosaic virus 2,WMV2)、馬鈴薯 Y 病毒 O 株系 (Potato potyvirus Y strain O,PVY),也一併列 入本研究的目標基因。綜合上述,本研究目標序列 共源自 48 種基因(表 1)

(二)測試序列

(4)

錫東 教授與亞洲大學生物科技范宗宸 教授研究 室,共 5 條,序列名稱與長度分別如下: 1. PRSV CP (Papaya ringspot potyvirus Coat protein),1070 bp。

2. 35S Promoter,835 bp。

3. GUS (β-glucuronidase),1812 bp。

4. NPTII (neomycin phosphotransferase II), 795 bp。 5. NOS(nopaline synthase),260 bp。 二、方法 (一)自動擷取外來基因 本研究利用數個 Bioperl 模組撰寫程式,進行 GenBank 遠端資料庫自動搜尋與下載。所使用的 Bioperl 模組如下: 1.Bio::Perl、Bio::SeqIO:對序列進行操作或呼 叫與轉換序列檔 2.Bio::DB::GenBank:獲取遠端資料庫(Genbank) 資料 3.Bio::DB::Query::GenBank:對 Genbank 進行遠 端資料庫查詢 先搜集全部目標基因名稱,利用 Qualifier(檢索限定子)中的基因名稱[GENE]與 [Title]兩個限定子進行搜尋,並將這些字串存於 gm_ID.txt。使用 Bioperl 中 Bio::DB::GenBank 模組對 NCBI Genbank 資料庫進行操作;並利用 Bio::DB::Query::GenBank 模組進行迴圈詢問 (query),查詢 GMO 目標基因。得到最新 GMO 目標 基因序列之 accession number(登錄碼),再將所 有得到的 accession number 清單儲存於

gm_AN.list。

接下來利用 Bioperl 中之 get_sequence 函 數至 NCBI Genbank 下載 gm_AN.list 內全部 accession number 所對應之 FASTA 格式的 GMO 目 標基因序列資料,並全部存放在 gmo.fasta 檔,為 建立 BLAST 資料庫作準備。

find_AN.pl 程式至 Genbank 詢問使用 $query_string 以及後面接著詢問字串。如 「Aad\[Title\] AND Aad\[gene\]」。另外建立 $query_obj 進行查詢操作時,使用參數

-db(protein or nucleotide database)與 -query(query string),程式執行流程與說明如圖 1。 (二)建立 GMO BLAST 資料庫 建立 BLAST 資料庫之前,需將序列格式化。 由 NCBI FTP 下載 BLAST-2.2.16-ia32-win32.exe。解壓縮後,取得 formatdb.exe。formatdb.exe 是格式化 BLAST 資 料庫的工具程式。利用 formatdb.exe 將 gmo.fasta 進行格式化,GMO BLAST 資料庫即建置完成。 (三)wwwBLAST 由 NCBI FTP 免費下載的 BLAST 伺服器版為 WWWBLAST 程式,版本為 2.2.16,亦可轉為 Linux 作業系統的單機版,需安裝於 Apache 伺服器上。 本研究的使用平台為 B2D Server Linux (stable s1 版),下載相對應的

WWWBLAST-2.2.16-ia32-linux.tar.gz。NCBI WWWBLAST 以仿照 NCBI 線上 BLAST 介面為主,是網 頁版(Web-base)的 BLAST 系統。由 Regular BLAST、PSI/PHI BLAST、Mega BLAST、RPS BLAST、 BLAST 2 sequences 五組程式所組成,每組並包含 有無支援主從式架構(client-server)模式,共計 10 種查詢類別。解壓縮後進行權限設定,TmpGifs 資料夾權限為 777,logfiles (WWWBLAST.log and psiBLAST.log)權限為 666。本研究系統架構圖如 圖 2。

結果

(一)序列蒐集 本研究使用 Perl 程式對 NCBI 送出字串,為避免 Perl 對字串解譯錯誤,故在特殊符號前,如雙引 號(" ")、中括號([])等,加上具轉譯作用的倒斜 線"\",讓 Perl 略過倒斜線之後一個字元不去解譯 它。全部基因檢索字串如表 2,共得到 2447 條 accession number,基因總數 48 個,41 個有序列 資料的基因。其中 cry1F、cry34Ab1、cry35Ab1、 cry3A、cry3Bb1、cry9c、mcry3A 皆為抗蟲基因, 使用[GENE]限定檢索,查無資料,取消限定檢索改 用 NCBI 廣義的全文搜尋,仍然無相關資料。全部

(5)

序列以 fasta 格式儲存在 gmo.fasta。利用 formatdb.exe 程式將 gmo.fasta 格式化,GMO Blast Database 即建置完成。

(二)序列測試

一、PRSV CP(Papayaringt potyvirus Coat protein) 比對結果 利用 PRSV CP 比對在 BLAST Hits,會得到 83 個結 果,每一條序列結果都有序列名稱及期望值(E), 文字比對可以發現 X97251 與查詢序列間共有 975 個核酸相同,Hit Table 部份 X97251 與 X78557 經 NCBI 查詢結果,皆為 PRSV 台灣 YK 株系,X78557 核酸區段 1831-2751 為 coat protein 與本查詢序 列一致(1986-2960)接近。 二、35S Promoter 比對結果 在 Blast Hits 比對到有 148 個結果,文字比對可 以發現查詢出前 20 條序列一致性均為 100%,且 全部為一般基因選殖所用的 Ti 質體(Binary vector)。Hit Table 結果至 NCBI 查詢顯示都皆為 我們測試序列(35S Promoter)。 三、GUS (β-glucuronidase)比對結果 Blast hits 比對到 20 條一致性程度高,後 10 條 差異性較大,文字比對方面發現前 20 條序列的期 望值均 100%,主要都為載體,hit Table 結果顯 示 1812、1802、1808、1800、1794,共五組,NCBI 查詢結果都均為本測試序列(GUS)基因片段。

四、NPTII (neomycin phosphotransferase II) 比對結果 Blast Hits 比對到 100 條序列結果,文字比對前 二十條序列一致性 100%,且全部為一般基因選殖 所用的 Ti 質體,Hit Table 序列相似區全一致, 到 NCBI 查詢結果顯示該區段為基因為 nptII。 五、NOS(nopaline synthase)比對結果 Blast Hits 查詢到 230 序列,文字比對前 20 條序 列一致性均 100%,且全部都為一般基因轉殖所用 的 Ti 質體,Hit Table 序列均相似,經 NCBI 查詢 結果顯示應區段基因為 NOS Promoter。

討論

(一)NCBI Entrez 之檢索技巧 NCBI 整合性搜尋系統 Entrez 進行核酸資料 庫檢索時,直接在檢索欄位 (Search Field)鍵入 欲 搜 尋 基 因 名 稱 , 大 小 寫 並 無 差 異 , 以 gus(β-glucuronidase)基因為例,結果如圖 3。 仔細檢查搜尋結果,可發現有些非目標序列 亦在搜尋結果之內,須再次加以過濾,以第二條序 列 NM_202701 為例,如圖 4,該序列全長 1580bp, 基因名稱為「WRI1」並非我們所要的 gus,若使用 此全文檢索方式搜尋,結果會夾雜許多非目標基因 名稱的序列。為了進行有效率的搜尋,需利用 Entrez 的限定搜尋功能,常用檢索限定詞如表 3。 將 gus 限定為基因名稱搜尋(即[GENE]限定詞),結 果如圖 5,可獲得 30 條序列,序列數量減少且結 果較未限定搜尋的結果精確。最後,將序列輸出為 FASTA 格式,以建立 GMO Blast Database。 NCBI Entrez 支援布林邏輯,如一般常用的交集 (AND)、聯集(OR)、差集(NOT),使用這些邏輯運算 子時需使用大寫以作辨識,使用布林邏輯可將多個 限定詞組合,提高搜尋結果的品質。為了能獲得更 精準且符合需求的結果,避免包含過多全基因體 (complete genome)與全染色體序列(complete chromosome sequence)的資料。本研究使用檢索限 定詞,以基因名稱的[GENE]與標題說明[Title] 組 合為檢索字串,進一步篩選以提高效率。某些基因 的公開資料較少,故僅用[GENE]為限定詞;部分基 因如 APH4(hygromycin-B phosphotransferase)使 用[GENE]限定詞查詢無資料,改用一般較廣泛的名 稱 HPT(hygromycin phosphotransferase)作為搜 尋字串。

(二)GMO Blast Database 的更新與效能探討 隨著全球 GMO 作物的蓬勃發展,GMO 外來基 因的研究資料也逐漸增加。以本研究 GMO 外來基因 的 accd 基因為例,透過 NCBI Entrez 的限定詞 [MDAT]查詢歷年公開序列累積筆數,歷年累計成長 至 2007 年 7 月如圖 6。序列資料的增加快速成長, 資料的蒐集也需同步更新,以免發生資料過時,而 降低資料庫的實用性。

本研究建立的 GMO Blast Database 系統在序 列蒐集部分,於程式設計之初已將序列更新列入考

(6)

量。更新步驟可以利用批次檔(Batch file),將 find_AN.pl、get_GM_Seq.pl 與 formatdb.exe 這 三支程式集合而成單一檔案。批次檔就是將一群可 以在 DOS 下執行的命令(Command)集合而成的檔 案,副檔名為「.bat」。透過批次檔將所有更新動 作 包 裹 成 單 一 檔 案 autoget.bat , 只 要 執 行 autoget.bat 即 可 將 所 有 序 列 重 新 下 載 完 成 更 新,並產生新資料庫取代舊資料,對系統維護人員 非常方便。若有新增 GMO 外來基因,則僅需將新的 基 因 檢 索 條 件 鍵 入 gm_ID.txt , 再 執 行 autoget.bat,使資料庫更新即可。本資料庫首次 建置完成於 2007 年 5 月 5 日,內有 2447 條序列, 設定一個月更新一次,2007 年 7 月 5 日為 2489 條 序列,新增 42 條序列。 以往蒐集序列是從 NCBI 的查詢結果中勾 選,用人工的方式來來逐一判斷是否符合需求,需 要花費大量的時間與人力才能完成。以上述accd 基因為例,自 NCBI Entrez 鍵入accd搜尋,結果 共計 1798 條序列,決定該條序列是否含有accd 基因序列,必須逐筆檢視是否於注釋欄位中包含 accd基因,若有再回上一頁勾選該條序列,最後 再將全部勾選的序列匯出 Fasta 檔。整個作業共需 檢視 1798 條序列資料,選取 681 條,若不考慮網 路連線速度,以檢視一條序列是否會有目標基因需 30 秒計算,共花費 900 分鐘,本資料庫共計 48 個 基因,需檢視超過 20,000 條序列,選出 2247 條序 列,費時超過 166 個工作天,若考慮連線速度與之 後的資料庫建置,所花費的人力物力非常驚人。透 過本研究建立的自動擷取序列與建立資料庫系 統,只需要 4~5 小時(視連線狀況)即可完成,若使 用作業系統的排程設定,將更新建置的時間設定在 凌晨,研究人員不需要花費任何工作天數即可完 成,此項自動更新資料庫也是本系統的一項特色。

參考文獻

[1] Baxevanis A.D. and Ouellette B.F.F. (2005), A Practical Guide to the Analysis of Genes and Proteins , Bioinformatics.

[2] Chiter, A., Forbes, J. M., and Blair, G.

E.(2000), DNA stability in plant tissues: implications for the possible transfer of genes from genetically modified food, FEBS Letters , 481 , 164-168.

[3] Conner AJ, Glare TR, Nap JP. (2003), The release of genetically modified crops into the environment, Overview of ecological risk assessmentPlant J , 33 , 19~46.

[4] Fagan, J., Schoel, B., Haegert, A., Moore, J., Beeby, J. (2001), Performance assessment under field conditions of a rapid immunological test for

transgenic soybeans, Int. J. Food Sci. Technol , 36 , 357-367.

[5] Huang, H. Y. and Pan, T. M.(2004), Detection of genetically modified maize MON810 and NK603 by multiplex and real-time polymerase chain reaction methods, J. Agric. Food Chem, 52 , 3264-3268.

[6] Jakubowicz M (2002), Structure, catalytic activity and evolutionary relationships of

l-aminocyclopropane- 1-carboxylate synthase, the key enzyme of ethylene synthesis in higher plants, Acta Biochim Polon , 49 , 757-774.

[7] James, C. (2007), Global status of commercialized biotech/GM crops , ISAAA Briefs 35.

[8] James, C.(2006),Global status of

commercialized biotech/GM crops , ISAAA Briefs 34.

[9] Lee, M.K., et al. (2003), The mode of action of the Bacillus thuringiensis vegetative insecticidal protein Vip3A differs from that of

Cry1Ab –endotoxin, Appl. Environ.Microbiol, 69(8),4648–4657.

[10]

Mori,S.,Kobayashi,H.,Hoshi,Y.,Kondo,M.,and Nakano,M.(2004), Heterologous expression of the flavonoid 3',5'-hydroxylase gene of Vinca major alters flower color in transgenic Petunia hybrida, Plant Cell Rep, 22 , 415-421.

(7)

[11] Owen,M.D.K.(2000), Current use of transgenic herbicide-resistant soybean and corn in the USA., Crop Protection, 19 , 765-771.

[12]OliveiraSouza(2000),“Genetically Modified Plants: A Need for International Regulation”,6 AnnualSurvey

[13] RandalL.Schwartz and

TomPhoenix,“LearningPerl”,O’REILLY,2002, ISBN:957-8247-89-3

[14] Robbins-Manke JL, Zdraveski ZZ, Marinus M, Essigmann JM. (2005), Analysis of global gene expression and double-strand-break formation in DNA adenine methyltransferase- and mismatch repair-deficient Escherichia coli. J Bacteriol , 187, 7027-37.

[15] Stajich JE et. al. (2002), The Bioperl toolkit: Perl modules for the life sciences, Genome Res , 12(10) , 1611-8.

[16] Spaar, A., Dammer, C., Gabdoulline, R.R., Wade, R.C., Helms,V. (2006), Diffusional encounter of barnase and barstar. Biophys. J, 90 , 1913-1924.

[17] Ussuf K.K., Laxmi N. H. and Mitra

R.(2001) Proteinase inhibitors: Plant-derived genes of insecticidal protein for developing insect-resistant transgenic plants, Curr. Science, 80, 847-853.

(8)

表 1 目標序列基因一覽表

編號

Gene code

所 coding 的蛋白質或基因名稱

類別

1

aad

3"(9)-O-aminoglycoside

adenylyltransferase

抗生素

2

acc

1-amino-cyclopropane -1-carboxylic acid

synthase

(Dianthus caryophyllus L.)

果實成熟

3

accase

acetyl-CoA-carboxylase

(Z. mays)

耐除草劑

4

accd

1-amino-cyclopropane-1-carboxylic acid

deaminase

(Pseudomonas chlororaphis)

果實成熟

5

als

acetolactate synthase

(Brassica napus)

耐除草劑

6

aph4(hpt)

hygromycin-B phosphotransferase

(Escherichia coli)

抗生素

7

barnase

barnase ribonuclease

(Bacillus amyloliquefaciens)

雄性不育

8

barstar

barnase ribonuclease inhibitor

(Bacillus amyloliquefaciens)

雄性不育回復

9

bla

beta lactamase

抗生素

10

dhdps

dihydrodipicolinate synthase

(Corynebacterium glutamicum)

改變離胺酸

11

PRSV CP

viral coat protein

(Papaya ring spot virus (PRSV))

病毒

12

CMV CP

viral coat protein

(Cucumber mosaic virus)

病毒

13

ZYMV CP

viral coat protein

(Zucchini yellow mosaic virus)

病毒

14

WMV2 CP

viral coat protein

(Watermelon mosaic virus 2)

病毒

15

PVY CP

viral coat protein

(Potato potyvirus Y (PVY) strain O

(common strain))

病毒

16

cry1Ab

Cry1Ab delta-endotoxin (

Btk HD-1)

(Bacillus thuringiensis subsp. kurstaki

(Btk)

)

抗蟲

17

cry1Ac

Cry1Ac delta-endotoxin

(Bacillus thuringiensis subsp. kurstaki

(Btk)

)

(9)

18

cry1F

Cry1F delta-endotoxin

(Bacillus thuringiensis var. aizawai)

抗蟲

19

cry2Ab

Cry2Ab delta-endotoxin

(Bacillus

thuringiensis)

抗蟲

20

cry34Ab1

Cry34Ab1 delta-endotoxin

(Bacillus thuringiensis strain PS149B1)

抗蟲

21

cry35Ab1

Cry35Ab1 delta-endotoxin

(Bacillus thuringiensis strain PS149B1)

抗蟲

22

cry3A

cry3A delta-endotoxin

(Bacillus thuringiensis subsp.

Tenebrionis

)

抗蟲

23

cry3Bb1

cry3Bb1 delta-endotoxin

(Bacillus thuringiensis subsp.

kumamotoensis

)

抗蟲

24

cry9c

cry9c delta-endotoxin

(Bacillus thuringiensis subsp.

Tolworthi

)

抗蟲

25

dam

DNA adenine methylase

(Escherichia coli)

雄性不育

26

dfr

dihydroflavonol reductase

(Petunia hybrida)

花色

27

epsps

5-enolpyruvylshikimate-3-phosphate

synthase

(Agrobacterium tumefaciens CP4)

耐除草劑

28

fad2

fatty acid desaturase

改變脂肪酸

29

hfl

flavonoid 3p, 5p hydroxylase

(Petunia hybrida)

花色

30

gmfad2-1

delta(12)-fatty acid

dehydrogenase

(Glycine max)

改變脂肪酸

31

gox

glyphosate oxidoreductase

(Ochrobactrum anthropi)

耐除草劑

32

gus

beta-D-glucuronidase

(Escherichia

coli)

染色標記

報導基因

33

hel

helicase

(Potato leafroll luteovirus

(PLRV) orf 2

)

病毒

34

mcry3A

Cry3A delta-endotoxin

(Bacillus thuringiensis subsp.

tenebrionis

)

(10)

35

nitrilase

nitrilase

(Klebsiella pneumoniae subspecies

ozanae

)

耐除草劑

nopaline synthase

(Agrobacterium tumefaciens)

調控基因

(Promoter)

36

nos

A. tumefaciens nopaline synthase (nos)

3'-polyadenylation signal

調控基因

(Terminator)

37

neo

(nptⅡ)

neomycin phosphotransferase II

(Escherichia coli)

抗生素

38

pat

phosphinothricin N-acetyltransferase

(S. viridochromogenes)

耐除草劑

39

pg

polygalacturonase (Tomato)

軟化

40

pinII

protease inhibitor

(Solanum

tuberosum)

抗蟲

41

pmi

Phosphomannose isomerase

代謝,可作為

篩選標記

42

qtpase

nicotinate-nucleotide

pyrophosphorylase(carboxylating)

(Nicotiana tabaccum)

改變尼古丁

43

rep

replicase (RNA dependent RNA polymerase)

(Potato leafroll luteovirus (PLRV) orf

1

)

抗病毒

44

samase

S-adenosylmethionine hydrolase

(E. coli bacteriophage T3)

延緩成熟

45

spc

Spectinomycin/streptomycin resistance

抗生素

46

bay te

thioesterase

(Umbellularia

californica)

降低月桂酸與

豆蔻酸

47

vip3A

VIP3A vegetative insecticidal protein

(Bacillus thuringiensis strain AB88)

抗蟲

調控基因

(Promoter)

48

35S

35S RNA of cauliflower mosaic virus

調控基因

(Terminator)

(11)

表 2 基因檢索字串總表與取回筆數

編號

Gene code

檢索字串

搜尋筆數

1

aad

Aad\[Title\] AND Aad\[gene\]

9

2

acc

ACC\[Title\] AND ACC \[gene\]

33

3

accase

ACCase\[Title\] AND ACCase\[gene\]

61

4

accd

ACCd\[Title\] AND ACCd \[gene\]

681

5

als

Als\[Title\] AND Als \[gene\]

87

6

aph4(hpt)

Hpt\[Title\] AND Hpt\[gene\]

22

7

barnase

Barnase\[gene\]

2

8

barstar

Barstar\[gene\]

1

9

bla

Bla\[Title\] AND Bla\[gene\]

114

10

dhdps

DHDPS\[Title\] AND DHDPS\[gene\]

4

11

PRSV CP

PRSV AND CP\[gene\]

149

12

CMV CP

CMV AND CP\[gene\]

244

13

ZYMV CP

ZYMV AND CP\[gene\]

11

14

WMV2 CP

WMV 2 AND CP\[gene\]

2

15

PVY CP

PVY AND CP\[gene\]

142

16

cry1Ab

cry1Ab\[gene\]

7

17

cry1Ac

cry1Ac\[gene\]

11

18

cry1F

cry1F\[gene\]

0

19

cry2Ab

cry2Ab\[gene\]

5

20

cry34Ab1

cry34Ab1\[gene\]

0

21

cry35Ab1

cry35Ab1\[gene\]

0

22

cry3A

cry3A\[gene\]

0

23

cry3Bb1

cry3Bb1\[gene\]

0

24

cry9c

cry9c\[gene\]

0

25

dam

Dam\[Title\] AND Dam\[gene\]

16

26

dfr

DFR\[Title\] AND DFR\[gene\]

188

27

epsps

EPSPS\[gene\]

21

28

fad2

fad2\[Title\] AND fad2\[gene\]

80

29

hfl

F3'5'H\[gene\]

2

30

gmfad2-1

\"Glycine max\" AND Fad2-1\[gene\]

2

31

gox

Gox\[Title\] AND Gox\[gene\]

8

32

gus

Gus\[gene\]

30

33

hel

helicase [title]AND Hel[gene]

78

(12)

35

nitrilase

Nitrilase\[Title\] AND Nitrilase\[gene\]

1

36

nos

Nos\[Title\] AND Nos\[gene\]

81

37

neo(npt II)

neomycin AND NPTII\[gene\]

128

38

pat

PAT\[Title\] AND PAT\[gene\]

71

39

pg

PG[gene]

32

40

pin II

pin-II2x[gene]

2

41

pmi

pmi\[Title\] AND pmi\[gene\]

11

42

qtpase

QPT[gene]

6

43

rep

replicase [title]AND Rep[gene]

44

44

SAMase

SAM[gene]

15

45

spc

spectinomycin AND Spc\[gene\]

18

46

bay te

thioesterase AND te\[gene\]

1

47

vip3A

vip3A\[gene\]

23

48

35S

CaMv AND 35s\[gene\]

4

總計

2447

表 3

Entrez 常用檢索限定詞

索引標籤

說 明

檢索限定詞

All Fields

包含所有搜尋欄位

[ALL] or [ALL FIELDS]

Accession

序列登錄碼

[ACCN] or [ACCESSION]

Gene Name

基因名稱

[GENE]

Keyword

關鍵字

[KYWD] or [KEYWORD]

Properties

屬性

[PROP]

Organism

物種名稱

[ORGN] or [ORGANISM]

Title

每筆資料的標題說明行

[Title]

(13)

圖 1 序列擷取程式執行流程

圖 2 GMO BLAST Database 系統架構圖

gm_ID.txt

gm_AN.list

gmo.fasta

find_AN.pl

(14)

圖 3 NCBI 全文檢索 gus(β-glucuronidase)基因

說明:使用一般全文檢索,查詢 GUS 可得到 4228 條序列

圖 4 使用限定詞檢索 gus 基因

(15)

圖 5 非目標序列 NM_202701

說明: GUS 檢索結果中,NM_202701 的序列為 WRI1 基因,

非檢索目標找尋的 GUS 基因。

0 40 80 120 160 200 240 280 320 360 400 440 480 520 560 600 640 680 720 1995年 1996年 1997年 1998年 1999年 2000年 2001年 2002年 2003年 2004年 2005年 2006年 2007年

圖 6

NCBI 的

accd 序列資料歷年累計成長筆數

數據

表 1 目標序列基因一覽表
表 2 基因檢索字串總表與取回筆數
表 3 Entrez 常用檢索限定詞
圖 2 GMO BLAST Database 系統架構圖
+3

參考文獻

相關文件

5、「選課系統資料庫」APP 程式撰寫與分析(8 小時) 6、「雲端電子書城」APP 程式撰寫與分析(8 小時) 7、「多益 TOEIC 單字學習系統」APP

利用 Microsoft Access 資料庫管理軟體,在 PC Windows 作業系 統環境下,將給與的紙本或電子檔(如 excel

利用 Microsoft Access 資料庫管理軟體,在 PC Windows 作業系統環境 下,將給與的紙本或電子檔(如 excel

病歷號 主診斷 藥品5碼 BLOOD WBC執行日 就醫流水號 次診斷1 藥品成份名 BLOOD WBC檢驗值 性別 次診斷2 藥品商品名 HGB執行日. 出生日期 次診斷3 藥品開立日期時間

透過 Java Servlet 程式存取資料庫.

sort 函式可將一組資料排序成遞增 (ascending order) 或 遞減順序 (descending order)。. 如果這組資料是一個行或列向量,整組資料會進行排序。

代碼 姓名 姓別 住址 電話 部門 部門 位置..

Ctrl+N 建立一個新的 VI Ctrl+B 將程式方塊圖中所有壞線移除 Ctrl+R 執行目前的的 VI Ctrl+T 將人機介面與程式方塊圖左右並列 Ctrl+W 關閉目前的的 VI Ctrl+E