• 沒有找到結果。

水稻白葉枯病抗性基因之蛋白質胺基酸的多變數分析

N/A
N/A
Protected

Academic year: 2021

Share "水稻白葉枯病抗性基因之蛋白質胺基酸的多變數分析"

Copied!
14
0
0

加載中.... (立即查看全文)

全文

(1)台灣農業研究 (J. Taiwan Agric. Res.) 57(3):161–174 (2008). Xa 胺基酸組成多變數分析. 161. 1. 水稻白葉枯病抗性基因之蛋白質胺基酸組成的多變數分析 魏夢麗2 鍾依涵3 呂椿棠2 呂秀英2,4 摘. 要. 魏夢麗、鍾依涵、呂椿棠、呂秀英。2008。水稻白葉枯病抗性基因之蛋白質胺基酸組成 的多變數分析。台灣農業研究 57:161–174。 蛋白質中的胺基酸組成隱藏甚多訊息,但其組成特性會因不同物種或物種內不同基 因而異,故蛋白質的胺基酸組成分析成為生物資訊研究的重要課題之一。胺基酸組成特 性是由多個物種或基因 (觀測值) 與 20 種胺基酸之頻率 (變數) 所構成的資料矩陣來決 定,這種多維資料形式所含之訊息,最適合利用多變數分析 (multivariate analysis) 之統 計技術來解析。為促進水稻白葉枯病抗病基因 (Xa) 蛋白質序列的結構研究,有必要針 對所有已完全定序的 Xa 基因進行蛋白質之胺基酸組成分析。基此,本研究以 NCBI 公 共資料庫內已知序列的 Xa1、xa5、xa13、Xa13、Xa21、Xa26 及 Xa27 等基因共 17 條蛋 白質序列為供試材料,綜合運用集群分析 (cluster analysis) 及對應分析 (correspondence analysis),來檢測不同 Xa 基因之蛋白質胺基酸組成的變異形式。結果顯示,根據胺基酸 組成比例,可將 Xa 基因及其家族分成六群,各群基因之蛋白質序列中各有偏好的胺基 酸。Xa1、Xa21、Xa26 及 Xa27 基因之蛋白質序列中皆以白胺酸 (leucine) 出現頻率最高; xa13、Xa13 及 Xa27 的丙胺酸 (alanine) 出現較多但絲胺酸 (serine) 較少;xa13 及 Xa13 也有較多的纈胺酸 (valine);xa5 出現麩胺酸 (glutamic acid) 和酥胺酸 (threonine) 的頻 率遠高於其他基因;所有 Xa 基因皆含有高比例的疏水性胺基酸。本研究揭示出多變數 分析之統計技術,可有效檢測出 Xa 基因間蛋白質之胺基酸組成的變異形式。 關鍵詞︰水稻、Xa 基因、蛋白質結構、胺基酸組成及屬性、集群分析、對應分析。. 前. 言. 胺基酸是組成蛋白質的單位小分子,在蛋白質中出現的只有 20 種,其支鏈在大小、形狀、電 荷、形成氫鍵的能力和化學活性方面都存在差異。正由於這 20 種胺基酸的差異,以及它們的各種 組合變化的結果,影響最後所形成蛋白質的構造與特性,因此造就了結構多變、功能紛繁的蛋白質。 1. 2. 3. 4.. 行政院農業委員會農業試驗所研究報告第 2324 號。接受日期:2008 年 7 月 23 日。 本所作物組助理研究員、助理研究員與研究員。台灣 台中縣 霧峰鄉。 私立朝陽科技大學生物技術研究所碩士。台灣 台中縣 霧峰鄉。 通訊作者,電子郵件:iying@wufeng.tari.gov.tw;傳真機:(04)23390528。.

(2) 162. 台灣農業研究. 第 57 卷. 第3期. 蛋白質的長條胺基酸序列,為其一級構造 (primary structure),是蛋白質最終構成的根本,各級構 造的訊息都決定於胺基酸的序列,即蛋白質摺疊所含之訊息揭示在其胺基酸殘基的線性序列中 (Shi et al. 2005)。Wang & Wang (1999) 指出,胺基酸的分類和組成與蛋白質的分類相關,由此推論 出胺基酸的分類和序列中應含有蛋白質二級結構的訊息,胺基酸的合理分類是進一步研究蛋白質的 分類及預測等工作的前提及基礎。Villar & Koehler (2000) 分析序列總長度在 50 個胺基酸以下的小 型蛋白質之胺基酸組成,發現某些種類的胺基酸之出現比例較高,但相對其他疏水性 (hydrophobic) 胺基酸則出現較少,此一組成之趨勢特徵有利於胜肽 (peptide) 與其目標物間的反應。Chien & Chiang (2001) 對含 20 個胺基酸以下且形成分子內雙硫鍵之自然胜肽進行胺基酸組成分析,發現從 其所存在的胺基酸偏好性,似乎反應出蛋白質胜肽中形成雙硫鍵時的結構及功能上的一些特性。由 此可見,蛋白質中的胺基酸組成隱藏甚多訊息。在生物演化過程中可能由於突變或基於蛋白質結構 和功能所需,蛋白質中的胺基酸組成會產生變異,於是造成胺基酸組成特性在不同物種或物種內不 同基因間的差異 (Tang et al. 2004; Bharanidharan & Gautham 2005; Yampolsky & Stoltzfus 2005)。因 此蛋白質的胺基酸組成分析,成為生物資訊研究的重要課題之一。 胺基酸組成特性是由多個物種或基因 (觀測值) 與 20 種胺基酸之頻率 (變數) 所構成的資料 矩陣來決定,這種多維資料形式所含之訊息,最適合利用多變數分析 (multivariate analysis) 之統計 技術來解析。多變數分析是一種綜合分析方法,能夠在多個研究對象和多個指標相互關聯的情況下 分析出它們的統計規律。集群分析是多變數分析方法的一種,係利用一般邏輯程序,能根據多個變 數間或研究對象的相似性與相異性,客觀地將相似者歸在同一群內,其一般原則是使同一集群內的 個體差異性最小,而不同集群間的個體則具有最大差異性 (Leps & Smilauer 1999);集群分析之結 果最後以樹狀圖 (dendrogram) 的分支狀況來判斷群數。對應分析為 Benzecri 於 1973 年所提出, 又稱為相互平均法 (reciprocal averaging, Hill 1973),用於分析簡單二維及多維表格的行與列之間的 對應關係,是一種廣泛運用到生態學 (尤其是植物生態學) 的多變數統計分析技術,現已大量應用 到其他各方面的研究領域 (Beh 2004),包括基因組分析上之各種應用 (Gupta & Ghosh 2001; Tekaia et al. 2002; Tan et al. 2004)。對應分析對於數據的要求比較簡單,不需要有嚴格的線性關係,也無 須限定所處理的資料是連續或離散變數,只需要是一個列聯表 (contingency table) 的資料形式,即 可將多維之變數或樣本於一個低維空間上以一個序列分佈圖 (ordination diagram) 呈現;藉由序列 分佈圖,不但可用來檢測變數間或樣本間的關係,也能從各變數或樣本落在序列分佈圖上之距離遠 近,來輔助集群分析之樹狀圖的分群結果判斷,倘發現點間有群團現象表示可能是同一群。因此, 綜合運用集群分析與對應分析,將可瞭解不同基因間之蛋白質序列中胺基酸組成的相似與相異程 度,並據此判斷基因間的群聚關係。 水稻白葉枯病 (rice bacterial blight) 是由黃單孢桿菌 (Xanthomonas oryzae pv. Oryzae, Xoo) 引 起的一種細菌性維管束病害,為世界性主要稻作病害之一。目前雖然已有藥劑能針對此病害進行防 治,但育成抗病品種為解決此病害最有效之方法 (Chang 1995),因此瞭解水稻白葉枯病抗性基因 (Xa) 的結構,有利於水稻的分子育種 (Bai et al. 2003; Monosi et al. 2004; Zhou et al. 2004)。至 2007 年 3 月 31 日截止,日本的 NIG (National Institute of Genetics) 之 Oryzabase 資料庫 (http://www. shigen.nig.ac.jp/rice/oryzabase/top/top.jsp, Yamazaki & Jaiswal 2005) 內已登記命名 32 個 Xa 基因,其 中已完全定序的有 Xa1、xa5、xa13、Xa13、Xa21、Xa26 及 Xa27 7 個基因 (Song et al. 1995; Yoshimura.

(3) Xa 胺基酸組成多變數分析. 163. et al. 1995, 1998; Anjali & McCouch 2004; Gu et al. 2005; Sun et al. 2006)。植物抗病機制中,有兩套 基因系統先後作用,一為抗病基因 (resistant gene, R gene),二為防衛基因。R 基因能特異性的識別 病原菌對應之無毒 (Avr) 基因的產物,兩者可直接或間接地相互作用而刺激植物的訊號傳遞系 統,最後誘導出植物防衛基因的表達,使植物表現出抗病性,同時 R 基因能不斷進化,可對病原 菌不斷突變所產生的生理小種產生抗性 (Wang et al. 2002)。植物 R 基因的表現蛋白質結構分為五 類 (Baker et al. 1997):(1) 含有核苷酸結合位置 (nucleotide binding sites, NBS) 的細胞質受體類蛋 白 (cytoplasmic receptor-like proteins) 和多白胺酸重複 (leucine-rich repeat, LRR) 序列區域,簡稱為 NBS-LRR;(2) 絲胺酸-酥胺酸激酶 (serine-threonine kinase);(3) 含有大量細胞質外 LRR 區域的穿 膜受體 (transmembrane receptor);(4) 含細胞外 LRR 區域之穿膜受體和細胞內絲胺酸-酥胺酸激酶 (intracellualar serine-threonine kinase) 區域;及 (5) 其他。R 基因的發現,使水稻的抗病機制在分 子層次研究上有了突破性的發展,且由於水稻的 Xa 基因在演化上的保守性與差異性,揭示出 Xa 基因可能存在較複雜的分子機制 (Guo et al. 2005)。已知 Xa1 為上述第一類 R 基因,而 Xa21 和 Xa26 為第四類 R 基因,至於 xa5、xa13、Xa13 及 Xa27 之抗病防禦系統的生化途徑異於 Xa1、Xa21 和 Xa26,其表現蛋白質結構尚未清楚,目前被歸於其他之第五類 R 基因 (Yoshimura et al. 1998; Khush & Angeles 1999; Anjali & McCouch 2004; Gu et al. 2005; Sun et al. 2006)。為有利於暸解不同 Xa 基因 之蛋白質序列的結構差異,因此本研究利用多變數分析法之集群分析與對應分析,來探討這些已定 序的 Xa 基因之蛋白質胺基酸組成的變異形式。. 材料與方法 Xa 基因序列之蒐集與下載 本 研 究 透 過 NCBI (National Center for Biotechnology Information) 之 GenBank 資 料 庫 (http://www.ncbi.nlm.nih.gov/Genbank/index.html, Guisez et al. 1993) 下載已定序之 Xa 基因的編碼區 序列 (coding domain sequence, CDS) 和蛋白質序列,這些已知 Xa 基因的相關資訊整理如表 1,其 CDS 長度介於 318-5,409 bp 之間,來源包含有印度型水稻 (Oryza sativa indica caltivar-group)、日本 型水稻 (japonica)、長花藥野生稻 (Oryza longistaminata)。其中 Xa1 分別於 1999 年和 2004 年登錄 有兩條序列 (本文簡稱 Xa1_1999 和 Xa1_2004),各位於第 4 條與第 10 條染色體;xa5 為一隱性基 因,位於第 5 條染色體上;Xa13 及 xa13 分別為顯、隱性基因,皆位於第 8 條染色體上;Xa21 基 因家族位於第 11 條染色體,包含七個成員分別為 Xa21-A1、Xa21-A2、Xa21-B、Xa21-C、Xa21-D、 Xa21-E 及 Xa21-F;Xa26 基因家族位於第 11 條染色體,包含 4 個成員分別為 Xa26-MRKa、 Xa26-MRKb、Xa26-MRKc 及 Xa26-MRKd (本文簡稱 Xa26a、Xa26b、Xa26c 及 Xa26d);Xa27 位於第 6 條染色體。所蒐集共 17 條基因之序列中 Xa21-A2、Xa21-C、Xa21-F 及 Xa26d 等 4 個基因只有 CDS 序列,在 NCBI 中尚未登錄有完整的蛋白質序列,故本研究將此四條 CDS 另利用 BioEdit 生物資訊 軟 體 (Biological Sequence Alignment Editor for Win95/98/NT/2K/XP; http://www.mbio.ncsu.edu/ BioEdit/bioedit.html, Hall 2001) 將其轉譯成蛋白質序列,合計共 17 條蛋白質序列。. 多變數分析在 Xa 基因之蛋白質胺基酸組成的應用 為探討各 Xa 基因及其家族間胺基酸組成之相似及相異程度,首先計算各 Xa 基因及其家族之 蛋白質序列中各種胺基酸所佔比例,然後利用 STATISTICA 統計軟體 (Statsoft Inc. 2002) 以非加權.

(4) 台灣農業研究. 第 57 卷. 第3期. Xa26. Xa27. Xa26d. Xa27. 2005. 2006. 2006. 2006. 2006. 2005. 1997. 1997. 1998. 1995. 1998. 1997. 2006. 2006. 2004. 2004. Definition. AY986491. DQ355952. DQ355952. DQ355952. DQ355952. U72728. U72724. Oryza sativa (indica cultivar-group) receptor kinase-like protein gene Oryza longistaminata receptor-like kinase protein, pseudogene sequence Oryza sativa (indica cultivar-group) receptor kinase MRKa Oryza sativa (indica cultivar-group) bacterial blight resistance protein Xa26 Oryza sativa (indica cultivar-group) receptor kinase MRKc Oryza sativa (indica cultivar-group) cultivar Minghui 63 receptor kinase pseudogene Oryza sativa (indica cultivar-group) Xa27 gene, Xa27-IR24 allele. NM_194685 Oryza sativa (japonica cultivar-group) putative bacterial blight resistance protein Xa1-like protein, mRNA AY643716 Oryza sativa (indica cultivar-group) transcription factor IIA gamma subunit (TFIIAy) mRNA, partial cds. DQ421394 Oryza sativa (indica cultivar-group) cultivar IRBB13 disease resistant allele xa13 (xa13) gene, complete cds. DQ421395 Oryza sativa (indica cultivar-group) cultivar IR64 disease resistant allele XA13 (Xa13) gene, complete cds. U72725 Oryza longistaminata receptor kinase-like protein gene U72727 Oryza longistaminata receptor kinase-like protein, pseudogene sequence U37133 Oryza sativa (indica cultivar-group) receptor kinase-like protein gene U72723 Oryza longistaminata receptor kinase-like protein gene, pseudogene U72726 Oryza longistaminata receptor kinase-like protein. Oryza sativa (indica cultivar-group) mRNA for Xa1. Protein sequence translated from CDS using BioEdit software.. Xa26. Xa26c. z. Xa26. Xa21-C. Xa26b. Xa21. Xa21-B. Xa26. Xa21. Xa21-A2. Xa26a. Xa21. Xa21-A1. Xa21. Xa21. Xa13. Xa21-F. Xa13. xa13. Xa21. xa13. xa5. Xa21. xa5. Xa1_2004. AB002266. 2393. 11396. 3456. 3631. 3401. 7204. 9424. 13341. 19639. 3921. 5940. 8416. 924. 924. 318. 4206. 5910. Gene length. 6. 11. 11. 11. 11. 11. 11. 11. 11. 11. 11. 11. 8. 8. 5. 10. 4. CDS. 924. 924. 318. 4206. 5409. Length. 1683..4352,5147..55 47 14225..17135,17240 ..17625 21725..24659,24765 ..25141 34496..34911,35026 ..37951 2021..3423,9305..10 839, 13028..13416 1590..1931. 2819..5260. 15118..17720, 17827..18201 2367..4205. 342. 3327. 3342. 3312. 3297. 3071. 2442. 1839. 2978. 4771..7384,7676..80 2991 52 2151..4764,4872..52 2991 48 1..2677,3521..3921 3078. 1..924. 1..924. 1..318. 1..4206. 113..5521. Chr. no Location. AAY54163. -. ABD36513. ABD36512. ABD36511. -. AAB82756. AAB82753. -. AAC49123. -. AAB82755. ABD78943. ABD78942. AAV53715. NP_919667. BAA25068. 113. 1109 z. 1113. 1103. 1098. 1023 z. 813. 612. 992 z. 1025. 996 z. 996. 307. 307. 106. 1401. 1802. Protein sequence Accession no. Length. 第 57 卷. Xa21-D. Xa1. Xa1_1999. Accession no. in NCBI. 台灣農業研究. Xa21-E. Xa1. Label 1999. Gene Submitted symbol year. Table 1. Information summary of known sequences in rice Xa genes from Oryzabase and NCBI databases (update time: March 31, 2007). 表 1. Oryzabase 及 NCBI 資料庫中已定序之 Xa 基因的資訊摘要 (至 2007 年 3 月 31 日止). 164. 164 第3期.

(5) Xa 胺基酸組成多變數分析. 165. 配對算術平均法 (unweighted pair group method using arithmetic average, UPGMA) 進行集群分析, 以求得歸群樹狀圖。UPGMA 是集群分析的演算方法之一,以群間個體所有成對距離的平均值為判 斷,較不受離群值影響 (Mohna et al. 1992; Mumm et al. 1994)。接著,同樣再利用 STATISTICA 統 計軟體進行對應分析,由其行列之間的對應關係,求得序列分佈圖,以呈現基因間蛋白質胺基酸組 成之關係。最後綜合集群分析之樹狀圖和對應分析之序列分佈圖的結果,來共同決定群數。. 各群 Xa 基因之蛋白質胺基酸的組成及屬性比較 根據上述分群結果,計算各群 Xa 基因蛋白質序列中各種胺基酸的組成比例,並利用 Excel 軟 體繪製雷達圖,以進行各群 Xa 基因間蛋白質胺基酸組成之差異性比較。再根據胺基酸支鏈之性質 (Mathews et al. 2000,整理如表 2),計算各群基因之蛋白質序列中不同屬性胺基酸所佔比例,並藉 由雷達圖之呈現,來探討各群 Xa 基因間之蛋白質胺基酸屬性的差異。. 結. 果. 根據 17 個 Xa 基因及其家族之蛋白質序列中胺基酸組成比例的集群分析,由所得之樹狀圖 (圖 1A) 可發現,在歐氏距離 13.2 時,Xa 基因及其家族可被分成四群:Xa1_1999、Xa1_2004、Xa21-C、 Xa21-F、Xa26d、Xa21-A1、Xa21-A2、Xa21-B、Xa21-D、Xa21-E、Xa26a、Xa26b 及 Xa26c 為同一 群,xa13 和 Xa13 自成一群,xa5 和 Xa27 則各自成群。進而由對應分析所得之序列分佈圖上各基 因落點之距離遠近,大致也可將 Xa 基因及其家族分成四群,此與集群分析之結果一致 (圖 1 B)。 然而,由於考慮到 xa5、xa13、Xa13 及 Xa27 之蛋白質序列的長度 (106-307 base) 相較於其他 Xa 基因甚短,因此移去此四個基因再重新進行集群分析及對應分析。根據集群分析之樹狀圖 (圖 2A), 結果發現於歐氏距離 8.3 時,13 個 Xa 基因及其家族可進而被分成三群,其中 Xa1_1999、Xa1_2004 及 Xa21-C、Xa21-F、Xa26d 從前述群聚結果 (圖 1A) 中被分離出來而成為兩群 (圖 2 A)。檢視對 應分析之序列分佈圖,也得到一致的分群結果 (圖 2 B)。綜合圖 1 及圖 2 的兩次分群結果,Xa 基 因之蛋白質胺基酸組成可區分成六群 (表 3):第 I 群為 Xa1_1999 及 Xa1_2004,第 II 群為 Xa21-A1、Xa21-A2、Xa21-B、Xa21-D、Xa21-E、Xa26a、Xa26b 及 Xa26c,第 III 群為 Xa21-C、 Xa21-F 及 Xa26d,第 IV 群為 xa5,第 V 群為 xa13 及 Xa13,第 VI 群為 Xa27。 表 2. 胺基酸屬性分類 Table 2. Classification of amino acid attribution Non-Polar (Hydrophobic). Polar (Hydrophilic) Uncharged. Positively charged. Negatively charged. Alanine (Ala). Cysteine (Cys). Histidine (His). Aspartic acid (Asp). Phenylalanine (Phe). Glycine (Gly). Lysine (Lys). Glutamic acid (Glu). Isoleucine (Ile). Asparagine (Asn). Arginine (Arg). Leucine (Leu). Glutamine (Gln). Methionine (Met). Serine (Ser). Proline (Pro). Threonine (Thr). Valine (Val). Tyrosine (Tyr). Tryptophane (Trp).

(6) 166. 台灣農業研究. 第 57 卷. 第3期. 圖 1. 17 個 Xa 基因及其家族根據蛋白質胺基酸組成的分群結果。(A) 集群分析採 UPGMA 法之樹狀圖;(B) 對 應分析之序列分佈圖。 Fig. 1. Grouping results of 17 Xa genes and their families according to the amino acid composition in proteins. (A) Dendrogram of cluster analysis using UPGMA, (B) Ordination diagram of correspondence analysis..

(7) Xa 胺基酸組成多變數分析. 167. 圖 2. 12 個 Xa 基因及其家族 (不含 xa3、xa13、Xa13 及 Xa27) 根據蛋白質胺基酸組成的分群結果。(A) 集群 分析採 UPGMA 法之樹狀圖;(B) 對應分析之序列分佈圖。 Fig. 2. Grouping results of 12 Xa genes and their families (without xa3, xa13, Xa13 and Xa27) according to the amino acid composition in proteins. (A) Dendrogram of cluster analysis using UPGMA, (B) Ordination diagram of correspondence analysis..

(8) 168. 台灣農業研究. 第 57 卷. 第3期. 表 3. Xa 基因之蛋白質胺基酸組成比例的分群結果 Table 3. Grouping results of Xa genes determined from the percentage compositions of amino acids in proteins Group. Genes. I. Xa1_1999. Xa1_2004. II. Xa21-A1. Xa21-A2. Xa21-B. III. Xa21-C. Xa21-F. Xa26d. IV. xa5. V. xa13. VI. Xa27. Xa21-D. Xa21-E. Xa26a. Xa26b. Xa26c. Xa13. 由各群 Xa 基因表現蛋白質之胺基酸組成比例的雷達圖 (圖 3),可清楚看出各群 Xa 基因對表 現蛋白質的胺基酸使用確實有差異。分屬第 I、II、III 群的 Xa1、Xa21 及 Xa26 的蛋白質序列中皆 一致出現最多的白胺酸 (Leu),其次為絲胺酸 (Ser),但三群基因間在蛋白質序列中的其他胺基酸 之組成比例仍多少有異,其中 Xa1 的麩胺酸 (Glu) 出現較多而 Xa21 則以甘胺酸 (Gly) 和天門冬 醯胺酸 (Asn) 較多。相對於其他基因,xa13、Xa13 及 Xa27 的丙胺酸 (Ala) 出現較多但 Ser 較少; xa13 及 Xa13 也有較多的纈胺酸 (Val);xa5 出現 Glu 和酥胺酸 (Thr) 的頻率遠高於其他基因。第 VI 群之 Xa27 之蛋白質序列中出現 Leu 之頻率是所有基因中之最高;所有 Xa 基因之蛋白質序列出 現色胺酸 (Trp) 的頻率都甚少。 再由各群 Xa 基因之表現蛋白質的不同屬性胺基酸所佔比例之雷達圖 (圖 4),可發現各群 Xa 基因的蛋白質序列中皆以疏水性 (hydrophobic) 胺基酸出現較多,尤其以第 V 及 VI 群之 xa13, Xa13 及 Xa27 出現疏水性胺基酸之頻率最多,各高達約 58%,而第 IV 群之 xa5 的疏水性胺基酸雖 亦多,但含量為 38%,僅略高於無電荷胺基酸所佔比例 (36%)。Xa1、Xa21 及 Xa26 之蛋白質的胺 基酸屬性分布較相近。所有 Xa 基因蛋白質序列的親水性 (hydrophilic) 胺基酸中以無電荷胺基酸之 比例較高 (25–39%),而正電荷及負電荷胺基酸的含量都甚少,約佔 4–15%。. 討. 論. 根據本研究利用多變數分析進行 Xa 基因蛋白質序列中胺基酸組成比例的分群結果 (圖 1、圖 2 及表 3),顯示第 I 群為屬第一類 R 基因的 Xa1,而同屬第四類 R 基因的 Xa21 和 Xa26 及其基因家 族則被分成第 II、III 群,屬其他之第五類 R 基因的 xa5、xa13、Xa13 及 Xa27 分別歸於第 IV、V、 VI 群。由分群結果可以發現這些 Xa 基因之表現蛋白質各有其胺基酸組成特性 (圖 3),Xa1、Xa21 及 Xa26 都含有豐富的 Leu,這是因為它們的表現蛋白質皆含有 LRR 序列區域結構 (Song et al. 1995; Yoshimura et al. 1998; Sun et al. 2006);此外,這三個 Xa 基因也含有豐富的 Ser,尤其是 Xa21 及 Xa26 的抗病機制含有細胞外 LRR 區域之穿膜受體和細胞內絲胺酸-酥胺酸激酶區域 (Song et al. 1995; Sun et al. 2006),因此出現 Ser 頻率也較 Xa1 為高;而 Xa1、Xa21 及 Xa26 之間在其他胺基酸 (如 Glu、Gly 和 Asn) 的所佔比例仍多少有異。xa13 是 Xa13 顯性基因在啟動子 (promoter) 區域內序 列上之突變所產生的完全隱性基因,只有在同型 (homozygous) 狀態下對黃單孢桿菌菲律賓生理小 種 Xoo race 6 (strain PXO99) 能產生抗性 (Chu et al. 2006),經本研究分析結果 xa13 和 Xa13 的表現.

(9) 169. Xa 胺基酸組成多變數分析. II. I Xa1_1999, Xa1_2004. Cys. Asp Glu Phe Gly. Arg. His. Gln Asn. Leu. Ala Tyr 25 Cys Trp Asp 20 Val Glu 15 10 Thr Phe 5 0 Ser Gly. Tyr 25 Trp 20 15 Val 10 Thr 5 0 Ser. Arg. Arg. Gln Pro. Ile Pro. Lys. His. Asn. Leu. Asp Glu Phe Gly His. Gln. Ile Leu Met. His Pro. Asn. Leu. Lys. Tyr 25 Trp 20 Val 15 10 Thr 5 Ser 0. VI Xa27 Ala. Cys. Asp Glu Phe Gly. Arg. His. Gln Pro Asn. Leu Met. Lys. Met. Ala. Cys. Arg. Asn. Gly. Ile. xa13, Xa13. Ala. Asp Glu Phe. V. IV xa5. Pro. Cys. Gln. Ile Lys. Met. Met. Tyr 25 Trp 20 Val 15 10 Thr 5 Ser 0. Xa21-C, Xa21-F, Xa26d Ala. Ala Tyr 25 Trp 20 15 Val 10 Thr 5 0 Ser. III. Xa21-A1, Xa21-A2, Xa21-B, Xa21-D, Xa21-E, Xa26a, Xa26b, Xa26c. Ile Lys. Tyr 25 Trp 20 15 Val 10 Thr 5 0 Ser. Cys. Asp Glu Phe Gly His. Arg Gln. Ile Pro. Asn. Leu. Lys. Met. 圖 3. 各群 Xa 基因之蛋白質胺基酸組成差異的雷達圖。 Fig. 3. Polar plot showing the compositional differences among amino acids in proteins for each Xa-gene group.. 蛋白質之胺基酸組成被歸於同一群,經檢查兩者的蛋白質序列之編碼,發現幾乎相同,其差異僅在 第 298 位置上 xa13 編碼為 Thr,而 Xa13 編碼為 Ala。xa5、xa13、Xa13 及 Xa27 4 個基因之蛋白質 序列都不具有 LRR 結構,其 R 基因的表現蛋白質結構目前尚未清楚 (Yoshimura et al. 1998; Khush & Angeles 1999; Anjali & McCouch 2004; Gu et al. 2005; Sun et al. 2006),但從本研究結果發現,它們 的胺基酸組成特性明顯不同。Xa27 蛋白質序列中有非常多的 Leu 且含量遠高於其他 Xa 基因,按 此可能與 Xa27 之產物內含 3 個核定位信號 (nuclear localized signal, NLS) 模組之 C 端保守區域和 一個轉錄活化區的細胞核局部性第 III 型作用器有關 (Gu et al. 2005)。由此顯見,Xa 基因的蛋白質 胺基酸組成類別與蛋白質結構類別相關,但同類 R 基因間的蛋白質胺基酸組成仍有差異。 胺基酸支鏈的極性 (親水性) 或非極性 (疏水性),對形成蛋白質的整體構造與性質非常重要; 疏水性強的胺基酸,通常居於蛋白質的內部,再藉由疏水性所引發之摺疊 (folding) 過程中扮演了.

(10) 170. 台灣農業研究. 第 57 卷. 第3期. 圖 4. 各群 Xa 基因之蛋白質胺基酸屬性差異的雷達圖。 Fig. 4. Polar plot showing the attributional differences among amino acids in proteins for each Xa-gene group.. 重要角色 (Dill 1985; Nauchitel & Somorjai 1994; Villar & Kauvar 1994)。Mathews et al. (2000) 指出 疏水性胺基酸多,有利於維持蛋白質的完整三級結構。藉由多變數分析進行 Xa 基因蛋白質胺基酸 組成之分群結果,可以檢視出各群基因在胺基酸屬性分布的相似與相異程度,結果發現 7 個 Xa 基 因之蛋白質皆含有高比例的疏水性胺基酸,但各群基因間的比例仍有差異,其中 xa13、Xa13 及 Xa27 基因之蛋白質序列出現疏水性胺基酸的頻率最高,而以 xa5 基因蛋白質最少,Xa1、Xa21 及 Xa26 基因表現蛋白質的胺基酸屬性分布則較相近 (圖 4)。. 誌. 謝. 本研究承蒙行政院農業委員會農業生物技術國家型科技計畫 (計畫編號:94 農科-5.2.1-農 -C1(8)) 及國家科學委員會 (計畫編號:NSC95-2317-B-055-004) 補助經費,特致謝忱。.

(11) Xa 胺基酸組成多變數分析. 171. 引用文獻 (Literature cited) Anjali, S. I. and S. R. McCouch. 2004. The rice bacterial blight resistance gene xa5 encodes a novel form of disease resistance. Mol. Plant-Microbe Interact. 17:1348–1354. Bharanidharan, D. and N. Gautham. 2005. Amino acid variation in cellular processes in 108 bacterial proteomes. Arch. Microbiol. 184:168–174. Baker, B., P. Zambryski, B. Staskawicz, and S. P. Dinesh-Kumar. 1997. Signaling in plant-microbe interactions. Science 276:726–733. Bai, J., L. A. Pennill, J. Ning, S. W. Lee, J. Ramalingam, C. R. Webb, B. Zhao, Q. Sun, J. C. Nelson, J. E. Leach, and S. H. Hulbert. 2003. Diversity in nucleotide binding site-leucine-rich repeat genes in cereals. Genome Res. 12:1871–1884. Beh, E. J. 2004. A Bibliography of the Theory and Application of Correspondence Analysis. Vol. II-By Publication. School of Quantitative Methods and Mathematical Sciences, Univ. Western Sydney. Australia. 101 pp. Benzecri, J. P. 1973. Lanalyse des donnees. II. Lanalyse des correspondances. Dunod. Paris, France. 619 pp. Chang, S. J. 1995. Physiological and genetical studies on bacterial blight (Xanthomonas oryzae pv. oryzae) resistance in rice (Oryza sativa L.). PhD. Grad. Inst. Agron. National Chung-Hsing Univ. Taichung. 172 pp. Chien, W. J. and F. T. Chiang. 2001. The preference of amino acids in cyclic peptides an application of bio-information in elementary biochemistry. J. Chaoyang Univ. Technol. 6:617–628. (in Chinese with English abstract) Chu, Z., M. Yuan, J. Yao, X. Ge, B. Yuan, C. Xu, X. Li, B. Fu, Z. Li, J. L. Bennetzen, Q. Zhang, and S. Wang. 2006. Promoter mutations of an essential gene for pollen development result in disease resistance in rice. Genes Dev. 20:1250–1255. Dill, K. A. 1985. Theory for the folding and stability of globular protein. Biochemistry 24:1501-1509. Gu, K., B. Yang, D. Tian, L. Wu, D. Wang, C. Sreekala, F. Yang, Z. Chu, G. L. Wang, F. F. White, and Z. Yin. 2005. R gene expression induced by a type-III effector triggers disease resistance in rice. Nature 435:1122–1125. Guisez, Y., J. Robbins, E. Remaut, and W. Fiers. 1993. Folding of the MS2 coat protein in Escherichia coli is modulated by translational pauses resulting from mRNA secondary structure and codon usage: A hypothesis. J. Theor. Biol. 162:243–252. Guo, S. W., Y. Zhang, L. H. Sun, and D. Y. Gao. 2005. Progress on the research of bacterial blight resistance in rice. Chin. Agric. Sci. Bull. 21:339–344. (in Chinese with English abstract) Gupta, S. K. and T. C. Ghosh. 2001. Gene expressivity is the main factor in dictating the codon usage variation among the genes in Pseudomonas aeruginosa. Gene 273:63–70..

(12) 172. 台灣農業研究. 第 57 卷. 第3期. Hall, T. 2001. BioEdit version 5.0.6. North Carolina State Univ. 192 pp. Hill, M. O. 1973. Reciprocal averaging: An eigenvector method of ordination. J. Ecol. 61:237–249. Khush, G. S. and E. R. Angeles. 1999. A new gene for resistance to race 6 of bacterial blight in rice, Oryza sativa L. Rice Genet. Newsl. 16:92–93. Leps, J. and P. Smilauer. 1999. Multivariate Analysis of Ecological Data. Faculty of Biological Science. Univ. South Bohemia, Ceske Budejovice. 110 pp. Mathews, C. K., K. E. van Holde, and K. G. Ahern. 2000. Biochemistry. Addison Wesley Longman, Inc. USA. p.126–160. Mohna, F. I., P. Shen, S. C. Jong, and K. Orikono. 1992. Molecular evidence supports the separation of Lentinula edodes from Lentinus and related genera. Can. J. Bot. 70:2446–2452. Monosi, B., R. J. Wisser, L. Pennill, and S. H. Hulbert. 2004. Full-genome analysis of resistance gene homologues in rice. Theor. Appl. Genet. 109:1434–1477. Mumm, R. H., J. Hubert, and J. W. Dudley. 1994. A classification of 148 U.S. maize inbreds: II. Validation of cluster analysis based on RFLPs. Crop Sci. 34:852–865. Nauchitel, V. V. and R. L. Somorjai. 1994. Spatial and free energy distribution patterns of amino acid residues in water soluble proteins. Biophys. Chem. 51:327–336. Shi, X. H., X. R. Liu, L. Luo, W. B. Liu, and J. Xu. 2005. A research of amino acid order based on amino acid classification. J. Biomath. 20:491–495. Song, W. Y., G. L.Wang, L. L. Chen, H. S. Kim, L. Y. Pi, T. Holsten, J. Gardner, B. Wang, W. X. Zhai, L. H. Zhu, C. Frauquet, and P. Ronald. 1995. A receptor kinase-like protein encoded by the rice disease resistance gene, Xa21. Science 270:1804–1806. Statsoft Inc. 2002. STATISTICA: The small book chinese version. USA. 144 pp. Sun, X. L., Y. L. Cao, and S. P. Wang. 2006. Point mutations with positive selection were a major force during the evolution of a receptor-kinase resistance gene family of rice. Plant Physiol. 140:998–1008. Tan, Q., K. Brusgaard, T. A. Kruse, E. Oakeley, B. Hemmings, H. Beck-Nielsen, L. Hansen, and M. Gaster. 2004. Correspondence analysis of microarray time-course data in case-control design. J. Biomed. Inform. 37:358–365. Tang, H., J. G. J. Wyckoff, J. Lu, and C. I. Wu. 2004. A universal evolutionary index for amino acid changes. Mol. Biol. Evol. 21:1548–1556. Tekaia, F., E. Yeramoan, and B. Dujon. 2002. Amino acid composition of genomes, lifestyles of organisms, and evolutionary trends: A global picture with correspondence analysis. Gene 297:51–60..

(13) Xa 胺基酸組成多變數分析. 173. The Rice Chromosome 10 Sequencing Consortium. 2003. In-depth view of structure, activity, and evolution of rice chromosome 10. Science 300:1566–1569. Villar, H. O. and L. M. Kauvar. 1994. Amino acid preferences at protein binding sites. FEBS Lett. 349:125–130. Villar, H. O. and R. T. Koehler. 2000. Amino acid preferences of small, naturally occurring polypeptides. Biopolymers 53:226–232. Wang, A. J., C. X. Zhu, and F. J. Wen. 2002. Molecular biology of the resistance to blight disease in rice. J. Shandong Agric. Univ. (Nat. Sci.) 33:101–106. (in Chinese with English abstract) Wang, J. and W. Wang. 1999. A computational approach to simplifying the protein folding alphabet. Nat. Struc. Biol. 6:1033–1038. Yamazaki, Y. and P. Jaiswal. 2005. Biological ontologies in rice databases. An introduction to the activities in Gramene and Oryzabase. Plant Cell Physiol. 46:63–68. Yampolsky, L. Y. and A. Stoltzfus. 2005. The exchangeability of amino acids in proteins. Genetics 170:1459–1472. Yoshimura, S., A. Yoshimura, N. Iwata, S. R. McCouch, M. L. Abenes, M. Baraoidan, T. W. Mew, and R. J. Nelson. 1995. Tagging and combining bacterial blight resistance genes in rice using RAPD and RFLP markers. Mol. Breed. 1:375–387. Yoshimura, S., U. Yamanouchi, Y. Katayose, S. Toki, Z. X. Wang, I. Kono, N. Kurta, M. Yano, N. Iwata, and T. Sasaki. 1998. Expression of Xa1, a bacterial blight-resistance gene in rice, is induced by bacterial inoculation. Proc. Nat. Acad. Sci. 95:1663–1668. Zhou, T., Y. Wang, J. Q. Chen, H. Araki, Z. Jing, L. Jiang, J. Shen, and D. Tian. 2004. Genome-wide identification of NBS genes in japonica rice reveals significant expansion of divergent non-TIR NBS-LRR genes. Mol. Genet. Genomics 271:402–415..

(14) 174. 台灣農業研究. 第 57 卷. 第3期. Multivariate Analysis of Amino Acid Composition in Proteins from Rice Bacterial Blight Resistance Genes 1 Meng-Li Wei2, Yi-Han Chung3, Chun-Tang Lu2, and Hsiu-Ying Lu2,4 Abstract Wei, M. L., Y. H. Chung, C. T. Lu, and H. Y. Lu. 2008. Multivariate analysis of amino acid composition in proteins from rice bacterial blight resistance genes. J. Taiwan Agric. Res. 57:161–174.. Much information is stored in amino acid composition of proteins, while amino acid compositional features vary among species and among genes within species; thus, the analysis of amino acid composition of proteins becomes one of the important topics in bioinformatics research. The total amino acid usage is determined by obtaining a data matrix of multiple species or genes (observations) and 20 amino acid frequencies (variables). The multivariate analysis is well suited for exploring this multidimensional information. To accelerate the analysis of protein structure in rice bacterial blight resistance gene (Xa), it is essential to examine the amino acid composition of all completely sequenced Xa genes. Thus, using a total of 17 protein sequences of rice bacterial blight resistance genes, i.e., Xa1, xa5, xa13, Xa13, Xa21, Xa26, and Xa27 collected from NCBI, as test data, the pattern of variation of amino acid composition in Xa genes was detected by the complementary use of correspondence analysis and cluster analysis. The results showed that Xa genes were divided into six groups according to their percentage compositions of amino acids. The Xa1, Xa21, Xa26, and Xa27 genes were found to have leucine mostly. The xa13, Xa13, and Xa27genes had fewer serine but more alanine and glycine. The xa13 and Xa13 genes also contained much valine. The xa5 gene had much glutamic acid and threonine compared to other Xa genes. All of Xa genes had high-frequency hydrophobic amino acid in proteins. This research showed that multivariate statistical technique is useful for detecting the variation pattern of amino acid composition of proteins among Xa genes. Key words: Rice (Oryza sativa L.), Xa genes, Protein structure, Composition and attribution of amino acids, Cluster analysis, Correspondence analysis.. 1. Contribution No.2324 from Agricultural Research Institute, Council of Agriculture. Accepted: July 23, 2008. 2. Respectively, Assistant Researcher, Assistant Researcher and Senior Researcher. Crop Science Division, ARI, Wufeng, Taichung, Taiwan, ROC. 3. Master, Graduate Institute of Biotechnology, Chaoyang University of Technology, Wufeng, Taichung, Taiwan ROC. 4. Corresponding author, e-mail: iying@wufeng.tari.gov.tw; Fax: (04)23390528..

(15)

參考文獻

相關文件

1. In the textbook, pp 224-223, there is a surprising result called Space- filling curve. In addition, note the proof is related with Cantor set in exercise 7. There exists a

Good Data Structure Needs Proper Accessing Algorithms: get, insert. rule of thumb for speed: often-get

the prediction of protein secondary structure, multi-class protein fold recognition, and the prediction of human signal peptide cleavage sites.. By using similar data, we

In particular, we present a linear-time algorithm for the k-tuple total domination problem for graphs in which each block is a clique, a cycle or a complete bipartite graph,

Total spending and per-capita spending of visitors for the fourth quarter of 2011 were extrapolated from 39,900 effective questionnaires collected; besides, data for the fourth

Total spending and per-capita spending of visitors for the third quarter of 2011 were extrapolated from 47,300 effective questionnaires collected; besides, data for the third

In the first quarter of 2012, total spending and per-capita spending of visitors were extrapolated from 43,000 effective questionnaires collected from the Visitor Expenditure

S15 Expectation value of the total spin-squared operator h ˆ S 2 i for the ground state of cationic n-PP as a function of the chain length, calculated using KS-DFT with various