• 沒有找到結果。

第五章 大腸桿菌 gspS 基因表現之調控

5.3.1 gspS 上游序列之探討

(a)以啟動子預測軟體推測 gspS 上游啟動子區域 (promoter region) 位置

一般基因在其上游均有負責調控的啟動子區域 (promoter region),在本研究 之初,將gspS 上游序列約 1000 bp,亦即從基因組 (genome) 上第 3137615 bp 至 第3136521 bp(GspS 8th amino acid),以兩種啟動子預測軟體 (promoter

prediction),對此段序列含有啟動子的可能性及其位置做一初步探討。

以 Berkeley Drosophila Genome Project : Neural Network Promoter

Prediction,選擇prokaryote 選項,預測出gspS 上游含有三處可能的啟動子區域 (promoter regions) 及轉錄起始點 [transcription start sites (TSS)](圖十九),分別 在3137125 (距 GspS 起始密碼 3136544 處 581bp)、3137003 (距 GspS 起始密碼 459bp)、3136880 (距 GspS 起始密碼 336bp)。以 SoftBerry-bprom 亦預測出三處 TSS,分別在 3137510 (距 GspS 起始密碼 3136544 處 966bp)、3137124 (距 GspS 起始密碼580bp)、3136739 (距 GspS 起始密碼 195bp)。兩軟體所得結果有一重複,

TSS 位於 3137124 處之預測。由以上結果初步認定 gspS 上游序列含有啟動子,

且位置距離GspS 起始密碼 1000 bp 以內。

(b)以啟動子 (promoter prediction)、編碼區 (coding region prediction) 及操縱 子 (operon prediction) 預測軟體推測,gspS 是一單獨的轉錄單位 (transcription unit)

為瞭解gspS 是否為一單獨的轉錄單位(transcription unit),或是屬於一操縱 子 (operon),上游可能還有其他基因,針對此點,將搜尋序列往更上游延伸,使 用相關軟體,預測3139000 (GspS start codon 上游 2456 bp) 至 3136521(GspS 8th amino acid) 序列中,啟動子及編碼區的位置,並以操縱子預測 (operon prediction) 軟體,預測3163000 (GspS 起始密碼上游 26456 bp) 至 3133000 (GspS 起始密碼 下游3544 bp) 序列中,轉錄單位 (transcription unit) 與操縱子 (operon) 存在的 狀況。

(1)以啟動子預測軟體,預測 gspS 上游 3139000 至 3136521 啟動子區域 (promoter region) 位置

GspS start codon 位於 E. coli genome 的 3136544 處,首先將其上游序列約 2500 bp (3139000 至 3136521) 以兩種啟動子預測軟體 BDGP-Neural Network Promoter Prediction 及 SoftBerry-bprom 預測啟動子及轉錄起始處 (TSS)。

除前述所預測的三個 TSS 外,BDGP-Neural Network Promoter Prediction 預 測出更上游有四處TSS (圖十九),距離起始密碼子 (start codon) 由近至遠分別是 3137728,與起始密碼子距 1184bp;3137979,與起始密碼子距 1435bp;3138297,

與起始密碼子距1753 bp;3138690,與起始密碼子距 2146 bp。

SoftBerry-bprom 預測出與 BDGP 三個重複的 TSS,距離 GspS 起始密碼子 由近至遠分別為3137979,與起始密碼子距 1435 bp;3138297,與起始密碼子距 1753 bp;3138690,與起始密碼子距 2146 bp。其中,TSS 3137979 有一轉錄因子 (transcription factor) RpoD 的 binding site。

(2)以編碼區預測軟體,預測 gspS 上游區域 3139000 至 3136521 編碼區 (coding region) 位置

將 GspS 起始密碼子上游序列約 2500 bp (3139000 至 3136521)以兩種編碼區 預測軟體GeneMark.hmm for prokaryotes 及 Generation Microbial Gene Prediction System,預測 GspS 上游是否存有編碼區(圖二十)。

GeneMark.hmm for prokaryotes 預測所得編碼區,與 GspS 起始密碼子距離由 近至遠分別是在3137986 至 3137738 的基因長度為 249 bp,由 83 個胺基酸組成,

暫名之coding region 1(cod. 1);3138340 至 3137999 的基因長度為 342 bp,由 114 個胺基酸組成(cod.2);3138821 至 3138333 有一基因,長度為 489 bp,由 163 個 胺基酸組成(cod.3);另外此軟體亦預測在反向序列(在 genome 上為正向)3136749 至3137615 有一長 867 bp 的基因,由 289 個胺基酸組成(cod. 4)。

以Generation Microbial Gene Prediction System 預測,結果與 GeneMark 有兩 完全重複之結果,分別是3137986 至 3137738 ( 83 個胺基酸、cod. 1)、3138821 至3138333 ( 163 個胺基酸、cod. 3),另外在 3136701 至 3137615 處,有一反向 基因,長度為915bp,由 305 個胺基酸組成(cod. 4),此反向基因預測的起始碼 (start codon) 與 GeneMark 的結果稍有出入,但終止碼 (stop codon) 則相同。

(3)以操縱子預測軟體,預測 gspS 上游至下游間 (3163000 至 3133000) 轉錄單位 (transcription unit) 與操縱子 (operon) 存在的狀況

為瞭解 gspS 是單獨存在的基因或屬於某操縱子的一部份,以 SoftBerry FgenesB: Finding operons and genes in microbialgenomes,預測 3163000 (GspS 起 始碼前26456 bp)至 3133000 (GspS 起始碼後 3544 bp) 的序列轉錄單位

(transcription unit) 與操縱子 (operon) 存在的狀況,得知此區域可能含有 20 個轉 錄單位,其中17 個基因是單一轉錄單位,另外三段轉錄單位則構成三組操縱子,

總基因數為31 個。此預測結果和目前已知的基因位置幾乎完全吻合,列出距離 GspS 起始碼較近的 17 個基因於表七。

(4)啟動子 (promoter)、編碼區 (coding region) 與操縱子 (operon) 預測結果分

(4-1)啟動子與編碼區預測之比較

預測所得 TSS 位置分別是 3137728(以 TSS 1 表示) (圖二十一)、3137979 (TSS 2)、3138297 (TSS 3)、3138690 (TSS 4),編碼區分別是 3137986 (以 cod 1 表 示)、3138340 (cod 2)、3138821 (cod 3),cod 1 與 TSS 1 距離 258bp,cod 1 與 TSS 2 距離 7 bp, TSS 3 與 cod1 距離 311 bp,cod 2 與 TSS 3 距離 43 bp,TSS 4 與 cod 2 距離 350 bp,cod 3 與 TSS 4 距離 131 bp。其中 TSS 3 與 cod1 距離、TSS 4 與cod 2 距離皆大於 300 bp,彼此為相互基因所屬的 promoter 與 coding region 可能性較低。

(4-2)編碼區與操縱子預測之比較

預測所得編碼區分別是 3137986 (以 cod 1 表示) (圖二十二)、3138340 (cod 2)、3138821 (cod 3) 以及一反向編碼區 3136701 (cod 4),cod 4 與操縱子預測結 果的第15 個基因(也是反向)位置吻合(對照表七),亦即目前已知的 yghU;

cod 1 與操縱子預測結果的第 14 個基因位置吻合,亦即目前已知的 hybG;cod 2 與操縱子預測結果的第13 個基因位置吻合,亦即目前已知的 hypA;cod 3 與操 縱子預測結果的第12 個基因位置吻合,亦即目前已知的 hybE。

根據操縱子預測結果,gspS 上游為一緊鄰的反向基因 yghU,更上游處是一 操縱子,由九個基因組成,此結果與目前研究所知 (gspS 上游為 yghU,更上游 處是一操縱子,由八個基因組成) 相去不遠。此外 GspS 起始碼 (3136544) 與其 上游距離最近的同向基因hybG 終止碼 (3137738) 距離很遠,是 1194 bp,屬於 同一操縱子的可能性很低。

以上結果顯示 gspS 是一單獨的轉錄單位,且其啟動子位置在上游 1000 bp 以內。

(c)建構 gspS 啟動子區域 (promoter region) 與 lacZ 的融合基因 (fusion gene),

並分析β-galactosidase 活性,以偵測啟動子的強度。

gspS 上游不同長度片段至 GspS 13th amino acid 的序列以 PCR 方式放大,

並在5’ primer 加上 EcoRI 之切點,3’ primer 加上 BamHI 切點。這些片段長度及 位置分別為(圖二十三):(1) 472 bp,包含預測結果中最靠近 GspS 起始碼的兩

個TSS,分別是用 BDGP 程式預測的 TSS 3136880 (距離 GspS 起始碼 336 bp) 及 用Softberry 軟體預測的 TSS 3136739 (距離 GspS 起始碼 195 bp),(2) 687 bp,包 含預測結果中最靠近GspS 起始碼的四個 TSS,分別距離 GspS 起始碼 195 bp (from SoftBerry)、336 bp (from BDGP) 、459 bp (from BDGP)、580 bp (from BDGP and SoftBerry),其中 580 bp 片段 (TSS 3137124) 是兩軟體都有預測到的重複結果,

(3) 895 bp,此片段所包含之 TSS 與前述 687 bp 片段相同,含三個 BDGP 預測的 TSS 和兩個 Softberry 預測的 TSS,本長度的建構是考慮啟動子上游可能有未知 的調控因子 (regulatory element) 存在。

上述片段以PCR 大量複製後,與質體 pRS415 上 lacZ 基因前的 EcoRI 及 BamHI site 接合,得 pRS415-gspS472-lacZ (op)、pRS415-gspS687-lacZ (op)、

pRS415-gspS895-lacZ (op)。將此三質體分別轉殖入 E. coli XL1 blue,抽出質體 後,以酵素EcoRI 及 BamHI 截切並定序,確認片段長度及序列無誤後,送入宿 主SG20250。

SG20250/pRS415-gspS472-lacZ (op)、SG20250/pRS415-gspS687-lacZ (op)、SG20250/pRS415-gspS895-lacZ (op)及 SG20250/pRS415 四株菌,在 37℃下 培養至對數生長期,取樣分析β-galactosidase 活性 (表八)。前三株載體上帶有 gsp-lacZ 轉錄融合基因 (transcriptional fusion,operon fusion;op) 的菌株,其活 性皆大於對照組SG20250/pRS415,且活性約為 2000 至 2299 units。

lacZ 的產物 β-galactosidase 可分解 X-gal 而呈現藍色,本實驗以 λRS45 感 染帶有gspS-lacZ 質體 [pRS415-gspS-lacZ(op)]的菌株,再以 X-gal/LA 培養基進 行藍白篩選,製備溶胞液 (lysate),此時溶胞液中的 λRS45,皆含有不同長度的 gspS-lacZ。接著再用這些溶胞液分別感染宿主 E.coli SG20250,繼之以藍白篩選,

純化出呈現藍色的菌落。

在建構轉錄融合基因 (operon fusion) 的過程中,順利的得到三株溶原菌 (lysogen): HY1001,genotype 為 SG20250/gspS472-lacZ (op);HY1002,genotypeSG20250/gspS687-lacZ (op);HY1003,genotype 為 SG20250/gspS895-lacZ (op)。

將三株菌HY1001、HY1002、HY1003 於 37℃培養至對數生長期,取樣並分 析β-galactosidase 活性 (表八), HY1001 [gspS472-lacZ(op)]的活性是 60 units;

HY1002 [gspS687-lacZ(op)]的活性是 48 units;HY1003 [gspS895-lacZ(op)]的活性 是36 units。

由上述啟動子預測軟體,得知在 gspS 上游可能有 gspS 啟動子存在,加上活 性分析結果,三組質體上的gspS-lacZ 轉錄融合基因,活性都很高,在 2000 units 左右,染色體上的gspS-lacZ 啟動子融合基因,活性也有 50 units 左右。以上結 果顯示gspS 的啟動子位於起始密碼上游 433 bp 之內。

pRS415 與 pRS414 為一組相對應的 plasmids,在 pRS415 中,有一完整報導 基因 (reporter gene) lacZ,包含 lacZ 5 端未轉譯區域 (5’ untranslated region),所 以pRS415 用於建構標的基因與 lacZ 的轉錄融合基因 (transcriptional fusion or operon fusion;op)。pRS414 的報導基因 lacZ 則不含有 5 端未轉譯區域,因此用 於建構標的基因與lacZ 的轉譯融合 (translational fusion or protein fusion;pr)。

在製備pRS415-gspS-lacZ 轉錄融合基因的同時,也建構一組相對應之 pRS414-gspS-lacZ 轉譯融合基因,分別是 pRS414-gspS472-lacZ (pr)、

pRS414-gspS687-lacZ (pr)、pRS414-gspS895-lacZ (pr),並同前述方式,將其轉殖 入宿主SG20250,得三株菌 SG20250/pRS414-gspS472-lacZ (pr)、

SG20250/pRS414-gspS687-lacZ (pr)、SG20250/pRS414-gspS895-lacZ (pr)。

同前述SG20250/gspS-lacZ (op)溶原菌方式,欲建構相對應的

SG20250/gspS-lacZ (pr) 溶原菌,以 λRS45 感染 SG20250/pRS414-gspS895-lacZ (pr)、SG20250/pRS414-gspS687-lacZ (pr)及 SG20250/pRS414-gspS472-lacZ (pr),

結果三組皆無法用藍白篩選獲得藍色溶菌斑。

5.3.2 影響 gspS 表現的因素