第一章、緒論
1-1 前言
現今許多遺傳疾病被發現是與三核苷酸的擴張有關,在正常人的體內中,
也可以發現這些三核苷酸重複序列,並且這些序列皆會保持在一定的數目,一 旦這些三核苷酸重複序列擴張到某一定的程度,就會產生遺傳疾病[1],如表格 1 所示。現今臨床上最有名的例子為亨丁頓舞蹈症 (Huntington Disease) ,其對 應到的序列是由於位在人類第四對染色體上的編碼區出現 CAG 重複序列。在 正常人體內,CAG 重複序列的次數少於 26;當 CAG 重複次數超過 37 以上時 就會發病;在第 19 對染色體上的 DMPK 基因也有相似的情況,在這段基因中 可以找到 CTG 重複序列,而其對應到的疾病為強直性肌肉失養症(Myotonic dystrophy)。
表格 1、三重複序列與其對應到的疾病,摘錄自[1]。
2
在人體的 FMR1 基因也存在著相似的序列(如圖 1),在此基因上可以發現 CGG/CCG 重複序列。在正常人的體內中,CGG/CCG 三核苷酸的重複次數落在 5 至 44 間,在此重複次數下,序列會穩定的遺傳至子代;序列擴張至 60 到 200 之 間,則稱為前突變 (permutation) 。在這個狀態下,雖然個體不會產生疾病,但 是序列會發生不穩定的現象並且會遺傳至子代。一旦在個體內的序列超過 200 時,
就會產生 X 染色體易碎症 (Fragile X Syndrome),簡稱為 FXS[5]。
圖 1、人類 X 染色體示意圖。鍵頭所指的位置是 Xq27.3,為 FMR1 所處的位置,摘錄自[5]。
對於遺傳疾病的研究,序列的擴張就顯得十分重要。DNA 的擴張,可以用以 下理論作解釋。在 DNA 複製過程中,DNA 解螺旋酶會先解開一般的雙股螺旋結 構;這個時候,就會形成複製叉 (replication fork) 的結構,如圖 2 所示[4]。
圖 2、複製叉(replication fork)示意圖,正六邊形為 DNA 解螺旋酶、橢圓為 DNA 聚合酶,摘錄 自[4]。
3
4
圖 4、DNA 不正常複製之示意圖。DNA 複製過程中,因分別在領先股以及延遲股產生二級結 構,而造成不正常的擴張或縮短,摘錄自[3]。
隨著科學家針對 DNA 構型的深入研究,發現 DNA 除了典型的雙股螺旋外,
也會產生二級結構[3],如圖 5 所示。以(CNG)n為例 (N = A, T, C, G) ,在先前的 研究中,(CTG)n與(CAG)n會折疊成類似髮夾型的二級結構。有趣的是(CTG)n的 類髮夾型結構間會有滑動的現象,而目前認為這樣的滑動現象是造成序列擴張的 一個關鍵因素[2][4]。因此,研究 CGG/CCG 三核苷酸序列的擴張原因,可以從 探討此三核苷酸序列會折疊成的二級結構開始。
圖 5、連續 DNA 可能形成之二級結構示意圖,摘錄自[1]。
5
6
在 1977 年 Sutherland 對於 X 染色體的易碎做了更進一步的分析,他的研究 報告指出,在缺乏葉酸以及胸腺嘧啶的條件下培養,可以使這種 X 染色體易碎 的現象表達出來[11]。在 1985 年,Pembrey、Winter 以及 Davies 等人發現患者的 親代基因雖然有影響,但外表卻不會有任何的異常,染色體方面也沒有碎裂的情 況發生,這也顯示親代與子代間的差異[13]。經過多年的研究,才確認其主要病 是因為在 FMR1 基因的 5’端非轉譯區出現大量的 CGG 重複序列;然而基因圖譜 研究中,在正常人的體內中,CGG 重複序列除了在穩定的重複次數下;也可以 發現 CGG 重複序列中會被 AGG 所打斷。大約每 9 至 10 個 CGG,就會出現一 個 AGG。因此在正常人的體內中,(CGG)9AGG(CGG)9AGG...可以輕易的在 FMR1 的 5’端非轉譯區中發現[5]。因此 AGG 的插入對於結構及其動態有何影響 是我們極欲想了解的。
7
1-3 致病原因
在 1991 年 FMR1 的基因 Verkerk AJ 團隊轉殖出來。他們除了發現有大量重複 CGG 片段外,也發現病患 X 染色體 Xq27.3 位置的 CpG 島,如圖 7 所示。有過 甲基化的現象 (hypermethylation) [12]。甲基化係指 DNA 上的胞嘧啶 (cytosine) 會經過甲基轉移酶修飾,增加一個甲基,如圖 8 所示。甲基化為生物體中一種調 控基因表現的一種模式,經過甲基化的基因會變得不活化 (deactivation) ,抑制 基因的表達。
圖 7、 CpG 島示意圖。CpG 島是指 DNA 上的區域,此區域含有大量相鄰的胞嘧啶以及鳥嘌呤,
兩者間以磷酸酯鍵相連,如圖中灰色區塊。大量通常是 50%以上,不同種的生物比例會有所不 同,摘錄自[49]。
圖 8、DNA 甲基化示意圖。左邊為胞嘧啶(cytosine),右邊為經甲基 化的胞嘧啶(methylated cytosine) ,摘錄自[42]。
8 蛋白修飾 (histone modification) [19]。組蛋白為一種存在於真核生物中的一種蛋 白,其功能為包裝以及組織 DNA,DNA 與組蛋白的結合體稱為核小體。核小體 對於基因的表現扮演著重要的角色。組蛋白可以藉由組蛋白乙醯轉移酶 (histone acetyltransferase, HAT) 進行乙醯化,乙醯化的後的組蛋白,會使得 DNA 纏繞變 得鬆散,使得轉錄因子可以能夠與 DNA 結合,促進基因表現;經乙醯化的組蛋 白也可以經過組蛋白去乙醯轉移酶(histone deacetylase) 去乙醯化,以抑制基因表 達[20],如圖 9 所示。這樣一系列的影響,就會讓 FMR1 的啟動子不易進行轉錄 作用,使得患者體內失去基因產物,進而發生疾病[19]。
圖 9、組蛋白乙醯化以及去乙醯化示意圖。黃色柱體為組蛋白;白色線條為 DNA 序列;HDAC 為組蛋白去乙醯化轉移酶;HAT 為組蛋白乙醯化轉移 酶,摘錄自[20]。
9
1-4 已解出的 CGG/CCG 之二級結構
有關於 CGG 三核苷酸重複序列的構型,一直以來都存在著爭議。不過總體 而言可以分為兩派說法。一派的人認為,CGG 結構應該與 CNG (N 可以為 A、
T、C、G) 結構相同。會折成髮夾型結構[16]。但由於 CGG 重複序列富含鳥嘌 呤 (guanine) ,因此也有人認為鳥嘌呤四聯體 (G-quadruplex) 也是一種 CGG 可 能會形成的二級結構[21],詳見 1-4.2。
第二,從紫外-可見光吸收光譜 (UV/Vis absorbance spectroscopy) 發現 CGG 的結 構與鳥嘌呤四聯體有相當大的差異。他們表示,CGG 序列的結構應該為髮夾型 結構[24]。
圖 10、髮夾型結構示意圖,摘錄自[44]。
10
2010 年,Sarah Delaney 團隊利用膠體電泳 (Gel electrophoresis) 與硫酸二 甲酯分析 (dimethyl sulfate footprinting) 分析 d(CGG)19以及 d(CGG)39的構型。
實驗結果顯示,這兩條序列皆會折疊成髮夾型結構;插入 AGG 的 CGG 序列,
則有可能形成有兩個環 (loop) 的特殊髮夾型結構,如圖 11 所示[23]。
圖 11、Delaney 團隊之研究成示意圖。(A)(B)d(CGG)19之構型(C)插 AGG 的 CGG 序列所產生的 特殊髮夾型結構,摘錄自[23]。
11
1-4.2 鳥嘌呤四聚體
鳥嘌呤四聯體為一種富含鳥嘌呤的 DNA 序列在特定的離子條件下才會發生 的二級結構,並以四個鳥嘌呤為單位形成 G-quartet,數個 G-quartet 堆積起來就 會形成鳥嘌呤四聯體,如圖 12 所示。不同於典型的雙股螺旋結構,鹼基對以 Watson-Crick 鍵結模式鍵結。鳥嘌呤四聯體上的鳥嘌呤是以 Hoogsteen 的鍵結模 式並且在平面的中心存在著陽離子,可以分散鳥嘌呤上的靜電力,減少負電的排 斥力。目前也被證實,鉀離子對於穩定鳥嘌呤四聚體結構有相當好的效果[17]。
圖 12、鳥嘌呤四聚體結構示意圖。左圖為四個鳥嘌呤經由Hoogsteen氫鍵所形成的G-quartet,
中心具有陽離子穩定結構。右圖為 G-quartet 堆積而成的鳥嘌呤四聚體結構,摘錄自[43]。
12
1995 年,Usdin 團隊以膠體電泳 (Gel electrophoresis) 與硫酸二甲酯分析 (dimethyl sulfate footprinting) 分析 d(CGG)20在不同離子條件下的構型。實驗結果 顯示 d(CGG)20在鉀離子的條件下會形成特殊的結構,並且會阻礙體外的 DNA 合 成;而在其他的鈉離子以及銨離子的條件下不會阻礙 DNA 合成。利用硫酸二甲 酯分析,更進一步的推測,在鉀離子的條件下會形成鳥嘌呤四聚體的結構;在其 他離子條件則會形成類似頭對頭的髮夾型結構,如圖 13 所示 ,但他們也無法判 斷出何者為主要構型[18]。
圖 13、Usdin 團隊所解出(CGG)20的構型。(A)髮夾型結構(B)鳥嘌呤四股結構,摘錄自 [18]。
13
2009 年,Michaela Vol 團隊利用圓二色光譜測定 CGG 重複序列的構型。他 們發現,隨著序列的延長,鳥嘌呤四聯體的特性就越不顯著,這也與其他先前的 研究相吻合[25]。但是在短序列中 (重複次數為 4 以及 8) ,可以在高鉀離子的濃 度下誘導出鳥嘌呤四聚體。而插入 AGG 的 CGG 序列,在相同的條件下,也可 以擁有相同的結果,其實驗結果如圖 14 所示[21]。
圖 14、Michaela 團隊以圓二色光譜觀測 CGG 序列以及插入 AGG 之 CGG 序列的構型。(A)插入 AGG 之 CGG 序列(B)CGG 序列,兩者皆會形成平行結構的鳥嘌呤四聚體。
14
1-5 研究動機
染色體為一種遺傳性疾病,其病因為 CGG 的不正常擴張。在 DNA 的擴張 理論中,二級結構及其動態滑動扮演著重要的角色[26]。但是由於序列擴張所造 成的遺傳疾病沒有一個有效的治療方式[3]。因此若能了解出其 DNA 構型,對於 CGG 擴張的模式會有相當大的幫助。在人體中常被發現的插入 AGG 的 CGG 序 列來說,也沒有文獻清楚地指出 AGG 對於一般 CGG 序列的影響。
由先前的研究可以得知 CGG 三重複序列雖然在不同條件下,構型會有所不 同。大部分的文獻指出,CGG 的二級結構以髮夾型結構以及鳥嘌呤四聚體為主。
但是以往的測量方法皆屬於巨觀的觀測結果,且 CGG 重複序列可能因同時具有 不同構型狀態而不容易解析。因此,此研究以單分子螢光光譜去測定 CGG 以及 插入 AGG 的 CGG 序列的構型及其動態,進行對 CGG 序列長度與 AGG 插入頻 率做一系統性的研究,以找出 AGG 對於此擴張序列之影響。
15 振能量轉移 (single-molecule fluorescence resonance energy transfer, smFRET) 搭 配全內反射顯微鏡去研究 CGG 三重複序列的構型。