1-1 前言
微衛星 (microsatellites) 序列又被稱為簡單重複序列
(Simple Sequence Repeats,SSRs) ,通常由一個到六個鹼基對的基本單元重複片段所組成[1],常分 布於染色體中,分布的範圍包含編碼區 (coding region)、非編碼區 (non-coding
region)、啟動子 (promotor) 和三端非轉譯區 (3’ untranslated region, 3’ UTR) 與 五端非轉譯區 (5’ untranslated region, 5’ UTR) [1],如圖一所示 。三核苷酸重複 (trinucleotide repeats, TNR) 序列是以三個核苷酸為單位的重 複序列,為微衛星重複序列的主要種類之一。TNR 序列的不正常擴張 (expansion) 被認為與許多遺傳性神經疾病有關[2],當重複次數超過特定數量時,可能導致神 經退化性疾病[3]。且當基因遺傳至子代時,有可能進一步擴張,使重複序列更加 增長,導致發病 (onset) 年齡更早甚至更嚴重[2,4,5]。
圖 一、不同重複序列導致的疾病與其在基因的位置。摘錄自參考資料 [1]。
不同的遺傳性神經疾病有其對應的重複序列,正常個體與發病個體的序列重 複次數也各不相同,如圖二所示[5]。而本篇研究的目標為引發 X 染色體脆折症 (Fragile X syndrome) 的 CGG 重複序列。
圖 二、各種遺傳性神經疾病與其對應重複序列,藍色為正常的重複次數範圍,紅色為發病的重 複次數範圍。摘錄自參考資料[5]
1-2 X 染色體脆折症
X 染色體脆折症是一種常見的性聯遺傳性神經性疾病,僅次於唐氏症 (Down syndrome) 為造成智能障礙的第二大原因。致病的主因與 FMR1 (Fragile X Mental Retardation 1) 基因中五端非轉譯區的 CGG 重複次數異常擴張有關[3]。
在 1969 年 Herbert Lubs 透過標記 X 染色體,在 X 染色體下端觀察到一 個脆折的特徵,證明了與 X 染色體有關[6],直到 1991 年,Verkerk 及其同事鑑 定了 X 染色體上 FMR1 基因與 X 染色體脆折症關係,建立了整個疾病的分子 基礎[7]。
一般正常女性的染色體為 XX,若只有一個 X 染色體為異常,可以在另一 個正常的 X 染色體的保護下變成帶因者;而一般男性則為 XY,缺乏另一正常 X 染色體保護而顯現症狀。這也就說明了女性帶因率高,但症狀卻在男性身上出 現機率較高[3]。
圖 三、正常個體、準突變個體、全突變個體在 FMR1 的 5'-UTR 的 CGG 重複次數,以及轉 譯後的基因產物。摘錄自參考資料 [8]。
FMR1 基因在正常個體中 CGG 序列重複次數通常低於 54,並會穩定地傳
給子代;若重複次數在 55~200 之間,則為準突變 (pre-mutation) 狀態,個體本身 通常無任何症狀,但若此基因經由女性傳給下一代時,可能造成 CGG 重複序列 進一步擴增,而達到全突變 (full- mutation) 狀態,此時 CGG 序列重複次數大 於200,而個體具有上述症狀,如圖三[3,8,9]。1-2.1 X 染色體脆折症致病原因
病患的 FMR1 基因中除了發現有大量的 CGG 序列片段外,也發現其 X 染 色 體 Xq27.3 位 置 的 CpG 位 點 (CpG sites) 如 圖 四 , 有 過 甲 基 化 (Hypermethylated) 的現象[9,10]。CpG 位點指 DNA 某個區域鹼基序列以胞嘧啶 (cytosine) 連接鳥嘌呤 (guanine),CpG 位點上的胞嘧啶可以被甲基化成 5’-甲基 胞嘧啶 (methylated cytosine) ,如圖五所示[10]。
圖 四、FMR1 位於人類 X 染色體中 Xq27.3 位置示意圖。鍵頭指的位置是 Xq27.3。摘錄自參 考資料 [9]
圖 五、DNA 甲基化示意圖。左邊是胞嘧啶,右邊是甲基化後的胞嘧啶,摘錄自參考資料[11]
組蛋白 (Histone) 為真核生物中的核內蛋白,與 DNA 纏繞組成核小體,是 真核生物染色質的基本單位。在正常情況下,未甲基化的 DNA 能自行與轉錄因 子 (Transcription factor) 結合,但 DNA 甲基化後被甲基結合蛋白 (methyl-CpG-binding domain proteins, MBD, 圖六綠色部分)和 DNA 甲基化轉移酶 (DNA methyl transferases, 圖六橙色部分)辨識並附著,使更多蛋白質附著在基因座 (locus),像是組蛋白脫乙醯酶 (Histone deacetylases, HDACs)、組蛋白甲基轉移酶 (Histone methyl transferases, HMTs),形成緊密的染色質,使得轉錄因子難以與 DNA 結合,進一步抑制基因表達[12]。
圖 六、DNA 甲基化影響 DNA 轉錄示意圖。摘錄自參考資料[12]
由於 CGG 重複序列的異常擴張,導致 FMR1 基因啟動子中的甲基化區域 過多,而在 FMR1 基因受影響的區域會使腦部無法正常生成 FMRP (Fragile X Mental Retardation 1 fusion protein) 基因產物,進而影響智力的發展[10]。
1-3 DNA 重複序列的擴張
CGG 重複序列在擴張所引起染色體脆折症的成因已有相當程度的了解[7],
但在 DNA 層級如何引起序列擴張的機制仍不清楚[13]。Mirkin 提出在複製 (replication)、修復 (repair) 或重組 (recombination) 過程中,因為二級結構的形成 而可能造成擴張的機制[14],簡述如下:
圖 八、DNA 不正常複製示意圖。二級結構分別在領先股與延遲股上,造成 DNA 複製的擴張 或縮短 摘錄自參考資料[14]
DNA 重組與修復亦會導致序列擴張,核苷酸序列在損傷時,引發同源重組 (Homologous recombination)、錯配修復 (Mismatch repair) 等修復機制來修復已損 傷的 DNA,同源重組修復期間的錯位如圖九 (A);或在雙鏈斷裂修復過程中產 生滑動 (slippage),如圖九 (B),都可能導致重複序列擴張[16]。
圖 九、(A) 同源重組錯位導致的擴張事件(左) 收縮事件(右)。(B) 雙鏈斷裂修復過程滑動導致 的擴張事件 (左),或重複序列單元的缺失導致收縮事件 (右)。摘錄自參考資料[16]。
1-4 CGG 重複序列已知的二級結構
式與重複次數為奇數或偶數有關。Kazuhiko Nakatani 團隊透過聚丙烯醯胺膠體 電泳 (Polyacrylamide gel electrophoresis) 與圓二色性光譜 (Circular dichroism spectroscopy) 確認了 CGG 髮夾型結構的存在[17]。 Mergny 團隊也透過溫度-紫外光吸收光譜 (Temperature UV-absorbance spectrum) 發現 CGG 重複序列的 構型並非 G –四聯體,更加確立了 CGG 重複序列應是髮夾型結構[20]。1-4-2 鳥嘌呤四聯體
鳥嘌呤四聯體由富含鳥嘌呤的 DNA 序列所組成,在特定的離子條件下,以 四個鳥嘌呤為單位,彼此以 Hoogsteen 氫鍵配對形成鳥嘌呤四分體 (G-quartet),
再以多層的鳥嘌呤四分體堆疊成鳥嘌呤四聯體。層與層中間通常會有陽離子以減 少鳥嘌呤之間的靜電排斥力而穩定。可依四股的方向分成平行 (parallel)、反平行 (antiparallel) 以及混合型 (hybrid) ,如圖十一[21]。
圖 十一、鳥嘌呤四聯體結構以及常見的折疊方式示意圖。摘錄自參考資料[21]
2004 年時 Michaela 團隊透過圓二色性光譜與膠體電泳研究 CGG 重複序 列,當重複次數小於7 時,在加入 2M 鉀離子溶液加熱至 90℃,等待五分鐘後 緩慢降溫至隔夜,CGG 重複序列會形成分子間的 (intermolecular) 鳥嘌呤四聯體 [18]。隨後該研究團隊在 2008 年時,重複次數大於 7 的 CGG 重複序列在 2mM 的鉀離子條件下加入乙醇,也能夠折疊成鳥嘌呤四聯體[22]。雖然這些研究中鳥 嘌呤四聯體的形成並非在生理 (physiological) 條件下,但也不能排除此一結構在 生理條件下少量存在的可能。
1-5 AGG 插入對於 CGG 重複序列的影響
正常人類的 FMR1 基因中,每 8 到 11 個 CGG 重複序列,存在著 AGG 序 列的中斷,在具有 AGG 插入的 CGG 重複序列並不會致病,並且穩定不會被不 正常擴張[23]。AGG 序列的插入可能改變了原本序列的穩定性,使 CGG 重複 序列形成不同的構型[23,24],便是本篇想要探討的重點。
Sarah Delaney 團隊在 2010 年時,對於 (CGG)19 與 (CGG)39 進行構型分析,
發現在插入1 個 AGG 序列的情況下,DNA 仍維持一般髮夾型結構,如圖十二 (A)所示;但在插入 2 個 AGG 序列時,有可能形成兩個環的髮夾型結構,如圖 十二 (B)(C)所示,但他們無法判斷何者為主要構型[25]。
圖 十二、(A) 為 (CGG)19 在插入 1 個 AGG 序列可能形成的構型。(B)(C) 為 (CGG)19 在插 入2 個 AGG 序列可能形成的構型。摘錄自參考資料[25]
Michaela 團隊則對於 AGG 插入 CGG 重複序列形成鳥嘌呤四聯體的影響 進行了研究,在序列長度較短的情況下,AGG 序列是有助於形成四聯體的;隨 著序列長度越長,鳥嘌呤四聯體就越難生成。在加入其他誘導劑如:乙醇,使其 形成 G-四聯體,插入 AGG 的序列也是相對穩定的[22]。
1-6 重複序列髮夾型結構的動態滑動及其擴張的關係
在本實驗團隊先前發表的結果中,分別對於 TGGAA 重複序列[26],如圖十 三 (A), 與 CTG 重複序列[4],如圖十三(B),提出了滑動動態擴張 (dynamic slippage expansion) 的模型:若 DNA 在複製、修復、重組的過程中,新增一組重 複序列,形成突出型髮夾型結構,將不利於進行進一步的擴張。但此時序列可藉 由滑動進行動態結構重組,使其形成有利於近一步的擴張的對齊型髮夾結構,在 此情況下多次循環將連續擴張成更長序列[4,26]。藉著 AGG 序列的插入對於 CGG 重複序列構型上的變化,找出 AGG 序列在 CGG 重複序列擴張機制中造 成的影響。
圖 十三、(A) TGGAA 重複序列擴張示意圖。摘錄自參考資料[26]。(B) CTG 重複序列擴張示 意圖。摘錄自參考資料 [4]
1-7 研究動機
已知 X 染色體脆折症與 CGG 三重複序列的擴張有關,在研究擴張機制中,
二級結構及其動態滑動尤其重要。CGG 三重複核苷酸序列主要有髮夾型結構與 G-四聯體兩種構型。AGG 序列插入對於 CGG 重複序列構型的影響是本篇探討 的重點,過去只粗略知道 AGG 序列的插入使得 CGG 重複序列有機會形成其 他構型,但無論是存在1 個環以上的髮夾型結構,亦或是有機會形成 G-四聯體,
過去難以解析超過一種的情況,構型之間的比例與動態更無法得知。
本 篇 論 文 透 過 單 分 子 螢 光 共 振 轉 移 能 量(Single-molecule Fluorescence Resonance Energy Transfer) 光譜,配合圓二色性光譜輔助,對於 CGG 重複序列 與插入 AGG 的 CGG 重複序列作一系列的測量,分析其主要構型,及是否能在 一般生理條件鹽類濃度下,產生一定比例的 G-四聯體,更想透過時間解析來判 斷是否有滑動現象,或是構型之間的轉換。藉以瞭解 AGG 序列插入在結構與結 構動態學上對避免造成 X 染色體脆折症上所扮演的角色。