第一章 研究背景與動機
第三節 結構變異的類型
綜合以上所述,人類基因組的結構變異,小至單一個鹼基,大至幾個 Megabase、甚至是整條染色體,主要包含以下數種形式(3, 13):
1. 單一核苷酸的變化:
即點突變或單一核苷酸多型性(SNPs)。可能起源於複製失誤、DNA 修復
機制失效,或環境因素誘發核苷酸發生置換或改變。而視核苷酸發生的 位置是否位於基因功能區、表現調節區,或是否影響編碼所對應的胺基 酸,決定著其對表型的影響程度。
2. 倒位(Inversions):
倒位的發生為單一染色體發生斷裂,再由期間兩片段反轉而重新組成;
或是某個 DNA 單股上、序列方向相反的相似性序列的不正常配對、重 組,也可能導致倒位的發生。倒位一般認為並不會引起帶原者的不正常 表現型,因為其為平衡重組(Balanced Rearrangement),但會產生不正常 的配子,而產生基因組不平衡的子代。然而,若倒位發生於基因表現區,
則可能破壞基因結構而引起疾病,例如:近一半的 A 型血友病是由於倒 位的發生破壞了基因的結構而致病。
早期,倒位的鑑別僅能藉由顯微鏡下辨識染色體帶數(Band)的順序改變 來達成,因為染色體組型分析方法(Karyotyping)的解析度不夠,故對這 一類結構變異的瞭解十分有限,直到定序方法及原位螢光雜交技術發展 以後,才瞭解基因組裡存在更小的倒位變異。一篇研究基因組細微結構 變 異 的 文 獻 (14) 顯 示 , 基 因 組 裡 有 許 多 倒 位 多 型 性 (Polymorphic Inversions),大小約介於 5 Kb 到 1.9 個 Mb,值得注意的是,這些倒位所 發生的斷裂點有四分之三存在於片段性重複序列(Segmental Duplication) 的位置,這說明了這些倒位的發生可能是由於染色體側端重複性結構 (Flanking Repeat Structure)的重組所造成的。另外,許多倒位的發生位置 經常伴隨著基因物質的增加或減少,這篇文獻首先提出倒位也可能是基 因組不平衡的結構變異。
3. 易位(Translocations):
為兩染色體片段之交換,通常發生於非同源染色體之間,又分為相互易 位(Reciprocal Translocation)及專發生於 Acrocentric Chromosome 中心粒
組,因此有染色體易位者本身並不會有異常表型,但有較高產生不正常 配子及不平衡子代的危險性。和倒位一樣,易位發生時,若染色體斷裂 的位置為基因的表現區,則會破壞基因的結構或於重整後產生一個融合 的新基因,因此而引起疾病。例如:著名的費城染色體即為第 9 對染色 體與第 22 對染色體發生易位(Translocation),使得第 22 對染色體上產生 一個異常的融合基因 (BCR-ABL),因而引發慢性骨髓性白血病。
4. 插入(Insertions)、缺失(Deletions):
插入或缺失可能代表遺傳物質的增加或減少,插入或缺失的發生可能只 是單純的某 DNA 片段或數個鹼基對插入或缺損於基因組中的某個位 置;也可能是基因組中高相似性或完全相同的 DNA 序列,在有絲分裂 或減數分裂的過程中發生了重組,這種不對等的互換(Unequal Crossing over)的機轉可以發生在同一條染色體、同源染色體之間(Intrachromosome) 或 非 同 源 染 色 體 之 間 (Interchromatid Non-allelic Homologous Recombination),例如:α 地中海型貧血其 α 血球蛋白基因的缺損,及 X 染色體上紅綠視力色素基因的數目變異,都是由於不對等互換的機轉 所造成的。另外,還有一種罕見的機轉,是某些重複性序列可以藉由反 轉位的過程而造成結構變異,亦即將 RNA 反轉錄成 DNA,再把自己插 入基因組中的不同位置。例如:在少數的 A 型血友病患者身上,其致病 的原因為 L1 家族重複序列被插入在第 VIII 凝血因子其基因的表現序列 中,因此干擾了序列使基因不活化。當然,插入或缺失的發生並不一定 會引起疾病,目前應用解析度日益提升的全基因組(Genome-Wide)分析方 法,使得基因組裡插入與缺失發生的位置、範圍,與臨床表現的關係,
有了更全面、更進一步的瞭解。
5. 串連重複性序列(Tandem Repeats):
基因組裡有許多位置是由許多相同的核苷酸小單元連續排列而成的重複 性片段,有的聚集在某個或少數幾個基因座,有的則如單次出現的 DNA
序列一樣分散在整個基因組中,其構成了 10~15%的基因組(1),依照這 些串聯性重複片斷的大小差異,可將其區分為衛星(Satellite)、小衛星 (Minisatellite)及微衛星(Microsatellite)DNA。衛星 DNA 的小單元由 100 個以上的核苷酸組成,主要叢聚在染色體的著絲點或端粒區,一般認為 其扮演著維持染色體結構的角色,確保有絲分裂及減數分裂過程中染色 體的適當分離。小衛星 DNA 由 10 至 70 個核苷酸組成,微衛星 DNA 則 含有 1 至 6 個核苷酸,小衛星及微衛星兩種重複性片段遍佈於基因組中。
微衛星 DNA 依據其核苷酸組成的特性,又可細分為 3 種類型。第ㄧ種 是完整型,序列中的核苷酸完全由重複性小單元頭尾連接所組成。第二 種是間斷型,重複性小單元的序列中有核苷酸發生置換、刪除或嵌入的 情形。第三種是複合型,序列中的核苷酸由兩種以上重複性小單元組成。
其遺傳過程遵循孟德爾定律,在同源等位基因上,個體間主要的差異在 於小單元的重複次數,因此這類串聯性片段的多型性,廣泛的被應用於 連鎖分析、親子鑑定及刑事鑑定上。
這一類的重複性序列,雖然有許多並沒有轉錄活性,但其存在著大量的 劑量變異,會使得其存在的位置容易發生非對偶基因同源重組(Non- Allele Homologous Rearrangement),而重複序列間的異常重組可能造成 DNA 序列的插入、缺失、重複或倒位,因此是一些遺傳疾病產生突變的 原因。例如杭丁頓氏舞蹈症,主要與位於 DNA 轉譯區的微衛星 DNA-
-(CAG) n 的重複次數倍增有關,轉譯結果多出一段麩醯胺酸蛋白,而 造成一種神經退化性疾病。易脆X染色體症候群、肌強直型進行性萎縮 症,則是在不轉譯區中三核苷酸重複序列不穩定地倍增,導致智能障礙 或肌肉萎縮等遺傳疾病。
6. 片段重複性序列(Segmental Duplication or Low Copy Repeat):
重複性片段又稱為低度重複序列,其散佈於基因組中,大小介於 1
分佈的位置,可大略區分成兩種類型,某些片段在同一染色體裡的多個 位置重複散佈,稱為 Intrachromosomal Duplication;其他則散佈在非同源 染色體裡,稱為 Inter-或 Transchromosomal Duplication。片斷重複性序列 傾向聚集於基因組中著絲粒與端粒等區域,和前述的串聯性重複序列一 樣,重複性片斷的位置亦為基因組裡結構較不穩定的熱門區域(Hot Spot),容易促使染色體的非對偶同源性重組,造成遺傳物質的缺失、插 入或複製,而引起遺傳性疾病。而這些片段的長度、序列的相似性、排 列順序及重複性片段之間的距離,都是影響染色體不對稱配對發生頻率 的因素。當不對稱配對發生在同源染色體、排列順序相同的重複性片段 間時,會導致遺傳物質交互的增加或減少;但當不對稱配對發生在排列 順序相反的重複片段間時,則會導致倒位(Inversion)的發生。大部分引起 已知遺傳疾病的重複性片段都很大,約介於 10~400 Kb 之間,且其序列 有超過 96%的相似性。例如最常見的微缺失疾病,Digeorge Syndrome,
其重複序列的涵蓋區域約 300Kb 大小,且該區域的序列有 99.7%的相似 性。
然而,有愈來愈多的證據顯示,基因組裡重複性的片斷亦有可能為正常 的變異,除了重複性片段本身在不同的個體間即有數目變化的特性外,
其藉由 NAHR 的機制所構成的多型性,廣泛分佈於正常健康族群,故亦 屬於基因組劑量變異(Copy Number Variation)的一部份。
7. 基因組劑量變異(Copy Number Variations):
基因組劑量變異(Copy-Number Variant, CNV)也稱基因基因組劑量多型 性(Copy-Number Polymorphism, CNP),是一種大小介於 1Kb 至幾個 Mb 的 DNA 片段變異,因此包含前述的重複性序列以及插入、缺失,根據 文獻,至少 10-20%的基因活性遺傳變異是由 CNV 引起的(16),基因組 劑量變化可以透過破壞基因編碼蛋白的活性區域,改變基因的表現
“量";或者破壞控制基因活性的調節區域,影響基因活性。由於其在
人類基因組中廣泛分佈,覆蓋的核苷酸總數遠超過單核苷酸多型性 (Single Nucleotide Polymorphisms, SNPs)的總數,極大地豐富了基因組遺 傳變異的多樣性。基因組劑量變異對於物種特異性、基因組組成、物種 的演化和系統發育,以及基因組某些特定區域的基因表達和調控,可能 具有非常重要的生物學意義。
8. 其他:
除了上述的變異類型外,基因組的結構變異尚包含了於正常染色體數量 外、額外多出的標記染色體(Marker Chromosome);因染色體兩處斷裂後 又重新連結成環形構造的環狀染色體;一染色體在著絲粒的兩側有相同 的長臂或短臂的等臂染色體(Isochromosome);兩染色體分別發生斷裂後 兩者互相連結所形成的雙著絲粒染色體(Dicentric Chromosome);以及一 雙 倍 體 (Diploid) 的 個 體 其 某 一 同 源 染 色 體 皆 來 自 單 一 親 方 染 色 體 (Uniparental Disomy)等等。
第四節 基因組劑量變異形成的機制
承上段的敘述,CNV 通常發生在包含或兩側夾有大片段同源性序列、或片 段重複序列的位置。這些同源性序列或重複性序列會藉由非等位基因同源重組 (Non-Allelic Homologous Hecombination, NAHR)的機制,使重複序列間錯誤配 對,引發不同的染色體重組,造成期間序列(Intervening Sequence)產生基因組劑 量的變化。非等位基因同源重組會造成大片段的結構多型性,或直接導致基因組 不平衡或早發型、高度遺傳的疾病。
然而,非等位基因同源重組並不能解釋所有的 CNV,部分也許是由一些非 同源性重組的突變機制所造成的 (5)。如,某些 CNV 被發現與非 β 的 DNA 結 構有關(與標準的右旋 β-Helix 結構不同,包含左旋的 Z DNA 及 Cruciform),這 些結構被認為會促進染色體重組,理論上會促進某些 CNV 的產生與存在。(5)
再者,非同源性末端連結修復的機制(Non-Homologous End-Joining Repair) (14, 22, 5),為真核生物修復雙股 DNA 斷裂的一種機制,有時雙股 DNA 斷裂並不會以 同源性序列為模板進行修復,而是經由一連串酵素的作用,直接將斷裂的末端連
再者,非同源性末端連結修復的機制(Non-Homologous End-Joining Repair) (14, 22, 5),為真核生物修復雙股 DNA 斷裂的一種機制,有時雙股 DNA 斷裂並不會以 同源性序列為模板進行修復,而是經由一連串酵素的作用,直接將斷裂的末端連