第四章、 資料模擬
第一節、 模擬 F 2 子代資料
本研究首先利用電腦程式模擬產生三組
n
個個體的F
2子代資料,分別用於 討論三種不同資料型態之數量性狀觀測值(表型值)的情況: 第○1 組,常態分 布性狀值資料,n=250
; 第○2 組,二項分布性狀值資料,n=500
; 第○3 組,卜 瓦松分布性狀值資料,n=500
。由於二項分布或卜瓦松分布表型值資料是先模擬 出常態分布性狀值再做適當的轉換(詳細轉換方式請見本節第二階段:5.
),因 轉換過程可能會損失一些訊息,故在此模擬產生較多的F
2子代個體資料。每個 個體分別紀錄一個數量性狀y
及36
個遺傳標識,標識代號A(qq)
及B(QQ)
分別 為同質的親本基因型,標識代號H(Qq)
為異質的雜交組合型,這36
個遺傳標識 分別屬於6
條染色體(6
個連鎖群),每條染色體的長度為100cM
並各具有6
個 遺傳標識,遺傳標識間之距離為20cM
,第一條染色體之遺傳標識為1~6
,第二 條染色體之遺傳標識為7~12
,其餘類推;第一至第五條染色體各含有一個QTL
, 分別位於自左端算起第70
、49
、27
、8
、30 cM
處,第六條染色體則不具有QTL
(如圖
4.1
)。Chromosome 1
QTL
Marker 1 Marker 2 Marker 3 Marker 4 Marker 5 Marker 6
0 20 40 60 80 100 cM
Chromosome 2
Marker 7 Marker 8 Marker 9 Marker 10 Marker 11 Marker12
0 20 40 60 80 100 cM
Chromosome 3
Marker 13 Marker 14 Marker 15 Marker 16 Marker 17 Marker 18
0 20 40 60 80 100 cM
Chromosome 4
Marker 19 Marker 20 Marker 21 Marker 22 Marker 23 Marker 24
0 20 40 60 80 100 cM
Chromosome 5
QTL
Marker 25 Marker 26 Marker 27 Marker 28 Marker 29 Marker 30
0 20 40 60 80 100 cM
Chromosome 6
Marker 31 Marker 32 Marker 33 Marker 34 Marker 35 Marker 36
0 20 40 60 80 100 cM
QTL
70
QTL
49
27
QTL
8
30
第○1 組,常態分布性狀值資料所設定的五個
QTL
累加性效應分別為1.5
、第一階段:模擬產生各標識因子之基因型
r 為兩標識因子之間的互換率(recombination frequency)。
3.
根據Haldane
互換率公式(Bailey, 1961)
:( ( ) )
First marker genotype Second marker genotype
p2 < p11
A(qq)
p11 ≦p2 < p12
A(qq) H(Qq)
p2 > p12
B(QQ)
p2 < p21
A(qq)
p21 ≦p2 < p22
H(Qq) H(Qq)
p2 > p22
B(QQ)
p2 < p31
A(qq)
p31 ≦p2 < p32
B(QQ) H(Qq)
p2 > p32
B(QQ)
圖
4.2 決定第二個標識因子基因型之流程圖
4.
根據標識因子之間的距離,可類推求出前一個標識因子和同染色體上的下一 個標識因子之間的互換率,再依同樣的方法定出同一條染色體上每一個標識 因子的基因型。5.
依相同步驟模擬第二條到第六條染色體上各標識因子之基因型。▅
第二階段:模擬產生各染色體的性狀值
先假設各組資料之性狀值皆服從常態分布,模擬產生連續型的數量性狀表型 值資料,再依各組所欲模擬得到的觀測值(數量性狀表型值)資料型態,將連續 型的數量性狀表型值適當的轉換成二項分布(第○2 組)或卜瓦松分布類型的資料
(第○3 組)。
1.
決定各QTL
的累加性與顯性效應,如表4.1
(當模擬第○1 組資料時)與4.2
(當第○2 組或第○3 組資料時)。
2.
視此條染色體上之QTL
的基因型為A (qq)
、H(Qq)
或B(QQ)
(如果有的話), 依據表4.1
或4.2
所列各條染色體上的數量性狀基因之累加性效應(a)
及顯性 效應(d)
,計算此條染色體上的每一個數量性狀基因對性狀值的貢獻。第
i
個數量性狀基因對性狀值的貢獻為:1 2
i i i
w = ax + dx
若基因型為
A(qq)
,則x
1i= 0 , x
2i= 0
; 若基因型為H(Qq)
,則x
1i= 1 , x
2i= 1
; 若基因型為B(QQ)
,則x
1i= 2 , x
2i= 0
。3.
依上述方法2
重複六次,將每條染色體上每一個數量基因對性狀值的貢獻相 加(當模擬第○1 組之F
2子代個體的性狀值資料時,則再加上平均為0
,變方 為1
之常態分布的環境效應),即為一個F
2子代個體的數量性狀值。4.
到此僅完成一筆F
2 子代個體模擬常態分布的資料,重複第一及第二部分n
5.
至此第○1 組資料即正式模擬完成。因為第○2 組資料欲模擬得到的是二項分布 的數量性狀表型值,故需再將服從常態分布的連續性狀值轉換成二項分布的 資料,其轉換之步驟如下:先計算500
個個體數量性狀平均值,再將性狀值 大於或等於平均值的個體令其觀測值為1
,小於平均值的個體則令其觀測值 為0
,即可將連續的性狀值轉換為二項分布的資料。因為第○3 組資料欲模擬 得到的是卜瓦松分布的數量性狀表型值,故必須再將服從常態分布的連續性 狀值轉換成卜瓦松分布的資料,其轉換之步驟如下:若y
i為第i
個個體(i=1,2,…,500)
服從常態分布的連續型性狀值,隨機產生一個服從Poisson(y
i)
分布之數值o
i,即可將連續的性狀值轉換為卜瓦松分布類型的資料。▅
依上述過程可模擬得到的觀測值資料包括各條染色體上每一個標識因子的 基因型及標識因子間的距離,也就是連鎖圖譜