模擬 F 2 子代資料

第四章、資料模擬

第一節、模擬 F 2 子代資料

本研究首先利用電腦程式模擬產生三組

n

個個體的

F

₂子代資料，分別用於討論三種不同資料型態之數量性狀觀測值（表型值）的情況：第○¹ 組，常態分布性狀值資料，

n=250

；第○² 組，二項分布性狀值資料，

n=500

；第○³ 組，卜瓦松分布性狀值資料，

n=500

。由於二項分布或卜瓦松分布表型值資料是先模擬出常態分布性狀值再做適當的轉換（詳細轉換方式請見本節第二階段：

5.

），因轉換過程可能會損失一些訊息，故在此模擬產生較多的

F

2子代個體資料。每個個體分別紀錄一個數量性狀

y

及

36

個遺傳標識，標識代號

A(qq)

及

B(QQ)

分別為同質的親本基因型，標識代號

H(Qq)

為異質的雜交組合型，這

36

個遺傳標識分別屬於

6

條染色體（

6

個連鎖群），每條染色體的長度為

100cM

並各具有

6

個遺傳標識，遺傳標識間之距離為

20cM

，第一條染色體之遺傳標識為

1~6

，第二條染色體之遺傳標識為

7~12

，其餘類推；第一至第五條染色體各含有一個

QTL

，分別位於自左端算起第

70

、

49

、

27

、

8

、

30 cM

處，第六條染色體則不具有

QTL

（如圖

4.1

）。

Chromosome 1

QTL

Marker 1 Marker 2 Marker 3 Marker 4 Marker 5 Marker 6

0 20 40 60 80 100 cM

Chromosome 2

Marker 7 Marker 8 Marker 9 Marker 10 Marker 11 Marker12

0 20 40 60 80 100 cM

Chromosome 3

Marker 13 Marker 14 Marker 15 Marker 16 Marker 17 Marker 18

0 20 40 60 80 100 cM

Chromosome 4

Marker 19 Marker 20 Marker 21 Marker 22 Marker 23 Marker 24

0 20 40 60 80 100 cM

Chromosome 5

QTL

Marker 25 Marker 26 Marker 27 Marker 28 Marker 29 Marker 30

0 20 40 60 80 100 cM

Chromosome 6

Marker 31 Marker 32 Marker 33 Marker 34 Marker 35 Marker 36

0 20 40 60 80 100 cM

QTL

70 QTL

49

27 QTL

8

30

第○¹ 組，常態分布性狀值資料所設定的五個

QTL

累加性效應分別為

1.5

、

第一階段：模擬產生各標識因子之基因型

r 為兩標識因子之間的互換率(recombination frequency)。

3.

根據

Haldane

互換率公式

(Bailey, 1961)

：

( ( ) )

First marker genotype Second marker genotype

p2 < p11

A(qq)

p11 ≦p2 < p12

A(qq) H(Qq)

p₂ > p₁₂

B(QQ)

p2 < p21

A(qq)

p₂₁≦p2 < p₂₂

H(Qq) H(Qq)

p2 > p22

B(QQ)

p2 < p31

A(qq)

p31 ≦p2 < p32

B(QQ) H(Qq)

p2 > p32

B(QQ)

圖

4.2 決定第二個標識因子基因型之流程圖

4.

根據標識因子之間的距離，可類推求出前一個標識因子和同染色體上的下一個標識因子之間的互換率，再依同樣的方法定出同一條染色體上每一個標識因子的基因型。

5.

依相同步驟模擬第二條到第六條染色體上各標識因子之基因型。

^▅

第二階段：模擬產生各染色體的性狀值

先假設各組資料之性狀值皆服從常態分布，模擬產生連續型的數量性狀表型值資料，再依各組所欲模擬得到的觀測值（數量性狀表型值）資料型態，將連續型的數量性狀表型值適當的轉換成二項分布（第○² 組）或卜瓦松分布類型的資料

（第○³ 組）。

1.

決定各

QTL

的累加性與顯性效應，如表

4.1

（當模擬第○¹ 組資料時）與

4.2

（當第○² 組或第○³ 組資料時）。

2.

視此條染色體上之

QTL

的基因型為

A (qq)

、

H(Qq)

或

B(QQ)

（如果有的話），依據表

4.1

或

4.2

所列各條染色體上的數量性狀基因之累加性效應

(a)

及顯性效應

(d)

，計算此條染色體上的每一個數量性狀基因對性狀值的貢獻。

第

i

個數量性狀基因對性狀值的貢獻為：

1 2

i i i

w = ax + dx

若基因型為

A(qq)

，則

x

₁_i

= 0 , x

₂_i

= 0

；若基因型為

H(Qq)

，則

x

₁_i

= 1 , x

₂_i

= 1

；若基因型為

B(QQ)

，則

x

₁_i

= 2 , x

₂_i

= 0

。

3.

依上述方法

2

重複六次，將每條染色體上每一個數量基因對性狀值的貢獻相加（當模擬第○¹ 組之

F

₂子代個體的性狀值資料時，則再加上平均為

0

，變方為

1

之常態分布的環境效應），即為一個

F

2子代個體的數量性狀值。

4.

到此僅完成一筆

F

2 子代個體模擬常態分布的資料，重複第一及第二部分

n

5.

至此第○¹ 組資料即正式模擬完成。因為第○² 組資料欲模擬得到的是二項分布的數量性狀表型值，故需再將服從常態分布的連續性狀值轉換成二項分布的資料，其轉換之步驟如下：先計算

500

個個體數量性狀平均值，再將性狀值大於或等於平均值的個體令其觀測值為

1

，小於平均值的個體則令其觀測值為

0

，即可將連續的性狀值轉換為二項分布的資料。因為第○³ 組資料欲模擬得到的是卜瓦松分布的數量性狀表型值，故必須再將服從常態分布的連續性狀值轉換成卜瓦松分布的資料，其轉換之步驟如下：若

y

_i為第

i

個個體

(i=1,2,…,500)

服從常態分布的連續型性狀值，隨機產生一個服從

Poisson(y

)

分布之數值

o

_i，即可將連續的性狀值轉換為卜瓦松分布類型的資料。

^▅

依上述過程可模擬得到的觀測值資料包括各條染色體上每一個標識因子的基因型及標識因子間的距離，也就是連鎖圖譜

(linkage map)

，與觀測到的數量性狀值：第○¹ 組，常態分布；第○² 組，二項分布；第○³ 組，卜瓦松分布的資料。

在文檔中有限差分近似法在數量性狀基因座定位上最大概似估值變異矩陣估算上之應用 (頁 45-51)

第四章、 資料模擬

第一節、 模擬 F 2 子代資料

n

F

n=250

n=500

n=500

5.

F

y

36

A(qq)

B(QQ)

H(Qq)

36

6

6

100cM

6

20cM

1~6

7~12

QTL

70

49

27

8

30 cM

QTL

4.1

QTL

0 20 40 60 80 100 cM

0 20 40 60 80 100 cM

0 20 40 60 80 100 cM

0 20 40 60 80 100 cM

QTL

0 20 40 60 80 100 cM

0 20 40 60 80 100 cM

QTL

70

QTL

49

27

QTL

8

30

QTL

1.5

3.

Haldane

(Bailey, 1961)

( ( ) )

First marker genotype Second marker genotype

A(qq)

A(qq) H(Qq)

B(QQ)

A(qq)

H(Qq) H(Qq)

B(QQ)

A(qq)

B(QQ) H(Qq)

B(QQ)

4.2 決定第二個標識因子基因型之流程圖

4.

5.

1.

QTL

4.1

4.2

2.

QTL

A (qq)

H(Qq)

B(QQ)

4.1

4.2

(a)

(d)

i

第四章、資料模擬

第一節、模擬 F 2 子代資料