材料及方法 - 探討族群特有基因座與連鎖失衡區塊圖像不完整現象之關聯

本研究使用 48 個玉米自交系作為試驗材料（表一）：其中 24 個由農業試驗所提供，包括現今玉米參考序列所定序之 B73 品系，甜質種玉米品系金蜜、

新吉士、彩白、Su963106、Su963107 等，糯質種玉米台農 5 號和台農 6 號的雜交親本，爆裂種 HP301 與來自國際玉米和小麥改良中心(International Maize and Wheat Improvement Center, CIMMYT)的(亞)熱帶品系。另外 24 個則為臺南區農業改良場朴子分場提供，全為來自 CIMMYT 的(亞)熱帶品系。試驗品系適應的氣候帶、來源地區和胚乳的特性等資訊，分別在美國農業部 (United States Department of Agriculture, USDA)、國際玉米和小麥改良中心和行政院農業委員會農業試驗所的台灣農業研究期刊中獲得 (劉紹國、謝光照，2012；謝光照、盧煌勝，2006；謝光照，2010，2015)。本次所使用之試驗品系，皆為各場認定具有優良特性可做為未來育種計畫的遺傳材料。農業試驗所提供之品系，部分為台灣自行引種並選育而得，故在遺傳背景上應會有溫帶種與熱帶種玉米混雜的狀況。

表一、48 個試驗品系相關資料整理 (續)

編號品系名品系基本資料 MaizeSNP50 基因型資料 STRUCTURE

來源地氣候帶適應地胚乳 Call rate（％）同質結合率（％）溫帶馬齒種溫帶甜質種 (亞)熱帶種

38 CML521 Africa 亞熱帶 Africa MA/ST 硬粒種 95.54 96.12 0.002 0.041 0.957

39 CML522 Africa 亞熱帶 Africa MA/ST 馬齒種 95.53 96.22 0.000 0.000 1.000

40 CML523 Africa 亞熱帶 Africa MA/ST 馬齒種 95.72 96.43 0.088 0.002 0.910

41 CML538 Africa 亞熱帶 Africa MA/ST 馬齒種 95.58 96.32 0.005 0.047 0.948

42 CML541 Africa 亞熱帶 Africa MA/ST 硬粒種 95.54 96.32 0.025 0.083 0.892

43 CML544 Africa 亞熱帶 Africa MA/ST 馬齒種 95.71 96.45 0.066 0.002 0.932

44 CML545 Africa 亞熱帶 Africa MA/ST 馬齒種 95.62 96.25 0.050 0.001 0.950

45 CML547 Africa 亞熱帶 Africa MA/ST 硬粒種 95.63 96.21 0.045 0.076 0.879

46 CML19 Mexico 熱帶 Lowland 馬齒種 95.40 96.39 0.000 0.000 0.999

47 CML550 Latin Am 熱帶 Latin Am. Lowland /T 硬粒種 94.82 94.47 0.000 0.000 0.999

48 CML551 Latin Am 熱帶 Latin Am. Lowland /T 硬粒種 95.18 96.28 0.000 0.000 1.000

第二節玉米全基因體組 DNA 萃取

chloroform：isoamyl alcohol = 24：1 混合液，劇烈震盪至乳化狀態。以 10,000

rpm 離心 5 分鐘，吸取上清液 0.55 ml 置於新的離心管中。再加入等倍體積

間。多數樣本位於 120 ng/µl 左右，絕對量為 3.6 mg。每一樣本皆以濃度約 100 56,110 個單核苷酸多型性 (single nucleotide polymorphism, SNP) 位點，此部分的試驗委託生物科技研究所蔡孟勳老師研究室進行。取得的基因型資料由 Genome

（Principal Coordinate Analysis, PCoA），以近似主成分分析的方式觀察樣品的分布情形。第二種則以 STRUCTURE 2.3.4 (Pritchard et al. 2000) 軟體，利用貝氏方

法基於模型分群，依照 Evano 等人 (2005) 提出的方法決定最佳分群數，並決定構的評估。分析條件使用預設 lenth of burnin period = 20,000、number of MCMC reps after burnin = 20,000。分群數 K 設為 2 到 7 群，每個 K 值均計算 20

第五節區分族群內特有之分子標記

使用在 TASSEL 中內建的連鎖失衡分析工具，以 window size 為 100 個

區塊不完整的分子標記分類，視為成功或失敗。隨機抽取與特有分子標記數量相同的位點，記錄成功的個數並多次抽取建立二項分布。依據中央極限定理視其為常態分布，查看特有分子標記的成功個數位於常態分布上的位置。

1. 篩選造成連鎖失衡區塊圖像不完整之分子標記

將分子標記資料於 TASSEL 中以 window size = 2 計算相鄰三個分子標記間 R² 值的大小，並於 R 軟體中進行篩選。以 if() 函數建立判斷式，並以 && 連 結篩選條件。以三個分子標記為一組，取出相鄰分子標記間 R² < 0.8，且間距一 個分子標記間 R² > 0.8 的區域。將其中與另外兩相鄰分子標記間 R² < 0.8 的標記視為造成連鎖失衡區塊圖像不完整的分子標記。（附錄程式碼五）

2. 驗證族群特有標記

利用 R 軟體中 %in% 判斷式比對族群特有標記與造成連鎖失衡區塊圖像不完整分子標記兩組資料，配合 length() 指令計算兩組資料中相同標記的個數，並以此代表族群特有標記資料中“成功”的個數。

以 sample() 指令對同質結合分子標記資料檔中具有物理圖譜位置資訊的 15,919 的分子標記進行隨機取樣。取樣個數為族群特有標記的總數，並比對造成連鎖失衡區塊圖像不完整的分子標記，紀錄“成功”的個數。以迴圈的方式重複取樣 10,000 次，以“成功”的個數建立二項分布，並檢測族群特有分子標記資料中

“成功”的個數位於此分布上的位置。同時將此二項分布視為常態分布，以 pnorm() 指令計算族群特有分子標記在常態分布上的百分比。（附錄程式碼五）

在文檔中探討族群特有基因座與連鎖失衡區塊圖像不完整現象之關聯 (頁 21-32)