水稻幼苗期根系耐冷的遺傳定位

(1)

國立臺灣大學生物資源暨農學院農藝學研究所碩士論文

Department of Agronomy

College of Bioresources and Agriculture

National Taiwan University Master Thesis

水稻幼苗期根系耐冷的遺傳定位

Genetic Mapping of Cold Tolerance Roots of Rice (Oryza sativa L.) Seedling

游岳儒 Yueh-Ru You

指導教授：胡凱康博士 Advisor: Kae-Kang Hwu, Ph.D.

中華民國 105 年 7 月

July, 2016

(2)

(3)

摘要

台灣的水稻 (Oryza sativa L.) 栽培屬移植苗系統，因機械化操作，常對幼根造成系統性的損傷。一期作多在一至三月間進行移植，若有寒流侵襲，幼苗根系生長受限，吸收養分能力不足，將使水稻產生葉黃化。但栽培者以為是缺乏養分而增加施肥，待寒流離開，幼苗根系恢復生長，過多的養分反對植株造成不良影響。為了有效選擇具耐冷特性的材料，用於未來育成耐冷品種，我們以 44K panel 內的種原為對象，利用全基因組關聯性分析 (genome-wide association study, GWAS) 尋找與耐冷特性有關之數量性狀基因座 (QTL,

quantitative trait locus)。統計模式則採取 P 模式以控制族群結構，減低可能發生第一型錯誤 (false positive) 的機會。我們於第 2 條染色體上找到一介於 18.10 ~ 18.44 Mb 的顯著區域，區域內的 SNP 經簡化後，可歸類出 7 種 haplotype。其中Hap 2 表現優於它者，且屬 Hap 2 的種原大多為來自中緯度地區的溫帶型稉稻 (temperate japonica, TEJ)。以 Hap 2 配合外表型資料，挑選具耐冷潛力的種原，擴大重複數進行外表型驗證，其耐冷表現也大致穩定。再以選出的種原 (Kon Suito) 與台中秈 10 號 (TCS10) 進行雙親本雜交，並以其 F2族群的QTL 定位對GWAS 進行驗證，但兩者的結果無法相互印證。雖然我們已經以 PCA 校正族群結構，但本次GWAS 的結果顯示我們無法完全消除族群結構帶來的影響，未來可能需要其它方法來校正族群結構；而GWAS 與雙親本雜交的 QTL 定位也需同時進行以彌補互相的缺陷。

關鍵字：幼苗根系、耐冷特性、全基因組關聯性分析、P 模式、數量性狀基因座

(4)

Abstract

Mechanical transplanting commonly used in rice (Oryza sativa L.) cultivation usually caused systematic damages to the root system of rice seedlings. The retarded regrowth of adventitious roots may occur as the result of cold current between

January and March in Taiwan, and limit nutrient uptake of the seedlings to a point that the seedling leaves become discolored. In this study, a genome-wide association study (GWAS) was conducted on the 44K panel to identify QTLs associated with seedling root regrowth under low temperature treatment. P model was used to reduce the possibility of false positive caused by population structure. We have found a significant region of 18.10 to 18.44 Mb on Chromosome 2, and simplified the significant SNPs in this region into 7 haplotypes. Accessions possessing haplotype 2 performed better than others, and most of them are temperate japonica. A set of 10 cold tolerant and 5 cold sensitive accessions were selected based on both phenotypic and genotypic data, and their root growth difference were verified by subject them to the same cold treatment with extended repeats. However, bi-parental mapping on the F2 population derived from the cross between cold tolerant “Kon Suito” and cold sensitive “Taichung Sen 10” did not reveal any QTL related to the root growth

characteristic under cold treatment. It is speculated that while P model was used in the GWAS, the population structure was still not fully corrected. In light of the result of this study, we recommend to conduct bi-parental mapping as a verification measure after GWAS.

Key words: seedling roots, cold tolerance, GWAS, P model, QTL

(5)

第一章前言 ... 1

第二章前人研究 ... 3

第一節低溫逆境 ... 3

第二節低溫對水稻造成的傷害 ... 4

第三節水稻幼苗期耐低溫的遺傳定位 ... 5

第四節全基因組關聯性分析 (GWAS) ... 8

第三章材料與方法 ... 13

第一節全基因組關聯性分析 (GWAS) ... 13

第二節親本挑選與外表型驗證 ... 21

第三節 F2族群對關聯性定位的驗證 ... 22

第四章結果與討論 ... 28

第一節全基因組關聯性分析 (GWAS) ... 28

第二節親本挑選與外表型驗證 ... 42

第三節 F2族群對關聯性定位的驗證 ... 45

第五章結論與未來展望 ... 51

參考文獻 ... 53

附錄 ... 60

(6)

表目錄

表 1 6 個性狀間的相關係數... 29

表 2 次族群變因對各性狀的 VE ... 31

表 3 GWAS 達顯著水準之 SNP 所涵蓋範圍有與前人文獻中 QTL 相重疊者 .. 40

表 4 第 2 條染色體上 18.20 ~ 18.60 Mb 間的 haplotype 分析 ... 41

表 5 16 個候選種原... 43

表 6 外表型驗證時，冷處理組觀測值的變方分析表... 43

附表 1 本次 GWAS 與 44K panel 之種原中各次族群種原所佔之比例 ... 66

附表 2 木村氏 B 水耕液配方 ... 67

附表 3 SNP Assay 清單 ... 68

附表 4 總根性狀 TRls的錯誤發現率 (FDR)... 69

附表 5 16 個候選種原的詳細資料... 70

(7)

圖目錄

圖 1 水稻種植流程... 14

圖 2 水稻根系影像操作流程... 16

圖 3 DAS 15 時根系生長狀況... 17

圖 4 Fluidigm SNP Genotyping Analysis 軟體對基因型的判別 ... 26

圖 5 六個性狀的直方分佈圖... 29

圖 6 各次族群種原 TRls ... 31

圖 7 236 個種原於前 5 個 PC 的投影狀況 ... 32

圖 8 兩種模式下，TRls的曼哈頓圖及百分位圖 ... 38

圖 9 175 種原間，Hap 2 種原與其餘種原的表現 ... 38

圖 10 P 模式下，全種原的與各次族群的曼哈頓圖 ... 39

圖 11 16 個候選種原的外表型驗證 ... 44

圖 12 外表型試驗與 GWAS 試驗中外表型的相關分析 ... 44

圖 13 F2族群於正常處理與冷處理下各單株的TRls ... 46

圖 14 F2族群的TRls分佈 ... 46

圖 15 F2族群正常處理組的單一分子標誌迴歸 ... 49

圖 16 F2族群冷處理組的單一分子標誌迴歸 ... 50

圖 17 F2族群冷處理組第2 條染色體的單一分子標誌迴歸 ... 50

附圖 1 冷處理組六種性狀的分佈... 60

附圖 2 兩種模式下，TRn的曼哈頓圖及百分位圖 ... 61

附圖 3 兩種模式下，NARls的曼哈頓圖及百分位圖 ... 62

附圖 4 兩種模式下，NARn的曼哈頓圖及百分位圖 ... 63

附圖 5 兩種模式下，OARls的曼哈頓圖及百分位圖 ... 64

附圖 6 兩種模式下，OARn的曼哈頓圖及百分位圖 ... 65

(8)

中英文縮寫對照表

GWAS (genome wide association study)：全基因組關聯性分析 SNP (single nucleotide polymorphism)：單一核苷酸多型性 QTL (quantitative trait locus)：數量性狀基因座

RIL (recombinant inbred line)：重組自交系 LD (linkage disequilibrium)：連鎖失衡 DAS (day after seedling)：種下天數

TRls (total root length sum)：總根長

ANOVA (analysis of variance)：變異數分析 IND (indica)：秈稻

TEJ (temperate japonica)：溫帶型稉稻 TRJ (tropical japonica)：熱帶型稉稻

PCA (principal component analysis)：主成分分析

(9)

第一章前言

水稻 (Oryza sativa L.) 是世界上最重要糧食作物之一，亞洲地區眾多人口仰賴其為主要的糧食來源，在台灣亦如是。水稻的歷史悠久，經人類長期的選拔與馴化，具有廣泛的適應性與豐富的遺傳歧異度 (Garris et al., 2005)。

台灣慣行的耕作系統為二期制，又以第一期作產量更甚於第二期作，一其作插秧時間由南部到北部是一至三月間，依氣溫回暖趨勢由南向北推進；二其作則是五至七月間。水稻的生長適溫為15 ~ 25˚C，第一期作插秧時間尚屬冬末春初，時有寒流侵襲，溫度可能降至10˚C 左右甚或更低，水稻幼苗將會受到低溫逆境。據許志聖博士 (個人通訊，2014 年 3 月) 觀察，寒流過境時，植株幼苗常有葉片黃化的問題，一般農民會認為是養分不足，而施加更多的肥料，但效果有限。台灣特有的育苗插秧系統，以機械插秧機進行大規模的機械插秧，

會對植株幼苗造成系統性的機械傷害，普遍使幼苗根系長度不超過5 cm，亟需一段時間來生長恢復，這卻是其它地區不曾面臨的問題。許志聖博士因此嘗試將問題轉移到根系發育狀況，葉片黃化是否是根系吸收能力不足所導致，而非土壤中養分不足？更深入的觀察同意了上述想法：將正處寒流中的植株挖出觀

察，發現幼苗根系生長不良，像是「束起來」，在土壤中伸展的情況不佳。因為

寒流侵襲，使幼苗根系恢復正常生長較慢，在土壤中伸展的面積不夠，所以吸收能力也不足，添加施肥並未解決養分不足的問題，待寒流離去，植株恢復正常生長，有足夠的能力吸收養分後，過肥反而導致植株易倒伏等更嚴重的損害；營養生長期生長受阻，也將延後植物進入生殖生長期的時間，收穫時間後拖，然而無法於五至六月前收穫完成，又可能會遇到七月開始的颱風季，導致更嚴重的損失。

有鑑如此困境，我們希望找到對低溫較具耐受性的品種，以適合在台灣這

(10)

樣特殊的環境與栽培制度下種植，且同樣具有相當的產量與品質。但目前台灣現有的品種多數對低溫的耐性不佳，本實驗室先前對兩台灣優良品種台稉二號 (TK2) 與台中秈 10 號 (TCS10) 低溫下的生長狀況測試結果不良。因此，我們將目標放眼至其它地區的種原 (germplasm)，嘗試尋找是否有其它國家的種原，尤其是來自溫帶地區的種原，能符合我們的需求。一般來說，原生於寒冷地區的品種應具有較強的耐冷性，稉稻往往也較秈稻更強的耐冷性 (Galszmann et al., 1990; Mackill and Lei, 1997)。除了就外表型態觀察外，我們也以近年來逐漸流行的全基因組關聯性分析 (genome-wide association study, GWAS)，利用高密度、能覆蓋全基因組的單一核苷酸多型性 (single nucleotide polymorphism, SNP) 分子標誌，尋找於眾多種原間存在的耐冷特性，定位有關聯的遺傳區域，探究其特殊性，並以此來佐證我們的外表型調查結果。綜合外表型與基因型的資料，我們將在眾多種原間挑選未來育成耐冷品種的親本。

GWAS 存在一些干擾因素，如族群結構、稀有對偶基因等 (Korte and Farlow, 2013)，因此本篇研究希望利用 GWAS 對水稻幼苗期的耐冷特性作遺傳定位，並於眾多種原間挑選具耐冷特性者，作為未來育成耐冷品種的親本。後再擴大候選親本的重複數以觀察其於冷逆境的表現是否穩定，透過外表型的測試驗證GWAS 結果；以所選親本之雜交後裔 F2的遺傳定位，再次驗證是否能得到與GWAS 相互呼應的結果 (Zhao et al., 2007; Zhao et al., 2011)。

(11)

第二章前人研究

第一節低溫逆境

非生物逆境是水稻生長重要的限制因素，溫度是其中一個。水稻的生長適溫為15 ~ 25˚C，低於 15˚C 時泛稱為低溫逆境 (low-temperature stress) 或冷逆境 (cold stress) (Zhang et al., 2014)。水稻原產於熱帶及亞熱帶地區，比起其它糧食作物如小麥 (Triticum aestivum L.) 或大麥 (Hrodeum vulgare L.) 對低溫更敏感，因此低溫逆境對水稻生長是重要的限制因子 (Zhang et al., 2014)。低溫逆境可再進一步細分，0 ~ 15˚C 為寒冷逆境 (chilly stress)；低於 0˚C 將會結霜，為霜害逆境 (freeze stress) (Levitt, 1980)。生長在熱帶或亞熱帶地區的植物，因其較容易受到低溫所造成的損害 (Lyons, 1973)。而台灣的寒流多介於 10˚C 左右，因此本論文所指之低溫逆境，皆專注於寒冷逆境，並不討論植株結霜的情況。

植株的在低溫逆境下所引起的直接傷害，包含種子萌芽率降低、幼苗發育遲緩、提高致死率、降低稔實率等。細探生理層面的改變，包含細胞膜系的穩定性下降，溫度降低會逐漸結冰而破壞其流動性，導致負面影響如 (一)電解質與醣類的滲漏、(二)光合作用效率下降，因葉綠素膜系的穩定度不足，無法維持高能量的狀態；(三)酵素活性下降，導致呼吸作用的效率減緩、ATP 合成受阻；(四)毒性物質增加，如活化氧族 (reactive oxygen species, ROS) 與 MDA (malondialdehyde)；蛋白質降解 (Levitt, 1980)。

根系是植物吸收養分的部位，其發育情況與生理狀態是否正常顯得不容忽視，因為自二十世紀中期開始，大量使用化學肥料栽培作物，根系是否能有效吸收養分，已成為現今產量最重要的限制因子 (Fageria, 2012)。在許多物種，

(12)

地下部周遭環境的溫度與地上部的生長狀況有強烈的關係 (Cooper, 1973;

BassiriRad et al., 1991)。一般而言地下部溫度的改變，可能顯著影響氣孔的開合、葉片水勢的狀態及產生因缺乏養分所造成的病徵 (Clarkson et al., 1986)。

低溫逆境往往也與水分逆境密不可分。低溫時，大麥、高梁 (Sorghum Bicolor L.) 根系的吸水能力、離子通透速率下降 (BassiriRad et al., 1991)；菜豆 (Phaseolus vulgaris L.) 在 15˚C 以下，比起其它溫度會有更嚴重的水分逆境 (Unger and Danielson, 1967)、葉片氣孔開合因低溫而受限，導致喪失調節水分的功能 (Wilson, 1976)；豌豆 (Pisum sativum) 根系吸水能力下降 (Brouwer and Vliet, 1960)；玉米 (Zea mays L.) 在低溫時因水份吸收效率下降，導致 NO3-、 K、P、Ca 及 Mg 等的吸收效率也跟著下降 (Grobbelaar, 1963)。

第二節低溫對水稻造成的傷害

水稻於幼苗期的低溫逆境同樣容易降低種子的萌發率、生長遲緩、褪色 (discoloration)、黃化 (yellowing)、萎凋 (withering)、分櫱數下降、植株矮化、

延遲抽穗、不稔等不良影響 (Kaneda and Beachell, 1974; Mackill and Lei, 1997)。

過去在水稻的研究也發現因為低溫導致水分吸收效率不彰、營養元素如氮、磷、鉀、鋅等吸收速率低落 (Takeshima, 1964; Chuaudhary, 1970; Sharif Zia et al., 1994)、呼吸作用效率低落 (Takeshima, 1964) 等不利影響。另外，也有研究發現地下部低溫 (15˚C) 處理 3 天，會使水分吸收量比起正常溫度 (30˚C) 下少了近40% (Takeshima, 1964)；低溫會抑制氮素的吸收，導致最終產量下降 (Yoshida, 1981) ；低溫 (17˚C) 處理 30 天，氮、磷、鉀等吸收量比起正常溫度 (21˚C) 減少，導致植株生長不良 (Shimazaki et al., 1963)；低溫會使氮素吸收量下降，因為根表面運送NH4+、NO3- 等主要氮素來源之酵素和轉運蛋白的活性降低 (Feng et al., 2011)；低水溫使各個生長階段的光合作用效率下降 (Shimono

(13)

et al., 2004)；甚至有研究發現，低於 12˚C 時，根系基本上停止生長 (Maruyama and Tajima, 1986)。綜觀上述研究，低溫逆境與植株養分不足可能有密切的關係，許博士的設想與之吻合。

第三節水稻幼苗期耐低溫的遺傳定位

為了有效增進作物對非生物逆境的耐性，辨認控制該性狀的基因座甚至瞭解其分子機制是必要的。大多數重要的農藝性狀如株高、抽穗期、產量、逆境的耐性等，於雙親本雜交的F2族群都呈現連續的外表型變異，這樣連續性的外表變異係由數量性狀基因座 (quantitative trait locus, QTL) 所控制 (Ashikari and Matsuoka, 2006)。因為大多數的農藝性狀都是由 QTL 所控制，尋找與辨認 QTL 已成了許多遺傳研究的關鍵。而過去許多研究也大都表明水稻的耐冷性狀是連續分佈的數量性狀，應超過一個基因所控制 (Andaya and Mackill, 2003)。

對於尋找與定位這些關鍵的遺傳因子，QTL 定位法 (QTL mapping) 與關聯性定位法 (association mapping, AM) 是一個有效率的策略 (Takeda and Matsuoka, 2008; Mickelbart et al., 2015)。

過去對水稻幼苗期耐冷基因的尋找與定位，已有一定的成果。早於 30 年前，Kwal et al. (1984) 針對 10 天大的幼苗進行 10 天的低溫 (12˚C) 處理，以幼葉黃化程度為目標性狀，找到單顯性控制的耐冷基因 (Cts1(t))。Chuong and Omura (1982) 也找到三個與幼葉黃化相關的基因 chs1、chs2 及 chs3。但

Nagamine (1991) 認為幼葉黃化與低溫誘發的幼葉萎凋是不同的生理反應，應由不同的基因所控制，他透過對4 天大的幼苗進行 7 天的低溫 (15˚C) 處理，發現其F2族群的幼葉萎凋比是3：1，同樣是由單顯性的主效基因所控制，並將該基因命名為Cts2(t)。依循這些結果，Andaya and Mackill (2003) 同時針對幼葉黃 化與幼葉萎凋進行研究：對14 天大的幼苗 (3 葉齡) 處以 25/9˚C (日/夜) 14 天

(14)

觀察幼葉黃化程度、9˚C 16 天觀察幼葉萎凋程度，並分別定位，前者於第 4 條染色體上定位到一外表型解釋量20.8%的 qCTS4-1、後者於第 12 條染色體上定位到解釋量40.6%的 qCTS12，他們認為很可能就是 Cts1(t) 與 Cts2(t)，也因為 qCTS12 並沒有在幼葉黃化的定位結果中發現，證明 Nagamine (1991) 的看法，幼葉耐黃化與否與低溫誘發的幼葉萎凋程度是不同基因所控制的。qCTS12 後續的精細定位，縮小至染色體上55kb 的區間，而此區間內有 8 個推測的 open reading frame (ORF)，可能轉譯出 3 個蛋白質，其中 2 個是 zeta-class 的 glutathione S-transferase (GST) (Andaya and Tai, 2006)。水稻的基因組中有 3 個 zeta-class 的 GST，其中 2 個的轉錄基因分別是 OsGSTZ1 與 OsGSTZ2，兩者都 在第12 條染色體上，而過量表現 OsGSTZ1 的轉殖株也已被證實在低溫逆境下 有較佳的種子萌發率與幼苗發育狀況 (Takesawa et al., 2002)，因此 qCTS12 很可能就是OsGSTZ1 (Andaya and Tai, 2006)。

對於水稻幼苗期的低溫逆境之傷害評估與遺傳定位，並不侷限於幼葉的表現。遭遇低溫逆境時，水稻幼苗往往會有葉片捲曲、黃化甚至死亡等三大指徵 (Qian et al., 2000)，所以也有很多學者針對幼苗存活率作研究。Qian et al. (2000) 對3 葉齡的幼苗處以 6 ~ 10˚C 的低溫 7 天，並給予 25˚C 的恢復期，觀察幼苗的存活率，定位出4 個 QTL 分別在第 1、2、3、4 條染色體上。Zhang et al.

(2005a) 對 3 天大的幼苗處以 10˚C 的低溫 13 天，並給予 28˚C 的恢復期 12 天，觀察幼苗的存活率，在第11 條染色體上定位到外表型解釋量 29.8%的 qSCT-11。Lou et al. (2007) 對 10 天大的幼苗處以 6/10˚C (日/夜) 7 天，25˚C 恢復期6 天後觀察存活率，在第 2 條染色體上定位到外表型解釋量 27.42%的 qCTS-2。Jiang et al. (2008) 遵循 Qian et al. (2000) 的處理，在第 1 條染色體定位到外表型解釋量24.51%的 qSCT-1。Koseki et al. (2010) 對 3.5 葉齡的幼苗處以4˚C 的低溫 6 天，給予恢復期 14 天，觀察幼苗的存活率，在第 11 條染色體上定位到外表型解釋量40.0%的 qCtss11。

(15)

另外也有針對幼苗地上部生長的研究。Zhang et al. (2005b) 對 10 天大的幼苗作15˚C 的低溫處理 15 天，共發現 6 個 QTL 分別在第 3、5、7、8 條染色體上。Ranawake et al. (2008) 對剛萌芽的幼苗作 4˚C 的低溫處理 12 天，再給予 35˚C 的恢復期 4 天，觀測幼苗的地上部增長量，共定位 5 個 QTL 分別在第 1、

3、7、11、12 條染色體上。Fukuda and Terao (2015) 將 2 天大的幼苗放於 16˚C 四週再測量其地上部長度，在第1、3、8 條染色體上共定位出 3 個 QTL，其中第1 條染色體上的 qSL1 能解釋外表變異 31.8%，且與已知的半矮性基因 SD1 (semi-dwarf 1) 在同一區域。

地上部的遺傳定位研究已有很多，真正將目標性狀轉移到地下部的研究卻相當有限，原因可能是地下部相對複雜、難以調查。然而，水稻的部份莖部與根部皆生長於水面下，地下部溫度 (水溫) 比起地上部溫度 (空氣溫) 往往於水稻的生長中扮演更重要的角色 (Matsushima et al., 1964a; b)。真正感受水溫的是地下部的根，因此Zhang et al. (2013) 於 3 葉齡時對植株進行冷水及冷室兩種處理：冷水處理組為保持空氣溫23.4˚C、水溫降至 9.1˚C，持續 9 天，觀察幼葉黃化程度；冷室處理則將空氣溫降至11˚C，持續 7 天，觀察幼葉萎凋程度。兩處理共定位出6 個 QTL，在兩處理都能定位到的只有第 12 條染色體上的

qCTS12，可對照 Andaya and Mackill (2003)，及第 9 條染色體上的 qCTS9，其餘4 個 QTL 無法同時在兩處理中都定位到。冷水處理可視為只作根部處理，冷室處理則為全株處理，兩種處理的結果雖有些類似，代表有一定的關聯性，但不全然是相同的生理反應。而只作根部處理，亦能觀察到幼葉黃化的現象，合理的推測試因為根受到低溫逆境，養分吸收能力下降才導致幼葉黃化，與前述的想法相符 (Takeshima, 1964; Chuaudhary, 1970; Clarkson et al., 1986; Sharif Zia et al., 1994)。

對幼苗根系進行低溫處理並遺傳定位的研究十分有限。韓等人 (2005) 對

(16)

大根長、最大根徑、根乾重、地上部乾重、根苗乾重比等性狀，共定位出17 個 QTL，但大部分的外表變異解釋量小於 10%，屬微效。這樣的結果可能是因為根部性狀相當複雜，並非由幾個簡單的因子所控制。

幼苗耐冷的 QTL 定位已有豐富的結果，但各個研究的結果未必能相互對照。這樣的情形可能因為各個研究的處理部位不同，有的研究作冷室處理，有的研究則作冷水處理 (Zhang et al., 2013)；處理的程度也不同，有的研究以 4˚C 作低溫處理 (Ranawake et al., 2008)，也有研究作以 15˚C 作低溫處理 (Zhang et al., 2005b)；甚至材料的特性也有差距，有些研究以 F2.3族群為對象 (韓等人，

2005)，有些研究以高世代的重組自交系 (recombinant inbred line, RILs) F2.6 ~ F2.8族群為對象 (Andaya and Mackill, 2003; Zhang et al., 2005a, 2013; Ranawake et al., 2008; Jiang et al., 2008)，也有研究以回交族群作為對象 (Fukuda and Terao, 2015)。

第四節全基因組關聯性分析 (GWAS)

即使過去一、二十年來 QTL 定位法的成功有目共睹，但它仍然有幾個受限之處：(一)無論是 F2還是RILs，只能偵測其雜交材料的兩種對偶基因、(二)因為定位材料的重組次數有限，定位的解析力就難以提升 (Korte and Farlow, 2013)。

隨著分子標誌的發展，近年來高通量、高密度單一核苷酸多型性 (single nucleotide polymorphism, SNP) 分子標誌逐漸盛行，關聯性定位法或稱為連鎖失衡 (linkage disequilibrium, LD) 定位法，已能將遺傳定位推展至 DNA 鹼基序列的層級 (Zhu et al., 2008)。有別於以往的 QTL 定位法是利用 QTL 與分子標誌間的重組率 (recombination fraction) 來定位 QTL，關聯性定位法並不考慮分子標誌間的關係，直接利用各個分子標誌與目標外表性狀的相關性來定位QTL

(17)

(Takeda and Matsuoka, 2008)。關聯性定位法採用的材料是一群多樣性相當豐富的種原 (Takeda and Matsuoka, 2008)，這些種原通常採集自世界各地，如各地方具代表性的品種或栽培種 (cultivar)、地方種 (landrace)、收集系 (accession) 等。與F2或RILs 等實驗室材料相比，種原經過數百年甚至千年的繁殖，染色體已發生很多次互換，連鎖失衡區塊 (LD block) 的範圍會隨著重組事件發生的次數越多而慢慢減小，目標性狀相關的基因座與分子標誌的距離也隨之下降。

當SNP 的密度夠高，每個連鎖失衡區塊就至少能與一個 SNP 連鎖而藉由 SNP 分子標誌被研究者捕捉到，也因為種原的連鎖失衡區塊遠小於一般QTL 定位法中使用的定位族群如RILs，關聯性定位法的解析力會高於一般的 QTL 定位法。水稻的LD block 範圍依各個次族群會有所差異，大約介於 500 kb ~ 1 Mb；

而LD 衰退至其起始值一半時，秈稻次族群大約是 100 kb， aus 與溫帶型稉稻 大約是200 kb，而熱帶型稉稻大約是 300 kb (Zhao et al., 2011)。

透過統計模式的建立與運算，尋找與目標外表性狀顯著關聯的連鎖失衡區塊。多樣性豐富的種原組合有利於捕捉到各基因座上更多型式的對偶基因，而非只有雙親本的對偶基因型式 (Takeda and Matsuoka, 2008)。近年逐漸流行的全基因組關聯性分析 (genome-wide association study, GWAS)，即是利用能覆蓋全基因組的SNP 分子標誌與目標性狀作關聯性定位，尋找可能有關聯的遺傳區域。GWAS 可先行於 QTL 定位法之前，或者同時實行以補足互相的缺陷 (Korte and Farlow, 2013)。

GWAS 同樣有需要面對的問題。由於採用的材料往往是廣具多樣性的種原、收集系等，各族群間強烈的族群結構 (population structure) 所造成的影響不容忽視。族群結構廣泛存在於各物種，物種內的集群、群落，或是地理上的區隔、天擇甚至人為選拔都是可能造成的因素 (Yu et al., 2006)。族群結構會導致目標性狀與基因型間錯誤的關聯性，提高第一型錯誤 (false positive) 的可能

(18)

(Zhao et al., 2007)。過去有研究使用 Genomic Control (GC) (Devlin and Roeder, 1999)、Structured Association (SA) (Pritchard et al., 2000) 來控制族群結構所造成的效應，但效果皆有限，前者在族群結構與目標性狀關聯太強時效力不足，後者無法捕捉個體之間較細微、複雜的親緣關係 (Zhao et al., 2007)。

Yu et al. (2006) 提出以混合型模式 (mixed model) 來校正關聯性定位時同時具有族群結構與家族親屬關係 (familial relatedness) 的定位材料，他們在模式中嘗試加入族群結構 (Q) 及親緣關係 (K) 作為共變項：族群結構 (Q) 係透過軟體STURTURE (Pritchard et al., 2000) 計算所得，視為固定型效應；親緣關係 (Kinship, K) 則是透過兩兩個體間的 identical by state (IBS) 去逼近其

identical by descent (IBD)，作為兩兩個體之間的親緣關係，視為隨機型效應。模式中不含隨機型效應的稱為一般線型模式 (general linear model, GLM)，如 Q 模式；模式中含有隨機型效應的則是混合線型模式 (mixed linear model, MLM)，

如K 模式、Q+K 模式。而他們以玉米的開花期、穗長及穗半徑為目標性狀，發現同時加入Q 與 K 的 Q+K 模式可以有效降低第一型錯誤，而只加入 K 的 K 模式次之，只加入Q 的 Q 模式再次之 (即 SA)，最後才是 GC。

另外，面對族群層化 (stratification) 造成的影響，Price et al. (2006) 提出以主成分分析 (principal component analysis, PCA) 的主成分估計族群結構，並在統計模式中作為共變項企圖去除其效應。延續這樣的想法，Zhao et al. (2007) 試圖以PCA 取代 STRUCTURE 作為族群結構的估計項，同時比較了 Q、K、

Q+K、P (PCA) 與 P+K 等模式於 95 個阿拉伯芥 (Arabidopsis thaliana) 收集系 16 個性狀間的定位結果，發現 STRUCTURE 與 PCA 對於族群結構的捕捉都有不錯的效果；而多加入親緣關係矩陣 (K) 能更有效降低第一型錯誤，即 Q+K 模式會好於Q 模式、P+K 模式也會好於 P 模式。因為 GWAS 需要相當大量的外表型、基因型資料以提高統計上的可信度，而在同樣的資源下，採用PCA 會比STRUCTURE 在巨量資料的計算上會更容易。

(19)

Zhao et al. (2007) 對 95 個阿拉伯芥收集系的定位結果，naïve (模式中不含 Q 與 K) 與 Q+K 兩種模式皆定位到 FRI 基因 (開花基因 FLC 的啟動子)，與兩 個F2族群以QTL 定位法 (區間定位法) 所得的結果能相互印證；但也僅有這個 QTL 能在兩種方法中都定位到，其餘 Q+K 模式中所發現的數個 QTL 並不能在 F2族群的定位結果獲得。這說明GWAS 可能是一個可行的策略，但也有其缺陷。對族群結構作校正是必要的，校正的不足會產生第一型錯誤，導致某些 QTL 可能並不存在但被誤認為存在；過度校正確會產生第二型錯誤 (false negative)，某些 QTL 其實存在但被過度校正反而無法被觀測。

GWAS 除了可以找到前人研究結果中已知的 QTL，也因採用覆蓋全基因組 的分子標誌、廣具多樣性的種原，可能找到更多可能與目標特性相關的遺傳區域。Li et al. (2010) 對阿拉伯芥開花期的定位結果，找到 12 個可能的候選 QTL，其中四個 QTL 落在已知的開花基因 (FT、FRIler、FRIcol 及 FLC) 10 kb 的範圍之內，另外8 個則可能是新發現的 QTL。

GWAS 在水稻上的研究也相當廣泛。Famoso et al. (2011) 對水稻鋁逆境耐受性的研究中，族群結構對鋁逆境耐受性有57%的解釋量，而稉稻往往比秈稻具更高的耐受性；48 個可能的候選區域大多數都是某一種次族群特有的，其中有三個候選QTL 與前人已提出的基因在 200 kb 的範圍以內，分別是 aus 次族群 於第2 條染色體上找到與 Nrat1 位置相近的 QTL、所有次族群 P 模式下於第 5 條染色體上找到與STAR2 (LOC_Os05g02750) 位置相近的的 QTL、秈稻次族群 於第7 條染色體上找到與 LOC_Os07g34520 位置相近的的 QTL，但這樣的結果無法與其RILs、BILs (backcross inbred line) 兩個重組族群的定位結果相互對照。

另外，Zhao et al. (2011) 利用 44100 個 SNP 分子標誌與全世界 82 個國家收集而來的413 個水稻種原 (44K panel)，進行 34 個重要農藝性狀的遺傳定位而

(20)

有所成果。株高無論是在naïve 還是 MLM 兩種模式下都可以定位到 SD1，綠色 革命中舉世著名的半矮性基因；naïve 模式卻能額外定位到兩個基因，第 8 條染色體上的OsBAK1 與第 1 條染色體上的 DGL1，這樣說明 MLM 可能過度校正 而產生第二型錯誤。芳香稻次族群具最長的穗長，aus 與秈稻次之，溫帶型稉稻最短，熱帶型更稻有最大的變異範圍，以各次族群分別定位的結果發現，秈稻次族群定位到OsTB1、SLR1、OsBR1，aus 次族群 FZP、SSD1，熱帶型稉稻 次族群定位到OsLIC、MOC1，說明了不同次族群間應該有不同的機制來控制 穗長，各基因座間的對偶基因有多種型式，即遺傳的異質性 (genetic

heterogeneity)。開花期的定位結果能定位到 HD1，穀粒長也能定位到 GS3。他 們的成果同樣證實GWAS 是一個可行的策略，但也認為 GWAS 並不能解決所有的問題而毫無缺陷。面對族群結構的影響，他們提出以雜交族群的後裔進行定位，可以補足GWAS 的盲點。

Hsu and Tung (2015) 針對水稻的耐淹特性進行遺傳定位。他們在 MLM 及

秈、稉兩次族群下的GLM，都定位到一些遺傳區域且能與已知耐淹相關基因相

對照，如WUS、LOGL8、MYB、CIPK25、IAA-β-GTF、CK-O-GTF；或能與前 人QTL 相對照，如 qAG5。而他們對 IR64 與 Nipponbare 的 RILs 族群進行區間定位，也在第1 條染色體上找到與 HXK6 相鄰近的顯著區域。但 GWAS 與區間 定位兩者結果卻無法互相對照，說明GWAS 可能產生第一型錯誤與第二型錯誤，這是研究者無法忽略的問題。

另外還有許多在水稻進行GWAS 的研究，如對抗臭氧逆境的能力 (Ueda et al., 2015)；穗長、初分支數、穀粒長、穀粒寬、穀粒長寬比等與穗有關的性狀 (Zhang et al., 2015b)；特別針對秈稻與熱帶型稉稻的 19 種農藝性狀 (Begum et al., 2015)；利用三個 panel 的集合，數千個種原一同對穀粒長、寬等穀粒性狀的定位 (McCouch et al., 2016)。眾研究的研究成果，將供後續研究參考或是利用於育種計劃，以增進作物的優良特性。

(21)

第三章材料與方法

第一節全基因組關聯性分析 (GWAS)

1. 材料種植

本次 GWAS 試驗期間於 2014 年 9 月至 2014 年 12 月期間，選取的品種共 240 個。其中 237 個係隨機選取 44K rice diversity panel (Zhao et al., 2011，以下簡稱44K panel) 內的種原，收集自世界各地共 82 個國家；另外 3 個是台灣本地的品種。本次全基因組關聯性分析與44K panel 之種原中各次族群

(subpopulation) 種原所佔之比例列於附錄表 1。

將材料分為處理組與對照組，皆依以下配置：品種數量眾多，因此將 240 個品種隨機分成4 批次，一批次種植 60 品種；每品種有 4 重複，每批次有 240 棵單株，分散種於6 盆內，每盆隨機 40 株。

各種原取約 15 顆種子，分別置於市售茶葉濾包內，開口反摺並以釘書針封緊。先放置於烘箱42˚C 高溫處理 2 天，以打破可能的種子休眠性。接著以 1%

的次氯酸鈉 (Sodium hypochloride, NaClO) 溶液消毒 10 分鐘，再置於 35%的 PEG (polyethylene glycol) 4000 溶液中常溫 25˚C 12 小時，目的調整所有種子的水勢到一致，使各種原的發芽力相當。將PEG 溶液洗淨後，放置種子於常溫且保持濕潤之環境下發芽2 天。

發芽2 天後，將種子於臺灣大學人工氣候室自然光室 30/25˚C (日/夜溫) 種下，採取水耕系統。種植盆器為市售亮粉紅色之亮彩整理箱 (KEYWAY, KV- 06)，長 35.5 cm、寬 23.0 cm、高 15.3 cm，容積約 7.5L；於盆內約 12 cm 高處放置一塊純白色壓克力板，長30 cm、寬 20 cm、厚約 0.15 cm，板上有 50 個孔

(22)

洞，橫5 列、縱 10 行，捨棄左右 2 行，中間 8 行 40 洞作為植株生長基座。種下天數 (day after seedling, DAS) 第五天前需於壓克力板下加裝一層塑膠紗網，

輔助種子附著，並於DAS 5 時拆除，改以長 2 cm、寬 2 cm、高 2 cm 的水耕海綿夾住各植株之莖部底端，再將水耕海綿塞入孔洞中。同時於DAS 5 開始以木村氏B (Kimura B) 水耕液培養，以提供植株所需養分 (詳細配方與使用方法於附錄表2)，此後至收穫調查前每 3 天需更換一次水耕液。

DAS 15 時，進行切根處理，以模擬插秧機的機械傷害。以剪刀將所有植株的根剪齊至5 cm (以下)，並將處理組移至 15/13˚C (日/夜溫) 自然光室，接受低溫處理6 天，對照組則繼續生長於 30/25˚C (日/夜溫) 自然光室。DAS 21 時，

將所有植株的根部剪下，置於市售5 號塑膠夾鏈袋內，於 4˚C 冰箱內暫存。所有種植流程簡列於圖1。

圖 1 水稻種植流程

上方表示對照組，下方表示處理組；橘色部份表示30/25˚C (日/夜溫)的正常處理，藍色部份表示15/13˚C (日/夜溫)的冷處理。綠色數字表示 DAS，綠色實線表示催芽(DAS -5)、播種(DAS 0)、加裝海棉(DAS 5)、切根/低溫(DAS 15)等幾個重要處理的DAS，綠色虛線表示更換水耕液的 DAS。

(23)

2. 外表型調查 (phenotyping)

將每單株的所有根各別剪下，捨棄下端有明顯刀痕者 (該根長約 5 cm) (圖 3)。有刀痕的根係於 DAS 15 時進行切根處理後，被切去根冠生長點者，其於冷處理的6 天內因已失去生長點，根系並不會繼續延長，故不在調查對項之列而捨棄。將剩餘的根逐一排列於一厚約0.2 cm 之透明玻璃板上，並放置一把 15 cm 的鐵尺作為對照，以掃描器 (HP scanjet 3970) 掃描。每單株即為一張掃描圖檔 (圖 2 a)，彩色、解析度 300 dpi (dot per inch)，格式為.tiff，。

我們設想植株的地下部伸展面積愈龐大，吸收養分的能力也愈好，雖然根的性狀相當多樣，我們先就伸展面積作觀察。伸展面積當與根的總長度平方成正比，因此本篇研究中，我們調查根長與根數 (root number, n)，兩者的組合即是總長度 (length sum, ls)。

使用 SmartRoot (Lobet et al., 2011) 作為量測根長的工具，其為圖像軟體 ImageJ 的一個插件 (plug-in)。SmartRoot 要求圖檔為 8 位元 (8-bit) 的黑白檔，

並定義灰階值最低處 (0，即全黑) 為根，因此圖檔先透過圖像軟體 ImageJ 的巨集 (Macro) 作系統性灰階化、負片 (圖 2 b)，並存為另一新圖檔，始以該新圖檔進行根長的量測。SmartRoot 會偵測圖檔中灰階值較低處並允許手動放置節點 (node) (圖 2 c)，再將節點連結起來，始成一根並命名之；根長的計算則利用該根所有節點所跨越的像素 (pixel) 數，配合解析度換算回跨越的長度，即該根長。一張圖檔之所有根測量完成後 (圖 2 d)，輸出為一逗號分隔檔 (.csv)。

對量測的根有以下定義：處理前就已存在者老根 (old adventitious root, OAR)；冷處理期間六天內新生長者為新根 (new adventitious root, NAR)。其各可得兩種性狀：老根數 (old adventitious root number, OARn)、老根總長 (old

(24)

adventitious root length sum, OARls)、新根數 (new adventitious root number, NARn) 及新根總長 (new adventitious root length sum, NARls)，命名每條根時也需加上老根或新根的資訊，如第一條新根即為NAR_1，方便後續分類與分析。

(a) (b)

(c) (d)

圖 2 水稻根系影像操作流程

(a) 掃描所得之彩色原始檔 (b) 圖(a)經 ImageJ 負片與灰階的灰階圖檔 (c) 為圖 (b)紅圈處局部放大，SmartRoot 於灰階圖檔上放置節點 (黃色圈) (d) SmartRoot 完成圖(b)的根長測量。圖中尺標為 15 cm 的尺。

(25)

如前言所述，本篇研究的目標在於尋找對機械傷害及低溫逆境有耐性的種原，關心的應是逆境處理後再生長的部份，因此DAS 21 觀察到的總根 (total root, TR) 為兩種根的總和，但總根長 (total root length sum, TRls) 應先扣除 DAS 15 時就老根原先已有的長度。根據觀察，DAS 15 時未達 5 cm，保留生長點而能繼續生長的老根，其平均約為3cm (圖 3)，因此 TRls的定義如下：

TR_𝑙𝑠 = NAR_𝑙𝑠+ OAR_𝑙𝑠− 3 × OAR_𝑛

而總根數 (total root number, TRn) 定義如下：

TR_𝑛 = NAR_𝑛 + OAR_𝑛

老根與新根的辨別方法主要有二：第一為側根生長的多寡，老根因生長時間較久，其側根生長遠較新根茂密，一般來說新根也較為光滑；第二為綠藻附著的多寡，同樣因老根生長時間較久，其綠藻附著量遠多於新根。

觀察六個性狀於各批次的分佈情況外，也對各性狀間進行相關分析，採用的是Pearson 相關係數，並以 α = 0.05 為顯著水準。

圖 3 DAS 15 時根系生長狀況

綠框處為DAS 15 時未受切根處理的老根，其餘則為經切根處理的根，可見到刀痕而長度剩5 cm 左右。

(26)

3. 關聯性定位

全基因組關聯性分析係以覆蓋於全基因組之 SNP 分子標誌與目標性狀作關聯性定位 (association mapping)，嘗試尋找與目標性狀有高度相關的遺傳區域，

並加入族群結構 (population structure, P) 甚至親緣關係 (kinship, K) 以控制可能過高的第一型錯誤 (false positive)。本次 GWAS 使用的模式有二，第一是只加入族群結構項的P 模式，如式(1)：

y = 𝐒α + 𝐏β + ϵ --- (1)

第二則是同時加入族群結構項與親緣關係項的P+K 模式，如式(2)：

y = 𝐒α + 𝐏β + 𝐙μ + ϵ --- (2)

兩模式皆為複回歸模式，以矩陣代數的形式表示。式中y 代表目標性狀觀測值之向量；S 為維度 236×36901 的 SNP 分子標誌之設計矩陣 (design matrix)；α 為SNP 分子標誌的回歸係數向量，即代表各 SNP 的效應；P 為維度 236×5 的族 群結構之設計矩陣；β 為各主成分的回歸係數向量；C 為維度 236×236 的親緣關係之設計矩陣；μ 為親緣關係的回歸係數向量，並符合 𝜇~𝑁(0, 𝜎_𝑔²𝐾)，K 是兩兩個體間 IBS 的矩陣 (Zhao et al., 2007)；ε 則是誤差項 (error term) 且 ε~𝑁(0, 𝜎_𝑒²𝐼)。而各項所求方法於下細述。

SNP 資料來自 Zhao et al. (2011) 公佈於網路上的 44K SNP set

(http://www.ricediversity.org/data/index.cfm)，其 Affymetrix SNP array 中包含 44100 個 SNP，捨棄缺值 > 4.5% 與次對偶基因頻度 (minor allele frequency, MAF) < 1% 者後，剩餘 36901 個高品質的 SNP (Zhao et al., 2011)。於網路上下載其壓縮檔後，以TASSEL 4.0 讀入.fed 與.map 兩檔，再存出為一.hmp 以利後

(27)

續使用。此36901 個 SNP 之基因型資料再進行後續分析，包含族群結構、親緣關係的估算，及關聯性定位。

而兩模式中，SNP 分子標誌之效應與 PCA 所估之族群結構效應，皆視為固定型效應 (fixed effect)；唯親緣關係效應視為隨機型效應 (random effect)。故 P 模式 (P model) 為一般線型模式 (GLM)，而 P+K 模式 (P+K model) 為同時有固定型、隨機型兩種效應的混合線型模式 (MLM)。面對含有隨機型效應的 MLM，以 Henderson (1984) 提出之 mixed model equation (MME) 求解，能大幅簡化運算過程，節省資源與時間。

先以次族群為變項，對六個性狀作單向變方分析 (analysis of variance, ANOVA)，以次族群變項的平方和除以總平方和作為次族群變因的解釋變異量 (VE, variance explained)，藉此觀察次族群效應之程度。接著才以主成分分析 (principal component analysis, PCA) 的主成分 (principal component, PC) 作為族群結構的估計值，並透過軟體TASSEL 進行主成分分析 (Ueda et al., 2015; Hsu and Tung, 2015)。基因型資料共有 36901 個 SNP，以 hmp.輸入 TASSEL 後，先以Data 介面下的 Transform 的 Collapse Non Major Alleles 將基因型資料數值化，軟體會將每個SNP 的主對偶基因 (major allele) 設為 0、其餘皆設為 1。再以Transform 的 PCA 介面下進行 PCA，方法為 Correlation，運算結果則選擇輸出5 個主成分。運算結果也輸出為 TAB 分隔檔.txt，並以 R 語言繪圖觀察各主成分。

最後，兩模式的求解，皆以軟體 TASSEL 4.0 (Bradbury et al., 2007) 執行。

外表型資料的第一欄第一格需填為「<trait>」，存為 TAB 分隔檔再以軟體讀入；基因型資料SNP 分子標誌的設計矩陣可直接以.hmp 檔讀入；親緣關係矩陣直接透過TASSEL 計算，選取基因型資料後於以軟體 Analysis 介面下的 Kinship 功能計算之。最後，將外表型資料、基因型資料、前 5 個主成分等以軟

(28)

體中Data 介面下的∩Join 功能合併為一組資料，才分別以 Analysis 介面下的 GLM / MLM 功能求解線型模式：GLM 對 SNP 採取 1000 次的重排測驗 (permutation test)；MLM 需同時選取親緣關係矩陣方能進行，變方成分的估計方法使用P3D (Zhang et al., 2010; Ueda et al., 2015)。模式求解後，於 Result 介面下得SNP 之 P-value 向量，將其輸出為 TAB 分隔檔 (.txt)。再以 R 語言繪製各類圖表及進行各類分析。

達到顯著水準的遺傳區域也嘗試與前人研究作印證。水稻的 LD 衰退至其初始值一半時大概是100 ~ 300 kb 的距離 (Zhao et al., 2011)，而 LD 衰退至其初始值之一半時的距離，區間內的分子標誌被普遍認為具有強烈關聯，故達到顯著水準的遺傳區域，以該區域中最顯著的SNP 為中心，前後延伸 200 kb 作為可能的候選區域 (Famoso et al., 2011; Zhao et al., 2011; Ueda et al., 2015)，利用 Q- TARO (http://qtaro.abr.affrc.go.jp/) 資料庫尋找是否有與前人文獻中與耐冷性狀或根系生長性狀相關的QTL 有所重疊。另外 haplotype 的分析也以候選區域內的SNP 進行：先將有缺值的種原歸為未歸類 (undefined)，再將剩餘的種原依 SNP 的組合分類，每種分類即為一 haplotype，並計算各個 haplotype 的外表型表現。

(29)

第二節親本挑選與外表型驗證

以各種原 TRls的表現優劣為主要選擇依據，並輔以haplotype 分析的結果，

共選擇16 個種原。

外表型驗證時的試驗設計為每批次 6 盆，其中 3 盆為處理組、另 3 盆為對照組，每盆內皆含16 種原各 3 重複共 48 顆，隨機分配於 50 洞內種值；共執行 3 批次。因此，各種原重複數為 27。而種植流程與外表型調查方法皆同前述，

於2015 年 9 月至 2015 年 10 月期間種植。本次驗證欲藉由擴大各種原的重複數，以觀察各候選親本的耐冷表現是否穩定。

以變方分析檢視批次、盆裝等是否會影響各候選種原的耐冷特性表現；也以相關分析觀察本次驗證時的外表型表現是否與GWAS 時的外表型表現有足夠的相關性，藉此觀察各候選親本耐冷表現的穩定程度。

(30)

第三節 F

2

族群對關聯性定位的驗證

以台灣優良品種台中秈 10 號 (TCS10) 為母本，候選親本蒙古種原 Kon Suito (GN721) 為父本，雜交所得 F2種子，於2016 年 3 月種下。試驗設計為種下F2種子500 棵，於 DAS 15 時隨機拔去 148 棵，並將剩下的 352 棵再隨機選取半數進行低溫處理。其餘種植流程則同前述。

1. 外表型調查

幼苗根系的掃描與長度測量，皆同於本章第一節 2.外表型調查時所述。

2. 幼葉 DNA 萃取

收穫時同時收取地上部幼葉數片，經冷凍乾燥 20 小時並保存於 -20˚C 冰箱以利後續基因型分析。以CTAB 法抽取幼葉 DNA，CTAB 萃取液的配方為 CTAB (hexade cyltrimethyl ammonium bromine) 2.0 % (w/v)、NaCl(aq) 1.4 M、

EDTA (ethylene diamine tetra acetic acid) 0.5 M、Tris 緩衝液 0.1 M、β-ME (2- mercaptoethanol) 0.2 % (w/v)、PVP (polyvinylpolypyrrolidone) 1~2 % (w/v)、20 mM RNAase。剪下三段幼葉約 0.02 g 裝入 2.0 mL 離心管，並加入數十顆 0.2 mm 玻璃珠共約 0.5 g，以研磨機震盪 30 秒兩次後，加入 800 μL 的 CTAB 萃取液。接著65˚C 水浴加熱 1 小時，每 15 分鐘取出上下搖晃以利充分反應。

水浴後以 16000 xg (14299 rpm) 離心 10 分鐘，再將約 500 μL 的深綠色上清液倒入新的1.5 mL 離心管，並加入等體積 500 μL 的氯仿/異戊醇

(chloroform/isoamylalcohol (24:1) ) 以震盪器劇烈震盪 30 秒使溶液混合，再以

(31)

16000 xg (14299 rpm) 離心 10 分鐘。接著吸取約 400 μL 的清綠色上清液至已加入200 μL 的 5 M NaCl(aq) 的新 1.5 mL 離心管內，並加入 360 μL (總體積 600μL 的0.6 倍) 的異丙醇 (isopropanol)，輕輕上下搖動使溶液混合均勻後室溫靜置過夜。

隔夜後以 16000 xg (14299 rpm) 離心 20 分鐘，倒出上清液並加入 1 mL 的沖洗液 (Wash buffer)，其配方為 0.2 M 醋酸鈉溶液 (Sodium Acetate, NaOAc)、

75% 乙醇 (ethyl alcohol, EtOH)，上下搖動使 DNA 沉澱浮起並以 16000 xg (14299 rpm) 離心 5 分鐘。接著同樣倒出上清液，加入 75% 1 mL 的乙醇，上下搖動使DNA 沉澱浮起並以 16000 xg (14299 rpm) 離心 5 分鐘。結束後，倒出上清液並將離心管倒置乾燥30 分鐘。待管內乾燥後加入 50 μL 的 TE 緩衝液，其配方為10mM 的 Tris 緩衝液 (pH=8.0)、10mM EDTA (pH=8.0)，使 DNA 回溶作為原始液。

取 2 μL 的 DNA 原始液，加上 2 μL 的追蹤染劑 (6× loading dye)，以 1%的洋菜膠進行電泳，洋菜膠之製作方法為0.5g 洋菜粉 Agarose I (amresco^®) 加上 50 mL 的 Tris-borate EDTA (TBE) 緩衝液，加熱使洋菜粉完全溶解後，再加入 2 μL 的 Sybrgreen (SEEBIOSCIENCE, Cat. NO: SE - 100)，倒入電泳槽並待其冷卻。電泳條件為100 伏特、40 分鐘，結束後將膠片放置於 UV 燈上觀察 DNA 品質，並以黑白模式拍照記錄。

先取 2 μL 的 DNA 原始液以分光光度計 (Nanodrop-1000, Thermo Scientific) 粗估DNA 原始液的濃度，再取 2 μL 的 DNA 原始液稀釋 4 倍進行定量。取稀釋後的DNA 液 2 μL，加入 48 μL 的 TE 緩衝液後，再加入 50 μL 的經 TE 緩衝液稀釋98.06 倍的 picogreen (Quant-iT^TM PicoGreen)；而同樣取 2 μL 的 λ DNA 加入48 μL 的 TE 緩衝液、50 μL 的 picogreen，每次定量作 8 重複，並將 8 重複間的平均螢光讀值作為標準濃度100 ng/μL 的螢光值，用以推算各個待測 DNA

(32)

的濃度。將待測DNA 同 λ DNA 一同以 qPCR (ABI 7500 fast) 測量各待測品 picogreen 之螢光值，並計算各待測 DNA 的濃度。

3. 基因型分析

自 44K panel 的 SNP 中選出秈稻與稉稻兩次族群間多型性表現良好者，並以能均勻散佈於水稻全基因組12 條染色體為佳，最後配合 Fluidigm 96×96 晶片的通量，選出96 個最具代表性者作為 SNP Assay，各條染色體上所選的 SNP 依其長度有所不同，約有6 ~ 11 個 SNP 不等，名單列於附表 3。本次 F2族群正常處理組與冷處理組各進行兩片96×96 晶片，每片晶片的前 8 個樣品分別為 TCS10、Kon Suito、人工模擬之 F1 -1 (TCS10 × Kon Suito)、QH2O、IR64、

Nipponbare、人工模擬 F1-2 (IR64 × Nipponbare)、QH2O，以利作為對照。兩個人工模擬之F1係分別以其兩親本picogreen 定量至 10 ng/μL 後，取等量混合而成。每晶片可進行88 個 F2族群單株的基因型分析。

Fluidigm 96×96 晶片為可同時進行 96 個個體與 96 個 SNP 的基因型分析平台。本組SNP Assay 中，每個 SNP 包含三組引子 (primer)，分別為 Locus Specific Primer (LSP)、Specific Target Amplification Primer (STA) 及 Allele Specific Primer (ASP)；而針對一個 SNP 兩種型式的對偶基因，分別有能與其黏合並擴增的ASP，並帶有不同顏色的螢光片段，以利對偶基因的判別。

上晶片前先以 LSP 與 STA 兩組引子產生針對 SNP 的專一性產物，放大基因組中SNP 所在之片段，能有效優化後續 ASP 的擴增。先將 96 組 LSP 與 96 組STA 混合為 STA Primer Mix，並稀釋為 500 nM 後，取 0.5 μL 加入 2.5 μL 的 Master Mix (Qiagen 2× Multiplex PCR Master Mix)、1.25 μL 的 DNA 液 (10 ng/μL)，再加 0.75 μL 的 QH2O 將反應體積充足至 5 μL。以此進行第一次

(33)

PCR，條件為 95˚C 15 分鐘；95˚C 15 秒、60˚C 4 分鐘共 14 循環。完成後，將 STA 產物以 45 μL 的 TE 緩衝液稀釋 10 倍後保存於 -20˚C。

將 96 個 SNP 各別的 LSP 與 ASP 混為一管，並以 TE 緩衝液稀釋為 7.5μM、20 μM 作為 SNPtype Assay Mix。後取 1.0 μL 的 SNPtype Assay Mix 加入2.5μL 的 2× Assay Loading Reagent (Fluidigm, PN 85000736)，再加 1.5 μL 的 QH2O 將反應體積充足至 5 μL。取 0.1× 的 STA 產物 5 μL 以 45 μL 的 QH2O 再稀釋10 倍後為 0.01× 的 STA 產物，再取 2.5 μL 的 0.01x STA 產物，加入 3.0 μL 的 Biotium 2× Fast Probe Master Mix (Biotium, PN 31005)、0.3 μL 的 SNPtype 20x Sample Reagent (Fluidigm, FN 100-6425)、0.1 μL 的 SNPtype Reagent

(Fluidigm, FN 100-3402)、0.036 μL 的 ROX (Invitrogen, PN 12223-012)，並以 QH2O 將反應體積充足至 6.0 μL 作為 Sample Mix。

分別將 SNPtype Assay Mix 與 Sample Mix 注入 Fluidigm 96×96 晶片後，將晶片放入IFC Controller MX Load Mix，模式選擇 Load Mix，機器會將兩邊的 Mix 漸漸注下。後將晶片取出，放進 PCR Machine FC1 Cycler 進行 PCR，PCR 的條件為：樣品加熱階段70˚C 30 分鐘、25 ˚C 10 分鐘；酵素 Hot Satrt 階段 95˚C 5 分鐘；Touchdown 階段時每循環皆為 95˚C 15 秒、64˚C 45 秒、72˚C 15 秒，但每階段中的黏合 (annealing) 溫度從 64˚C 每次下降 1˚C，直至 61 ˚C，共 4 循環；擴增階段 90˚C 15 秒，60˚C 45 秒，72˚C 15 秒，共 34 循環；最後以 25˚C 冷卻 10 秒。PCR 完成後將晶片取出，放入 EP1 System 照相，選擇的螢光為Reference Dye (ROX)、Allele 1 (FAM)、Allele 2 (HEX)，機器會自動偵測最適曝光時間並照相。自EP1 System 存出照相的結果，其為一.bml 檔。

使用 Fluidigm 的 SNP Genotyping Analysis 軟體對其影像結果進行分析。匯入晶片所得之.bml 檔後，於 Chip Explore 介面 Sample Setup 匯入樣品之配置清單 (以 excel 表複製貼入)，並指定兩個 QH2O 作為 NTC；於同介面 Assay Setup

(34)

之Plate Setting 的 Mapping 下選擇 96-96 Assay-SBS96 後，匯入 96 個 SNP 的清單。後於Chip Explore 介面下的 Detail Views 即可觀看本次基因型分析的結果，

軟體預設的分群數為3 (K = 3)，將各個體依其兩種螢光的讀值畫為散佈圖，再將之分為三群 (圖 4)：靠近稉稻親本及對照 (Kon Suito、Nipponbare) 者會貼近於x 軸，以紅點表示其為稉型同質結合體 (XX)；靠近秈稻親本及對照

(TCS10、IR64) 者會貼近於 y 軸，以綠點表示其為秈型同質結合體 (YY)；靠近人工F1者則會貼近於y 軸於 x = y 的 45˚斜直線上，以藍點表示其為異質結合體 (XY)；NTC 應靠近原點，以黑點表示。若有軟體明顯判讀錯誤者，也可手動更改。確認基因型判讀得結果後，輸出為.csv。再以 R 語言將 XX 轉換為 A、YY 轉換為 B、XY 轉換為 H，缺值以「-」表示，並與外表型觀測值整合為一新.csv。

圖 4 Fluidigm SNP Genotyping Analysis 軟體對基因型的判別

預設的分群數為3 (K=3)，軟體會將各個體依兩種螢光的讀值畫為散佈圖，再區分為三種基因型；黑點代表NTC。

(35)

4. 單一分子標誌迴歸 (Single marker regression)

對所得之分子標誌作單一分子標誌的迴歸，每個分子標誌的各種型式作為變級，即A、B、H。模式如下：

y = 𝛽₀+ 𝛽₁𝑥₁+ 𝜖 --- (3)

y 為外表型觀測值；𝛽₀為迴歸模式之截距項；𝛽₁為迴歸係數；𝑥₁為分子標誌的型式；𝜖為殘差項。而透過 F 檢定來檢驗𝛽₁是否存在：

H₀: 𝛽₁ = 0 𝑣𝑠. H_𝑎: 𝛽₁ ≠ 0

而所得F 統計值我們將轉換為 LOD 值以表示，LOD 值係兩個迴歸模式之殘差平方和之比值，並取10 為底的對數。第一個模式為假設分子標誌所在位置存在 QTL，即式(3)；第二個模式則假設分子標誌所在位置不存在 QTL，如式(4)：

y = 𝛽₀+ 𝜖 --- (4)

LOD =^𝑛

2× log₁₀(^𝑆𝑆^𝑒0

𝑆𝑆𝑒1) --- (5)

式(5)中，SSe0代表式(4)的殘差平方和；SSe1代表式(3)的殘差平方和。兩模式殘差平方和的比值，為模式中加入此分子標誌後對外表變異解釋的提升量，可視為QTL 存在與否的指標。F 值與 LOD 的轉換如式(6) (Broman and Sen, 2009)：

F = (10^𝑛²^{×𝐿𝑂𝐷} − 1)(^{𝑛−𝑑𝑓−1}

𝑑𝑓 ) --- (6)

將 F2族群各單株外表型觀測值及其基因型資料 (A、B、H) 之.csv 輸入 R 語言。以函數lm() 運算各分子標誌的迴歸模式，並以函數 anova() 取出其 F 統計值與P-value。再將 F 統計值轉換為 LOD 值後繪圖觀察。

(36)

第四章結果與討論

第一節全基因組關聯性分析 (GWAS)

1. 外表型調查

本次 GWAS 的 240 個品種隨機分為 4 個批次種植，1 批次內含 60 品種。但從冷處理組的原始資料的分佈情形可見 (附圖 1)，批次間存在效應，導致各批次的平均值有所差異：第二批表現優於其它三批次，第三批的新根表現偏差，

第四批的老根表現也偏差。各批次皆含60 種原，如此的數量已足夠龐大，因此我們假定各批次間的材料不應有偏向，意即若存在批次效應，不會是取樣偏差所造成的。面對批次效應，我們採取的策略是以平均值對批次間進行校正，將各批次的平均調整至同一水平 (附圖 1)。

冷處理組的原始資料經校正後，以直方圖觀察 TRls、TRn、NARls、NARn、 OARls及OARn等六個性狀的分佈狀況 (圖 5)。六個性狀皆呈連續分佈，並無明顯的左偏或右偏。如此結果支持我們以關聯性定位為主要方法，尋找與目標性狀具高度關聯之遺傳區域。

六個性狀彼此也存在一定的相關性，相關係數介於 0.50 ~ 0.96 (表 2)。唯新根性狀 (NARls、NARn) 與老根性狀 (OARls、OARn) 間相關係數皆不顯著，這說明新根的出生與老根的繼續生長，很可能是由不同的生理機制所控制。另外，無論是總根、新根或老根，其總長性狀皆與總數性狀呈高相關 (0.82、

0.83、0.96)，總長性狀本已就包含總數性狀的意義在內，高相關的結果說明，

我們可能可單獨以總長性狀作為三種根的耐冷指標。

(37)

在此我們關心的是地下部的總伸展面積，也因為 TRls與其它五個性狀皆有一定的相關性，往下的分析以TRls為優先檢視的性狀，其它性狀為輔。

圖 5 六個性狀的直方分佈圖

圖中六個性狀的排列，由左上至右下分別是TRls、NARls、OARls、TRn、NARn

及OARn。

表 1 6 個性狀間的相關係數

TRls TRn NARls NARn OARls OARn

TRls 1.00 0.82^*** 0.79^*** 0.64^*** 0.58^*** 0.50^***

TRn 1.00 0.58^*** 0.75^*** 0.63^*** 0.66^***

NARls 1.00 0.83^*** -0.03 -0.06

NARn 1.00 -0.01 -0.03

OARls 1.00 0.96^***

OARn 1.00

** p-value < 0.001

(38)

2. 次族群結構分析

將台灣品種的資料扣除後，繼續分析本次 GWAS 中屬於 44Kpanel 的 237 個種原，其中一個種原 (NSFTV.ID = 2) 因無法查得其基因型資料，故此後的討論亦將其捨棄。水稻具有強烈的族群結構，前人研究中提到主要可分為5 種次族群 (subpopulation)，分別是：芳香稻 (Aromatic, Aro)、aus (AUS)、秈稻 (indica, IND)、溫帶型稉稻 (temperate japonica, TEJ)、熱帶型稉稻 (tropical japonica, TRJ) (Garris et al., 2005)。以軟體 STRUCTURE 將所有種原分群，預設 群數設為5 (K = 5)，若無法與任一次族群具 80% 相似者，則歸類為 Admix (ADM) (Famoso et al., 2011; Zhao et al., 2011)；分群結果皆依循 Zhao et al. (2011) 所述。

觀察各個次族群TRls的表現狀況 (圖 6)：溫帶型稉稻表現最好、而秈稻表現次於溫帶型稉稻但變異的範圍大、aus 表現不良、熱帶形稉稻表現最差。這與我們起初的設想相符，來自溫帶地區的種原如溫帶型稉稻，可能具有較好的耐冷特性；反之，原生於熱帶地區的熱帶型稉稻應對冷逆境較為敏感。ANOVA 的結果顯示 (表 2)，次族群效應對六個性狀的解釋變異量介於 14% ~ 31% 間，

雖其對於各性狀間的解釋量不完全相同，但仍說明次族群結構具有不容忽視的效應，對於我們最關心的總根長TRls，次族群結構也解釋了約25% 的外表型變異。以上結果支持我們必須將族群結構納為模式中的變項。

以 PCA 觀察族群結構 (圖 7)：PC1 解釋了 35.34% 的總變異量，能區分 indica 亞種 (秈稻 + aus) 與 japonica 亞種 (溫帶型稉稻 + 熱帶型稉稻)；PC2 解釋了10.68% 的總變異量，能進一步區分中早稻與秈稻；PC3 解釋了 5.99%

的總變異量，能進一步區分溫帶型稉稻與熱帶型稉稻；PC4 與 PC5 分別解釋 1.93% 與 1.84% 的總變異量，皆能區分芳香稻與水稻其它次族群的不同。前 5

(39)

個PC 總共解釋 55.78% 的總變異量，這樣結果大致同於 Zhao et al. (2011) 所述，因此本次GWAS 採用前 5 個 PC 作為族群結構的估計值。

表 2 次族群變因對各性狀的 VE

Trait TRls TRn NARls NARn OARls OARn

VE (%)^* 24.93 31.02 19.89 22.23 14.63 15.65

*VE (variance explained)：變方分析中將次族群平方和除以總平方和

圖 6 各次族群種原 TRls

盒鬚圖中，每盒鬚中的粗線代表中位數 (Q2)；盒的上下兩線分別是第三四分位數 (Q3)、第一四分位數 (Q1)，兩者差值為四分位距 (interquartile range, IQR)；

盒外的上下兩線則代表Q3 + 1.5 IQR、Q1 – 1.5 IQR，作為是否離群的界線，於兩者以外的數值視為離群值 (outlier)，以圓圈表示。以灰色代表 ADM、紫色代表Aro、黃色代表 AUS、紅色代表 IND、藍色代表 TEJ、淺藍色代表 TRJ，橫虛線為所有種原之平均。

(40)

圖 7 236 個種原於前 5 個 PC 的投影狀況

括號內的百分比為該PC 對整體資料的解釋變異程度。灰色代表 ADM、紫色代表Aro、黃色代表 AUS、紅色代表 IND、藍色代表 TEJ、淺藍色代表 TRJ。

(41)

3. 關聯性定位

模式建構的好壞，可藉由百分位圖 (quantile-quantile plot, qqplot) 檢視。假定控制一性狀的基因座不應過多，SNP 之回歸係數的 P-value 應服從均一分佈 (uniform distribution)。那麼以均一分佈的變數之百分位數為期望值，眾 P-value 之百分位數為觀測值，兩者所繪製的關聯散佈圖，即百分位圖，其不應偏離斜率為1 的直線太多，若偏離太多，可能代表模式中仍有需校正的因子，反之則代表模式已過度校正 (Zhao et al., 2007; Zhao et al., 2011)。本次建構的兩模式，

亦以百分位圖來評估模式建構的好壞。

兩模式下，各性狀之 P-value 的百分位圖如圖 8、附圖 2 ~ 附圖 6。P 模式下，總根性狀 (TRls、TRn) 稍微上偏斜率為 1 的斜直線，新根性狀 (NARls、 NARn) 大致貼齊斜直線，老根性狀 (OARls、OARn) 則有些下偏；額外加入親緣關係效應的 P+K 模式下，總根性狀 (TRls、TRn) 較 P 模式時更貼近斜直線，但新根性狀 (NARls、NARn) 已能見到下偏斜直線，老根性狀 (OARls、 OARn) 則更為下偏。以上結果顯示 P 模式更合適於本次分析，因此往下的分析，我們主要採用 P 模式，但也參考 P+K 模式的結果，檢視是否有第一型錯誤 (false positive) 的可能。

以曼哈頓圖 (manhattan plot) 檢視全基因組中與目標性狀高度關聯的區域。曼哈頓圖為SNP 與其回歸係數的 P-value 的散佈圖，為方便觀察，P-value 取以10 為底的負對數值 ( –log10(P-value) )，而不同染色體的 SNP 以不同顏色表示。顯著標準的訂定則參考錯誤發現率 (false discovery rate, FDR)，同樣使用 44K panel 作定位族群 (mapping population) 的數篇前人研究都指出，當顯著標準訂於 –log10(P-value) > 4 時，可使 FDR 低於 25% (Famoso et al., 2011; Zhao et al., 2011; Ueda et al., 2015)，即發現顯著的 SNP 裡，其真正為不顯著的數量少於

(42)

25%。本次建立的模式，TRls之FDR 計算的結果大致同於上述等研究 (附表 4)，因此也將顯著標準定於 –log10(P-value) > 4。

各性狀的曼哈頓圖如圖 8、附圖 2 ~ 附圖 6。當一個區域在一性狀的兩模式下都達顯著水準，且有穩固的峰型 (意即有 SNP 群聚的現象)，始認定該區域與耐冷特性具足夠的關聯性。第2 條染色體上約 18.10 ~ 18.44 Mb 的區域，無論在TRls、TRn、NARls及NARn的兩種模式下，皆達顯著水準，顯示此區域可能與耐冷特性有相當強的關聯，Courtois et al. (2003) 在 18.26 ~ 20.73 Mb 的區域找到與乾旱處理下根莖乾重比相關的QTL (表 3)，與本次 GWAS 達顯著水準之 SNP 有所重疊。第 1 條染色體上 8.59 ~ 8.72 Mb 的區域，NARn兩種模式都達到顯著水準，Horii et al. (2006) 在 3.43 ~ 10.75Mb 的區域找到控制不定根系總長的QTL (表 3)，也與本次 GWAS 達顯著水準的 SNP 重疊。第 6 條染色體上有 3 個SNP (id6010626, 20.37 Mb / id6010718, 20.49 Mb / id6010812, 20.70 Mb) 在 TRn的P 模式達顯著水準， id6010718 在 TRn的P+K 模式、id6010812 在 NARls的P 模式都達到顯著水準。第 4 條染色體上 6.45 ~ 7.51 Mb 區域內，TRls

與TRn的P 模式達顯著水準，Andaya and Mackill (2003) 在 0.68 ~ 6.57 Mb 區域內找到耐冷性的QTL qCTS4-1；Courtois et al. (2003) 在 6.57 ~ 11.29 Mb 的區域內找到一QTL，其與乾旱處理下根乾重有關 (表 3)。

同一模式下，三種根的總長性狀與根數性狀，其曼哈頓圖大致類似，顯示總長性狀與根數性狀的意義相似，可以其一代替，這與先前單就外表型資料的觀察相同：總長性狀本就包含根數性狀的意義在內，因此我們單獨以總長性狀作為三種根耐冷指標的代表。

另外，我們也用四個主要的次族群 (IND、AUS、TEJ 及 TRJ) 分別對 TRls

作關聯性定位，希望藉此觀察各次族群間的差異，並與TRls 在全種原 P 模式下作比較。只對各次族群作定位時，模式的族群結構 (P) 只使用其第一主成分

水稻幼苗期根系耐冷的遺傳定位

國立臺灣大學生物資源暨農學院農藝學研究所 碩士論文

National Taiwan University Master Thesis

水稻幼苗期根系耐冷的遺傳定位

Genetic Mapping of Cold Tolerance Roots of Rice (Oryza sativa L.) Seedling

游岳儒 Yueh-Ru You

指導教授：胡凱康 博士 Advisor: Kae-Kang Hwu, Ph.D.

中華民國 105 年 7 月

July, 2016

摘要

Abstract

目錄

第一章 前言 ... 1

第二章 前人研究 ... 3

第三章 材料與方法 ... 13

第四章 結果與討論 ... 28

第五章 結論與未來展望 ... 51

參考文獻 ... 53

附錄 ... 60

表目錄

圖目錄

中英文縮寫對照表

第一章 前言

第二章 前人研究

第一節 低溫逆境

第二節 低溫對水稻造成的傷害

第三節 水稻幼苗期耐低溫的遺傳定位

第四節 全基因組關聯性分析 (GWAS)

第三章 材料與方法

第一節 全基因組關聯性分析 (GWAS)

第二節 親本挑選與外表型驗證

第三節 F

族群對關聯性定位的驗證

第四章 結果與討論

第一節 全基因組關聯性分析 (GWAS)

國立臺灣大學生物資源暨農學院農藝學研究所碩士論文

指導教授：胡凱康博士 Advisor: Kae-Kang Hwu, Ph.D.

第一章前言 ... 1

第二章前人研究 ... 3

第三章材料與方法 ... 13

第四章結果與討論 ... 28

第五章結論與未來展望 ... 51

第一章前言

第二章前人研究

第一節低溫逆境

第二節低溫對水稻造成的傷害

第三節水稻幼苗期耐低溫的遺傳定位

第四節全基因組關聯性分析 (GWAS)

第三章材料與方法

第一節全基因組關聯性分析 (GWAS)

第二節親本挑選與外表型驗證

第四章結果與討論

第一節全基因組關聯性分析 (GWAS)