• 沒有找到結果。

利用限制酶切位連結核酸定序技術探討野生稻導入系統之基因體多型性

N/A
N/A
Protected

Academic year: 2022

Share "利用限制酶切位連結核酸定序技術探討野生稻導入系統之基因體多型性"

Copied!
98
0
0

加載中.... (立即查看全文)

全文

(1)

國立臺灣大學生物資源暨農學院農藝學系 碩士論文

Department of Agronomy

College of Bioresources and Agriculture National Taiwan University

Master Thesis

利用限制酶切位連結核酸定序技術 探討野生稻導入系統之基因體多型性

Genomic characterization of wild rice introgression lines using restriction site-associated DNA sequencing

翁子涵 Tzu-Han Weng

指導教授:黃永芬 博士 Advisor: Yung-Fen Huang, Ph. D.

中華民國 107 年 2 月

Feb 2018

(2)
(3)

致謝

轉眼間在臺大渡過了七年歲月,歷經身邊同學與夥伴們來來去去的改朝換代,

終於輪到我來寫下這個句點,感觸良多,這些日子不論是開心愉快的、難過不捨 的、艱澀苦悶的,我都會好好將其收著,並牢牢記著。

謝謝黃永芬老師,在收到電子郵件後願意跨洋打給正在服兵役的我,至今仍 是印象深刻,謝謝您願意收我當您的第一個學生,甚感榮幸,也謝謝您在研究中 的鼓勵,耐心且細心的幫忙,以及這段時間不論是課業上或生活上給予的照顧與 關愛,萬分感謝。謝謝李長沛博士與農試所幫忙的各位前輩與技工們,辛苦的種 植與蒐集試驗資料,才能讓這份研究得以完成。謝謝陳凱儀老師與董致韡老師,

不論是在提供實驗儀器與藥品,或是對於內容的建議與指導,使本篇論文能夠順 利完成,也感謝農藝系老師們在學生生涯中給予的幫助與教導。

感謝在碩士生涯中相遇相識的好夥伴們,因為有你們的點綴讓日子更加精彩。

謝謝高驥學長時常將我從水深火熱中救出,無論何種問題都能幫助我迎刃而解;

謝謝啟銘、傑宇、世宗、宇宏、云堅,一同度過無數個深夜團隊時刻,為生活找 點樂趣;謝謝同期的碩班夥伴們,聖凱、岳儒、瑋倫、兆平、奕廷、瑋泓、柏勳、

雅文,不管是在課業上的幫忙,還是偶爾互相吐吐苦水,都能是一起前進的動力;

謝謝碩一時收留我的力瑜老師和纕淇、丘原,讓還沒有實驗室的我不至於無家可 歸;謝謝碩三時虎生家的吃飯好夥伴怡樺、天成、同杉,讓我順利度過最難熬的 時期;謝謝 R405 的學弟妹,譽嵐、芃諭、仲汶、敬廷、健誠,一同下田、實習 與實驗;謝謝佳致,帶我認識了許多園藝領域中的人事物,也謝謝妳的陪伴。

最後,謝謝這幾年來支持我也最溫暖的家人們,沒有你們也就不會有現在的 我,無論何時,回家能看到你們真好,還有最可愛的狐狸狗小白,希望你在天上 也能夠盡情奔跑,我愛你們。

翁子涵

(4)

摘要

稻米 (Oryza sativa L.) 為世界上重要的糧食作物,現今育種策略造成稻米之 遺傳背景窄化及遺傳脆弱性等問題,使用野生近緣種 (crop wild relatives) 作為雜 交親本被視為解決方法之一。本研究利用兩組野生稻導入系統,分別為導入野生 稻 O. nivara 基因體的 AA 族群及導入野生稻 O. officinalis 基因體的 AC 族群,以 限 制 酶 切 位 連 結 核 酸 定 序 技 術 (restriction site-associated DNA sequencing, RAD-seq) 建立定序庫,採用 Illumina-Hiseq 2500 次世代核酸定序平台完成定序 後,以 Stacks 及 TASSEL 兩種程式進行單一核苷酸多型性 (SNP, single nucleotide polymorphism) 辨識。AA 族群共獲得 3,428 個缺值率小於 10%且具有多型性之 分子標誌,加上前人使用之 157 個簡單重覆序列 (Simple sequence repeat, SSR) 分子標誌,經篩選後共以 2,489 個分子標誌建立總長 1,743.3 cM 之連鎖圖譜,並 以多重區間定位法 (multiple interval mapping, MIM),針對基本農藝性狀、產量 相關性狀、穗與穀粒性狀及抗病表現等性狀進行數量性狀基因座 (quantitative trait loci, QTL) 定位,共定位到 178 個 QTL,平均外表型解釋度為 12.1% (介於 2.21%至 35.7%之間)。AC 族群獲得 4,601 個缺值率小於 10%且具有多型性之 SNP 分子標誌,以單一分子標誌迴歸法 (single marker regression) 定位 54 個 QTL,

平均外表型解釋度為 10.3% (介於 0.2%至 52.4%之間)。在千粒重、每穗粒數、穗 重、稻熱病抗性、褐飛蝨抗性、紋枯病抗性等許多性狀中皆有發現來自野生稻之 有利對偶基因存在,配合搜尋前人文獻後佐證 QTL 鄰近位置有相關基因存在,

且發現未出現於文獻中的 QTL,可供進一步研究。

關鍵字:稻米 (Oryza sativa L.)、野生近緣種、限制酶切位連結核酸定序技術、

數量性狀基因座

(5)

Abstract

Rice (Oryza sativa L.) is one of the most important staple food crop in the world.

Breeding strategies for rice nowadays often lead to problems such as narrow genetic background and genetic vulnerability. Using crop wild relatives (CWR) as crossing parents is viewed as one solution to these problems. In this study, two populations of introgression lines, AA and AC, which were generated using O. nivara and O.

officinalis as donor parents, respectively, were used. Restriction site-associated DNA

sequencing (RAD-seq) libraries were constructed and sequenced using Illumina-Hiseq 2500. Stacks and TASSEL were used for single nucleotide polymorphism (SNP) calling. In AA population, 3,428 SNPs with missing rate less than 10% were discovered. Along with 157 simple sequence repeat (SSR) markers from previous study, after marker filtering, we used a total of 2,489 markers to construct a linkage map spanning 1,743.3 cM. Multiple interval mapping (MIM) was used for mapping quantitative trait loci (QTL) for agronomic traits, yield-related traits and resistance to different pests and diseases. One hundred and seventy-eight QTL, each explained on average 12.1% phenotypic variance (ranging from 2.21 to 35.7%), were identified in AA population. In AC population, 4,601 SNPs with missing rate less than r 10% were discovered and analyzed using single marker regression. Fifty-four QTL, each explained on average 10.3% phenotypic variance (ranging from 0.2% to 52.4%), were identified. Favorable alleles from wild rice were found for several traits such as thousand grain weight, panicle weight, blast resistance and brown plant hopper resistance, etc. Some QTL were confirmed through previous studies, while others have not been reported yet, which may serve as targets for further studies.

Keywords: rice (Oryza sativa L.), crop wild relatives, restriction site-associated DNA

(6)

目錄

口試委員審定書……… i

致謝... ii

摘要... iii

Abstract ... iv

目錄... v

表目錄... vii

圖目錄... viii

第一章、 前言... 1

野生近緣種於育種之運用... 1

野生稻於稻米育種之運用... 2

高通量分子標誌的原理及應用... 5

研究目的... 7

第二章、 材料與方法... 8

試驗材料... 8

農藝性狀調查... 9

葉片 DNA 萃取與定量 ... 9

RAD-seq 定序庫製備 ... 10

RAD-seq 資料分析及基因型資料整理 ... 12

連鎖圖譜建立... 16

數量性狀基因座分析... 17

第三章、 結果... 18

外表型資料... 18

(7)

RAD-seq 序列資料分析與比較 ... 21

連鎖圖譜... 22

數量性狀基因座... 23

第四章、 討論... 28

序列資料分析流程... 28

連鎖圖譜與物理圖譜之比較... 29

性狀之遺傳結構... 30

第五章、 結論與未來展望... 35

參考文獻... 70

附錄... 83

(8)

表目錄

表一、農藝性狀調查項目與方法 ... 36

表二、2015 年第一期作 AC 族群之農藝性狀彙總... 40

表三、AC 族群病蟲害抗性表現... 41

表四、各流程讀序分析 ... 42

表五、SNP 解析彙總 ... 43

表六、AA 族群連鎖圖譜摘要 ... 44

表七、AA 族群 QTL 分析結果 (株高、抽穗日數與產量相關性狀) ... 45

表八、AA 族群 QTL 分析結果 (穗部性狀) ... 46

表九、AA 族群 QTL 分析結果 (榖粒性狀) ... 47

表十、AA 族群 QTL 分析結果 (病蟲害抗性表現) ... 49

表十一、AC 族群 QTL 分析結果 (產量相關性狀) ... 50

表十二、AC 族群 QTL 分析結果 (穗部性狀) ... 51

表十三、AC 族群 QTL 分析結果 (病蟲害抗性表現) ... 52

(9)

圖目錄

圖一、栽培稻與野生稻 O. nivara 種間導入系統 AA 族群建立流程 ... 53

圖二、栽培稻與野生稻 O. officinalis 種間導入系統 AC 族群建立流程 ... 54

圖三、AC 族群 2015 年一期作農藝性狀分布圖... 55

圖四、AC 族群產量相關性狀與穗、穀粒性狀之表型相關... 58

圖五、AC 族群稻熱病及褐飛蝨抗性表現分布... 59

圖六、AC 族群白葉枯病抗性表現分布... 60

圖七、AC 族群紋枯病抗性表現分布... 61

圖八、讀序數曲線圖 ... 62

圖九、AA 族群之物理圖譜與遺傳圖譜之比較 ... 63

圖十、AC 族群之物理圖譜... 64

圖十一、AA 族群使用 Psatcks 及 Ustacks 獲得之 SNP 於物理圖譜之分布 .... 65

圖十二、AA 族群 SNP+SSR 物理圖譜與 SSR 物理圖譜比較 ... 66

圖十三、AC 族群之物理圖譜... 67

圖十四、AA 及 AC 族群褐飛蝨抗性 QTL 定位之結果 ... 68

圖十五、AA 及 AC 族群稻熱病抗性 QTL 定位之結果 ... 69

(10)

第一章、前言

野生近緣種於育種之運用

為了確保在氣候暖化及變異遽增下之糧食安全,如何利用更多樣且豐富的作 物種類擴大遺傳資源背景是改良作物的關鍵之一 (Dempewolf et al. 2014)。野生 近緣種 (crop wild relatives) 為作物馴化前的野生種及親緣關係較近之物種,前人 研究發現其具有對非生物逆境的適應性、生物逆境的抗性甚至是高產的潛能,因 此 使 用 野 生 近 緣 種 作 為 雜 交 親 本 被 視 為 擴 大 栽 培 種 遺 傳 變 異 的 方 法 之 一 (Brozynska et al. 2016),並可對於作物的生產力帶來顯著的成長 (Hajjar and Hodgkin 2007)。但種間雜交面臨雜交不親和、雜交後代不稔等困難,需透過胚拯 救、回交、染色體倍加等方式加以克服。

野生近緣種具有改善作物基因來源之潛力最早由 Vavilov 提出 (Vavilov 1926),Maxted 和 Kelly 等人 (2009) 估計全球約有 50,000-60,000 個作物及其野 生近緣種,其中的 10,739 個物種被視為對改善糧食安全有直接之幫助 (Maxted and Kell 2009)。Tanksley and McCouch (1997) 認為分子標誌發展與基因型圖譜的 建立能夠有效增進野生種利用,且持續地對野生種源取樣能增加新基因發現之機 率。早於 19 世紀末期已有運用野生近緣種改良栽培種之紀錄:當法國面臨葡萄 根瘤蚜的危害時,是 藉 由引進 北 美對病害具有抗性的 Vitis rupestris 、Vitis berlandieri 和 Vitis riparia 三個野生近緣種重建葡萄酒產業 (Prescott-Allen and

Prescott-Allen 1987)。在野生近緣種運用於作物育種的例子中,超過 80%用來增 加栽培品種對病害及蟲害之抗性 (Hajjar and Hodgkin 2007),如水稻抗草狀矮化 病毒 (rice grassy stunt virus, RGSV) 抗性基因之導入 (Brar and Khush 1997);番 茄由野生種導入超過 40 個抗病基因 (Rick and Chetelat 1995);小麥銹病與嵌紋病 毒 (wheat streak mosaic virus, WSMV) 之抗性導入 (Hoisington et al. 1999);樹薯

(11)

嵌紋病 (mosaic virus) 與細菌性萎凋病 (bacterial wilt) 抗性之導入,使樹薯於奈 及利亞的產量上升 40% (Nweke 2004) 等實際應用之例。根據 CWR 網站 (http://www.cwrdiversity.org/) 統計,目前已有超過 25 種作物已經或正在進行野 生近緣種蒐集及應用於育種改良之研究計畫,高粱、馬鈴薯、燕麥、向日葵、鷹 嘴豆等作物均在此範疇中。

除了病蟲害抗性基因的導入外,野生近緣種對栽培種於非生物逆境的耐受性 提升也有所幫助。野生種棲地分布廣泛,在一些較極端的環境下仍可發現其蹤跡,

被認為具有較大的遺傳歧異度與環境耐受性 (Henry 2014),因此,使用野生近緣 種能夠幫助栽培作物面對環境變遷之影響:如野生種大麥 Hordeum spontaneum 中發現提升根乾重與根長之數量性狀基因座 (quantitative trait loci, QTL) 增加栽 培種對乾旱的耐受性 (Naz et al. 2014);運用野生小麥 Triticum dicoccoides 能提升 對乾旱及鹽害之耐受性 (Nevo and Chen 2010);評估野生稻 Oryza officinalis、

Oryza rufipogon 耐旱相關性狀,進行如根長、地上部生物量、葉片水勢能之研究

(Feng et al. 2012);對野生種大豆全基因體定序並定位耐鹽害之基因 (Qi et al.

2014),其他如甘蔗、玉米、蔬果與油料作物等皆有相關研究 (Brozynska et al.

2016)。

野生稻於稻米育種之運用

稻米 (Oryza sativa L.) 為世界上最重要的糧食作物之一,亦為亞洲地區人民 主食,其發展與人類糧食問題息息相關 (Godfray et al. 2010)。隨著人口倍數成長,

糧食需求逐漸增加,為了因應氣候變遷造成的影響,現今的育種目標著重於高產 量、高營養價值、生物與非生物逆境的耐受性 (Tai et al. 2014)。長期以來稻米的 育種策略多以高產為主要育種目標,然而,單一化的稻種栽培往往帶來稻米之遺 傳背景窄化及遺傳脆弱性等問題,使得栽培稻無法適應氣候變遷所帶來的衝擊 (Dempewolf et al. 2014)。

(12)

現今稻屬下有 24 個種,包括 2 個栽培種--亞洲栽培稻 (Oryza sativa) 及 非洲栽培稻 (Oryza glaberrima)--和 22 個野生種。栽培種為 AA 染色體組,共 12 對染色體 (2n = 2x = 24),野生稻可依不同的染色體組分為 AA、BB、CC、BBCC、

CCDD、EE、FF、GG、HHJJ、HHKK 等 10 種類型 (Sanchez et al. 2013)。野生 稻具高度遺傳多樣性,能適應各類自然環境,常帶有抗生物及非生物逆境之特性,

可用以擴增現有栽培稻之遺傳歧異度,作為導入有利對偶基因之育種材料,為一 珍貴遺傳資源 (Henry and Nevo 2014)。至今已有許多將野生稻基因導入栽培稻進 行育種之成功例子,如國際稻米研究所陸續從野生稻中篩選出抗稻熱病 (rice blast, BL) 及抗白葉枯病 (bacterial blight, BB) 等基因 (Brar and Khush 1997)。無 論是在生物逆境、非生物逆境之抗性、產量增加等皆有野生稻相關研究發表,如 AA 染色體組 O. rufipogon 已發現增進栽培稻產量及產量構成要素之 QTL (McCouch et al. 2007; Moncada et al. 2001; Septiningsih et al. 2003);AA 染色體組 O. longistaminata 對白葉枯病之抗性 (Ikeda et al. 1990);BB 染色體組 O. punctata

耐熱耐旱之特性 (Sanchez et al. 2013);BBCC 染色體組 O. minuta 對褐飛蝨 (brown plant hopper, BPH) 之抗性 (Brar et al. 1996);CCDD 染色體組 O. latifolia 的 BPH、BB 之抗性等 (Multani et al. 2003)。

O. nivara 與栽培稻同為 AA 染色體組,分類於第一級基因庫,為最早被應

用於將優良特性導入栽培稻之野生稻種之一,Ling 等人 (1970) 篩選 6,723 個栽 培品系及野生稻種對水稻草狀矮化病毒之感病程度,僅有屬於 O. nivara 的一個 品系具有較佳之抗性 (Ling et al. 1970),並於 1974 年成功釋出第一批帶有抗水稻 草狀矮化病毒之品種 (Khush and Ling 1974)。此外,另有研究利用 O. nivara 與 栽培稻雜交建立導入系 (introgression line, IL),藉以探討水稻種間雜交後代的遺 傳及育種行為;Win 等人 (2009) 將 O. nivara 與亞洲栽培稻台中 65 號,進行多 代回交,利用 SSR (single sequence repeat) 輔助建立野生稻導入系,成功定位位 於水稻第 12 條染色體短臂的 F1花粉不稔性基因 (Win et al. 2009);Miura 等人

(13)

(2008) 利用亞洲栽培稻 Koshihikari 與 O. nivara 建立之導入系進行研究,於水稻 第 2 條染色體短臂發現可能導致水稻種間雜交後雜種衰退的 hbd1(t) 基因 (Miura et al. 2008);Cheema 等人 (2008) 於栽培稻 O. sativa cv PR114 與 O. nivara 雜交 族群中定位出第四條染色體長臂上之抗白葉枯病基因 (Cheema et al. 2008)。

於遠緣野生種的利用上,不同染色體組間雜交後代稔實率低,且雜交種子會 有發育不完全或是退化之現象 (Bouharmont 1961),但經由胚拯救培養通常可得 到雜交植株。Jena and Khush (1984) 經胚拯救成功得到水稻種間雜交植株,使野 生稻研究進一步產生可稔之後裔族群,以提供選拔利用。O. officinalis 為 CC 染 色體組,雖與栽培稻在染色體組間差異較大,但因在生物及非生物逆境中具有良 好特性,除了同為 AA 染色體組的野生稻外,常被應用於與栽培稻雜交,藉以導 入其優良特性;已知 O. officinalis 對於褐飛蝨、白葉枯病、稻熱病、紋枯病等有 抗性基因 (Huang et al. 2001; Jena and Khush 1990; Lakshmanan and Velusamy 1991; Tan et al. 2004)。Jena and Khush (1990) 成功建立 O. officinalis 導入系並發 現抗褐飛蝨基因,並於後續研究中分別在第 3、第 4 及第 12 條染色體上定位到 相關之抗性基因 (Hirabayashi et al. 1998; Huang et al. 2001)。在非生物逆境上,

Ishimaru 等人 (2010) 利用 O. officinalis 在清晨開花 (early-morning flowering, EMF) 特性,將此性狀導入亞洲栽培稻 Koshihikari,有助避開白天高溫 32 – 36 ℃ 造成之不稔現象 (Ishimaru et al. 2010);Liu 等人 (2015) 則提出 O. officinalis 導 入系統在耐旱性狀之表現優於栽培稻 (Liu et al. 2015)。

(14)

高通量分子標誌的原理及應用

最 初 的 核 酸 定 序 法 (Sanger et al. 1977) 又 稱 為 鏈 終 止 定 序 法 (chain termination),以聚合酶連鎖反應 (polymerase chain reaction, PCR) 為基礎,利用 雙脫氧核糖核苷酸 (dideoxynucleotides, ddNTPs) 隨機中止反應,獲得不同長度 的 DNA 片段,隨後透過電泳結果判讀 DNA 序列。近年來隨著次世代定序 (next-generation sequencing, NGS) 的快速發展,能同時定序數百萬條 DNA 之高 通量分子技術漸趨成熟,在短時間內獲得大量定序資料,被廣泛應用於生命科學 各領域之研究,相關技術如 reduced representation libraries (RRL, Van Tassell et al.

2008)、restriction site-associated DNA sequencing (RAD-seq, Baird et al. 2008)、

double-digest restriction site-associated DNA sequencing (dd-RAD, Peterson et al.

2012)、genotyping-by-sequencing (GBS, Elshire et al. 2011) 都有各自的優點及特色。

其共通特點為利用限制酶進行全基因體多位點酶切及同時定序多個樣品,旨在開 發分子標誌時完成基因型分析,獲得不論是數量還是密度都較為充足之分子標誌。

在分子標誌的開發、基因滲入、遺傳演化等研究中皆有所幫助 (Egan et al. 2012),

在育種上則增進分子輔助選種的能力且加速新品種之育成 (Edwards and Batley 2010)。

酶切系統通常利用甲基化敏感型限制酶,集中取樣基因可能表現之序列,限 制酶辨識切位數與獲得之序列個數成反比,定序深度與覆蓋度隨限制酶之選擇而 有所不同,考量待測之基因體序列及大小與研究之目的等因素後,選擇出最佳之 限制酶種類與平台。Baird 等人 (2008) 提出 RAD-seq,此方法將 DNA 樣品經酶 切後接上含有條碼 (Barcode) 的轉接子,每個 DNA 樣品連接一特定條碼,混和 多個樣品後隨機震碎,選取 300-700 bp 之序列接上 Y 型端轉接子 (Y adaptor),

由於 PCR 擴增時無法擴增兩端皆為 Y 型轉接子之序列,可避免定序資源浪費。

後續分析利用條碼區分樣品來源,開發分子標誌同時完成基因型分析 (Baird et al.

(15)

2008)。Peterson 等人於 2012 年時針對此方法進行修改,以雙重限制酶降低基因 體複雜度,一為切位辨識鹼基較多之 rare cutter;另一為切位辨識鹼基較少之 common cutter,藉由不同的限制酶組合,基因體之複雜度與 RAD-seq 相比更加 縮減,取樣序列減少,定序深度提升進而減少缺值以獲得更可靠之判讀結果 (Peterson et al. 2012)。Elshire 等人 (2011) 提出的 GBS,則是在限制酶處理後不 經片段大小選擇,直接進行 PCR (Elshire et al. 2011);Poland 等人 (2012) 針對 GBS 進行修改,透過不同的限制酶組合降低基因體複雜度 (Poland et al. 2012)。

次世代定序資料分析可依樣品參考序列有無,使用對應分析流程 (pipeline),

如 TASSEL 3.0 GBS Pipeline (Bradbury et al. 2007)、TASSEL 5.0 GBSv2 Pipeline (Glaubitz et al. 2014) 與 Stacks (Catchen et al. 2013; Catchen et al. 2011) 等。主要 步驟可歸納為依照條碼分類樣品來源、比對回參考序列或定序資料自行比對、尋 找族群間之多型性與基因型分型等步驟。除了上述分析流程外,其他如 IGST (IBIS Genotyping-by-Sequencing Tool) (Sonah et al. 2013)、UNEAK (Universal Network Enabled Analysiss Kit) (Lu et al. 2013) 以及 Fast-GBS (Torkamaneh et al.

2017) 等多種流程,可依照使用者之需求選擇最適當的分析工具。

最早應用次世代分子技術於植物基因體研究為 Barbazuk 等人 (2007) 透過 Roche/454 平台定序玉米之 EST (expressed sequence tag) 並展現,尋找出約 7,000 個 SNPs,驗證前人研究中定序深度不足的序列上之基因,能夠更有效率地 利用於玉米等基因體龐大作物之研究 (Barbazuk et al. 2007)。其他次世代分子技 術之應用如透過定序 5.89 Gb 的 Koshihikari 序列發現 67,051 SNPs,利用基因型 與 haplotype blocks 幫助分析水稻各品種演化的起源與途徑 (Yamamoto et al.

2010);透過 GBS 方法對 176 個水稻之雙親本重組自交系進行分析,建立與 SSR 相比更為完全之連鎖圖譜 (Spindel et al. 2013);利用 RAD-seq 定序並尋找番茄晚 疫病之 QTL (Chen et al. 2014);利用 RAD-seq 協助建立大麥高密度遺傳圖譜 (Zhou et al. 2015) 等許多相關研究紀錄。

(16)

研究目的

本研究利用兩組野生稻導入系統,以 RAD-seq 進行高通量基因型分型,定 位野生稻插入片段之位置,與其對基本農藝性狀、產量相關性狀、穗與穀粒性狀 及抗病表現相關之基因座,期許本研究結果能輔助野生稻導入品系於水稻育種上 的運用。

(17)

第二章、材料與方法

試驗材料

本研究使用之重組自交系 (recombinant inbred lines, RILs) 及野生稻導入系 統 (introgression lines, ILs) 為行政院農業試驗所稻作研究室的李長沛博士所建 立;野生稻親本皆來自於國際稻米研究所 (International Rice Research Institute, IRRI)。本研究所用之兩族群組成簡述如下:

852T034 / TNG71 RILs (AA 族群):

AA 族群之母本 852T034,為栽培稻台農 67 號 (Tainung 67, TNG67) 與原產 於馬來西亞的亞洲型普通野生稻 Oryza nivara (IRGC. acc. 102165) 雜交後再經一 次回交的 BC1F11系統。O. nivara 為 AA 染色體組,一年生、早熟、穗大而有芒、

分蘖多、抗褐飛蝨與抗白背飛蝨 (李 2010)。再以 852T034 與台農 71 號 (Tainung 71, TNG71) 進行雜交,於 F2世代逢機選出 158 個單株,經多代自交,並從族系

中外表性狀或褐飛蝨檢定有明顯分離者再增選 3-5 株進入下一世代中,至 F10

成立 199 個 RILs (圖一)。

TNG67 / O. officinalis ILs (AC 族群):

AC 族群是以原產於印度之 CC 染色體組多年生野生稻 O. officinalis (IRGC.

acc. 100896) 為父本與栽培稻 TNG67 進行雜交所得。為了克服後代不稔性,經

過 F1世代胚培養後與 TNG67 進行二次回交,從後代篩選稔實率佳者繁殖,各世

代淘汰易倒伏、芒太長、落粒性強的系統,優良系統增選 3-5 株進入下一世代 中,至 BC2F14共 134 個 ILs (圖二)。

(18)

農藝性狀調查

AA 族群性狀調查數據來自李長沛博士之論文 (李,2010),試驗於 2008 年 在臺中縣霧峰鄉行政院農業試驗所試驗田區進行:每品系及親本各栽植三行,每 行 12 株單本植,行株距 30×15 公分,共三重複,田間管理依慣行農法施行,肥 料於移植後 10 天及 30 天施用每公頃 N:P2O5:K2O = 80:50:40 公斤。各性狀 參照國際稻米研究所訂定之標準 (INGER, 1996) 或做部份之修改進行調查。AC 族群則於 2014 與 2015 年於同一地點進行性狀調查,並於 2015 年增加高肥區 (N : 174 kg/ha) 與低肥區 (N : 48 kg/ha) 兩種氮素處理,以探討 AC 品系於高低肥下 的產量和病害反應,模擬農民過度施肥是否加重病害之程度。田間依品系編號順 序排列,每品系種 3 行,每行 10 株單本植,行株距 28×16 公分。所調查性狀敘 述統整於表一。

葉片 DNA 萃取與定量

DNA 萃取採用 DNeasy Plant Mini Kit (Cat. No. 69106, QIAGEN, Hilden, Germany)。水稻葉片經冷凍乾燥處理後保存於 -80°C 冰箱,萃取前以剪刀將約 0.05g 葉片剪碎後放入 2 mL 微量離心管中,加入一顆鋼珠並使用樣品均質機 (SH-100, KURABO, Osaka, Japan),以最高轉速震盪 150 秒至粉末狀。取出鋼珠 後加入 600 µL Buffer AP1 及 4 µL 100 mg/mL RNaseA,上下搖晃混合均勻後置於 65°C 水浴槽 10 分鐘,其間搖晃 2 至 3 次使受熱均勻。加入 195 µ L Buffer P3,

混勻並靜置於冰上 5 分鐘後以 14000 rpm 離心 5 分鐘,取上清液至 QIAshredder spin column 中以 14000 rpm 離心 2 分鐘,將過濾後下層之液體轉移至新的 1.5 mL 微量離心管內,加入 750 µL Buffer AW1 後混勻。將管內所有液體分兩次加入 DNeasy Mini spin column 中以 8000 rpm 離心 1 分鐘後拋棄下層溶液,置換下管 並以 500 µL Buffer AW2 以 8000 rpm 離心 1 分鐘、14000 rpm 離心 2 分鐘共清洗

(19)

兩次,將上層 column 轉移至新的 1.5 mL 微量離心管中,將 60 µL Buffer AE 注 入 column 溶出 DNA,靜置 5 分鐘後以 8000 rpm 離心 1 分鐘,即可獲得目標之 DNA 溶液。

為達到後續酶切系統需要之 DNA 濃度,採用酒精沉澱使 DNA 濃縮至 20 ng/µ L 以上。將濃度未達標準之 DNA 溶液,加入總體積 0.5 倍 6 M 乙酸銨 (CH3COONH4) 後,再加入 DNA 與乙酸銨混和溶液總體積 2.5 倍的 95%酒精後 混和均勻,在室溫下放置兩小時以上,以 16000 ×g 離心 30 分鐘,去掉上清液後,

加入 500 µL 95%酒精清洗,以 16000 ×g 離心 5 分鐘去除酒精後放置於室溫下待 其完全乾燥後,回溶於 20 µL Buffer AE。以 Nanodrop (ND-1000, Thermo Fisher Scientific Inc., MA, USA) 做濃度初估,並以 1%瓊脂膠 (in 0.5× Tris-borate EDTA [TBE] Burffer) 檢測 DNA 品質,最後透過 Picogreen dsDNA Assay Kit (Cat.

No.P7589, Thermo Fisher) 進行 DNA 精確定量。

RAD-seq 定序庫製備

本 RAD-seq 定序庫製備採用 Chen et al. (2014) 所改良之定序庫製備法。親 本取樣七份,後代各品系取樣一份,每份樣品取 1 µg DNA,使用 20 units 限制 酶 PstI-HF (Cat. No. R3140S, New England Biolabs, Ipswich, MA, USA),以 1×

CutSmart® Buffer (Cat. No. B7204S, New England Biolabs, Ipswich, MA, USA) 與 二次蒸餾水配置總反應體積 50 µL,於 37°C 培養箱過夜進行酶切反應。以 80°C 20 分鐘去除限制酶活性後於室溫降溫。接著加入 2 µL 100 nM barcoded P1 adapter、

0.5 µ L 2000 unit/μL T4 DNA ligase (Cat. No. M0202T, New England Biolabs, Ipswich, MA, USA)、0.6 µ L 100 mM riboATP (Cat. No. E6011, Promega, Madison, WI, USA) 等,單一樣品總反應體積為 60 µ L,於 20°C 反應 1 小時,於 65°C 處 理 20 分 鐘 終止 活 性後 自 然 降至 室 溫 。接著 使 用 超音 波 震 盪器 (Bioruptor Sonication System UCD-200, Diagenode, Seraing, Belgium) 將 DNA 以超音波震盪

(20)

至 1 kb 以下的片段長度;每個樣品取 (300/樣品數) µL 混合均勻後分裝至 6 管 0.5 mL 微離心管以配合機器操作,每 7 分鐘一循環共震盪 21 分鐘。使用 0.5%瓊 脂膠 (in 0.5× TBE) 進行初步片段大小判別,若片段範圍過大,則再度進行超音 波震盪至理想片段範圍。之後將 6 管 DNA 混合並使用 MinElute PCR Purification Kit (Cat. No. 28004, QIAGEN, Venlo, Netherland) 濃縮 DNA,以 40 µ L elution buffer (10 mM Tris-Cl, pH8.5) 溶出 DNA。片段篩選使用 BluePippin System (Sage science, Beverly, MA, USA),範圍設定在蒐集 200 bp 到 500 bp 長度間片段,加入 DNA 溶液體積 0.8 倍的 Agencourt® AMPure® XP system (Cat. No. A63881, Beckman Coulter, Brea CA, USA) 以磁珠協助 DNA 純化,並以 1%瓊脂膠 (in 0.5

× TBE) 檢測 DNA 片段大小。取定量 1 µg 之 DNA 樣品使用 Quick Blunting Kit (Cat. No. E1201, New England Biolabs, Ipswich, MA, USA) 將超音波震碎產生的 破裂端修復成磷酸化的平坦端。修復完以 1.8× Agencourt® AMPure® XP system 磁珠系統純化 DNA 溶液後加入 5 μL 10× NEBuffer2 (Cat. No. B7002S, New England Biolabs, Ipswich, MA, USA)、1 μL 10 mM dATP 及 3 μL Klenow exo- (Cat.

No. M0212, New England Biolabs, Ipswich, MA, USA),於 37˚C 反應 30 分鐘後使 其自然冷卻,再次純化後加入 5 μL 10× NEBuffer2、1 μL 10 μM P2 adapter、0.5 μL 100 mM riboATP、及 0.5 μL 2,000 unit/μL T4 DNA ligase,置於 PCR 機器進行反 應,20℃ 3 小時,再經 Agencourt® AMPure® XP system 純化後即為 RAD library template。接著進行高精確度聚合酶連鎖擴增反應,取上步驟完成之 RAD template 定量 50 ng,加入 50 μL Phusion® High-Fidelity PCR Kit (Cat. No. B7204S, New England Biolabs, Ipswich, MA, USA) 或 NEBNext® UltraTM Q5 Master Mix (Cat.

No. M0544S, New England Biolabs, Ipswich, MA, USA) 及 4 μL 10 mM Solexa primer mix (primer sequences : Solexa forward primer 5′-AAT GAT ACG GCG ACC ACC GA-3′; Solexa reverse primer 5′-CAA GCA GAA GAC GGC ATA CGA-3′),

PCR 反應為 98°C 30 秒;98°C 10 秒,66°C 30 秒,72°C 30 秒,共 18 cycles;72

(21)

°C 5 分鐘;PCR 結束後產品保存於 4°C 中。PCR 完成後以 Agencourt® AMPure®

XP system 純化擴增 產物。定序 庫 於國立 陽明大學 榮 陽基因體 研究中心 以 Illumina-HiSeq 2500 次世代核酸定序平台 (Illumina Inc., San Diego, CA, USA),

進行 single-read 100 bp sequencing 定序作業。

RAD-seq 資料分析及基因型資料整理

本次 RAD-seq 資料首先以 Stacks (Catchen et al. 2013; Catchen et al. 2011) 為 分析工具,使用版本為 V1.37 (2016/02/24),分為已知參考序列 (Pstacks) 與未知 參考序列 (Ustacks) 兩種處理程序,並配合使用 FastQC (Andrews 2010)、Bowtie2 (Langmead and Salzberg 2012)、SAMtools (Li et al. 2009)、R (R Core Team 2017) 等 軟體輔助分析。先在 local 端進行資料準備步驟,再利用臺灣大學農藝學系伺服 器進行運算 (中階 2U,型號為 HPDL385p、CPU 為 AMD Opteron 6348 ×2,暫 存記憶體 128 GB)。除了 Stacks 外,本研究亦使用 TASSEL 3.0 GBS Pipeline (Bradbury et al. 2007) 與 TASSEL 5.0 GBSv2 Pipeline (Glaubitz et al. 2014) 進行分 析,兩者同樣使用臺灣大學農藝學系之中階 2U 伺服器進行分析,將定序資料 fastq 檔分析結果輸出為 Variant Call Format (VCF) 檔案型式後再於 local 端圖形介面 進行後續篩選步驟,以及使用 R 統計軟體協助分析。

Pstacks (已知參考序列)

整理定序條碼與區分各樣品序列資料

首先以 Stacks 之 process_radtags 指令,將每一個 lane 的定序資料依照條碼 區分成各樣品。檔案輸入及輸出的格式為 .gzfastq,序列帶有正確之條碼及酶切 位點予以保留,且開啟指令內條碼區與限制酶切位區錯誤回復之功能,擷取扣除 條碼後的 95 bp 以滑動窗口法 (sliding windows) 進行序列品質篩選,滑動窗口大 小設定為每 0.1 倍序列長度進行一次品質判定,讀序品質標準 (phred quality score:

(22)

Q = -log10 (P),P 為定序錯誤率) 設為 20,每 10 bp 之平均定序品質若低於 20 則捨棄此讀序。相關參數依照該 Stacks 使用說明設定 (附錄 1),序列整理完成後 可得各樣品讀序資料檔案與整個 lane 的過程紀錄,包括每個樣品的讀序量、刪 除之低品質讀序數、各條碼對應讀序數與非正確之條碼數量等。

比對參考序列

由 Rice Genome Annotation Project (http://riceplantbiology.msu.edu/) 下載水稻 參考序列 MSU7 (equivalent to IRGSP-1.0, ssp. japonica, cv 日本晴),利用 Bowtie2 V2.2.7 (2016/02/12) 比對樣本及參考序列。首先以 bowtie2-build 將所下載之參考 序列資料轉為 Rice_MSU7 之 fasta 參考序列檔案,在 end-to-end 比對模式下,以 Bowtie2 內建之 --very sensitive 模式進行精確之比對。接著使用 SAMtools 套件,

將檔案轉換與壓縮成 BAM (binary SAM) File,再依照 MAPQ (Mapping quality, MAPQ = -log10(P), P 值為比對錯誤率) 值判斷該序列位置,MAPQ 越大表示該讀 序愈具專一性,愈可能位於參考序列比對之相關位置,可避免同一序列同時比對 到多個位置而造成誤判,處理完之 BAM 檔案可進行 stacks 程式之後續處理。

彙整並建立各樣本基因座資料

Pstacks 將各樣本比對至參考序列相同位置之讀序視為基因座,不進行讀序 深度篩選。比對檔案中 CIGAR code,遇到 Insertion 會將插入片段刪除後補上 N 並修剪尾端維持讀序等長,遇到 Deletion 則在尾端補上 N 使片段等長於參考序 列,根據相同位置之讀序,針對每一個核苷酸位點進行同質結合或異質結合之判 讀。各樣品於本階段處理後形成三個檔案:.tags.tsv、.snps.tsv、.alleles.tsv。tags.tsv 紀錄每個基因座的染色體確切位置;snps.tsv 紀錄計算概度與判讀結果;alleles.tsv 則紀錄異質結合基因座中的 haplotypes 與其頻度。

(23)

建立親本間共通基因座目錄並對應樣本之基因型

Stacks 核心程式 cstacks 可找出樣本間共通基因座並建立目錄,若分析材料 為雙親本雜交組合,則以親本資料建立目錄。基因座目錄之建立始於尋找親本間 共有且為不同對偶基因之同質結合基因座,接著使用核心程式 sstacks,比對各樣 本之序列至親本間共通基因座目錄,進行基因型分型,最後將基因型資訊輸出 為 .matches.tsv。

使用 Stacks 串聯程式

Stacks 程式中的串聯程式 ref_map.pl 可一次執行前述步驟,並將檔案與 MySQL database 整合,藉由網頁瀏覽 PHP 圖形化介面視窗,可設定染色體、SNP 數量、基因型判讀、讀序深度等多項篩選條件,並直接於網頁上顯示結果。若要 將資料輸出成為其他後續軟體可分析之型式,可利用 export_sql.pl,依照 haplotype 或是 genotype 格式輸出該批次分析結果,便於後續其他軟體之分析,亦可直接 使用指令 genotypes 或 populations 輸出所需要之檔案。

Ustacks (未知參考序列)

在各樣品之序列資料經初步整理 (process_radtags, 同 Pstacks 步驟) 後,以 Ustacks 取代 Pstacks 進行序列彙整並建立各樣本基因座資料,不經過參考序列比 對,直接堆疊各樣本之讀序;同一序列之讀序數> 3 才加以保留,以降低定序錯 誤之序列比例 (附錄 2)。接著兩族群以親本 TNG71、TNG67、O. officinalis、O.

nivara 建立共通基因座目錄 (cstacks);AA 族群及 AC 族群再分別根據目錄建立

全族群之基因型 (sstacks),以 VCF 輸出 (指令:populations) 供後續分析。最後 將 SNP 前後的序列比對回水稻參考序列以得 SNP 之位置。

(24)

GBS Pipeline

TASSEL GBS Pipeline 保留擁有一個完整條碼與限制酶切位之序列,並將其 修剪為 64 bp (不包括條碼片段,由限制酶切位點開始),修剪途中遇到缺值 (N) 時拋棄,而遇到第二個限制酶切位或共同轉接子 (common adapter) 時則將其移 除後以腺嘌呤 (A) 補至 64 bp,並將相同讀序合併為一個 tag (FastqToTagCount Plugin);接著將多個相同且含有超過三個讀序的 tag 合併 (MergeMultipleTag CountPlugin),以降低定序錯誤。以 Burrows-Wheeler Alignment (Li and Durbin 2009) 軟體套件為比對之方法,將 tag 序列比對至水稻參考序列後,轉換至 TASSEL 可讀取之 .topm (SAMconverterPlugin),並以原始序列資料配合條碼與 tag 檔整理出每個樣品所含之 tag (FastqToTBTPlugin),最後再將兩者比對以建立 各樣品之基因型資料 (TagsToSNPByAlignmentPlugin),以 VCF 輸出檔案供後續 分析。

GBSv2 Pipeline

將定序資料依條碼分類 (GBSSeqToTagDBPlugin),讀序錯誤率接受度為 0.01 (-mnQS = 20)。為統一片段長度以利後續分析,將片段總長與最短長度皆設定為 90 bp (-kmerLength, -minKmerL = 90,通常為 kmerLength + Barcode < Read length),

以排除一讀序中因第二個限制酶切位造成較短的片段;一序列在資料庫中出現最 少 3 次 (-c = 3) 才予以保留。 將資料庫內的序列以 fastq 檔案型式 輸出 (TagExportToFastqPlugin) 後以 Bowtie2 與水稻參考序列進行比對,比對模式設為 very sensetive , 並 將 比 對 後 形 成 之 .sam 檔 存 入 資 料 庫 中 彙 整 (SAMToGBSdbPlugin)。資料庫內序列經整合各樣本讀序數及物理位置後,可獲 得各樣品在具有多型性之 SNP 的基因型 (DiscoverySNPCallerPluginV2),並可輸 出如覆蓋度 (coverage)、定序深度 (read depth)、標誌編號、MAF (Minor allele

(25)

frequency)、heterozygosity 等相關基因型資料 (SNPQualityProfilerPlugin)。最後 以 VCF 輸出供後續分析 (ProductionSNPCallerPluginV2)。

資料整理與篩選

將 Stacks (Pstacks / Ustacks)、TASSEL (GBS / GBSv2) 四個 pipeline 以 VCF 檔輸入 TASSEL 圖形化介面並統一以 Hapmap 格式輸出。以自行編寫之 R 程式 將原始核苷酸值轉換成 A、B、H,分別代表來自母本之同質結合型、來自父本 之同質結合型與異質結合型,以 call rate≧0.9、MAF≧0.1、heterozygosity≦0.05 進行篩選。為了最佳化利用分子標誌,親本基因形資訊缺乏之分子標誌亦先將較 高頻度的對偶基因設為栽培稻基因型,之後再於建立連鎖圖譜時進行配子相校正。

利用 R/VennDiagram (Chen and Boutros 2011) 輔助比較四個 pipeline 之 SNP 異同,

再將四個 pipeline 定位的分子標誌聯集成最終使用的基因型資料。

連鎖圖譜建立

本研究利用 R/ASMap (Taylor et al. 2015) 及 R/qtl (Broman et al. 2003) 建立 連鎖圖譜。連鎖圖譜之建構流程參考 Taylor (2006) 及 Broman (2012) 並稍作修 改。除了本研究所開發之分子標誌外,AA 族群另加入李 (2010) 使用的 157 個 SSR 資料。因族群經過多代自交,故將異質結合設為缺值。若兩個以上的 SNP 在一特定族群中之數據完全相同 (缺值亦用作比對),則只留下其一 (findDupM arkers, exact.only = F),之後再檢查有無個體間基因型相似度≧95%之個體 (comparegeno),基因型相似個體間只留其一。為了保留野生稻基因體可能偏好插 入之位置,本研究並無剔除不符合孟德爾分離比之分子標誌。完成資料整理後以 R/ASMap 之 mstmap 指令進行分子標誌連鎖分群檢定,最大互換率設為 0.2,且 將分群檢定之 p.value 設為 1×10-10。初步分群結果輸出後以肉眼檢查並更改錯誤

(26)

之 配 子 相 及 檢 查 同 一 連 鎖 群 內 分 子 標 誌 是 否 來 自 單 一 染 色 體 。 最 後 以 MapChart2.3 (Voorrips 2002) 繪製連鎖圖譜及其與物理圖譜比對圖。

數量性狀基因座分析

本研究利用 R/qtl 套件定位數量性狀基因座,相關設定主要參考與修改自 Broman and Sen (2009)。針對不同族群及性狀使用單一分子標誌迴歸 (single marker regression, Kearsey and Hyne 1994) 或多重區間定位法 (multiple interval mapping, MIM, Kao et al. 1999) 進行分析。單一分子標誌迴歸之閾值利用重排 1,000 次 (permutation, Churchill and Doerge 1994) 所得之最大 LOD 值之分布,以 α= 0.05 制定。MIM 以順向及反向迴歸篩選與性狀顯著相關之數量基因座,最 大 QTL 數設為 10 (max.qtl = 10),本次使用方法為 Haley-Knott (method = “hk”),

LOD penalties 則由重排測試 1,000 次後取α= 0.05 所得 (scantwo, method = “hk”, n.perm = 1000);由於 MIM 閾值建立所需之重排試驗相當耗時 (單一性狀 165 個體、4,080 SNP、使用臺灣大學農藝系中階伺服器需要 8 小時完成),因此我們 使用 10 個性狀重排試驗於α= 0.05 所得之 LOD 平均值協助定位所有性狀之數量 基因座。將單一性狀所定位之所有 QTL 置入同一線性模型後 (makeqtl),重新估 計各基因座之位置 (refineqtl) 及效應(fitqtl),並以 LOD-1 決定 95%信賴區間。

(27)

第三章、結果

外表型資料

本次研究使用 AA 與 AC 兩個族群,AA 族群性狀調查數據來自李 (2010),

在此不再贅述。以下為 AC 族群與輪迴親 TNG67 於 2014 及 2015 之性狀資料分 析結果 (表二、表三)。

產量相關性狀之表現

輪迴親 TNG67 單株產量 (GWP) 在高肥 (27.8 g) 或低肥 (32.7 g) 處理下皆 大於 AC 族群平均值 (表二),在高肥處理下平均為 23.8 g,最高可達 44.3 g,低 肥處理下產量平均則為 20.6 g,最高亦可達 40 g,整體結果在高肥環境下表現較 佳 (t-test, p-value < 0.01),單株平均增加約 3.2 g。每株粒數 (SP) 部分,輪迴親 TNG67 在兩種處理下變化不大,皆略多於 1,600 粒 (表二),整體族群大致呈現 右偏分布,高肥處理有 43%個體超過 1,000 粒、低肥處理只有 22% (圖三),高肥 處理平均粒數為 1,050 粒,低肥處理平均粒數則為 852 粒,兩者間有顯著差異 (t-test, p-value < 0.01),高肥處理平均可較低肥處理多出約 200 粒。兩者族群內部 變異程度大,高肥處理最高可達約 2,506 粒,最低僅有 336 粒,相差 2,170 粒;

低肥處理之粒數最高為 1,862 粒,最低為 395 粒,高低差則為 1,467 粒。稔實率 (FER) 方面,輪迴親 TNG67 在高肥處理下稔實率為 78.4%,低肥處理則為 90.8%

(表二),兩者族群整體呈現左偏分布 (圖三),在高肥處理下平均稔實率為 87.3%,

低肥處理平均稔實率為 89.8%,不同肥料處理間無顯著差異 (t-test, p-value >

0.05)。輪迴親 TNG67 之千粒重 (TGW) 在高肥 (20.9 g) 或低肥 (22.1 g) 處理下 皆低於族群平均 (表二),族群中不論高肥或低肥處理,千粒重集中於 20 g 到 30 g 之間 (約 75%),在高肥處理下平均為 26.8 g,低肥處理則為 27.9 g,兩者以 t-test 在 95%信心水準下無顯著差異 (p-value > 0.05)。每穗粒數 (SPP) 部分,輪迴親 TNG67 於高肥與低肥處理分別為 143 粒及 123 粒,皆大於族群中 95%以上之個 體 (表二),整體族群從每穗 42 粒到 163 粒不等,最大與最小者間差異可以達到 100 粒以上,高肥處理下平均有 97.8 粒,低肥處理為 89.6 粒,肥料處理對於每 穗粒數之影響顯著 (t-test, p-value < 0.05)。輪迴親 TNG67 每株穗數 (PN) 平均約

(28)

為 12-13 穗 (表二),整體族群集中於 5-15 穗之間 (約 95%),在高肥處理下平 均為 10.8 穗,低肥處理則為 9.4 穗,肥料處理對於每株穗數之影響顯著 (t-test, p-value < 0.01)。

穗部性狀之表現

輪迴親 TNG67 之穗長 (PL) 在高肥 (19.9 cm) 及低肥 (18.9 cm) 處理皆略 低於族群平均 (表二),整體穗長介於 15-24 cm 之間,在高肥處理下平均為 20.5 cm,低肥處理下為 19.5 cm,肥料處理對穗長之影響有顯著差異 ( p-value < 0.001)。

穗重 (PW) 部分,輪迴親 TNG67 在高肥處理與低肥處理皆為 2.6 g (表二),穗重 在族群內變異程度較大,每穗可從 1.0-3.4 g 不等,在高肥處理下平均為 2.4 g,

低肥處理下平均為 2.3 g,兩者間無顯著差異 (t-test, p-value > 0.05)。著粒密度 (PD) 方面,輪迴親 TNG67 在高肥及低肥處理分別為 7.2 粒和 6.5 粒,整體族群 分布集中於 2-6 粒間 (高肥 88%、低肥 91%),高肥處理平均每公分為 4.8 粒,

低肥處理為 4.6 粒 (表二),兩者間無顯著差異 (t-test, p-value > 0.05)。

性狀間相關性分析

在高肥處理下,與單株產量 (GWP) 呈高度正相關的性狀為每株粒數 (SP, 0.77, p-value < 0.001) 與每株穗數 (PN, 0.71, p-value < 0.001),符合產量構成要素 推論 (圖四);每株粒數 (SP) 與每株穗數 (PN, 0.72, p-value < 0.001)及每穗粒數 (SPP, 0.73, p-value < 0.001) 呈高度正相關,每穗粒數 (SPP) 與著粒密度呈高度正 相關 (PD, 0.96, p-value < 0.001)。而千粒重 (TGW) 與每株粒數 (SP, -0.51, p-value < 0.001)、每穗粒數 (SPP, -0.55, p-value < 0.001)、著粒密度 (PD, -0.52, p-value < 0.001) 呈負相關之結果也顯示在粒數增加的情況下會造成千粒重的下 降,可能為產量方面與千粒重無顯著相關的原因 (0, p-value = 0.984)。其他較為 相關者為穗重 (PW) 與單株產量 (GWP, 0.54, p-value < 0.001)、每穗粒數 (SPP, 0.62, p-value < 0.001) 及著粒密度 (PD, 0.53, p-value < 0.001)。

低肥處理之性狀相關性,整體趨勢與高肥處理相同,如每株粒數 (SP) 與單 株產量 (GWP, 0.78, p-value < 0.001)、每株穗數 (PN, 0.73, p-value < 0.001)、每穗 粒數 (SPP, 0.63, p-value < 0.001)、著粒密度 (PD, 0.64, p-value < 0.001) 呈現中至 高度正相關,每穗粒數 (SPP) 與著粒密度之間呈高度正相關 (PD, 0.91, p-value <

(29)

0.001)。至於高肥低肥處理間之性狀,除了單株產量 (GWP, 0.33, p-value = 0.006) 與每株穗數 (PN, 0.31, p-value = 0.009) 兩者外,其餘皆呈現中至高度正相關 (圖 四)。

病蟲害抗性表現

本研究於 2014 年一期作及 2015 年二期作針對 AC 族群之抗病表現進行檢測。

本族群在 2014 年第一期作有 52%的個體對稻熱病 (BL) 顯示高抗病性 (抗病表 現≦1, 圖五、表三)。族群平均抗病程度為 3,代表族群含有對稻熱病的抗性。

但在 2015 年第二期作調查時,平均等級上升至 5.9,86%的個體抗病表現下降,

兩期作間有顯著差異 (t-test, p-value < 0.001),而輪迴親 TNG67 抗病等級則由極 抗升至極感。以褐飛蝨 (BPH) 抗性而言,2014 年第二期作平均表現為 4.9,屬 於具有抗性的族群,其他三期作平均抗性表現在 5.7-6.2 之間 (中抗),平均約 有 8%個體為感病,每個品系隨著年份和季節起伏而無特定趨勢,輪迴親 TNG67 的抗性表現介於 5-7 之間 (圖五、表三)。

白葉枯病 (BB) 之檢測使用兩種菌株,接種後族群病斑長度分布如圖六所示。

XF-115 平均病斑長度在低肥處理下為 9.7 cm,在高肥處理下為 11.5 cm,高肥處 理嚴重程度大於低肥處理 (t-test, p-value < 0.05);而 XF-89b 之病斑長度則分別為 7.6 及 8.3 cm,高肥與低肥處理對感病程度之影響不顯著 (t-test, p-value = 0.4) (表 三)。紋枯病 (SB) 危害比率以病斑長度除以植株高度之比率為基準 (圖七),在 高肥處理下平均株高為 102 cm、平均病斑長度為 67.5 cm、危害比率為 67.0%;

低肥處理下則分別為 94.3 cm、47.6 cm 及 51.6% (表三),可以發現無論是在株高、

病斑長度、危害比率皆為高肥處理大於低肥處理 (t-test, p-value < 0.001),株高因 施肥量增加而上升了 8%,相較之下病斑長度卻上升了 42%,也因此造成危害程 度提升了約 15%,推測高肥環境加強紋枯病之病徵。

(30)

RAD-seq 序列資料分析與比較

樣品讀序分析

本次定序共使用 Illumina Hiseq 2500 次世代核酸定序平台共 8 個 lane,讀序 總量約 87.3 億,平均每個 lane 獲得約 1.09 億讀序,每條 lane 同時針對 41 到 45 個樣品定序,相關資料如附件 3 所示。不同分析方法辨識出的 SNP 略有差異:

扣除限制酶切位序列不正確、樣品條碼錯誤或是無法辨識、以及品質較低的讀序 後所保存之讀序,最低者為 GBSv2 pipeline,餘下 77.3%序列資料,最高者為 GBS pipeline 之 94.2% (表四)。各樣品讀序平均值為 2,136,122,最多讀序數樣品為 R542 之 3,702,858、最少讀序數樣品為 R551 (2,461) (圖八 a)。檢視發現共有 16 個樣品 讀序數遠小於平均值,其中八個為 lane 6 的第四行,平均只有 7,024 個讀序,可 能原因為製備時之操作疏忽所引起。另,圖八 b 可以發現使用不同條碼對於讀序 數之影響,使用條碼 P1-46 (GTCAC) 之八個樣本,平均只有 10,764 個讀序片段;

使用條碼 P1-22 (CCCCA) 樣品平均讀序數為 3,176,313,大於整體平均值 49%,

顯示定序時讀序分配不均。上述 16 個因定序深度不足之樣本被排除於後續分析 之外。

各流程分析之分子標誌

由於親本 TNG71 之葉片取樣有誤,本次 AA 族群使用國立臺灣大學農藝系 陳凱儀博士提供之 TNG71 序列資料,使用 Stacks 進行 SNP calling。從分子標誌 數量來看,Pstacks 親本間共有 105,424 個 SNPs (Catalog),其中 36,271 個 SNPs 在族群中具有多型性 (34.1%);Ustacks 親本間可得 42,892 個 SNPs (Catalog),其 中 18,150 個 SNPs 在族群中具有多型性 (42.3%) (表五 a)。兩者經品質篩選後 (call rate≧0.9, MAF≧0.1, heterozygosity≦0.05),Pstacks 餘下 3,376 個分子標誌 (3.2%),

Ustacks 餘下 1,698 個分子標誌 (4.0%)。

在 AC 族群中,從起始 SNP 數量來看為 Pstacks > GBSv2 > GBS > Ustacks (表 五 b);Pstacks 親本間有最多的 190,192 個 SNPs,其族群中具有多型性者卻只有 2.8% (5,392);GBSv2 有次多的 91,353 個 SNPs,族群中具有多型性者佔其中 77.3%

(70,800);GBS pipeline 則得到 49,332 個 SNPs,69% (34,016) 在族群中具有多型 性;Ustacks 親本間雖然只獲得 20,542 個 SNPs,但高達 92% (20,541) 之 SNP 在

(31)

族群中呈現多型性。經相同標準 (call rate≧0.9, MAF≧0.1, heterozygosity≦0.05) 篩選後之品質佳之分子標誌數量為 GBSv2 (16,607) > GBS (9,995) > Ustacks (2,834) > Pstacks (190)。

連鎖圖譜

AA 族群之連鎖圖譜,以 Pstacks 及 Ustacks 聯集之 3,428 個品質良好之分子 標誌及 2008 年李長沛博士所使用之 157 個 SSR 分子標誌,共 3,585 個分子標誌 進行遺傳圖譜的建構。經過篩選去除重複基因型之分子標誌 (完全重複,缺值也 納入重複計算) 與個體相似度≧95%之個體後,以及手動更改錯誤之配子相後,

最後以 163 個體及 2,489 個分子標誌建立連鎖圖譜,共產生 38 個連鎖群,總長 為 1,743.3 cM,分子標誌間最大間隔為 19.4 cM,平均間隔為 1.52 cM。由於親本 852T034 為 O. nivara 與 O. sativa 雜交且回交一次後產生之插入系,分子標誌並 未均勻分布在每一條染色體上,而是位於野生稻插入之片段上,每一條染色體之 連鎖群數介於 2-5 之間,其中以第 8 條染色體有 5 個連鎖群最多 (表六)。分子 標誌最多者為第 1 條染色體有 569 個分子標誌約佔整體 23%,最少者為第 3 條染 色體,只有 15 個分子標誌位於其上 (0.6%)。

本次所得之連鎖圖譜與物理圖譜比較如圖九所示,連鎖圖譜中染色體上之分 子標誌大致都與物理圖譜的位置順序一致,除了第 12 條染色體外,其他每條染 色體皆發現分子標誌間有排序顛倒的情況,而第 4、5、9、10、11 條染色體上此 情況較為明顯,長度最長為第 11 條染色體上交錯約 5 Mbp。

AC 族群使用四個分析方法之聯集共 17,846 個品質良好之分子標誌,大部分 來自於 GBSv2 及 GBS 兩個 pipeline,經過篩選去除重複基因型之分子標誌,經 手動勘誤後餘下 69 個體、4,601 個分子標誌,其物理圖譜位置分布如圖十所示。

為了保留野生稻基因偏好插入之位置,本次並無挑除不符合分離比之分子標誌 (1,036 個不符合孟德爾分離率)。在未了解 AA 與 CC 基因體重組時之互換趨勢下,

本次 AC 族群未建構連鎖圖譜,而採用單點分析之方式尋找與性狀相關之基因 座。

(32)

數量性狀基因座

本次 AA 族群共調查 36 個性狀,其中 31 個性狀定位出顯著之 QTL,共 178 個 QTL,以第 1 條染色體上之 50 個 QTL 最多。平均 QTL 外表型解釋度為 12.1%,

其分布範圍從 2.2-35.7% (表七-表十)。

AC 族群在不同年份及不同肥料用量之處理下共有 34 個性狀與處理組合,

其中單株產量與每株穗數沒有定位到顯著之 QTL,餘下性狀共定位到 54 個 QTL,

平均每個 QTL 外表型解釋度為 10.3%,分布範圍從 0.2-52.4% (表十一-表十 三)。

抽穗日數與株高

AA 族群中,與抽穗日數有關之 QTL 分布在第 1、2、4、8、9、10 條染色 體上 (表七),解釋抽穗日數變異能力範圍介於 5.8-19.1%之間,兩期作皆定位 到 4 個 QTL 且皆有在第 1 與第 10 條染色體定位到 QTL 但位置無重複。第 4 與 第 10 條染色體上使抽穗日數縮減之 QTL 效應來自 852T034,其餘染色體上使抽 穗日數縮減之 QTL 效應來自 TNG71。與株高有關之 QTL 定位於第 1、4、7、8 條染色體上 (表七),株高變異解釋最高者為第 1 條染色體長臂上之 QTL 可解釋 35.7%,且兩期作都在此連鎖群 1.3 定位到相關 QTL。餘下之 QTL 外表型解釋度 介於 4.9-21.6%間,第 4 及第 7 條染色體上各有 1 個降低株高之 QTL 效應來自 852T034。

產量相關性狀

產量構成要素性狀中包括每株粒數、稔實率、千粒重、單株產量、每株穗數、

每穗粒數等性狀。其中,AA 族群沒有定位到與單株產量及每株粒數有關之 QTL;

AC 族群沒有定位到與單株產量及每株穗數有關之 QTL。

AA 族群與稔實率有關之 QTL 位於第 2 與第 5 條染色體上,外表型變異解 釋程度從 12.2-20.1%之間 (表七),其中一期作定位於第 2 條染色體上兩個相鄰 之 QTL 對稔實率呈現 repulsion,效應分別來自 TNG71 與 852T034,各解釋 15.5%

及 20.1%的外表型變異。二期作於第 5 條染色體上定位之 QTL 則能使稔實率上 升 3.5%,其效應來自 TNG71。AC 族群在高肥處理中定位到與稔實率有關之 QTL

(33)

位於第 2 及第 7 條染色體上,外表型變異解釋程度分別為 19.6%及 6.5% (表十一),

使稔實率增加之外表型效應皆來自 TNG67;低肥處理則無定位到相關之 QTL。

調控千粒重之 QTL 在 AA 族群中定位於第 1、4、7、12 條染色體上,解釋 千粒重變異範圍介於 7.0-14.7% (表七),其中兩期作皆定位到連鎖群 4.1、7.2 上 之 QTL,但兩期作中 4.1 連鎖群之 QTL 為不同基因座,一期作中連鎖群 1.3 上 有兩個呈現 repulsion 之 QTL,各解釋 7.0%及 14.3%外表型變異且其效應分別為 +0.9 g 及-1.3 g,第 4 條染色體上可使千粒重增加之 QTL 效應來自 852T034。AC 族群中則定位到 4 個 QTL,位於第 3、4、8 條染色體上,解釋變異程度介於 1.6

-25.9%間 (表十一),其中不同肥料處理皆有定位到第 3 條上 27.68-28.52 Mbp 附近之 QTL,並為解釋度最大之 QTL,低肥與高肥處理解釋度分別為 15.3%及 25.9%,其使千粒重增加之 QTL 效應皆來自 O. officinalis。

AA 族群與每穗粒數有關之 4 個 QTL 區域位於第 1、3、7、8 條染色體上,

其外表型解釋程度從 8.0-15.9% (表七),二期作定位到第 3 條染色體上之 QTL,

其餘 QTL 為一期作之 QTL。解釋程度最大者為第 8 條染色體上之 QTL (15.9%),

其增加每穗粒數效應值來自 TNG71,其他 3 個 QTL 效應則來自 852T034。而 AC 族群定位到 3 個 QTL,位於第 3、4、9 條染色體上,外表型解釋程度介於 3.7-

30.7% (表十一),高肥與低肥處理中有重複之 QTL 出現於第 3、4 條染色體上,

能解釋超過 30%之外表型變異,3 個增加每穗粒數之 QTL 效應皆來自 TNG67。

AA 族群與每株穗數有關之 4 個 QTL 定位於第 2、3、8、12 條染色體,外 表型解釋程度介於 8.1-12.0% (表七),兩期作無定位到重複之 QTL,除了第 3 條染色體外,其餘染色體上使每株穗數增加之 QTL 效應均來自 852T034。

AC 族群與每株粒數有關之 5 個 QTL 定位於第 2、3、11 條染色體上,外表 型解釋程度介於 3.7-27.3% (表十一),不同肥料施用量處理皆可在第 3 及第 11 條染色體上定位到 QTL,而高肥處理多定位到 1 個位於第 2 條染色體上之 QTL。

除了第 3 條染色體上 27.81 Mbp 處 QTL 效應來自 TNG67 外,其餘能使每株粒數 增加之 QTL 效應皆來自 O. officinalis。

(34)

穗部相關性狀

AA 族群中與穗長有關之 11 個 QTL 分布在第 1、2、5、11 條染色體上 (表 八),兩期作定位之 QTL 區域十分相似,二期作結果又比一期作多定位出 3 個 QTL。對於穗長之外表型解釋程度為 8.1-14.0%。除了連鎖群 1.2、1.3 及 5.3 前 端之 QTL 等位基因效應來自 852T034 外,其餘使穗長增加之 QTL 等位基因效應 皆來自 TNG71。AC 族群與穗長有關之 11 個 QTL 分布在第 2、3、4、5、8、9、

10、12 條染色體上,外表型解釋度皆小於 7% (表十二),最大者位於第 12 條染 色體 0.69 Mbp 上 (6.8%),兩種處理皆定位到其中 9 個 QTL,低肥處理多定位到 第 3 條染色體上之 QTL;高肥處理則多定位到第 10 條染色體上之 QTL。第 4、

8、9、10、12 條染色體上使穗長增加之 QTL 效應主要來自 TNG67,其餘第 2、

3、5 條染色體上之 QTL 效應來自 O. officinalis。

AA 族群與穗重相關之 6 個 QTL 分布在第 2、3、5、8、11 條染色體上,外 表型解釋能力介於 7.6-12.2% (表八)。其中,兩期作皆為連鎖群 8.5 上定位之 QTL 有最大的外表型解釋度 (12.2%、11.2%),使穗重增加之等位基因效應來自 TNG71,其他如第 3 條及第 11 條染色體上之 QTL 效應則來自於 852T034。AC 族群定位到 3 個與穗重有關之 QTL,位於第 3、9、10 條染色體上,外表型解釋 度除了第 3 條染色體上之 QTL 為 31.2%,其餘 2 個 QTL 皆小於 10% (表十二)。

不同施肥量處理皆有定位到第 10 條染色體上 20.71-21.18 Mbp 間之 QTL,使穗 重增加之 QTL 效應皆來自 TNG67。

AA 族群與著粒密度相關之 9 個 QTL 分布於第 1、3、4、5、8、11 條染色體 上,解釋著粒密度變異能力介於 5.9-19.3% (表八)。兩期作皆有定位出共同的區 域,如連鎖群 1.3、8.5、11.4 上鄰近之 QTL,且都是連鎖群 11.4 上之 QTL 有最 大之外表型解釋能力,兩期作分別為 15.5%及 19.3%。整體而言,第 3、5、11 條染色體上使著粒密度增加之等位基因效應來自 852T034,而第 1、4、8 條染色 體上之等位基因效應來自 TNG71。AC 族群在兩種處理下皆只定位到一個 QTL,

位於第 3 條染色體 27.72-28.14 Mbp 間 (表十二),外表型解釋度大於 50%,其 等位基因效應來自 TNG67。

(35)

榖粒相關性狀

AA 族群中與粒長相關之 QTL 分布於第 1、2、4、5、7、8、10、11 條染色 體上 (表九),獲得之 QTL 數量為各種分類中最多,共有 20 個 QTL,外表型解 釋能力範圍為 3.0-15.5%之間,且兩期作間都有定位出相同之 QTL,包括連鎖 群 1.3、5.3、7.2、8.5、10.1、11.4 皆位於相鄰區域。就 QTL 效應而言,第 1 及 第 4 條染色體上使粒長增加之等位基因效應主要來自 852T034,第 2 及第 10 條 染色體上有 repulsion,無法判定確切之效應來源。調控粒寬之 QTL 分布於第 1、

2、3、4、10、11、12 條染色體上 (表九),外表型解釋能力除了連鎖群 1.3、2.2 與 11.2 上有主要調控之 QTL 外,其餘解釋能力均在 5%左右,兩期作相同之 QTL 區域為第 10.3、11.2、12.3 這 3 個連鎖群內。除了無法判定連鎖群 1.3 及 2.2 上 相鄰 QTL 之 repulsion 現象外,第 3、4、10、11 條染色體上皆有來自 852T034 之效應存在。粒形受到粒長與粒寬之影響,定位與粒形相關之 QTL 與前兩者幾 近重疊,在第 1、7、8、11 條染色體上有定位到 QTL (表九),其中,兩期作定位 出相同 QTL 區域為連鎖群 1.3、11.2、11.4,分別在粒長與粒寬中被定位出相鄰 之 QTL。外表型解釋能力以一期作定位之連鎖群 1.3 上 QTL 為最大 (26.1%),

其餘介於 3.2-12.8%之間。

病蟲害抗性表現

對褐飛蝨抗性而言,AA 族群本次在一期作無定位到 QTL,二期作則定位到 3 個 QTL,分別位於第 1 條、第 4 條和第 10 條染色體上 (表十),其外表型解釋 度在 10.3-15.9%之間,第 1 條染色體上降低感病程度之 QTL 效應來自 852T034,

第 4 條和第 10 條染色體上之 QTL 效應則來自 TNG71。AC 族群定位到 5 個 QTL,

位於第 1、4、7、9 條染色體上 (表十三),外表型解釋度在 4.4-14.6%間,四期 作有 2015 年兩期作無定位到相關之 QTL,而 2014 年兩期作無重複之 QTL。第 4 條染色體上使感病程度降低之 QTL 效應來自 O. officinalis,其餘 QTL 效應來自 TNG67。

對於稻熱病抗性而言,本次 AA 族群兩期作共定位到 4 個位於第 1 條及第 4 條染色體上之 QTL (表十),在第 4 條染色體上有解釋度為 52.7%之 QTL,其餘三 者外表型解釋度皆不超過 10%,使稻熱病感病程度降低之 QTL 效應皆來自親本

(36)

852T034。AC 族群中共定位到 5 個與稻熱病有關之 QTL,位於第 1、4、7、8 條 染色體上,其外表型解釋度範圍從 0.2-27.9%間 (表十三)。兩期調查中無重複 之 QTL 被定位到,二期作只有定位到第 4 條染色體上之 QTL,其效應來自 O.

officinalis,而一期作定位之第 1 及第 8 條染色體上有使感病程度降低之 QTL 效 應來自 O. officinalis,。

對於白葉枯病生理小種 XF115 抗病程度之 QTL 定位,共有 3 個 QTL 位於第 1、4、5 條染色體上,外表型解釋度從 14.8-39.4%之間 (表十三),兩種肥料處 理下無定位到相同之 QTL,高肥處理下定位到第 4 條染色體上能減少病斑長度 之 QTL 效應來自 O. officinalis,另外兩個 QTL 效應則來自 TNG67。生理小種 F89b 之抗病程度則定位到 10 個相關 QTL,分布在第 2、4、5、6、8、11、12 條染色 體上,外表型解釋程度皆小於 7% (表十三)。兩種處理下在第 4 及第 5 條染色體 上有相同之 QTL,位於第 4、8、11、12 條染色體上使病斑長度降低之 QTL 效應 來自 O. officinalis。

對於抗紋枯病抗性部分,平均感病程度為病斑長度×100 /植株高度,因此將 目標放在影響病斑長度與感病程度之 QTL 上。在兩種不同肥料處理下,只有高 肥處理中定位到 2 個相關之 QTL,分布於第 3 及第 11 條染色體上 (表十三),外 表型解釋程度皆超過 10%。其中,第 11 條染色體上定位之 QTL 在病斑長度及平 均感病程度皆有相關,其使感病程度降低之效應來自 TNG67,而第 3 條染色體 上使感病程度降低之 QTL 效應則來自 O. officinalis,能使平均感病程度降低約 6%。

(37)

第四章、討論

序列資料分析流程

整體而言,Stacks (Pstacks/Ustacks) 與 TASSEL (GBS / GBSv2) 的差異在判 讀序列及判定 SNP 之方式有所不同。在辨識並區分各樣本讀序時,各流程保留 之片段長度由限制酶切位點開始,Stacks 保留 95 bp 之片段、GBSv2 保留片段大 小為 90 bp、GBS 則只保留 64 bp 之片段。Illumina 定序技術下有愈靠近 5′端核苷 酸平均品質愈佳之情況,Stacks 採用滑動窗口法進行序列品質篩選,單一核苷酸 品質不佳時仍有機會保留,而 GBSv2 則逐一檢驗每個核苷酸,在預設保留長度 內只要出現品質低於設定之標準即不予保留,且當讀序中出現第二個限制酶切位 或是共同轉接子序列時也將其排除。相較之下 GBS 分析流程保留之片段最短,

其因品質不佳而淘汰之讀序數最少,但也因讀序片段短而拋棄序列後段可能存在 之 SNP,具有多型性分子標誌只有 GBSv2 的 48%,篩選至最後優良之分子標誌 則只有 GBSv2 的 60% (表五 b)。

在 SNP 判定方面,Stacks 為各樣本內先進行讀序堆疊後,再進行全族群的 SNP 判定,較容易因定序深度不足而受到影響,單一個體內讀序數少於 3 之序列 則無法被保留,個體定序深度夠,親本建立之共通基因座目錄才會更加完全;

TASSEL 則將所有個體的讀序一起比對後再分辨個體基因型值,因所有讀序同時 堆疊而較容易發現各樣品中定序深度淺但真實存在之序列。例如本研究 AC 族群 中使用不同的條碼會造成樣本總讀序數有所差異 (最少 2,461 到最多 3,702,858 個讀序) (圖八),而 AC 族群由種間雜交之後代經回交後多次自交產生,野生稻 O. officinalis 插入片段佔基因體之比例低,加上個體內讀序深度不足可能造成 Stacks 在 進 行 堆 疊 時 , 排 除 帶 有 野 生 稻 基 因 片 段 之 序 列 , 導 致 Stacks (Pstacks/Ustacks) 獲得之分子標誌數量少於 TASSEL (GBS / GBSv2),因此樣本定 序深度之多寡與族群的組成方式是挑選不同分析軟體的考慮要點。

分子標誌篩選過程中,首先篩選出在族群內具有多型性之分子標誌,兩族群 中皆以 Pstacks 篩選前後差異為最大。AA 族群本次以 Pstacks 建構共通基因座目 錄時放入 TNG67、TNG71 及 O. nivara,而族群內多型性在於親本 852T034 內野

生稻插入片段,經組成至 F 世代時多數基因型趨於同型結合,所以親本間具有

(38)

多型性之分子標誌大於族群中具有多型性之分子標誌;AC 族群以 TNG67 與 O.

officinalis 建立共通基因座目錄,但在族群經回交兩次並多代自交至 BC2F19後,

這些基因座絕大多數都偏向栽培稻之同型結合基因型,為造成其多型性比例低之 原因。

本次分子標誌篩選主要以 call rate≧0.9、MAF≧0.1、heterozygosity≦0.05 三 者作為標準,在去除族群內無多型性之分子標誌後,不符合 call rate≧0.9 者為最 多,如本次 AA 族群 Pstacks 流程共有 36,271 個有多型性之 SNP,9,684 個(28%) call rate≧0.9、19,883 個 (55%) MAF≧0.1、29,995 個(83%) heterozygosity≦0.05;

Ustacks 流程共有 18,150 個有多型性之 SNP,5,015 (28%) 個 call rate≧0.9、11,182 個 (62%) MAF≧0.1、13,735 個 (76%) heterozygosity≦0.05。AC 族群 4 個流程 也呈現相同結果,皆是以 call rate≧0.9 淘汰之分子標誌最多,MAF≧0.1 次之,

heterozygosity≦0.05 最少。

觀察各分析流程所得之分子標誌,不論是 AA 族群或是 AC 族群,其特定 pipeline 並無特定偏好之染色體位置 (圖十一、圖十三)。AA 族群之分子標誌主 要集中於親本 852T034 上 O. nivara 插入之位置,在第 1、5、6、7、8、9、11 條 染色體上皆有親本 852T034 上非野生稻插入片段但具有多型性之區域,可能為 O. nivara 與 TNG67 兩者間無多型性,但與 TNG71 有多型性,或是 TNG67 與 TNG71 間具有多型性。AC 族群具有多型性之分子標誌分布於各條染色體且無特 定之位置,最多為第 7 條染色體有 563 個 SNP,最少為第 2 條染色體有 279 個 SNP。

連鎖圖譜與物理圖譜之比較

本研究 AA 族群共使用 2,489 個分子標誌建立連鎖圖譜 (圖九),包含本次分 析之 2,348 個 SNP 與先前研究之 141 個 SSR 分子標誌。比較先前李 (2008) SSR 物理圖譜與本次 SSR+SNP 之物理圖譜 (圖十二),可發現本次結果大幅增加分子 標誌之數量與密度,除了原有 SSR 分布之染色體片段外,可在第 6、8、9、11、

12 條染色體上發現具有多型性之片段,為之前無發現分子標誌之區域。而本次 SSR+SNP 之連鎖圖譜與以 157 個 SSR 分子標誌所建立之連鎖圖譜相比,連鎖群 中分子標誌數量增加使平均間隔縮小,如第 1 條染色體上之連鎖群,平均間隔從

參考文獻

相關文件

S08176 王輝明 一個亞太區、非隨機、開放性、第二期臨床試驗,用以評 估讓 KRAS 基因野生型的轉移性大腸直腸癌病患使用單

( Buddhism Goes to the Movies: Introduction to Buddhist Thought and

鋼絲軌道: (鋼絲型線燈)利用 金屬線的導電性取代傳統 電線。線燈多採用多面反 射燈泡。.. 特殊燈.

基因編輯技術以人工核酸酶辨識特定 DNA 位置,並於此處切斷雙股 DNA。DNA 斷

Theorem (M.Kalkowski, M.Karonski, and F.Pfender, 2010) ([8]) Every connected graph G 6= K 2 is 5-edge weight colorable1. Theorem (T.Bartnicki, J.Grytczuk,

The information from the questionnaire is analyzed in several statistics methods, such as descriptive statistics, factor analysis approach, reliability and validity

由於資料探勘 Apriori 演算法具有探勘資訊關聯性之特性,因此文具申請資 訊分析系統將所有文具申請之歷史資訊載入系統,利用

隨著影像壓縮技術之進步、半導體科技之快速發展、無線通訊技術與數位傳送輸技術