1
國立成功大學「邁向頂尖大學計畫」
延攬優秀人才工作報告表
NCKU’s “Aim for the Top University Project”
Work Report Form for Distinguished Scholars
□續聘
continuation of employment■ 離職
resignation100 年 7 月 13 日更新 受聘者姓名
Name of the Employee
陳昱廷
■男 女 M ale Female聘 期 Period of Employment
fro m 101 年(y) 11 月(m) 8 日(d) to 102 年(y) 4 月(m) 30 日(d) 研究或教學或科技研發與
管理計畫名稱 The project title of research,
teaching, technology development and management
生科院生命科學系比較基因體
中心/建置國際化比較基因體
學研究中心
計畫主持人
(申請單位主管)
Project Investigator (Head of Department/Center)
蔣鎮宇教授
補助延聘編號
Grant Number
HUA 101 - 3 - 9 - 547
一、 研究、教學、科技研發與管理工作全程經過概述。 (由受聘人填寫)
Please summarize the entire research, teaching, or science and technology R&D and management work process ( To be completed by the employee)
1. 接管和負責基因體研究中心之 Linux 伺服主機管理和著手安裝常用的次世代序列分析相關資訊軟體 a. 建置和管理研究中心之使用者連線帳號。
b. 安裝 ABySS ,次世代定序之嶄新組序(de novo assembly)程式套件,解決安裝問題和測試。
c. 安裝 EMBOSS 套件,歐洲開發的分子生物分析開放套件。
d. 安裝 glimmer 套件,預測蛋白編碼區域軟體。
e. 安裝 BLAST 套件和相關蛋白資料庫,自製參考序列之比較基因體資料庫。
f. 安裝 SSPACE 套件,嶄新組序輔助程式,協助建構基因組骨架 (scaffolding) 。 g. 安裝分子演化分析軟體:Ka Ks 計算器,Mega-core 軟體。
h. 安裝 SOAP2 套件,次世代定序之貼序(re-sequencing)程式套件,且著手建置貼序相關分析流程。
2. 著手研究Xanthomonas citri pv. mangiferaeindicae (XCM)感染芒果的黑腐病原菌基因體
蔣教授將實驗室畢業生初步完成的 Xanthomonas 分析交給本人研究 XCM 基因體和進行比較基因體分 析,以繼續完成研究。文獻搜尋和閱讀,2002~2012 年間,發表的十二株Xanthomonas 基因體分析報告論 文。
而蔣教授專長在分子演化分析,我們直接找差異大的蛋白序列來進行演化、親緣分析,目標尋找和區 分正向天擇基因和負向天擇基因(背景基因)。另,也會著手建置基因功能分類分析流程,以利進行致病基 因和宿主專一性基因的找尋。
完成X.citri pv. Mangiferaeindicae (XCM)最佳組裝,成為 43 連續體(scaffolds)。然後進行基因 編碼區預測和進行蛋白序列比對,得到 5391 個高可靠編碼蛋白基因。另,預測得到 55 個 tRNA 基因和 3 個 rRNA 操作子。
利用十二個參考物種蛋白序列,進行與 XCM 預測蛋白的比較基因體。利用保守的 16S rRNA 序列和相近 物種 16S rRNA 序列,進行物種間分子演化時間推估。根據 30 保守基因的演化分析,得到近似物種親緣關 係。依據演化親緣闗係,選定兩組:citri組與 campestris 組,做相近物種的組內和組間編碼區域的演化 速率分析,先取得演化分岐高的蛋白配對,再進行高演化特性蛋白的挑選,分別得到數十個,為可能的造 成不同入侵寄主差別的關鍵功能蛋白,另也推論細菌基因垂直移動可能是造成演化分岐的主因。
而此研究目前整理成的初稿,正在俢訂階段。
3. 著手研究藍綠藻基因體 GI1 菌株
a. 從合作對象取得藍綠藻基因體 GI1 菌株的基因體序列草稿與基因預測。
b. 序列截取出蛋白編碼序列,進行與近綠物種的全基因體基因的演化分析。
c. 目前己發表的藍綠藻基因體,演化時間較久,最近源物種間,基因分子演化之 Ks 值很高,因此進行 同類置換/異類置換(Ti/Tv, transition /transversion)比例的分析,了解基因演化未飽和。
d. 利用區域序列比對(BLAST)找出同源蛋白配對,再取得演化分岐高的蛋白配對,進行高演化特性蛋白 的挑選。分析造成蛋白高演化速率的原因。
4. 著手研究陰道滴蟲基因體 T1 菌株
2
a. 己發表在 Science 的 G3 代表株,其基因體不小,有 178-Mb 鹼基對,為一初稿基因體,含在 7 萬多 個長度不一的連續體片段,也含有 6 萬個蛋白表達基因和數百份的 rRNA 和 tRNA 基因。
b. 搜尋滴蟲基因體 28S-18SrRNA 之間的 ITS 區域序列得知,在演化上陰道滴蟲可分成兩群,演化上分 岐在 80 萬年內。而 T1 菌株和 G3 在同一群,屬原始群。
c. 從美國 NCBI/Genbank 資料庫取得連續體片段和其註解檔,利用 Bioperl 程式模組工具和 EMBOSS 套 件,將基因註解做資料截取與轉換。
d. 利用 SOAP2 貼序程式,在 G3 代表株上,完成 7 萬多個長度不一的連續體片段,做差異比較。
e. 利用整理後的基因註解檔案,比較 6 萬個蛋白表達基因的編碼差異和進行演化分析。
f. 依據貼序結果的整理,基因序列覆蓋率大於 90%以上,有 95.7 %的蛋白表達基因。可以用來做表達 基因的編碼差異分析。
g. 滴蟲基因體 T1 菌株的嶄新組序結果,得到 70-Mb 的連續體(contig)序列,雖然與參考物種有些差 異,但仍可用來分析和尋找不同於 G3 菌株的新基因。
5. 建置基因體和比較基因體分析平台 I. 基因體組裝流程建置:
a. 從合作的工科系伺服主機,下載XCM原始 Paired-end 序列資料檔和 mate-pair 序列資料檔。
b. 先了解實驗室,原先在次世代原始序列品質評估和處理程式的原始碼和處理原則。
c. 著手進行,次世代原始序列品質評估和處理程式的撰寫。
d. 進行XCM 資料的 ABySS 嶄新組序,分析不同品質條件下的組序結果。
e. 比較 XCM 嶄新組序結果於先前與海大資工合作之結果,而截至目前之結果,相差不多,N50 值為 66-kb,約為 300 個 DNA 連續序列(contigs)片段。組出之片段較多,預估該物種之基因體存在不少 之重覆性序列。
f. 利用建構基因組骨架軟體,以協助嶄新組序結果的改進。
II. 基因體組裝流程建置:
a. 進行連續序列(contigs)片段上,分別用不同軟體,進行蛋白編碼區,tRNA 和 rRNA 基因區域之預測。
b. 進行基因預測區域的資料庫搜尋和比對,保留高顯著性之同源結果,為可信賴的基因。
c. 針對基因預測蛋白,進行建構分子演化親緣樹分析,另,也-進行分子替換演化速率分析。
d. 在具高相似度的參考物種的分析計畫,則建置分析其基因內單一核酸(SNP)變化差異之分析流程。
6. 提昇基因體中心電腦軟、硬體設備與網路設備
a. 高速乙太網路交換器(Gigabit-Switch): 評估基因體中心內、外連網效率不佳原因,因而規劃和進 行採購高速乙太網路交換器。成功上連網路到 1000 Mb/bps,下載和上傳到工科系超電伺服器,平 時可達 15Mb/sec。
b. HP 工作站硬體規劃及軟體規劃:採購基因體中心需要的高運算計算伺服器。
c. (廠牌)磁碟陣列伺服器硬體規劃及軟體格式規劃:採購基因體中心需要的含高速光纖通道的磁碟陣 列伺服器。
二、 研究或教學或科技研發與管理成效評估( 由計畫主持人或單位主管填寫 )
Please evaluate the performance of research, teaching or science and technology R&D and management Work: (To be completed by Project Investigator or Head of Department/Center)
(1)是否達到延攬預期目標?
Has the expected goal of recruitment been achieved?
是。
(2)研究或教學或科技研發與管理的方法、專業知識及進度如何?
What are the methods, professional knowledge, and progress of the research, teaching, or R&D and management work?
協助本計劃之生物資訊相關分析之執行,並以其專業知識進行基因體資訊之組裝,達成目標進度。
(3)受延攬人之研究或教學或科技研發與管理成果對該計畫(或貴單位)助益如何?
How have the research, teaching, or R&D and management results of the employed person given benefit to the project (or your unit)?
本中心需要大量生物資訊之資料運算,陳昱廷博士至本中心服務,在研究上有很大的幫助,預計下個半年度就可將資料整理 完成,投稿至學術期刋。
(4)受延攬人於補助期間對貴單位或國內相關學術科技領域助益如何?
How has the employed person, during his or her term of employment, benefited your unit or the relevant domestic academic field?
陳昱廷博士在服務期間亦熱心指導其它同事與研究生關於生物資訊方面之分析,具體提昇整個研究團隊的研究能量。
(5)具體工作績效或研究或教學或科技研發與管理成果:
Please describe the specific work performance, or the result s of research, teaching, or R&D and management work:
預測出 5391 個高可靠編碼蛋白基因和 55 個 tRNA 基因和 3 個 rRNA 操作子。也完成利用十二個參考物種蛋白序列與 XCM 預 測蛋白的比較基因體分析,得到近似物種之間之親緣關係。進行藍綠藻基因體 GI1 菌株的分析,利用近緣物種之同源蛋白配對,
得到高演化分岐基因,分析造成蛋白高演化速率的原因。進行陰道滴蟲 T1 菌株基因體的研究,己整理出與參考物種基因變之間
3 的基因變異。
(6) 是否續聘受聘人?
Will you continue hiring the employed person?□續聘 Yes ■不續聘 No
※ 此報告表篇幅以三~四頁為原則。
This report form should be limited to 3-4 pages in principle.※ 此表格可上延攬優秀人才成果報告繳交說明網頁下載。
This report form can be downloaded in http://scholar.lib.ncku.edu.tw/explain/