• 沒有找到結果。

研究設計與研究方法

主要的毒理基因體學資料來自於CTD(http://ctdbase.org)[7],全名 為比較毒理基因體學資料庫(Comparative Toxicogenomics Database),

其資料庫內搜集了超過2000萬筆的毒理基因體相關資料(2013/06)資 料),內容包括化學物質、基因、疾病三者間的關係,另外還包含了 基因本體論及交互作用途徑與前三者的交互關係;在收集毒理基因體 學資料時,找到戴奧辛相關的化學物質後,可以發現到擁有最多相關 交互作用(13804筆)的戴奧辛化合物為TCDD (表5),查找文獻後也可 以發現,許多研究戴奧辛相關論文主要也以TCDD為研究探討對象,

因此下面以TCDD為主要資料收集對象,並且專注在人類相關的數據 資料;另一方面,從GEO(Gene Expression Omnibus,

http://www.ncbi.nlm.nih.gov/geo/)及EMBL-EBI ARRAY EXPRESS (European Molecular Biology Laboratory-European Bioinformatics Institute, http://www.ebi.ac.uk/arrayexpress/) 搜尋與TCDD相關的微陣 列晶片資料,物種選擇人類,平台則以Affymetrix GeneChip Human Genome U133 Plus 2.0 (HG-U133_Plus_2)作相關資料的收集;其中 GEO為NCBI(National Center for Biotechnology Information)的一個資 料庫,內容包含了許多的微陣列晶片及定序資料,是一開放功能性的

14

基因體資料庫;另一個EMBL-EBI ARRAY EXPRESS則為EMBL中的 資料庫,也收錄了許多歐洲方面的微陣列晶片及定序資料。

表5. 戴奧辛相關化合物基因/蛋白質交互作用數(前19名)

毒理基因體學與微陣列晶片初步分析

將自CTD搜集而來的TCDD毒理基因體學資料做整理,從其中挑 出人類的資料,將所得的基因列表送入MetaCore (GeneGo Inc., St Joseph, MI, http://www.genego.com)執行生物途徑分析及基因表現資 料採礦的軟體進行分析[28, 29],並同時針對這些基因影響的部分作 生物途徑及基因本體論上的探討。

15

而在微陣列晶片資料方面,下載挑選出的微陣列晶片資料,使用 CLC Genomics Workbench (CLC Bio, Aarhus, Denmark)進行資料的讀

取,CLC Genomics Workbench為一多功能基因體分析軟體,同時可藉 由安裝多個插件(plugin)來增加其功能;在讀取微陣列晶片數據後,

以CLC Genomics Workbench內建的功能將微陣列晶片中不同時間及 不同濃度部分作基本的統計分析,挑選其中FDR(False Discovery Rate) P-Value < 0.05的數據,輔以基因註解檔案解讀,將相對應的基因列表 篩選出來。

視覺化資料

為了呈現得到的基因列表實際交互作用的情形,需將資料以視覺 化的方式呈現,將基因列表以 MetaCore 進行分析並產生生物網絡關 係,接下來視覺化的部分需仰賴視覺化軟體作處理,這類軟體有相當 多選擇(表 6),像是採用 Java 語言作撰寫的 CuttleFish, igraph, Gephi、

商用軟體 IPA, NetMiner,又或者是開放原始碼的 Cytoscape,這些軟 體都可以用來做視覺化處理,而在本篇研究中,我們選用了 Cytoscape 來產生生物網絡,此軟體為視覺化工具,可以將各項數據轉化為節點,

輔以各節點之關係數據以產生網絡圖,可以更清楚瞭解詳細的相互作 用關係[30],Cytoscape 優點在於為一開放原始碼的平台,檔案在不同

16

作業系統上可相互通用,同時也有許多軟體開發者所開發之插件可供 使用,讓即便不擅程式語言的使用者,也能輕鬆地使用其他使用者所 開發的插件。

表 6.視覺化分析軟體一覽

除了使用原先 Cytoscape 內建的視覺化模板外,我們另外使用了 3DScape 這個視覺化模板,3DScape 可以將原先的網絡作三維空間的 運算,增加的一維空間可以呈現更複雜的網絡,並且讓整個網絡更貼 近實際在生物體內交互作用的情形,使得其中有著較高影響性的節點 能夠輕易地被找出來,即便不使用相關的統計數據去做分析,也可以 讓使用者較容易由錯綜複雜的網絡中找到高影響性的節點[31]。

統計數據分析

得到生物網絡後,再使用 Cytoscape 可供安裝的插件 CentiScaPe 來進行網絡的分析,此插件可以用來分析多個統計數據[32],特別是 用在網絡上各個節點相關指標,像是重要向心性(Stress Centrality)、

Name Fuctions Free or Commical Platform

IPA analysis and visualization of biological data commical Java NetMiner4 analysis and visualization of network data commical Windows

CuttleFish network visualization free Java

igraph creating and manipulating graphs free Java

SNA network analysis and visualization free Win, Mac(with QT toolkit)

Gephi visualization and manipulation free Java+OpenGL

cytoscape network data integration, analysis and visuaization free Java

Pajek network analysis free Java

17

放射中心度指標(Radiality Centrality)、參與中間度指標(Betweenness Centrality)等 7 項數據,其中又以統稱中間度指標(Nodal Centrality)者

最能看出一個節點的重要性,簡單來說就是判讀一個節點在網絡中的 核心程度,包括了連接中間度指標(Degree Centrality)、近距中間度指 標(Closenness centrality)、參與中間度指標三者數據[33],這些數據已

經廣泛被使用在社群網絡或是人際網絡的分析上,用來代表不同人在 社群網絡中的重要性[34, 35],這三個統計數據公式如下:

Degree Centrality[33]:當一個圖(G)為 G=(V,E)共有 n 個節點時,

連接中間度指標 CD(ν)的公式為:

CD (ν)=!"# !!!!

deg(ν)為點 ν 的鄰居數,除以總點數扣除自身的點數(n-1)後,即得 CD (ν),其數值越大則代表相接的點越多,表示其重要性越高。

Closenness centrality[33]:為點至其他節點間的直線距離,公式 為:

CC (ν)= !!(!,!)

!∈!/  !

其中 d(ν, t)為任一點 t 至 ν 的距離,此值越大則顯示結點 ν 與圖上多 點的距離很近,傳遞訊息的速度也很快。

18

19

圖 5. 微陣列晶片資料分析流程。

20

相關文件