以生物網絡研究戴奧辛的毒理基因體機轉
全文
(2) 致謝 穿過陽光所形成的林蔭下,走上數十階的階梯,轉個轉角,打開 門鎖,迎面而來的,是與外頭溫度有些落差的微風,是的,這邊是待 了兩年左右的研究室。 在研究室裡汲汲營營了兩年左右的時間,春去秋來,時間不可謂 短,在當中的腦力激盪及討論,促使了最後這篇論文的產生,最要感 謝地,自然是我的指導教授-沈林琥老師,沒有了老師的意見,這篇 論文也不會就這樣有了開始;在論文的內容上,也承蒙沈老師的指導 及建議,更遑論學術知識、簡報技巧、文章書寫及做人處世上的啓發 與經驗汲取,一切的一切都給我在碩士班的求學過程及論文的完成上, 都為不可或缺的元素。 感謝口試委員余松良博士與孫英傑博士在百忙之中抽空參加,並 對於原本論文中較為不足之處,不吝給予其專業的建議,讓這篇論文 的論述,得以更加的完善,再次的獻上誠摯的感謝。 感謝劉君帆先生在技術部分上的指導,讓我從對程式語言完全不 熟,在經過多次的課程與例子實作後,對於程式語言有初步的瞭解及 熟悉,因此補足了先前所不足的部分,讓我在之後相關軟體的使用上, 能更加快速的上手,順利執行論文中視覺化部分的工作。 感謝王昀珩先生在分析軟體使用上的訓練,讓我在進行資料的處. i.
(3) 理時,能快速並準確地得到正確的資料,讓論文的內容能順利的如期 完成。 在研究室的時光裡,學長田耘政的經驗分享及開導,讓我在遇到 研究上的不順遂時,能夠打起精神繼續走下去;學弟陳育興在旁時時 刻刻表現出的努力向學精神,則讓我想要鬆懈時,再次燃起奮鬥下去 的意念。 感謝學樺、長亨、文賢、君晏、師晟、伊涵、宗穎、裕翔及庭維 在這兩年的碩士生活中的陪伴,雖然我們走的路略有不同,但你們的 陪伴及分享,都讓我在這兩年的時光過得充足,謝謝你們。 最後要感謝的,是我的父母及家人,有了你們在背後的支持與鼓 勵,讓我即便在大學的求學路上過得並不順遂,也能勇敢地往研究所 邁進,更讓我在求學的過程中,不為生活的開銷所煩惱,可以毫無顧 忌的專心於學業的攻讀,乃至於今天順利取得碩士學位。. 民國一零二年八月 王國信於 師大生科系. ii.
(4) 目錄 致謝----------------------------------------------------------------------------i 目錄----------------------------------------------------------------------------I 表目錄------------------------------------------------------------------------II 圖目錄-----------------------------------------------------------------------III 中文摘要-------------------------------------------------------------------VII 英文摘要--------------------------------------------------------------------IX 1. 緒論-----------------------------------------------------------------------1 2. 研究設計與研究方法------------------------------------------------13 3. 研究結果---------------------------------------------------------------20 4. 結果討論與延伸------------------------------------------------------91 5. 參考文獻--------------------------------------------------------------104 附錄--------------------------------------------------------------------117. I.
(5) 表目錄 表1.. 斯德哥爾摩公約 12 項持久性有機汙染物-------------------------2. 表2.. 2011 年 05 月 環境空氣戴奧辛監測資料(環保署, 2011)--------4. 表3.. 文獻中已知 TCDD 相關多種疾病-----------------------------------9. 表4.. 文獻中指出 TCDD 具有的生物毒性--------------------------------9. 表5.. 戴奧辛相關化合物基因反應數(前 19 名)------------------------14. 表6.. 視覺化分析軟體一覽------------------------------------------------16. 表7.. TCDD 對不同物種間基因/反應數前 20 名的基因--------------21. 表8.. GeneGO 反應途徑圖-途徑前 10 名--------------------------------22. 表9.. GeneGO 反應途徑圖-疾病前 10 名--------------------------------24. 表10.. E-MEXP-2458 生物網絡中具高中間度指標列表---------------89. 表11.. E-MEXP-2574 生物網絡中具高中間度指標列表---------------90. 表12.. E-MEXP-2817 生物網絡中具高中間度指標列表---------------90. 表13.. E-GEOD-25034 生物網絡中具高中間度指標列表-------------91. 表14.. 各網絡中間度指標最高者------------------------------------------95. 表15.. 所有微陣列晶片資料中,各網絡高中間度指標節點-----------96. 表16.. 各網絡中間度指標最高者與鄰居數比較------------------------99. 表17.. 與 miR-191 相關的疾病--------------------------------------------102. II.
(6) 圖目錄 圖1.. 戴奧辛基本化學結構--------------------------------------------------6. 圖2.. TCDD 化學結構--------------------------------------------------------7. 圖3.. TCDD 影響 AhR 進一步造成 C1P1A1 的表現量改變----------10. 圖4.. 簡易判別高中間度指標範例---------------------------------------18. 圖5.. 微陣列晶片資料分析流程------------------------------------------19. 圖6.. 細胞分化:細胞內基質重構途徑----------------------------------23. 圖7.. TCDD 可能影響基因本體論中的生化交互作用----------------25. 圖8.. TCDD 可能影響基因本體論中的細胞區域----------------------25. 圖9.. TCDD 可能影響基因本體論中的分子機制----------------------26. 圖10.. 2458-net1-1 的 force directed 圖-------------------------------------28. 圖11.. 2458-net1-3 的 span tree 圖-------------------------------------------30. 圖12.. 2458-net2-1 的 force directed 圖-------------------------------------31. 圖13.. 2458-net2-3 的 span tree 圖-------------------------------------------32. 圖14.. 2458-net3-1 的 force directed 圖-------------------------------------33. 圖15.. 2458-net3-3 的 span tree 圖-------------------------------------------34. 圖16.. 2458-net4 的 force directed & span tree 圖-------------------------35. 圖17.. 2458-net7 的 force directed & span tree 圖-------------------------37. 圖18.. 2458-net9 的 force directed & span tree 圖-------------------------38. III.
(7) 圖19.. 2458-net11-1 的 force directed 圖-----------------------------------39. 圖20.. 2458-net11-3 的 span tree 圖-----------------------------------------40. 圖21.. 2574-net1-1 的 force directed 圖-------------------------------------41. 圖22.. 2574-net1-3 的 span tree 圖-------------------------------------------42. 圖23.. 2574-net2-1 的 force directed 圖-------------------------------------43. 圖24.. 2574-net2-3 的 span tree 圖------------------------------------------44. 圖25.. 2574-net3-1 的 force directed 圖-------------------------------------45. 圖26.. 2574-net3-3 的 span tree 圖-------------------------------------------46. 圖27.. 2574-net4-1 的 force directed 圖-------------------------------------47. 圖28.. 2574-net4-3 的 span tree 圖-------------------------------------------48. 圖29.. 2574-net5-1 的 force directed 圖-------------------------------------49. 圖30.. 2574-net5-3 的 span tree 圖-------------------------------------------50. 圖31.. 2574-net6-1 的 force directed 圖-------------------------------------51. 圖32.. 2574-net6-3 的 span tree 圖------------------------------------------52. 圖33.. 2574-net7-1 的 force directed 圖-------------------------------------53. 圖34.. 2574-net7-3 的 span tree 圖-------------------------------------------54. 圖35.. 2574-net9-1 的 force directed 圖-------------------------------------55. 圖36.. 2574-net9-3 的 span tree 圖-------------------------------------------56. 圖37.. 2574-net11-1 的 force directed 圖-----------------------------------57. IV.
(8) 圖38.. 2574-net11-3 的 span tree 圖-----------------------------------------58. 圖39.. 2817-net1-1 的 force directed 圖-------------------------------------59. 圖40.. 2817-net1-3 的 span tree 圖------------------------------------------60. 圖41.. 2817-net2-1 的 force directed 圖-------------------------------------61. 圖42.. 2817-net2-3 的 span tree 圖-------------------------------------------62. 圖43.. 2817-net3-1 的 force directed 圖-------------------------------------63. 圖44.. 2817-net3-3 的 span tree 圖-------------------------------------------64. 圖45.. 2817-net4-1 的 force directed 圖-------------------------------------65. 圖46.. 2817-net4-3 的 span tree 圖------------------------------------------66. 圖47.. 2817-net7 的 force directed & span tree 圖-------------------------67. 圖48.. 2817-net9-1 的 force directed 圖-------------------------------------68. 圖49.. 2817-net9-3 的 span tree 圖------------------------------------------69. 圖50.. 2817-net11-1 的 force directed 圖-----------------------------------70. 圖51.. 2817-net11-3 的 span tree 圖-----------------------------------------71. 圖52.. agli-net1-1 的 force directed 圖--------------------------------------72. 圖53.. agli-net1-3 的 span tree 圖--------------------------------------------73. 圖54.. agli-net2-1 的 force directed 圖--------------------------------------74. 圖55.. agli-net2-3 的 span tree 圖--------------------------------------------75. 圖56.. agli-net3-1 的 force directed 圖--------------------------------------76. V.
(9) 圖57.. agli-net3-3 的 span tree 圖--------------------------------------------77. 圖58.. agli-net4-1 的 force directed 圖--------------------------------------78. 圖59.. agli-net4-3 的 span tree 圖--------------------------------------------79. 圖60.. agli-net5-1 的 force directed 圖--------------------------------------80. 圖61.. agli-net5-3 的 span tree 圖--------------------------------------------81. 圖62.. agli-net6-1 的 force directed 圖--------------------------------------82. 圖63.. agli-net6-3 的 span tree 圖--------------------------------------------83. 圖64.. agli-net7-1 的 force directed 圖--------------------------------------84. 圖65.. agli-net7-3 的 span tree 圖--------------------------------------------85. 圖66.. agli-net9-1 的 force directed 圖--------------------------------------86. 圖67.. agli-net9-3 的 span tree 圖--------------------------------------------87. 圖68.. agli-net11-1 的 force directed 圖-------------------------------------88. 圖69.. agli-net11-3 的 span tree 圖-------------------------------------------89. 圖70.. TCDD 與多氯聯苯類影響基因比較-----------------------------100. 圖71.. TCDD 與多環芳香烴類影響基因比較--------------------------100. VI.
(10) 摘要 戴奧辛類(Dioxins)的相關化合物目前已知共有 76 個,其中以四氯 戴奧辛(2,3,7,8-Tetrachlorodibenzo-p-dioxin, TCDD)是最常用來作為研 究戴奧辛毒性的化學物質,同時也有最多相關的基因-反應數。為了 探討重要的基因/受體(Receptor),需要分析 TCDD 相關的各項研究數 據,尤其是毒理基因體方面的資料,再輔以視覺化生物網絡及統計數 據的計算;本篇研究以 Gene Set Enrichment Analysis (GSEA)分析 TCDD 相關的毒理基因體學數據,包含有基因本體論(GeneOntology, GO)及相關途徑的分析,另一方面搜集相關微陣列晶片(microarray)的 資料,其後篩選出 FDR p-value < 0.05 的基因列表,並利用 Cytoscape 視覺化生物網絡(Biological Networks)及搭配統計中間度指標(包含: 連接中間度指標、近距中間度指標、參與中間度指標)計算加以分析。. 完成上述分析後,我們從毒理基因體資料分析中了解 TCDD 的毒 理基因體相關機轉,得到 TCDD 影響人類的 2234 個不重複基因,進 一步找出 TCDD 對於人類生理上影響的廣泛性及最有可能影響的基 因及疾病;在微陣列晶片資料的分析中,藉著視覺化及統計數據的分 析,由統計數據的不同得以確切的比較出對於不同基因或受體的作用 差異,找出了像是 HDAC1、E2F1、SP1 這些與過往文獻中不盡相同. VII.
(11) 的結果,這些研究結果再經由進一步的分析比對後,也可能在之後的 相關毒理及病理研究上,作為可用的生物標的。. 中文關鍵字:戴奧辛、生物網絡、中間度指標、近距中間度指標、參 與中間度指標、連接中間度指標。. VIII.
(12) Abstract To investigate the important genes/receptors, we were analyzing toxicogenomics data of 2,3,7,8-Tetrachlorodibenzo-p-dioxin (TCDD) in human and visualizing biological networks to calculate the nodal centrality (including: betweenness centrality, closenness centrality and degree centrality) describing the network topology.. More than 70 chemicals have been found in dioxin family, and TCDD is the chemical compound that has the greatest number of gene-interactions.. Retrieving. TCDD. toxicogenomics. data. from. Comparative Toxicogenomics Database (CTD). Using Gene Set Enrichment Analysis (GSEA) method to analyze gene sets by pathways, GeneOntology (GO) and networks. To analyze array data of TCDD effect of human using Affymetrix GeneChip Human Genome U133 Plus 2.0 platform (HG-U133_Plus_2), we use CLC genomics workbench software to execute statistical analysis. After mining feature ids at false discovery rate (FDR) p-value less than 0.05, we add annotations of their gene symbols. The visualization software Cytoscape could construct biological network with gene list, and its plugin CentiScaPe can compute specific nodal centrality parameters in the biological networks analyze.. The curated interactions between TCDD and genes/interactions were obtained from CTD, and 2234 unique human genes/proteins were found. The GO and pathways of these 2234 genes/proteins were fully analyzed. The top 20 genes/proteins may serve as molecular biomarkers of TCDD IX.
(13) toxicity. The top 10 diseases included pathologic processes, female urogenital, stomach, skin, adnexal and ovarian disease. The high nodal centrality nodes, HDAC1, E2F1 and SP1 are retrieved by CentiScaPe from TCDD related toxicogenomics data(E-MEXP-2817, E-MEXP-2574, E-MEXP-2458 and E-GEOD-35034). Someday, these results could be biomarks using in biosensor system to detect chemicals in human body.. Keywords: Dioxins; Biological Networks; Nodal Centrality; Closenness Centrality; Betweenness Centrality; Degree Centrality.. X.
(14) 1. 緒論 壹、 研究背景 環境賀爾蒙 Rachel Carson 在 1962 年所寫的“寂靜的春天”一書,內容介紹了 當時所廣泛使用的殺蟲劑 DDT(Dichlorodiphenyltrichloroethane,雙對 氯苯基三氯乙烷)對於周遭環境及生物的危害,同時也帶動了之後相 關化學物質的研究;這類會影響動物內分泌系統(賀爾蒙系統)的化學 物質統稱為環境賀爾蒙(Endocrine Distrupting Chemicals, EDCs)[1],像 是前面所提到的 DDT,另外還有像是多氯聯苯類(Polychlorinated Biphenyl, PCBs) 、 雙 酚 A(Bisphenol A, BPA) 、 多 溴 二 苯 醚 類 (Polybrominated Biphenyl ethers, PBDEs)、之前被大家關注的塑化劑- 鄰苯二甲酸酯類(Phthalates, PAEs),另外還有被稱作世紀之毒的戴奧 辛類。. 持久性有機汙染物 而在環境賀爾蒙中又有一部份被稱作持久性有機汙染物,在經過 許多研究後,了解到這些化學物質具有以下的幾個特性:具有持久性 -存在環境中的時間長、具生物累積性、對於人類及環境有相當大的 風險[2];這些物質會經由各種管道進入到環境中,進而汙染空氣、. 1.
(15) 土壤、水,而進入生物體內,經由食物鏈最終累積在食用這些動植物 的人體中,提高多種疾病發生的風險,特別是生殖功能上的影響,對 於男性及女性都有相同的危害[1]。. 全球管理現況 表 1. 斯德哥爾摩公約 12 項持久性有機汙染物 Annex. Name. A. Elimination. Aldrin Chlordane Dieldrin Endrin Heptachlor Hexachlorobenzene Mirex Toxaphene Polychlorinated biphenyls (PCBs). B. Restriction C. Unintentional Production. DDT Polychlorinated dibenzo-p-dioxins ("dioxins") and Polychlorinated dibenzofurans Polychlorinated biphenyls (PCBs) Hexachlorobenzene. 2.
(16) 針對這些持久性有機汙染物,聯合國也在 2005 年簽訂了斯德哥 爾摩公約(Stockholm Convention on Persistent Organic Pollutants) 來管 理這些會造成環境,甚至是人體危害的化學物質,公約中條列了 12 項的持久性有機汙染物,並將其分為以下三類:禁止(Elimination)、 限制(Restriction)、減少或消除無意產生(Unintentional Production)(表 1),除了 2005 年所條列的化學物質外,之後在 2006、2007、2009 的 會議中,也增加了近 20 種的化學物質做管制的動作。. 台灣環境檢測資料 以下的資料也可以看到台灣的環境中有這些持久性有機汙染物,首先, 2002 至 2005 年間環保署陸續在全台 21 條河川偵測持久性有機汙染 物,結果顯示全台各地由南到北河川中都有持久性有機汙染物的測出; 而 2004 年至 2006 年間環保署偵測河川中多氯聯苯類(屬持久性有機 汙染物)的分佈情形,亦有相同的結果[3, 4]。. 3.
(17) 表 2. 2011 年 05 月 環境空氣戴奧辛監測資料(環保署, 2011) 空品區. 縣市. 測站. 監測日期. 環境戴奧辛監測 (pg I-TEQ/m3). 南投縣. 康壽國小. 20110516. 0.017. 彰化縣. 忠孝國小. 20110516. 0.061. 臺中市. 忠明國小. 20110516. 0.019. 大里市公所. 20110516. 0.039. 基隆市. 基隆女中. 20110509. 0.013. 新北市. 秀峰高中. 20110509. 0.024. 桃園縣. 桃園農工. 20110509. 0.054. 臺北市. 松山國小. 20110509. 0.021. 宜蘭空品區. 宜蘭縣. 宜蘭國小. 20110509. 0.027. 竹苗空品區. 新竹市. 東門國小. 20110516. 0.013. 新竹縣. 信勢國小. 20110509. 0.026. 苗栗縣. 苗栗縣議會. 20110516. 0.013. 花東空品區. 臺東縣. 臺東縣政府. 20110516. 0.013. 雲嘉南空品區. 嘉義市. 興嘉國小. 20110516. 0.028. 嘉義縣. 新港國小. 20110516. 0.032. 臺南市. 中山國中. 20110516. 0.022. 新營國小. 20110516. 0.024. 雲林縣. 崙背國中. 20110516. 0.015. 屏東縣. 中正國小. 20110509. 0.032. 高雄市. 楠梓國小. 20110509. 0.02. 八卦國小. 20110509. 0.038. 中部空品區. 北部空品區. 高屏空品區. 4.
(18) (pg I-TEQ/m3=皮克(10-12)/每平方公尺);{TEQ (Toxicity Equivalency Quantity of 2,3,7,8-tetrachlorinated dibenzo-p-dioxin);I-TEQ (International Toxic Equivalents)}。. 由台灣都會區空氣戴奧辛監測資料(表 2)[5]可以看到在不同地區 的空氣中也同樣的測出持久性有機汙染物-戴奧辛,以上的資料可以 看到這些持久性有機物染物質在台灣普遍存在,且分佈範圍廣泛,因 此,了解這些持久性有機汙染物就變得相當重要。. 5.
(19) 戴奧辛. 圖 1.戴奧辛基本化學結構 戴奧辛的主要結構是由兩個苯環加兩個氧原子鍵結構成(圖 1),這 樣的結構為脂溶性,也就是這樣的特性讓戴奧辛相當穩定,難以從身 體排除,容易累積在動物體內;戴奧辛被稱為世紀之毒,也是在斯德 哥爾摩公約規範的 12 項持久性有機汙染物中被列為控制排放(減少或 消除無意產生)的項目之一,因為戴奧辛並非是工業生產的產物,而 是在工業處理過程中產生的次級產物,所以只能盡可能地減少處理中 生產的量;再來最重要的還有其目前已知的多種毒性,同時文獻中也 有提到戴奧辛已知對生物的生化危害性[6]。. 目前已知的戴奧辛相關化合物共有 70 多種[7],在許多毒理學研 究的文獻當中,研究人員常以 TCDD 為主要研究材料。TCDD 化學 全名為 2,3,7,8-Tetrachlorodibenzo-p-dioxin,在戴奧辛主結構的 2,3,7,8 的位置 各接上了一個氯基(Chloride)(圖 2). 6.
(20) TCDD. 圖 2. TCDD 化學結構. TCDD 是最足以代表戴奧辛,也是毒性最強的戴奧辛化合物,這 點可以從分析戴奧辛的劑量單位—毒性當量(Toxic Equivalent, TEQ) 就可以看出來;其分析的方式為毒性當量因子(Toxic Equivalency Factor, TEF) 乘上所測得的濃度;TEF 就是毒性當量因子的簡稱,不 同的戴奧辛化合物有各自的數值,其中為基準的便是 TCDD,足見其 毒性;而在相關的研究論文中也有提到 TCDD 對於人體相當危險, 同時也是用來了解戴奧辛化合物毒性的模式物質[8]。目前大多數 TCDD 的研究皆專注於特定疾病、物種與基因,而從體/組學角度研 究 TCDD 的相關文獻較少。. TCDD 相關疾病及影響 目 前 已 經 發 現 TCDD 與 許 多 疾 病 相 關 ( 表 3) , 如 肺 癌 (Lung cancer)[9] 、 慢 性 阻 塞 性 肺 部 疾 病 (Chronic obstructive pulmonary. 7.
(21) disease)[10]、消瘦症候群(Wasting syndrome)[11]、良性/惡性腫瘤 (Tumor promotion)[12]、內分泌系統異常(Endocrine system modulation)[13]、胸腺萎縮(Thymus atrophy)[14]、上皮組織及淋巴組 織的病變(Epithelial hyperplasia/metaplasia; Lymphoid involution)[15]、 乳癌(Breast Cancer)[16]、細胞壞死(Necrosis)[17]、氧化壓力的增加並 造成去氧核糖核酸的傷害(Reactive oxygen species (ROS)/Oxidative stress; DNA damage)[18, 19]等疾病或病徵;而 TCDD 已知的生理毒性 則 有 以 下 幾 種 : 生 殖 和 發 育 毒 性 (Reproductive & Developmental toxicity)[20, 21] 、 心 臟 毒 性 (Cardiotoxicity)[22] 、 神 經 毒 性 (Neurotoxicity)[23] 、 肝 臟 毒 性 (Hepatotoxicity)[13] 、 致 畸 性 (Teratogenicity)[24]、免疫毒性(Immunotoxicity)[13,23]等(表 4)。. 8.
(22) 表 3. 文獻中已知 TCDD 相關多種疾病 Name Lung cancer Chronic obstructive pulmonary disease Wasting syndrome Tumor promotion Endocrine system modulation Thymus atrophy Epithelial hyperplasia Epithelial metaplasia Lymphoid involution Porphyria Breast cancer Lung cancer Necrosis DNA damage Cell cycle distributions Reactive oxygen species (ROS) Oxidative stress DNA damage. References Toyoshiba et al. 2004 N'Jai et al. 2008. Nohara et al. 2008 Mathew et al. 2009. Audouze et al. 2010. Magkoufopoulou et al. 2011 Jennen et al. 2011. 表 4. 文獻中指出 TCDD 具有的生物毒性 Toxicities. References. Reproductive toxicity. Mathew et al. 2008. Developmental toxicity Immunotoxicity Cardiotoxicity Teratogenicity Neurotoxicity Teratogenicity. N'Jai et al. 2008. Immunotoxicity Hepatotoxicity. 9.
(23) 圖 3. TCDD 影響細胞內的 AhR,會造成原先與 HSP90 結合、Arnt 的 共同作用,最終造成 C1P1A1 的表現量改變[6]. 已知 TCDD 影響 mRNA 的途徑(Pathway)會影響特定的受體,而 引起一連串的交互作用(圖 3)[6],甚至會導致疾病的發生;而國內外 也有受戴奧辛危害的報導,例如烏克蘭總統受戴奧辛毒害[25];還有 食物受到戴奧辛汙染的案例,像是中石化戴奧辛的汙染,造成河川裡 的魚戴奧辛驗出超標[26];在英國發現從德國進口的食用蛋也受到戴 奧辛汙染[27],可見戴奧辛的危害。. 10.
(24) 貳、 研究問題. 如何在已知的大量基因及疾病數據中,以毒理基因體學角度找出 真正具有影響性的基因或是標的蛋白。. 參、 研究目的. 在目前眾多的 TCDD 相關研究中,毒理基因體學(Toxicogenomics) 的文獻較少,使用生物網絡的研究又更在少數,故本篇論文的研究目 的有以下幾點:. A. 搜 集 不 同 的 研 究 數 據 , 包 括 : 基 因 體 資 料 、 微 陣 列 晶 片 (Microarray)、毒理學資料等相關的研究數據。 B. 分析以上研究數據,從中挑選出與人類相關之研究,並將數 據以統計軟體進行分析,找出這些資料的共通性,進而探討這些資料 在基因本體論(Gene Ontology, GO)上的意義。 C. 將挑選出來的數據以生物網絡方法分析並視覺化,搭配統計 軟體分析並找出其中具統計意義的節點(Node),再加以深入探討其生 理意義。. 11.
(25) 肆、 研究的重要性. l 關於 TCDD 對於人體影響的研究相當的多,也研究了很長的 一段時間,從這麼大量的資料找出其中具有關鍵性的資訊是個重要的 課題。 l 目前少有 TCDD 的毒理基因體學研究,多為研究個別機制, 較缺乏整體性觀點,可能因此忽略了部分真正關鍵的部分。 l 將相關資料列表以生物網絡的方式呈現,可以更清楚瞭解到 各個部分的關聯性,輔以統計軟體分析後的數據,更能看出各個節點 在整個網絡裡的重要性,進一步了解其在生物體內所扮演的角色差 異。. 12.
(26) 2. 研究設計與研究方法 TCDD 相關資料收集 主要的毒理基因體學資料來自於CTD(http://ctdbase.org)[7],全名 為比較毒理基因體學資料庫(Comparative Toxicogenomics Database), 其資料庫內搜集了超過2000萬筆的毒理基因體相關資料(2013/06)資 料),內容包括化學物質、基因、疾病三者間的關係,另外還包含了 基因本體論及交互作用途徑與前三者的交互關係;在收集毒理基因體 學資料時,找到戴奧辛相關的化學物質後,可以發現到擁有最多相關 交互作用(13804筆)的戴奧辛化合物為TCDD (表5),查找文獻後也可 以發現,許多研究戴奧辛相關論文主要也以TCDD為研究探討對象, 因此下面以TCDD為主要資料收集對象,並且專注在人類相關的數據 資料;另一方面,從GEO(Gene Expression Omnibus, http://www.ncbi.nlm.nih.gov/geo/)及EMBL-EBI ARRAY EXPRESS (European Molecular Biology Laboratory-European Bioinformatics Institute, http://www.ebi.ac.uk/arrayexpress/) 搜尋與TCDD相關的微陣 列晶片資料,物種選擇人類,平台則以Affymetrix GeneChip Human Genome U133 Plus 2.0 (HG-U133_Plus_2)作相關資料的收集;其中 GEO為NCBI(National Center for Biotechnology Information)的一個資 料庫,內容包含了許多的微陣列晶片及定序資料,是一開放功能性的. 13.
(27) 基因體資料庫;另一個EMBL-EBI ARRAY EXPRESS則為EMBL中的 資料庫,也收錄了許多歐洲方面的微陣列晶片及定序資料。 表5. 戴奧辛相關化合物基因/蛋白質交互作用數(前19名). 毒理基因體學與微陣列晶片初步分析 將自CTD搜集而來的TCDD毒理基因體學資料做整理,從其中挑 出人類的資料,將所得的基因列表送入MetaCore (GeneGo Inc., St Joseph, MI, http://www.genego.com)執行生物途徑分析及基因表現資 料採礦的軟體進行分析[28, 29],並同時針對這些基因影響的部分作 生物途徑及基因本體論上的探討。. 14.
(28) 而在微陣列晶片資料方面,下載挑選出的微陣列晶片資料,使用 CLC Genomics Workbench (CLC Bio, Aarhus, Denmark)進行資料的讀 取,CLC Genomics Workbench為一多功能基因體分析軟體,同時可藉 由安裝多個插件(plugin)來增加其功能;在讀取微陣列晶片數據後, 以CLC Genomics Workbench內建的功能將微陣列晶片中不同時間及 不同濃度部分作基本的統計分析,挑選其中FDR(False Discovery Rate) P-Value < 0.05的數據,輔以基因註解檔案解讀,將相對應的基因列表 篩選出來。. 視覺化資料 為了呈現得到的基因列表實際交互作用的情形,需將資料以視覺 化的方式呈現,將基因列表以 MetaCore 進行分析並產生生物網絡關 係,接下來視覺化的部分需仰賴視覺化軟體作處理,這類軟體有相當 多選擇(表 6),像是採用 Java 語言作撰寫的 CuttleFish, igraph, Gephi、 商用軟體 IPA, NetMiner,又或者是開放原始碼的 Cytoscape,這些軟 體都可以用來做視覺化處理,而在本篇研究中,我們選用了 Cytoscape 來產生生物網絡,此軟體為視覺化工具,可以將各項數據轉化為節點, 輔以各節點之關係數據以產生網絡圖,可以更清楚瞭解詳細的相互作 用關係[30],Cytoscape 優點在於為一開放原始碼的平台,檔案在不同. 15.
(29) 作業系統上可相互通用,同時也有許多軟體開發者所開發之插件可供 使用,讓即便不擅程式語言的使用者,也能輕鬆地使用其他使用者所 開發的插件。. 表 6.視覺化分析軟體一覽 Name Fuctions IPA analysis and visualization of biological data NetMiner4 analysis and visualization of network data CuttleFish network visualization igraph creating and manipulating graphs SNA network analysis and visualization Gephi visualization and manipulation cytoscape network data integration, analysis and visuaization Pajek network analysis. Free or Commical Platform commical Java commical Windows free Java free Java free Win, Mac(with QT toolkit) free Java+OpenGL free Java free Java. 除了使用原先 Cytoscape 內建的視覺化模板外,我們另外使用了 3DScape 這個視覺化模板,3DScape 可以將原先的網絡作三維空間的 運算,增加的一維空間可以呈現更複雜的網絡,並且讓整個網絡更貼 近實際在生物體內交互作用的情形,使得其中有著較高影響性的節點 能夠輕易地被找出來,即便不使用相關的統計數據去做分析,也可以 讓使用者較容易由錯綜複雜的網絡中找到高影響性的節點[31]。. 統計數據分析 得到生物網絡後,再使用 Cytoscape 可供安裝的插件 CentiScaPe 來進行網絡的分析,此插件可以用來分析多個統計數據[32],特別是 用在網絡上各個節點相關指標,像是重要向心性(Stress Centrality)、 16.
(30) 放射中心度指標(Radiality Centrality)、參與中間度指標(Betweenness Centrality)等 7 項數據,其中又以統稱中間度指標(Nodal Centrality)者 最能看出一個節點的重要性,簡單來說就是判讀一個節點在網絡中的 核心程度,包括了連接中間度指標(Degree Centrality)、近距中間度指 標(Closenness centrality)、參與中間度指標三者數據[33],這些數據已 經廣泛被使用在社群網絡或是人際網絡的分析上,用來代表不同人在 社群網絡中的重要性[34, 35],這三個統計數據公式如下: Degree Centrality[33]:當一個圖(G)為 G=(V,E)共有 n 個節點時, 連接中間度指標 CD(ν)的公式為: CD (ν)=. !"# ! !!!. deg(ν)為點 ν 的鄰居數,除以總點數扣除自身的點數(n-1)後,即得 CD (ν),其數值越大則代表相接的點越多,表示其重要性越高。. Closenness centrality[33]:為點至其他節點間的直線距離,公式 為: CC (ν)=. ! !∈!/ ! !(!,!). 其中 d(ν, t)為任一點 t 至 ν 的距離,此值越大則顯示結點 ν 與圖上多 點的距離很近,傳遞訊息的速度也很快。. 17.
(31) Betweenness Centrality[33]:為節點出現在所有最短距離的次數, 公式如下: CB(ν)=. !!" ! !!!!!∈! ! !". σst 為節點 s 到 t 最短路徑的數目,σst(ν)則為 σst 中經過特定節點 ν 的 路徑數目,此數值越大表示為 s 到 t 中為必經之點的重要性也越大; 舉例來說(圖 4),點 B 有最高的近距中間度指標及參與中間度指標, 點 A 則是有最高的連接中間度指標;利用 CentiScaPe 分析各個生物 網絡的中間度指標,可以得到數據較高的單個或是多個節點(基因或 是受體)(圖 5 為微陣列晶片資料分析流程)。. 圖 4.在這個網絡裡,節點 B(黃色圓圈)有著網絡中最高的參與中間度 指標(40.333)與近距中間度指標(0.071),而節點 A(綠色圓圈)則是有最 高的連接中間度指標(0.556)。. 18.
(32) 圖 5. 微陣列晶片資料分析流程。. 19.
(33) 3. 研究結果 將搜集到的數據經上列步驟的分析與計算後,得到了以下的結果: I.. 戴奧辛相關化合物的毒理基因體數據經整理過後,首先將. CTD 得到的 TCDD 影響的基因部分,挑出各物種間影響前 10 名的基 因,再以人類為基準最排序,得到與基因/蛋白質交互作用數前 20 名 的列表(表 7);再來將 TCDD 影響人類的 2234 不重複基因送入分析軟 體 MetaCore 作分析,可以得到最可能受影響的交互作用途徑前 10 名 (表 8)及可能影響的疾病前 10 名列表(表 9),其中最可能影響的途徑 則為細胞內基質重構途徑(圖 6),在其中可以看到 TCDD 影響的基因 在許多位置都有表現(紅色溫度計),顯示其極可能受 TCDD 影響而造 成整個途徑發生錯誤,進而造成相關的疾病。. 20.
(34) 表 7. TCDD 對不同物種間基因/蛋白質交互作用數前 20 名 Gene symbols. Human. Mouse. Rat. Others. CYP1A1. 248. 123. 95. 45. AHR. 145. 632. 65. 48. CYP1B1. 67. 17. 11. 9. CYP1A2. 58. 13. 58. 8. ARNT. 29. 17. 2. 12. PTGS2. 23. 24. 14. 1. ESR1. 21. 3. 4. 4. IL1B. 17. 3. 0. 0. IL8. 15. 4. 0. 0. BRCA1. 14. 2. 1. 0. TNF. 10. 20. 7. 0. NQO1. 9. 34. 5. 1. TP53. 8. 0. 12. 0. SRC. 5. 27. 2. 0. AHRR. 3. 2. 1. 10. NFE2L2. 1. 21. 2. 2. EGF. 1. 99. 1. 0. LHB. 0. 0. 10. 0. LEP. 0. 3. 12. 0. INS1. 0. 111. 0. 0. 21.
(35) 表 8. GeneGO 交互作用途徑圖將基因作為生物標記,經統計計算後, 列出最可能受影響的交互作用途徑前 10 名,第一名為細胞分化:細 胞內基質重構途徑(cell adhesion_ECM remodeling)。. 22.
(36) 圖 6. GeneGO 交互作用途徑影響第一名-細胞分化:細胞內基質重構 途徑(有紅色溫度計標示的為 TCDD 影響的部分)-可以看到 TCDD 可 能同時影響多個基因/受體,進而造成整個途徑的變化,最終可能導 致疾病的發生。. 23.
(37) 表 9. GeneGO 交互作用途徑圖將基因作為生物標記,經統計方式算出 可能影響的疾病前 10 名列表,第一名為病理症狀的發生。. 另外再將這些基因列表以基因本體論方式分析,得到基因本體論 下的影響層面(包含生化交互作用、細胞區域、分子機制共三個層次), 再將這些結果以圓餅圖的方式作呈現(圖 7-生化交互作用影響層次; 圖 8-細胞區域影響層次; 圖 9-分子機制影響層次)。. 24.
(38) 圖 7. TCDD 可能影響基因本體論中的生化交互作用部分,前三名: 代謝交互作用、細胞交互作用、細胞間溝通。. 圖 8. TCDD 可能影響基因本體論中的細胞區域,依序為:胞內區域、 胞外區域、蛋白質複合體。. 25.
(39) 圖 9. TCDD 可能影響基因本體論中的分子機制部分,由大到小:催 化活性、結合、轉錄因子。. 26.
(40) II. 從預設條件下(物種:人類;平台:HG-U133_Plus_2.0)所找到 符 合 目 標 共 有 四 筆 微 陣 列 晶 片 資 料 , 分 別 為 E-MEXP-2817 、 E-MEXP-2574、E-MEXP-2458、E-GEOD-35034,其中 E-MEXP-2817、 E-MEXP-2574、E-MEXP-2458 為原作者僅發表在 EMBL-EBI ARRAY EXPRESS 這個資料庫,E-GEOD-35034 則同時發佈在 EMBL-EBI ARRAY EXPRESS 及 NCBI 的 GEO;E-MEXP-2817 使用人類肝癌細 胞株 HepG2,實驗組加入 TCDD(10nM)與加入 DMSO(10%)的對照組 做 12、24、48 小時的比較,每組皆做三重複[36];E-MEXP-2574 同 樣使用 HepG2 細胞株,試驗的化學物質有苯芘(Benzo[a]pyrene, 2µM )、 黃麴毒素 B1(Aflatoxin B1, 1µM)、環孢靈(Cyclosporin A, 3µM)、雌二 醇(Estradiol, E2, 30µM)及 TCDD(10nM)與對照組的 DMSO(0.5%),時 間則分別為 12、24、48 小時,一樣做三重複;E-MEXP-2458 使用了 HepG2 細胞及完成分化的肝細胞 HepaRG,測試的物質除了苯芘 (10µM)、黃麴毒素 B1(3µM)、環孢靈(300µM)及 TCDD(10nM),還有 雌二醇(30µM)來跟 DMSO(0.5%)作對照,組別為三重複的 12、48 小 時做比較[37];E-GEOD-35034 使用的是人類皮膚纖維細胞(human skin fibroblast cells, hSFCs),測試影響的物質有雙酚 A(10nM)、雌二 醇(0.1nM)、TCDD(1nM)、DMSO,以同樣 24 小時做三重複相互比較。. 27.
(41) 微陣列晶片資料中具有顯著差異的資料,會經由統計數據的分析 下被挑選出來(FDR P-Value < 0.05),輔以視覺化成生物網絡後(圖 10-69) , 更 能 看 出 節 點 ( 基 因 / 蛋 白 質 ) 間 的 相 互 關 係 ; 而 在 經 由 CentiScaPe 分析中間度指標較高者(表 10-13),在生物網絡上佔有的重 要性也代表著在實際影響舉足輕重。. 28.
(42) 圖 10. 2458-net1-1 的 force directed 圖-可以看到有些點連接了不少節 點,像是 TAK1(MAP3K7)、NF-kB、c-Jun 等,但是還是無法確定何 者有著最高的中間度指標,經過計算後,可知道 TAK1(MAP3K7)有 著最高的中間度指標。. 29.
(43) 圖 11. 2458-net1-3 相較於 force directed 的網絡,span tree 的呈現方式 更可以將節點顯示成更易從肉眼判斷高中心度指標的點,但依舊無法 直接找到最高者,經過計算可知為 TAK1(MAP3K7)。. 30.
(44) 圖 12. 2458-net2-1 force directed 的網絡,可以看到有以多個點為中心 散射出去,像是 ESP1、STAT1、NF-kB 等,仍須搭配統計數據的計 算找出最高中間度指標的點,前 3 名依序為 CREB1、ESR1 (nuclear)、 NF-kB。. 31.
(45) 圖 13. 2458-net2-3 span tree 方式的展示可以清楚看到 7 個由中心散射 出的網絡,雖然可以判讀是哪些點,但是還需由插件來計算中間度指 標,依序為 CREB1、ESR1 (nuclear)、NF-kB、C/EBPbeta、c-Jun、RelA (p65 NF-kB subunit)、STAT1。. 32.
(46) 圖 14. 2458-net3-1 force directed 的網絡,整個網絡節點超過 900 個, 位於中心的點有些擁擠,需要統計數據的計算才得以分別高中間度指 標者,最高的節點前三名依序為為 c-Myc、SP1、p53。. 33.
(47) 圖 15. 2458-net3-3 span tree 的網絡圖可以看到有一個大圈及多個小圈 組成,以統計插件計算出高中間度指標節點前三名依序為為 c-Myc、 SP1、p53、Elk-1。. 34.
(48) 35.
(49) 圖 16. 2458-net4-1&4-3 force directed 與 span tree 的網路圖中,雖然有 近 500 個節點組成,但可以清楚看到 HNF4-alpha 與最多節點做連結 的情形。. 36.
(50) 圖 17. 2458-net7-1&7-3 的 force directed 及 span tree 網絡圖由於節點 相當的多,須仰賴統計分析插件計算各點的中間度指標才能判斷,最 終結果擁有最高中間度指標的前三名依序為 HDAC1、PLK1、Bcl-6。. 37.
(51) 圖 18. 2458-net9-1&9-3 force directed 與 span tree 的網絡圖中有著相當. 38.
(52) 多的節點,經插件分析可得到有著最高的中間度指標前三名依序為 mTOR、PP2A catalytic、TFIID。. 圖 19. 2458-net11-1 force directed 的網絡,經 CentiScaPe 的計算可得 知有最高中間度指標數據前三名依序為 HDAC1、PLK1、Bcl-6。. 39.
(53) 圖 20. 2458-net11-3 span tree 網絡圖經 CentiScaPe 的計算可得知有最 高中間度指標數據前三名依序為 HDAC1、PLK1、Bcl-6。. 40.
(54) 圖 21. 2574-net1-1 force directed 網絡的節點雖然不複雜,可以看到 c-Jun、NF-kB、TRAF6 等節點位於重要位置,經 CentiScaPe 計算有 最高中間度指標的前三名依序為 NF-kB、TAK1(MAP3K7)、TRAF6。. 41.
(55) 圖 22. 2574-net1-3 span tree 的網絡可見 NF-kB、TAK1(MAP3K7)有較 多的鄰居數,經計算後得知)有最高中間度指標數據前三名依序為 NF-kB、TAK1(MAP3K7)、TRAF6。. 42.
(56) 圖 23. 2574-net2-1 force directed 的網絡中有著較複雜的結點,雖然可 以分辨出有 2~3 節點位於較中心位置,經統計後可得知有最高中間度 指標數值的前三名分別為 SP1、CREB1、C/EBPbeta。. 43.
(57) 圖 24. 2574-net2-3 span tree 網絡圖可以看到由 SP1、CREB1 為中心的 多個圓型網絡圖,經計算後得知有最高中間度指標的前三名分別為 SP1、CREB1、C/EBPbeta。. 44.
(58) 圖 25. 2574-net3-1 force directed 的網絡可看到由 STAT1、Elk-1、p53 散射出來多個網絡圖,經計算後得知中間度指標數據前三名依序為 p53、Elk-1、AP-1。. 45.
(59) 圖 26. 2574-net3-3 span tree 網絡圖可見多個節點所構成的圓型網絡圖, 計算後得知最高中間度指標者前五名依序為 p53、Elk-1、AP-1、NF-kB、 c-Jun。。. 46.
(60) 圖 27. 2574-net4-1 force directed 的網絡可見到由 HNF4-alpha 散射構成 的網絡為主體,經計算後也證實其為最高中間度指標者。. 47.
(61) 圖 28. 2574-net4-3 span tree 網絡圖顯示 HNF4-alpha 為中心節點,中 間度指標的計算也有相同的結果。. 48.
(62) 圖 29. 2574-net5-1 force directed 的網絡圖呈現相當擁擠的狀態,利用 CentiScaPe 計算中間度指標後可知最高者前三名依序為 NF-Y、 HNF4-alpha、c-Myc。. 49.
(63) 圖 30. 2574-net5-3 span tree 網絡圖中的連結數相當多,須經由 CentiScaPe 計算後才可知有最高中間度指標前五名依序為 NF-Y、 HNF4-alpha、c-Myc、SP1、PKA-cat (cAMP-dependent)。. 50.
(64) 圖 31. 2574-net6-1 force directed 的網絡相當的繁複,CentiScaPe 也無 法詳細得到其中各節點的中間度指標。. 51.
(65) 圖 32. 2574-net6-3 span tree 網絡看來相當的繁雜,CentiScaPe 無法算 出詳盡的中間度指標參數。. 52.
(66) 圖 33. 2574-net7-1 force directed 的網絡圖由於節點相當的多,經統計 分析插件計算各點的中間度指標亦不得其結果。. 53.
(67) 圖 34. 2574-net7-3 span tree 由於節點與關聯相當的繁複,統計分析插 件計算無法算出節點的中間度指標。. 54.
(68) 圖 35. 2574-net9-1 force directed 的網絡由 533 個節點所構成,可由統 計插件的計算得知最高中間度指標者前三名依序為 Casein kinase II, alpha chains、Casein kinase II, alpha chain (CSNK2A1)、CDK2。. 55.
(69) 圖 36. 2574-net9-3 span tree 有著相當多的節點,經插件分析可得到有 著最高的中間度指標前三名依序為 Casein kinase II, alpha chains、 Casein kinase II, alpha chain (CSNK2A1)、CDK2。. 56.
(70) 圖 37. 2574-net11-1 由 1166 個節點組成 force directed 的網絡,經 CentiScaPe 的計算可得知有最高的中間度指標前三名依序為 PLK1、 CDK2、Casein kinase II, alpha chain (CSNK2A1)。. 57.
(71) 圖 38. 2574-netw11-3 span tree 網絡經 CentiScaPe 的計算可得知最高的 中間度指標數據前三名依序為 PLK1、CDK2、Casein kinase II, alpha chain (CSNK2A1)。. 58.
(72) 圖 39. 2817-net1-1 force directed 的網絡可見到由 SP1 延伸出去的鄰居 數相當多,經統計數據也發現到最高的中間度指標前三名依序為 SP1、 RBP6、DGKE。. 59.
(73) 圖 40. 2817-net1-3 span tree 的網路的散射情形與 CentiScaPe 的統計結 果都指向 SP1 有最高的中間度指標,前三名依序為 SP1、RBP6、 DGKE。. 60.
(74) 圖 41. 2817-net2-1 force directed 的網絡中可看到由 E2F1、AKT 所散 射出去的多個子網絡,在經過統計分析後,得到最高中間度指標者前 三名依序為 p53、CREB1、E2F1。. 61.
(75) 圖 42. 2817-net2-3 span tree 由數個節點散射出的子網絡組成, CentiScaPe 計算結果指出最高中間度指標者前四名依序為 p53、 CREB1、E2F1、C/EBPbeta。. 62.
(76) 圖 43. 2817-net3-1 force directed 的網絡呈現多組的散射狀,經由統計 插件的計算得知最高的中間度指標者前三名為 c-Myc、SP1、STAT1。. 63.
(77) 圖 44. 2817-net3-3 span tree 網絡圖顯示最高中間度指標者為 c-Myc, 同時 CentiScaPe 分析的結果前兩名分別為 c-Myc、SP1。. 64.
(78) 圖 45. 2817-net4-1 force directed 的網絡可以看到以 HNF4-alpha 為中心 散射形成,經 CentiScaPe 的統計後也有相同的結果。. 65.
(79) 圖 46. 2817-net4-3 span tree 網絡圖及 CentiScaPe 的統計結果證明 HNF4-alpha 為中間度指標最高的節點。. 66.
(80) 67.
(81) 圖 47. 2817-net7-1&7-3 force directed 與 span tree 的網絡中含有大量的 節點,須經由 CentiScaPe 的統計分析後,確定擁有最高中間度指標前 三名依序為 STAT3、HDAC1、PLK1。. 圖 48. 2817-net9-1 force directed 網絡由於節點相當的多,須仰賴統計 分析插件計算各點的中間度指標才能判斷,最終結果擁有最高中間度 指標前三名依序為 PLK1、PP2A catalytic、STAT3。. 68.
(82) 圖 49. 2817-net9-3 span tree 網絡中由相當多的節點組成,經統計數據 插件 CentiScaPe 分析可得到有著最高中間度指標前三名依序為 PLK1、 PP2A catalytic、STAT3。. 69.
(83) 圖 50. 2817-net11-1 force directed 的網絡,經 CentiScaPe 的計算可得 知最高中間的指標數據前三名依序為 STAT3、PLK1、HDAC1。. 70.
(84) 圖 51. 2817-net11-3 span tree 經 CentiScaPe 的計算可得知最高中間的 指標數據前三名依序為 STAT3、PLK1、HDAC1。. 71.
(85) 圖 52. agli-net1-1 force directed 的網絡可以看到 SP1 介於整個網絡的 中心,CentiScaPe 統計的結果也顯示 SP1 有最高的中間度指標。. 72.
(86) 圖 53. agli-net1-3 span tree 的網絡顯示方式及 CentiScaPe 的計算結果 可以看到 SP1 為中間度指標最高的節點。. 73.
(87) 圖 54. agli-net2-1 force directed 的網絡由 GCR-alpha、Oct3/4 多個節點 延伸而成,CentiScaPe 的計算結果證實有最高的中間度指標數值前三 名依序為 HNF4-alpha、CREB1、GCR-alpha。. 74.
(88) 圖 55. agli-net2-3 span tree 網絡圖經 CentiScaPe 的統計後,最高的中 間度指標數值前四名依序是 HNF4-alpha、CREB1、GCR-alpha、 Oct-3/4。. 75.
(89) 圖 56. agli-net3-1 force directed 的網絡可看到多個節點延伸出來,如 c-Myc、NF-kB、CREB1 等,經 CentiScaPe 統計插件計算後得知中間 度指標最高的前三名依序為 c-Myc、AP-1、CREB1。. 76.
(90) 圖 57. agli-net3-3 force directed 的網絡呈現多節點散射狀,CentiScaPe 計算後的結果顯示中間度指標最高的前三名依序為 c-Myc、AP-1、 CREB1。. 77.
(91) 圖 58. agli-net4-1 force directed 的網絡及 CentiScaPe 的計算結果接顯 示 SP1 的中間度指標數據最高。. 78.
(92) 圖 59. agli-net4-3 span tree 網絡及 CentiScape 統計結果都顯示 SP1 擁 有最高的中間度指標數據。. 79.
(93) 圖 60. agli-net5-1 force directed 的網絡顯示情形,可以看到節點間的交 互作用情形相當繁雜,也使得 CentiScaPe 有無法計算中間度指標的情 形。. 80.
(94) 圖 61. agli-net5-3 span tree 網絡顯示情形可見節點間的交互作用情形 相當繁複,也使得 CentiScaPe 無法計算當中各節點的中間度指標數 據。. 81.
(95) 圖 62. agli-net6-1 force directed 的網絡主要由兩個子網絡所構成,經過 統計分析軟體的處理後,得到中間度指標最高的前三名依序為 PPAR-gamma、CBP、1-Oct。. 82.
(96) 圖 63. agli-net6-3 force directed 的網絡可以看到多個子網絡,以 CentiScape 統計插件計算後,得知中間度指標最高的前三名依序為 PPAR-gamma、CBP、1-Oct。. 83.
(97) 圖 64. agli-net7-1 force directed 的網絡圖由於節點相當的多,須仰賴統 計分析插件計算各點的中間度指標才能判斷,最終結果擁有最高的中 間度指標前三名依序是 PPAR-gamma、Menin、Caspase-1。. 84.
(98) 圖 65. agli-net7-3 span tree 網 絡 圖 呈 現 一 個 圓 形 的 形 狀 , 使 用 CentiScaPe 計算後得到有著最高的中間度指標數據前三名依序是 PPAR-gamma、Menin、Caspase-1。. 85.
(99) 圖 66. agli-net9-1 force directed 的網絡有著相當多的節點,經插件分析 可得到有著最高的中間度指標前三名依序為 G-protein alpha-i family、 Serotonin receptor、AMPA receptor。. 86.
(100) 圖 67. agli-net9-3 span tree 的網絡由相當多的節點組成,經插件分析 可得到最高的中間度指標前三名依序為 G-protein alpha-i family、 Serotonin receptor、AMPA receptor。. 87.
(101) 圖 68. agli-net11-1 force directed 的網絡,經 CentiScaPe 的計算可得知 有最高的中間的指標數據前三名依序是 PPAR-gamma、Menin、 Caspase-1。. 88.
(102) 圖 69. agli-net11-3 span tree 網絡圖經 CentiScaPe 的計算可得知有最高 的中間度指標數據前三名依序是 PPAR-gamma、Menin、Caspase-1。. 表 10. E-MEXP-2458(2458-net)生物網絡中具高中間度指標列表 Data 2458-net1 2458-net2 2458-net3 2458-net4 2458-net7. 2458-net9 2458-net11. Gene Name TAK1(MAP3K7) CREB1 c-Myc HNF4-alpha HDAC1 Bcl-6 PLK1 mTOR PP2A catalytic HDAC1 Bcl-6 PLK1. Betweenness Centrality 1.34E+03 8.52E+04 4.24E+05 2.65E+05 6.98E+04 3.65E+04 5.74E+04 9.02E+03 2.14E+04 6.98E+04 3.65E+04 5.74E+04. 89. Closenness Centrality 5.99E-03 7.76E-04 4.91E-04 1.82E-03 6.60E-04 5.99E-04 5.80E-04 1.27E-03 1.39E-03 6.60E-04 5.99E-04 5.80E-04. Degree Centrality 2.04E-01 2.89E-01 4.31E-01 9.57E-01 2.69E-02 1.95E-02 3.21E-02 1.46E-02 2.39E-02 2.98E-02 2.15E-02 3.55E-02.
(103) 表 11. E-MEXP-2574(2574-net)生物網絡中具高中間度指標列表 Data 2574-net1 2574-net2 2574-net3 2574-net4 2574-net5. 2574-net9. 2574-net11. Gene Name NF-kB TAK1(MAP3K7) SP1 p53 HNF4-alpha c-Myc HNF4-alpha NF-Y Casein kinase II, alpha chain (CSNK2A1) CDK2 PKA-cat (cAMP-dependent) Casein kinase II, alpha chains CDK2 PLK1. Betweenness Centrality 9.11E+02 1.21E+03 1.91E+05 6.08E+04 1.60E+05 8.76E+05 9.52E+05 1.09E+06 9.65E+03 6.31E+03 6.38E+03 9.88E+03 1.73E+04 3.17E+04. Closenness Centrality 6.10E-03 6.76E-03 8.98E-04 9.21E-04 2.23E-03 1.43E-04 1.35E-04 1.39E-04 1.78E-03 1.59E-03 1.57E-03 1.89E-03 9.51E-04 9.87E-04. Degree Centrality 3.00E-01 2.20E-01 5.38E-01 2.62E-01 9.28E-01 1.22E-01 1.22E-01 1.18E-01 2.07E-02 2.26E-02 2.07E-02 3.57E-02 2.58E-02 3.61E-02. 表 12. E-MEXP-2817(2817-net)生物網絡中具高中間度指標列表 Data 2817-net1 2817-net2 2817-net3 2817-net4 2817-net7. 2817-net9. 2817-net11. Gene Name SP1 p53 c-Myc SP1 HNF4-alpha HDAC1 STAT3 PLK1 GATA-2 TFIID HOXA4 PLK1 PP2A catalytic HDAC1 STAT3 PLK1 STAT3. Betweenness Centrality 2.24E+03 9.07E+04 4.29E+05 3.49E+05 2.68E+05 6.67E+04 7.77E+04 6.34E+04 5.33E+04 1.03E+04 1.02E+04 1.93E+04 1.92E+04 6.67E+04 7.77E+04 6.34E+04 7.77E+04. 90. Closenness Centrality 1.20E-02 8.57E-04 4.98E-04 4.78E-04 1.78E-03 6.03E-04 5.95E-04 5.36E-04 5.32E-04 9.61E-04 8.74E-04 1.17E-03 1.18E-03 6.03E-04 5.95E-04 5.36E-04 5.95E-04. Degree Centrality 5.51E-01 3.30E-01 4.31E-01 4.07E-01 9.52E-01 2.87E-02 4.36E-02 3.27E-02 2.98E-02 8.61E-03 1.51E-02 2.61E-02 2.06E-02 6.86E-02 1.04E-01 3.62E-02 4.83E-02.
(104) 表 13. E-GEOD-25034(agli-net)生物網絡中具高中間度指標列表 Data agli-net1 agli-net2 agli-net3 agli-net4 agli-net6. agli-net7. agli-net9. agli-net11. Gene Name SP1 HNF4-alpha CREB1 c-Myc SP1 PPAR-gamma 1-Oct CBP BACE1 Caspase-1 PPAR-gamma Menin G-protein alpha-i family PKC AMPA receptor Ionotropic glutamate receptor Serotonin receptor BACE1 Caspase-1 PPAR-gamma Menin 1-Oct. Betweenness Centrality 2.15E+03 1.24E+04 7.24E+03 1.68E+04 8.59E+03 3.63E+05 3.16E+05 2.94E+05 6.64E+02 6.89E+02 2.52E+03 7.56E+02 5.97E+02 2.30E+02 5.35E+02 4.84E+02 8.16E+02 6.64E+02 6.89E+02 2.52E+03 7.56E+02 6.10E+02. Closenness Centrality 9.52E-03 3.41E-03 2.90E-03 2.06E-03 9.71E-03 2.96E-04 2.70E-04 2.85E-04 6.49E-03 6.37E-03 8.62E-03 6.49E-03 1.02E-02 8.40E-03 9.35E-03 8.20E-03 9.80E-03 6.49E-03 6.37E-03 8.62E-03 6.49E-03 5.56E-03. Degree Centrality 2.86E-01 4.86E-01 2.61E-01 2.51E-01 9.57E-01 1.16E-01 1.07E-01 1.15E-01 1.50E-02 1.72E-02 3.86E-02 1.93E-02 2.68E-02 3.13E-02 2.68E-02 6.25E-02 7.59E-02 1.83E-02 2.09E-02 4.71E-02 2.36E-02 2.62E-02. 4. 結果討論與延伸 從第一部分的毒理基因體資料分析結果來看,可以瞭解到 TCDD 對於不同物種影響的廣泛度,尤其在人類身上的影響,更可能造成不 同部位的病變,其中影響的基因部份,像是在人類乳癌細胞上的 AHR 被發現有受 TCDD 影響的情形,CYP1A1 也有類似的情形,被証實在 誘導乳癌的發生上有相當的影響[38],這些跨物種的基因在大鼠及小 鼠身上都有表現,近年來也被用於研究 TCDD 對 microRNA(miRNA) 的影響上[6, 39],而有些基因則只有在特定物種上有表現,像是 IL1B、 IL8 只在人類及小鼠身上有[40, 41, 42],INS1 只在小鼠身上發現[43], 顯見 TCDD 同時具有跨物種及對特定物種的影響;自 MetaCore 分析 出來的 GeneGO 途徑圖(圖 6)部分,可以發現到 TCDD 對於細胞分化 91.
(105) 中的細胞內基質重構的交互作用途徑有較大的影響,這個交互作用與 很多正常的生理過程有關,如胚胎發育、繁殖、增殖、細胞運動和粘 附、促進傷口癒合、新生血管生成等,這些被影響的基因/受體位於 交互作用網絡圖上的不同路徑,甚至其中的 MMP-13 及 MMP-1 就位 在整個網絡途徑的中央,影響不少下游基因/受體的表現,造成途徑 中的蛋白質比例失衡,最終影響整個途徑[44, 45],可見 TCDD 對於 此交互作用途徑的影響;以基因本體論的角度來看 TCDD 對於人體 可能造成的影響,可以從生化交互作用、細胞區域、分子機制功能這 三個層級做分析;自生化交互作用的影響部分,可以看到受 TCDD 影響的前三名為:代謝途徑、細胞相關途徑、細胞間溝通,比例則為: 24.2%、17.8%、12.2%(圖 7),這些生化途徑對於生物體內的正常作 用有著相當大的重要性,一旦被影響了,可能會對人體造成一定的危 害,甚至引起疾病;細胞區域層次的影響前三名則分別為:細胞內層 的 53.4%、細胞外區域的 26.9%及蛋白質複合體的 14.7%(圖 8);分子 機制功能方面則會造成像是催化活性、結合、轉錄分子活性的異常, 比例上為 31.2%、30.5%、8.1%(圖 9),以上所看到 TCDD 會影響的部 分,都是一些相當基本的交互作用及途徑,這些都會造成人體基本生 理出現異常的情形,可見 TCDD 的危害不是可以輕易被忽視的。. 92.
(106) 接下來看到第二部分的微陣列晶片資料分析結果,將微陣列晶片 資料加上基因註解後,篩選出其中 FDR P-Value < 0.05 的基因列表以 Cytoscape 產生生物網絡圖(圖 10- 69),並以 CentiScaPe 統計出中間度 指標的三個參數,找出具有影響性的多個基因/受體(表 10-12)。其中 以 Cytoscape 產生生物網絡圖時,我們使用了 3DScape 這個視覺化插 件來產生兩種圖,一種是 force directed 的方式,這種做圖方式所使用 的演算法,會真實呈現節點間的相互關聯性;另一種則是 span tree, 這種做圖所採用的演算法,則是盡可能地將連接鄰居數較多的節點作 為中心,再以其作放射狀的延伸;使用了以上兩種不同的視覺化演算 法,可以在觀察生物網絡圖時,同時理解到整個網絡實際的關係性, 更可以在尚未搭配統計數據下,便可約略地找出在網絡中具有較高中 心度指標的節點,像是在一些節點數目較少或是單一節點中間度指標 高於其他節點的網絡中,如 2458-net1(圖 10, 11)、2574-net1(圖 21, 22)、 2817-net1(圖 39, 40)、agli-net1(圖 52, 53),這類基因列表中有直接關 聯性節點所生成的生物網絡圖;有些網絡圖雖然可以大概看出具較高 中間度指標的節點,但是需要經過統計數據插件 CentiScaPe 的處理, 方可自得到的參數中,找出網絡中最高中間度指標的節點,大部份的 生物網絡圖結果都是這類型的;也有一些是由於節點的中間度指標遠 高於其他的節點,從視覺判斷的結果與 CentiScaPe 計算後得到的中間. 93.
(107) 度指標兩者相吻合的情形,2574-net4(圖 27, 28)、2817-net4(圖 45, 46)、 2458-net4(圖 16)、agli-net4(圖 58, 59)這幾個網絡都是如此;最後也有 幾個網絡是 CentiScaPe 無法計算的,雖然有成功產生出生物網絡圖, 但卻無法計算出各節點的中間度指標,像是 2574-net6; -7(圖 31, 32, 33, 34)及 agli-net5(圖 60, 61)。 在判斷節點的重要性上,我們使用了中間度指標作為判斷的依據, 這類的統計數據已經在其它不同的領域所利用,像是社群網絡及流病 方面的分析[46, 47],顯見其用來分析網絡中重要數據的可行性,近 期也有被用於其他化學物質毒理基因的分析[48],故使用中間度指標 來作重要性的評估;中間度指標越高代表著節點為網絡的核心的可能 性也越高,中間度指標並非由單一數據決定,而是由連接中間度指標、 近距中間度指標、參與中間度指標三個參數的數據做決定;在這三個 參數中,連接中間度指標會受到與節點連接的鄰居數與整個網絡的節 點改變而有所影響,當鄰居數越多,或是網絡節點數目越少時,連接 中間度指表也就越大,反之亦然,生理意義上則代表此節點(基因/受 體)表現情形改變時,容易帶給周圍基因連帶交互作用的可能性也越 大;近距中間度指標則是與特定節點跟鄰居間的距離有正相關,數據 越大顯示點與點間距離越小,同時代表著影響其他節點表現的速度也 越快;參與中間度指標的高低則是節點在整個網絡的位置相關,當節. 94.
(108) 點位置處於整體網絡的中心點,此節點的改變會造成其他正常路徑的 執行成功率也大幅度的下降,綜合以上三點所得到的中間度指標,便 可用來判斷生物網路中節點的重要性,也就是各網絡中間度指標最高 者所代表的意義(表 14)。. 表 14. 各網絡中間度指標最高者 Data 2574-net1 2574-net2 2574-net3 2574-net4 2574-net5 2574-net9 2574-net11. Gene Name Betweenness Centrality Closenness Centrality TAK1(MAP3K7) 1.21E+03 6.76E-03 SP1 1.91E+05 8.98E-04 p53 6.08E+04 9.21E-04 HNF4-alpha 1.60E+05 2.23E-03 NF-Y 1.09E+06 1.39E-04 Casein kinase II, alpha chains 9.88E+03 1.89E-03 PLK1 3.17E+04 9.87E-04. Degree Centrality 2.20E-01 5.38E-01 2.62E-01 9.28E-01 1.18E-01 3.57E-02 3.61E-02. 2817-net1 2817-net2 2817-net3 2817-net4 2817-net7 2817-net9 2817-net11. SP1 p53 c-Myc HNF4-alpha STAT3 STAT3 STAT3. 2.24E+03 9.07E+04 4.29E+05 2.68E+05 7.77E+04 7.77E+04 7.77E+04. 1.20E-02 8.57E-04 4.98E-04 1.78E-03 5.95E-04 5.95E-04 5.95E-04. 5.51E-01 3.30E-01 4.31E-01 9.52E-01 4.36E-02 1.04E-01 4.83E-02. 2458-net1 2458-net2 2458-net3 2458-net4 2458-net7 2458-net9 2458-net11. TAK1(MAP3K7) CREB1 c-Myc HNF4-alpha HDAC1 PP2A catalytic HDAC1. 1.34E+03 8.52E+04 4.24E+05 2.65E+05 6.98E+04 2.14E+04 6.98E+04. 5.99E-03 7.76E-04 4.91E-04 1.82E-03 6.60E-04 1.39E-03 6.60E-04. 2.04E-01 2.89E-01 4.31E-01 9.57E-01 2.69E-02 2.39E-02 2.98E-02. agli-net1 agli-net2 agli-net3 agli-net4 agli-net6 agli-net7 agli-net9 agli-net11. SP1 HNF4-alpha c-Myc SP1 PPAR-gamma PPAR-gamma Serotonin receptor PPAR-gamma. 2.15E+03 1.24E+04 1.68E+04 8.59E+03 3.63E+05 2.52E+03 8.16E+02 2.52E+03. 9.52E-03 3.41E-03 2.06E-03 9.71E-03 2.96E-04 8.62E-03 9.80E-03 8.62E-03. 2.86E-01 4.86E-01 2.51E-01 9.57E-01 1.16E-01 3.86E-02 7.59E-02 4.71E-02. 95.
(109) 表 15. 所有微陣列晶片資料中,各網絡高中間度指標節點 Data 2574-net1 2574-net2 2574-net3 2574-net4 2574-net5. 2574-net9. 2574-net11 2817-net1 2817-net2 2817-net3 2817-net4 2817-net7. 2817-net9. 2817-net11 2458-net1 2458-net2 2458-net3 2458-net4 2458-net7. 2458-net9 2458-net11. agli-net1 agli-net2 agli-net3 agli-net4 agli-net6. agli-net7. agli-net9. agli-net11. Gene Name NF-kB TAK1(MAP3K7) SP1 p53 HNF4-alpha c-Myc HNF4-alpha NF-Y Casein kinase II, alpha chain (CSNK2A1) CDK2 PKA-cat (cAMP-dependent) Casein kinase II, alpha chains CDK2 PLK1 SP1 p53 c-Myc SP1 HNF4-alpha HDAC1 STAT3 PLK1 GATA-2 TFIID HOXA4 PLK1 PP2A catalytic HDAC1 STAT3 PLK1 STAT3 TAK1(MAP3K7) CREB1 c-Myc HNF4-alpha HDAC1 Bcl-6 PLK1 mTOR PP2A catalytic HDAC1 Bcl-6 PLK1 SP1 HNF4-alpha CREB1 c-Myc SP1 PPAR-gamma 1-Oct CBP BACE1 Caspase-1 PPAR-gamma Menin G-protein alpha-i family PKC AMPA receptor Ionotropic glutamate receptor Serotonin receptor BACE1 Caspase-1 PPAR-gamma Menin 1-Oct. Betweenness Centrality 9.11E+02 1.21E+03 1.91E+05 6.08E+04 1.60E+05 8.76E+05 9.52E+05 1.09E+06 9.65E+03 6.31E+03 6.38E+03 9.88E+03 1.73E+04 3.17E+04 2.24E+03 9.07E+04 4.29E+05 3.49E+05 2.68E+05 6.67E+04 7.77E+04 6.34E+04 5.33E+04 1.03E+04 1.02E+04 1.93E+04 1.92E+04 6.67E+04 7.77E+04 6.34E+04 7.77E+04 1.34E+03 8.52E+04 4.24E+05 2.65E+05 6.98E+04 3.65E+04 5.74E+04 9.02E+03 2.14E+04 6.98E+04 3.65E+04 5.74E+04 2.15E+03 1.24E+04 7.24E+03 1.68E+04 8.59E+03 3.63E+05 3.16E+05 2.94E+05 6.64E+02 6.89E+02 2.52E+03 7.56E+02 5.97E+02 2.30E+02 5.35E+02 4.84E+02 8.16E+02 6.64E+02 6.89E+02 2.52E+03 7.56E+02 6.10E+02. 96. Closenness Centrality 6.10E-03 6.76E-03 8.98E-04 9.21E-04 2.23E-03 1.43E-04 1.35E-04 1.39E-04 1.78E-03 1.59E-03 1.57E-03 1.89E-03 9.51E-04 9.87E-04 1.20E-02 8.57E-04 4.98E-04 4.78E-04 1.78E-03 6.03E-04 5.95E-04 5.36E-04 5.32E-04 9.61E-04 8.74E-04 1.17E-03 1.18E-03 6.03E-04 5.95E-04 5.36E-04 5.95E-04 5.99E-03 7.76E-04 4.91E-04 1.82E-03 6.60E-04 5.99E-04 5.80E-04 1.27E-03 1.39E-03 6.60E-04 5.99E-04 5.80E-04 9.52E-03 3.41E-03 2.90E-03 2.06E-03 9.71E-03 2.96E-04 2.70E-04 2.85E-04 6.49E-03 6.37E-03 8.62E-03 6.49E-03 1.02E-02 8.40E-03 9.35E-03 8.20E-03 9.80E-03 6.49E-03 6.37E-03 8.62E-03 6.49E-03 5.56E-03. Degree Centrality 3.00E-01 2.20E-01 5.38E-01 2.62E-01 9.28E-01 1.22E-01 1.22E-01 1.18E-01 2.07E-02 2.26E-02 2.07E-02 3.57E-02 2.58E-02 3.61E-02 5.51E-01 3.30E-01 4.31E-01 4.07E-01 9.52E-01 2.87E-02 4.36E-02 3.27E-02 2.98E-02 8.61E-03 1.51E-02 2.61E-02 2.06E-02 6.86E-02 1.04E-01 3.62E-02 4.83E-02 2.04E-01 2.89E-01 4.31E-01 9.57E-01 2.69E-02 1.95E-02 3.21E-02 1.46E-02 2.39E-02 2.98E-02 2.15E-02 3.55E-02 2.86E-01 4.86E-01 2.61E-01 2.51E-01 9.57E-01 1.16E-01 1.07E-01 1.15E-01 1.50E-02 1.72E-02 3.86E-02 1.93E-02 2.68E-02 3.13E-02 2.68E-02 6.25E-02 7.59E-02 1.83E-02 2.09E-02 4.71E-02 2.36E-02 2.62E-02.
(110) 從整理出來的各網絡中間度指標最高者來看(表 14),可以看到有 些 節 點 在 多 個 實 驗 組 重 複 出 現 的 情 形 , 像 是 TAK1(MAP3K7) 在 2574-net1, 2458-net1、SP1 在 2574-net2, 2817-net1, agli-net-1, -4、 HNF4-alpha 在 2574-net4, 2817-net4, 2458-net4, agli-net-1, -4、c-Myc 在 2817-net3, 2458-net3, agli-net3,這些節點在同樣的細胞株,不同的 實驗組都在生物網絡中有相當高的中間度指標,顯示 TCDD 容易對 這些節點造成影響,進而引發一連串的生化過程,最終可能引起疾病 的發生;而 SP1 及 c-Myc 在人類的肝癌細胞株及上皮組織纖維細胞 中都有受 TCDD 影響的情形,也顯示出 TCDD 確實在人體上有廣泛 性影響;將各網絡中高於網絡平均中間度指標的節點挑選出來並排序 (表 15),將這些結果與 CTD 找到受 TCDD 影響的人類基因列表作比 對,可以發現到 HDAC1、SP1、E2F1 三個基因有重複的情形,這幾 個基因在先前的研究上也被發現與 TCDD 引起的疾病有關係,像是 HDAC1 就被發現到與乳癌的發生相關[49],SP1 與 E2F1 則是在乳癌、 皮膚癌、胰臟癌的研究上被發現到[50, 51],這些基因在文獻中並非 作為主要討論的對象,卻在我們的研究中有著相當高的中間度指標數 據,可能是在於生化實驗中,其表現性不會高於當前所研究的基因, 但是在整個網絡中,卻可能佔有相當重要的位置,需藉由生物網絡的 分析,再搭配統計數據的計算,方可看到其重要性,或許在之後相關. 97.
(111) 研究上,可以嘗試這些與以往不同的方向來作進一步的研究;同時比 較不同微陣列晶片資料所得到的結果,可以看到即便是使用相同細胞 株的 E-MEXP-2817、E-MEXP-2574、E-MEXP-2458 三筆資料,在以 同樣方式產生出來的生物網絡中,也同時出現高中間度指標者有相同 相異的情形,重複出現的像是 TAK1(MAP3K7)、c-Myc、HNF4-alpha、 PP2A catalytic、PLK1,這些高中間度指標的節點即便是重複出現, 數值一樣有所差異,並不因為以同樣細胞株及相同濃度的 TCDD 及 同種生物網絡生成方式而相同,可能的差異在於控制組所使用的 DMSO 濃度上所造成,或是個體細胞受 TCDD 影響的程度不同;而 在將各網絡中間度指標最高者中的連接中間度指標與其鄰居數做比 較(表 16),可以發現到連接中間度指標的高低,並不會完全與其鄰居 數成正比,而是與整個生物網絡的總節點數目有較高的相關性,當總 節點數目越低時,多一個鄰居數便會讓節點的連接中間度指標有較大 幅度的改變,同時也代表著當整個生物網絡的規模越大時,單一節點 的改變也不容易造成整個網絡的崩潰。 最後試著將 FDR P-Value < 0.05 的微陣列晶片基因列表與高中間 度指標的基因(表 15)作比對,可以發現僅有 2817-net9 中的 HOXA4 一個重複,與大多的 FDR P-Value < 0.05 的基因都不相符,這部分可 能的原因是生物網絡中高中間度指標的基因與用來生成生物網絡的. 98.
(112) 基因並不完全相同,而是位於高中間度指標基因的上游,在 TCDD 影響到 FDR P-Value < 0.05 的基因表現後,可能會造成高中間度指標 的上游基因表現改變,最終使得高中間度指標基因的表現受到影響; 因此,在第一層資料分析中得到的,可能尚未是真正重要的結果,需 經由生物網絡視覺化並計算中間度指標後,才可能篩選出實際重要的 資料,進而找出真正在生物體中具指標性影響的重要結果。. 表 16.各網絡中間度指標最高者與鄰居數比較 Data 2574-net1 2574-net2 2574-net3 2574-net4 2574-net5 2574-net9 2574-net11. Gene Name TAK1(MAP3K7) SP1 p53 HNF4-alpha NF-Y Casein kinase II, alpha chains PLK1. Degree Centrality 2.20E-01 5.38E-01 2.62E-01 9.28E-01 1.18E-01 3.57E-02 3.61E-02. total node number(n) 51 546 432 403 3100 533 1166. deg(v) 11 293 6 373 367 11 42. 2817-net1 2817-net2 2817-net3 2817-net4 2817-net7 2817-net9 2817-net11. SP1 p53 c-Myc HNF4-alpha STAT3 STAT3 STAT3. 5.51E-01 3.30E-01 4.31E-01 9.52E-01 4.36E-02 1.04E-01 4.83E-02. 50 498 954 520 1744 730 1576. 27 9 411 494 76 76 52. 2458-net1 2458-net2 2458-net3 2458-net4 2458-net7 2458-net9 2458-net11. TAK1(MAP3K7) CREB1 c-Myc HNF4-alpha HDAC1 PP2A catalytic HDAC1. 2.04E-01 2.89E-01 4.31E-01 9.57E-01 2.69E-02 2.39E-02 2.98E-02. 55 510 952 517 1747 755 1580. 12 12 386 494 47 410 47. agli-net1 agli-net2 agli-net3 agli-net4 agli-net6 agli-net7 agli-net9 agli-net11. SP1 HNF4-alpha c-Myc SP1 PPAR-gamma PPAR-gamma Serotonin receptor PPAR-gamma. 2.86E-01 4.86E-01 2.51E-01 9.57E-01 1.16E-01 3.86E-02 7.59E-02 4.71E-02. 50 139 212 95 1798 467 225 383. 14 67 53 90 208 18 17 18. 99.
(113) 圖 70. TCDD 與多氯聯苯類影響基因比較(數字皆代表影響的基因數 目). 圖 71. TCDD 與多環芳香烴類影響基因比較(數字皆代表影響的基因 數目). 在 TCDD 毒理基因體學資料及微陣列晶片資料的分析後,我們試 著去比較其他持久性有機物汙染物影響的基因列表,並與 TCDD 所 影響的基因列表作比對,試圖找出這些基因是否有重疊性,在持久性 有機汙染物中,已經有許多的化學物質被發現會造成不少的影響相關, 像是雙酚 A 及 DDT 相關化學物質會造成去氧核糖核酸甲基化的異常 [52, 53]、多氯聯苯類影響甲狀腺素的合成[54],這些都對生物的健康 都可能造成影響,都可以是我們接下來分析的對象,而我們想先從化 學結構上與 TCDD 相近的持久性有機汙染物質著手,第一個看到與 100.
(114) 多氯聯苯類的重複性(圖 70),從圓餅圖上的數據可以知道,多氯聯苯 類與 TCDD 同時會影響的基因共有 180 個,且佔了多氯聯苯類影響 基因中近 78%,這其中除了 TCDD 已被研究了相當長的一段時間外, 當然也跟 TCDD 影響的廣泛性有關係;第二個看到的則是與多環芳 香烴類(Polycyclic Aromatic Hydrocarbons , PAHs)的比較(圖 71),可以 發現同時影響的基因共有 92 個,這些會受共同影響的基因,可能會 因多種持久性有機汙染物的共同影響,而加劇疾病的發生與否,是之 後可以進一步探討的方向;另外,雖然我們由生物網絡圖的視覺化, 搭配上統計數據插件 CentiScaPe 計算出具高中間度指標的節點,但是 對於整個網絡中,不同的節點各自代表的重要性還是不甚清楚,畢竟 在生物體內的網絡,各個基因/受體在不同交互作用及區域,其代表 的重要性也有所差異,如何找出不同基因/受體在不同網絡中的比重, 也是之後努力的課題之一,在確定了以上的結果後,相信這些找到的 資料,有機會應用在預防性醫療上,作為受化學物質危害後,用來評 估可能引起相關疾病的指標,或者作為生物感測器的應用,作為監測 人體是否受到特定化學物質影響的依據。. 101.
(115) 表 17. 與 miR-191 相關的疾病 Disease breast cancer colorectal cancer colorectal cancer gastric cancer (stomach cancer) lung cancer pancreatic cancer prostate cancer glioblastoma head and neck squamous cell carcinoma (HNSCC) kidney cancer lung cancer malignant melanoma prostate cancer. References Iorio et al. 2005 Xi et al. 2006 Volinia et al. 2006. Ciafre et al. 2005 Hebert et al. 2007 Chow et al. 2009 Yanaihara et al. 2006 Caramuta et al. 2010 Prueitt et al. 2008. 另外近幾年發現到的 miRNA,也被證實會受一些環境化學物質影 響其表現,TCDD 也是其中的一個,進而影響到目標基因的表現,從 近幾年來有關 TCDD 的研究文獻可以看到與 CTD 資料相符合的人類 基因部分,像是 CCL2、UGT1A6、 UGT1A7、SPARC、GADD45A、 ME1[37],或是 TMC7、TUFT1、SMAD7、TIPARP、AQP3、LIF、 HBEGF、DUSP 等[6],這些受 TCDD 影響的人類基因中,有些被發 現到是 miR-191 的目標基因,miR-191 是目前已知會受 TCDD 影響的 miRNA 之一[6],同時也知道 TCDD 會導致 miR-191 正調控的發生, 而 miR-191 則被發現與多種癌症有因果關係(表 17),像是乳癌[55]、 大腸癌[56, 57]、胃癌[57]、神經母細胞瘤[58]、頭頸部鱗狀細胞癌[59]、 腎臟癌[60]、肺癌[57, 61]、惡性黑色素瘤[62]、前列腺癌[57, 63]等; 102.
(116) 只是目前已知 miRNA 的目標基因僅有少部分為實驗驗證過,大部份 是經預測出來的目標基因,仍需更多的實驗證據來驗證預測是否準確, 待擁有更多的數據後,便可以試著將所得到的基因列表以同樣的方式 來做視覺化及統計數據的分析,進一步找出具高中間度指標的基因, 作為相關研究的生物標的。. 103.
(117) 5. 參考文獻. [1] Diamanti-Kandarakis, E. et al. Endocrine-disrupting chemicals: an Endocrine Society scientific statement. Endocrine reviews 30, 293-342, doi:10.1210/er.2009-0002 (2009).. [2] Boethling, R. et al. Environmental persistence of organic pollutants: guidance for development and review of POP risk profiles. Integrated environmental assessment and management 5, 539-556, doi:10.1897/IEAM_2008-090.1 (2009).. [3] 毒性化學物質環境流布調查分析計畫(92年版) [http://sta.epa.gov.tw/report/Files/EPA-92-U1J1-02-102.pdf]。台北市, 環保署. [4] 毒性化學物質污染排放調查與模式之建立-一般環境中(92年版) [http://sta.epa.gov.tw/report/Files/EPA-91-U1J1-02-111.pdf]。台北市, 環保署。. [5] 環境空氣戴奧辛監測資料(100年5月)[資料檔]。台北市,環保署網 站:http://edw.epa.gov.tw/reportInspectDioxin.aspx. 104.
(118) [6] Elyakim, E. et al. hsa-miR-191 is a candidate oncogene target for hepatocellular carcinoma therapy. Cancer research 70, 8077-8087, doi:10.1158/0008-5472.CAN-10-1313 (2010).. [7] Davis, A. P. et al. The Comparative Toxicogenomics Database: update 2013. Nucleic Acids Res 41, D1104-1114, doi:10.1093/nar/gks994 (2013).. [8] Calkosinski, I., Dobrzynski, M., Cegielski, M., Sieja, A. & Calkosinska, M. [The multifaceted effect of 2,3,7,8-tetrachlorodibenzo-p-dioxin (TCDD) in organisms, especially dentition changes]. Postepy Hig Med Dosw (Online) 60, 237-240 (2006).. [9] Baan, R. et al. A review of human carcinogens--Part F: chemical agents and related occupations. Lancet Oncol 10, 1143-1144 (2009).. [10] Toyoshiba, H. et al. Gene interaction network suggests dioxin induces a significant linkage between aryl hydrocarbon receptor and retinoic acid receptor beta. Environmental health perspectives 112, 1217-1224 (2004).. 105.
相關文件
如:parathion、malathion,易與 choline esterase 結 合,使失其作用,造成 acetylcholine 之大量積 存,引起神經興奮、死亡。可用藥 Atropine 以 斷 choline estease 和
OSEventCnt OSEventType OSEventGrp OSTCBStkPtr OSTCBExtPtr OSTCBStkBottom OSTCBStkSize OSTCBId OSTCBNext OSTCBPrev OSTCBEventPtr OSTCBMsg OSTCBDly OSTCBStat OSTCBPrio
1.基於確保安全移轉、處理及使用以現代生物技術所獲得可能對生物多樣性保
Managing and Evaluating an HCS siRNA Screen of the p53 Pathway with AcuityXpress Software.
S08176 王輝明 一個亞太區、非隨機、開放性、第二期臨床試驗,用以評 估讓 KRAS 基因野生型的轉移性大腸直腸癌病患使用單
第 II 期 c-MET 分子前期 篩選:Taiwan Phase II Pre-screening Patient Information Sheet & Informed Consent Form Traditional Chinese
[r]
To evaluate Buffett’s pure stock-selection ability, we used Berkshire Hathaway’s 13F filings to collect the portfolio of publicly held companies and constructed a monthly time