• 沒有找到結果。

化合物抑制劑與蛋白激酶結合之嵌合計算研究:胺基酸支鏈可動性及活化中心氫鍵限制的影響

N/A
N/A
Protected

Academic year: 2021

Share "化合物抑制劑與蛋白激酶結合之嵌合計算研究:胺基酸支鏈可動性及活化中心氫鍵限制的影響"

Copied!
122
0
0

加載中.... (立即查看全文)

全文

(1)國立臺灣師範大學化學系碩士論文 指導教授:孫英傑 博士 Advisor:Ying-Chieh Sun,Ph.D. 化合物抑制劑與蛋白激酶結合之嵌合計算研 究:胺基酸支鏈可動性及活化中心氫鍵限制的 影響. Virtual Screening of Enzyme Inhibitors for Two Kinases Using Docking Computation:Effects of Flexible Side Chains and Hinge Hydrogen Bond Constraints 研究生:蔡孟璇 中華民國壹零壹年陸月.

(2) 謝誌. 碩士學位完成是我人生規畫中一個重要的過程,這兩年在研究所的日子,培 養了我嚴謹的態度及正確的判斷,一切的點點滴滴使身心都獲得了成長。本篇論 文得以順利完成,首先要感謝孫英傑教授的細心指導與鼓勵,讓我論文的基礎得 已成型。此 外,也 感 謝 口 試 委 員 楊 大 衍 教 授 與 許 世 宜 教 授 的 指 正 與 協 助 , 並提供許多建議,使本篇論文能更精緻完善。 在碩士班的生涯中,很幸運地身邊有許多人的幫助,特別是孫英傑教授,每 當在實驗上遇到瓶頸時,總是能夠給予我新的啟發,讓我對研究有新的思考及不 同面向的看法,尤其在進度報告時分享許多建議,老師所提供的意見確切指出我 在研究中所不足的盲點之處,也教導我面對任何事情時應有的態度以及方法,實 在受益良多。感謝冠緯、博晉、永富、興洲、育劭,嘉仁等所有實驗室的同學們, 謝謝你們平常的包容,賴於大家平日的精神支持與實質協助,讓我的碩士班生活 可以過得如此充實。 最後,感謝我的家人,感謝你們長久以來的支持與鼓勵,允許我追尋自己的 夢想,在此特別將完成論文的喜悅與你們一起分享。. 蔡孟璇. 謹識. 2012 年 6 月.

(3) 總目錄. 圖目錄 -------------------------------------------------------------------. Ⅳ. 表目錄 -------------------------------------------------------------------. Ⅶ. 中文摘要 ----------------------------------------------------------------. Ⅸ. 英文摘要 Abstract -----------------------------------------------------. XI. 第一章. 緒論 ---------------------------------------------------------------. 1. 1-1. 前言 ----------------------------------------------------------------. 2. 1-2. 與 CDKs 相關的細胞週期調控(cell cycle control)-----. 4. 1-3. 蛋白質激酶訊息傳導與酪胺酸激脢受體(receptor tyrosine kinase ,c-MET)及癌症(Cancer)-------------. 5. 1-4. 與 c-MET 相關疾病的訊息傳導途徑及其抑制劑------------. 6. 1-5. 分子嵌合(Docking)----------------------------------------------. 11. 1-6. DUD 資料庫(Directory of Useful Decoys) ----------------. 12. 1-7. 研究目標 -----------------------------------------------------------. 13. 理論與方法 ------------------------------------------------------. 15. 2-1. 分子嵌合遺傳學優化(GOLD)-----------------------------------. 16. 2-2. 評分函數(Scoring Function)-----------------------------------. 17. 第二章. I.

(4) 2-3. 遺傳演算法 --------------------------------------------------------. 20. 搜尋效率(Scoring Efficiency) ------------------------. 22. 2-3-1 2-4. 蛋白質可動胺基酸支鏈設定------------------------------------. 24. 2-5. 活化中心蛋白質骨架氫鍵原子限制設定---------------------. 25. 2-6. 分析方法與分子嵌合參數設定 --------------------------------. 27. 2-6-1. 再現 10 個已知 IC50 實驗值的結晶結構------------. 28. 2-6-2. 設定可動胺基酸支鏈的交叉分子嵌合--------------. 29. 2-6-3. c-MET 可動胺基酸支鏈的 1000 個小分子虛擬篩 選 -----------------------------------------------------------. 2-6-4. c-MET 活化中心氫鍵限制的 1000 個小分子虛擬 篩選----------------------------------------------------------. 40. 高速虛擬篩選 ZINC 化學資料庫分子----------------. 44. 計算結果與討論 ------------------------------------------------. 46. 2-6-5 第三章. 34. 3-1. CDK2 可動胺基酸支鏈及活化中心氫鍵限制 EF 數值----. 48. 3-2. CDK2 結果討論/分析--------------------------------------------. 50. 3-3. c-MET10 個已知 IC50 實驗值結構評分值結果----------------. 56. 3-4. c-MET 設定可動胺基酸支鏈交叉分子嵌合結果------------. 58. 3-4-1. 蛋白質固定不動結果分析/討論-----------------------. 59. 3-4-2. 動 Met1160 與 Glu1127 的支鏈結果分析/討論-----. 62. II.

(5) 3-4-3. 動 Met1160、Glu1127 與 Ile1084 的支鏈結果分析 /討論--------------------------------------------------------. 3-4-4. 動 Met1160、Glu1127、Ile1084 與 Leu1157 的支 鏈結果分析/討論-----------------------------------------. 3-5. 63. 64. c-MET 可動胺基酸支鏈及活化中心氫鍵限制的 1000 個 小分子虛擬篩選 --------------------------------------------------. 66. 3-5-1. 選擇適當的評分函數------------------------------------. 67. 3-5-2. 選擇合適的搜尋效率(search efficiency) -------------. 73. 3-5-3. 分析/討論 3 種可動胺基酸支鏈及活化中心氫鍵 限制的影響 -----------------------------------------------. 77. 3-5-4 分析/討論 3 個結晶構型的結果比較 ------------------. 81. 高速虛擬篩選 ZNIC 化學資料庫分子結果--------------------. 86. 3-6-1. ZNIC 篩選結果前 100 名分子結構 ------------------. 89. 3-6-2. ZNIC 篩選結果與前 5 名之結合模式 ---------------. 95. 結論 ---------------------------------------------------------------. 103. 參考文獻 ---------------------------------------------------------------------. 105. 3-6. 第四章. III.

(6) 圖目錄 圖1. 細胞週期------------------------------------------------. 4. 圖2. c-MET 訊息傳導路徑-------------------------------------. 6. 圖3. c-MET 3D 結晶構型---------------------------------------. 7. 圖4. genetic algorithm 流程圖--------------------------------. 21. 圖5. 可動胺基酸支鏈設定的輔助說明圖------------------. 24. 圖6. 小分子與蛋白質骨架原子之氫鍵作用力示意圖--. 25. 圖7. 不同的小分子與蛋白質骨架形成之氫鍵示意圖--. 26. 圖8. 3 個 c-MET 結晶構型胺基酸序列比對圖-------------. 30. 圖9. 3 個 c-MET 結晶構型活性中心胺基酸結構圖-------. 33. 圖 10. 3CTH hinge 附近小分子與蛋白質形成氫鍵示意圖. 41. 圖 11. 3CTH hinge 附近小分子與蛋白質形成之氫鍵距離. 41. 圖 12. 3CTJ hinge 附近小分子與蛋白質形成氫鍵示意圖. 42. 圖 13. 3CTJ hinge 附近小分子與蛋白質形成之氫鍵距離. 42. 圖 14. 3L8V hinge 附近小分子與蛋白質形成氫鍵示意圖. 43. 圖 15. 3L8V hinge 附近小分子與蛋白質形成之氫鍵距離. 43. 圖 16. CDK2 三種結晶構型在不同設定下 top1%時 EF 值. 48. 圖 17. CDK2 三種結晶構型在不同設定下 top5%時 enrichment factor 數值-----------------------------IV. 49.

(7) 2. 圖 18. pIC50 值與化合物評分值的相關圖(R =0.610) -----. 53. 圖 19. c-MET 活性位置 3D 圖-----------------------------------. 61. 圖 20. 3CTH 可動胺基酸支鏈及活化中心氫鍵限制設定 條件 top1%、top5%、top10%與 EF 作圖------------. 圖 21. 3CTJ 可動胺基酸支鏈及活化中心氫鍵限制設定 條件 top1%、top5%、top10%與 EF 作圖------------. 圖 22. 75. 76. 3L8V 可動胺基酸支鏈及活化中心氫鍵限制設定 條件 top1%、top5%、top10%與 EF 作圖------------. 76. 圖 23. top1%-3 個結晶構型的 EF 作圖------------------------. 79. 圖 24. top5%-3 個結晶構型的 EF 作圖------------------------. 79. 圖 25. top10%-3 個結晶構型的 EF 作圖----------------------. 80. 圖 26. ZINC12431676 分子結構 -------------------------------. 93. 圖 27. ZINC12431676 在活性位置之 3D 結構圖 ------------. 93. 圖 28. ZINC12431676 分子結構 -------------------------------. 94. 圖 29. ZINC12431676 在活性位置之 3D 結構圖 ------------. 94. 圖 30. ZINC12406622 分子結構 -------------------------------. 95. 圖 31. ZINC12406622 在活性位置之 3D 結構圖-------------. 95. 圖 32. ZINC12431633 分子結構 -------------------------------. 96. 圖 33. ZINC12431633 在活性位置之 3D 結構圖-------------. 96. V.

(8) 圖 34. ZINC12155041 分子結構 -------------------------------. 97. 圖 35. ZINC12155041 在活性位置之 3D 結構圖-------------. 97. VI.

(9) 表目錄 表1. 10 個化合物分子結構與 IC50 實驗數據---------------. 8. 表2. 10 個活性分子結構與 IC50 實驗數據-------------------. 35. 表3. 1CKP 在不同設定條件下 EF 平均數值------------------. 50. 表4. CDK2 在不同設定下 EF 倍率(decoys from DUD) ------. 51. 表5. CDK2 在不同設定下 EF 倍率(第一組 decoys from ZINC) --------------------------------------------------------. 表6. CDK2 在不同設定下 EF 倍率(第二組 decoys from ZINC) --------------------------------------------------------. 表7. 53. 擺動活化中心胺基酸支鏈 EF 倍率(第一組 decoys from ZINC) -------------------------------------------------. 表9. 52. 擺動活化中心胺基酸支鏈 EF 倍率(decoys from DUD) ----------------------------------------------------------. 表8. 51. 53. 擺動活化中心胺基酸支鏈 EF 倍率(第二組 decoys from ZINC) -------------------------------------------------. 53. 表 10. CDK2 不同條件設定 Top1%EF 平均倍率-----------------. 53. 表 11. 10 個已知 IC50 實驗值結構評分值結果-----------------. 56. 表 12. 蛋白質固定不動交叉分子嵌合的 RMSD 值-------------. 60. 表 13. 蛋白質固定不動交叉分子嵌合的 RMSD 值-------------. 61. VII.

(10) 表 14. 擺動 Met1160 與 Glu1127 的支鏈交叉分子嵌合的 RMSD 值-------------------------------------------------------. 表 15. 擺動 Met1160、Glu1127 與 Ile1084 的支鏈交叉分 子嵌合的 RMSD 值-------------------------------------------. 表 16. 62. 擺動 Met1160、Glu1127、Ile1084 與 Leu1157 的支 鏈交叉分子嵌合的 RMSD 值-------------------------------. 表 17. 62. 64. scoring function 與其 Spearman's rank correlationcoefficientρ值-------------------------. 67. 表 18. 18 個活性分子結構與 Ki 實驗數據---------------------. 68. 表 19. 10 個活性分子結構與 Ki 實驗數據---------------------. 74. 表 20. 3CTH 的 1000 個小分子虛擬篩選 EF 數值---------------. 77. 表 21. 3CTJ 的 1000 個小分子虛擬篩選 EF 數值---------------. 78. 表 22. 3L8V 的 1000 個小分子虛擬篩選 EF 數值---------------. 78. 表 23. top1%-3 個結晶構型 EF 數值-----------------------------. 81. 表 24. top5%-3 個結晶構型 EF 數值-----------------------------. 82. 表 25. top10%-3 個結晶構型 EF 數值---------------------------. 82. 表 26. 前 100 名分子及其性質 -----------------------------------. 86. 表 27. 前 10 名分子各作用力評分數值--------------------------. 96. VIII.

(11) 摘要 我們探討兩種蛋白激酶,CDK2 和 c-MET 的分子嵌合計算。此兩種蛋白激酶 在藥物發展上是許多實驗學家所感興趣的。 在 CDK2 蛋白激酶的部分,我們研究在虛擬篩選時,是否擺動胺基酸支鏈加 上活化中心氫鍵限制可以提高 enrichment factor(EF)。我們使用 Directory of Useful Decoys (DUD)資料庫作為測試基準資料庫。平均來說,將活化中心氫鍵 限制可以使 EF 提高 2 倍;若單獨擺動胺基酸支鏈僅能使 EF 微幅增加。兩個效應 同時在嵌合計算開啟所得到的 EFs 和個別效應所得到的 EFs 並沒有明顯的增加。 有趣的是,某些胺基酸支鏈相較其他而言會對 EF 有很大的影響。這些計算結果 對於虛擬篩選是有幫助的,在大型的分子數據資料庫以獲得更好的命中。 除了 CDK2 激酶外,我們也使用相同的分子嵌合計算程序對 c-MET 激酶做研 究。c-MET 為一種蛋白質激酶,在多細胞生物中扮演重要的角色,如調控細胞的 增殖、移動、侵襲、轉移與血管新生等,且對於胚胎發育和傷口癒合是不可或缺 的;然而,c-Met 的過量表現或突變,也是造成人類癌症的原因之一。 首先,我們從蛋白質資料庫可得的結晶構型,挑選 10 個 c-MET 抑制劑複合物做 分子嵌合計算,研究其再現性。第二,我們再選擇 5 個 c-MET 抑制劑複合物做交 叉分子嵌合,藉此研究當 c-MET 在不同的結晶構型時,如何再現小分子的構型。 第三,我們選擇前 3 名的 c-MET 結晶構型進行虛擬篩選,計算 10 個已知具有抑 制力的小分子,在嵌合計算中可篩選出多少個活性分子。同時也設定擺動胺基酸 IX.

(12) 支鏈及活性中心氫鍵限制。我們發現,當設定 3 個可動胺基酸支鏈加上可形成氫 鍵原子做限制時,和其他組合相較之下結果較佳。最後,我們藉由以上較佳的條 件選擇和設定,高速虛擬篩選 40 萬個化合物,並分析數個具有較佳親和力的化 合物與 c-MET 之間的作用力和結合圖形,而這些計算結果將有助於實驗學家設計 與搜尋 c-MET 抑制劑。. 關鍵字:激酶、分子嵌合計算、虛擬篩選 X.

(13) Abstract In the present study, we carried out docking computation of compounds against two kinases, CDK2 and c-MET, using GOLD program. Both are of pharmaceutical interest. In the part of CDK2 kinase, we investigated if allowing side chains to move and applying hydrogen bond constrains can enhance enrichment factor(EF) in virtual screening. To this end, compounds from DUD database were used for benchmark. The computations gave that applying hydrogen bond constraints enhance EF, on average, by about a factor of 2, and allowing side chains to move only enhance EF slightly. With both effects turned on in docking computation, the calculated EFs do not enhance significantly compared with EFs obtained from individual effect. Interestingly, some side chains have more significant enrichment effects than others. These computed results should be useful for virtual screening over large compounds databases against CDK2 kinase in order to obtain better hits. In addition to CDK2, we also investigated c-MET kinase using similar docking procedure. c-MET (MET) is a kinase protein that plays an important role in multi-cells, including regulation of proliferation, motility, invasion, migration, and angiogenesis. It is also essential for embryonic XI.

(14) development and tissue damage repair. However, overexpression of c-MET or mutations occurs in many human cancers. First, we carried out docking computations for 10 c-met inhibitor complexes with crystal structures available in the protein data bank in orderto examine their reproducibility.Second, we choose 5 complexes to do crossing docking and investigate how ligand conformations can be regained when protein structures from different complexes were used. Third, we selected top3 protein structures from these 5 complexes for subsequent virtual screening. For benchmark, we constructed a group of 1000 compounds consisting 10 active and 990 decoy compounds, and see if 10 active compounds can be screened out in docking computation.Effects of side chain flexibility and hinge hydrogen bond constraints were examined as well. We found that the results obtained byallowing 3 residues to move and constraining 2hinge hydrogen bonds simultaneouslyare better than results obtained by other combinations. Finally, virtual screening for 400,000 compounds of c-MET was carried out. The interactions between top-ranked compounds and c-met were analyzed and discussed. These computed results and analysis should be of aid in design and discovery of c-met inhibitors.. key words:kinase、docking computations、Virtual Screening XII.

(15) 第一章 緒論. 1-1. 前言. 1-2. 與 CDKs 相關的細胞週期調控(cell cycle control). 1-3. 蛋白質激酶訊息傳導與酪胺酸激脢受體(receptor tyrosine kinase ,c-MET)及癌症(Cancer). 1-4. c-MET 相關疾病的訊息傳導途徑及其抑制劑. 1-5. 分子嵌合(Docking). 1-6. Directory of Useful Decoys (DUD). 1-7. 研究目標. 1.

(16) 1-1 前言 蛋白質激酶是治療許多疾病的重要標靶蛋白,其中一部分蛋白質激酶的抑制 劑已是臨床用藥,同時過去幾十年對於研究新的、有效的 kinase 抑制劑一直持 續增加當中。此外,在臨床上,一些抗癌藥物抑制劑的使用,有抗藥性的問題產 生,因此 kinase 抑制劑的研究仍是藥物化學研究中的重要課題。 構效關係 1 2 QASR(QuantitativeStructure-Activity Relationship)研究是 藥物設計中一重要方法,研究一群分子的結構與其功能活性關係。藉助分子與分 子之間的物理化學性質參數,或是分子結構上的參數,以數學或統計學方式來做 定量測定,研究有機小分子與生物大分子間的相互作用,或是有機小分子在生物 體內吸收、分佈、代謝、排泄等生理上相關性質的方法。構效關係除了應用於藥 物設計上,也廣泛用於化學毒劑或是農藥等生物活性分子的設計。但目前隨著電 腦計算能力的提高和運算時間上的縮短,利用電腦輔助藥物設計 3 可以快速大範 圍篩選有可能具有活性的化合物,其中分子嵌合 4 (Docking)技術即常被用以 篩選藥物分子。藥物分子篩選方法主要是以化學資料庫進行虛擬篩選 5 (virtual screening)作大範圍篩選,找出具有潛力的藥物分子,此方式漸漸取代了過去定 量構效關係在藥物設計上的主導地位,儘管如此,QSAR 技術在藥物研究上仍然 發揮很重要的作用。 虛擬篩選的方式主要可分為兩大類,分別為 ligand –based approach 6 以 及 structure-based approach 7 。Ligand-based approach 是以 ligand 為基礎 2.

(17) 的設計方法,將預備分析的分子透過電腦的計算,藉由電腦計算後產生的描述符 號,我們可得知此分子和已知活性或非活性分子間的相似性為何,在這方法中我 們可以不需要知道蛋白質的結構。Structure-based approach 則是以標靶蛋白 質結構做為基礎的設計方法。由於目前蛋白質資料庫的擴展及 X-ray 繞射技術的 進步,藉由核磁共振(NMR)得知分子的結構,用一系列小分子和蛋白質的複 合物來定義出主要作用的類型,以及小分子上官能基和蛋白質胺基酸的距離。. 3.

(18) 1-2 與 CDKs 相關的細胞週期調控(cell cycle control). 細胞週期是一非常複雜且精細的調節過程,有大量的蛋白質參與其中,且 主要的核心為細胞週期依賴性蛋白激酶 8 9 10 (Cyclin-dependent kinases,CDKs)。 CDKs 在蛋白激酶中是較獨特的,因為它們的功能嚴格地取決於各個不同的 cyclins 蛋白質,至今為止,CDK1、CDK2、CDK3、CDK4、CDK6、CDK7 發現和細胞 周期的調節相關;CDK8、CDK9 和轉錄調節有關;CDK5、CDK11 和神經功能較相關。 細胞週期是一連串有規律的步驟,使細胞成長,而後分裂為兩個子細胞, 不分裂的細胞則不在細胞週期之中。其各階段如圖 1 所示,包括 G1,S,G2 和 M。 G1 代表“GAP 1”,S 代表“Synthesis”(合成),為 DNA 進行複製的階段。G2 代表“GAP 2”,M 代表“mitosis”(有絲分裂),為進行核裂(染色體分離)和質 裂(cytokinesis,細胞質分裂)的階段。其中,CDKs 是控制細胞週期中,細胞由 一個狀態進入下一個狀態的主要物質,可使細胞由 G1 進入 S 或由 G2 進入 M。. 圖 1:細胞週期 11 4.

(19) 1-3 蛋白質激酶訊息傳導與酪胺酸激脢受體(receptor tyrosine kinase ,c-MET)及癌症(Cancer) 在生物體內,酶(kinase)是訊息傳遞途徑與細胞活動的重要成員,藉由磷 酸化特定蛋白質來傳遞分子訊息,調控細胞酵素及其他蛋白質,蛋白質酶在進行 磷酸化步驟時,再進行下一步反應,磷酸化其他特定蛋白質,完成傳遞訊息步驟。 過去研究也指出,一個正常細胞,如果負責生長控制的訊號傳遞組件出了問 題,它就有可能轉變成癌細胞,若阻斷與癌症相關訊息傳導途徑就可有效抑制癌 細胞的生長與繁殖。對於訊息傳導途徑當中包含許多生化分子與酵素,一般而言, 若以藥物與標靶蛋白質結合控制其活性,對治療有效的癌細胞可以產生增加癌細 胞凋亡、減少增殖、促進分化、減少血管生成與轉移。 本篇研究所探討的酪胺酸激脢受體 12(receptor tyrosine kinase ,c-MET) 在多細胞生物中扮演重要的角色,如調控細胞的增殖、移動、侵襲、轉移與組織 再生等,且對於胚胎發育和傷口癒合是不可或缺的。c-MET 屬於酪胺酸蛋白激酶 (tyrosine protein kinase) ,Met 是肝細胞生長因子(hepatocyte growth factor, HGF)的細胞表面接受體。HGF 是一種具多樣性功能的生長因子,當 HGF 與 c-Met 結合之後,引發 Met 的酪氨酸磷酸化,並吸引其他細胞內訊息傳遞分子與之結合, 進而藉由活化這些細胞蛋白,將 HGF 的訊息傳遞到細胞內,最後導致細胞行為的 改變。在許多人類的癌症,都可以發現有 c-MET 的過量表現或發生突變。. 5.

(20) 1-4 c-MET 相關疾病的訊息傳導途徑及其抑制劑. c-MET 與許多疾病的訊息傳導路徑接息息相關 13 。如下圖 2,此為 c-MET 訊息傳遞路徑模型。當 c-MET 與它的配位體肝細胞生長因子 (HGF) 結合時,其 酪氨酸激酶活性就會被活化,之後藉由與 SH2 domain 特定蛋白的結合與磷酸化, 來活化 Ras、PI3K、 MAPK、STATs 等訊息傳導路徑。. 圖 2:c-MET 訊息傳導路徑 14. 6.

(21) 圖 3:c-MET3D 結晶構型(PDB code:3CTJ) 目前對 c-MET 在結構生物學研究上,蛋白質資料庫(Protein Data Bank)中 約有六萬多個 c-MET X-ray 結晶構型被解出,在活性位置結構特性上 15 ,如上 圖 3,分別由多胺酸片段(Glycine-rich-loop,胺基酸片段 1084-1089,紅色)、鉸 鏈片段(Hinge loop,胺基酸片段 1157-1160,深藍色) 、催化片段(Catalytic loop, 胺基酸片段 1195-1208,橘色)以及活化片段(Activation loop,胺基酸片段 1218-1223,粉紅色)這些二級結構所組成。 目前市面上尚未出現以 c-MET 為治療標靶的藥物,但在一些研究中已有實 驗數據被提出,實驗中這些抑制劑具有良好的抑制效果。因此,在本篇論文研究 中,我們挑選 10 個已有實驗數據的化合物,並測得這 10 個化合物與 c-met 的抑 制情形,其 IC50 值介於 1~110nM,如下表 1, 7.

(22) 表 1:10 個化合物分子結構與 IC50 實驗數據 NO. PDB code. IC50 (nM). NO. PDB code. 1. 3CE3. 1.8. 6. 3A4P. 56. 2. 3CTH. 3.5. 7. 1R0P. 73. Ligand. 8. Ligand. IC50 (nM).

(23) 3. 3CTJ. 1.0. 8. 3L8V. 8. 4. 3F82. 3.9. 9. 3DKF. 43. 9.

(24) 3DKC. 43. 5. 10. 10. 1R1W. 110.

(25) 1-4 分子嵌合(Docking). 在分子模擬的領域中,Docking 軟體可用來了解小分子(ligand)和蛋白質 (protein)的結合情形,模擬小分子與生物大分子,在三維結構的嵌合情形和其 結合強度的計算方法,接著透過虛擬篩選,得到活性化合物與 protein 間的結合 能,以助於發現當中一些重要的作用力位置,此為分子嵌合技術在藥物設計領域 上所扮演的角色。 欲預測出小分子與蛋白質最佳的結合模式須考慮到兩個面向:第一,要有準 確的評分函數(scoring function),其次,要有高效率的搜尋演算法(searching algorithm)。評分函數的設計,主要是從蛋白質結構資料庫中尋找解析度較好 的結晶構形,運用能量的計算,以建立一個準確的數學函數,可以快速有效地推 測小分子與蛋白質是否可以穩定的結合,甚至能計算結合強度(binding affinity)或結合的自由能(binding free energy)。由於尋找具有最佳評分 值的結合模式並不容易,所以我們必須搭配一個有效的搜尋演算法,避免浪費過 多計算時間。 目前的 Docking 軟體主要約有 20 多種,近年來學術界或是商業用途使用率 較高的包括 AutoDock 16 、Dock 17 、FlexX 18 、GOLD 19 、Glide 20 等,由於各軟體 中所使用的演算方法以及評分函數皆有所差異,因此所得到篩選預測準確度也會 有所差別。 11.

(26) 1-5 DUD 資料庫(Directory of Useful Decoys). Directory of Useful Decoys (DUD) 21 是一個為人熟知、用以測試 virtual screening 效能的標準資料庫,特別是用在分子嵌合計算上,其包含 40 個不同 的蛋白質的活性分子及非活性分子,活性分子共有 2950 個 ligand,每個活性分 子有 36 個 decoy 分子,實際上 decoy 數目應為 2,950 x 36 = 106,200,但因為 有部分 ligand 共享 decoy 的關係,因此,現有提供 decoy 數目為 95,266。然而, DUD 並非全然完整,還是會受限於某些因素,首先,所有 DUD 的 decoys 選自於 ZINC 資料庫,因此,僅測量小分子少部份在合成可行的區域。第二,選取 decoy 的標準為對應到其活性分子,在物理性質類似,例如分子量、cLogP、number of hydrogen donors and acceptors 、number of rotatable bonds、number of important functional groups,但彼此在化學結構上不同,因此 decoy 可能會 使得原來具活性的分子,在 ZINC 資料庫表現為物理性質較差者。. 12.

(27) 1-6 研究目標. 本研究目標針對兩個激酶- CDK2 及 c-Met-進行分子嵌合計算,主要檢視三 個效應。第一,檢視可動胺基酸支鏈對分子嵌合計算結果的影響,第二則是探討 活化中心附近蛋白質骨架和小分子間所形成的氫鍵,以 GOLD 軟體將氫鍵限制 (constraints)後對計算結果的影響,第三項則是同時設定可動胺基酸和氫鍵限 制,對分子嵌合計算結果的影響。最後,以高速虛擬篩選方式來搜尋對 c-MET 具有潛力的藥物小分子。在進行所有研究之前,我們先以 18 個已知實驗 IC50 值 之小分子化合物進行分子嵌合計算,用以驗證是否 Chemscore 評分函數所預測出 評分值能與實驗值具有正相關性。 在過去分子嵌合計算主要是將蛋白質固定,計算小分子置於活性中心的評分 值,然而,不同的小分子與相同蛋白質產生交互作用時,蛋白質的構型也會隨著 小分子構型不同而產生改變,特別是與小分子有交互作用之活性中心附近的胺基 酸 22 23 ,因此,我們藉由交叉分子嵌合模擬計算 24 與 1000 個小分子虛擬篩選 25 兩 種方法,分析討論在不同的可動胺基酸支鏈設定條件下,以及活化中心附近蛋白 質骨架和小分子間所形成的氫鍵做限制時對計算結果的影響,並找出最佳的設定 條件及結晶構型探討第二項及第三項的效應。. 13.

(28) 目前市面上尚未出現以 c-MET 為標靶治療的藥物,因此,我們搜尋 ZINC 分 子資料庫 26 中具有潛力的藥物結構,在我們研究中總共篩選 40 萬個分子,最終 挑選出評分值排序前 10 名化合物,作為建議之可能 c-MET 抑制劑及這些小分子 與蛋白質可能之結合模式。. 14.

(29) 第二章 理論與方法. 2-1. GOLD. 2-2. 評分函數(Scoring Function). 2-3. 遺傳演算法 2-3-1. 搜尋效率(Scoring Efficiency). 2-4. 蛋白質可動胺基酸支鏈設定. 2-5. 活化中心蛋白質骨架氫鍵原子限制設定. 2-6. 分析方法與分子嵌合參數設定 2-6-1. 再現 10 個已知 IC50 實驗值的結晶結構. 2-6-2. 設定可動胺基酸支鏈的交叉分子嵌合. 2-6-3. c-MET 可動胺基酸支鏈的 1000 個小分子虛擬篩選. 2-6-4. c-MET 活化中心氫鍵限制的 1000 個小分子虛擬篩選. 2-6-5. 高速虛擬篩選 ZINC 化學資料庫分子. 15.

(30) 2-1 分子嵌合遺傳學優化(GOLD). GOLD(Genetic Optimisation for Ligand Docking)是由 Cambridge Crystallographic Data Centre(CCDC)公司所研發設計,利用一套遺傳演算法 (genetic algorithm)的方式,來尋找小分子在蛋白質結合位置(binding site)中 能量最穩定構型的分子嵌合軟體。進行模擬計算時,我們可以設定部分特定位置 蛋白質的鍵做轉動 27. 28. ,也可以將活化中心附近能形成氫鍵的原子做. constraints 29 ,加重氫鍵作用力的計算,並且在計算過程中考慮結合位置處水 分子的作用,藉此找出能量較穩定的結合模式。 根據 GOLD 官方網站所公佈數據,由蛋白質資料庫取樣 305 個 X-ray 晶體 結晶結構重新進行嵌合計算,測得 GOLD 具有 72% 成功率能找到正確的結合模 式 30 ,此外在 85 個藥物結構中,GOLD 可再現 81% 的結構且 RMSD<2Å。. 16.

(31) 2-2 評分函數(Scoring Function). 在 GOLD(version 5.0 )程式中提供 4 種表示 protein-ligand 的評分函數可 選擇使用,分別為 Goldscore 31 、Chemscore 32. 33. 、Chemplp 34 以及 ASP 35 ,其設置. 的目的包含了三大方向:首先,評分函數須能判斷 ligand 和 protein 正確的結 合位置;其次,評分函數必須具有排列 ligand 和 protein 結合時的親和力數值; 最後,評分函數具有能力可以有效地從大量非活性的化合物中挑出具有活性的小 分子。在本篇論文中所選用到的評分函數為 Goldscore 36 和 Chemscore 兩評分函 數。. 17.

(32) 以下是 GoldScore 在計算小分子與蛋白質結合模式所使用的評分函數,詳細 如下所示:. Goldscore Fitness=S(hb_ext)+1.375×S(vdw_ext)+S(hb_int)+S(int)+S(bar) 其中 S(int)=S(vdw_int)+S(tors_int). S(hb_ext). →小分子與蛋白質間的氫鍵作用力. S(vdw_ext) →小分子與蛋白質間的凡得瓦作用力 S(hb_int). →小分子內部的氫鍵作用力. S(int). →小分子內部的作用力. S(vdw_int). →小分子內部的凡得瓦作用力. S(tors_int). →小分子內部的鍵結扭角能. S(bar). →水分子在小分子與蛋白質間所提供的作用力. 在 GoldScore 評分函數中,較特殊的計算項目為小分子與蛋白質間的凡得瓦 作用力必須加權 1.375 倍,此外,水分子對於評分函數影響也列入考量,當計算 得到評分值越高,代表能量越趨於穩定。. 18.

(33) 以下是 Chemscore 在計算小分子與蛋白質結合模式所使用的評分函數,詳細 如下所示: Chemscore Score =ΔG binding + Pclash+ cinternalPinternal+ (ccovalentPcovalent+ Pconstraint) 其中ΔG binding = ΔG 0 +ΔG hbond +ΔG metal +ΔG lipo +ΔG rot Pclash. →分子間的碰撞能. CinternalPinternal. →分子內的扭角能量. ccovalentPcovalent. →共價鍵的能量. ΔG0. →由多組線性迴歸得到的相關係數. ΔGhbond. →活性分子與蛋白質的氫鍵作用力. ΔGmetal. →所有原子與活性分子中的金屬作用力. ΔGlipo. →所有活性分子中的親油性分子與蛋白質親油性之作用力. ΔGrot→frozen rotatable bond 的作用力 由上述式子可以發現,GoldScore 和 Chemscore 兩評分函數在計算公式上有 所差異,且 Chemscore 分子間作用力的計算公式較 GoldScore 簡化許多,因此在 計算速度上 Chemscore 比 GoldScore 快三至五倍左右。. 19.

(34) 2-3 遺傳演算法. Gold 軟體使用了遺傳演算法(genetic algorithm,簡稱 GA)作為找出活性分 子在蛋白質中的最佳構型,將能量做最小化的方式搜尋蛋白質內的最佳結構。 遺傳演算法 37 (genetic algorithm,簡稱 GA)大約於 1950 年代開始發展, 由生物學者和電腦學家合作,在電腦上模擬出基因的運作,並應用到其他許多領 域。遺傳演算法在計算過程中,主要是模擬達爾文的進化論中提到「物競天擇, 適者生存,不適者淘汰」的進化理論,運用在尋找小分子與蛋白質間最佳結合模 式,在每次的計算中,構型較佳的會被保留下來,而構型不佳的則無法進入下一 步的計算。 在遺傳演算法中,首先會以亂數產生一群可能的構型成為初始結構(initial population)或母代族群,接著將母代族群每個構型編碼(encoding)成染色體 (chromosome),編碼是以二元編碼方式(binary coding)將染色體中每一基因 均以{0,1}表示,經過編碼後染色體為一串以{0,1}組合的字串,利用評分 函數計算時必須先經過解碼(decoding),來計算評分數值。在演算過程中,優 良染色體將會被大量複製到下一代,或是被選擇至交配池產生下一代,也就是評 分值高的染色體被選擇到機會相對較高。然而,在進行遺傳演算過程中為了避免 基因轉移(migration) 、交配(crossover)僅找尋到局部最佳解(local optimum), 可以運用突變(mutation)的方式,隨機改變子代某一基因值,跳脫搜索的空間 20.

(35) 以增加空間選擇的多樣性,使有機會找尋到全區最佳解(global optimum) 。當演 化達到指定世代數目或是已達收斂,將最後染色體進行解碼,得到的評分值越高, 代表此染色體愈趨近於最佳解,意謂在演化過程中存活的機率愈高。. 圖 4:genetic algorithm 流程圖 38. 21.

(36) 2-3-1. 搜尋效率(search efficiency). 搜尋效率的設定,是根據每一個獨立小分子,進行控制分子嵌合計算的速度, 以及預測其結果的準確性。 當將所有小分子的搜尋效率設定為 100%時,表示對於一個具有 5 個可旋轉 鍵結的小分子來說,將進行 30,000 GA 的操作數(number of operations);相對 來說,若將搜尋效率改為 50%,則此小分子將只會進行 15,000 GA 的操作數,其 計算結果的準確度將會降低,但所花的時間相對減少,因此可根據所要計算的小 分子數量來設定搜尋效率。. 22.

(37) 2-4 蛋白質可動胺基酸支鏈設定. 在真實情況中,人體內的蛋白質存在於溶液中,當蛋白質與活性分子嵌合時, 整個蛋白質是可以動的。但在大多的分子嵌合計算軟體中,為了降低計算時間, 除了將能量計算簡化之外,也會在計算時的預設值設定將蛋白質固定住不動,以 便加快計算的時間與搜尋小分子在蛋白質中的最穩定構型。 近年來,分子嵌合計算方法加入在蛋白質活性中心附近支鏈的位像搜尋,我 們可以自行選擇讓活性中心附近的胺基酸支鏈動,以模擬較接近真實的狀態,可 以改善預測時的準確性。特別是在當蛋白質結晶構型與非該結晶構型之小分子進 行分子嵌合時,可動的胺基酸支鏈將可提供較有彈性的空間,以配合小分子找尋 較穩定的構型。 在 GOLD 軟體進行可動胺基酸支鏈的設定方式中,每一次的計算最多可選擇 十組的胺基酸支鏈。在位向的搜尋上,每個胺基酸有不同可選轉的鍵數,與適當 的選轉角度,設定如下(圖 5 所示): (1). 選擇具有光學特性的原子 4 個,如下圖的 N (1286), CA (1287), CB (1290) 和 CG (1291),此將可定義為一條可旋轉鏈(Chi1)。. (2). 其中 N(1286)、CA(1287)、CB(1290)構成的平面與 CA(1287)、CB(1290)、 CG(1291)構成的平面所夾的角度,即我們可以自行設定的扭轉角度。. (3). 一個胺基酸將可設定數條可旋轉鏈,而一條旋轉鏈也可設定多個扭轉角 23.

(38) 度。. 圖 5:可動胺基酸支鏈設定的輔助說明圖-此為 Tyrosine 另外,GOLD 軟體根據文獻 46,建立圖書庫(Library),可以自動設定每個胺 基酸最適當的旋轉鍵及扭角。. 24.

(39) 2-5 活化中心蛋白質骨架氫鍵原子限制設定. 根據文獻 29 ,大部分的激酶在活化中心位置上有三種明確的蛋白質原子作用 力模式存在,如下圖 6 所示,此蛋白質原子包含了在 hinge 區的氫鍵,且 90%具 活性的小分子至少會和蛋白質上任兩個原子形成兩個氫鍵,若我們在進行分子嵌 合時,將可形成氫鍵的原子做限制,對於搜尋小分子和蛋白質較佳的結合模式具 有很大的幫助,且在往後大量虛擬篩選時,找到具活性小分子的機會可以提高許 多。. 圖 6:小分子與蛋白質骨架上原子之氫鍵作用力示意圖 29. 25.

(40) 我們選擇在 hinge 區同一胺基酸上可形成氫鍵的原子做限制,其中,一為 HBA(hydrogen bond acceptor),另一為 HBD(hydrogen bond donor),如圖 7 所 示,我們可以選擇 HBA1+HBD、HBA1+HBA2 以及 HBA2+HBD 三種方式做限制。. 圖 7:三種不同的小分子與蛋白質骨架形成之氫鍵示意圖 29. 26.

(41) 2-6 分析方法與分子嵌合 GOLD 軟體參數設定. c-MET 在蛋白質資料庫中有約六萬多個結晶構型,這些蛋白質的結晶構型不 全然相同。我們著重在活性中心附近的幾個胺基酸支鏈,探討當胺基酸支鏈進行 擺動,以及對活化中心可形成氫鍵的原子做 constraint 時,其對分子嵌合計算 的結果之影響。其中我們使用 Goldscore 評分函數來計算而得各項作用力數值, 並以此評分函數與 RMSD 值來進行探討。 在描述比較分子嵌合結果與 X-ray 實驗結構上的差異,以 root mean square deviation 值(簡稱為 RMSD)表示。. N:列入 RMSD 計算總原子數。 di:第 i 個原子與對應到參考結構該原子的距離,單位為 Å。. 當 RMSD 數值越大時,表示此分子與參考結構的差異越大。. 27.

(42) 2-6-1 再現 10 個已知 IC50 實驗值的結晶結構. 在研究之前,將先檢視 GOLD 軟體中,GOLDscore 評分函數所預測的評分值 是否能與實驗值具有相關性。我們找尋具有 IC50 實驗值的 c-MET 結晶構型 10 個 做為測試依據,進行分子嵌合模擬計算。. 在比較計算結果與實驗值時,為了能顯示出評分值與 IC50 之間的相關性,我 們將 IC50 轉換為 pIC50 值,如下式所列:. pIC50=-logIC50. 利用此方法顯示,表示若 GOLD 軟體可符合預期結果,則其結果評分值將與 pIC50 值具有正相關性。. 28.

(43) 2-6-2. 設定可動胺基酸支鏈的交叉分子嵌合. 藉由 2-6-1 的再現結晶構形結果,我們在其中挑出其 IC50 值較高且 fitness 較佳的 5 個蛋白質結晶構型。再從這 5 個結晶構形,挑出其活性中心附近的胺基 酸支鏈位置差異較大但胺基酸序列相同的 3 個結晶構形,來進行可動胺基酸支鏈 的交叉分子嵌合(cross docking)。 此 3 個結晶構型胺基酸序列如下頁圖 8 所示,其中紅色序列為 3 個結晶構型 的主要序列,往下的每一行序列依序為 3CTH、3CTJ、以及 3L8V。另外,圖中 也註明出多胺酸片段(Glycine-rich-loop,胺基酸片段 1082-1089)、鉸鏈片段(Hinge loop,胺基酸片段 1157-1160) 、催化片段(Catalytic loop,胺基酸片段 1195-1208) 以及活化片段(Activation loop,胺基酸片段 1218-1223)。 在 3CTJ 結晶構型中,由於 activation loop 附近缺少某些片段,因此,我們藉由 EasyModeller 39 (version 3.0 ) 軟體,補上所缺失的片段,使胺基酸序列更加完 整。. 29.

(44) Glycine-rich loop (1182-1089). Hinge (1157-1160). 30.

(45) Catalytic loop (1195-1208). Activation loop (1218-1223). 31.

(46) 圖 8:3 個 c-MET 結晶構型胺基酸序列比對圖. 32.

(47) 根據參考文獻 40 發現,Glycine-rich-loop 的主鏈位置差異度大,導致其支 鏈位置也不盡相同。另外,ILE1084 則是較容易與小分子產生作用力,所以容易 產生不同的構型。我們從圖 9 也發現,MET1160 與 GLU1127 也是活性中心附近構 型差異較大的兩個胺基酸支鏈。因此,我們將交叉分子嵌合模擬分成四種不同條 件情況,來進行比較: 第一部分:蛋白質固定不動 第二部分:動 MET1160 與 GLU1127 的支鏈 第三部分:動 MET1160、GLU1127、ILE1084 的支鏈 第四部分:動 MET1160、GLU1127、ILE1084 與 LEU1157 的支鏈. 圖 9:3 個 c-MET 結晶構型活性中心胺基酸結構圖 33.

(48) 2-6-3. c-MET 可動胺基酸支鏈的 1000 個小分子虛擬篩選. 我們利用不同 c-MET 可動胺基酸支鏈設定,進行 1000 個小分子虛擬篩選, 以便挑選出較適當的結晶構型以及可動胺基酸支鏈的設定條件。承接 2-6-2 的交 叉分子嵌合所挑選的 3 個蛋白質結晶構型,使用 GOLD virtual screening 設定, 我們進行 1000 個小分子的虛擬篩選。在 1000 個小分子中,包括 10 個已知具有 IC50 實驗值的抑制小分子,以及 990 個從 ZINC 資料庫所下載的小分子。. 10 個已知具有抑制 PKA 活性的小分子其分子結構與 IC50 實驗數據列於表 2 中。此外,我們以 Christopher A. Lipinski 在 1997 年所提出的 rule of five 41 作為 990 個小分子的篩選基本準則。 分子量. <500. logP 值. <5. 分子 hydrogen bond donor. <5. 分子 hydrogen bond acceptor <10. 34.

(49) 表 2:10 個活性分子結構與 IC50 實驗數據 IC50 (nM). MW. NO. 1. 1.0. 649. 2. 2.6. 702. NO. Ligand. 35. IC50 (nM). MW. 6. 368. 760. 7. 39000. 469. Ligand.

(50) 3. 1.9. 599. 8. 675. 393. 5. 4. 24. 516. 9. 1000. 498. 36.

(51) 5. 2.0. 392. 37. 10. 760. 285.

(52) 根據此基本準則,我們設定以下條件: 分子量. 350~500. logP 值. 0~5. 分子 hydrogen bond donor. 2~5. 分子 hydrogen bond acceptor. 1~5. 在 ZINC 資料庫進行搜尋,找到的共有 1000 個符合條件的小分子,並隨機刪除 10 個小分子,剩餘 990 個小分子我們則假設為 non-binders。. 進行 1000 小分子的虛擬篩選,我們計算篩選結果前 1%(前 10 名的小分子)、 前 5%(前 50 名的小分子)及前 10%(前 100 名的小分子)的 enrichment factor 42 44. ,來進行分析/討論。. enrichment factor 的計算如下:. EF. x%. . Activessampled N sampled. N total Activestotal. Activessampled. 表示在前 x%內所含抑制小分子的數量。. N. 表示在前 x%內所含的分子總數。. sampled. N total. 表示整個資料中所含的分子總數。. Activestotal. 表示整個資料中所含的抑制小分子的數量。 38. 43.

(53) 3 個 c-MET 結晶構型並根據下列三個部分分別進行 1000 個小分子虛擬篩選, 分析/討論在不同可動胺基酸支鏈的條件設定下,對篩選結果有何影響。. 第一部分:蛋白質固定不動 第二部分:動 MET1160 與 GLU1127 的支鏈 第三部分:動 MET1160、GLU1127、ILE1084 的支鏈 第四部分:動 MET1160、GLU1127、ILE1084 與 LEU1157 的支鏈. 39.

(54) 2-6-4 c-MET 活化中心氫鍵限制的 1000 個小分子虛擬篩選. 我們利用不同 C-MET 活化中心氫鍵限制,進行 1000 個小分子虛擬篩選,以 便挑選出較適當的結晶構型。承接 2-6-2 的交叉分子嵌合所挑選的 3 個蛋白質結 晶構型,藉由 VMD 軟體確認蛋白質 hinge 區可形成氫鍵的蛋白質骨架之原子, 3 個 c-MET 蛋白質結晶構型中,其 hinge 區域包含 Ala A1057、Leu A1058、Asn A1059、 Met1160,然而,並非此四個胺基酸上的氧原子或氮原子皆可做限制,適當的氫 鍵距離為 2.8~3.0Å,但由圖 11、圖 13 以及圖 15 可以看到,Leu A1058 和 Asn A1059 其氫鍵距離稍大,且在結構上被其他胺基酸片段檔到的關係,在 GOLD 軟體中無 法做限制的設定,因此,最後我們選擇 Met1160 做為提供 HBA 以及 HBD 之限制設 定。. 40.

(55) 圖 10:3CTH hinge 附近小分子與蛋白質形成之氫鍵示意圖. 圖 11:3CTH hinge 附近小分子與蛋白質形成之氫鍵距離. 41.

(56) 圖 12:3CTJ hinge 附近小分子與蛋白質形成之氫鍵示意圖. 圖 13:3CTJ hinge 附近小分子與蛋白質形成之氫鍵距離 42.

(57) 圖 14:3L8V hinge 附近小分子與蛋白質形成之氫鍵距離. 圖 15:3L8V hinge 附近小分子與蛋白質形成之氫鍵示意圖. 43.

(58) 2-6-5. 高速虛擬篩選 ZINC 化學資料庫分子. 在虛擬篩選中,為了能夠大量篩選出具有潛力藥物分子結構,來做為 c-met 的活性分子,必須藉化學資料庫(Chemical database)提供化學分子結構資料。 目前常用化學資料庫包含有 WDI(World Drug Index) 、美國國家癌症研究所(NCI, National Cancer Institute)、ACD(Available Chemical Directory)及 ZINC 等。在 本論文中是 ZINC 資料庫做為篩選分子檔案來源,目前在 ZINC 分子資料庫中收 藏約有一千三百萬個分子資料,可透過 ZINC 所建立網站(http://zinc.docking.org/) 來篩選所需分子資料。 由於 ZINC 資料庫中一千三百萬個左右的分子資料,若將其全數運算須耗費 大量時間,因此,為了能有效快速尋找出具有潛力分子,我們以 Christopher A. Lipinski 在 1997 年所提出的 rule of five 40 作為篩選基本準則。 分子量. <500. logP 值. <5. 分子 hydrogen bond donor. <5. 分子 hydrogen bond acceptor <10. 本篇論文在 ZINC 資料庫初步篩選分子設定為:分子量介於 350 到 500、分 子 hydrogen bond donor 介於 1 到 5、分子 hydrogen bond acceptor 介於 1 到 5 以及 44.

(59) 限制分子內可旋轉鍵結數小於 5,以此作為篩選依據在 ZINC 資料庫共篩選出約 40 萬個分子資料,往後將利用這些分子資料進行高速虛擬篩選。 為了加快虛擬篩選速度,在初步篩選時我們選擇以 GOLD 預設參數設定中 7-8 times speed-up 作為高速篩選時的設定,待初步篩選完畢後,選擇評分值前 10%的分子(約四萬個分子)進行第二次的篩選,最終將評分值排序前 100 名,來 找尋 10 個可能具有抑制效果的分子以及其結合構型,且此 10 個分子可以經由改 良與發展後,最終成為 c-MET 的抑制劑。. 45.

(60) 第三章 計算結果與討論. 3-1. CDK2 可動胺基酸支鏈及活化中心氫鍵限制 EF 數值. 3-2. CDK2 結果討論/分析. 3-3. c-MET10 個已知 IC50 實驗值結構評分值結果. 3-4. c-MET 設定可動胺基酸支鏈交叉分子嵌合結果 3-4-1. 蛋白質固定不動結果分析/討論. 3-3-2 動 Met1160 與 Glu1127 的支鏈結果分析/討論 3-4-3. 動 Met1160、Glu1127 與 Ile1084 的支鏈結果分析/討. 論 3-4-4. 動 Met1160、Glu1127、Ile1084 與 Leu1157 的支鏈結. 果分析/討論. 3-5. c-met 可動胺基酸支鏈及活化中心氫鍵限制的 1000 個小分子 虛擬篩選 3-5-1 選擇適當的評分函數 3-5-2. 選擇合適的搜尋效率(search efficiency). 3-5-3 分析/討論 3 種可動胺基酸支鏈及活化中心氫鍵限制的 影響 3-5-4 分析/討論 3 個結晶構型的結果比較 46.

(61) 3-6. 高速虛擬篩選 ZNIC 化學資料庫分子結果 3-6-1. ZNIC 篩選結果前 100 名分子結構. 3-6-2. ZNIC 篩選結果與前 5 名之結合模式. 47.

(62) 3-1 CDK2 可動胺基酸支鏈及活化中心氫鍵限制 EF 數值. 我們分析了 CDK2 三種結晶構型,分別為 1ckp、1hcl 以及 1hck,比較其在 蛋白質固定不動的情況下、可動胺基酸支鏈和可動胺基酸支鏈加上活化中心氫鍵 限制時,enrichment factor 的差異,由圖 16、17 顯示,當設定條件在可動胺 基酸支鏈加上活化中心氫鍵限制時 EF 是最高的,從過去許多文獻得知,設定可 動胺基酸支鏈會比蛋白質固定時有較高機會找到具活性的小分子,但若加入活化 中心氫鍵限制時,EF 數值可以再度提高。. top1%. rigid. 25. constraint Phe82. Enrichment factor. 20. Leu166 Phe82+His84 Glu81+Phe82. 15. Leu166+Arg150 Leu166+Phe152 10. Phe82+constraint Leu166+constraint Phe82+His84+constraint. 5. Glu81+Phe82+constraint Leu166+Arg150+constraint. 0. 1ckp. 1hcl. 1hck. Leu166+Phe152+constraint. 圖 16:CDK2 三種結晶構型在不同設定下 top1%時 enrichment factor 數值. 48.

(63) top5%. Enrichment factor. 10. rigid constraint. 9. Phe82. 8. Leu166. 7. Phe82+His84 Glu81+Phe82. 6. Leu166+Arg150. 5. Leu166+Phe152. 4. Phe82+constraint. 3. Leu166+constraint. 2. Phe82+His84+constraint. 1. Glu81+Phe82+constraint Leu166+Arg150+constraint. 0 1ckp. 1hcl. 1hck. Leu166+Phe152+constraint. 圖 17:CDK2 三種結晶構型在不同設定下 top5%時 enrichment factor 數值. 49.

(64) 3-2 CDK2 結果討論/分析. 對於可動胺基酸支鏈的選法,我們主要是將 CDK2 蛋白質結構分成三區來看, 分別為 hinge、activation loop 以及 Glycine rich loop,其中,在 hinge 附 近我們總共選了 7 組不同胺基酸支鏈的搭配,其中僅有 2 組所得到的 EF 和單獨 做限制時相近,隨著挑選的可動胺基酸支鏈在 activation loop 附近,在 15 種 不同組合有 6 組得到的 EF 高於單獨做限制的設定,和在 hinge 相比,讓 EF 增加 的 side chain 組合機率提高許多,當所挑選的可動胺基酸支鏈靠近 Glycine rich loop 時,在 9 種組合當中僅有 1 組 EF 的數值和 constrain 接近。. 表 3:1ckp 在不同設定條件下 EF 平均數值 設定條件. Top1%EF 平均值. Top5%EF 平均值. Top10%EF 平均值. Top20%EF 平均值. Constraint. 18.63. 6.62. 4.33. 3.68. Side chain side chain + constraint. 9.27. 3.99. 2.91. 2.02. 21.94. 10.34. 7.56. 4.12. 我們將各種不同設定條件組合所得到的 EF 取平均值,如表 3 所示,當設定 條件在可動胺基酸支鏈加上活化中心氫鍵限制時,EF 平均值是最高的,利用這 樣的概念,期許若做其它種激酶的虛擬篩選時,或許找到具有活性小分子的機率 可以提高許多。. 50.

(65) 最後,我們為了再次檢測不同設定條件下 EF 的增加幅度,從 ZINC 化學資料 庫隨機挑選和 DUD 中提供 decoys 數量相同的小分子,分成兩組和 DUD 中的活性 分子做虛擬篩選計算。 表 4:CDK2 在不同設定下 EF 倍率(decoys from DUD). constraint. Ratio top1% 1.46. Ratio top5% 2.78. Ratio top10% 2.60. Ratio top20% 2.4. Phe80+Phe82+c. 1.10. 2.06. 2.40. 2.4. His84+Lys142+c. 1.06. 1.83. 1.98. 2.06. Phe84+Ala151+c. 0.40. 1.06. 0.74. 1.06. Gln131+Ile135+Lys142+c. 0.45. 1.21. 1.26. 1.43. Gln131+Gln113+Lys142+c. 0.36. 0.71. 0.84. 0.93. Leu133+Lys142+Asp145+c. 0.45. 1.32. 1.14. 1.29. Leu134+Asn136+Lys142+c. 0.64. 1.07. 1.37. 1.73. Vla64+Lys142+Leu134+c. 0.73. 1.57. 1.52. 1.51. 1ckp. 註:c = constraint 表 5:CDK2 在不同設定下 EF 倍率(第一組 decoys from ZINC). constraint. Ratio top1% 2.51. Ratio top5% 2.39. Ratio top10% 2.18. Ratio top20% 1.95. Phe80+Phe82+c. 1.55. 1.14. 1.72. 1.54. His84+Lys142+c. 1.51. 1.85. 2.00. 1.76. Phe84+Ala151+c. 0.48. 0.56. 0.95. 1.36. Gln131+Ile135+Lys142+c. 2.50. 1.85. 2.00. 1.76. Gln131+Gln113+Lys142+c. 1.50. 1.43. 1.36. 1.12. Leu133+Lys142+Asp145+c. 0.50. 2.43. 2.09. 1.71. Leu134+Asn136+Lys142+c. 1.87. 2.43. 2.00. 1.89. Vla64+Lys142+Leu134+c. 1.50. 1.85. 2.00. 1.71. 1ckp. 註:c = constraint 51.

(66) 表 6:CDK2 在不同設定下 EF 倍率(第二組 decoys from ZINC). 1ckp constraint Phe80+Phe82+c His84+Lys142+c Phe84+Ala151+c Gln131+Ile135+Lys142+c Gln131+Gln113+Lys142+c Leu133+Lys142+Asp145+c Leu134+Asn136+Lys142+c Vla64+Lys142+Leu134+c. Ratio top1%. Ratio top5%. Ratio top10%. Ratio top20%. 3.87 1.55 1.87 1.00 2.70 2.22. 2.61 1.10 1.50 0.70 1.10 0.85. 2.48 1.43 1.25 0.89 1.25 1.11. 2.12 1.74 1.65 0.73 1.52 0.9. 0.49 1.87. 1.90 1.49. 1.41 1.48. 1.44 1.60. 0.48. 1.49. 1.36. 1.81. 註:c = constraint. 由表 4、表 5 與表 6 可以發現,當 decoys 選自 ZINC,設定條件為 constraint 時,EF 倍率和 rigid 相比明顯增加兩倍以上,這顯示了 constraint 使 EF 增加 的效應遠比單獨擺動胺基酸支鏈來得大,此表示找到活性分子的機會可以提高。 比較 decoys 選擇來自不同資料庫的結果,在相同條件的設定下,EF 增加的趨勢 是一致的。然而,若我們加入擺動 hinge 附近或是 Glycine rich loop 上的胺基 酸支鏈,EF 會稍微下降,因此我們將擺動胺基酸支鏈的位置轉移到 activation loop,檢測其經由計算後所得到的 EF 數值變化。. 52.

(67) 表 7:擺動活化中心胺基酸支鏈時 EF 倍率(decoys from DUD). 1ckp. Ratio top1%. Ratio top5%. Ratio top10%. Ratio top20%. constraint. 1.46. 2.78. 2.60. 2.4. Leu166+Arg150. 0.45. 1.21. 1.68. 2.03. Leu166+Arg150+c. 1.09. 1.64. 2.37. 2.38. Leu166+Phe152. 0.72. 1.21. 1.63. 1.9. Leu166+Phe152+c. 1. 1.5. 1.94. 2.03. 註:c = constraint 表 8:擺動活化中心胺基酸支鏈時 EF 倍率(第一組 decoys from ZINC). 1ckp. Ratio top1%. Ratio top5%. Ratio top10%. Ratio top20%. constraint. 2.51. 2.39. 2.18. 1.95. Leu166+Arg150. 3.55. 2.57. 2.63. 2.42. Leu166+Arg150+c. 8.11. 4.41. 4.46. 3.25. Leu166+Phe152. 6.55. 3.29. 3.73. 2.95. Leu166+Phe152+c. 7.63. 5.15. 4.46. 3.61. 註:c = constraint 表 9:擺動活化中心胺基酸支鏈時 EF 倍率(第二組 decoys from ZINC). 1ckp. Ratio top1%. Ratio top5%. Ratio top10%. Ratio top20%. constraint. 3.87. 2.61. 2.48. 2.12. Leu166+Arg150. 2.89. 1.79. 1.99. 2.00. Leu166+Arg150+c. 7.24. 2.89. 3.02. 2.72. Leu166+Phe152. 4.24. 2.00. 2.63. 2.43. Leu166+Phe152+c. 5.55. 3.30. 2.89. 2.82. 註:c = constraint. 53.

(68) 從表 7、表 8 與表 9 可以發現,隨著擺動胺基酸支鏈在 activation loop 上 時,加上 constraint 後,EF 的倍率遠比單獨 constraint 高許多。例如表 8,擺 動 Leu166+Arg150 時,EF 和 rigid 相比時增加 3.55 倍,但加入 constraint 後, EF 提高到 8.11 倍;或者表 9,擺動 Leu166+Phe152 時,EF 和 rigid 相比時增 加 4.24 倍,但加入 constraint 後,EF 提高到 5.55 倍。從過去文獻可以得知, 擺動胺基酸支鏈找到具活性小分子的機會可以提高,若我們結合加入活性中心氫 鍵 constraint,且選擇適當的擺動胺基酸支鏈組合,可以大幅地提高 EF 值。. 表 10:CDK2 不同條件設定 Top1%EF 平均倍率 設定條件. Top1% EF 平均倍率. 活性中心氫鍵限制. 2.41. 擺動胺基酸支鏈. 2.13. 活性中心氫鍵限制+擺動胺基 酸支鏈. 3.25. 我們將不同條件組合在 top1%EF 的倍率取平均值,如果 10 所示,整體來說, 做 CDK2 的分子嵌合計算時,若我們選擇擺動胺基酸支鏈加上活性中心氫鍵限制, EF 得到的平均倍率是較高的。然而,不論我們將條件設定為活性中心氫鍵限制, 擺動胺基酸支鏈或是同時設定兩者,平均來說,EF 和蛋白質不動相比有升高的 結果。. 54.

(69) 最後,我們將表 8、表 9 不同的組合,在篩選時放入原結晶構型 1ckp 的 ligand-PVB,在總分子數 2146 個中,活性分子 PVB 皆在前 10 名被挑選出來,表 示往後大量篩選時,我們若選用表 8、表 9 的篩選條件時,找到具有活性分子的 機會可以提高。. 55.

(70) 3-3. c-MET 10 個已知 IC50 實驗值結構評分值結果. 在研究之前,我們先檢視 GOLD 軟體中,GOLDscore 評分函數所預測的評分 值是否能與實驗值具有相關性。我們挑選出 10 個已知實驗 IC50 值的分子結構做 為測試依據。表 11 是 10 個化合物以 Default1 設定、100GA run 以及將 operations 改為 1 ×106 測試的各項數值結果。其中 RMSD 值所表示的是,每個化合物前 5 個 clusters 中,與結晶構型最低的 RMSD 值。 根據表 10 發現,10 個化合物其前 cluster5 結果皆與結晶構型的 RMSD < 2, 表示此 10 個化合物再現結果準確度高。 圖 18 為 17 個化合物評分值與實驗值 pIC50 值的相關度作圖。其中 R2=0.647, 發現其評分值結果與實驗 pIC50 值具有良好的相關性,顯示此評分函數之適用 性。. 表 11:10 個已知 IC50 實驗值結構評分值結果 IC50 No. PDB. ligand. pIC50. cluster. Rmsd. fitness. (nM) 1. 3CE3. 1FN. 1.8. 8.74. 2. 0.80. 100.05. 2. 3CTH. 319. 35. 7.45. 1. 0.77. 76.3. 3. 3CTJ. 320. 10. 6.95. 2. 0.90. 71.25. 56.

(71) 4. 3F82. 353. 3.9. 8.40. 1. 1.55. 88.96. 5. 3DKC. ATP. 43. 7.36. 1. 0.73. 88.6. 6. 3A4P. DFQ. 56. 7.25. 2. 0.75. 71.23. 7. 1R0P. KSA. 73. 8.00. 3. 0.54. 77.6. 8. 3L8V. L8V. 8. 8.09. 2. 0.67. 94.04. 9. 3DKF. SX8. 43. 7.36. 2. 0.62. 68.12. 10. 1R1W. KSA. 110. 8.00. 1. 1.13. 83.65. Default 1 setting 100 GA runs Fitness Score. 110 100 90 80 70 60 50 5. 6. 7. 8. 9. Experimental pIC50 圖 18:pIC50 值與化合物評分值的相關圖(R2=0.610). 57. 10 R² = 0.647.

(72) 3-4 c-MET 設定可動胺基酸支鏈的交叉分子嵌合結果. 藉由表 11 再現結晶構型結果,我們將此 10 個先進行交叉分子嵌合模擬。再 根據這十個結晶構型,挑出其活性中心附近的胺基酸支位置差異較大但序列相同 的四個蛋白質結晶構型:包括 3CTH、3CTJ、3F82 和 3L8V,來進行可動胺基酸支 鏈的交叉分子嵌合(cross docking)。我們將交叉分子嵌合模擬再分成三種不同 條件情況下,進行比較: 第一部分:蛋白質固定不動 第二部分:動 Met1160 與 Glu1127 的支鏈 第三部分:動 Met1160、Glu1127 與 Ile1084 的支鏈 第四部分:動 Met1160、Glu1127、Ile1084 與 Leu1157 的支鏈. 我們取每個分子嵌合模擬的前 5 個 cluster 中最低的 RMSD 值來紀錄,並將 結果分成四部分進行分析,其中表 4、5、6、7、8 對角線深藍色框部分為原本下 載的結晶構型配對(3CE3-1FN、3CTH-319、3CTJ-320、3F82-353、3DKC-ATP、 3A4P-DFQ、1R0P-KSA、3L8V-L8V、3DKF-SX8、1R1W-KSA)。. 58.

(73) 3-4-1. 蛋白質固定不動結果分析/討論. 第一部分:蛋白質固定不動 RMSD 值結果. color code. <1. 1~2. 2~3. 3~4. >4. 表 12:蛋白質固定不動交叉分子嵌合的 RMSD 值. protein rigid 1FN. 3CE3. 3CTH. 3CTJ. 3F82. 3DKC. 3A4P. 1R0P. 3L8V. 3DKF. 1R1W. 0.62. 1.60. 1.76. 1.60. 9.95. 3.95. 9.654. 0.64. 10.51. 13.04. 319. 1.63. 1.58. 1.66. 1.58. 10.5. 6.34. 8.109. 1.56. 7.81. 10.23. 320. 1.00. 0.82. 1.46. 0.93. 7.85. 5.79. 6.612. 0.89. 7.44. 9.72. 353. 1.51. 1.71. 1.75. 1.59. 11.50. 9.84. 10.13. 1.45. 11.38. 12.90. 59.

(74) protein rigid ATP. 3CE3. 3CTH. 3CTJ. 3F82. 3DKC. 3A4P. 1R0P. 3L8V. 3DKF. 1R1W. 8.35. 7.59. 7.49. 10.26. 0.88. 5.43. 4.64. 8.99. 5.48. 8.77. DFQ. 10.60. 10.54. 10.93. 3.77. 9.53. 0.66. 2.79. 6.68. 4.56. 6.09. KSA. 7.502. 4.73. 9.65. 8.40. 4.25. 2.21. 0.51. 7.80. 5.49. 7.70. L8V. 0.841. 0.77. 0.46. 0.70. 11. 8.34. 8.38. 0.61. 9.31. 10.96. SX8. 9.45. 25.24. 8.14. 7.63. 5.73. 1.84. 6.14. 5.65. 0.59. 6.76. KSA. 7.23. 4.68. 9.53. 8.26. 4.22. 2.13. 0.61. 7.70. 5.46. 1.83. 60.

(75) 從結果可以明顯發現,當蛋白質固定不動時,與結晶小分子所嵌合模擬的結 果佳(對角線深藍色框的值)。這是因為我們所下載的 x-ray 結晶構型,必為蛋白 質與小分子交互作用後至最穩定的構型,因此當進行蛋白質固定不動的分子嵌合 模擬,小分子便很快很容易找到最佳構型,且與結晶的小分子構型相似,RMSD 值皆小於 2。 接著,我們再從此 10 個蛋白質結晶構型中,挑出其 IC50 值較低而 fitness 較佳,並且其活性中心附近的胺基酸支鏈位置差異較大但序列相同的五個蛋白質 結晶構型,:包括 3CE3、3CTH、3CTJ、3F82 和 3L8V,來進行可動胺基酸支鏈的 交叉分子嵌合,如表 13 所示。. 表 13:蛋白質固定不動交叉分子嵌合的 RMSD 值. color code. <1. 1~2. 2~3. 3~4. >4. protein rigid 1FN. 3CE3. 3CTH. 3CTJ. 3F82. 3L8V. 0.62. 0.6. 1.76. 1.6. 0.64. 319. 1.63. 1.58. 1.66. 1.58. 1.56. 320. 1. 0.82. 1.46. 0.93. 0.89. 353. 1.51. 1.71. 1.75. 1.59. 1.45. L8V. 0.84. 0.77. 0.46. 0.7. 0.61. 61.

(76) 3-4-2 動 Met1160 與 Glu1127 的支鏈結果分析/討論. 第二部分:動 Met1160 與 Glu1127 支鏈 RMSD 結果. 表 14:動 Met1160 與 Glu1127 的支鏈交叉分子嵌合的 RMSD 值. 3CE3. 3CTH. 3CTJ. 3F82. 3L8V. 1FN. 0.57. 1.5. 0.88. 0.79. 0.63. 319. 0.79. 1.68. 1.69. 0.96. 0.76. 320. 1.98. 0.79. 0.86. 0.84. 0.82. 353. 1.57. 1.69. 1.76. 1.55. 0.64. L8V. 1.23. 0.86. 0.57. 0.52. 0.63. 粉紅色框表示其 Rmsd 值較原先 rigid 時來的小,綠色框表示其 Rmsd 值較原 先 rigid 時來的大。. 62.

(77) 3-4-3 動 Met1160、Glu1127 與 Ile1084 的支鏈結果分析/ 討論. 第三部分:動 Met1160、Glu1127 與 Ile1084 支鏈 RMSD 結果. 表 15:動 Met1160、Glu1127 與 Ile1084 的支鏈交叉分子 嵌合的 RMSD 值. Met1160 Glu1127 Ile1084 1FN. 3CE3. 3CTH. 3CTJ. 3F82. 3L8V. 0.65. 1.49. 1.75. 1.59. 0.61. 319. 1.04. 0.96. 1.69. 1.71. 0.68. 320. 1.79. 0.8. 0.93. 0.92. 0.9. 353. 1.52. 0.91. 1.76. 1.6. 1.44. L8V. 1.29. 0.76. 0.9. 0.58. 0.62. 粉紅色框表示其 Rmsd 值較原先 rigid 時來的小,綠色框表示其 Rmsd 值較原 先 rigid 時來的大。. 63.

(78) 3-4-4 動 Met1160、Glu1127、Ile1084 與 Leu1157 的支鏈結果分析/討論. 第四部分:動 Met1160、Glu1127、Ile1084 與 Leu1157 支鏈 RMSD 結果. 表 16:動 Met1160、Glu1127、Ile1084 與 Leu1157 的支鏈 交叉分子嵌合的 RMSD. Met1160 Glu1127 Ile1084 Leu1157 1FN. 3CE3. 3CTH. 3CTJ. 3F82. 3L8V. 0.59. 1.58. 1.68. 0.77. 0.65. 319. 0.96. 0.76. 1.01. 1.55. 0.73. 320. 1.01. 0.78. 0.82. 0.96. 0.92. 353. 0.63. 1.73. 1.75. 0.58. 0.62. L8V. 0.79. 1.63. 1.55. 0.65. 0.55. 粉紅色框表示其 Rmsd 值較原先 rigid 時來的小,綠色框表示其 Rmsd 值較原 先 rigid 時來的大。. 64.

(79) 圖 19:c-MET 活性位置 3D 圖(此為 3CTH 結晶構型). 65.

(80) 3-5. c-MET 可動胺基酸支鏈及活化中心氫鍵限制的 1000 個 小分子虛擬篩選. 當我們單獨設定擺動胺基酸支鏈,發現其 enrichment factor 有上升的趨勢, 而根據文獻 29 ,若選擇在活化中心附近可形成氫鍵的原子做限制時,找到活性分 子的機會可以大幅提高。因此,為了能讓蛋白質結晶構型與非該結晶構型之小分 子進行分子嵌合時,可以更有效地讓小分子找尋穩定的構型,我們結合 3-4 的目 標,選擇同時設定可動胺基酸支鏈以及將活化中心附近可形成氫鍵的原子做限 制。 使用與交叉分子嵌合模擬相同的 3 個 c-MET 結晶蛋白質構型:3CTH、3CTJ 與 3L8V,進行 1000 個小分子虛擬篩選,並計算出篩選結果前 1%(前 10 名的小分 子)、前 5%(前 50 名的小分子)及前 10%(前 100 名的小分子)中,含有 10 個已知 具有 IC50 實驗值的抑制小分子個數。其中在 1000 個小分子中,包括 10 個已知具 有 IC50 實驗值的抑制小分子,以及 990 個 non-binders。 我們將結果分成兩種方式進行分析: 1.. 分析/討論 5 個結晶構型前 1%、前 5%及前 10%,三種可動胺基酸支鏈設定 條件的結果。. 2.. 分析/討論 5 個結晶構型的結果比較,找出最佳構型及設定條件,用來進 行高速虛擬篩選。 66.

(81) 3-5-1. 選擇適當的評分函數(scoring function). 在進行可動胺基酸支鏈的 1000 個小分子虛擬篩選前,我們先以 18 個具 IC50 值 c-MET 的活性分子(表 18),搭配 990 個分子量介於 360 到 400 的非活性分子, 來找出最佳的評分函數(scoring function)。. 藉由 Spearman's rank correlation coefficient ρ 45 ,用以評估 ligand 的 binding affinity 和其 Ki 實驗數據,此兩變量排序的函數,其數值落在+1 到-1 之間,+1 表示為一個完美的正相關,活性較大的分子經由計算結果,其結 合能力數值相對較高;-1 則表示一個完美的負相關,0 表示此兩變量無法統整出 規律。如表 17 所示,我們發現 Chemscore 相較於 Goldscore,其評估小分子的 結合能力和生物活性較具一致性,且在計算時間上 Chemscore 比 Goldscore 快三 至五倍左右,考量往後進行高速虛擬篩選時間因素,在接下來實驗設定上,我們 將選擇 Chemscore 做為評分函數。. 表 17:scoring function 與其 Spearman's rank correlation coefficientρ值. scoring function GoldScore. ChemScore. Chemplp. Asp. 3CE3. 0.15. 0.31. -0.09. -0.18. 3CTH. 0.19. 0.26. 0.05. -0.02. 3CTJ. 0.02. 0.27. 0.14. -0.21. 3F82. 0.08. 0.29. -0.13. -0.20. 3L8V. 0.17. 0.37. 0.07. -0.14. 67.

(82) 表 18:18 個活性分子結構與 Ki 實驗數據 NO. Ligand. Ki (nM). MW. NO. Ligand. Ki (nM). MW. 1. 1.2. 706. 10. 763. 469. 2. 4.5. 649. 11. 24. 524. 68.

(83) 3. 9.6. 702. 12. 4. 662. 4. 21. 599. 13. 29. 375. 69.

(84) 5. 30. 600. 14. 393. 675. 6. 33. 516. 15. 6400. 381.5. 70.

(85) 7. 71. 392. 16. 760. 285. 8. 107. 368. 17. 30000. 360. 71.

(86) 9. 180. 498. 72. 18. 2400. 686.

(87) 3-5-2. 選擇合適的搜尋效率(search efficiency). 為了往後大量篩選時間上的考慮,我們先以 10 個具 IC50 值 c-MET 的活性分子(表 19),搭配 990 個分子量介於 360 到 400 的非活性分子,測試在不同的搜尋效率設定 下,結合能力是否有收斂的情形。在此,我們進行了 10,000 GA 的操作數(number of operations)到 100,000 GA 的操作數。 我們發現當操作數在 50,000 GA 和 60,000 GA 時,結合能力開始有收斂情形出 現,因此,在接下來的虛擬篩選設定上,我們選擇以 50,000 GA 當作操作數。. 73.

(88) 表 19:10 個活性分子結構與 Ki 實驗數據 NO. Ligand. Ki (nM). MW NO. Ligand. Ki (nM). MW. 1. 4.5. 649. 6. 107. 368. 2. 9.6. 702. 7. 763. 469. 74.

(89) 3. 21. 599. 8. 393. 675. 4. 33. 516. 9. 180. 498. 75.

(90) 5. 71. 392. 76. 10. 760. 285.

(91) 3-5-3 分析/討論 3 種可動胺基酸支鏈及活化中心氫 鍵限制的影響. 我們分別計算 3 個結晶構型前 1%(top1%)、前 5%(top5%)及前 10%(top10%)的 enrichment factor 紀錄如下表 20-22。. 表 20:3CTH 的 1000 個小分子虛擬篩選 enrichment factor 值 3CTH. top1%. top5%. top10%. rigid. 10. 4. 8. flexible residues 1160/1127 + hinge 2HB constraint. 40. 10. 7. flexible residues 1160/1127/1084 + hinge 2HB constraint. 40. 10. 7. flexible residues 1160/1127/1084/1157 + hinge 2HB constraint. 40. 10. 2. 77.

(92) 表 21:3CTJ 的 1000 個小分子虛擬篩選 enrichment factor 值. 3CTJ. top1%. top5%. top10%. rigid. 20. 8. 4. flexible residues 1160/1127 + hinge 2HB constraint. 20. 8. 2. flexible residues 1160/1127/1084 + hinge 2HB constraint. 40. 12. 10. flexible residues 1160/1127/1084/1157 + hinge 2HB constraint. 20. 8. 2. 表 22:3L8V 的 1000 個小分子虛擬篩選 enrichment factor 值. 3L8V. top1%. top5%. top10%. rigid. 20. 8. 4. flexible residues 1160/1127 + hinge 2HB constraint. 20. 6. 6. flexible residues 1160/1127/1084 + hinge 2HB constraint. 30. 8. 7. flexible residues 1160/1127/1084/1157 + hinge 2HB constraint. 20. 10. 6. 78.

(93) 根據表 20~22 的數據,我們做長條圖如下圖 20-22. 3CTH rigid 40. Enrichment factor. 35 flexible residues 1160/1127+hinge 2HB constraint. 30 25 20. flexible residues 1160/1127/1084+hinge 2HB constraint. 15 10 5 0 top1%. top5%. top10%. flexible residues 1160/1127/1084/1157+hinge 2HB constraint. 圖 20:3CTH 可動胺基酸支鏈及活化中心氫鍵做 constraints 設定條件 top1%、top5%、top10%與 enrichment factor 作圖. 3CTJ 40 rigid. Enrichment factor. 35 30. flexible residues 1160/1127+hinge 2HB constraint. 25 20. flexible residues 1160/1127/1084+hinge 2HB constraint. 15 10. flexible residues 1160/1127/1084/1157+hinge 2HB constraint. 5 0 top1%. top5%. top10%. 圖 21:3CTJ 可動胺基酸支鏈及活化中心氫鍵做 constraints 設定條件 top1%、top5%、top10%與 enrichment factor 作圖 79.

(94) 3L8V 30 rigid. Enrichment factor. 25 20. flexible residues 1160/1127+hinge 2HB constraint. 15. flexible residues 1160/1127/1084+hinge 2HB constraint. 10. flexible residues 1160/1127/1084/1157+hinge 2HB constraint. 5 0 top1%. top5%. top10%. 圖 22:3L8V 可動胺基酸支鏈及活化中心氫鍵做 constraints 設定條件 top1%、top5%、top10%與 enrichment factor 作圖. 從圖 20-22 中發現,當我們同時設定可動胺基酸支鏈及活化中心氫鍵做限制時, 其 enrichment factor 上升趨勢大幅提高,表示如果當我們選同時對活化中心胺基 上的氫鍵做限制以及擺動胺基酸支鏈時,可搜尋到抑制小分子的機率會提高許多。 再比較 top1%、top5%與 top10%,我們發現 top1%、top5% 和的 top10%的 enrichment factor 仍有差距,但在 top10%的結果明顯可以提高許多,此表示當我 們在做模擬篩選時,篩選範圍需設定在總化合物篩選數量的前 10%。. 80.

(95) 3-5-4. 分析/討論 3 個結晶構型的結果比較. 我們分別前 1%、前 5%及前 10%的 enrichment factor 紀錄如下表 23-25,比較 3 個結晶構型的結果。. 表 23:top1%-3 個結晶構型 enrichment factor 值 top1%. 3CTH. 3CTJ. 3L8V. 平均. rigid. 10. 20. 20. 16.6. flexible residues 1160/1127 + hinge 2HB constraint. 40. 20. 20. 26.6. flexible residues 1160/1127/1084 + hinge 2HB constraint. 40. 40. 30. 36.6. flexible residues 1160/1127/1084/1157 + hinge 2HB constraint. 40. 20. 20. 26.6. 81.

(96) 表 24:top5%-3 個結晶構型 enrichment factor 值 top5%. 3CTH. 3CTJ. 3L8V. 平均. rigid. 4. 8. 8. 6.6. flexible residues 1160/1127 + hinge 2HB constraint. 10. 8. 6. 8.0. flexible residues 1160/1127/1084 + hinge 2HB constraint. 10. 12. 8. 10. flexible residues 1160/1127/1084/1157 + hinge 2HB constraint. 10. 8. 10. 9.3. 表 25:top10%-3 個結晶構型 enrichment factor 值. top10%. 3CTH. 3CTJ. 3L8V. 平均. rigid. 2. 4. 4. 2.6. flexible residues 1160/1127 + hinge 2HB constraint. 7. 5. 6. 6. flexible residues 1160/1127/1084 + hinge 2HB constraint. 7. 10. 7. 8. flexible residues 1160/1127/1084/1157 + hinge 2HB constraint. 5. 5. 6. 5.3. 82.

(97) 根據表 23-25 的數據,我們做長條圖如下圖 23-25. top1% 40 rigid. Enrichment factor. 35 30. flexible residues 1160/1127+hinge 2HB constraint. 25 20. flexible residues 1160/1127/1084+hinge 2HB constraint. 15 10. flexible residues 1160/1127/1084/1157+hing e 2HB constraint. 5 0 3CTH. 3CTJ. 3L8V. 平均. 圖 23:top1% 3 個結晶構型的 enrichment factor 作圖. top5% 12 rigid Enrichment factor. 10 8. flexible residues 1160/1127+hinge 2HB constraint. 6. flexible residues 1160/1127/1084+hinge 2HB constraint. 4 2. flexible residues 1160/1127/1084/1157+hing e 2HB constraint. 0 3CTH. 3CTJ. 3L8V. 平均. 圖 24:top5% 3 個結晶構型的 enrichment factor 作圖 83.

(98) top10% 10 9. rigid. Enrichment factor. 8 7 6. flexible residues 1160/1127+hinge 2HB constraint. 5 4. flexible residues 1160/1127/1084+hinge 2HB constraint. 3 2 1 0 3CTH. 3CTJ. 平均. 3L8V. flexible residues 1160/1127/1084/1157+hing e 2HB constraint. 圖 25:top10% 3 個結晶構型的 enrichment factor 作圖. 從表 23-25 我們發現,當我們同時設定可動胺基酸支鏈及活化中心氫鍵做限制 時,其 enrichment factor 平均值都依序上升。表示在進行虛擬篩選時,如果同時 設定可動胺基酸支鏈及活化中心氫鍵做限制,其篩選出有抑制力小分子的效果比固 定蛋白質的篩選效果還要好。 從圖 23-25 發現,比較 3 個結晶構型的篩選結果,不論是 top1%、top5%或 top10%, 3CTJ 的 enrichment factor 值皆比其他 2 個結晶構型高,且選擇動 Met1160、Glu1127、 Ile1084 加上活化中心氫鍵做限制時,挑選到活性分子的機會比其他設定條件來的 高,表示使用 3CTJ 結晶構型來做為 c-MET 的虛擬篩選構型,有較大的機會可以搜 尋到具有抑制力的小分子。 根據 3-3 c-MET 可動胺基酸支鏈及活化中心氫鍵做限制的 1000 個小分子虛擬篩. 84.

(99) 選分析顯示,以下將成為進行高速模擬篩選的設定條件: (1). 3CTJ 結晶構型將做為 c-MET 的高速虛擬篩選的蛋白質構型。. (2). 設定動 Met1160、Glu1127、Ile1084 的支鏈,加上活化中心氫鍵做限制。. (3). 篩選範圍將訂為所有化合物篩選數量的前 5%。. 85.

(100) 3-6. 高速虛擬篩選 ZINC 化學資料庫分子結果. 從 ZINC 化學資料庫所挑選的 40 萬個化合物,經由 3-3 結果的最佳條件設定, 我們進行高速篩選。經由初步篩選及第二次篩選,最終前 100 名最佳評分值數據及 各項作用力,列於表 26 中。 表 26:前 100 名分子及其性質 Compound(ZINC ID). Score. MW. XlogP. H-bond donor. H-bond acceptor. ZINC12431676. 52.05. 434.561. 3.67. 1. 5. ZINC11662486 ZINC12406622 ZINC12431633 ZINC12155041 ZINC65382059 ZINC19954083 ZINC24976050 ZINC12291582 ZINC01496097 ZINC12596719 ZINC12431632 ZINC36697843 ZINC00757959 ZINC29882623 ZINC55307141 ZINC22913273 ZINC13728220 ZINC22436629 ZINC24976056 ZINC12098747 ZINC29135657 ZINC29882549 ZINC28182853 ZINC24988026. 51.63 50.11 50.00 49.53 49.41 49.14 48.89 48.86 48.80 48.74 48.73 48.72 48.66 48.64 48.54 48.52 48.48 48.45 47.97 47.89 47.83 47.80 47.48 47.47. 415.622 437.543 408.586 425.552 375.448 446.537 442.564 423.577 432.588 444.019 408.586 448.57 411.593 387.483 459.61 391.535 364.509 387.911 447.58 420.606 383.451 378.516 438.527 443.591. 2.23 4.38 4.52 4.48 4.46 4.5 4.12 2.51 3.89 3.3 4.52 4.89 5 2.71 3.52 3.94 4.95 3.43 4.42 4.09 4.36 4.33 4.92 3.9. 3 1 2 2 1 1 1 2 1 3 2 2 2 1 2 1 3 2 1 1 2 1 1 1. 5 5 4 4 5 4 5 5 5 5 4 5 3 5 5 4 3 5 5 5 5 4 5 5. 86.

參考文獻

相關文件

第六章 探索性研究設計 :

而在後續甲烷化反應試驗方面,以前段經厭氧醱酵產氫後之出流水為進流基 質。在厭氧光合產氫微生物方面,以光合作用產氫細菌中產氫能力最好的菌株 Rhodopseudomonas palustris

本專題研究目的旨在活用 kinect 捕捉人體動作,並設法順暢與 設備連動的方法;同時對 HTML5(少許)與 javascript 進行研究,設

本專題研究目的旨在活用 kinect 捕捉人體動作,並設法順暢與 設備連動的方法;同時對 HTML5(少許)與 javascript 進行研究,設

為此,國立中正大學防制藥物濫用教育中心與台灣藥物濫用防治研究學會,在教育部學生事 務及特殊教育司之支持下,將於 2019 年 10 月

4634 potassium hydrogen fluoride 氟化氫鉀,氫氟化鉀. 4635 potassium

將產出鍊輸入後,各訂單會依其最有利的時間排定 其生產順序,因此會發生個訂單擠在同一天等產能不足

謝函亘﹝32﹞以衣夾為研究對象,採用 TRIZ 創新之方法,結合綠色設計(Green