2-1 GOLD
2-2 評分函數(Scoring Function)
2-3 遺傳演算法
2-3-1 搜尋效率(Scoring Efficiency)
2-4 蛋白質可動胺基酸支鏈設定
2-5 活化中心蛋白質骨架氫鍵原子限制設定
2-6 分析方法與分子嵌合參數設定
2-6-1 再現 10 個已知 IC
50實驗值的結晶結構 2-6-2 設定可動胺基酸支鏈的交叉分子嵌合
2-6-3 c-MET 可動胺基酸支鏈的 1000 個小分子虛擬篩選
2-6-4 c-MET 活化中心氫鍵限制的 1000 個小分子虛擬篩選
2-6-5 高速虛擬篩選 ZINC 化學資料庫分子
16
2-1 分子嵌合遺傳學優化(GOLD)
GOLD(Genetic Optimisation for Ligand Docking)是由 Cambridge
Crystallographic Data Centre(CCDC)公司所研發設計,利用一套遺傳演算法
(genetic algorithm)的方式,來尋找小分子在蛋白質結合位置(binding site)中
能量最穩定構型的分子嵌合軟體。進行模擬計算時,我們可以設定部分特定位置
蛋白質的鍵做轉動27 28,也可以將活化中心附近能形成氫鍵的原子做
constraints29,加重氫鍵作用力的計算,並且在計算過程中考慮結合位置處水 分子的作用,藉此找出能量較穩定的結合模式。
根據 GOLD 官方網站所公佈數據,由蛋白質資料庫取樣 305 個 X-ray 晶體
結晶結構重新進行嵌合計算,測得 GOLD 具有 72% 成功率能找到正確的結合模
式30,此外在 85 個藥物結構中,GOLD 可再現 81% 的結構且 RMSD<2Å。
17
2-2 評分函數(Scoring Function)
在 GOLD(version 5.0 )程式中提供 4 種表示 protein-ligand 的評分函數可
選擇使用,分別為 Goldscore31、Chemscore32 33、Chemplp34以及 ASP35,其設置 的目的包含了三大方向:首先,評分函數須能判斷 ligand 和 protein 正確的結
合位置;其次,評分函數必須具有排列 ligand 和 protein 結合時的親和力數值;
最後,評分函數具有能力可以有效地從大量非活性的化合物中挑出具有活性的小
分子。在本篇論文中所選用到的評分函數為 Goldscore36和 Chemscore 兩評分函 數。
18
以下是 GoldScore 在計算小分子與蛋白質結合模式所使用的評分函數,詳細
如下所示:
Goldscore
Fitness=S(hb_ext)+1.375×S(vdw_ext)+S(hb_int)+S(int)+S(bar) 其中 S(int)=S(vdw_int)+S(tors_int)
S(hb_ext) →小分子與蛋白質間的氫鍵作用力
S(vdw_ext) →小分子與蛋白質間的凡得瓦作用力
S(hb_int) →小分子內部的氫鍵作用力
S(int) →小分子內部的作用力
S(vdw_int) →小分子內部的凡得瓦作用力
S(tors_int) →小分子內部的鍵結扭角能
S(bar) →水分子在小分子與蛋白質間所提供的作用力
在 GoldScore 評分函數中,較特殊的計算項目為小分子與蛋白質間的凡得瓦
作用力必須加權 1.375 倍,此外,水分子對於評分函數影響也列入考量,當計算
得到評分值越高,代表能量越趨於穩定。
19
以下是 Chemscore 在計算小分子與蛋白質結合模式所使用的評分函數,詳細
如下所示:
Chemscore
Score =ΔGbinding+ Pclash+ cinternalPinternal+ (ccovalentPcovalent+ Pconstraint)
其中ΔGbinding = ΔG0 +ΔG hbond +ΔG metal +ΔGlipo+ΔG rot
Pclash →分子間的碰撞能
CinternalPinternal →分子內的扭角能量
ccovalentPcovalent →共價鍵的能量
ΔG0 →由多組線性迴歸得到的相關係數
ΔGhbond →活性分子與蛋白質的氫鍵作用力
ΔGmetal →所有原子與活性分子中的金屬作用力
ΔGlipo →所有活性分子中的親油性分子與蛋白質親油性之作用力
ΔGrot→frozen rotatable bond 的作用力
由上述式子可以發現,GoldScore 和 Chemscore 兩評分函數在計算公式上有
所差異,且 Chemscore 分子間作用力的計算公式較 GoldScore 簡化許多,因此在
計算速度上 Chemscore 比 GoldScore 快三至五倍左右。
20
2-3 遺傳演算法
Gold 軟體使用了遺傳演算法(genetic algorithm,簡稱 GA)作為找出活性分
子在蛋白質中的最佳構型,將能量做最小化的方式搜尋蛋白質內的最佳結構。
遺傳演算法37(genetic algorithm,簡稱 GA)大約於 1950 年代開始發展,
由生物學者和電腦學家合作,在電腦上模擬出基因的運作,並應用到其他許多領
基因轉移(migration)、交配(crossover)僅找尋到局部最佳解(local optimum),
可以運用突變(mutation)的方式,隨機改變子代某一基因值,跳脫搜索的空間
21
以增加空間選擇的多樣性,使有機會找尋到全區最佳解(global optimum)。當演
化達到指定世代數目或是已達收斂,將最後染色體進行解碼,得到的評分值越高,
代表此染色體愈趨近於最佳解,意謂在演化過程中存活的機率愈高。
圖 4:genetic algorithm 流程圖38
22
2-3-1 搜尋效率(search efficiency)
搜尋效率的設定,是根據每一個獨立小分子,進行控制分子嵌合計算的速度,
以及預測其結果的準確性。
當將所有小分子的搜尋效率設定為 100%時,表示對於一個具有 5 個可旋轉
鍵結的小分子來說,將進行 30,000 GA 的操作數(number of operations);相對
來說,若將搜尋效率改為 50%,則此小分子將只會進行 15,000 GA 的操作數,其
計算結果的準確度將會降低,但所花的時間相對減少,因此可根據所要計算的小
分子數量來設定搜尋效率。
23
(2) 其中 N(1286)、CA(1287)、CB(1290)構成的平面與 CA(1287)、CB(1290)、
CG(1291)構成的平面所夾的角度,即我們可以自行設定的扭轉角度。
(3) 一個胺基酸將可設定數條可旋轉鏈,而一條旋轉鏈也可設定多個扭轉角
24
度。
圖 5:可動胺基酸支鏈設定的輔助說明圖-此為 Tyrosine
另外,GOLD 軟體根據文獻46,建立圖書庫(Library),可以自動設定每個胺
基酸最適當的旋轉鍵及扭角。
25
2-5 活化中心蛋白質骨架氫鍵原子限制設定
根據文獻29,大部分的激酶在活化中心位置上有三種明確的蛋白質原子作用 力模式存在,如下圖 6 所示,此蛋白質原子包含了在 hinge 區的氫鍵,且 90%具
活性的小分子至少會和蛋白質上任兩個原子形成兩個氫鍵,若我們在進行分子嵌
合時,將可形成氫鍵的原子做限制,對於搜尋小分子和蛋白質較佳的結合模式具
有很大的幫助,且在往後大量虛擬篩選時,找到具活性小分子的機會可以提高許
多。
圖 6:小分子與蛋白質骨架上原子之氫鍵作用力示意圖29
26
我們選擇在 hinge 區同一胺基酸上可形成氫鍵的原子做限制,其中,一為
HBA(hydrogen bond acceptor),另一為 HBD(hydrogen bond donor),如圖 7 所
示,我們可以選擇 HBA1+HBD、HBA1+HBA2 以及 HBA2+HBD 三種方式做限制。
圖 7:三種不同的小分子與蛋白質骨架形成之氫鍵示意圖29
27
2-6 分析方法與分子嵌合 GOLD 軟體參數設定
c-MET 在蛋白質資料庫中有約六萬多個結晶構型,這些蛋白質的結晶構型不
全然相同。我們著重在活性中心附近的幾個胺基酸支鏈,探討當胺基酸支鏈進行
擺動,以及對活化中心可形成氫鍵的原子做 constraint 時,其對分子嵌合計算
的結果之影響。其中我們使用 Goldscore 評分函數來計算而得各項作用力數值,
並以此評分函數與 RMSD 值來進行探討。
在描述比較分子嵌合結果與 X-ray 實驗結構上的差異,以 root mean square
deviation 值(簡稱為 RMSD)表示。
當 RMSD 數值越大時,表示此分子與參考結構的差異越大。
N:列入 RMSD 計算總原子數。
di:第 i 個原子與對應到參考結構該原子的距離,單位為 Å。
28
2-6-1 再現 10 個已知 IC
50實驗值的結晶結構
在研究之前,將先檢視 GOLD 軟體中,GOLDscore 評分函數所預測的評分值
是否能與實驗值具有相關性。我們找尋具有 IC50實驗值的 c-MET 結晶構型 10 個
做為測試依據,進行分子嵌合模擬計算。
在比較計算結果與實驗值時,為了能顯示出評分值與 IC50之間的相關性,我
們將 IC50轉換為 pIC50值,如下式所列:
pIC50=-logIC50
利用此方法顯示,表示若 GOLD 軟體可符合預期結果,則其結果評分值將與
pIC50值具有正相關性。
29
2-6-2 設定可動胺基酸支鏈的交叉分子嵌合
藉由 2-6-1 的再現結晶構形結果,我們在其中挑出其 IC50值較高且 fitness
較佳的 5 個蛋白質結晶構型。再從這 5 個結晶構形,挑出其活性中心附近的胺基
酸支鏈位置差異較大但胺基酸序列相同的 3 個結晶構形,來進行可動胺基酸支鏈
的交叉分子嵌合(cross docking)。
此 3 個結晶構型胺基酸序列如下頁圖 8 所示,其中紅色序列為 3 個結晶構型
的主要序列,往下的每一行序列依序為 3CTH、3CTJ、以及 3L8V。另外,圖中
也註明出多胺酸片段(Glycine-rich-loop,胺基酸片段 1082-1089)、鉸鏈片段(Hinge
loop,胺基酸片段 1157-1160)、催化片段(Catalytic loop,胺基酸片段 1195-1208)
以及活化片段(Activation loop,胺基酸片段 1218-1223)。
在 3CTJ 結晶構型中,由於 activation loop 附近缺少某些片段,因此,我們藉由
EasyModeller39 (version 3.0 ) 軟體,補上所缺失的片段,使胺基酸序列更加完 整。
30
Glycine-rich loop (1182-1089)
Hinge (1157-1160)
31
Catalytic loop (1195-1208) Activation loop (1218-1223)
32
圖 8:3 個 c-MET 結晶構型胺基酸序列比對圖
33
根據參考文獻40發現,Glycine-rich-loop 的主鏈位置差異度大,導致其支 鏈位置也不盡相同。另外,ILE1084 則是較容易與小分子產生作用力,所以容易
產生不同的構型。我們從圖 9 也發現,MET1160 與 GLU1127 也是活性中心附近構
型差異較大的兩個胺基酸支鏈。因此,我們將交叉分子嵌合模擬分成四種不同條
件情況,來進行比較:
第一部分:蛋白質固定不動
第二部分:動 MET1160 與 GLU1127 的支鏈
第三部分:動 MET1160、GLU1127、ILE1084 的支鏈
第四部分:動 MET1160、GLU1127、ILE1084 與 LEU1157 的支鏈
圖 9:3 個 c-MET 結晶構型活性中心胺基酸結構圖
34
2-6-3 c-MET 可動胺基酸支鏈的 1000 個小分子虛擬篩選
我們利用不同 c-MET 可動胺基酸支鏈設定,進行 1000 個小分子虛擬篩選,
以便挑選出較適當的結晶構型以及可動胺基酸支鏈的設定條件。承接 2-6-2 的交
叉分子嵌合所挑選的 3 個蛋白質結晶構型,使用 GOLD virtual screening 設定,
我們進行 1000 個小分子的虛擬篩選。在 1000 個小分子中,包括 10 個已知具有
IC50實驗值的抑制小分子,以及 990 個從 ZINC 資料庫所下載的小分子。
10 個已知具有抑制 PKA 活性的小分子其分子結構與 IC50實驗數據列於表 2
中。此外,我們以 Christopher A. Lipinski 在 1997 年所提出的 rule of five41作為 990 個小分子的篩選基本準則。
分子量 <500
logP 值 <5
分子 hydrogen bond donor <5
分子 hydrogen bond acceptor <10
35
表 2:10 個活性分子結構與 IC50實驗數據
NO Ligand IC50
(nM) MW NO Ligand IC50
(nM) MW
1 1.0 649 6 368 760
2 2.6 702 7 39000 469
36
3 1.9 599 8 675 393.
5
4 24 516 9 1000 498
37
5 2.0 392 10 760 285
38
enrichment factor 的計算如下:
total
39
3 個 c-MET 結晶構型並根據下列三個部分分別進行 1000 個小分子虛擬篩選,
分析/討論在不同可動胺基酸支鏈的條件設定下,對篩選結果有何影響。
第一部分:蛋白質固定不動
第二部分:動 MET1160 與 GLU1127 的支鏈
第三部分:動 MET1160、GLU1127、ILE1084 的支鏈
第四部分:動 MET1160、GLU1127、ILE1084 與 LEU1157 的支鏈
40
2-6-4 c-MET 活化中心氫鍵限制的 1000 個小分子虛擬篩選
我們利用不同 C-MET 活化中心氫鍵限制,進行 1000 個小分子虛擬篩選,以
便挑選出較適當的結晶構型。承接 2-6-2 的交叉分子嵌合所挑選的 3 個蛋白質結
晶構型,藉由 VMD 軟體確認蛋白質 hinge 區可形成氫鍵的蛋白質骨架之原子, 3
個 c-MET 蛋白質結晶構型中,其 hinge 區域包含 Ala A1057、Leu A1058、Asn A1059、
Met1160,然而,並非此四個胺基酸上的氧原子或氮原子皆可做限制,適當的氫
鍵距離為 2.8~3.0Å,但由圖 11、圖 13 以及圖 15 可以看到,Leu A1058 和 Asn A1059
其氫鍵距離稍大,且在結構上被其他胺基酸片段檔到的關係,在 GOLD 軟體中無
法做限制的設定,因此,最後我們選擇 Met1160 做為提供 HBA 以及 HBD 之限制設
定。
41
圖 10:3CTH hinge 附近小分子與蛋白質形成之氫鍵示意圖
圖 11:3CTH hinge 附近小分子與蛋白質形成之氫鍵距離
42
圖 12:3CTJ hinge 附近小分子與蛋白質形成之氫鍵示意圖
圖 13:3CTJ hinge 附近小分子與蛋白質形成之氫鍵距離