• 沒有找到結果。

蛋白質實際應用

在文檔中 中 華 大 學 碩 士 論 文 (頁 46-54)

第 4 章 結果與討論

4.3 蛋白質實際應用

(2) 測試資料未獲得 Maximum Outlier:在測試樣本範例中,Maximum Outlier 提供進一步輔助演算法做為剔除懷疑編碼的依據與參考,也就是當有需要猜測的懷 疑編碼的情況時,演算法將再利用 Maximum Outlier 對應組合編碼,用來針對懷疑 編碼出現的次數做累加計數。而在 Maximum Outlier 組合編碼中出現次數較多次的 編碼,演算法就判定該編碼為應剔除的編碼,因此可提高演算法著準確性。若無 Maximum Outlier 的資訊,也是造成演算法失誤的原因之一。以上述例子來看,RMSD 最大的數值為 3.5222 Å ,但都未超過 Maximum Outlier 的範圍 4.3248 Å ,因而也無 法做出進一步的判斷,選出正確該被剔除的點座標。

上述這種錯誤發生的情況,在我們的測試資料中極為常見。因為缺少 Maximum Outlier 的候選者,藉以提供演算法針對懷疑編碼繼續做出進一步的判斷,所以出現 了比預期還多的剔除點數之情形。

表 4.3、蛋白質 1aj6_A 結構片段之重心座標。

Model 1 X 座標 Y 座標 Z 座標

重心 1 53.363 -2.026 42.108 重心 2 62.405 -1.256 45.914 重心 3 64.978 0.7696 30.831 重心 4 66.342 -2.588 47.001 Model 2

重心 1 28.583 68.689 57.946 重心 2 19.829 67.272 62.213 重心 3 18.118 81.147 55.671 重心 4 16.821 67.687 65.251

表 4.4、組合幾何圖形與其 RMSD 值(以 1aj6_A 為例)。

片段組合形式 RMSD

13 2.70 14 3.19 24 6.69 12 1.94 124 2.07 1234 2.40 123 2.71 234 2.94 134 3.04 23 3.06 34 4.17

演算法將所有編碼組合與 RMSD 輸出,可讓使用者觀看所有組合在空間中幾何 形狀的對應情況,也可以看出哪些(X,Y,Z)點座標編碼組合堆疊後的情形。例如,4 個點不剔除任何點(排除 0 個點),則選擇前 4 組編碼組合之 RMSD 值以及一組全部 點座標都疊合的編碼組合下的 RMSD 值,如「13(2.70

)、14(3.19

)、

24(6.69

)、12(1.94

)、與 1234(2.40

)」。由於前 4 筆 RMSD 最佳的組合編碼中,出現 13、14、24 等,取其交集後可得編碼 1234 皆有出現,所 以我們便推斷在這個測試例子中,我們不需要剔除任何一個(X,Y,Z)點座標重心,幾 何形狀就能堆疊得很好。程式最終不會輸出需要被剔除的編碼,符合預期結果。

圖 4.4、結構片段比對示意圖,以 1aj6_A 為例。此蛋白質中,圍繞在配體結合部位 (ligand binding site)有四個不連續的結構片段。每個結構片段可得其重心,以此重心 進行結構疊合之計算。

當我們透過 PyMOL 軟體觀看 1aj6_A 的各片段(X,Y,Z)點座標重心連線構成的 幾何形狀(圖 4.4)。當兩組(X,Y,Z)點座標重心自身相疊時,其結果完全重疊。說明了

1

2

3 90-101

39-57

66-80

158-172 PDB:1aj6_a

4

本研究方法進行構形疊合的計算沒有問題。演算法會輸出所有構形疊合的資訊,可 提供使用者做為依據與參考。

除此之外,我們挑選一種酵素 acetylcholinesterase,1acj_A 與 2wfz_A 兩個不同 蛋白質間的模板比對做為測試實例,用以表示在兩相異蛋白質進行模板比對時,本 研究方法可正確回傳結果。這組測試的模板片段有 5 段,都是出現在該酵素內配體 結合部位周圍的局部結構。各別將每個片段中所有 Cα 的座標加總並平均,使其產 生重心,所以共產生 5 個重心點座標。我們抓取 Ca 的這 5 個片段的位置範圍分別 如表 4.5,2wfz_A:77~91、110~125、192~206、323~341、448~459,及表 4.6,

1acj_A :77~91、110~125、192~206、323~341、438~449。

表 4.5、蛋白質結構 2wfz_A 片段之重心座標。

X 座標 Y 座標 Z 座標 重心座標 1 -4.748 74.040 66.564 重心座標 2 0.075 67.691 54.101 重心座標 3 5.248 65.340 48.773 重心座標 4 11.613 65.246 72.340 重心座標 5 8.549 86.768 58.996

表 4.6、蛋白質結構 1acj_A 片段之重心座標。

X 座標 Y 座標 Z 座標 重心座標 1 -4.391 75.427 67.114 重心座標 2 0.152 68.824 54.555 重心座標 3 5.184 66.263 49.124 重心座標 4 11.760 65.996 72.716 重心座標 5 10.508 75.746 59.667

演算法讀入局部結構片段的重心點座標,透過演算法執行計算。經過計算後,

這組測試資料的界定離群值範圍為[-7.3299,12.2781]。

表 4.7、2wfz_A-1acj_A 組合幾何圖形與其 RMSD 值。

片段組合形式 RMSD 值( ) 234 0.0117 1234 0.0154 124 0.0214 134 0.0230 123 0.0232 235 1.4788 1345 1.5018 1235 3.3468 12345 3.3609 2345 4.0351 1245 4.1395 245 4.8363 145 5.0139 345 5.5353 125 5.8176 135 6.5251

所有編碼組合與 RMSD 輸出後,可以看出(X,Y,Z)點座標編碼組合堆疊後的情形。

若是要判斷 5 個點剔除 0 個點,則選擇出前 4 組參考編碼組合以及一組全部點座標 都疊合的編碼組合(表 4.7),如「234(0.0117

)、1234(0.0154

)、124 (0.0214

) 、

134(0.0230

)與 12345(3.3609

) 」。

若是要 5 個點剔除 1 個點,則選擇前 3 組參考編碼組合,234、1234 及 124。從 中我們能發現編碼 5 並沒有出現在這 3 組的組合當中,因此演算法會推斷應該將編 碼 5 的結構片段排除,才可讓模板比對時,整體幾何形狀疊合得更好。

圖 4.5、1acj_A 完整的蛋白質及模板之局部結構圖。紅色螺旋結構胺基酸範圍是 77~91;藍色平板結構是胺基酸 110~125 的位置;黃色則是 192~206 這片段結構;

綠色則是 323~341 的片段結構;而 438~449 的片段則為橘色。此五個局部結構片段 皆是圍繞在該蛋白質中配體 Tacrine 的結合部位周圍。

透過 PyMOL 軟體觀察 1acj_A 完整的蛋白質結構如(圖 4.5),其中呈現出胺基酸 77~91、110~125、192~206、323~341、438~449 等各局部結構在整體蛋白質空間上 的位置。從(圖 4.5)上可看出點座標重心編號 12345 在空間上的位置與相對應的情 況。

3

2

4 1

5 77-91

110-125 192-206

323-341

438-449 PDB:1acj_a

圖 4.6、2wfz_A 完整的蛋白質及模板之局部結構圖。紅色螺旋結構胺基酸範圍是 77~91;藍色的部分平板結構是胺基酸 110~125 的位置;黃色則是 192~206 這片段 結構;綠色則是 323~341 的片段結構;而 448~459 的片段則為橘色。此五個局部結 構片段皆是圍繞在該蛋白質中配體 TRIMETHYLPROPYL-METHYLPHOSPHINATE 的結合部位周圍。

透過 PyMOL 軟體觀看整體的 2wfz_A 完整的蛋白質結構(圖 4.6),並呈現其胺 基酸 77~91、110~125、192~206、323~341、448~459 在整體蛋白質空間上的位置。

從圖上可觀察出(X,Y,Z)點座標重心編號 12345 在空間上的位置與相對應的情況。

77-91 110-125 192-206

323-341

448-459 3

2

1 4

PDB:2wfz_a

5

圖 4.7、2wfz_A 與 1acj_A 局部結構幾何圖形之疊合示意圖。編號第 5 及 5'的局部結 構,兩者在空間中的位向十分不同,經由演算法的推斷可得知應將此點剔除,僅疊 合其餘四個片段才可得到正確的模板比對。

經由 PyMOL 軟體觀看 2wfz_A 及 1acj_A 的點座標重心連線構成的幾何形狀整 體堆疊後 (如圖 4.7),更能清楚知道哪個(X,Y,Z)點座標重心應該被剔除,讓整體結 構達最佳化。透過上圖我們也能發現片段結構點座標 5 與 5'的兩個片段結構,在空 間中的位置的確相距甚遠,五個片段重心疊合的 RMSD 為 3.3609

。而其他 1234 片段的位置則相對接近,幾何形狀相似度也較高。若只疊合這四個重心,其 RMSD 為 0.0154

。所以在這個例子中我們就能下一個結論,(X,Y,Z)點座標重心 5 應被剔 除,幾何形狀堆疊就能達到更佳的相似度,結果也與演算法執行後的結果相符合。

77-91 110-125 192-206

323-341

3

2

4 1

5 448-459 5’

438-449

PDB:2wfz_a PDB:1acj_a

在文檔中 中 華 大 學 碩 士 論 文 (頁 46-54)

相關文件