• 沒有找到結果。

中 華 大 學 碩 士 論 文

N/A
N/A
Protected

Academic year: 2022

Share "中 華 大 學 碩 士 論 文"

Copied!
60
0
0

加載中.... (立即查看全文)

全文

(1)

中 華 大 學 碩 士 論 文

胺基酸與結構字元間殘基接觸數之研究 A Study of Residue Contact Number Among the

Amino Acid and Structural Alphabet

學 系 別:生物資訊學系碩士班 學號姓名:M10120003 莊 利 偉 指導教授:董 其 樺 博 士

中 華 民 國 104 年 8 月

(2)

i

中文摘要

在研究蛋白質結構的生物資訊領域中,胺基酸的特性與立體結構的摺疊形狀有著 緊密的關聯性。為了了解在蛋白質結構中各胺基酸之間的相互關係,可透過計算胺基 酸中 Cα 原子彼此的接觸數,再將其轉換為分數,藉此觀察每種胺基酸在蛋白質中,

何種胺基酸彼此之間較常發生靠近或疏遠。以往研究僅考慮胺基酸的一級序列與二級 結構等資訊,並未包含局部片段的三級結構之資訊,可能無法真實反應出胺基酸在蛋 白質中的所扮演的角色。因此,本研究使用結構字元(Structural Alphabet, SA)的定義,

把胺基酸替換為結構字元,使其胺基酸一級序列中能同時隱含二級與三級結構的描述,

並藉由胺基酸的連結度數量定義其所屬環境,了解胺基酸存在於蛋白質內部或外部後,

再觀察局部結構之摺疊型式與胺基酸彼此相互接觸的分佈傾向。

本研究方法產生出三種分數矩陣,分別為 23 個結構字元的 23 乘 23 矩陣、23 個 結構字元與 3 種二級結構的 69 乘 69 矩陣,以及 23 個結構字元與 5 種環境的 115 乘 115 矩陣。研究結果顯示,使用結構字元所產生的分數矩陣,相較於其他研究者的分 數矩陣,其分布的變異數較大,且具有較明顯的二級結構分群,因此更能將胺基酸排 列與結構摺疊形狀的關聯性做詳細的描述。

本研究探討蛋白質中胺基酸原子之間的接觸數量,以新的觀點,例如環境、局部 結構、結構字元等構面,統計分析各胺基酸之間在不同條件環境下的接觸偏好。結果 所得之接觸偏好矩陣,可顯示出胺基酸存在於蛋白質內部或外部及當時所屬的局部二 級結構,彼此之間產生接觸的傾向為何。

關鍵字:結構字元、胺基酸交互作用、胺基酸接觸數、分數矩陣

(3)

ii

Abstract

In structural biology, there is a strong link between the characteristics of amino acids and the folding of three-dimensional protein structures. In order to understand the relationships between each amino acid within a protein structure, a score is given based the contact numbers of Cα atoms in an amino acid such that the distances of all amino acids of a protein structure can be observed. Past research has only considered the primary sequence and secondary structure of amino acids while overlooking the local tertiary structure; thus, the role amino acids play within a protein may not be completely understood. Therefore, this study used the structural alphabet (SA) in place of amino acids such that the primary sequence simultaneously illustrated the secondary and tertiary structures and defined the environment based on the amino acid contact numbers. Then, after determining whether the amino acid was inside or outside the protein molecule, the folding of the local structure and the distribution of amino acids could be observed.

Three score matrices were generated in this study: a 23x23 matrix of the 23-state SA, a 69x69 matrix of the 23-state SA and three secondary structures, and a 115x115 matrix of the 23-state SA and five environments. The results indicated that compared to the score matrices in past studies, the SA score matrices had larger distribution variances and more prominent secondary structure groups; therefore, they can better describe the relationships between the amino acid sequence and structural folding.

In this study, we uncover the contact numbers of amino acids in proteins based on new ideas, such as the environment, the local structures, and structural alphabets to analyze the contact preference under different conditions between the various amino acids. The results obtained from the scoring matrix of contact preference may exhibit amino acids present in the protein inside or outside with the local secondary structure and demonstrate

(4)

iii

the tendency to yield contact with other amino acids.

Keyword: Structural Alphabet, Amino Acid Interaction, Amino Acid contact, scoring matrix

(5)

iv

致謝

當初進入這個研究領域時一無所知,程式和生物資訊的知識都很薄弱,非常感謝 董其樺老師,在研究過程中,不斷提供方向讓我思考,並且教導許多專業知識,願意 花時間將我在研究中所遇到的瓶頸一一解決,使我在程式及閱讀英文論文這方面的能 力精進不少,真的很謝謝董老師。

還要感謝同一個實驗室的學長,凱傑和葉融學長,他們在忙於自己的研究時,也 會不時的關心一下我的研究狀況,而且提供了一些優良的方法來解決問題,並且教導 了我許多程式方面的處理方式。也要感謝雖然不同實驗室,但是也在同個地方做研究 的學長姐們,宜慧、啟婷學姐和日旭學長在我遇到困難時給予鼓勵,偉聖學長提供方 法讓我面對研究不會太緊張,喜偉學長教了我不少電腦程式的相關使用。感謝冠甫同 學及子維同學,研究過程中遇到的困難或是瓶頸,都多虧了他們的幫忙才得以解決,

以及葉王和錦賢學弟處理實驗室的雜務,讓我能專注於研究上。

最後要感謝家人們的支持與鼓勵,如果沒有父母辛苦賺錢,我根本無法努力到現 在,他們在我身上的金錢和精神的支持,讓我可以專心投入於研究中,使我更有信心,

最後也如願以償的完成了我的研究,由衷感謝他們。

(6)

v

目錄

中文摘要 ... i

Abstract... ii

致謝 ... iv

目錄 ... v

表目錄 ... vii

圖目錄 ... viii

第一章、緒論 ... 1

1.1 研究動機 ... 1

1.2 研究目的 ... 2

第二章、相關文獻探討 ... 4

2.1 蛋白質的胺基酸交互作用偏好 ... 4

2.2 準化學方法(quasi-chemical method)探討胺基酸之交互作用 ... 5

2.3 結構字元之定義與二級結構之關聯 ... 7

2.4 特定種類胺基酸序列-蛋白質局部結構關係:結構字元的分析 ... 7

第三章、研究方法 ... 9

3.1 測試資料之準備 ... 9

3.2 將 PDB 轉成 DSSP ... 10

3.3 計算胺基酸 Cα 與 Cα 之間的距離 ... 11

3.4 分鏈計算 ... 12

3.5 胺基酸環境定義 ... 13

3.6 根據接觸數所產生的分數矩陣 ... 15

3.7 20 乘 20 的分數矩陣 ... 18

(7)

vi

3.8 60 乘 60 的分數矩陣 ... 19

3.9 100 乘 100 的分數矩陣 ... 20

3.10 將胺基酸替換成結構字元(SA) ... 21

3.11 23 乘 23 的分數矩陣 ... 22

3.12 69 乘 69 的分數矩陣 ... 22

3.13 115 乘 115 的分數矩陣 ... 23

第四章、研究結果與討論 ... 24

4.1 胺基酸接觸總數 ... 24

4.2 胺基酸在環境中的胺基酸交互作用分數 ... 27

4.3 結構字元之間的分數矩陣 ... 29

4.4 結構字元與二級結構之間的分數矩陣... 30

4.5 結構字元與環境之間的分數矩陣 ... 32

4.6 結構字元在各環境中的接觸總數 ... 34

第五章、結論與未來展望 ... 36

參考文獻 ... 38

附錄 ... 40

(8)

vii

表目錄

表 1、胺基酸公式中符號代表意義 ... 17 表 2、結構字元公式中符號代表意義 ... 17

(9)

viii

圖目錄

圖 3-1、蛋白質 PDB 轉換成 DSSP 檔。 ... 10

圖 3-2、以胺基酸 Cα 原子之間距離定義是否接觸。 ... 11

圖 3-3、蛋白質計算接觸的方式。 ... 12

圖 3-3、蛋白質 3IOX 的胺基酸周圍連結度。 ... 13

圖 3-4、蛋白質 PDB 檔輸出成環境檔。 ... 14

圖 3-5、胺基酸、結構以及環境的三大分數矩陣示意圖。 ... 15

圖 3-6、獲得蛋白質資料及計算接觸分數流程圖。 ... 16

圖 3-7、胺基酸之間的接觸示意圖。 ... 18

圖 3-8、胺基酸與結構之示意圖。 ... 19

圖 3-9、胺基酸與環境之示意圖。 ... 20

圖 3-10、結構字元、結構與環境之示意圖。 ... 21

圖 4-1、胺基酸在三種結構下的接觸數量圖。 ... 26

圖 4-2、20 種胺基酸在五個環境中的交互作用分數。 ... 28

圖 4-3、23 個結構字元之間的交互作用分數圖。 ... 29

圖 4-4、23 個結構字元與結構之間的交互作用分數圖。 ... 31

圖 4-5、23 個結構字元與 5 個環境之間的交互作用分數圖。 ... 33

圖 4-6、結構字元在五個環境中的接觸數量圖。 ... 35

(10)

1

第一章、緒論

1.1 研究動機

生物科技與實驗技術越來越進步,在資料庫上所累積的蛋白質資料也日新月異。

透過研究學者們不斷的研究,衍生或結合更多精細的方法與更完整的資源,使得世界 上每日持續發現出新的資料與資訊。在生物資訊的領域中,蛋白質摺疊問題一直以來 是個難以解決的問題。一個蛋白質通常都是由數千個原子所組成,在線性或空間結構 中,可以擁有成千上萬種不同的排列組合,使得每個蛋白質彼此之間在結構上有很大 的差異。而且直到現在,生物資料庫中還是存在著許多還未發現的蛋白質結構,但經 由長年對於蛋白質結構的預測與分析,研究者依舊能得到許多可以供人使用的蛋白質 資訊。

未知結構或功能的蛋白質數量仍遠多於已知序列的蛋白質資料,透過全世界各地 不同的實驗室所使用的研究方法,正逐步地擴張蛋白質未知的領域。在儲存蛋白質結 構的資料庫裡,可以從每個蛋白質結構檔中獲得各原子的座標資訊。每個蛋白質的原 子都有編號,雖然原子起始編號都不盡相同,但都是由小到大按照順序排列,為了了 解原子之間並非只是像資料上所表示直行式的排列,藉由蛋白質資料庫上原子的座標 資訊,可以計算出各原子之間的距離,得以知道原子之間除了所屬的胺基酸之外,也 包含了他們在空間上的變化關係。

以往普遍使用的結構比較方法,都會考慮蛋白質摺疊方式和結構相似度。透過結 構與原子座標上的變化,可以觀察出每個不同的蛋白質,因為結構靈活性的緣故,在 某些區域特別容易或不容易發生變化。前人的研究[1]中已指出,這些在蛋白質骨幹 中的局部胺基酸的變化,只與其周遭的胺基酸產生作用,並僅能影響局部的結構,而 通常不會影響至整體蛋白質的結構。所以只需計算蛋白質上各原子之間的距離,以及 其中分別所屬的局部二級結構,就能發現摺疊後蛋白質所發生的變化,或是結構上的

(11)

2

差異。

1.2 研究目的

本研究採用計算Cα 原子之間的距離,可以清楚得知哪些胺基酸 Cα 原子較靠近,

兩個胺基酸之間在原子編號上也許差很遠,但運用座標計算完距離以後發現距離相當 靠近,蛋白質在結構上會產生摺疊,即使原子編號數字差很多,因為結構摺疊的關係 也可能將兩個原子摺到相當接近的距離。

蛋白質在不同環境中裡面胺基酸的傾向會與疏水概念有關, 已有國外研究 Kauzmann[2]、Fersht et al.[3]和Tanford et al. [4]推出,胺基酸疏水性程度是根據埋藏 在蛋白質環境或是暴露在含水介質中胺基酸傾向所得到。與水可接觸面積以及接觸數 都是跟該胺基酸周圍的其他胺基酸有關。本研究要透過計算Cα原子距離的方式,尋 找出究竟哪些胺基酸之間和結構字元之間比較有相互靠近的傾向。我們根據純胺基酸 之間的距離、考慮二級結構資訊、還有考慮以接觸數來定義名為「環境」的分類方式。

最後針對每種不一樣的條件所計算出來的結果,我們分別為三大類來觀察,並探討是 否會因為條件的不同而產生不一樣的統計結果,或是不會受到條件設定的影響。

本研究包含三大部分之探討。在第一部分,本研究除了以胺基酸為基礎,進行蛋 白質內接觸數之統計,以一個 20 乘 20 的矩陣來觀察,亦利用結構字元之定義,探討 接觸數與結構字元組成之關聯。結構字元本身就有包含結構的資訊在其中,計算結構 字元之間所產生出的 23 乘 23 矩陣後,就能藉此觀察胺基酸與結構之間的分數變化。

第二部分,從 DSSP 所獲得的結構資訊,及結構字元中所包含的結構資訊,兩者皆有 定義二級結構。因此根據二級結構,我們統計與分析兩兩接觸的胺基酸與二級結構組 成之關聯性,產生 60 乘 60 矩陣,以及相接觸的結構字元與個別二級結構組成之相關 性,做出 69 乘 69 矩陣。第三部分,我們結合結構字元與環境定義,產生出 115 乘 115 分數矩陣,或產生 100 乘 100 之矩陣來探討胺基酸與所處環境之關聯。這部分的

(12)

3

矩陣中包含了胺基酸、結構以及環境的概念,將所有考慮的元素和設定的條件全部囊 括,希望最後可由這些矩陣所呈現的結果探討其生物意義。

(13)

4

第二章、相關文獻探討

2.1 蛋白質的胺基酸交互作用偏好

眾所皆知,蛋白質的三級結構很複雜,難以進行全面的統計分析。而在二級結構 的層面上,因只考慮了三種結構,分別是 Helix、Strand 和 Loop,所以儘管立體結構 很複雜,但仍可透過局部片段上明顯的二級結構,像 Helices 和 Strands,或多個 strands 所組合成幾乎平面的 Sheets,進行統計研究。

為了了解胺基酸與結構之間的關係,有研究者使用計算胺基酸之間距離的方式,

並將二級結構資訊引入,以此序列與結構之綜合關係進行統計分類。此外,也有將各 胺基酸間共多少鄰居,也就是有多少個接觸到的胺基酸記錄下來,做為另一種序列與 空間關係的統計分類。把 3 種二級結構和 20 種胺基酸當成一種分類的維度,對蛋白 質進行統計觀察後所提供的新見解,很具生物意義[5]。

根據接觸數方法來研究蛋白質結構,有許多相關研究,其中不同之處主要在於對 胺基酸接觸的定義。例如:TS(Tanaka and Scheraga)定義是使用距離小於凡德瓦半徑總 和[6]。RO(Robson and Osguthorpe)使用定義包含凡德瓦力、靜電、氫鍵和溶劑之交互 作用[7]。MC(Maiorov and Crippen)的方法則區分較細,是骨幹與骨幹之間接觸,O 原 子與 N 原子距離小於 32Å 且 C 原子與 N 原子距離要大於 3.9Å ;此外,骨幹和側鏈的 接觸與否,是以 N 原子或 O 原子與 Cβ 原子距離小於 5.0Å 為標準,且在配對上沒有 其他原子交互作用;側鏈與側鏈之間的接觸則以兩Cβ 原子距離小於 9Å 為其定義[8]。

BL(Bryant and Lawrence)之研究則是在 0-10Å 的範圍內定義各種不同距離,來分析胺 基酸接觸數[9]。

然而,蛋白質結構複雜,在結構上些微的差異就足以影響結果,因此有部分研究 採納胺基酸環境的概念,以該胺基酸周圍其他胺基酸的數量,來決定該胺基酸所處的

(14)

5

環境為何。一些相關研究以不同的定義來決定胺基酸環境,例如計算Cα 和 Cβ 原子 在不同門檻值之下的距離,以決定胺基酸接觸數量[10];以胺基酸質心為中心,計算 在 6.5Å 中共有多少個其他胺基酸[11]。而[5]則使用不同於其他人的方法,是透過接 觸數數量來決定環境,最後得到胺基酸接觸之分數矩陣。

2.2 準化學方法(quasi-chemical method)探討胺基酸之交

互作用

前人研究中提出了一個名為準化學方法(quasi-chemical method)的研究角度,用來 計算胺基酸之間的交互作用,需要用到已知的蛋白質結構資訊和計算所有結構中不同 類型的成對接觸[5]。該論文作者提出,當接觸數超過一門檻值時,能宣稱該胺基酸 與另外一種胺基酸之交互作用很具有吸引力。胺基酸接觸的定義是,只要兩個胺基酸 之間有符合所設定的距離標準,彼此就算是鄰居。而交互作用的強度是統計所有蛋白 質中該胺基酸之鄰居數量來決定。若是在統計所有的蛋白質之原子結構後,發現某胺 基酸與另一種胺基酸的接觸數低於門檻值,表示這兩種胺基酸互為排斥,較不容易在 結構中相互接觸。準化學方法提供了胺基酸之間交互作用的估計,論文中大致分為四 個類別進行計算及統計結果。

使用準化學方法對於研究蛋白質行為有幾個影響的關鍵,例如:胺基酸在二級結 構的特定傾向以及傾向或避免與水接觸等。因此準化學方法透過定義來表現生物意義,

舉例來說,在蛋白質穩定結構的核心內,其胺基酸的鄰居數量會比在蛋白質邊緣時更 多。這是由於內部胺基酸,在結構緊密之下,彼此會比較靠近,所以接觸的次數多,

而在外部的胺基酸只會與少數鄰近的胺基酸有接觸的機會。因此統計次數在最終換算 成分數後,在蛋白質內部的胺基酸交互作用分數會比在外部的胺基酸還要好。

分析Cα與Cα之間的接觸,並將兩者之間的接觸數字定義為連結度,根據連結度

(15)

6

的數字分成5個環境,低連結度為暴露,高連結度為埋藏。根據前人研究[5]發現,一 胺基酸與其他胺基酸之間的接觸,不論環境為何,都有相似的分佈傾向,各種胺基酸 在5個環境下所呈現的結果模式都很一致。此外,胺基酸亦會傾向與另一個為同類型 結構的胺基酸產生接觸。

將胺基酸在環境和結構的條件下分別產生出兩種分數矩陣,分別是20個胺基酸和 5個環境之間的矩陣以及20個胺基酸和3種結構之間的矩陣。最後產生出100乘100和60 乘60兩個有對稱性的矩陣,經過計算後矩陣中負分代表具有高度吸引傾向,正分表示 為排斥傾向。令人驚訝的是,每個胺基酸在某個特定的環境時,對到其他胺基酸的所 有環境所呈現出來的分數大致相同。胺基酸在相同環境下的值都差不多,但全部的環 境下觀察卻有很明顯的差異性,因此證明還是需要用到100乘100的分數矩陣。此外,

像是CYS-CYS的區塊,不論是哪個環境,都是很明顯的負分,表示在全部胺基酸所 有環境中,CYS-CYS是最具吸引傾向,並且是最容易發生交互作用的胺基酸,這和 蛋白質內部雙硫鍵的特性完全符合。此現象無論在100乘100或60乘60的矩陣,都能觀 察到CYS-CYS不論什麼結構都是呈現很明顯的負分,仍然是所有胺基酸中最有利於 交互作用的胺基酸,而且當結構為Helix-Helix和Sheet-Sheet時,比起其他類型的交互 作用有更高的傾向[11]。

(16)

7

2.3 結構字元之定義與二級結構之關聯

以往針對蛋白質胺基酸所做的統計分析或比對,多半是只針對胺基酸單獨個別的 觀察。後來有相關研究透過採用不只單一一個位置和其結構資訊,還將該胺基酸周圍 其他五個胺基酸和結構納入,將這五個胺基酸和結構所產生的局部區塊稱為結構字元 (Structural Alphabet, SA)[12, 13]。每一種結構字元都有其特殊的結構,以平移的方式 透過計算將五個胺基酸歸類為一個結構字元。該研究結果顯示,結構字元是一段帶有 二級結構資訊的序列片段,其結構字元與二級結構之對應關係如下。

 α-helix 的結構字元:A、Y、B、C、D。

 類似 α-helix 的結構字元:G、I、L。

 β-sheet 的結構字元:H、E、F。

 類似 β-sheet 的結構字元:K、N。

 coil 或 loop 字的結構字元:M、P、Q、R、S、T、V、W、X、Z。

2.4 特定種類胺基酸序列-蛋白質局部結構關係:結構字元

的分析

對於蛋白質三級結構的知識,前人提出了一些有趣的見解,根據結構分析和預測 方法從非重複的蛋白質測試資料中獲得資訊,其中產生出名為胺基酸序列-蛋白質結 構(Amino Acid Sequence-Protein Structure),縮寫為 AAS-PS[1]。該研究選擇三種物種 的非重複性資料,所選的物種分別為阿拉伯芥、惡性瘧原蟲以及釀酒酵母,設定蛋白 質序列條件並篩選出符合條件的蛋白質。蛋白質設定編碼共有十六個名為 Protein Blocks 的字元,每一個字元皆表現蛋白質局部三維結構。Protein Blocks 字元的方法,

已經被廣泛運用在描述三維蛋白質骨幹,以及局部的結構預測上。此研究將胺基酸中

(17)

8

二級結構以及 Protein Blocks 以 Z-score 計算,用 Z-score 統一計算出一個得以比較的 分數,藉由 Z-score 比較並觀察 Protein Blocks 和二級結構之間的差異性,進而分析出 Protein Blocks 在胺基酸中佔有多麼重要的位置。

他們觀察到,在測試資料中,不同蛋白質的 AAS-PS 關係卻有著相似的功能。根 據胺基酸親水性、Helix 習性以及不同物種的特性,可分析蛋白質是否會因為不同物 種而表現出不同的 AAS-PS 關係。該研究分別做了一般的二級結構,以及他們自己所 設計的一套名為 Protein Blocks 的結構字元,做更精細的局部摺疊描述。再從這兩種 方法所產生出來的結果去比較兩者之間的差異。最後探討是否物種變化會讓 AAS-PS 關係有所改變,並能檢驗與標準二級結構比較後所產生的結果是否有誤[1]。

(18)

9

第三章、研究方法

3.1 測試資料之準備

測試資料的蛋白質是參考[1],我們從 PISCES 伺服器中選出符合條件的蛋白質列 表,選擇球狀蛋白是因為可溶於水的蛋白質結構,在水環境中一級結構不斷彎折,慢 慢依照胺基酸特性而區分出親水區和疏水區,進而漸漸形成球狀的蛋白質。而蛋白質 序列長度至少要有一定的長度,才能摺疊成擁有較完整結構的蛋白質。其餘選擇蛋白 質測試資料的條件如下。

 只有球狀蛋白

 最小序列長度為 50

 序列一致性小於 20%

 X 光結構解析度小於 1.8Å

 R factor 大於 0.25

 去除結晶不完全、斷鏈、結構不連續的蛋白質結構

 去除結構內包含非 20 種標準胺基酸的蛋白質

PISCES 伺服器更新的日期為 2014 年 3 月 23 日,經過條件挑選過後,得到共有 3588 個蛋白質名稱。接著到 PDB 網站上將這 3588 個蛋白質的 PDB 檔案下載下來,

針對這些蛋白質來進行計算與分析。

(19)

10

3.2 將 PDB 轉成 DSSP

為了獲得二級結構資訊並將胺基酸序列轉換為 SA 序列,我們將 PDB 檔利用 DSSP 網站轉成 DSSP 檔,再讀取其中的二級結構定義與 Kappa 與 Alpha 角度(轉換 SA 之用)。從 DSSP 中獲得結構資訊,進而與 PDB 的胺基酸互相對應,所以當計算 完 PDB 中的胺基酸距離,也能得知當下的那個胺基酸的結構為何。

在讀取 PDB 檔時是抓取記錄 Cα 原子的資料行,抓取 X、Y、Z 座標來計算胺基 酸之間的距離。而同時,我們也讀取 DSSP 所判斷的二級結構,抓到字母為 H、G、I 我們定為 Helix;B、E 為 Strand;T、S 和空白則為 Loop,當要將胺基酸轉成結構字 元時,讀取 DSSP 檔中的 Kappa 與 Alpha 角度,再經由 3D-BLAST 所定義的結構字 元對應表,即可將蛋白質一級序列轉換成三級結構。圖 3-1 為 PDB 檔案轉換成 DSSP 檔案的過程。

圖 3-1、蛋白質 PDB 轉換成 DSSP 檔。以蛋白質 1O06 為例,在 PDB 檔中 Cα 行的 X、

Y、Z 座標,轉檔成 DSSP 後,利用二級結構之定義,以及 Kappa 和 Alpha 之角度,

以便轉換成結構字元。

(20)

11

3.3 計算胺基酸 Cα 與 Cα 之間的距離

根據每個蛋白質每個鏈中各個胺基酸的Cα 來計算,計算每個胺基酸的 Cα 與其 他胺基酸的Cα 之間的距離。只要兩個胺基酸之間距離有小於 6.5 的情況下就符合記 錄為一次接觸。每計算一個蛋白質中的一個鏈之後才換下一個鏈或下一個蛋白質來計 算,當有計算到相同的胺基酸時才會再繼續累加,所以計算完 3588 個蛋白質之後會 記錄成個別 20 個胺基酸的的接觸數。觀察圖 3-2 為兩胺基酸 Cα 原子之間的距離,用 以區分有接觸和無接觸。

圖 3-2、以胺基酸 Cα 原子之間距離定義是否接觸。當兩個胺基酸 Cα 原子,經過計算 完座標之距離後,距離小於 6.5 Å 時,則定義為有接觸。反之兩 Cα 原子之間的距離 大於 6.5 Å ,兩胺基酸之間則視為沒有接觸。

>6.5 Å

無接觸

≦6.5 Å

有接觸

(21)

12

3.4 分鏈計算

計算蛋白質中胺基酸的距離時,不會跨蛋白質亦不會跨蛋白質鏈來計算,直接單 純計算蛋白質鏈自身內部胺基酸相互之間的距離。像圖 3-3 為蛋白質中兩個不同的鏈,

以 A 鏈的 THR 來看,若它鄰近的都為符合算一次接觸的情況,THR 的接觸就算 2 次,

SER-THR 和 THR-LYS,就算 A 鏈的 THR 與 B 鏈的 THR 距離有符合算一次接觸的 情況,因為不是同一個蛋白質鏈,所以 A 鏈的 THR-B 鏈 THR 不能算一次接觸。計 算完 A 鏈與 B 鏈後,THR 的接觸次數在 A 鏈內共計 2 次,在 B 鏈內有 ILE-THR 和 THR-GLU 等共 2 次接觸。最後統計 THR 的接觸次數總和即是 4 次。

圖 3-3、蛋白質計算接觸的方式。計算蛋白質中,胺基酸之間的距離,蛋白質鏈是分 開判斷,並且也無跨蛋白質的計算。蛋白質 A 鏈與 B 鏈之胺基酸序列,即使兩鏈其 中的某一個 THR 彼此相鄰,我們也不會將其視為接觸。

(22)

13

3.5 胺基酸環境定義

根據[1],計算胺基酸之間的距離後,根據距離得知每個胺基酸會與多少胺基酸 有接觸,藉由接觸的數量多寡,得以了解胺基酸為親水或疏水。若此胺基酸的接觸數 很少,就判定為是暴露在蛋白質外部的親水區胺基酸,而接觸數多則判斷為埋藏在蛋 白質內部的疏水區胺基酸,這裡將每個胺基酸與鄰近胺基酸的接觸,稱為連結度。以 圖 3-3 為例,觀察圖中特定胺基酸的連結度為多少,所屬環境為何。

圖 3-3、蛋白質 3IOX 的胺基酸周圍連結度。圓圈標記的胺基酸 ASN-388,方框所圈 的六個胺基酸,都為與 ASN-388 距離小於 6.5 Å。圖中 ALA-386 離 ASN-388 較遠,

其距離大於定義值,因此判定不與 ASN-388 接觸。最後,ASN-388 的連結度為六,

所以歸類為環境四。

(23)

14

計算每個胺基酸與其他胺基酸之間是否有鄰近的情形,只要有距離小於 6.5Å,就 記錄為一次連結度。我們以連結度的數量大小設定為環境的定義,分別如下。

 Environment 1: 連結度 1~3

 Environment 2: 連結度 4

 Environment 3: 連結度 5

 Environment 4: 連結度 6

 Environment 5: 連結度 7 以上

圖 3-4 為將 PDB 檔,輸出成 DSSP 檔的過程,當中所使用到的資料分別的位置,

以及所需功能。

圖 3-4、蛋白質 PDB 檔輸出成環境檔。以蛋白質 1O06 的轉檔過程為例,在 PDB 檔 中 Cα 行的 X、Y、Z 座標,計算空間中與周圍胺基酸的接觸數後,將每個胺基酸所 屬的環境做歸類,以便往後做胺基酸、結構字元與環境計算時使用。

(24)

15

3.6 根據接觸數所產生的分數矩陣

透過計算胺基酸Cα 與 Cα 之間的距離,有單純計算胺基酸與胺基酸之間的距離,

還有將結構考慮進胺基酸之間的計算,最後是加入自訂的環境定義與胺基酸之間的距 離計算,所以將會產生三種分數矩陣,分別是 20 個胺基酸與 20 個胺基酸的 20 乘 20 分數矩陣、20 個胺基酸和 3 個結構之組合下的 60 乘 60 分數矩陣、以及 20 個胺基酸 和 5 種環境之組合的 100 乘 100 分數矩陣,分數矩陣組成樣貌,可從圖 3-5 觀察。

圖 3-5、胺基酸、結構以及環境的三大分數矩陣示意圖。胺基酸與胺基酸之間的交互 作用,分數矩陣大小為 20 乘 20;胺基酸結合三種二級結構所產生的分數,矩陣大小 為 60 乘 60;若考慮 20 種胺基酸與五類環境條件產生的分數,矩陣即為 100 乘 100 之大小。

獲取蛋白質資料、計算過程、如何定義、產生結果,為本研究的主要操作流程(圖 3-6),主要產生三大分數矩陣,在計算完分數後,統計完一個矩陣再統計下一個,最 終產生胺基酸的三個分數矩陣與結構字元的三個分數矩陣。

20x3

60

20x5

100 20

20

(25)

16

圖 3-6、獲得蛋白質資料及計算接觸分數流程圖。首先從 PISCES 伺服器中,獲得適 合的蛋白質清單;接著將蛋白質 ID,從 PDB 網站上獲取 PDB 檔案;將 PDB 檔轉成 DSSP 檔,以及把 PDB 檔輸出成環境檔;計算 PDB 檔中每個胺基酸 Cα 原子之間的 距離;設定條件將環境作定義分類;根據公式計算胺基酸、結構字元、二級結構以及 環境之間的交互作用分數;最後將每個計算出來的分數矩陣以顏色圖的方式呈現,觀 察結構字元與胺基酸在二級結構和環境下的變化。

蛋白質清單

PDB 檔

轉換成 DSSP 檔

計算 PDB 中胺基酸 Cα 原子之間的距離

定義環境

計算分數

將分數以顏色圖的方式呈現

(26)

17

表 1、胺基酸公式中符號代表意義

矩陣大小 20*20 60*60 100*100

接觸數量 nij ni1,j2 nix,jy

數值 g 設定 2 2 2

胺基酸數量 i Si Si Si

胺基酸數量 j Sj Sj Sj

胺基酸總數 S S S

二級結構數量 1 - f1 -

二級結構數量 2 - f2 -

環境數量 x - - ex

環境數量 y - - ey

接觸總數 N N N

表 2、結構字元公式中符號代表意義

矩陣大小 23*23 69*69 115*115

接觸數量 nij ni1,j2 nix,jy

數值 g 設定 2 2 2

結構字元數量 i Si Si Si

結構字元數量 j Sj Sj Sj

結構字元總數 S S S

二級結構數量 1 - f1 -

二級結構數量 2 - f2 -

環境數量 x - - ex

環境數量 y - - ey

接觸總數 N N N

(27)

18

3.7 20 乘 20 的分數矩陣

這個分數矩陣是將 20 種胺基酸之間計算完接觸數之後,經由公式計算出交互作 用的分數,公式如下:

M(𝑖, 𝑗) = −𝑙𝑛 [ 𝑛𝑖𝑗

𝑔×(𝑆𝑖𝑆)×(𝑆𝑗𝑆)×𝑁] ……… (1) 公式當中的各個元素,如 nij為 i 胺基酸與 j 胺基酸之間的接觸數;N 為所有胺基 酸的接觸數總和;S 為所有胺基酸的總數,Si為 i 胺基酸的總數,Sj為 j 胺基酸的總數;

g 的數值設定是當兩個胺基酸名字相同時 g 等於 1,不一樣則 g 等於 2。g 的定義是,

當相互接觸的兩胺基酸名稱相同時,不論怎麼配對,都只有一種情形。而兩胺基酸名 稱不同時,則會有兩種接觸的組合,例如 ALA 與 LEU 配對,有 ALA 對 LEU 和 LEU 對 ALA 兩種情形,因此計算的權重 g 要乘上兩倍。計算完括弧內數值後取-ln,就是 取-log 以 e 為底數,最後得到的數值就是 20 乘 20 矩陣中其中一格的交互作用分數。

圖 3-7 為胺基酸的接觸情況。

圖 3-7、胺基酸之間的接觸示意圖。兩個胺基酸之間的接觸方式,是以 20 個胺基酸之 間的配對,並計算 20 個胺基酸相互之間的接觸數,再將接觸數轉換為分數,最終會 產生一個 20 乘 20 的分數矩陣。

胺基酸 胺基酸

20 20

(28)

19

3.8 60 乘 60 的分數矩陣

計算過 20 個胺基酸之間的接觸數,再來就是從 DSSP 檔中找到每個胺基酸相對 應的三種二級結構其中之一,並且套用到公式中,如下:

M(𝑖, 𝑗) = −𝑙𝑛 [ 𝑛𝑖1,𝑗2

𝑔×(𝑆𝑖𝑆)×(𝑆𝑗𝑆)×(𝑓1𝐹)×(𝑓2𝐹)×𝑁]………..……(2) 公式中各元素的定義分別如下所述。ni1,j2表示當 i 胺基酸屬於結構 1 與 j 胺基酸 屬於結構 2 時兩者之間的接觸數;N 為所有胺基酸的接觸總和;S 為胺基酸總數,F 為結構總數,其中 S 等於 F,代表每個胺基酸一定會有一個結構,所以胺基酸總數 S 會與結構總數 F 相等,Si為 i 胺基酸的總數,Sj為 j 胺基酸的總數,f1為結構 1 的總 數,f2為結構 2 的總數;g 的設定是當胺基酸名字相同且結構也相同時 g 等於 1,其 他情況 g 都為 2。計算完之後取-log 以 e 為底,最後得到的數值就是 60 乘 60 矩陣中 的其中一格交互作用分數。圖 3-8 為胺基酸的接觸情況。

圖 3-8、胺基酸與結構之示意圖。兩個胺基酸包含二級結構之間的接觸方式,以 20 個胺基酸和 3 種二級結構之間做統計,計算分析胺基酸相互之間的接觸分數,最終會 產生一個 20 乘 3 與 20 乘 3 的矩陣,為一個 60 乘 60 的分數矩陣。

胺基酸 胺基酸

20 20

結構

3

結構

3

(29)

20

3.9 100 乘 100 的分數矩陣

計算過 20 個胺基酸之間的接觸數,也將每個胺基酸依照鄰居的數量而做出了環 境的定義,所以每個胺基酸也會有該胺基酸所屬的環境,一共有 5 種環境,之後開始 計算胺基酸與環境之間的交互作用分數,公式如下:

M(𝑖, 𝑗) = −𝑙𝑛 [ 𝑛𝑖𝑥,𝑗𝑦

𝑔×(𝑆𝑖𝑆)×(𝑆𝑗𝑆)×(𝑒𝑥𝐸)×(𝑒𝑦𝐸)×𝑁]………(3) 公式裡的元素定義分別如下。首先 nix,jy為胺基酸 i 屬於環境 x 時和胺基酸 j 屬於 環境 y 時兩者之間的接觸數、N 為所有胺基酸的接觸數總和,S 為胺基酸總數與 E 為 環境總數、由於每個胺基酸一定會被定義一個環境,所以胺基酸總數 S 會與環境總數 E 相等、Si為 i 胺基酸的總數,Sj為 j 胺基酸的總數、ex為環境 x 的總數,ey為環境 y 的總數。g 的設定是當胺基酸名字相同且環境也相同時 g 為 1,其他情況 g 皆定為 2。

最後取-log 以 e 為底,最後得到的數值就是 100 乘 100 分數矩陣中的其中一格交互作 用分數。圖 3-9 為胺基酸的接觸情況。

圖 3-9、胺基酸與環境之示意圖。兩個胺基酸與環境之間的接觸方式,以 20 個胺基酸 和 5 種環境之間做組合,計算並統計胺基酸加上環境條件後,每個胺基酸在各種環境 下彼此之間的分數,最終產生一個 20 乘 5 與 20 乘 5 的矩陣,為一個 100 乘 100 的分 數矩陣。

胺基酸 胺基酸

20 20

環境

5

環境

5

(30)

21

3.10 將胺基酸替換成結構字元(SA)

上述有使用到胺基酸的部分,將所有胺基酸替換成結構字元,進而針對結構字元、

二級結構以及環境,這三部分做計算,計算過程和方式都與胺基酸相同,最終呈現結 果產生三個分數矩陣,因為結構字元的編碼有 23 個,而胺基酸只有 20 個,最後結構 字元所統計出來的分數矩陣大小,會與胺基酸的分數矩陣大小不同。如圖 3-10 所示,

結構字元的三種接觸方式。

(a)

(b)

(c)

圖 3-10、結構字元、結構與環境之示意圖。(a)結構字元與結構字元之間的接觸方式,

是以 23 個結構字元與 23 個結構字元之間的配對,最後產生一個 23 乘 23 個分數矩陣。

(b)結構字元包含結構之間的組合,23 個結構字元與 3 種二級結構之間的排列,計算 並統計出結構字元在各種結構的情形下,最終產生一個 23 乘 3 與 23 乘 3 的矩陣,為 一個 69 乘 69 的分數矩陣。(c)結構字元包含環境之間的組合,23 個結構字元與 5 個 環境之間的排列,計算並統計出結構字元在各種環境下的分數,最後產生一個 23 乘 5 與 23 乘 5 的矩陣,為一個 115 乘 115 的分數矩陣。

SA SA

23 23

SA SA

23 23

結構

3

結構

3

SA SA

23 23

環境

5

環境

5

(31)

22

3.11 23 乘 23 的分數矩陣

計算 SA 與 SA 之間的接觸數之後,透過公式將 SA 之間的交互作用分數計算出 來,公式如下:

M(𝑖, 𝑗) = −𝑙𝑛 [ 𝑛𝑖𝑗

𝑔×(𝑆𝑖𝑆)×(𝑆𝑗𝑆)×𝑁]……….………..(4) 公式當中的各個元素,如 nij為 i 結構字元與 j 結構字元之間的接觸數;N 為所有 結構字元的接觸數總和,S 為所有結構字元的總數,Si為 i 結構字元的總數,Sj為 j 結構字元的總數;g 的數值設定是當兩個結構字元名字相同時 g 為 1,不一樣則 g 為 2。計算完括弧內數值後取-ln,就是取-log 以 e 為底數,最後得到的數值就是 23 乘 23 矩陣中其中一格的交互作用分數。

3.12 69 乘 69 的分數矩陣

計算完 23 個結構字元之間的接觸數,再從 DSSP 檔中找到每個結構字元相對應 的三種結構其中之一,並且套用到公式中

公式如下:

M(𝑖, 𝑗) = −𝑙𝑛 [ 𝑛𝑖1,𝑗2

𝑔×(𝑆𝑖𝑆)×(𝑆𝑗𝑆)×(𝑓1𝐹)×(𝑓2𝐹)×𝑁]………..…………..(5) 公式中各元素的定義分別如下述。ni1,j2表示當 i 結構字元屬於結構 1 與 j 結構字 元屬於結構 2 時兩者之間的接觸數;N 為所有結構字元的接觸總和,S 為結構字元總 數,F 為結構總數,其中 S 等於 F,因為每個結構字元一定會有一個結構,所以結構 字元總數 S 會與結構總數 F 相等,Si為 i 結構字元的總數,Sj為 j 結構字元的總數,

f1為結構 1 的總數,f2為結構 2 的總數;g 的設定是當結構字元名字相同且結構也相 同時 g 設定為 1,其他情況 g 都為 2。計算完之後取-log 以 e 為底,最後得到的數值 就是 69 乘 69 矩陣中的其中一格交互作用分數。

(32)

23

3.13 115 乘 115 的分數矩陣

計算過 23 個結構字元之間的接觸數,也將每個結構字元依照鄰居的數量而做出 了環境的定義,所以每個結構字元也會有該結構字元所屬的環境,一共有 5 種環境,

之後開始計算結構字元與環境之間的交互作用分數 公式如下:

M(𝑖, 𝑗) = −𝑙𝑛 [ 𝑛𝑖𝑥,𝑗𝑦

𝑔×(𝑆𝑖𝑆)×(𝑆𝑗𝑆)×(𝑒𝑥𝐸)×(𝑒𝑦𝐸)×𝑁]………..(6) 公式裡的元素分別為: nix,jy為結構字元 i 屬於環境 x 時和結構字元 j 屬於環境 y 時 兩者之間的接觸數、N 為所有結構字元的接觸總和,S 為結構字元總數,E 為環境總 數,其中 S 等於 E,因為每個結構字元一定會有一個環境,所以結構字元總數 S 會與 環境總數 E 相等,Si為 i 結構字元的總數,Sj為 j 結構字元的總數,ex為環境 x 的總 數,ey為環境 y 的總數;g 的設定是當結構字元名字相同且環境也相同時 g 設定為 1,

其他情況 g 都為 2。算完後取-log 以 e 為底,最後得到的數值就是 115 乘 115 分數矩 陣中的其中一格交互作用分數。

先是計算胺基酸之間的交互作用分數,還有考慮結構或環境之後的交互作用分數,

並將分數轉成顏色來表示,以便觀察當中分數的變化。我們可從分數色階圖中觀察出 在哪些胺基酸會比較喜歡靠近在一起,並且以此分數色階圖與參考文獻相互做比較,

若發現兩者分數色階圖所呈現的樣貌差不多,即可判斷我們所統計的資料沒有問題。

分別做完胺基酸的 20 乘 20、60 乘 60 和 100 乘 100 三種矩陣的圖之後,我們以結構 字元也一樣針對三種分數矩陣來做圖,而結構字元最後是產生 23 乘 23、69 乘 69 和 115 乘 115 的三種分數矩陣圖,最後觀察並探討結構字元的接觸趨勢。

(33)

24

第四章、研究結果與討論

4.1 胺基酸接觸總數

前人研究[1]中是使用 1654 個蛋白質來做 100 乘 100 的交互作用分數圖,而本研 究所使用的蛋白質數量共 3588 個。以本研究的測試資料所統計而得的 100 乘 100 的 分數圖和文獻的分數圖做比較,結果發現交互作用分數圖呈現的顏色分布情況與文獻 相似,這表示我們所使用的公式與計算的分數結果無誤。

文獻中[1]有針對結構與胺基酸做直條圖來觀察,將胺基酸與結構之接觸數量做 成直條圖,與參考文獻[1]的圖做比較,分別從三種不同結構圖觀察接觸數量,觀察 數量比例的分布,每個結構每張圖都與參考文獻的比例符合,只是接觸的數量會不同,

因為參考文獻是以 1654 個蛋白質來做,本研究是以 3588 個蛋白質來做,所以會產生 接觸數量的差異,不過比例分布沒有太大差異,證明圖沒有問題,照常理來判斷,

Helix 的圖要以對到其他胺基酸是 Helix 時數量最高,Strand 也是對到 Strand 時最高,

Loop 也是如此,觀察三個圖的趨勢,確實如此,更加能確定這三個圖為合理的直條 趨勢圖。

觀察到圖 4-1(a)中,在所有胺基酸的二級結構為 Helix 時,ALA 的接觸數量最高,

而 ALA 在其他結構則沒有與其他胺基酸有較明顯的接觸。

圖 4-1(c)中,GLY 為 Loop 對到所有胺基酸為 Loop 時的接觸數最高,表示 GLY 特別容易出現在 Loop。此外 PRO 也有這樣的傾向,整體而言,雖然 PRO 在圖 4-1 (c) 中的 Loop 接觸數不像 GLY 特別突出,但當 PRO 為 Helix 和 Strand 時,接觸數量特 別少,由此可知,PRO 最常以 Loop 的結構出現並與其他胺基酸靠近產生接觸。

圖 4-1(b)中,二級結構為 Strand 時,VAL 接觸數量最高,表示 VAL 特別常為二 級結構 Strand,且最容易和其他胺基酸產生接觸。

SER、GLU、ASP 和 LYS,在三種二級結構中,為 Helix 和 Loop 的時候接觸數

(34)

25

較高,表示這四個胺基酸較常出現於 Helix 和 Loop。

雖然 LEU 在圖 4-1(a)中,為 Helix 時對所有胺基酸的接觸數是第二高,但因為在 圖 4-1(b)和圖 4-1(c),LEU 為 Strand 和 Loop 時與所有胺基酸的接觸數也不低,由此 觀察出,LEU 沒有特別傾向為某個二級結構,LEU 平均出現在三種二級結構中。

(35)

26

圖 4-1、胺基酸在三種結構下的接觸數量圖。橫軸為 20 個胺基酸的名稱,縱軸為各個 胺基酸對到所有胺基酸的接觸總數,分別為(a)Helix、(b)Strand 和(c)Loop 三張圖,代 表該胺基酸為某結構時,對到其他 20 個胺基酸的接觸總數。每個胺基酸在每張圖中 都有三條直條,左邊藍色長條為該胺基酸對到全部胺基酸為 Helix 的接觸總數;中央 綠色直條為該胺基酸對到全部胺基酸為 Strand 的接觸總數;右邊紅色直條為該胺基酸 對到全部胺基酸為 Loop 的接觸總數。

(36)

27

4.2 胺基酸在環境中的胺基酸交互作用分數

我們針對胺基酸與環境做出了一個 100 乘 100 的交互作用分數圖,如圖 4-2 所示,

每一格表示一個胺基酸為某環境時對到另一個胺基酸為某環境時的分數。觀察到最藍 的區域落在 Cys-Cys 的區塊,分數為-3.29~1.103,表示最具吸引傾向,最喜歡靠近在 一起。此觀察結果與 A.P. Joseph et al.之研究結果[1]幾乎一致,Cys-Cys 的區塊在他們 的結果裡五種環境同樣也是幾乎都藍色。圖 4-2 裡,數值越小顏色越藍、數值越大則 顏色越紅。整張矩陣圖裡分數最低的位置落在 HIS_e1-HIS_e1,接觸數經過換算後的 數值為-4.39。而分數最高落在 Cys_e1-GLU_e5,數值分數為 5.508,較高的數值表示 這個情況時兩個胺基酸最不常發生靠近。

圖 4-2 中,以白色表示兩個胺基酸之間完全沒有接觸,不過只有 7 種這樣的情形 出 現 , MET_e1-MET_e4 、 CYS_e1-LEU_e5 、 CYS_e1-ILE_e2 、 CYS_e1-MET_e2 、 CYS_e1-TRP_e5、GLN_e5-CYS_e1、ASN_e4-CYS_e1。

(37)

28

圖 4-2、20 種胺基酸在五個環境中的交互作用分數。橫軸與縱軸分別為 20 個胺基酸,

每一個胺基酸當中又分為五個環境,所以一個胺基酸會有五格分數,每一格為該胺基 酸屬於該環境時,對到另一個胺基酸屬於某環境的分數。

(38)

29

4.3 結構字元之間的分數矩陣

圖 4-3 表示 23 種 SA 彼此之間的交互作用分數圖,色階範圍是-2.5~3.5。由於 SA 本身就有包含了結構的資訊在序列裡面,因此可以直接觀察到屬於 Helix、Strand 和 Loop 的 SA 分數大致分布的情形。從圖 4-3 中可看出,屬於 Helix 的 SA(A、Y、B、

C、D)相互之間都是藍色,分數較好。同樣地,屬於 Strand 的 SA(H、E、F)彼此之間 分數也是較好。而屬於 Strand 的 SA (HEF),它們與屬於 Helix 的 SA 之間的顏色都是 紅色,表示分數較差。鄰近胺基酸較容易形成相同的二級結構,每一結構片段都是相 同且連續的結構,不同的二級結構之間沒有明顯產生距離相近的情形,胺基酸在形成 Helix 與 Strand 時,不會在某段 Helix 片段中,突然出現一段 Strand;反之,在 Strand 片段中,也不會突然出現 Helix 片段。在連接 Helix 與 Strand 之間,通常會以 Loop 做連結,結構之間距離近、分數好也很符合常理。

圖 4-3、23 個結構字元之間的交互作用分數圖。橫軸和縱軸分別都為 23 個結構字元,

依照各個結構字元所屬結構排列,排列順序從 Helix(A、Y、B、C、D)、類似 Helix(G、

I、L)、Strand(H、E、F)、類似 Strand(K、N)和其他(coil 或 loop,M、P、Q、R、S、

T、V、W、X、Z),每一格為結構字元彼此之間接觸數所轉換的分數。

(39)

30

4.4 結構字元與二級結構之間的分數矩陣

23個SA和3種二級結構之間的圖,矩陣大小原來應該為69乘69,但去除掉沒有 Helix和Strand的那13個字元,矩陣大小變為56乘56,因為SA本身就有包含結構,所以 如果另外再做結構與SA的圖,會出現SA為不屬於它的結構時對到其他SA的接觸為0,

例如A、Y、B、C、D本身的結構為Helix,所以表示當圖中有A-Strand、Y-Strand、B-Strand、

C-Strand、D-Strand的情況會出現很多沒有接觸的值。就蛋白質二級結構的定義而言,

Helix與類似Helix-like的SA並不會出現在Strand之結構中。而SA本身屬於Strand的H、

E、F、K、N也是一樣,例如:當它們做到H-Helix、E-Helix、F-Helix的時候,大部 分的接觸為0,與其他SA之間幾乎都沒有分數,所以這幾種SA不會出現Helix。

在圖4-4中將這幾種狀況去除,可以直接觀察到SA之間相對的分數變化,例如觀 察到座標(19,19),表示SA為H結構為Strand與SA為H結構為Strand的分數,分數為 -4.069。從圖4-4中可發現像A、Y、B、C、D分別對到也是A、Y、B、C、D任何一個 SA且都為Helix時,分數都比較好,顏色為深藍色。而H、E、F則是對到同樣也是H、

E、F且結構都為Strand時分數最好。由此可知當遇到屬於該結構的兩個SA時分數會最 好,而分數較差的分布較分散,紅色就比較沒有集中的情形,大多落在SA(AYBCD) 為Loop時對到SA(PQRSTVWXZ)為Helix,以及SA(PQRSTVWXZ)兩者相對結構分別 為Helix和Strand時,紅色分布就沒有較固定的趨勢。因此我們建議如果要分析二級結 構與接觸數的關係,直接觀察23乘23的SA圖(如圖4-3)即可。

(40)

31

圖 4-4、23 個結構字元與結構之間的交互作用分數圖。橫軸與縱軸分別為 23 個結構 字元,依照二級結構劃分區塊記錄交互作用分數,結構字元的排列順序,在 Helix 區 塊為(A~Z)、Strand 區塊為(H~Z)而 Loop 區塊為(A~Z)。屬於 Helix 與類似 Helix 的結 構字元不會有屬於 Strand 的情況;同時,屬於 Strand 與類似 Strand 的結構字元亦不 會有屬於 Helix 的情況,因此圖中將結構字元(AYBCDGIL)-Strand 及(HEFKN)-Helix 的分數排除。

(41)

32

4.5 結構字元與環境之間的分數矩陣

在23種SA個別也分成五種不同的環境後,此接觸分數矩陣大小為115乘115(23個 SA與5個環境乘上23個SA與5個環境),每個矩陣元素都是由SA與另一個SA在5個環境 (e1~e5)中的接觸次數。將這些接觸轉換成分數,每一格資料為特定的SA與另一個特 定的SA在5種不同環境中的交互作用分數,如圖4-5。例如:座標(5,9)之分數為-0.146,

是A為e5時與Y為e4時兩者之間接觸數所轉換的分數,兩個SA因為都屬於Helix結構,

且挑選的環境又比較大,經公式轉換後的分數為負表示兩者helix結構在蛋白質內部環 境經常產生接觸。圖4-5中色階範圍是從藍色到紅色,藍色代表負值,表示兩SA較易 互相吸引,偏好靠近在一起;正值顯示為紅色,表示兩SA相互排斥,較不常靠近在 一起。

從圖 4-5 中,我們也能觀察到,在 V 對到 W 時,不論環境,其區塊會比較偏藍,甚 至連 P、Q、R、S、T、X、Z 這些都呈現區塊都偏藍的情況,表示這幾個 SA 之間的 交互作用分數比較好,在 SA 之間的 Cα 距離比較靠近。反之,例如 Y 對到 H、F、K、

N 都是紅色區塊,甚至當 Y 對到 E 時,還有一半是白色,表示這兩者之間接觸數量 連 1 次都沒有,兩個 SA 之間完全沒有靠近的可能,因為接觸為 0,導致沒有交互作 用分數的產生。另外觀察到 SA 中的 A、Y、B、C、D、H、E、F、Z,都有出現自己 對到自己且為環境 5 時交互作用分數都是最好的情況,分數為最低。

(42)

33

圖 4-5、23 個結構字元與 5 個環境之間的交互作用分數圖。橫軸與縱軸分別為 23 個 結構字元,結構字元的排列順序,分別為 Helix(A、Y、B、C、D)、類似 Helix(G、I、

L)、Strand(H、E、F)、類似 Strand(K、N)和其他(coil 或 loop,M、P、Q、R、S、T、

V、W、X、Z),每個結構字元有五個對應的環境,由左而右、由上而下,依序為環 境一到環境五。

(43)

34

4.6 結構字元在各環境中的接觸總數

如圖 4-6 統計接觸數之結果所示,我們分別針對五種不同的環境做了直條圖來分 析,觀察每個 SA 屬於某環境時所對應到其他 SA 屬於各種環境的接觸數量。結果發 現每個 SA 不論為哪個環境對到其他 SA 為環境 5 時的接觸數量都比較高,跟其他環 境的接觸數量相比,表示當某 SA 不論自身的連結度(環境)多少,與其他 SA 為環境 5 的接觸都是最高,因為環境 5 的連結度為 7 以上,胺基酸和 SA 都埋在蛋白質內部,

彼此之間距離較近,所以相較之下在內部的連結度比在蛋白質外部高出許多。我們能 輕易觀察到分別的 5 個環境直條圖,都是以環境 5 的接觸數量那條為最高。只有少數 的 SA 例外,如在環境 1 中可觀察到 H、E、F、K、N 和 T 對到與其他 SA 為環境 1 時的接觸數量最多,這表示 Strand 多半出現在蛋白質的表面(環境 1)。H、E、F 為環 境 4 和 5 時,與所有 SA 為環境 5 的接觸數量也很高,表示 Strand 結構在蛋白質內部 也滿常出現。而屬於 Helix 的 SA 在環境 1 時接觸數明顯很低,表示在蛋白質外部,

不太常出現 Helix 的結構。

屬於 Helix 的結構字元(AYBCD),產生接觸數量最高都分布在環境 4 和 5,以及 類似 Helix 的結構字元(GIL),接觸數量最高落在環境 2~4,表示這些二級結構為螺旋 形的 SA,幾乎都分布在蛋白質內部居多。

環境 2,3,4 在圖 4-6 裡的趨勢走向大致相似。環境 4 與 5 之間的 Helix 走向較不同,

像環境 4 的 e5 走向是先高後低的交替順序,而環境 5 是越來越高到 B 之後又越來越 低。未來可能可以朝向將環境 5 做進一步細分,原本環境 5 是以連結度 7 以上就歸類 在這組,應可以將連結度等於 7 歸類在環境 5,連結度 8 以上歸類在環境 6,或者設 計更多的環境分類來觀察看看。如此一來,或許能夠更明顯歸納出結果,來探討連結 度與接觸次數的分佈趨勢和關聯性。

(44)

35

圖 4-6、結構字元在五個環境中的接觸數量圖。各張圖的橫軸為 23 個 SA,五張圖從 上到下分別表示每個 SA 屬於五個環境的情形,縱軸表示各 SA 在該環境時對到所有 SA 的接觸數,每個圖中的 SA 都會有五條直條圖表示該 SA 與其他所有 SA 在五個環 境中分別的接觸數量。

(45)

36

第五章、結論與未來展望

本研究目前採取的方法,是計算每個蛋白質內部的胺基酸之間的距離,而且是分 鏈來進行運算,並沒有跨蛋白質來做計算。我們先計算完某蛋白質的某鏈內部胺基酸 之間的距離後,再接著計算下一個鏈。只要兩個胺基酸符合距離之條件,就累計一次 接觸。一般而言,兩胺基酸要距離比較靠近,通常出現在同個蛋白質且同個鏈內。但 亦有可能會發生同個蛋白質但不同的鏈之間,在空間中兩胺基酸距離很靠近的情形。

甚至是蛋白質交互作用的例子中,會有多個蛋白質彼此接觸,因而產生跨蛋白質的胺 基酸之間也有出現距離相近的機會。本研究未來可以朝向這個方向去改善,考慮跨鏈 或是跨蛋白質來做胺基酸之間的計算,來更進一步探討胺基酸或結構偏好產生什麼樣 的接觸習性。

另一方面,將來在計算胺基酸之間的距離時,應可排除周圍兩個鄰近的胺基酸的 接觸數。因為鄰近胺基酸大部分都會是相同二級結構,在相同結構內的相鄰胺基酸之 間,距離會明顯低於我們所設定的條件,因此會被視為是產生接觸。然而這種接觸,

只反應兩相鄰胺基酸,較無特殊意義。我們未來應該要著重在一級結構裡相隔遙遠,

但三級結構裡距離很靠近的兩胺基酸之間的接觸。若去除將鄰近胺基酸視為有接觸的 狀況,可以更明確了解在空間中,實際有哪些胺基酸是真正產生接觸且距離靠近。

在挑選蛋白質的篩選條件下,當初最小序列長度是選擇 50 的胺基酸。但是發現 有些蛋白質的基因長度和胺基酸長度並不一致,這是由於蛋白質在進行 X 光結晶繞 射實驗時,只能結晶出部分胺基酸。因此有些胺基酸沒有被結晶出來,會導致胺基酸 可能不完整,而影響統計結果。

一般來說胺基酸在遇到相同結構的胺基酸時很容易產生接觸,在二級結構同類相 對產生較高接觸數的是 helix 和 strand,而 loop 就比較少這樣的情形發生,結構字元 也是如此,每個結構字元都有其相對應的結構,只是判定結構的方式與胺基酸不同,

不過結構字元也有屬於 helix 和 strand 的字元,所以也會有相同結構的情況下接觸較

(46)

37

容易產生的傾向。

可根據距離做設定,距離設定近一些或是遠一些,進而觀察哪些胺基酸在定義較 近距離時,會出現較多接觸數的情形。我們可從中觀察,有哪些胺基酸是在設定較遠 距離的定義下才會產生較高的接觸數,甚至也許能觀察到有哪種胺基酸是不受距離限 制的影響,這些都是一些值得探討的議題。

本研究與前人研究的不同之處,當中包含了在讀取二級結構檔案時,針對二級結 構的判定,計算胺基酸之間的接觸,結構字元中的局部二級結構,以及針對環境的設 定來統計分數,運用結構字元的角度來探討蛋白質中胺基酸的接觸,最後就能直接觀 察出所屬二級結構,存在於蛋白質內部或外部,胺基酸彼此之間的接觸偏好。

未來本研究可朝向不同物種作考慮,例如透過數據分析,根據蛋白質胺基酸的交 互作用,統計細菌和人類的蛋白質,將只有細菌所擁有但人類沒有的蛋白質統計出來,

藉此探討不同物種中蛋白質胺基酸間交互作用偏好的差異,往後可藉此結果在結構生 物學之領域裡衍生其他應用。

當初只計算 20 個胺基酸之間的距離而轉換為 20 乘 20 的分數矩陣時,發現分數 記錄不夠詳細,因為沒有包含結構資訊,此矩陣不足以表達胺基酸在蛋白質中的真正 面貌。因此,採取使用結構字元的方式,將胺基酸用結構字元來定義二級結構,考慮 更多元素,使得分數分布更細膩,藉此了解胺基酸與二級結構在空間中,彼此的關係 與相互產生作用的偏好。

至於使用定義環境的概念,一方面了解胺基酸的連結度越高,表示埋在蛋白質內 部,視為疏水;連結度越低,表示暴露在蛋白質外部,視為親水。觀察使用環境定義 後所產生的 100 乘 100 矩陣,可發現哪些胺基酸喜歡作用於蛋白質外部或內部,藉由 胺基酸在環境中的傾向,了解胺基酸親水或疏水的特性。同時也能藉此了解在蛋白質 內部環境或外部環境裡,局部結構會有什麼不同的摺疊型式與彼此相互接觸的分佈傾 向。

(47)

38

參考文獻

1. de Brevern, A.G. and A.P. Joseph, Species specific amino acid sequence-protein local structure relationships: An analysis in the light of a structural alphabet. J Theor Biol, 2011. 276(1): p. 209-17.

2. Kauzmann, W., Some factors in the interpretation of protein denaturation. Adv Protein Chem, 1959. 14: p. 1-63.

3. Kellis, J.T., Jr., et al., Contribution of hydrophobic interactions to protein stability.

Nature, 1988. 333(6175): p. 784-6.

4. Nozaki, Y. and C. Tanford, The solubility of amino acids and two glycine peptides in aqueous ethanol and dioxane solutions. Establishment of a hydrophobicity scale. J Biol Chem, 1971. 246(7): p. 2211-7.

5. Jha, A.N., S. Vishveshwara, and J.R. Banavar, Amino acid interaction preferences in proteins. Protein Sci, 2010. 19(3): p. 603-26.

6. Tanaka, S. and H.A. Scheraga, Medium- and long-range interaction parameters between amino acids for predicting three-dimensional structures of proteins.

Macromolecules, 1976. 9(6): p. 945-50.

7. Robson, B. and D.J. Osguthorpe, Refined models for computer simulation of protein folding. Applications to the study of conserved secondary structure and flexible hinge points during the folding of pancreatic trypsin inhibitor. J Mol Biol, 1979.

132(1): p. 19-51.

8. Maiorov, V.N. and G.M. Crippen, Contact potential that recognizes the correct folding of globular proteins. J Mol Biol, 1992. 227(3): p. 876-88.

9. Bryant, S.H. and C.E. Lawrence, An empirical energy function for threading protein sequence through the folding motif. Proteins, 1993. 16(1): p. 92-112.

10. Bolser, D.M., et al., Residue contact-count potentials are as effective as

(48)

39

residue-residue contact-type potentials for ranking protein decoys. BMC Struct Biol, 2008. 8: p. 53.

11. Zhang, C. and S.H. Kim, Environment-dependent residue contact energies for proteins. Proc Natl Acad Sci U S A, 2000. 97(6): p. 2550-5.

12. Yang, J.M. and C.H. Tung, Protein structure database search and evolutionary classification. Nucleic Acids Res, 2006. 34(13): p. 3646-59.

13. Tung, C.H., J.W. Huang, and J.M. Yang, Kappa-alpha plot derived structural alphabet and BLOSUM-like substitution matrix for rapid search of protein structure database. Genome Biol, 2007. 8(3): p. R31.

(49)

40

附錄

測試資料蛋白質

PDBid

1A73 1CV8 1E2W 1F8E 1GJ7 1H2C 1IIB 1JHG 1K92 1L9L 1A92 1CXQ 1E4C 1F94 1GK7 1H32 1IJB 1JHJ 1KAE 1L9X 1AH7 1CY5 1E58 1F9V 1GK9 1H4X 1IJY 1JI7 1KAF 1LC0 1AHO 1CZP 1E5K 1FCQ 1GKM 1H6F 1IN4 1JID 1KGD 1LFP 1AIE 1D02 1E7L 1FD3 1GKP 1H91 1IO0 1JIW 1KHX 1LKK 1AK0 1D0C 1EAQ 1FIU 1GMU 1H99 1IOM 1JIX 1KJQ 1LLF 1ARB 1D0D 1EB6 1FK5 1GMX 1H9H 1IQ5 1JK3 1KMT 1LM5 1ATG 1D0Q 1EDM 1FM0 1GNY 1HBN 1IQZ 1JKE 1KMV 1LMI 1AYL 1D4O 1EEX 1FN9 1GO3 1HDO 1IRQ 1JL0 1KNG 1LNI 1AZO 1D5T 1EG2 1FO8 1GP0 1HFE 1ITX 1JL1 1KOE 1LQT 1B9W 1D8W 1EGW 1FOB 1GPP 1HQ1 1IUQ 1JM0 1KP6 1LS1 1BB1 1DC1 1EKQ 1FS1 1GPQ 1HTR 1IX9 1JNI 1KPT 1LU0 1BGC 1DD9 1ELK 1FSG 1GQ8 1HX0 1J0P 1JO0 1KQ6 1LUC 1BGF 1DDW 1ELU 1FT5 1GQI 1HX6 1J24 1JOS 1KQF 1LUZ 1BKR 1DFM 1ES9 1FTR 1GS9 1HXI 1J27 1JOV 1KQP 1LWB 1BM8 1DFU 1ET1 1FX2 1GSO 1HXR 1J2J 1JUH 1KQR 1LXJ 1BU8 1DG6 1EUV 1FXO 1GU2 1HYO 1J34 1JY1 1KS8 1LYQ 1BX7 1DGW 1EUW 1FYE 1GU4 1HYP 1J3A 1JY2 1KS9 1LYV 1BYI 1DJ0 1EVL 1G2Q 1GU7 1HZ4 1J3W 1JYA 1KT6 1M0K 1C1K 1DK8 1EWF 1G2R 1GUQ 1HZ6 1J77 1JYH 1KU3 1M0W 1C4Q 1DMG 1EYE 1G2Y 1GUT 1I1W 1J7X 1JZ8 1KVE 1M15 1C5E 1DOW 1EZG 1G3P 1GVJ 1I27 1J83 1K2X 1KWF 1M1F 1C7K 1DP7 1EZW 1G5A 1GVP 1I2T 1J8B 1K3X 1KYF 1M1Q 1C7S 1DPJ 1F1E 1G61 1GWE 1I4J 1J8R 1K4I 1KZF 1M22 1CC8 1DQZ 1F1M 1G6X 1GWM 1I5G 1J98 1K4N 1KZQ 1M2D 1CCW 1DS1 1F32 1G8A 1GWY 1I71 1JCD 1K5C 1L1L 1M40 1CL8 1DTD 1F3U 1G8E 1GXM 1IDP 1JEK 1K5N 1L3K 1M45 1CMC 1DWK 1F46 1G8K 1GXU 1IFR 1JET 1K6X 1L3L 1M4L 1COT 1DXG 1F60 1G8Q 1GY7 1IG0 1JFB 1K7C 1L6P 1M55 1CTF 1DY5 1F86 1GCI 1H16 1IGQ 1JH6 1K7J 1L6X 1M93

(50)

41

PDBid

1M9Z 1N71 1O6D 1P1X 1Q92 1R7J 1S99 1T7F 1UCD 1V0W 1MC2 1N7S 1O6G 1P57 1Q9U 1R8S 1S9R 1T7M 1UCR 1V2B 1MCT 1N8V 1O7I 1P5V 1QD1 1R9L 1SAU 1T8K 1UCS 1V2Z 1MF7 1N93 1O7J 1P5Z 1QDD 1R9W 1SBW 1T92 1UD9 1V33 1MFW 1N9P 1O82 1P6O 1QF8 1RA0 1SBX 1T9I 1UFI 1V4P 1MG7 1NC5 1O8B 1P90 1QG8 1RCQ 1SDI 1TA3 1UFY 1V5I 1MGQ 1NEP 1O97 1P9G 1QGE 1RDQ 1SG6 1TBF 1UGI 1V6P 1MJ4 1NF8 1OAI 1P9I 1QGI 1RFY 1SJW 1TCA 1UGX 1V6T 1MJ5 1NG6 1OCY 1PBY 1QJP 1RG8 1SLU 1TFE 1UI0 1V77 1MKK 1NJH 1OD6 1PCF 1QKR 1RGX 1SMX 1TFZ 1UIX 1V7Z 1MN8 1NKD 1ODM 1PFB 1QLW 1RJU 1SN9 1TIF 1UJ2 1V8H 1MNN 1NKG 1OEW 1PG6 1QNA 1RKI 1SQS 1TJX 1UJ8 1V96 1MOF 1NKI 1OF8 1PM4 1QNR 1ROC 1SU8 1TP6 1UKF 1VBW 1MQO 1NLQ 1OGO 1PMH 1QQF 1RTQ 1SVF 1TQG 1UNQ 1VCC 1MTP 1NLS 1OH0 1PO5 1QTX 1RTT 1SX5 1TR0 1UOY 1VD6 1MTY 1NNX 1OI0 1PP0 1QV9 1RUT 1SZ7 1TS9 1UPT 1VDK 1MUN 1NQJ 1OI2 1PQH 1QW2 1RV9 1SZH 1TT8 1US0 1VE4 1MUW 1NRJ 1OI7 1PSR 1QW9 1RW1 1SZN 1TU9 1USE 1VH4 1MVF 1NSZ 1OJH 1PV5 1QWG 1RW7 1T07 1TUA 1USM 1VH5 1MW9 1NTH 1OK0 1PX5 1QWO 1RWE 1T0B 1TUK 1UTE 1VHN 1MXE 1NTY 1OKS 1PZ4 1QWY 1RWH 1T0T 1TUO 1UTG 1VIM 1MY7 1NU0 1ONW 1PZ7 1R0R 1RWJ 1T1D 1TWD 1UUJ 1VJF 1MZ9 1NWW 1OQ1 1Q0R 1R0U 1RWR 1T1J 1TWY 1UUY 1VJU 1N08 1NWZ 1OQJ 1Q2H 1R29 1RYL 1T1U 1TXG 1UV7 1VK1 1N0W 1NXM 1ORU 1Q5Y 1R3S 1RYO 1T2D 1TXL 1UVQ 1VKE 1N0X 1NYC 1OSY 1Q5Z 1R5L 1RZH 1T3Y 1TZP 1UWC 1VKK 1N13 1NZ0 1OU8 1Q6Z 1R5M 1S1D 1T61 1U07 1UWK 1VL7 1N3L 1NZJ 1OW1 1Q7D 1R6J 1S29 1T6F 1U60 1UY4 1VLA 1N4W 1O06 1OW4 1Q7L 1R6X 1S3C 1T6U 1U7L 1UZ3 1VLY 1N62 1O66 1P1M 1Q8D 1R77 1S7I 1T79 1U84 1V05 1VMB

(51)

42

PDBid

1VMG 1WD3 1WZD 1XUB 1YOD 1ZK5 2AHF 2BHU 2C71 2CVE 1VPB 1WDD 1X0T 1XV5 1YPQ 1ZKE 2AIB 2BIV 2C78 2CVI 1VPR 1WER 1X1K 1XW3 1YPY 1ZL0 2AJ7 2BJF 2C7P 2CWR 1VPT 1WFB 1X1N 1XYI 1YQH 1ZLD 2AKF 2BJI 2C92 2CWS 1VQS 1WHI 1X54 1Y0K 1YQS 1ZMI 2AMJ 2BJQ 2C95 2CX7 1VSR 1WHZ 1X6I 1Y43 1YRK 1ZMM 2APJ 2BJV 2CAR 2CXA 1VTZ 1WLG 1X6O 1Y66 1YTL 1ZPS 2ASB 2BKX 2CB8 2CXH 1VYI 1WLZ 1X6Z 1Y6X 1YTV 1ZS4 2ASK 2BKY 2CBZ 2CXN 1VYK 1WMH 1X8Q 1Y7T 1YU0 1ZS9 2AXC 2BL0 2CC6 2CXY 1VYR 1WN2 1X91 1Y8A 1YX1 1ZT3 2AXO 2BL8 2CCM 2CYJ 1VZM 1WNA 1X9I 1Y9I 1Z0P 1ZV1 2AXW 2BLN 2CCQ 2CZL 1W0H 1WNY 1XAK 1Y9L 1Z0W 1ZVA 2AYD 2BMO 2CCV 2CZS 1W0N 1WOL 1XAU 1YB3 1Z2N 1ZVZ 2B0A 2BN3 2CCW 2D1S 1W1O 1WOU 1XBI 1YBK 1Z2U 1ZY7 2B0T 2BO9 2CE2 2D3D 1W23 1WPA 1XCR 1YCD 1Z3E 1ZZ1 2B1Y 2BOG 2CG7 2D3G 1W2F 1WPN 1XD3 1YD0 1Z3X 1ZZK 2B3G 2BOP 2CHH 2D48 1W2W 1WPU 1XDN 1YDI 1Z67 256B 2B4H 2BRF 2CI1 2D4P 1W2Y 1WRD 1XE7 1YE8 1Z6M 2A14 2B61 2BS2 2CIO 2D5B 1W4S 1WS8 1XFF 1YFN 1Z70 2A26 2B82 2BT9 2CIU 2D5M 1W53 1WT6 1XG0 1YFQ 1Z72 2A40 2B8I 2BU3 2CIW 2D5W 1W5Q 1WTJ 1XJU 1YGT 1Z96 2A50 2B97 2BWF 2CJS 2D68 1W5R 1WU9 1XKR 1YI9 1Z9L 2A65 2BA2 2BZ1 2CKK 2D7C 1W66 1WUB 1XMK 1YJ7 1ZCE 2A6S 2BAY 2C0G 2CMP 2D80 1W6S 1WUI 1XMT 1YKI 1ZD0 2A6Z 2BBA 2C0H 2CNQ 2D8D 1W96 1WV3 1XOD 1YLE 1ZGK 2A9I 2BBR 2C1V 2CNZ 2DBN 1W99 1WVF 1XQO 1YLL 1ZHS 2A9S 2BCM 2C2U 2CO3 2DBQ 1WB4 1WVQ 1XSV 1YLX 1ZHV 2ABS 2BDR 2C3V 2COV 2DBY 1WBH 1WWI 1XSZ 1YMT 1ZHX 2ACF 2BF6 2C4J 2CPG 2DC4 1WC2 1WY3 1XT5 1YN3 1ZI8 2AEB 2BF9 2C60 2CS7 2DDR 1WCW 1WZ3 1XTT 1YOC 1ZJC 2AG4 2BFD 2C61 2CU3 2DDX

參考文獻

相關文件

Microphone and 600 ohm line conduits shall be mechanically and electrically connected to receptacle boxes and electrically grounded to the audio system ground point.. Lines in

Forming the initial ideas as the base of the composition activity, as well as the fundamental

This database includes antigen’s PDB_ID, all sites (include interaction and non-interaction) of a nine amino acid sequence of primary structure and secondary structure.. After

Therefore, the focus of this research is to study the market structure of the tire companies in Taiwan rubber industry, discuss the issues of manufacturing, marketing and

Therefore, this study based on GIS analysis of road network, such as: Nearest Neighbor Method, Farthest Insertion Method, Sweep Algorithm, Simulated Annealing

Zhang, “A flexible new technique for camera calibration,” IEEE Tran- scations on Pattern Analysis and Machine Intelligence,

Bitter plants with higher amino acid has a bitter taste in the more than 30 kinds of amino acids there are 20 types of amino acids contained in bitter gourd contains glutamic

And, it is irrelevant in long direction; (2) the greater bearing area improves the LCM strength in both directions; (3) the greater Frame retaining wall height, the greater