• 沒有找到結果。

B 細胞表頂或稱為抗原決定位(b-cell epitopes or antigenic determinants ),其定義為一 抗原分子上的某個區域可以被免疫球蛋白(immunoglobulin)上的結合位所辨識稱之。此 蛋白上的表頂分通常劃分為連續(continuous)或不連續的(discontinuous),主要取決於是否 列入表頂的胺基酸序列是連續的鏈或非連續的(圖 2)。研究指出大部份的 B 細胞抗原決 定位為非線性的[14],但是對於疫苗的研究以及免疫診斷的應用方面,針對連續性的 B 細胞抗原決定位研究是值得關注的方向。近年來,由於生物資訊免疫學的蓬勃發展已經 發展出許多可應用的預測工具,在線性 B 細胞抗原決定位預測方面[15-16]。

圖 2 為抗體結合至表頂與 B 細胞表頂類型示意圖[17]

註:a.為不連續型表頂、b.為連續型表頂

接下來針對我們欲研究的對象—口蹄疫病病毒,其生化背景做一個簡單探討。口蹄 疫病毒是屬於小病毒科(Picronaviridiae)中的鵝口瘡病毒(Aphthovirus),其為一種無 封套(non-envelop)的病毒,其結構為二十面體對稱(icosahedral symmetry)結構直徑 約25nm;外面由結構上的衣殼(capsid)包覆著其基因體,其基因體由單股正股的RNA 所組成,約有8500個鹼基,可直接作為mRNA轉譯成蛋白質。病毒的開放式閱讀框架(open reading framework,ORF)編碼一個大的單鏈聚合蛋白(single-chain polyprotein),該聚合蛋 白在轉譯過程中被不斷裂解產生病毒的結構性蛋白(structural protein, SP)包括1A、1B、

1C和1D和非結構性蛋白(non-structural protein,NSP)包括2A、2B、2C、3A、3B、3C、

4

3D等,所以實際上並不存在一個完整的聚合蛋白,所以ORF可分為L、P1、P2、P3 四 個區(如圖3)。

圖3 (a)口蹄疫病毒在單一細胞之生活史 (b) 口蹄疫病毒蛋白質體組成[18]

L區編碼LB和LaB兩種重疊的非結構性蛋白,這兩種蛋白是從2個不同的功能性起始 密碼子轉譯而成的;LB和LaB催化自身從單鏈聚合蛋白上裂解下來,並裂解宿主細胞 eIF24F和eIF24G,而阻止宿主細胞蛋白質合成,其中eIF24F是cap結合蛋白複合體中的成 分,是宿主細胞蛋白質轉譯過程中所必需的起始因子。L區為病毒複製的非必需區,缺 失L區的突變株仍能在宿主細胞內複製。

P1區依次編碼VP4(1A)、VP2(1B)、VP3(1C)和VP1(1D)四種結構性蛋白,最後組裝 成病毒的衣殼蛋白。口蹄疫病毒的結構性蛋白(SP)組成的衣殼由60個複本組成,每個 複本由四個蛋白質所組裝而成,分別為VP1(1D)、VP2(1B)、VP3(1C)、VP4(1A)組成一 蛋白質次單元(protomer),其為構成蛋白質衣殼的最小單位,而蛋白質次單元再組成衣 殼蛋白亞單位(capsomere)進而組裝成蛋白質衣殼(capsid)。而VP1(1D)、VP2(1B)、

VP3(1C)在病毒顆粒表面組成八股的β-Barrels結構,而VP4(1A)則在內部(如圖4)。

5

圖4 口蹄疫病毒的protomer及β-Barrels結構單元[19]

P2區依次編碼2A、2B、2C三種非結構性蛋白,2A為一16個胺基酸所組成的多肽,

能夠自我催化P1-2A與2C解離,且從胺基酸序列分析推估2A可能是一種Tyr-Gly特異性的 蛋白酶(protease)。2B和2C的功能尚不清楚,2C可能與RNA的複製有關,2B可能與病毒 的感染有關。(雖然2A屬於P2區,但是有證據顯示其先形成P1-2A前驅物後再由3C所轉 譯的蛋白酶將之裂解開)。

P3區編碼4種非結構性蛋白分別為3A、3B、3C和3D。3A被認為是小RNA病毒複製 複合體與膜架構結合的錨定蛋白,與病毒誘導的細胞病理效應和阻斷細胞內蛋白的分泌 有關。3A似乎與FMDV的致病性有密切的關係,不同血清型FMDV之3A編碼區的改變或 缺失均會減弱其致病性。3B蛋白是由編碼區3個串聯重複的非等同的基因編碼,因而可 以產生3種不同的3B蛋白(VPg)。VPg基因的複本數與RNA病毒的感染力有關。攜帶有 pUpU架構的VPg蛋白可以與3′端的poly(A)結合作為病毒RNA合成時的引導蛋白,這種特 殊的RNA複製模式與宿主mRNA轉錄不同,因而在宿主RNA合成受到抑制時,並不影響 病毒RNA的合成。3C蛋白為Gln-Gly特異的蛋白酶,催化大部分聚蛋白的裂解;3C也參 與組蛋白H3的裂解,可能對宿主細胞的基因轉錄有抑制的作用。3D為RNA倚賴的RNA 聚合酶(RNA polymerase),又稱病毒感染相關抗原(VIAA)催化病毒RNA的合成。病毒 RNA就以VPg為引導物,以3D為RNA聚合酶,以3A、2B、2C及一些宿主蛋白形成複製 複合體,附著於胞質內的膜架構上合成負鏈RNA,再以負鏈RNA為模板合成正鏈RNA,

新合成的正鏈RNA包被完整的衣殼即成為一個完整的病毒顆粒[20]。

基於上述分子生物學方面的研究,蛋白質衣殼由四個部分VP4(1A)、VP2(1B)、

VP3(1C)及VP1(1D)組成,由文獻可以得知對於定義出口蹄疫抗原決定位主要的研究在其 結構蛋白方面,利用抗體定義出具保護能力的B細胞抗原表頂,現今已經有許多相關的 研究定義出許多此病原體上保護性抗原決定位,例如:在結構上GH loop、BC loop、EF loop、C β-sheet、H β-sheet 等VP1上二級結構上[21-22]。其次,有必要提高診斷能力,

對於感染動物及免疫動物的辨別上,因此近來也針對非結構蛋白部位單株抗體辨識抗原

6

表頂的辨識上用來幫助檢測感染與否[23]。

表 1 為相關研究中1不同血清型所定義出來的抗原決定位

O A C Asia 1

G-H loop (RGD) VP1 133-160

G-H loop (RGD) VP1 133-160

G-H loop (RGD) VP1 133-160

G-H loop (RGD) VP1 133-160 VP1 C terminus

VP1 198-213

VP1 C terminus VP1 198-213

VP1 C terminus VP1 198-213 5 fold axis

B-C loop VP1 43-48

H-I loop around VP1 170 G-H loop (RGD)

VP1 135~167 B-C loop

VP2 131-134 3 fold axis B-B "knob"

VP3 56-61

B-B "knob"

VP3 56-61

B-B "knob"

VP3 56-61

B-B "knob"

VP3 56-61 C terminus VP3 56-61 註:表表示不同血清型(O、A、C 及 Asia1)其實實驗中被定義出的 B 細胞表頂,如:G-H loop 表示其結構上的名稱,VP1 表示其在蛋白質體上的部位,133-160 則是序列的位置 在 VP1 上。

7

1.3 研究目標定義

當動物的免疫系統遭遇到一個新的抗原時,免疫系統會針對抗原上的抗原決定位 (epitope)的數目,產生許多相對應的抗體。動物抗體被誘發後,可藉由採血後經由被誘 導免疫動物之血清(serum)部分純化後獲得,亦即所謂的抗血清(antiserum),此抗血清為 多株抗體(polyclonal antibodies),在許多免疫方面的研究,利用此抗血清來當作決定抗原 決定位的位置以及抗原上是否有抗體能辨識的位置。一般來說可以被此靠血清所辨識的 片段,我們可以合理地認為其具有抗原性(antigenicity),但是是否具有能真正誘導欲免 疫動物產生免疫原性(Immunogenicity)則是需要更進一步的動物實驗來認定。

圖 5 為 B 細胞表頂映射概念[24]

圖 5 為利用圖表式描繪抗血清定義出病原上抗原決定位實驗,宿主暴露在某受質下 產生抗體由 B 細胞,此受質即為免疫原(immunogen),此受質被抗體體辨識可被當做一 抗原,當抗原或免疫原被抗體特異性地辨識出來此位置為表頂。我們的題目為使用此經 由表頂映射實驗所定義出來的實驗數據,找出此類型資料的物化特性來達到預測的效 果。

1.4 研究目標

我們的目標是利用相關研究所建立的知識下,使用病原體(FMDV)相關B細胞抗原表 頂免疫資訊,結合機械學習的方式,建立口蹄疫病毒的免疫模型來改善預測的準確度在 此B細胞抗原表頂的子群當中。為了達到上述的目標必須從病原體資訊中萃取重要的特 徵及降低特徵的維度達到減小有害的訊息及冗贅及不恰當的特徵,此需要針對不同次分 類資料庫中,擷取出免疫相關重要資訊並使用此資訊來幫助免疫問題的研究。

我們必須瞭解我們所面對及欲解決的問題-即預測 FMDV 線性的抗原決定位自免疫

8

由此,在此我們使用物化特性(physicochemical properties)當做我們的特徵向量,我們 轉換訓練序列成特徵空間基於物化特性的指標,並結合特徵選取(feature selection)的方式

9

圖 6 FMDV 免疫計算的系統建構概念圖

10

二、計算上相關研究

2.1 資料庫

最初在 B 細胞表頂的的研究及預測基於研究 B 型肝炎表面抗原(hepatitis B surface antigen)、流感血凝素(influenza hemagglutinins)、雞痘病毒的血凝素(fowl plague virus hemagglutinin)、人類組織相容複合體抗原(human histocompatiBility antigen HLA-B7)、人 類干擾素(human interferons)、大腸桿菌(Escherichia coli)、霍亂腸毒素(cholera

enterotoxins)、豚草過敏原(ragweed allergens Ra3 and Ra5)及鏈球菌(streptococcal M protein),針對抗原胺基酸組成物化性質[26]。其後,發展了許多資料庫用來研究線性 B 細胞表頂的研究,在此我們介紹兩個主要用來發展線性 B 細胞表頂預測的資料庫。

Bcipep:

Bcipep 被建立用於發展線性 B 細胞表頂相關研究,Bcipep 是一個資料庫使用實驗的 方式來測定線性 B 細胞表頂,包含免疫原性資料收集自不同文獻和其他公開資料庫中 而來,此資料庫提供的有關單抗與多抗的抗體所產生的表位資料。其包含的 2479 個項 目,每個項目包含胺基酸序列來源蛋白病原體分類免疫原性、中和性、實驗方法、模式 生物、資料參考來源、抗體抗原結構等,並且涵蓋了範圍廣泛的病原微生物如病毒,細 菌,原生動物和真菌[27]。此資料庫建立於 2005 年,其後許多B 細胞表頂預測研究接 使用此資料並用不同的機械學習型是建立模型。

IEDB:

IEDB (Immune Epitope DataBase, http://www.immuneepitope.org)此資料庫是由美國 LIAI 研究所(La Jolla Institute for Allergy and Immunology)協同其他學術研究機構共同合作,動 員數十名研究人員,花費數年時間閱讀文獻蒐集、整理建製而成,為目前世界上資料量 最豐富的抗原決定位資料庫,此外其會定期更新資料內容[28]。

2.2 研究方法

最初企圖預測B細胞抗原決定位研究建立在由相關實驗結果所得到物理化學特性 (physicochemical properties)的分析上,其使用性質尺度的方法(propensity scale method),

將序列轉換為性質尺度值來衡量每個胺基酸的傾向,為了減少結果的波動,每個目標胺 基酸序列在在滑動窗口(sliding window)計算平均性質傾向的胺基酸值,然後給予滑動窗 口的中心目標的胺基酸殘基此性質尺度分數的值,以此為基礎預測是否給予胺基酸殘基 序列可能是線性B細胞表頂(如圖7)。

11

圖7 表示使用性質指標預測的概念

第一個傾向規模預測方法線性B細胞表頂是由Hopp及Woods利用Levitt所提出的親水性 性質尺度(hydrophilicity propensity)分配的傾向值給予每個胺基酸[26]。這種方法是基於 假設抗原決定位對應的蛋白質序列通常含有大量的帶電荷性和極性以及親水性殘基。其 後,其他幾個傾向量表陸續被提出對於預測線性B細胞表頂,包括:親水性、易曲性、

轉位、以及溶液的可接近性質[29-32]。之後,PREDITOP、PEOPLEE、PITOPE及BcePred 預測線性B細胞表頂基於組合多項物理化學性質指標,而不是依賴個別性質指標的方式 [33-35]。(如圖8)

圖8 為BcePred server提供圖型化的輸出結果

註:圖縱座標表示其性質指標給的性質數值,橫坐標表示在抗原上的胺基酸位置

註:圖縱座標表示其性質指標給的性質數值,橫坐標表示在抗原上的胺基酸位置

相關文件