成大研發快訊 - 文摘
成大研發快訊 第九卷 第七期 - 2009年七月十日
[ http://research.ncku.edu.tw/re/articles/c/20090710/2.html ]
以數據探勘方法搜尋液相層析質譜圖譜中的磷酸化胜肽 訊號用來鑑定磷酸化蛋白質結構
吳欣怡1、曾新穆2、廖寶琦1,*
1國立成功大學環境醫學研究所
2國立成功大學資訊工程研究所 [email protected]
Journal of Proteome Research, 2007, 6, 1812-1821
蛋白質磷酸化(protein phosphorylation)是ㄧ個重要的後轉譯修飾
(posttranslational modification)與生理機制息息相關,雖然許多的分析策略被 陸續提出,但是磷酸化蛋白質上磷酸基的確實位置的鑑定仍然是極富挑戰。固 定金屬離子親和層析(Immobilized metal ion affinity chromatography, IMAC) 或是二氧化鈦(TiO2)微管柱等磷酸化蛋白質的富集技術常被使用,然而常見的 干擾是大量非磷酸化蛋白質也會同時被單離出來。本實驗室先前的研究曾經使 用去磷酸脢處理磷酸化胜肽,後續的磷酸化胜肽的鑑定或定序部份就可以專注 在去磷酸脢處理前後有特定質量位移的質譜訊號上,但是液相層析質譜儀(LC- ESI-MS)分析通常會產生數以百計的質譜圖,以手動積分來辨識有質量位移的
質譜訊號是非常耗時耗力的,如果使用適當的數據分析程式來處理質譜數據,就可以從大量的數據挑選出 特定有價值的訊號來進一步處理。本篇論文提出一個以數據探勘方法搜尋液相層析質譜圖譜中的磷酸化胜 肽訊號用來鑑定磷酸化蛋白質結構,使用方法包括去磷酸化處理、用四極柱/飛行時間質譜儀(quadrupole/
time-of-flight mass spectrometer)做精確質量測量、及一個數據分析程式用來辨識LC-MS質譜圖中在去磷 酸化處理前後出現質量變化訊號(圖一)。去磷酸脢可以除去磷酸化胜肽上的磷酸基,而造成處理前後的胜 肽出現質量改變,每ㄧ個磷酸基將會造成大約-80 Da (HPO3=79.966 Da)的質量改變,若胜肽鏈含有數個 磷酸基則會出現-80倍數的質量改變(-80 x n Da, n 為磷酸基的數量)。我們自行撰寫了一個程式叫做 DeltaFinder來進行複雜的質譜數據處理,並且鑑別哪些訊號可能來自磷酸化胜肽。圖二顯示DeltaFinder 程式的運作步驟,包括去同位素、計算原始質量及計算質量差。去同位素步驟包括同位素群及帶電荷狀態 (z)之鑑別,待所有的zi值都得到後,胜肽片的質量可以經由公式M = morzi − zi得到,每ㄧ個從未經去磷酸 脢處理的樣本的LC-MS 數據計算而來的Mi值,都會伴隨有另ㄧ組Mj值是從有去磷酸脢處理的樣本計算而 來的。如果Mi與Mj之間的關係符合 | Mi − Mj − 79.966 n | ≤ k, n=1, 2, 3,…, 則Mi與Mj值都會被輸入至 Delta Mass Table,再經由DeltaFinder處理過後,可能來自磷酸化胜肽的訊號都會自複雜的LC-MS數據中 被挑出來。
1 of 4
成大研發快訊 - 文摘
圖一: 分析流程。從蛋白質消化得來的含磷胜肽在由TiO2微管柱豐富化後,經由LC-MS分析 (Mi, TiO2豐富 化的含磷胜肽質量) 或在LC-MS分析前經由去磷酸基酶alkaline phosphatase處理過 (Mj, alkaline
phosphatase處理過的含磷胜肽質量)。DeltaFinder 程式是用來輸出質譜訊號對,其滿足Mi = Mj + (80 x n), n = 1, 2, 3...的條件。
為了證明此樣品處理及數據分析方法之實用性,我 們用α及β乳蛋白的混合物當作標準品,比較利用傳 統數據參考模式(data-dependent) LC-MS/MS所鑑 定得來之磷酸化胜肽及與用本篇論文所提出之方法 所鑑定得來之磷酸化胜肽數量作比較,來進一步說 明此樣品處理及數據分析方法。從500ng乳蛋白混 合物水解產物經由nano-HPLC-MS (QSTAR)分析所 得的數據中顯示,共有256個胜肽質量被
DeltaFinder鑑別出來(圖三A)。經由二氧化鈦富集 的樣本,在DeltaFinder分析後,61個胜肽含有磷酸 基及許多不含磷酸基的胜肽被檢測出來(圖三B),經 由去磷酸基酶處理的樣本則有93個胜肽含有磷酸基 被檢測出來(圖三C),最後程式可以產生10個潛在的
2 of 4
成大研發快訊 - 文摘
圖二: 解釋DeltaFinder 程式運算法則的流程圖。經由 商業軟體MES輸出的LC-MS數據,輸入至
DeltaFinder,經過去同位素及質量計算,輸出的質 量清單為符合(80 x n) 質量改變。
含磷酸基胜肽的訊號(Figure 3D).
我們同時也利用本方法進行鼻咽癌
(nasopharyngeal carcinoma)細胞株磷酸化蛋白質 體之研究。從鼻咽癌細胞株(NPC-TW02)全細胞打 碎後,再離心後取出之蛋白質沉澱物,將此蛋白質 沉澱物水解在經過二氧化鈦微管柱分離後,ㄧ半的 樣品直接注入nano-HPLC-LCQ質譜儀分析,利用 data-dependent模式分析所得的圖譜再經由 MASCOT搜尋,只鑑別到3個磷酸化蛋白質其中包 括9個磷酸化胜肽,其離子分數分佈情形顯示於圖 四A。將另ㄧ半的樣品使用本文提議之分析程序,
則鑑別出27個磷酸化蛋白質其中包括109個磷酸化 胜肽和221個被磷酸化的位置,圖四B顯示被鑑別到 的磷酸化胜肽的離子分數。經由我們的方法分析的
樣本,不僅磷酸化蛋白質及磷酸化胜肽的數量比較多,其相對的分數亦較高。
3 of 4
成大研發快訊 - 文摘
圖三: LCMS 數據 (A) α-and β-casein 混合物經由trypsin消化;(B) 經過TiO2微管柱豐富化處理過的樣本;
(C) 再經過alkaline phosphatase處理過的樣本; (D) 被DeltaFinder 程式挑選出來的含磷胜肽。
圖四: 使用DeltaFinder 程式提高了自NPC細胞檢測到 的含磷胜肽。(A) 如果只使用MS/MS實驗,只檢測到 9個含磷胜肽;(B) 使用DeltaFinder 程式之後檢測到 109個含磷胜肽。
我們認為我們的分析程序並無選擇偏差(selection bias),因為我們是自大量的質譜訊號中經過過濾而 篩選出去磷酸化反應前後樣本中出現質量變化的訊 號,與常用的中性脫失掃描(neutral loss scan)實驗 相比,我們提出的分析程序並無不利於tyrosine 磷 酸化胜肽的選擇偏差。我們鑑定到的221個被磷酸 化的位置中,168個(76%)發生在胺基酸serine上,
35個(16%)發生在胺基酸threonine上,以及18個 (8%)發生在胺基酸tyrosine上,被磷酸化的位置發 生在tyrosine上的比例明顯的高出其他研究,我們 猜測主要的原因是phosphotyrosine胜肽在質譜分析 上的訊號強度很低所致。根據我們自己的MS 及 MS/MS圖譜發現,18個在tyrosine上被磷酸化的胜 肽僅有2個的訊號強度出現在全掃瞄質譜圖中的前5 名,如果再配合使用去磷酸化反應同時偵測比較去 磷酸化反應後在LC-MS圖譜上的質量變化,其餘的 16個訊號則可以被偵測到並且可進行後續的LC- MS/MS定序分析,因此我們認為我們提出的分析程 序並無不利於tyrosine 磷酸化胜肽的選擇偏差。
我們的結果顯示利用數據探勘方法在搜尋複雜的液 相層析質譜圖譜中的磷酸化胜肽訊號之價值。
參考文獻
1.吳欣怡;廖寶琦,長庚醫誌 2008, 31, 217-227.
2.Holmes, M.R.; Giddings, M.C. Anal. Chem. 2004, 76, 276-282.
4 of 4