• 沒有找到結果。

第一章 緒論

1.4 研究目的

藉由肝癌細胞的蛋白質體的研究,整合蛋白質資料與肝癌病患,透過生物資訊技術的協 助,建立肝癌病患資料、診斷資料及肝癌的蛋白質體資料web-based 資訊管理系統,協 助生物學家管理複雜的蛋白質資料與肝癌病患診斷資料。透過瀏覽器可操作及存取相關 資訊。

一、建立實驗室資訊管理系統:

建立web-based 的實驗室資訊管理系統,管理蛋白質體實驗的不同軟體的分析結果,並 整合肝癌病患的診斷資料,蛋白質體實驗各項參數資料如藥品配方、材料規格、處理方 法,並將資料儲存至資料庫中,使用者透過瀏覽器與管理系統互動,存取系統上資料,

並可由系統提供的連結功能,讀取公用資訊庫上更詳細的註解資訊。資料納入電子資料

二、提供醫療與生物構面的資料探索:

系統整合醫療診斷及蛋白質體資料,研究者可從肝癌分期、發生部位、生化檢驗的異常 現象等診斷條件,檢視符合這些條件的肝癌蛋白質體資料的特性。亦可從蛋白質的特性 如蛋白質名稱或存取編號檢視符號這些蛋白質條件的病患診斷資料。結合臨床診斷觀察 及蛋白質體資料,資料分析功能協助發現癌症早期診斷的標識。

三、開發方便的資料管理整合及連結系統:

針對臨床資料及實驗室的現有影像軟體(PD Quest)設計一整合系統,並提供 Comma Separate Value(CSV)檔案格式作為開放式的資料匯入的格式、web-based 資料輸入介面,

使用者藉由圖形介面(Graphic User Interface)的步驟線上完成各項資料輸入。藉由上述二 種資料輸入選擇。相容於更多的蛋白質體實驗室的資料管理需求。

第二章 文獻探討

資訊科技的應用無疑是人類基因體計畫成功的重要因素之一,藉由電腦系統的強大運算 能力,協助序列分析,人類基因體計畫才能提前完成。但生物學家們對基因的運作、基 因產物蛋白質的功能、生物的各項功能以及疾病與基因的關係,仍然未解。藉由蛋白質 體研究探討各項基因功能,蛋白質體實驗所產生的大量數據,更需借重生物資訊對蛋白 質資料處理分析,提供研究者對於生物的各種現象更深的瞭解,結合蛋白質體學 (Proteomics)與生物資訊學(Bioinformatics)探討生物的各項功能已成為後基因體時代生 命研究的重要的模式[Vihinen,2001]。

在後基因體時代的生命科學研究,各實驗室在高效率技術(High through-put)協助下所產 生的大量數據,因實驗數據快速增加,各項的研究對於生物資訊將更加倚重。這些數據 如何透過生物資訊的協助,與傳統的生物學理論相結合,組織成有系統的知識,清楚的 說明生命的過程[Kanehisa and Bork,2003]。面臨新實驗方法及大量數據的特性,各實 驗室開始自行發展實驗室資訊系統,從內部資料管理、整合網路上的公用資源、資料分 析、從文獻上自動摘錄出相關的資料、及知識管理系統的建立,提供生物學者對生命科 學有更深一層的瞭解,不再是如同生物資訊發展早期只是一個單純的序列管理工具或資 料的提供者[Stein,2003]。發展更靈敏的蛋白質體研究方法與蛋白質體的生物資訊,對 於蛋白質體的發展有同樣的重要。下列就蛋白質體與生物資訊的整合技術應用於醫學加 以說明。

2.1 建置蛋白質體資訊系統

目前已有實驗室將其蛋白質體的研究結果儲存於資料庫中,使用者可透過網頁取得研究 結果,對於相關領域的研究提供了相當方便的資料參考來源。

Celis 等人 (1999)將膀胱癌的病理切片與正常組織相比對的蛋白質體研究結果,透過網 站(http://biobase.dk/cgi-bin/celis)的公布其研究結果,其研究重點為從病理切片中比對出 的蛋白質點,其資訊提供主要為這些蛋白質點的資訊及其他公用資料庫如 Swiss Prot、

Omin、PROSITE 對此蛋白質的註解連結,研究者無法得知蛋白質以外的資訊,如原始的 gel 的影像或病患的相關資料。其網站的目的提供其他研究者可經由網路快速取得資 訊。但系統所提供的查詢的功能如關鍵字或蛋白質名稱查詢都需相當熟悉其研究結果,

否則無法由適當的詞彙而得到正確的查詢,但所提供的影像局部放大檢視提供研究者相 當方便的二維膠片影像檢視。

Hill 等人(2003)開發 UAB Proteomics database 作為蛋白質體研究結果的資料庫,儲存二 維電泳影像及蛋白質訊息,提供實驗室蛋白質體資料管理。使用者可藉由樣品代碼 (sample id)、蛋白質名稱(protein name)、樣品來源( source) (如組織、細胞系)、理論 (theoretical molecular mass)及實際(apparent molecular mass)的分子量及理論(theoretical isoelectric point)及測量(measured isoelectric point)的等電點、蛋白質點編號(gel spot number)、實驗室操作者(investigator)、部門(department)。可由這些資料屬性中的單項或 多項組合查詢所需資料。系統設計藉由前端的web-interface 介面、後端的關聯性資料庫 及Java servlet 為動態網頁的開發,存取實驗室內的蛋白質的研究資料及連結至 NCBI 及

Hill 等人 所開發的系統,提供了相當完整的蛋白質體實驗資訊,從 gel 影像及影像中的 所探討的蛋白質,及蛋白質理論及實際的分子量,理論及測量的等電點,資料的查詢包 含樣品代碼、實驗室操作者、部門資料查詢方式。對於實驗室內部的資料管理及資料分 享提供更方便的操作方式,本系統的目的主要在於改善實驗室的資料的管理及無紙化。

Liang 等 人 (2002) 透 過 HCC-M 細 胞 比 對 的 蛋 白 質 體 研 究 結 果 , 透 過 網 站 (http://proteome.btc.nus.edu.sg/hccm/)的公布其研究結果,其研究重點為 HCC-M 細胞株比 對出的蛋白質點,並提供這些蛋白質點的實驗資訊如理論及實驗的分子量及 Pi 值,其 網站的目的提供其他肝癌研究者可經由網路快速取得資訊。系統所提供的查詢的功能如 蛋白質存取編碼(Access No)、蛋白質名稱查詢,相較於 Celis 的膀胱癌蛋白質體資料庫 因採用標準的命名(蛋白質存取編碼 Access No)較方便的查詢。

Cho 等人(2002)同時發展實驗室內部的蛋白質體資料管理系統與資料分析發現診斷生 物標記(biomarker),協助肝癌的早期診斷。YPRC-PDB 系統:

1. 蛋白質體資料方面:從樣品來源、日期、操作者、一維電泳及二維電泳影像及各 蛋白質點的各項資料(座標、濃度、範圍)。

2. 病患資料:基本資料的年齡、性別,症狀描述、家族病史、各項肝功能、手術前 治療及手術後的癒後觀查。

系統的目的除提供蛋白質體研究的資料管理功能外,因整合醫療診斷資料由資料探勘工 具分析特殊蛋白質的變化與肝癌診斷資料關連。發現肝癌的蛋白質標記協助早期治療。

2.2 蛋白質體在醫學上的應用

蛋白質體學廣泛應用於人類疾病的研究,由分子層次探討疾病特性。對疾病生理及預後 的變化提供系統性的研究,改善疾病的診斷及治療。如癌症的早期診斷,藉由血清的蛋 白質的特殊表現型態(expression pattern)及生物資訊的資料分析,目前已可應用於卵巢、

前列腺、乳癌、胰臟、膀胱癌症的篩檢[Sanchez et al,2004],未來還可發展為大規模人 口篩檢工具。蛋白質體研究來對比對正常、病變、老化細胞間的差異,加速醫療診斷、

治療的發展,新藥的開發。

一、診斷:

目前大部分的診斷仍藉由人體細胞中的單一蛋白質的偵測及定量分析。這些檢驗技術的 發展,大都從疾病的診斷或復發率與測量蛋白質的變化相互關係的觀察所獲得的經驗。

一般而言這些檢測值的預測性都相當低,無法作為診斷的主要依據,在臨床上通常需輔 助其他程序協助診斷。如癌症中的診斷通常需病理切片輔助。蛋白質體研究中,蛋白質 表現模式(expression pattern)相較於傳統的單一蛋白質檢驗,可提供更多與生物及臨床相 關的有用資訊。如目前已可從胰液、尿液或血清中生物標記(biomarker),正確地篩檢出 癌症與非癌症患者如卵巢癌、膀胱癌。未來還可發展成為特殊疾病的大量篩檢方法,提 昇早期及正確的診斷[Sanchez et al,2004]、[Wasinger and Corthals,2002]。

二、癒後觀察

癒後的發展,可視為疾病期間的不同時期的診斷,及對疾病的處置治療方式提供驗證上 的觀察。癒後的過程會因不同的治療而不同,對疾病的治療研究是很重要的資訊。傳統 的癒後觀察主要是針對病患的病變組織或器官,而蛋白質體的研究能提供更深一層的分

未來如能連結病患的病歷資料,在癒後的研究、治療、個人醫療(individual)發展有很大 的幫助[Sanchez et al,2004]

三、協助醫療的整體發展

醫療的執行應用大概可分為五項要素:診斷(diagnosis)、癒後發展(prognosis)、治療 (therapy)、預防(prevention)、疾病的預測(prediction of diseases)。在醫療的應用這些要素 彼此相互關連,如正確的診斷才能提供適當的治療,能早期的疾病預測才能擬定預防措 施。

疾 病 的 發 生 大 概 可 分 為 五 項 原 因 : 基 因(genetic) 、 傳 染 (infectious) 、 環 境 因 子 (environmental)、細胞凋零(apoptosis)、老化(aging)五項因素[Sanchez et al,2004]。引起 疾病的原因通常包含一個以上的因子(如圖 2-1)。人類基因體計畫雖可協助診斷因基因缺 陷所造成的疾病,但大部分的疾病由環境所造成,無法單由基因檢測得知真正病因,通 常需由基因體學、蛋白質體學及代謝的研究才能真正得知病因。如類澱粉沈著症 (amyloidosis):經基因檢測屬於慢性的肺結核(tuberculosis)的高危險群(predisposition),

加上營養及衛生不佳的落後地區環境,則有可能因 β2-microglobulin 的累積發展成類澱 粉沈著症(amyloidosis)。蛋白質體學的研究對疾病的原因探討能從基因擴充至環境因素 的 影 響 , 對 疾 病 能 有 更 正 確 的 瞭 解 , 同 時 蛋 白 質 體 亦 可 應 用 於 診 斷 、 癒 後 發 展 (prognosis)、治療(therapy)。對於醫療要素與五項疾病成因及相互關係,提供很重要的研 究工具,加速未來醫療的整體發展。

Genetic Predisposition

Infection

Time

Environmental influences

Storage handling and apotosis

圖 2-1:疾病的五項原因。疾病的成因大部分都是上述五大因素相互影響所造成[Sanchez

et al,2004]。

2.3 蛋白質體的肝癌研究現況

生物性標識是指和疾病相關,或造成疾病本身的蛋白質分子。因此,可以用來在正常及

生物性標識是指和疾病相關,或造成疾病本身的蛋白質分子。因此,可以用來在正常及

相關文件