• 沒有找到結果。

第三章 研究方法

3.4 資料模型

4

圖 3.2:圓型為套用現有商業套裝或公用資料庫的查詢功能協助資料的分析,三角型為 系統所增加的資料項目。Step1 為樣品的製備上傳的資料為病患診斷資料及實驗的設 定,Step2 為二維電泳比對上傳的資料為二維電泳膠片影像及蛋白質體的位置。Step3 為 mass spectrometry 實驗,上傳資料為分子量及經公用資料庫比對的蛋白質。

3.4 資料模型

一、蛋白質體資料模型:

1. 蛋白質體資料的實體(Entity)包括:樣本、二維電泳膠片、待測蛋白質(SOI)、實驗 條件(藥品、時間、溫度)[Taylor et al,2003],各實體之屬性如下:樣品:樣品種 類、生物來源。

2. 二維電泳膠片:膠片尺寸、染色、影像及實驗條件別。

3. 待測蛋白質(Spot of interest):座標,質譜分析結果有分子量、蛋白質存取編碼、蛋 白質名稱。

4. 實驗條件:藥品、時間、溫度屬性。

二、肝癌病患的診斷資料實體包含病理切片、病患資料、診斷及生化檢察值,各實體屬 性值如下:

1. 病理切片:編碼(id)、病變器官(organ)、病變部位(Site)、檢查時間(occurance age)。

2. 病患基本資料:編碼(P-id)、性別(gender)、生日(birthdate)、血型(Blood type)。

3. 診斷及肝功能生化檢察值:編碼(P-id)、癌症期別(stage)、GOT、GPT、ALB、LDH、

ALP、TBIL、DBIL、病理報告(P_report)、放射線報告(R_report)。

4. 各資料實體之間的關係如圖 3.3 所示。包含蛋白質體的資料及診斷資料實體。

Ex protocol -Medium -Time -Temperature

Pathological Section -ID

-Organ -Source -Age (Occurence)

Patient Data -P-ID -Gender -Birthdate -Blood type

Clinical Data -P-ID

第四章 研究結果

本系統的建立可以協助管理蛋白質體實驗所產生的複雜數據,將分析的結果如:二維電 泳膠片、蛋白質位置、預測蛋白質等,建構至系統的資料庫中,並提供web-based 介面 存取蛋白質體研究資料。而肝癌臨床資料的存入,如診斷資料中的肝臟病變部位、肝功 能檢驗值、肝癌期別等,尋找具有共同臨床症狀或檢驗值之病患樣品,是否具有共同的 蛋白質點或蛋白質群體(pattern)。亦可從具有相同蛋白質點的樣品來源,找出病患的共 同臨床症狀。臨床及蛋白質體資料多元的檢視方法,將有助於研究者以不同的檢視資料 項目,取得有意義的相關性,進而發現新知識[Wilk,2003],加速國內肝癌研究發展。

後基因體時代因基因功能的探討,結合蛋白質體及生物資訊的跨領域學門,已成為生命 科學研究的重要方式。此研究整合蛋白質體及肝癌的診斷資料,落實後基因體的研究至 實際的應用,為肝癌的醫療提供早期發現的診斷方式。蛋白質體資料管理、整合肝癌病 患的診斷資料及使用者資料查詢,說明如下。

4.1 系統及建置平台

蛋白質體研究的資料管理需面臨二大問題,從實驗室的數據管理觀點如何建立一資訊系 統管理這些複雜的蛋白質體數據,另一方面如何利用這些數據的特性,結合資料分析,

發現特殊功能的蛋白質。如結合病患的診斷資訊,發展生物標記(biomarker)的可能,協 助重大疾病的早期診斷、治療及新藥開發。這也是後基因體結合蛋白質體及生物資訊的

最終目標。

系統的架構為標準的 web-based 應用程式。前端為使用者的瀏覽器及中介軟體(middle ware)及後端的資料庫如圖 4-1。本系統使用微軟 2000 server 及內含 IIS5 為作資訊服務 系統,採用微軟Access 2000 作為資料儲存系統,透過 ODBC 驅動程式與資料庫連結。

採用active server pages(ASP)為動態的網頁開發語言,ASP 語言是一種廣泛使用於動態 網頁開發的描述性語言(Script language)效能比傳統的 CGI(Command Gateway Interface) 高,對於資料庫的連結及不同瀏覽器的支援都有相當高的相容性[陳長念 陳勤意,2001]。

Patient Clinical Data

HIS DB

Gel image analysis CSV file

Edit interface

Predefined CSV file

Gel Images

Query

management Browser

Internet / Intranet

Proteomic data

Public Protein profile

CGI

Web Server DB Server

系 統 架 構

Peptide mass fingerprint

ASP ASP

Client browser

圖 4-1:系統架構圖及所含元件。Client browser 為使用者與系統溝通介面。Web server 處理使用者各項需求。Dbserver 提供資料儲存。HIS(Hospital Information System);

CGI(Common Gateway Interface);ASP(Active Server Pages);CSV(Comma Separate

Value)。各元件詳細如 4-2 說明。

4.2 系統功能說明

蛋白質體研究過程複雜且需搭配不同軟體配合資料分析如二維電泳的影像分析、質譜分 析的蛋白質研判,加上分析結果儲存於各獨立的軟體中,這些於軟體間缺乏資料的溝通 介面,無法整合這些實驗結果至資料庫管理儲存,對於研究相當的不方便。若能將這些 實驗數據整合至資料庫中,並設計單一介面的資料存取,提供研究者透過統一的介面管 理資料及存取各實驗結果。本系統的目的為協助建立蛋白質體研究實驗室資料管理系統

(Laboratory Information Management Systems, LIMS)。

整合實驗室現行的二維電泳影像比對套裝軟體(PDQuest Ver: 6.2.1,BioRad)的比對資 料、各項實驗處理條件資料、蛋白質的質譜分析,協助建立蛋白質體研究的資料管理系 統。整合肝癌病患的診斷資料,建立肝癌的蛋白質體及診斷的資料庫。並設計資料查詢 介面存取資料。系統提供蛋白質體研究資料及同步檢視診斷資料,並可連結至外部公用 資料庫(NCBI 及 Swiss Prot)讀取得更詳細的蛋白質註解資訊,在視覺化的資料呈現下,

提供研究者更方便的資料存取環境。

系統的架構採 web-based 系統設計。包含使用者的工作站瀏覽器(Client)、資料庫主機 (Database server)和網路服務主機(web swerver)如圖 4-1。

4.2.1 工作站瀏覽器(Client):

為系統與使用者溝通介面主要的功能:

提供使用者身份驗證,目前使用者分為四級群組(guest、user、lab user、administrator)各 級使用者因屬不同群組,系統授與不同權限,說明如4-3 網站導覽說明。

1. 資料上傳畫面:配合網路主機檔案傳輸,將蛋白質體資料、診斷資料上傳至網路 服務主機。

2. 查詢畫面:蛋白質體資料及肝臟病患資料屬性查詢資料。

4.2.2 網路服務主機(web swerver):

網路服務主機包含四個主要元件檔案傳輸管理(FTP manager)、資料分析器(Parser)、編輯 界面(Editor Interface)和查詢管理(Query Management) 如圖 4-1。各元件功能說明如下:

1. 檔案傳輸管理:處理三種外部資料來源的類型類資料。

I. 醫院資訊系統 (Hospital Information System)的所轉出的病患資料。

II. 蛋白質體分析資料,二維電泳膠片圖形檔、蛋白質點(SOI,Spots of interest)位 置圖的座標。

部位、肝功能的檢驗指數ALB、GOT、GPT、ALP、LDH、TBIL、DBIL、

病 理 報 告 、 放 射 線 報 告 。 本 項 資 料 由 醫 院 的 醫 院 資 訊 系 統(Hospital Information system HIS)匯出,格式如附錄四的病患資料格式。

II. 二維電泳膠片圖檔:jpeg 或其他瀏覽器所支援的格式如 bmp。

III. 二維電泳膠片檢測蛋白質點作標位置:檢測點上的座標,本項資料經 PDQuest (Ver: 6.2.1)所提供的 basic export 的匯出功能,操作畫面(如附錄 五),匯出格式如附錄四的蛋白質點資料格式。

IV. 蛋白質質譜分析資料:將比對後的資料匯整成 comma separate value (CSV) 檔,格式如附錄四的蛋白質定性分析預測資料格式。

3. 編輯界面:提供圖形界面 (GUI )提供使用者檢視上傳的資料。並提供未來資料編 輯、新增的畫面。或採用的資料分析系統不同於本實驗室時,資料無法以附錄四 的格式轉入本系統時,由本畫面逐步輸入各項資料。

4. 查詢管理:查詢管理提供蛋白質資訊方面的蛋白質存取號碼、蛋白質名稱、分子 量(molecular weight)範圍、pI 值,病患資料方面的病發年紀、性別、癌症期別、肝 功能的生化檢驗值ALB、GOT、GPT、LDH、ALP、TBIL、DBIL。的個別查詢或 上述各資料項目的組合查詢。

4.2.3 資料庫主機:

資料庫設計,提供複雜及不同資料來源的儲存架構,可將大量的生物資料有組織的儲存 起來,避免資料重覆與錯誤。更重要的是,目前大部分的資訊開發工具都是架構在資料 庫上(database-backed)的開發應用程式[Nelson et al,2003]。將實驗資料及診斷資料存入 資料庫,可利用現有的資訊工具開發操作容易(user friendly)、快速查詢介面,操作這些 資料。

4.3 網站導覽

本系統以web-based 設計的蛋白質體實驗的資料管理系統,網站詳細功能如下:

使用者登錄系統後,系統依據使用者給予不同的權限,系統規劃四級使用者:

外部使用者Guest(不需申請)、User(需申請,核發 ID 及密碼);內部使用者的 power user(需 申請,核發ID 及密碼)及 administrator。系統各項功能說明及使用權限如下說明:

系統登錄(首頁)如圖

A B

圖 4-2 系統登錄畫面:使用者進入系統前需進行登錄通過認證後使用系統各項功能,未 申請任何帳號可先用 guest 登錄(密碼 guest)

系統畫面設計採框架網頁(frame)的設計方式,網頁左邊為功能項目如圖 4-3(C),右邊為 內容顯示部分如圖4-3(A、B)。下列將依系統各項主要功能,逐步說明各細項功能:

A. 二維電泳膠片檢視

B. 資料查詢:

C. 使用者管理:

D. 使用者群組管理:

E. 各項實驗條件設定:

F. 資料上傳:

A. 二維電泳膠片檢視:檢視所有二維電泳膠片資訊由此畫面可連結至二維電泳的詳細 資訊如圖 4-3(A),內部使用者有資料管理權限如圖 4-3(B)可連結至二維電泳資料編輯 (A.6.1 畫面 4-19)或刪除功能。

A

B

C

圖 4-3:二維電泳膠片標題檢視:選取左側功能表即可進入本功能。其中 A 畫面為外部 使用者只有檢視功能(VIEW),內部使用者可進行各項資料編輯及刪除如圖中標示 B

A.1 二維電泳詳細資料檢視如圖 4-4 及圖 4-5,選取圖 4-3 的 view 可進入本項功能,本

畫面提供三項資訊:

A.1.1 病患的基本資料性別、診斷(圖 4-4 標示 A)。

A.1.2 二維電泳中的蛋白質點資料,可由影像中直接點選標示(圖 4-4 標示 C)或圖 4-5 的蛋白質資料說明LINK 進入蛋白質 Mass Data(圖 4-6 標示 A)。

A.1.3 影像放大檢視,選取放大部分(圖 4-4 標示 B)選取放大倍數(100% ~300%),檢視 放大的影像(圖 4-6 標示B)。

A B

C D

圖 4-4 二維電泳膠片檢視:病患的基本資料性別、診斷(標示 A)。從影像中直接點選標 示(標示 C)進入蛋白質 Mass Data。選取放大區域(標示 D)選取放大倍數(100%

~300%)(標示 B),檢視放大的影像(圖 4-6 標示 B)。

圖 4-5 二維電泳膠片檢視(圖 4-4 同一網頁):檢視所預測的各項蛋白質詳細資料蛋白質 名稱、ACCESS NO、pI、分子量。點選 LINK 進入蛋白質 Mass Data(同圖 4-4 的標示

C)。

A

B C

D

圖 4-6 蛋白質 Mass data 及影像放大:蛋白質的 mass data(標示 A)及註解的連結(標示

C)二維電泳膠片的詳細的診斷資訊連結(標示 A,本功能不提供外部使用者)。二維電泳

膠片放大後的影像(標示 B)。

A.1.2.1 病患各項診斷資料及肝功能檢驗值如圖 4-7(標示 B)(本功能不提供外部使用者) A.1.2.1.1 二維電泳樣品處理條件及藥品如圖 4-7(標示 C)

A.1.2.1.2 二維電泳條件及藥品染色如圖 4-7(標示 C)

A

B

C

圖 4-7 病患診斷肝功能及各項實驗條件檢視:點選 SHOW(標示 A)可檢視病患的診斷及 肝功能資料如標示B。選點標示 B 中的 SAMPLE 可檢視樣品詳細處理設定及藥品如標 示C 中的上圖,選點標示 B 中的 2D CONDITION 可檢視二維電泳條件設定及藥品如標 示C 中的下圖

A.1.2.2 連結公用蛋白質資料庫的註解如圖 4-8(標示 B 及 C)

A

C

B

圖 4-8:蛋白質註解資訊。A 為蛋白質存取編碼可連結至公用資料庫,Swiss Prot 資料 庫如圖中的 B,NCBI 資料庫如圖中的 C。

相關文件