• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

18

第四章、 實證分析

在醫學上,生物標記物(biomarker)是用來衡量人體疾病、生理狀態的重要物 質,生物標記物可以是特定的細胞、激素或基因。Chang 等學者(2001)證實攝護 腺癌病患的 LEP 基因表現量與腫瘤大小成正向關係;Singh 等學者(2010)也利用 LEP 當作生物標記物進行攝護腺癌研究。本研究以 LEP 為生物標記物,運用 MD1、

MD2 和 LCT,對攝護腺癌病患資料進行分析,試圖篩選出與 LEP 有顯著相關的 基因組,以利後續驗證這些基因組與攝護腺癌的相關性,期望能對於該疾病的診 斷、治療或預後結果上有突破性發展。

1. 資料背景

攝護腺癌生物晶片資料取自美國國家生物技術信息中心(NCBI)之 GEO 基因 資料庫(編號 GSE6959),此晶片包含 40 位非裔美國人(African-American)及 47 位 歐裔美國人(European-American)受試者。美國為全世界攝護腺癌發病率及死亡率 最高的地區。而所有人種中,非洲裔男性有最高罹患攝護腺癌的風險,考量不同 人種間的差異,本研究僅以其中 33 位罹患攝護腺癌的非裔美國男性資料進行實 證分析,GSE6959 生物晶片中記載每位受試者 22,277 個連續型態的基因表達值。

基因組(gene set)為生物學家依據基因路徑、染色體調控、生物學功能將基因 分組,每個基因組都具有其特定生物意義。本研究基因組採用 2008 年分子特徵 資料庫(Molecular Signatures Database,MSigDB)所定義的 C2 集合(版本 2.5),其 基因組定義來自 340 篇期刊文章之研究

根據 Subramanian 等學者(2005)研究建 議應選用至少有 15 個基因的基因組以獲得較為穩定的結果,故此處共有 1,417 個基因組符合條件被納入此實證分析。

基因在不同的研究方法或資料庫之下,有不同的命名系統。有些學術名稱中 包含基因的相關資訊,例如:基因情況或遺傳模式。GSE6959 晶片資料以 probe set ID 型式表示基因名稱,而 C2 集合是以 gene symbol 型式標示基因。在進行數據

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

19

分析之前,我們將每個基因組中的 gene symbol 轉換成 probe set ID 型式,而此轉 換過程並非一對一對應,有些基因的 gene symbol 會轉換成多個 probe set ID,或 是沒有其對應的 probe set ID。例如:本文所採用的生物標記物 LEP 是以 gene symbol 型式命名,在 GSE6959 晶片中則稱作 207092_at。我們定義基因組大小 (gene set size)為一個基因組中能對應到 probe set ID 的 gene symbol 個數。

2. 分析結果

我們以 MD1、MD2 和 LCT 三種基因組分析方法,運用於非裔美國男性攝 護腺癌資料,試圖篩選出 C2 集合中,與 LEP 基因表現量相關性高的基因組。

表 C 為三種基因組分析方法分別在顯著水準 0.005、0.01、0.05 下的顯著基 因組個數。MD1 及 MD2 的顯著個數遠多於 LCT,此發現與前一章的模擬研究 中檢定力之比較結果大相逕庭。在此實例中,MD1 與 MD2 較 LCT 法更能偵測 出顯著基因組。另外,MD2 法顯著基因組個數皆多於 MD1 法,此結果則呼應 MD2 法的定義,以及模擬分析中 MD2 法的檢定力比 MD1 法高的發現。

在顯著水準 0.05 下,僅有 13 個基因組同時被三個方法判定為顯著。更進一 步的,表 D 列出三種基因組分析方法的顯著基因組之兩兩交集個數,其中對角 線個數則為每一個方法的顯著基因組個數,而各方法與 NA 欄或列交叉格中的個 數為該方法獨自判定為顯著的基因組個數。MD1 法與 MD2 法判定為顯著的基因 組相似,以 MD1 法判定為顯著的基因組大約有 8 成的比例也在 MD2 法中被判 定為顯著。LCT 法判定為顯著的基因組大約有 5 成的比例也在 MD1 法、MD2 法中被認定為與 LEP 有關。

表 E.1、表 E.2、表 E.3 分別是三種分析方法的顯著基因組詳細名單,此時僅 列出 p-value 最小的 35 個基因組結果(前 35 名),表格中包含顯著基因組名稱、

基因組大小和 p-value,完整的顯著基因組結果則呈現於附錄 B。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

20

表 C:MD1、MD2 和 LCT 分別在顯著水準.005, .01, .05下的顯著基因組個數。

表 D:在顯著水準0.05下,MD1、MD2 和 LCT 顯著的基因組交集個數。

p-value<0.005 p-value<0.01 p-value<0.05

MD1 71 117 353

MD2 118 171 446

LCT 1 3 37

MD1 MD2 LCT NA

MD1 353 291 16 59

MD2 446 19 149

LCT 37 15

NA 0

SHIPP_DLBCL_CURED_DN 32 0

FMLPPATHWAY 36 0

BYSTROM_IL5_UP 40 0

PTDINSPATHWAY 20 0

OXIDATIVE_PHOSPHORYLATION 57 0

GRANDVAUX_IRF3_DN 20 0

IGF1MTORPATHWAY 19 0

FERRARI_4HPR_UP 21 0

DORSEY_DOXYCYCLINE_UP 30 0

KRETZSCHMAR_IL6_DIFF 120 0

4NQO_UNIQUE_FIBRO_UP 21 0

ADIP_VS_PREADIP_DN 35 0

EGF_HDMEC_UP 43 0

CMV_8HRS_DN 42 0

UVC_HIGH_D6_DN 26 0

MMS_MOUSE_LYMPH_HIGH_4HRS_UP 31 0

WERNERONLY_FIBRO_DN 44 0

INOS_ALL_DN 70 0

HDACI_COLON_TSABUT_UP 53 0

HSA00510_N_GLYCAN_BIOSYNTHESIS 32 0

HSA04210_APOPTOSIS 78 0

HSA04720_LONG_TERM_POTENTIATION 64 0

SMITH_HTERT_UP 95 0.001

LEE_MYC_TGFA_UP 58 0.001

GLYCEROLIPID_METABOLISM 43 0.001

LEE_ACOX1_UP 58 0.001

NO1PATHWAY 27 0.001

SIG_BCR_SIGNALING_PATHWAY 45 0.001

ZHANG_EFT_EWSFLI1_UP 78 0.001

STOSSI_ER_UP 47 0.001

ZHAN_PCS_MULTIPLE_MYELOMA_SPKD 22 0.001 LEI_MYB_REGULATED_GENES 225 0.001

UVB_NHEK3_C8 62 0.001

OXSTRESS_RPETHREE_DN 26 0.001

ET743_SARCOMA_UP 60 0.001

CORDERO_KRAS_KD_VS_CONTROL_DN 52 0

OVARIAN_INFERTILITY_GENES 25 0

SHIPP_DLBCL_CURED_DN 32 0

CCR5PATHWAY 17 0

LEE_MYC_UP 51 0

FMLPPATHWAY 36 0

CELL_CYCLE_REGULATOR 18 0

HDACPATHWAY 29 0

NO1PATHWAY 27 0

SIG_BCR_SIGNALING_PATHWAY 45 0

OXIDATIVE_PHOSPHORYLATION 57 0

PROPANOATE_METABOLISM 30 0

REN_E2F1_TARGETS 33 0

GRANDVAUX_IRF3_DN 20 0

ZHANG_EFT_EWSFLI1_UP 78 0

STOSSI_ER_UP 47 0

GUO_HEX_DN 52 0

ZHAN_PCS_MULTIPLE_MYELOMA_SPKD 22 0

HESS_HOXAANMEIS1_DN 52 0

DORSEY_DOXYCYCLINE_UP 30 0

XU_CBP_DN 33 0

4NQO_UNIQUE_FIBRO_UP 21 0

ADIP_VS_PREADIP_DN 35 0

EGF_HDMEC_UP 43 0

UVC_HIGH_D2_DN 34 0

UVC_HIGH_D6_DN 26 0

MMS_MOUSE_LYMPH_HIGH_4HRS_UP 31 0

HDACI_COLON_CUR_DN 35 0

INOS_ALL_DN 70 0

HDACI_COLON_CLUSTER6 27 0

CALRES_MOUSE_DN 40 0

ESR_FIBROBLAST_UP 49 0

HSA04210_APOPTOSIS 78 0

HSA04662_B_CELL_RECEPTOR_SIGNALING_PATHWAY 59 0 HSA04720_LONG_TERM_POTENTIATION 64 0

HADDAD_HPCLYMPHO_ENRICHED 203 0.004 HSA04140_REGULATION_OF_AUTOPHAGY 28 0.005

HADDAD_HSC_CD10_UP 205 0.006

HSA00380_TRYPTOPHAN_METABOLISM 50 0.010

NADLER_OBESITY_UP 49 0.011

TRYPTOPHAN_METABOLISM 51 0.013

GCRPATHWAY 17 0.013

ZHAN_MM_CD138_LB_VS_REST 21 0.013 HSA04740_OLFACTORY_TRANSDUCTION 27 0.018 HSA04920_ADIPOCYTOKINE_SIGNALING_PATHWAY 68 0.018

GATA3PATHWAY 15 0.022

FRUCTOSE_AND_MANNOSE_METABOLISM 25 0.023

SHIPP_DLBCL_CURED_UP 28 0.024

ST_GAQ_PATHWAY 26 0.028

NO1PATHWAY 27 0.028

PROTEASOME 17 0.030

HEMATOP_STEM_ALL_UP 34 0.032

TSADAC_HYPOMETH_OVCA_UP 36 0.034

HSA03050_PROTEASOME 22 0.034

PORPHYRIN_AND_CHLOROPHYLL_METABOLISM 19 0.035

HIF1_TARGETS 32 0.036

TARTE_BCELL 36 0.037

VIPPATHWAY 26 0.037

CARBON_FIXATION 19 0.041

VERNELL_PRB_CLSTR2 16 0.041

UVB_NHEK1_C6 106 0.041

HSA00710_CARBON_FIXATION 20 0.041 AGED_MOUSE_HIPPOCAMPUS_ANY_DN 35 0.042

XU_CBP_DN 33 0.043

TNFA_NFKB_DEP_UP 18 0.043

JNK_UP 24 0.046

SIG_PIP3_SIGNALING_IN_B_LYMPHOCYTES 32 0.047 ZHAN_MULTIPLE_MYELOMA_VS_NORMAL_DN 39 0.047

IL1_CORNEA_UP 62 0.047

HSA04150_MTOR_SIGNALING_PATHWAY 42 0.047

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

24

3. 結果討論

MD1、MD2 和 LCT,三種方法完整檢定 C2 集合所有 1417 個基因組之計算 時間分別為: MD1(39371秒)、MD2(137448 秒)、LCT(282 秒)。故 LCT 法計算效 率遠高於我們的方法,主要是由於 MD1、MD2 需要計算各切片之變異數矩陣,

當基因個數多時,則非常耗時。

在 C2 的 1,417 個基因組中,當顯著水準為 5%時,承上節,MD1 判斷為顯 著的有 353 個基因組、MD2 判斷為顯著的有 446 個基因組、LCT 判斷為顯著的 有 37 個基因組。三種方法共同判定為顯著的基因組有 BRENTANI_REPAIR 基因 組、HIF1_TARGETS 基因組、GCRPATHWAY 基因組等 13 個基因組,其中部分 的基因組已經被生物學界證實與攝護腺癌細胞的成長與轉移有關,例如: Terrasi 等學者(2009) 指出 HIF1_TARGETS 基因組中的缺氧誘導因子 1(HIF1)基因、類 胰島素生長因子 1(IGFBP1)基因與 LEP 有高度相關,且在產生攝護腺癌細胞過程 扮演重要關鍵。Eid 等學者(1998)研究發現 VIPPATHWAY 基因組中的早期生長反 應 2(EGR2)基因在人類攝護腺腫瘤的發展中起重要作用。

另外,MD1 法與 MD2 法兩者分析結果相似,且較 LCT 法有較多顯著結果。

兩種方法的顯著基因組之交集共有 291 個基因組,其中多數的基因組在運用 LCT 法時並未獲得顯著結果。例如: REN_E2F1_TARGETS 基因組在 MD1 法的排列顯 著值為.005,在 MD2 法的排列顯著值為 0.0,而 LCT 法的顯著值則為.277。在此 REN_E2F1_TARGETS 基因組中包含攝護腺特異性基因(PSA),此為唯一納入 PSA 基因之基因組。已知 PSA 是目前最普遍用來檢測攝護腺癌的生物標記物,

同時美國國家癌症研究所及台灣國家衛生研究院皆利用 PSA 進行攝護腺癌研究。

另外,IFN_BETA_GLIOMA_UP 基因組在 MD1 法的排列顯著值為.002,在 MD2 法的排列顯著值為.002,而 LCT 法的顯著值則為.773。Wrann等學者(2012)研究 指出 IFN_BETA_GLIOMA_UP 基因組中的 FOSL2 基因會促進 LEP 的表現量,

且 FOSL2 基因參與細胞分化及腫瘤過程。最後,HDACI_COLON_SUL48HRS_DN

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

25

基因組在 MD1 法的排列顯著值為.002,在 MD2 法的排列顯著值為.002,而 LCT 法 的 顯 著 值 則 為 .842 。 Chen 等 學 者 (2012) 研 究 指 出 HDACI_COLON_SUL48HRS_DN 基因組中的脂聯素基因(ADIPOQ)和 LEP 之間 呈顯著負相關,LEP 為腫瘤生長刺激因子,ADIPOQ 則是腫瘤生長抑制因子。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

26

相關文件