國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
18
第四章、 實證分析
在醫學上,生物標記物(biomarker)是用來衡量人體疾病、生理狀態的重要物 質,生物標記物可以是特定的細胞、激素或基因。Chang 等學者(2001)證實攝護 腺癌病患的 LEP 基因表現量與腫瘤大小成正向關係;Singh 等學者(2010)也利用 LEP 當作生物標記物進行攝護腺癌研究。本研究以 LEP 為生物標記物,運用 MD1、
MD2 和 LCT,對攝護腺癌病患資料進行分析,試圖篩選出與 LEP 有顯著相關的 基因組,以利後續驗證這些基因組與攝護腺癌的相關性,期望能對於該疾病的診 斷、治療或預後結果上有突破性發展。
1. 資料背景
攝護腺癌生物晶片資料取自美國國家生物技術信息中心(NCBI)之 GEO 基因 資料庫(編號 GSE6959),此晶片包含 40 位非裔美國人(African-American)及 47 位 歐裔美國人(European-American)受試者。美國為全世界攝護腺癌發病率及死亡率 最高的地區。而所有人種中,非洲裔男性有最高罹患攝護腺癌的風險,考量不同 人種間的差異,本研究僅以其中 33 位罹患攝護腺癌的非裔美國男性資料進行實 證分析,GSE6959 生物晶片中記載每位受試者 22,277 個連續型態的基因表達值。
基因組(gene set)為生物學家依據基因路徑、染色體調控、生物學功能將基因 分組,每個基因組都具有其特定生物意義。本研究基因組採用 2008 年分子特徵 資料庫(Molecular Signatures Database,MSigDB)所定義的 C2 集合(版本 2.5),其 基因組定義來自 340 篇期刊文章之研究
。
根據 Subramanian 等學者(2005)研究建 議應選用至少有 15 個基因的基因組以獲得較為穩定的結果,故此處共有 1,417 個基因組符合條件被納入此實證分析。基因在不同的研究方法或資料庫之下,有不同的命名系統。有些學術名稱中 包含基因的相關資訊,例如:基因情況或遺傳模式。GSE6959 晶片資料以 probe set ID 型式表示基因名稱,而 C2 集合是以 gene symbol 型式標示基因。在進行數據
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
19
分析之前,我們將每個基因組中的 gene symbol 轉換成 probe set ID 型式,而此轉 換過程並非一對一對應,有些基因的 gene symbol 會轉換成多個 probe set ID,或 是沒有其對應的 probe set ID。例如:本文所採用的生物標記物 LEP 是以 gene symbol 型式命名,在 GSE6959 晶片中則稱作 207092_at。我們定義基因組大小 (gene set size)為一個基因組中能對應到 probe set ID 的 gene symbol 個數。
2. 分析結果
我們以 MD1、MD2 和 LCT 三種基因組分析方法,運用於非裔美國男性攝 護腺癌資料,試圖篩選出 C2 集合中,與 LEP 基因表現量相關性高的基因組。
表 C 為三種基因組分析方法分別在顯著水準 0.005、0.01、0.05 下的顯著基 因組個數。MD1 及 MD2 的顯著個數遠多於 LCT,此發現與前一章的模擬研究 中檢定力之比較結果大相逕庭。在此實例中,MD1 與 MD2 較 LCT 法更能偵測 出顯著基因組。另外,MD2 法顯著基因組個數皆多於 MD1 法,此結果則呼應 MD2 法的定義,以及模擬分析中 MD2 法的檢定力比 MD1 法高的發現。
在顯著水準 0.05 下,僅有 13 個基因組同時被三個方法判定為顯著。更進一 步的,表 D 列出三種基因組分析方法的顯著基因組之兩兩交集個數,其中對角 線個數則為每一個方法的顯著基因組個數,而各方法與 NA 欄或列交叉格中的個 數為該方法獨自判定為顯著的基因組個數。MD1 法與 MD2 法判定為顯著的基因 組相似,以 MD1 法判定為顯著的基因組大約有 8 成的比例也在 MD2 法中被判 定為顯著。LCT 法判定為顯著的基因組大約有 5 成的比例也在 MD1 法、MD2 法中被認定為與 LEP 有關。
表 E.1、表 E.2、表 E.3 分別是三種分析方法的顯著基因組詳細名單,此時僅 列出 p-value 最小的 35 個基因組結果(前 35 名),表格中包含顯著基因組名稱、
基因組大小和 p-value,完整的顯著基因組結果則呈現於附錄 B。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
20
表 C:MD1、MD2 和 LCT 分別在顯著水準.005, .01, .05下的顯著基因組個數。
表 D:在顯著水準0.05下,MD1、MD2 和 LCT 顯著的基因組交集個數。
p-value<0.005 p-value<0.01 p-value<0.05
MD1 71 117 353
MD2 118 171 446
LCT 1 3 37
MD1 MD2 LCT NA
MD1 353 291 16 59
MD2 446 19 149
LCT 37 15
NA 0
‧
SHIPP_DLBCL_CURED_DN 32 0
FMLPPATHWAY 36 0
BYSTROM_IL5_UP 40 0
PTDINSPATHWAY 20 0
OXIDATIVE_PHOSPHORYLATION 57 0
GRANDVAUX_IRF3_DN 20 0
IGF1MTORPATHWAY 19 0
FERRARI_4HPR_UP 21 0
DORSEY_DOXYCYCLINE_UP 30 0
KRETZSCHMAR_IL6_DIFF 120 0
4NQO_UNIQUE_FIBRO_UP 21 0
ADIP_VS_PREADIP_DN 35 0
EGF_HDMEC_UP 43 0
CMV_8HRS_DN 42 0
UVC_HIGH_D6_DN 26 0
MMS_MOUSE_LYMPH_HIGH_4HRS_UP 31 0
WERNERONLY_FIBRO_DN 44 0
INOS_ALL_DN 70 0
HDACI_COLON_TSABUT_UP 53 0
HSA00510_N_GLYCAN_BIOSYNTHESIS 32 0
HSA04210_APOPTOSIS 78 0
HSA04720_LONG_TERM_POTENTIATION 64 0
SMITH_HTERT_UP 95 0.001
LEE_MYC_TGFA_UP 58 0.001
GLYCEROLIPID_METABOLISM 43 0.001
LEE_ACOX1_UP 58 0.001
NO1PATHWAY 27 0.001
SIG_BCR_SIGNALING_PATHWAY 45 0.001
ZHANG_EFT_EWSFLI1_UP 78 0.001
STOSSI_ER_UP 47 0.001
ZHAN_PCS_MULTIPLE_MYELOMA_SPKD 22 0.001 LEI_MYB_REGULATED_GENES 225 0.001
UVB_NHEK3_C8 62 0.001
OXSTRESS_RPETHREE_DN 26 0.001
ET743_SARCOMA_UP 60 0.001
‧
CORDERO_KRAS_KD_VS_CONTROL_DN 52 0
OVARIAN_INFERTILITY_GENES 25 0
SHIPP_DLBCL_CURED_DN 32 0
CCR5PATHWAY 17 0
LEE_MYC_UP 51 0
FMLPPATHWAY 36 0
CELL_CYCLE_REGULATOR 18 0
HDACPATHWAY 29 0
NO1PATHWAY 27 0
SIG_BCR_SIGNALING_PATHWAY 45 0
OXIDATIVE_PHOSPHORYLATION 57 0
PROPANOATE_METABOLISM 30 0
REN_E2F1_TARGETS 33 0
GRANDVAUX_IRF3_DN 20 0
ZHANG_EFT_EWSFLI1_UP 78 0
STOSSI_ER_UP 47 0
GUO_HEX_DN 52 0
ZHAN_PCS_MULTIPLE_MYELOMA_SPKD 22 0
HESS_HOXAANMEIS1_DN 52 0
DORSEY_DOXYCYCLINE_UP 30 0
XU_CBP_DN 33 0
4NQO_UNIQUE_FIBRO_UP 21 0
ADIP_VS_PREADIP_DN 35 0
EGF_HDMEC_UP 43 0
UVC_HIGH_D2_DN 34 0
UVC_HIGH_D6_DN 26 0
MMS_MOUSE_LYMPH_HIGH_4HRS_UP 31 0
HDACI_COLON_CUR_DN 35 0
INOS_ALL_DN 70 0
HDACI_COLON_CLUSTER6 27 0
CALRES_MOUSE_DN 40 0
ESR_FIBROBLAST_UP 49 0
HSA04210_APOPTOSIS 78 0
HSA04662_B_CELL_RECEPTOR_SIGNALING_PATHWAY 59 0 HSA04720_LONG_TERM_POTENTIATION 64 0
‧
HADDAD_HPCLYMPHO_ENRICHED 203 0.004 HSA04140_REGULATION_OF_AUTOPHAGY 28 0.005
HADDAD_HSC_CD10_UP 205 0.006
HSA00380_TRYPTOPHAN_METABOLISM 50 0.010
NADLER_OBESITY_UP 49 0.011
TRYPTOPHAN_METABOLISM 51 0.013
GCRPATHWAY 17 0.013
ZHAN_MM_CD138_LB_VS_REST 21 0.013 HSA04740_OLFACTORY_TRANSDUCTION 27 0.018 HSA04920_ADIPOCYTOKINE_SIGNALING_PATHWAY 68 0.018
GATA3PATHWAY 15 0.022
FRUCTOSE_AND_MANNOSE_METABOLISM 25 0.023
SHIPP_DLBCL_CURED_UP 28 0.024
ST_GAQ_PATHWAY 26 0.028
NO1PATHWAY 27 0.028
PROTEASOME 17 0.030
HEMATOP_STEM_ALL_UP 34 0.032
TSADAC_HYPOMETH_OVCA_UP 36 0.034
HSA03050_PROTEASOME 22 0.034
PORPHYRIN_AND_CHLOROPHYLL_METABOLISM 19 0.035
HIF1_TARGETS 32 0.036
TARTE_BCELL 36 0.037
VIPPATHWAY 26 0.037
CARBON_FIXATION 19 0.041
VERNELL_PRB_CLSTR2 16 0.041
UVB_NHEK1_C6 106 0.041
HSA00710_CARBON_FIXATION 20 0.041 AGED_MOUSE_HIPPOCAMPUS_ANY_DN 35 0.042
XU_CBP_DN 33 0.043
TNFA_NFKB_DEP_UP 18 0.043
JNK_UP 24 0.046
SIG_PIP3_SIGNALING_IN_B_LYMPHOCYTES 32 0.047 ZHAN_MULTIPLE_MYELOMA_VS_NORMAL_DN 39 0.047
IL1_CORNEA_UP 62 0.047
HSA04150_MTOR_SIGNALING_PATHWAY 42 0.047
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
24
3. 結果討論
MD1、MD2 和 LCT,三種方法完整檢定 C2 集合所有 1417 個基因組之計算 時間分別為: MD1(39371秒)、MD2(137448 秒)、LCT(282 秒)。故 LCT 法計算效 率遠高於我們的方法,主要是由於 MD1、MD2 需要計算各切片之變異數矩陣,
當基因個數多時,則非常耗時。
在 C2 的 1,417 個基因組中,當顯著水準為 5%時,承上節,MD1 判斷為顯 著的有 353 個基因組、MD2 判斷為顯著的有 446 個基因組、LCT 判斷為顯著的 有 37 個基因組。三種方法共同判定為顯著的基因組有 BRENTANI_REPAIR 基因 組、HIF1_TARGETS 基因組、GCRPATHWAY 基因組等 13 個基因組,其中部分 的基因組已經被生物學界證實與攝護腺癌細胞的成長與轉移有關,例如: Terrasi 等學者(2009) 指出 HIF1_TARGETS 基因組中的缺氧誘導因子 1(HIF1)基因、類 胰島素生長因子 1(IGFBP1)基因與 LEP 有高度相關,且在產生攝護腺癌細胞過程 扮演重要關鍵。Eid 等學者(1998)研究發現 VIPPATHWAY 基因組中的早期生長反 應 2(EGR2)基因在人類攝護腺腫瘤的發展中起重要作用。
另外,MD1 法與 MD2 法兩者分析結果相似,且較 LCT 法有較多顯著結果。
兩種方法的顯著基因組之交集共有 291 個基因組,其中多數的基因組在運用 LCT 法時並未獲得顯著結果。例如: REN_E2F1_TARGETS 基因組在 MD1 法的排列顯 著值為.005,在 MD2 法的排列顯著值為 0.0,而 LCT 法的顯著值則為.277。在此 REN_E2F1_TARGETS 基因組中包含攝護腺特異性基因(PSA),此為唯一納入 PSA 基因之基因組。已知 PSA 是目前最普遍用來檢測攝護腺癌的生物標記物,
同時美國國家癌症研究所及台灣國家衛生研究院皆利用 PSA 進行攝護腺癌研究。
另外,IFN_BETA_GLIOMA_UP 基因組在 MD1 法的排列顯著值為.002,在 MD2 法的排列顯著值為.002,而 LCT 法的顯著值則為.773。Wrann等學者(2012)研究 指出 IFN_BETA_GLIOMA_UP 基因組中的 FOSL2 基因會促進 LEP 的表現量,
且 FOSL2 基因參與細胞分化及腫瘤過程。最後,HDACI_COLON_SUL48HRS_DN
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
25
基因組在 MD1 法的排列顯著值為.002,在 MD2 法的排列顯著值為.002,而 LCT 法 的 顯 著 值 則 為 .842 。 Chen 等 學 者 (2012) 研 究 指 出 HDACI_COLON_SUL48HRS_DN 基因組中的脂聯素基因(ADIPOQ)和 LEP 之間 呈顯著負相關,LEP 為腫瘤生長刺激因子,ADIPOQ 則是腫瘤生長抑制因子。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
26