• 沒有找到結果。

分層族群中的遺傳相關研究:族層配對及基因體控制之整合策略

N/A
N/A
Protected

Academic year: 2021

Share "分層族群中的遺傳相關研究:族層配對及基因體控制之整合策略"

Copied!
6
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會專題研究計畫 成果報告

分層族群中的遺傳相關研究:族層配對及基因體控制之整合

策略

計畫類別: 個別型計畫 計畫編號: NSC93-2320-B-002-066- 執行期間: 93 年 08 月 01 日至 94 年 07 月 31 日 執行單位: 國立臺灣大學公共衛生學院流行病學研究所 計畫主持人: 李文宗 報告類型: 精簡報告 處理方式: 本計畫可公開查詢

中 華 民 國 94 年 10 月 26 日

(2)

行政院國家科學委員會專題研究計畫成果報告

計畫名稱:(中文) 分層族群中的遺傳相關研究:族層配對及基因體

控制之整合策略

(英文) Genetic Association Studies in Stratified Populations:

the Integrated Strategy of Stratum Matching and

Genomic Controlling

計畫編號:NSC 93-2320-B-002-006

執行期限:93/08/01~94/07/31

主持人:李文宗 台灣大學公共衛生學院流行病學研究所

TEL: (02) 23123456-8357

FAX: (02) 23511955

E-Mail:

wenchung@ha.mc.ntu.edu.tw

一、中文摘要: 複雜性疾病易感受性基因的基因定位 非常仰賴家庭為本的相關分析。然而 收錄家族對照比收錄族群對照困難許 多。本計畫中,主持人提出一個新穎 的病例對照研究法,其中傳統病例對 照研究所面臨的族群分層偏差將以研 究設計階段的族層配對以及資料分析 階段的基因體控制進行處理。族層配 對是指依據種族、氏族、國籍、出生 地等變項進行配對;基因體控制是在 全基因體隨機選取若干虛無標記基因 而 後 以 卡 方 分 佈 的 縮 放 原 理 進 行 調 整。本計畫以電腦模擬展現出族層配 對的正確比例越高,將可提高研究的 檢力。假如族層配對粗糙,雖然檢力 下降,仍可利用基因體控制調整出正 確的型一誤差。主持人並比較族層配 對 策 略 研 究 與 個 案 雙 親 設 計 (case-parents design)所需的病例數。對 照組之於病例組的配對比例(matching ratio)增加,可減少病例數的需求。倘 若配對比例趨於無窮,所需個案數大 約為原本的一半。本計畫所提出族層 配對及基因體控制之病例對照研究法 可以掙脫家庭的束縛,而遺傳學上原 本複雜的基因定位問題將可由簡單的 流行病學方法解決。 二、緣由與目的

(3)

遺傳疾病研究方法中,對於疾病 易 感 受 性 基 因 定 位 (disease susceptibility gene mapping)的方法,包 括傳統的連鎖分析(linkage analysis), 以及近代提出的相關分析(association approach)1,2。連鎖分析的方法是檢定標 記基因座(marker)和疾病易感受性基 因座間是否存在連鎖,藉此而定位出 疾病易感受性基因座。然而學者指出 複雜性疾病(complex diseases)的基因 定位,連鎖分析方法有統計檢力(power) 偏低的缺點。個案收集時,也不容易 收 集 具 有 親 屬 關 係 而 同 樣 得 病 的 個 案。另外這個方法必須事先假設特定 的遺傳模式(mode of inheritance),限制 了它的廣用性。 相關分析為近年來廣為使用的方 法,檢定標記基因座和疾病易感受性 基因座間是否存在連鎖不平衡(linkage disequilibrium) 1,2。然而收集家族對照 相較於收集一般對照,難度會增加許 多。病例的父母/子女可能並不與病例 本 人 住 在 一 起 , 也 可 能 拒 絕 參 加 研 究。即使空間阻絕的困難可克服,實 際上研究者也可能面臨病例父母已身 亡或病例是家中獨子(女)而無兄弟 姊妹的窘境。因此傳統的病例對照研 究法(收集一般的對照而非家族對照) 如果不是因為它有可能造成族群分層 偏差3,4,應是遺傳相關研究較佳的選 擇。 最近Wacholder等人5做了一個有 關 族 群 分 層 偏 差 的 理 論 及 實 證 的 研 究,結果發現這個偏差在美國非西班 牙歐洲裔高加索人的癌症研究,其大 小是無關痛癢的(inconsequential)。雖 然其他族群的資料迄今仍缺乏,學界 已逐漸認清族群分層偏差的影響可能 不是早先所認為的那麼嚴重6-8 不過若吾人的興趣係在未知基因 的基因定位(gene mapping),而非已知 基因的基因效應定量(比如估計基因 型 相 對 危 險 性 , genotype relative risk),情況又有不同。基因定位的場 合以標記基因座的連鎖不平衡檢定為 主9。 這 是 一 種 假 說 檢 定 (hypothesis testing)而非估計(estimation)。統計學教 科書中明白告訴我們,只要樣本數夠 大,任何偏差即使再小也會被檢定出 來。因此族群分層偏差其偏差量雖可 能不大,但它在基因定位相關分析場 合中,卻極可能造成過多的假陽性連 鎖不平衡訊號。 「配對」(matching)是流行病學中 控制干擾作用慣用的手段10;而基因體 控制(genomic control)則為晚近遺傳學 家提出的方法11-13。我們可將配對的原 理用來處理族群分層的偏差,做為第 一道防線。比如我們可以依據種族、 氏族、國籍、出生地等變項進行配對 式 病 例 對 照 研 究 法 (matched case-control study) 。 如 此 族 層 配 對 (stratum matching)當然不可能百分之 百正確。接著我們可以再採用基因體 控制做為第二道防線,針對族層配對 後 所 殘 留 下 的 族 群 分 層 (residual stratification),進行處理。這種研究設 計階段採族層配對而在資料分析階段 採基因體控制的整合策略是一種創新 的思維,並可能有實際的效用。 因此本計畫目的為: 1. 提 出 一 個 新 穎 的 病 例 對 照 研 究 法,其中傳統病例對照研究所面 臨的族群分層偏差將以研究設計 階段的族層配對以及資料分析階

(4)

段的基因體控制進行處理。 2. 以 電 腦 模 擬 分 層 族 群 的 演 化 史 (evolutional history),以探討此等 整合策略對於族群分層偏差所造 成的過多偽陽性訊號(亦即第一 型誤差)的控制效果。 3. 進行完整的模擬試驗驗證族群配 對精緻程度(正確配對比例的多 寡 ) 、 對 照 病 例 個 案 的 配 對 比 (control-to-case matching ratio)在 策略中與統計檢力的關係。 4. 探討族層配對之錯誤耐受度。以 明瞭實際研究中,在有基因體控 制為後盾的情況下,研究者可僅 需花費多少心力在族層配對上, 而不致對第一型及第二型誤差有 太大影響。 5. 進行檢力公式(power formula)以 及最適加權係數的推導。 三、結果與討論 本 研 究 發 展 配 對 不 平 衡 檢 定 (matching disequilibrium test, MDT),檢 定配對組合中病例與對照基因頻率的 差異,藉此進行本研究整合策略中的 基因體控制分析。 電腦模擬顯示,若不進行基因體 控制,MDT受到族群分層偏差的影 響,產生擴張的型一誤差。配對越粗 糙,偏差的情況越嚴重,相反的,當 配對完全正確的時候,將可避免族群 分層偏差。 無論配對正確與否,利用基因體 控制皆可校正因族群分層偏差而擴張 的型一誤差。但研究顯示,若配合族 層配對策略,將可彌補基因體控制檢 力不足的缺點。配對越精緻,檢力越 高 。 對 照 組 之 於 病 例 組 的 配 對 比 例 (matching ratio)增加,則檢力越高。 作者推導該整合策略的檢力公式 和最適加權係數。並比較各遺傳模式 在相同檢力下,整合策略與家族研究 中個案雙親設計(TDT檢定)的所需病 例數。結果發現,對照組之於病例組 的配對比例(matching ratio)越高,所需 病例數越少。 總結以上可知,面對基因疾病相 關研究時,若採用本計劃提出族群配 對與基因體控制整合策略的病例對照 研究,除了可以控制族群分層偏差, 並可增加提升檢力。病例對照研究相 對於家族研究而言,更容易募集對照 組。並可增加對照組之於病例組的配 對比例(matching ratio),減少病例數的 需求。 四、計畫成果自評: 家族研究由於對照組收案不易, 向來是流行病學家最大的夢魘。吾人 若能完全掙脫家庭的束縛,在廣大族 群中選取對照組,就如流行病學家長 久以來所做一般,可依經費、人力的 考量,自由提高配對比率(如從1:1 提高至1:4)而提高檢力,那麼複雜 性疾病基因定位從連鎖分析至相關分 析的典範轉移才能竟全功。 本計畫提出的病例對照研究法, 採取族層配對及基因體控制,以克服 族群分層偏差的問題。預計其實際應 用價值高。另外,本計畫的研究成果 已 獲 “Genetic Epidemiology”14雜誌接 受發表。

(5)

五、參考文獻

1. Risch N, Merikangas K. The future of genetic studies of complex human diseases. Science 1996;273:1516-7. 2. Khoury MJ, Yang Q. The future of

genetic studies of complex human diseases: an epidemiologic

perspective. Epidemiology 1998;9:350-4.

3. Ewens WJ, Spielman RS. The transmission/disequilibrium test: history, subdivision and admixture.

Am J Hum Genet 1995;57:455-64.

4. Witte JS, Gauderman WJ, Thomas DC. Asymptotic bias and efficiency in case-control studies of candidate genes and gene-environment interactions: basic family designs.

Am J Epidemiol 1999;149:693-705.

5. Wacholder S, Rothman N, Caporaso N. Population stratification in epidemiologic studies of common genetic variants and cancer:

quantification of bias. J Natl Cancer

Inst 2000;92:1151-8.

6. Thomas DC, Witte JS. Point: population stratification: a problem for case-control studies of

candidate-gene associations? Cancer

Epidem Biomar 2002;11:505-12.

7. Wacholder S, Rothman N, Caporaso N. Counterpoint: bias from

population stratification is not a major threat to the validity of conclusions from epidemiological studies of common polymorphisms and cancer. Cancer Epidem Biomar 2002;11:513-20.

stratification and spurious allelic association. Lancet

2003;361:598-604.

9. Weinberg CR. It's time to rehabilitate the P-value. Epidemiology

2001;12:288-90.

10. Rothman KJ, Greenland S. Modern

epidemiology, 2nd ed. Philadelphia, PA: Lippincott-Raven Publishers, 1998.

11. Devlin B, Roeder K. Genomic control for association studies.

Biometrics 1999;55:997-1004.

12. Bacanu SA, Devlin B, Roeder K. The power of genomic control. Am J

Hum Genet 2000;66:1933-44.

13. Reich DE, Goldstein DB. Detecting association in a case-control study while correcting for population stratification. Genet Epidemiol 2001;20:4-16.

14. Lee WC. Case-Control Association Studies With Matching and Genomic Controlling. Genet Epidemiol

(6)

ABSTRACT

Family-based association studies have gained in popularity for mapping

disease-susceptibility gene(s) of complex diseases. However, recruiting family controls is often more difficult than recruiting unrelated controls. The author proposes a case-control study, where the possible biases due to population

stratification are controlled by matching in the design stage and by genomic controlling in the data-analytic stage. The matching is based on a set of

"stratum-delineating variables," such as, race, ethnicity, nationality, ancestry, and birthplace; and the genomic controlling is based on typing a number of null markers across the genome and applying the principle of multiplicative scaling of chi-square distribution. It pays to match carefully to have a higher proportion of correctly matched sets, as computer simulation showed that this would increase the power of the study. If matching is crude, one loses power but

still has the correct type I error rate after genomic controlling. Power studies showed that the numbers of affected subjects required for the pair-matched study are comparable to those required by the case-parents design, if the study was conducted in a homogeneous population. As the (control-to-case) matching ratio increases, the number of affected subjects required decreases. With matching ratio tending toward infinity, the number required shrinks roughly by half. The case-control study with matching and genomic controlling frees us from family bondage, and the genetic problem as complicated as mapping genes can now be studied using simple epidemiologic methods.

Keywords: epidemiologic methods; genetic epidemiology; case-control study; single nucleotide polymorphism;

參考文獻

相關文件

Directed numbers 2.1 understand the concept of directed numbers 9 Students are required to represent the directed numbers on the number line.. Students are required to

In 2006, most School Heads perceived that the NET’s role as primarily to collaborate with the local English teachers, act as an English language resource for students,

- Informants: Principal, Vice-principals, curriculum leaders, English teachers, content subject teachers, students, parents.. - 12 cases could be categorised into 3 types, based

Students were required to compare in the formulation stage as the case teacher asked them to look at additional mathematical relationships, whilst they were required to compare in

The prominent language skills and items required for studying the major subjects as identified through analysis of the relevant textbooks are listed below. They are not exhaustive

Then, it is easy to see that there are 9 problems for which the iterative numbers of the algorithm using ψ α,θ,p in the case of θ = 1 and p = 3 are less than the one of the

2-1 註冊為會員後您便有了個別的”my iF”帳戶。完成註冊後請點選左方 Register entry (直接登入 my iF 則直接進入下方畫面),即可選擇目前開放可供參賽的獎項,找到iF STUDENT

The subjects for the present study are 495 first-graded students from five Taiwanese senior high schools, and 270 freshmen from the Department of