连锁关联分析在疾病研究中的探讨

上传人:豆浆 文档编号:48452384 上传时间:2018-07-15 格式:PPT 页数:58 大小:5.79MB
返回 下载 相关 举报
连锁关联分析在疾病研究中的探讨_第1页
第1页 / 共58页
连锁关联分析在疾病研究中的探讨_第2页
第2页 / 共58页
连锁关联分析在疾病研究中的探讨_第3页
第3页 / 共58页
连锁关联分析在疾病研究中的探讨_第4页
第4页 / 共58页
连锁关联分析在疾病研究中的探讨_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《连锁关联分析在疾病研究中的探讨》由会员分享,可在线阅读,更多相关《连锁关联分析在疾病研究中的探讨(58页珍藏版)》请在金锄头文库上搜索。

1、1晶能生物技术(上海)有限公司 Hanson Zheng 郑汉城 连锁、关联分析在疾病研究中的探讨2Life is the translation of the information in the genome into the phenotype of the organismThe organism ,computes this phenotype from its genotype , given a specific environment3GenotypeMethylationCNVPhenotypeEnvironment41.24%0.1%5DNADNA序列的差异影响。序列的差异

2、影响。眼睛颜色眼睛颜色身高身高疾病疾病个性个性药物反应药物反应6Cystic fibrosisCoronary heart disease基因环境InfectionRadiation injuryBipolar disorderCancerHuntingtons disease少数单基因疾病大多数疾病是多基因疾病多种基因和环境共同作用的疾病复杂的机制7*单基因疾病 疾病的发生是由“单”基因的突变所致(一 对主基因):致病基因单基因疾病不多见,但由于其遗传性,危 害很大单基因疾病如:囊性纤维肿瘤,血友病, 血色沉着病等8多基因疾病多基因疾病是由两对以上基因突变所致,且环境因素在 这类疾病的发生中

3、起不同程度作用的一类疾病:易感基 因。如:肿瘤,高血压、动脉粥样硬化、糖尿病、哮喘、自 身免疫性疾病、老年痴呆、癫痫、精神分裂症、类风湿 关节炎、智能发育障碍等9*人基因组包含了人基因组包含了3x103x109 9个碱基个碱基 A AGGT TCCCCT TA AGGCCCCT TGGT TGGA AT TA AT TA AGGGGGGCCCCCCT TA AGGA AT TC CA A. .如何从茫茫基因组中找出致病或易感基因?10*遗传标记是在染色体上有可以确定的物理位置的DNA片 段,它有一定的遗传特征。标记可以是一个基 因,也可以是未知功能的DNA片段。因为 DNA片段在染色体上相互

4、接近因而能同时遗 传,标记通常被用作跟踪未被确定但大致位置 已知的基因。11*遗传标记发展第一代遗传标记:RFLP restrict fragment length polymorphism限制性片段长度多态性第二代遗传标记:STRs short tandem repeats短串联联重复序列第三代遗传标记: SNP single nucleotide polymorphism 单核苷酸多态性 12*第一代:限制性片段长长度多态态性RFLPs ( restriction fragment length polymorphisms)1980年,Botstein首次提出。 1987年,第一张较完整的

5、人基因连锁图,包含393个 RFLP位点。 亨廷顿舞蹈症(Huntington)成为第一个使用RFLP定 位的遗传病。 缺点:数目少,信息量小;成本昂贵,操作繁琐,不 易发展到自动化水平。13*STR广泛存在于人基因组,占约5%,基本单位是2bp -6bp的串联重复,其中以(CA)n ,(GT)n常见。 1996年,建立了以6000多个STR为主体的遗传图谱 ,两个标记之间的平均距离为0.7cM。 特点:数目比第一代标记多一些,多态性多。第二代:短串联联重复序列 STRs (short tandem repeats)14*第三代:SNP最普遍的遗传变异标记单核苷酸多态性(SNPs):在基因组中

6、,不同个体的DNA序列上的单 个碱基的差异SNP是目前进行疾病研究最为有效的遗传标记15SNPs: 最普遍的遗传变异标记l1/1000: 任何两个个体具有99.9% 的序列同源性l1/300: 每300bp出现一个SNP位点l90% 变异: SNP是最普遍的序列变异l不均匀分布: SNP在基因组中不均匀分布l10,000,000 SNP: 人类基因组中约有一千万个SNP位点,任何两个个体约有几百万的差 异16单体型(haplotype):相邻SNPs的等位位点倾向于以一个整体遗传给后代; 位于 染色体上某一区域的一组相关联的SNP等位位点 标签SNP(tagSNP):一个染色体区域可以有很多S

7、NP位点,能代表其他位点信息 的SNP位点称为标签SNP ;用少数几个标签SNPs,就能够提供该区域内大多数 的遗传多态模式; 50万个较常见的SNP,基本上代表了1000万个SNP SNPs: 最普遍的遗传变异标记17遗传学分析方法18方法一:关联分析(Associated Studies)在大人群中进行,不考虑家族遗传的方式,分析观察的遗传标记位点等 位基因和易感基因位点间存在连锁不平衡(Linkage Disequilibrium Analysis, LD)。连锁不平衡表示两位点是紧密连锁的,两位点越靠近则 LD程度越强。因此,标记位点与致病基因越近,突变率越低,杂合度越 高,用遗传标记

8、检出致病基因位点的机率越高。 连锁不平衡分析需要高密度的遗传标记,可用于基因的精细定位。 1920*如研究的疾病区域未知全基因组SNP分型检测芯片21*全基因组扫描无需实验假设/遗传模式支持 无需依赖少数位点 同时发现和疾病或某性状相关的多个位点 检出率高 定位精确22*全基因组分型扫描解决方案一:一步法对大人群样品进行全基 因组扫描扫描费用?对所有样品进行全基因组扫描23*全基因组分型扫描方案二:两步法1. 对小数量样品进行全基因组分型扫描 (100-200样品) 2. 设定 p-值(0.01)筛选出下一步要研究的位点3.进行大样品数的检测24*1,2,3,N1,2,3,MSNPs样品一步法

9、一步法Stage 1Stage 2样品标记两步法两步法1,2,3,MSNPsSamples1,2,3,N一步法和两步法全基因组分型扫描比较 25*多步设计降低实验成本 -illumina提供完整平台InfiniumGoldenGateGoldenGate26疾病对照122要研究的SNP位点疾病对照的关联分析疾病标记SNP位点27在大人群中进行遗传分析在大人群中进行遗传分析+= 2,000 人1000 病人Cases 病例1000 正常人Controls 对照病例对照的关联分析28病例-对照的关联分析有很多的优点:无亲缘关系的样本比较容易收集;是一种非参数分析,无需设定疾病的遗传模式;检出率较高

10、,尤其适于定位微效基因;定位精确,检出的遗传标记位点与致病基因的距离通常在1cM之内;可以提示相关位点或基因的传递方式及效应性质,并可由亚组分析发 现疾病的遗传异质性。基于病例-对照的关联分析在近几年的研究中逐渐占领了主导地位 ,成功的将一系列复杂疾病的易感基因定位到染色体的相对较 精确的位置。29检验遗传标记(等位基因、基因频率或是 单体型)在病例组的频率是否显著异于对 照组。如果得到阳性关联的结果,排除 各种混杂因素(如人群分层)之后,可以推 断该遗传标记存在于疾病易感基因基因 座内或者与易感基因座连锁不平衡。关联分析的原理30GWAS关联分析成功的关键(Biological Factor

11、s)l Population stratification l Minor Allele Frequency l Effect Size of Variants l Prevalence of phenotype l Phenotypic heterogeneity31GWAS关联分析成功的关键 (Technical Factors)Sample Size: Affects power to detect an associationLD/ Genomic coverage:Global CoverageLocal CoverageGene CoverageData Quality: Call

12、 Rate Accuracy Random errors32Sample Size: It is important to differentiate between:Required and Effective Sample SizeRequired sample size: Sample size needed to achieve statistical significance at a desired powerEffective sample size: r2 x required sample size Sample size based on the genomic cover

13、age of the genotyping product used (LD/Correlation)33TagSNPs provide optimized Power for WGA studiesDSL: disease susceptibility locusDisease PhenotypeTest for genetic association between the phenotype and the DSLMarkerLinkage DisequilibriumTest for association between phenotype and marker locusRequi

14、red Sample SizeDNAPhenotypeGenomic CoverageEffective Sample Size34Sample Size: “Required” versus “Effective” Sample SizeRequired sample sizes to achieve 80% power in a case/control study for a significance level of 10-7 with a disease relative risk of 1.3. This calculation assumes that the disease a

15、llele is typed directly (Required Sample Size = Effective Sample Size).35The interpretation of r2r2 x sample size is the “effective sample size” A study with 1000 cases and controls and an r2 of 0.8 has an effective sample size of 800 cases and controls (N x r2) (as if typing the disease causing SNP

16、 directly)Goal: The markers that are genotyped should be selected so that they have high r2-values (preferable 80%) with the marker that are not genotyped. The higher the r2 the better your powerA good SNPs selection will be key for the success of GWAs36LD/Genomic coverage: Not all SNPs are equally informative Need to select a panel with adeq

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号