基因型填充综述

上传人:鲁** 文档编号:470970254 上传时间:2023-01-16 格式:DOCX 页数:2 大小:9.27KB
返回 下载 相关 举报
基因型填充综述_第1页
第1页 / 共2页
基因型填充综述_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《基因型填充综述》由会员分享,可在线阅读,更多相关《基因型填充综述(2页珍藏版)》请在金锄头文库上搜索。

1、基因型填充基因型填补是指依据已分型位点的基因型对数据缺失的位点或者未分型位点进行基因型预 测的方法。对分型缺失率较高的基因芯片进行填补可以提高全基因组遗传标记的覆盖率及研 究效率,增加阳性关联位点的筛查成功率。基因型填补还可以应用于精细定位,填补已确认 的关联位点附近的位点,以便评价相邻SNP位点关联证据,加快复杂疾病易感基因的定位。 同时,基因型填补还可以降低直接分型的成本,对不同基因型分型平台合并导致丢失的大量 缺失的基因型进行填补,可有助于对这些数据的联合分析和Meta分析。基因型填充对GWA 研究发挥越来越重要的作用,并仍将成为GWA研究的重要工具之一,因此也成为了生物信 息领域研究的

2、重点和热点。基于位点间的连锁不平衡(LD),目前的基因型填充主要分成两大类,一类是家系数据 中的基因型填补,另一类是无关个体中的基因型填补。两者填充时的主要区别是家系成员中 的共享染色体段比较长(一般长达几百万碱基对,包含数千个SNP),而无关个体中共享染 色体区域比较短,这就使得寻找匹配的单倍型成为一个挑战。基因型填充所用的参数估计算 法包括期望值最大算法(EM)和马科夫链蒙特卡罗算法,用EM算法进行参数估计计算效 率相对较高,但容易陷入局部最大值;MACH不仅仅只是局部最大值,也有利于发现那些 频率较小却对疾病或表型有重大影响的等位基因,这种方法迭代次数较多,计算时间也随着 增加。现有的基

3、因型填充方法主要基于以下几种统计模型:单体型聚类算法、隐马尔科夫 模型、马尔科夫模型。这几年发展起来的用于基因型填充的软件分为两类:一类是填补每个缺失基因型的时候 考虑所有分型位点,这类的软件有Imputevl、ImputeV2、FastPHASE、MACH、BIMBAM; 另一类是填补时只考虑基因型缺失位点附近的一些已分型的位点,这类软件包括:PLINK、 TUNG、WAHP、BEAGKEo Impute在分析时假设每个个体之间基因型是独立的,imputev1 利用双倍型预测,imputev2利用单倍型预测,所以imputev2的计算时间复杂度比imputev1 低。同时imputev2也适

4、用于来自不同研究组的基因型数据,其计算效率相对其他较高,但 是当表型与基因分型平台密切相关的时候,Howise et al.发现,如果在不同的芯片上输入病 例组和对照组的数据,则对单倍体参照面板中的病例组和对照组预测未分型的SNP基因型, 会导致假阳性率增加。FastPHASE灵活适用于连锁不平衡模式和大型数据集,在大量染色 体情况下,计算复杂度只是线性增加,但要对模型的很多参数进行估计,这会减慢计算速度, 同时,当使模型的最大似然函数最大化时,会产生较高的错误率。MACH是基于马科夫链 的设计,通过蒙特卡罗方法迭代更新单倍型对,同时模型参数也在每次迭代中更新,这使其 能更灵活地进行数据集的分

5、析,但实际上,对有些参数的估计并不是很准确,从而降低了该 方法的计算效率。BEAGKE适用于局部单倍型多样的情况,所占的内存较小,但精确度比 不上MACH和Impute。PLINK、TUNG、WAHP是基于标签SNP的填充方法,这些方法简 单快速,但由于没有使用所有的数据,所提供的结果不是很准确。大部分这些软件将基因型填充都分为两个阶段,第一阶段为研究样本寻找匹配的单倍型 参照面板进行基因型填充,第二阶段是对填充的基因型数据进行关联检测。目前的参照面板 主要来自于HapMap的数据和1000 Genome基因计划,还有一种获取参照面板的方法是从 研究样本中选择一个子样本,对这个样本进行较多位点

6、的分型,作为参照面板,这种方法虽 然比直接使用HapMap和1000 Genome填充的基因型具有更高的准确度,但是基因费用高。 随着参照集越来越大越来越多样,参照面板选择策略也越来越难且越来越难解释,因此参照 面板的选择成为了基因型填充的紧迫问题。现在出现一种利用局部序列的相似性,为每个基 因区域的单倍型研究自定义一个参照面板的方法,这个方法提高了使用可用单倍型参考面板 的效率,同时不用选择参照面板,也可以提高对低频率变量填充的准确度,但这个适用范围 有限,目前对GWAS数据集中的序列还不适用,但这是用建立范式思想解决参照面板选择 问题所迈出的第一步。另外,结合各种统计模型,改善基因型填充算法,如用于填补拷贝数 变异的方法,也是目前基因型填充研究的关键问题。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号