生物信息学第二版计算表观遗传学

上传人:桔**** 文档编号:576771957 上传时间:2024-08-20 格式:PPT 页数:145 大小:15.92MB
返回 下载 相关 举报
生物信息学第二版计算表观遗传学_第1页
第1页 / 共145页
生物信息学第二版计算表观遗传学_第2页
第2页 / 共145页
生物信息学第二版计算表观遗传学_第3页
第3页 / 共145页
生物信息学第二版计算表观遗传学_第4页
第4页 / 共145页
生物信息学第二版计算表观遗传学_第5页
第5页 / 共145页
点击查看更多>>
资源描述

《生物信息学第二版计算表观遗传学》由会员分享,可在线阅读,更多相关《生物信息学第二版计算表观遗传学(145页珍藏版)》请在金锄头文库上搜索。

1、生物信息学生物信息学第十章第十章 计算表观遗传学计算表观遗传学哈尔滨医科大学哈尔滨医科大学 张岩张岩生物信息学生物信息学长颈鹿的来源长颈鹿的来源第一节第一节 引言引言Section 1 Introduction 一、表观遗传学(一、表观遗传学(epigeneticsepigenetics)表观遗传学是研究不涉及表观遗传学是研究不涉及DNA序列改变的情况下,序列改变的情况下,DNA甲基化谱、染色质结构状态和基因表达谱在细甲基化谱、染色质结构状态和基因表达谱在细胞代间传递的遗传现象的一门科学。胞代间传递的遗传现象的一门科学。遗传现象象:生物界普遍存在的生物界普遍存在的现象象表表观遗传现象象:生物界

2、普遍存在的另一生物界普遍存在的另一现象象二、计算表观遗传学二、计算表观遗传学应用及开发应用及开发生物信息学方法生物信息学方法(统计分析,模式识统计分析,模式识别等别等)解决生物医学相关的表观遗传学问题。解决生物医学相关的表观遗传学问题。生物信息学构架了基因组学与表观基因组学的桥梁生物信息学构架了基因组学与表观基因组学的桥梁计计算算表表观观遗遗传传学学表观遗传学领域全球发表的论文表观遗传学领域全球发表的论文计算表观遗传学的发展计算表观遗传学的发展三、计算表观遗传学研究方向三、计算表观遗传学研究方向预测的角度研究表的角度研究表观遗传现象。象。应用生物信息学工具建立用生物信息学工具建立遗传与表与表观

3、遗传调控控网网络。表表观遗传数据数据库。建立在表建立在表观遗传机制基机制基础的的功能基因功能基因组及比及比较基因基因组研究研究。四、计算表观遗传学研究内容四、计算表观遗传学研究内容(一)数据层面(一)数据层面分子水平的表观遗传修饰分子水平的表观遗传修饰(二)数据分类(二)数据分类(三)算法层面(三)算法层面开发新开发新方法方法和工具和工具处理及分析表处理及分析表观遗传数据观遗传数据挖掘表观挖掘表观遗传现象遗传现象常用的算法常用的算法统计学方法统计学方法回归分析回归分析相关分析及判别分析相关分析及判别分析聚类分析聚类分析主成分分析主成分分析因子分析因子分析模式识别方法模式识别方法支持向量机支持向

4、量机决策树决策树贝叶斯网络贝叶斯网络最小二乘法最小二乘法最近邻算法最近邻算法(四)功能层面(四)功能层面目的目的有效利用当前已有的高通量表有效利用当前已有的高通量表观基因基因组数据数据单核苷酸多态、单核苷酸多态、DNA甲基化与基因表达之间的关甲基化与基因表达之间的关系,挖掘调控基因表达的关键因子。系,挖掘调控基因表达的关键因子。举例:利用举例:利用DNA甲基化数据预测新的癌症相关基因甲基化数据预测新的癌症相关基因Prioritizing cancer-related genes with aberrant methylation based on a weighted protein-prot

5、ein interaction network.人类蛋白质互作网络人类蛋白质互作网络 癌症相关的子网癌症相关的子网肿瘤肿瘤神经退行神经退行性疾病性疾病心血管心血管疾病疾病精神性精神性疾病疾病代谢性代谢性疾病疾病(一)计算表观遗传学与疾病(一)计算表观遗传学与疾病五、计算表观遗传学的应用五、计算表观遗传学的应用内源性逆转录表达内源性逆转录表达肿瘤抑制基因表达肿瘤抑制基因表达染色质结构异常染色质结构异常 肿瘤表观遗传的特征肿瘤表观遗传的特征精神性疾病精神性疾病DNA甲基化的特征甲基化的特征(二)计算表观遗传学与发育(二)计算表观遗传学与发育发育中育中DNA甲基化的特征甲基化的特征早期胚胎早期胚胎D

6、NA甲基化的特征甲基化的特征(三)计算表观遗传学与进化(三)计算表观遗传学与进化DNA甲基化的甲基化的进化分析化分析DNA甲基化的甲基化的进化分析化分析DNA甲基化的甲基化的进化分析化分析DNADNA甲基化和组蛋白修饰有潜在的临床用途甲基化和组蛋白修饰有潜在的临床用途附加的诊断工具附加的诊断工具预后因子预后因子治疗反应预测治疗反应预测用于普遍临床实践用于普遍临床实践抑癌基因高甲基化和抑癌基因高甲基化和DNA高甲基化谱可用于癌症病高甲基化谱可用于癌症病人预后指示器人预后指示器特定基因的高甲基化可对特定基因的高甲基化可对治疗反应进行预测治疗反应进行预测第二节第二节 基因组的基因组的DNADNA甲基

7、化甲基化Section 2 Genome-wide DNA Methylation一、一、CpGCpG岛的岛的DNADNA甲基化调控基因表达甲基化调控基因表达(一一) DNADNA甲基化与甲基化与CpGCpG岛岛 DNA甲基化是一种甲基化是一种发生在生在DNA序列上的化学修序列上的化学修饰,可以在可以在转录及及细胞分裂前后被胞分裂前后被稳定地定地遗传。DNA甲甲基化是重要的表基化是重要的表观遗传代代码。 DNA甲基化的甲基化的发生机制生机制(二二)DNADNA甲基化对转录的调控甲基化对转录的调控1. DNA甲基化阻碍甲基化阻碍转录因子的因子的结合合2. DNA甲基化甲基化识别染色染色质标记 3

8、. DNA甲基化募集其他蛋白引起染色甲基化募集其他蛋白引起染色质沉默沉默4. DNA甲基化影响核小体定位甲基化影响核小体定位CpG岛甲基化和甲基化和转录的关系的关系(三三)DNADNA甲基化的意义甲基化的意义CpG二核苷酸的甲基化与重复元件沉默二核苷酸的甲基化与重复元件沉默CpG二核苷酸的甲基化与染色体的二核苷酸的甲基化与染色体的选择性沉默性沉默DNA甲基化与基因的甲基化与基因的组织特异表达特异表达二、基因组二、基因组CpGCpG岛识别方法岛识别方法(一)一)CpGCpG岛识别准则岛识别准则Gardiner-Garden和和Frommer长度最短度最短200bpGC含量至少含量至少50%CpG

9、 O/E最小最小0.6许多启多启动子缺乏子缺乏严格定格定义的的CpG岛,但是有,但是有组织特异的甲基化模式和特异的甲基化模式和转录活性有密切活性有密切联系。系。1. 最初的最初的CpG岛定定义2. 改改进的的CpG岛定定义Takai和和Jones增加最短增加最短长度、度、CpG O/E值GC含量分含量分别到到500 bp,0.65% 和和 55%对预测精度精度的影响。的影响。通通过使使阈值更加更加严格,格,Alu重复元件得到最大程度重复元件得到最大程度的排除,但此的排除,但此时却排除了原来数量却排除了原来数量10%的的CpG岛,这表明一些真正的表明一些真正的CpG岛可能也被排除。可能也被排除。

10、常见的常见的CpG岛预测算法岛预测算法预测方法预测方法长度长度(bpbp)GCGC含量含量(% %)CpG CpG O/EO/E重复元重复元件屏蔽件屏蔽备注备注ENSEMBL40050%0.6否否严严格的参数限制格的参数限制NCBI宽宽松松20050%0.6否否总总CpG岛岛数目数目307193NCBI严严格格50050%0.6否否总总CpG岛岛数目数目24163UCSC20050%0.6是是总总CpG岛岛数目数目28226常见的常见的CpG岛预测算法岛预测算法预测方法预测方法长度长度(bpbp)GCGC含量含量(% %)CpG CpG O/EO/E重复元重复元件屏蔽件屏蔽备注备注EMBOSS

11、指定指定指定指定指定指定否否参数可参数可调调CpGProD50050%0.6是是总总CpG岛岛数目数目76793CpGcluster无限无限制制无限制无限制无限制无限制否否总总CpG岛岛数目数目197727CpG_MI50无限制无限制无限制无限制否否总总CpG岛岛数目数目40926差异取决于以下因素差异取决于以下因素(1 1)任意)任意阈值的的应用;用;(2 2)没有考)没有考虑到到CpGCpG岛的异的异质性;性;(3 3)基于)基于DNADNA序列的序列的预测方法忽略了方法忽略了DNADNA甲基化状甲基化状态。举例:窗口法举例:窗口法Analyze a window. Does it mee

12、t CpG island criteria? If not, slide to the right one nucleotideAnd analyze again.And again.Until it meets the criteria Then jump ahead and check the window adjacent to the island on the 3 side.Repeat as needed, until the new window does not meet the CpG island criteriaThen slide the window back tow

13、ard the island.Keep sliding until the window meets CpG island criteria. If it doesnt meet the criteria, try trimming a base pair off each end and analyzing again. 削减削减削减削减削减削减Once it meets CpG island criteria, move on to the next adjacent window and analyze that. (二二)实验方法寻找实验方法寻找CpGCpG岛岛Illingworth等

14、人最近开等人最近开发了一了一项CXXC亲和和纯化技化技术(CAP,CXXC affinity purification)以富集非甲以富集非甲基化的基化的CpG富集的富集的DNA片段片段(CpG岛)。该技技术使用了半胱氨酸富集的使用了半胱氨酸富集的对非甲基化的非甲基化的CpG位位点有高点有高亲和性的和性的CXXC3结构域。构域。CXXC结构域构域对只只包含甲基化的包含甲基化的CpG位点或缺乏位点或缺乏CpG位点的位点的DNA片段片段几乎没有几乎没有亲和性。和性。从小鼠从小鼠Mbd1中得到的重中得到的重组的的CXXC结构域构域对非甲基非甲基化的化的CpG位点有高的位点有高的结合特异性,并被用于从全

15、基合特异性,并被用于从全基因因组DNA中提取中提取CpG岛。他。他们从人从人类血液中提取了血液中提取了超超过17000个个CpG岛。实验方法确定的基因组范围实验方法确定的基因组范围CpG岛图谱岛图谱(三三)CpGCpG岛定位有助于发现新基因岛定位有助于发现新基因CpG岛是重要的调控元件岛是重要的调控元件,可用于新基因的发现。可用于新基因的发现。CpG岛通常是不被甲基化的,作为管家基因的重岛通常是不被甲基化的,作为管家基因的重要标志之一。要标志之一。UCSC数据库的截图展示了三个数据库的截图展示了三个CpG岛岛三、实验检测技术测定三、实验检测技术测定DNADNA甲基化状态甲基化状态(一)一)DN

16、ADNA甲基化的检测方法甲基化的检测方法目前常用的目前常用的DNA甲基化检测方法是将待检序列中甲甲基化检测方法是将待检序列中甲基化的胞嘧啶转化为其他碱基组成的变化。最新的基化的胞嘧啶转化为其他碱基组成的变化。最新的检测方法还用到了基因微阵列(检测方法还用到了基因微阵列(microarray)。)。 1.限制性内切酶法限制性内切酶法2.亲和纯化亲和纯化3.重亚硫酸钠法重亚硫酸钠法1.限制性内切酶法限制性内切酶法使用甲基化敏感的酶检测使用甲基化敏感的酶检测DNA甲基化甲基化2.亲和纯化亲和纯化3.重亚硫酸钠法重亚硫酸钠法(二)基因组范围高通量的(二)基因组范围高通量的DNADNA甲基化检测方法甲基

17、化检测方法高通量测序是最新发展起来的但却是最有前途的全高通量测序是最新发展起来的但却是最有前途的全基因组基因组DNA甲基化分析方法。高通量测序技术的甲基化分析方法。高通量测序技术的出现,使得产生大量序列信息的时间和成本均要出现,使得产生大量序列信息的时间和成本均要低于桑格法。低于桑格法。目前,两种高通量的测序平台最为流行:一种是目前,两种高通量的测序平台最为流行:一种是454生命科学公司开发的焦磷酸测序方法,另外一生命科学公司开发的焦磷酸测序方法,另外一种是种是Illumina前身的前身的Solexa开发的基于荧光核苷酸开发的基于荧光核苷酸的系统。的系统。 技术技术应用应用优势优势局限局限Il

18、lumina磁珠磁珠阵列列甲基化多甲基化多态态性性发现发现和分和分析析定量,多达定量,多达96个个样品品的同的同时快速分析快速分析需要需要设计引物文引物文库,同,同时只能分只能分析析1536个位点个位点Affymetrix芯片芯片全基因全基因组组甲甲基化基化测测定定探探针针密度大,支持物密度大,支持物种多,可定制,价格种多,可定制,价格合理合理短寡核苷酸噪声短寡核苷酸噪声大,大,单单通道通道杂杂交,交,定制芯片昂定制芯片昂贵贵NimbleGen微微阵列列全基因全基因组组甲甲基化基化测测定定长长寡核苷酸探寡核苷酸探针产针产生生更更纯净纯净的数据,双通的数据,双通道道杂杂交,定制芯片不交,定制芯片

19、不昂昂贵贵,价格合理,价格合理较Affymetrix芯芯片的探片的探针密度小密度小DNA甲基化大规模分析可用平台一览表甲基化大规模分析可用平台一览表技术技术应用应用优势优势局限局限Agilent微微阵列列大大规规模甲模甲基化基化测测定定长长寡核苷酸探寡核苷酸探针产针产生更生更纯净纯净的数据,的数据,双通道双通道杂杂交交较Affymetrix和和NimbleGen芯芯片的探片的探针密度小密度小得多得多Solexa测序序全基因全基因组组甲基化甲基化测测定,分析定,分析印印记记位点位点定量化,无需定量化,无需杂杂交,交,并行的基因型信息并行的基因型信息下一代技下一代技术术,需,需要要购买购买昂昂贵贵

20、的的仪仪器或服器或服务务DNA甲基化大规模分析可用平台一览表甲基化大规模分析可用平台一览表四、异常四、异常DNADNA甲基化特征识别甲基化特征识别(一)癌症基因一)癌症基因组整体低甲基化整体低甲基化(二)癌基因的印(二)癌基因的印记丢失失(三)基因超甲基化是癌症的(三)基因超甲基化是癌症的标志志不同癌症之间存在差异不同癌症之间存在差异MeInfoText和和PubMeth数据库汇总了癌症特异的异数据库汇总了癌症特异的异常甲基化信息。使用生物信息学方法有助于进一步常甲基化信息。使用生物信息学方法有助于进一步扩充已知的异常甲基化基因列表的信息。扩充已知的异常甲基化基因列表的信息。第三节第三节 组蛋

21、白修饰的表观基因组组蛋白修饰的表观基因组Section 3 Epigenome of Histone Modifications一、组蛋白密码是重要表观遗传标记之一一、组蛋白密码是重要表观遗传标记之一(一一)核小体与组蛋白修饰核小体与组蛋白修饰1. 核小体与核小体与组蛋白蛋白 组蛋白修饰位点组蛋白修饰位点2. 组蛋白修蛋白修饰与与转录 关于组蛋白修饰在转录中的作用,已经有许多模型关于组蛋白修饰在转录中的作用,已经有许多模型如电中性模型、组蛋白密码以及信号通路模型被提如电中性模型、组蛋白密码以及信号通路模型被提出来。出来。不同的组蛋白修饰类型的作用不尽相同。不同的组蛋白修饰类型的作用不尽相同。组

22、蛋白乙蛋白乙酰化主要促使基因表达和化主要促使基因表达和DNA复制,使复制,使组蛋白乙蛋白乙酰化定位的基因得到化定位的基因得到动态的的调控。控。组蛋白蛋白去乙去乙酰化化则使基因沉默。使基因沉默。组蛋白的磷酸化可以改蛋白的磷酸化可以改变组蛋白的蛋白的电荷,荷,对基因基因转录、DNA修复和染色修复和染色质凝聚等凝聚等过程起程起调控作用。控作用。组蛋白的泛素化可以降解蛋白的泛素化可以降解组蛋白的泛素蛋白的泛素标记,启,启动基因表达。基因表达。3. 组蛋白修蛋白修饰的命名法的命名法 一个组蛋白修饰的精确表示由三部分组成:组蛋白一个组蛋白修饰的精确表示由三部分组成:组蛋白名称名称+组蛋白尾巴上的位点组蛋白

23、尾巴上的位点+修饰类型和个数。修饰类型和个数。例如基因例如基因转录起始位点富集普遍存在起始位点富集普遍存在H3K4me3修修饰,它是,它是组蛋白蛋白H3上,具体的位置上,具体的位置为第四个第四个位置即位置即赖氨酸(氨酸(lysine, K),),该位置存在三个甲位置存在三个甲基基基基团。又如又如H3K9me,则表示表示组蛋白蛋白H3上的第九位置上上的第九位置上的甲基化修的甲基化修饰,但并没有指定甲基集,但并没有指定甲基集团的数目,的数目,则泛指泛指组蛋白甲基化修蛋白甲基化修饰,这些模糊些模糊记法已被广法已被广泛地使用。泛地使用。(二二)激活性和抑制性的组蛋白修饰激活性和抑制性的组蛋白修饰根据对

24、基因起到激活还是抑制作用,组蛋白修饰可根据对基因起到激活还是抑制作用,组蛋白修饰可以大致分为两类:激活性的组蛋白修饰和抑制性的以大致分为两类:激活性的组蛋白修饰和抑制性的组蛋白修饰。组蛋白修饰。激活性的激活性的组蛋白修蛋白修饰中最常中最常见的是的是H3K4me。抑制性的抑制性的组蛋白修蛋白修饰中最常中最常见的是的是H3K27me。(三三)组蛋白密码组蛋白密码1. 动态而又而又稳定的定的组蛋白密蛋白密码 组蛋白的氨基酸残基可以接受蛋白的氨基酸残基可以接受许多种化学修多种化学修饰,包,包括甲基化和乙括甲基化和乙酰化等修化等修饰。质谱分析分析检测到到组蛋白蛋白H2A有有13个可以接受修个可以接受修饰

25、的位点,的位点,H2B、H3和和H4则分分别有有12个,个,21个和个和14个可以接受修个可以接受修饰的位点。的位点。每个氨基酸残基位点可以每个氨基酸残基位点可以发生至少一种化学修生至少一种化学修饰。 2. 细胞分化胞分化过程中的程中的组蛋白密蛋白密码 组蛋白修蛋白修饰的的调控在控在许多生理多生理过程中起到重要作用,程中起到重要作用,这其中就包括其中就包括细胞分化。研究胞分化。研究发现组蛋白乙蛋白乙酰化化对维持持细胞的未分化和多能状胞的未分化和多能状态十分重要。使用十分重要。使用组蛋白去蛋白去乙乙酰酶抑制抑制剂有助于有助于维持干持干细胞的多能性胞的多能性(pluripotency)。)。相反,

26、用去乙相反,用去乙酰酶抑制抑制剂刺激人刺激人类成熟成熟细胞或癌症胞或癌症细胞会胞会诱导分化的分化的进行。因此,表行。因此,表观遗传调控控对于于细胞成熟至关重要。到底是什么胞成熟至关重要。到底是什么类型型组蛋白修蛋白修饰或或组蛋白修蛋白修饰组合控制分化呢?如前所述,合控制分化呢?如前所述,组蛋白乙蛋白乙酰化有助于保持化有助于保持细胞的多能性。胞的多能性。 细胞分化过程中的组蛋白修饰变化细胞分化过程中的组蛋白修饰变化 (一一)测定组蛋白修饰的高通量技术测定组蛋白修饰的高通量技术二、组蛋白修饰二、组蛋白修饰的的高通量测定及分析技术高通量测定及分析技术检测技术检测技术ChIP-chipChIP-chi

27、pChIP-SAGEChIP-SAGEChIP-SeqChIP-Seq定量性定量性受受杂杂交效率影交效率影响响定量定量定量定量分辨率的影响分辨率的影响因素因素染色染色质长质长度及度及探探针针密度密度酶酶切效率切效率染色染色质长质长度,度,测测序深序深度度全基因全基因组组范范围围实验实验花花销销多多多多少少实验对实验对于于测测定定区域的局限性区域的局限性局限于局限于预设预设的的基因基因组组区域区域受受酶酶切位点切位点的限制的限制可覆盖大部分基因可覆盖大部分基因组组区域区域ChIPchip来自来自Genome-wide approaches to studying chromatin modifi

28、cationsChIPSAGEChIPSeq(二二)分析基因组范围的组蛋白修饰数据分析基因组范围的组蛋白修饰数据1. 高通量高通量组蛋白修蛋白修饰分析工具分析工具Tiling ArrayTileMap 基于模型的瓦式芯片分析算法(基于模型的瓦式芯片分析算法(model-based analysis of tilingarray algorithm, MAT)。)。 ChIP-SeqCisGenomeMACS2. 组蛋白修蛋白修饰峰峰值探探测 与其他基于与其他基于ChIP的高通量技的高通量技术一致的是,从一致的是,从ChIP-Seq标签数据数据鉴别出可靠的出可靠的组蛋白修蛋白修饰谱,等价于,等价

29、于寻找一段基因找一段基因组区域内的区域内的统计学学显著的著的组蛋白修蛋白修饰标签的峰。的峰。一个最直接的想法是,一个最直接的想法是,对于一段于一段长度一定的基因度一定的基因组区域来区域来说,包含,包含R个序列个序列标签可以从可以从统计学水平支学水平支持持这段区域被段区域被组蛋白修蛋白修饰所定位。所定位。一般原理一般原理构造背景分布:构造背景分布:泊松分布泊松分布例:人例:人类基因基因组gsize=3.0E9*0.8=2.4E9窗窗宽w基因基因组期望的期望的标签数(数(CD4+ T细胞胞H3K9me3)求求 使使 0.01当当R=3时,p=0.0021,满足要求。所以,以足要求。所以,以w为窗窗

30、宽,将基因,将基因组打碎,以打碎,以d为步步长,移,移动窗口,找出窗口,找出满足大于足大于3个个标签的窗口,合并后即的窗口,合并后即为组蛋白修蛋白修饰H3K9me3定位区域。定位区域。三、组蛋白修饰与其他表观遗传修饰三、组蛋白修饰与其他表观遗传修饰的的协同调控协同调控(一)(一)DNA甲基化和甲基化和组蛋白修蛋白修饰的相互作用的相互作用(二)通(二)通过贝叶斯网叶斯网络重构表重构表观遗传修修饰协同同调控基因表控基因表达网达网络四、组蛋白修饰异常与人类疾病四、组蛋白修饰异常与人类疾病(一一)异常)异常组蛋白修蛋白修饰模式模式与与癌症癌症(二二)组蛋白修蛋白修饰与其他疾病与其他疾病(三三)食品食品

31、营养与养与组蛋白修蛋白修饰第四节第四节 基因组印记基因组印记Section 4 Genomic Imprinting一、基因组印记是表观遗传现象一、基因组印记是表观遗传现象基因基因组印印记是在母是在母本和父本之本和父本之间产生生功能性区功能性区别并在哺并在哺乳乳动物物发育与生育与生长中起重要作用的一中起重要作用的一种表种表观遗传学机制。学机制。二、基于生物信息学方法识别新印记基因二、基于生物信息学方法识别新印记基因 目前目前实验测得印得印记基因的主要方法是利用基因的主要方法是利用DNA甲基甲基化和基因表达分析基因的印化和基因表达分析基因的印记情况,只关注染色体的情况,只关注染色体的一小段区域。

32、由于基因的一小段区域。由于基因的单等位表达可能只等位表达可能只发生在特生在特定定亚型、型、组织或或发育育阶段,所以段,所以实验确定印确定印记基因面基因面临很多很多问题。主要主要预测印印记基因的方法是用机器学基因的方法是用机器学习方法基于基因方法基于基因的序列特征的序列特征预测全基因全基因组印印记基因。基因。常用的模式识别方法常用的模式识别方法支持向量机(支持向量机(SVM)径向基神径向基神经网网络(RBF)隐马尔可夫模型可夫模型Logistic回回归主成分分析和二次判主成分分析和二次判别分析分析DNADNA序列特征序列特征CpG岛岛和和GC含量含量重复序列重复序列长长散在核元件(散在核元件(L

33、INEs)短散在核元件(短散在核元件(SINEs)简单简单重复序列重复序列DNA elements低复低复杂杂度重复序列度重复序列长长末端重复序列(末端重复序列(LTRs)基于主成分分析和二次判别的预测模型基于主成分分析和二次判别的预测模型三、印记基因的表观遗传异常与人类疾病三、印记基因的表观遗传异常与人类疾病印印记基因基因对哺乳哺乳动物的物的发育是至关重要的,哺乳育是至关重要的,哺乳动物物的基因印的基因印记抑制基因表达,印抑制基因表达,印记基因的异常表达会基因的异常表达会导致多种人致多种人类疾病。研究疾病。研究发现许多印多印记基因基因对胚胎和胎胚胎和胎儿出生后的生儿出生后的生长发育有重要的育

34、有重要的调节作用,作用,对行行为和大和大脑的功能也有很大的影响,印的功能也有很大的影响,印记基因的异常同基因的异常同样可可诱发癌症。癌症。第五节第五节 表观遗传表观遗传学学数据库及软件数据库及软件Section 5 Databases and Softwares in Epigenetics一、表观遗传学常用数据库一、表观遗传学常用数据库 1.人人类表表观基因基因组计划数据划数据库2.表表观基因基因组图谱3.人人类DNA甲基化与癌症数据甲基化与癌症数据库Epigenome ProjectRivera, C.M., and Ren, B. (2013). Mapping human epigen

35、omes. Cell 155, 39-55.Epigenome Data ResourcesEpigenome BrowserRahul Karnik1 and Alexander Meissner (2013). Browsing (Epi)genomes: A Guide to Data Resources and Epigenome Browsers for Stem Cell Researchers. Cell Stem Cell 13, 14-21.Local Epigenome BrowserUCSC Genome Browser 本地化本地化http:/ of Different

36、ially Methylated Regions (DMRs)Case and ControlMultiple CasesCase and ControlMultiple CasesEntropy差异甲基化区域的识别差异甲基化区域的识别QDMRQDMR导入甲基化数据导入甲基化数据定量甲基化差异定量甲基化差异筛选差异甲基化区域筛选差异甲基化区域定量差异甲基化区域的特异性定量差异甲基化区域的特异性导出分析结果导出分析结果使使用用流流程程导入甲基化数据导入甲基化数据目目前前QDMR只只接受接受txt文件文件浏览本地甲基浏览本地甲基化数据文件化数据文件例子甲基化数据例子甲基化数据数据中最大的数据中最大

37、的甲基化值甲基化值物种信息物种信息区域列信息区域列信息样本开始的列样本开始的列甲基化数据预览甲基化数据预览定量甲基化差异定量甲基化差异熵表示甲基化差异的大小,熵表示甲基化差异的大小,熵越小表示各样本间的甲熵越小表示各样本间的甲基化差异越大基化差异越大通过点击上面的某一行,通过点击上面的某一行,来查看相应区域在各样本来查看相应区域在各样本中的甲基化值中的甲基化值识别差异甲基化区域识别差异甲基化区域根据生物学研究的要求选根据生物学研究的要求选择合适的筛选差异甲基化择合适的筛选差异甲基化区域的阈值区域的阈值软件自动筛选差异甲软件自动筛选差异甲基化区域和非差异甲基化区域和非差异甲基化区域基化区域差异甲

38、基化区域差异甲基化区域非差异甲基化区域非差异甲基化区域差异甲基化区域的样本特异性差异甲基化区域的样本特异性利用绝对特异性利用绝对特异性CS表示差表示差异甲基化区域在各样本中异甲基化区域在各样本中的甲基化特异性,的甲基化特异性,大于大于0表示特异高甲基化,表示特异高甲基化,小于小于0表示特异低甲基化,表示特异低甲基化,等于等于0表示无特异性表示无特异性结果统计及差异甲基化区域分布结果统计及差异甲基化区域分布QDMR筛选筛选结果统计结果统计差异甲基化区域在差异甲基化区域在相应物种各染色体相应物种各染色体上的分布图上的分布图可以右击设可以右击设置保存该图置保存该图导出结果及后继分析导出结果及后继分析QDMRQDMR的帮助文档的帮助文档简洁的软件用户指南简洁的软件用户指南 http:/ CD4+T细胞特异低甲基化胞特异低甲基化T-DMR与激活型与激活型组蛋白修蛋白修饰相关;相关;CD4+T细胞特异高甲基化胞特异高甲基化T-DMR与抑制性与抑制性组蛋白修蛋白修饰相关。相关。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号