基因组测序与序列组装教学文案

上传人:youn****329 文档编号:135361108 上传时间:2020-06-15 格式:PPT 页数:81 大小:1.70MB
返回 下载 相关 举报
基因组测序与序列组装教学文案_第1页
第1页 / 共81页
基因组测序与序列组装教学文案_第2页
第2页 / 共81页
基因组测序与序列组装教学文案_第3页
第3页 / 共81页
基因组测序与序列组装教学文案_第4页
第4页 / 共81页
基因组测序与序列组装教学文案_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《基因组测序与序列组装教学文案》由会员分享,可在线阅读,更多相关《基因组测序与序列组装教学文案(81页珍藏版)》请在金锄头文库上搜索。

1、第一讲基因组测序与序列组装 任科教师 余爱丽生命科学院分子生物学与生物信息学系 主要内容 什么是基因组什么是基因DNA测序的方法DNA序列的组装人类基因组计划水稻基因组计划后基因组学 Zeamays8 000Homosapiens3 000Oryzasativa400Drosophilamelanogaster165Arabidopsisthaliana100Saccharomycescerevisiae12E coli4 6 GenomeSize Mb 什么是C值 通常是指一种生物单倍体基因组DNA的总量 在真核生物中 C值一般随着生物的进化而增加 高等生物C值一般大于低等生物 C值悖理 生

2、物的复杂性与基因组的大小并不完全成比例增加 阴影部分为一个门内C 值的范围 重复顺序 高度重复顺序 长度 几个 几千个bp拷贝数 几百个 上百万个首尾相连 串联排列集中分布于染色体的特定区段 如端粒 着丝粒等 也称卫星DNA中度重复顺序 一般分散于整个基因组中 长度和拷贝数差别很大单一顺序 基因主要位于单一顺序动物中单一顺序约占50 植物中单一顺序约占20 DNA的复性遵循二级反应动力学 可表述为 dCt dt KC02 反应达t时 单链DNA浓度 Ct C0 单链DNA起始浓度K 复性速度常数 顺序复杂性 Cot 1 2 1 K mol Sec L 常数 Ct C0 0 1 0 1 C0t

3、1 2 C0t 1 2 C0t 1 2 值与基因组复杂性成正比 是遗传信息的物理和功能单位 包含产生一条多肽链或功能RNA所必需的全部核苷酸序列 基因分类 编码RNA的基因 如rRNA基因 snRNA基因等 编码蛋白质的基因 2 什么是基因 基因的不连续性 Intron和Exon 大多数真核生物蛋白质基因的编码顺序 Exon 都被或长或短的非编码顺序 Intron 隔开 基因家族 一群具有一致的或相似顺序的基因 有的还担负类似的生物学功能 可以相互补偿 比如 E2ftranscriptionfactor 假基因 Pseudogene 来源于功能基因但已失去活性的DNA序列产生假基因的原因有 由

4、重复产生的假基因 加工的假基因 由RNA反转录为cDNA后再整合到基因组中 残缺的基因 Truncatedgene 重叠基因 同一段DNA能携带两种不同蛋白的信息 重迭基因有以下几种情况 一个基因完全在另一个基因内部 部分重叠 两个基因共用少数碱基对 一个基因完全在另一个基因内部如 B和A E和D其读码结构互不相同 部分重叠如 K和C 两个基因共用少数碱基对如 D和J TAATG D终止密码子 J起始密码子 3 DNA测序的方法链终止法测序化学降解法测序自动化测序非常规DNA测序 3 1链终止法测序 thechainterminationmethod 基本原理 通过合成与单链DNA互补的多核苷

5、酸链 由于合成的互补链可在不同位置随机终止反应 产生只差一个核苷酸的DNA分子 从而来读取待测DNA分子的顺序 技术路线与要求 制备单链模板 将单链模板与一小段引物退火 加入DNA多聚酶4种脱氧核苷酸分别加入少量4种双脱氧核苷酸 将4种反应产物分别在4条泳道电泳 根据4个碱基在4条泳道的终止位置读出基因序列 A克隆于质粒中DNA 用碱或热变性BM13克隆单链DNAC噬粒克隆DNADPCR产生单链DNA A高酶活性B无5 3 外切酶活性C无3 5 外切酶活性 ddATP ddCTP ddGTP ddTTP的3 碳原子连接的是氢原子 不是羟基 3 2化学降解法测序基本原理 在选定的核苷酸碱基中引入

6、化学集团 再用化合物处理 使DNA分子在被修饰的位置降解 技术路线 将双链DNA样品变为单链 每个单链的同一方向末端都用放射性同位素标记 以便显示DNA条带 分别用不同方法处理 获得只差一个核苷酸的降解DNA群体 电泳 读取DNA的核苷酸顺序 Maxam Gilbert法所用的化学技术 化学法测序实例 哌啶 3 3自动化测序 基本原理与链终止法测序原理相同 只是用不同的荧光色彩标记ddNTP 如ddATP标记红色荧光 ddCTP标记蓝色荧光 ddGTP标记黄色荧光 ddTTP标记绿色荧光 由于每种ddNTP带有各自特定的荧光颜色 而简化为由1个泳道同时判读4种碱基 3 4非常规测序毛细管电泳用

7、毛细管电泳取代聚丙烯凝胶平板电泳 节省时间 加快测序进程 其他程序同链终止法或化学测序法 光点测序脱氧三磷酸核苷酸连接到DNA3 末端时会释放1个焦磷酸 PPi 焦磷酸在磷酸化酶的作用下转化为化学能 并发出光亮 由此 往反应液中每次只加入1种核苷酸 当加入的核苷酸结合时 反应液发出亮点 并记录核苷酸种类 当核苷酸未结合时 反应液中的核苷酸酶迅速分解此核苷酸 由此来测定DNA序列 DNA芯片测序基本原理将各种排列顺序的寡核苷酸点播在芯片上 每个点播的寡核苷酸在排列的方阵中都有指定的位置 待检测的DNA分子与芯片温浴 凡是能杂交的寡核苷酸都会在确定位置发出信号 然后根据获取的信息将寡核苷酸的顺序进

8、行对比组装 拼接成完全的DNA顺序 利用基因芯片进行杂交测序的原理 4序列的组装 4 1随机测序与序列组装随机测序也称 鸟枪法 序列组装原理 直接从已测序的小片段中寻找彼此重叠的测序克隆 然后依次向两侧邻接的序列延伸 优点 不需预先了解任何基因组的情况 A B C A B C A B C A B C 小片段测序 计算机拼装 A B C 小片段测序 计算机拼装 鸟枪法 Shotgun 测序的问题 CAATGCATTA GCAGCCAATGC GAP 错装 实例 流感嗜血杆菌基因组的测序及顺序组装 超声波打断纯化的基因组DNA 琼脂糖电泳收集1 6 2 0Kb的区段 纯化 构建到质粒载体中 随机挑

9、选19687个克隆 进行28643次测序 得到可读顺序为11631485bp 组装成140个覆盖全基因组范围的独立的顺序重叠群 各重叠群间仍有间隙顺序间隙物理间隙 载体或宿主菌选用不当而被丢失的顺序 测序时遗漏的测序 解决办法 通过相邻已知顺序作为探针筛选已有的基因组文库 解决办法 利用其它宿主菌与载体重新构建文库 4 2限制测序 限制测序 是指将一段染色体区段的DNA顺序进行组装 一些已绘制了遗传图与物理图的微生物基因组测序中也采用这一方法 如高等植物拟南芥基因组的测序完全依据克隆重叠群 先进行各个BAC克隆的随机测序 再进行序列组装 水稻基因组测序计划采取得策略与此相同 4 3指导测序与序

10、列组装 建立在基因组图谱基础上的 鸟枪法 即所谓 指导鸟枪法 或 指导测序 在人类基因组进入测序组装阶段就采用此方法 其基本步骤如下 A构建平均为2Kb的人类基因组质粒文库 进行双向测序 B构建平均10Kb的人类基因组质粒文库 进行双向测序 读取2个端部顺序 C参考人类基因组图 特别是大量的STS位标作为基点 进行序列组装 排成重叠克隆群 先将染色体打成比较大的片段 几十 几百Kb 利用分子标记将这些大片段排成重叠的克隆群 Contig 分别测序后拼装 这种策略叫基于克隆群 contig based 的策略 A B C A B C 大片段contig 小片段测序拼装 两种策略的比较 鸟枪法策略

11、指导测序策略不需背景信息构建克隆群 遗传 物理图谱 时间短需要几年的时间需要大型计算机得到的是草图 Draft 得到精细图谱 4 5其他测序路线 重要区域优先测序人们对感兴趣的基因或与疾病相关的基因优先测序 如 人类主要组织相容性复合区位于第6号染色体 与人类免疫系统有关 因而优先测序 EST Expressedsequencetag 测序EST是一种重要的基因组图分子标记 以EST为探针很容易从cDNA文库中筛选全基因 又可从BAC克隆中找到其基因组的基因序列 优点 AmRNA可直接反转录成cDNA 而且cDNA文库也比较容易构建 B对cDNA文库大量测序 即可获得大量EST的序列 CEST

12、为基因的编码区 不包括内含子和基因间区域 一次测序的结果足以鉴定所代表的基因 5 人类基因组计划 人类基因组计划 Humangenomeproject 于1990年启动 我国于1999年加入该计划 承担其中1 的任务 即人类3号染色体短臂上约30Mb的测序任务 5 1人类基因组计划的目的 阐明人类基因组30亿个碱基对的序列 发现所有人类基因 并搞清其在染色体上的位置 破译人类全部遗传信息 使人类第一次在分子水平上全面地认识自我 解码生命 了解生命的起源 了解生命体生长发育的规律 认识种属之间和个体之间存在差异的起因 认识疾病产生的机制以及长寿与衰老等生命现象 为疾病的诊治提供科学依据 5 2人

13、类基因组草图的完成 2000年6月26日是人类历史上值得纪念的一天 人类基因组的工作草图已经绘制完毕并于这天向全世界公布 最终完成图要求测序所用的克隆能忠实地代表常染色体的基因组结构 序列错误率低于万分之一 A CeleraGenomics人类基因组的测序策略 5 3人类基因组测序策略 采集5个自愿者的DNA样品 构建3种不同插入子大小的基因组文库2Kb 10Kb和50Kb 完成约2700万次插入子末端测序 总长14800Mb GeneBank下载104018个BAC末端顺序 PFP发表的公开数据主要为BAC克隆的顺序 共4443 3Mb 随机测序与序列组装方法和指导测序与序列组装方法相结合进

14、行序列组装 B国际人类基因组测序策略构建BAC克隆 限制性酶处理获得指纹 根据指纹重叠方法组建BAC克隆重叠群 根据STS标记 将BAC克隆重叠群标定在物理图上 每个BAC克隆内部采用鸟枪法测序 组装 将BAC插入顺序与BAC克隆指纹极重叠群对比 将已阅读的顺序锚定到物理图上 5 4人类基因组测序结果 基因数是3万 4万还是10万人类遗传基因数量比原先估计的少很多 目前研究表明 人类基因组中约有3万至4万个蛋白编码基因 仅仅是果蝇基因数目的两倍 人有而鼠没有的基因只有300个 此结论是由两大科研小组的数据是从DNA水平上得出的 而 人类有10万多个基因 则是从RNA水平上得出的结论 所以 这些

15、数据不能推翻 人类有10万个基因 的说法 人类基因组研究的惊人发现 19号染色体是含基因最丰富的染色体 而13号染色体含基因量最少 目前已经发现和定位了26000多个功能基因 其中尚有42 的基因尚不知道功能 人类基因组中存在 热点 和大片 荒漠 在染色体上有基因成簇密集分布的区域 也有大片的区域只有 无用DNA 不包含或含有极少基因的成分 基因组上大约有1 4的区域没有基因的片段 35 3 的基因包含重复的序列 这说明那些原来被认为是 垃圾 的DNA也起重要作用 应该被进一步研究 什么是单核苷酸多态性 人类99 9 的基因密码是相同的 而差异不到0 1 不同人群仅有140万个核苷酸差异 这些

16、差异是由 单一核苷酸多样性 SNP 产生的 它构成了不同个体的遗传基础 个体的多样性被认为是产生遗传疾病的原因 在整个基因组序列中 人与人之间的变异仅为万分之一 从而说明人类不同 种属 之间并没有本质上的区别 5 5人类基因组计划的意义 随着人类基因组逐渐被破译 一张生命之图将被绘就 人们的生活也将发生巨大变化 人类基因研究的意义在于它可以支持和推动生命科学中一系列重要的基础性研究 如基因组遗传语言的破译 基因的结构与功能关系 生命的起源和进化 细胞发育 生产 分化的分子机理 疾病发生的机理等 5 6人类基因组计划的论理学 A个人DNA顺序的隐私权 如 次等 基因携带者可能受到岐视 职业限制 医疗保险等问题 B基因专利问题 6 后人类基因组计划 伴随着人类基因组计划的迅速进展 基因的全序列逐步被完整的测出 会出现大量的不知道任何功能信息的序列 因此 在HGP完成之后 即全部人类基因被定序之后 还需要 破解贮存于基因组之中的遗传语言 识别 分离 鉴定和克隆所有基因 搞清每个基因的功能及基因之间的相互作用和相互关系 7水稻的基因组 2002年我国科学家完成了水稻基因组定序和初步分析 出人意

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号