2017医学生物信息学

上传人:g**** 文档编号:53713392 上传时间:2018-09-04 格式:PPTX 页数:133 大小:11.05MB
返回 下载 相关 举报
2017医学生物信息学_第1页
第1页 / 共133页
2017医学生物信息学_第2页
第2页 / 共133页
2017医学生物信息学_第3页
第3页 / 共133页
2017医学生物信息学_第4页
第4页 / 共133页
2017医学生物信息学_第5页
第5页 / 共133页
点击查看更多>>
资源描述

《2017医学生物信息学》由会员分享,可在线阅读,更多相关《2017医学生物信息学(133页珍藏版)》请在金锄头文库上搜索。

1、非编码RNA研究方法及应用,中国医科大学科学实验中心刘 洁,一. RNA组学(RNomics),RNA研究历史,第一阶段:十九世纪八十年代至二十世纪初,解决了核酸组成和核苷酸结构。 第二阶段:本世纪五、六十年代,发现转运RNA(transfer ribonucleic acid,tRNA) 核糖体RNA(ribosomal RNA, rRNA)、信使RNA(messenger RNA,mRNA), 破译遗传密码,基本明确RNA将遗传信息从 DNA传递至蛋白质的途径。 第三阶段:本世纪八十年代开始,重新认识RNA传递遗传信息功能,全面认识 RNA生物功能多样性。,RNA研究获得的诺贝尔奖,RNA

2、领域的新发现,1. RNA控制着蛋白质的生物合成。 生物体内绝大多数生化反应由酶(蛋白质)催化控制。 多年来,人们努力寻找催化蛋白质生物合成的关键酶(转肽酶)。2000年,通过X线衍射分析核糖体大,小亚基的晶体,发现在肽键形成的2纳米范围中,没有蛋白质电子云存在。 表明肽键的形成由核糖体RNA(rRNA)催化。 核糖体是核酶,这成了2000年世界第二大科学成就。,噬菌体29装配过程中,有一种能够协助病毒进行自我装配的核酸大分子,它是一类RNA分子,由六个相同的RNA分子构成的六元环。 首先由外壳蛋白组装成噬菌体外壳,然后由包装RNA(packagin RNA,pRNA),在噬菌体基部的门上装配

3、成分子马达,依赖次马达的转动,将噬菌体DNA装入病毒外壳。 这种分子发动机可产生巨大的推力,是以ATP供能物质作为开关的。,2. RNA具运动功能,pRNA,3. RNA具调控功能,女性Xist RNA结合在X染色体上(见箭头),关闭整个X染色体基因的表达,染色体DNA3末端在端粒酶的作用下,以端粒RNA为模板,合成端粒DNA。 细胞分裂时,DNA每复制一次,端粒DNA缩短些,直至端粒全部消失,细胞再不分裂,导致死亡。 成人正常细胞没有端粒酶和端粒RNA,癌细胞有。 端粒RNA,控制细胞寿命和癌症发生。,4. RNA调控遗传信息,通过不同方式的RNA剪接,一种基因可在不同的发育、分化阶段,不同

4、的生理病理条件下或不同的细胞、组织中合成不同的蛋白质。 很多生物mRNA的成熟过程,均需经RNA编辑。 在蛋白质生物合成过程中,有多种称为“再编辑”的方式。通常mRNA编码区每三个核苷酸组成一个密码子,编码区每个核苷酸只能也必须被阅读一次。 再编码过程中,有的核苷酸被跳过没被阅读,有的却被阅读两次,有的被用来翻译特殊氨基酸。,5. RNA修饰,RNA由4种核苷酸组成,但通过核苷酸修饰增加了RNA结构的复杂性,为RNA功能多样性提供了物质基础。 rRNA中核苷酸的甲基化修饰和假脲嘧啶的生物合成、以及加工和细胞定位转运,均有一类小分子rRNA参与。,6. RNA携带遗传信息,在一些病毒中,不是DN

5、A,而是RNA携带遗传信息。 通常核酸是单链的(ssRNA single-stranded RNA),也有双链的(dsRNA double-stranded RNA)。 RNA病毒有:艾滋病病毒、烟草花叶病毒、SARS 病毒、MERS病毒、埃博拉病毒(EBOV)、西班牙流感病毒、甲型H1N1流感病毒、禽流感病毒、噬菌体(有一部分噬菌体是DNA病毒,如T2噬菌体)等。 植物病毒,除少数例外,大多数是RNA病毒。,7. RNA与疾病的关系,RNA突变或异常可引起疾病,如红斑狼疮、重症肌无力、某些II型糖尿病、某些帕金森病、某些老年痴呆等。 一些RNA突变后,造成蛋白质合成障碍或蛋白质合成错误率增加

6、。一种RNA突变,常可因其发生的部位不同,影响到不同蛋白质,而引起不同的疾病。 不同RNA的突变又可能因发生在同一种细胞或组织中,而引起同一种疾病。也可因引起一系列蛋白质合成的错误,表现为综合征。,8. 基因组研究中的“垃圾”可能是RNA基因,基因组研究过程中,发现大量不编码蛋白质的重复序列,一度被称为“垃圾”,该物质越是在高等生物中含量越多。 Alu家族的序列被认为是反式可移动元件,调控临近基因的表达。,研究所有上述各种RNA的时空表达情况及其生物学意义,将在全面破解生命奥秘中发挥重要作用。 中外科学家都注意到了以此为研究对象的RNA组学问题。 我国科学家在1998年第109次香山科学会议,

7、2000年1月第11次东方科技论坛和2000年3月国家重点基础研究项目评审会上,提到了“功能RNA组研究”。 国外在2000年底提出了RNA组学的全新概念。RNA组学研究将会在探索生命奥秘中和促进生物技术产业化中,做出巨大贡献。,RNA组学 后基因组时代的科学前沿,美国科学介绍2000年重大科学成就时,把人类基因组工作草图绘制工作排在第一位,其中介绍了生命可能始于RNA而非DNA。 2002年评出的“十大科学进展”中,排榜第一的发现“小RNA” 分子控制基因,显示小RNA是许多细胞遗传功能的主导。 作为四级学科的 RNA研究多次获得次诺贝尔奖,表明RNA研究的重要性。,RNA组学(RNomic

8、s),对细胞中全部RNA分子的结构与功能进行系统的研究,从整体水平阐明RNA的生物学意义即为RNA组学的主要任务。RNA并非简单地传递遗传信息,而是通过各种类型的RNA剪接、RNA编辑和RNA再编码来控制遗传信息的表达。它通过调控和催化蛋白质的生物合成而控制着生命的中枢。 基因组学研究正全力构筑生命科学基石,RNA组学研究是它不可缺少的同盟军。,二 . 非编码RNA ( Non-coding RNA,ncRNA),基因组和转录,编码蛋白序列 -人 基因组的2-3% -线虫 基因组的25% 基因组的转录水平 人 基因组90% 线虫 基因组的70% 绝大部分的转录产物是非编码RNA( Non-co

9、ding RNA,ncRNA) 物种间最主要的差别也是ncRNA,非编码RNA( Non-coding RNA,ncRNA),包括rRNA,tRNA,snRNA,snoRNA和miRNA等多种已知功能的 RNA,还包括未知功能的RNA。 能从基因组上转录而来,但是不翻译成蛋白,在RNA 水平上就能行使各自的生物学功能。 人基因组中有30亿个碱基对,其中1.5%能够编码蛋白质,98.5%是非蛋白质编码基因,这些基因序列一度被认为是“垃圾”基因。,ncRNA的作用,1. 影响染色体的结构。 2. 调控转录。 3. 参与RNA的加工,修饰。 4. 参与mRNA的稳定和翻译调控过程。 5. 影响蛋白质

10、的稳定和转运。 6. 在植物适应环境胁迫中的调控作用。 7. 在细胞发育和分化中的调控作用。,细菌RNAs- 小RNA(small RNA,sRNA) 真核RNA-非编码RNA(Non-coding RNA, ncRNA)、功能性RNA(functional RNA, fRNA)、小非信使RNAs(small nonmessenger RNAs,snmRNA) 根据亚细胞定位微小RNA(microRNA,miRNA)、小干扰RNA(small interfering RNA,siRNA)和长链非编码RNA(long non coding RNA,lncRNA)。,ncRNA的命名原则,1.大规

11、模鉴定新ncRNA,用理论预测和实验发现。 前者主要借助计算机,从已有的ncRNA中提取特征信息,然后以特征信息做全基因组搜索。 比较成功的预测软件有:预测snoRNA 的snoScan和snoGPS,预测tRNA 的tRNAScan,预测microRNA 的mirScan,RNAz,RNAmotif 等。 理论预测方法简便快捷,但最终的确定还是依赖于实验,因此理论预测与实验验证是相辅相成。,ncRNA 的主要研究内容,这些方法被称作“RNomics”。核心在于构建ncRNA 的cDNA 文库,主要分为小于50 nt,50500 nt以及大于500 nt 3 种,另外对于大于500 nt 的还

12、可以分为带polyA 尾巴和不带polyA 尾巴这两种. 多种方法可用来鉴定文库中的ncRNA。比较传统的是克隆测序,该法工作量很大,且对低丰度ncRNA 检测效率较差. 操作流程比较简单,且对仪器设备要求不高,成本相对较低,因此仍广泛使用.,鉴定ncRNA的实验方法,随着测序技术的发展,得到ncRNA的cDNA 文库以后,不用克隆就可以直接测序. 这种方法简单快捷,工作量小,可以检测到大量低丰度ncRNA. 对仪器要求较高,成本也很高,使用的测序仪主要有454 和solexa 两种. 随着技术的改进和成本的降低,这种直接测序的方法将成为主流.,454型测序仪, 速度快,一个测序反应耗时10个

13、小时,获得4-6亿个碱基对。比传统的Sanger测序的方法快100倍; 读长长,单个序列的读长更长,均匀可达到450个碱基左右; 通量高,每个反应得到超过100万个序列读长,成本降低; 正确度高,读长超过400bp时,单一读长的正确性超过99%; 一致性好,测序结果一致性超过99.99%; 可进行PairEnd测序研究; 简便高效,不需要进行建库、克隆挑取、质粒提取等工作,一个人可以在一天内完成一个微生物物种的测序工作.,Solexa 测序系统, 作为新一代测序技术,Solexa测序大大降低了测序成本,同时提高了测序效率; 每张芯片有8个通道,每个通道可单独运行一个样品,也可以把多个样品混合在

14、一起检测; 一次单通道的测序可以得到不低于500万条的序列; 每次运行实验可读取10亿个碱基/芯片; 可精确读取重复序列; 无需建库,自动化样品制备,简单,成本低; 样本使用效率极高,对少量样本也可以极灵敏精确地检测; 每次测序长度为30 nt左右.,核心在于构建高密度的覆盖全基因组的芯片,主要有affymetrix 公司和agilent 公司。 优点在于不用构建cDNA 文库,更不用做克隆,只要有分离纯化的ncRNA就可以检测,操作简单,成本很低,可以检测到大量低丰度的ncRNA。 缺点在于不能准确的确定ncRNA的转录起始终止位点,也很难区分剪切加工产物。,全基因组tiling 芯片技术,

15、主要集中在microRNA 和siRNA,主要原因在于这两种小RNA的功能作用方式,都是通过同目标基因进行碱基配对,寻找这些小RNA的靶点相对来讲比较容易; 而对于长的ncRNA来讲,它们往往要形成复杂的二级甚至是三级结构,预测其靶点比较困难。随着研究的深入,也有为数众多的长的ncRNA的功能被鉴定出来,例如Xist 和Khps1 就属于长的带polyA 尾巴的ncRNA. 环状RNA.,ncRNA的功能研究,传统意义中心法则,三. 微小RNA(microRNA,miRNA),1989年,Victor发现线虫中基因 lin-4 抑制基因 lin-14,认为 lin-4 应该也表达一种调控蛋白质

16、; 1993年,克隆出了 lin-4,却发现这个基因非常小,它的产物不是蛋白质,而是一个长度只有22个核苷酸的RNA。它是由单链的RNA分子产生,这个分子的一端折回来形成不完全的互补配对的“发卡结构“。,miRNA研究起始于时序调控小RNA(stRNAs)。 1993年,Lee等在秀丽新小杆线虫(Caenorhabditis elegan)中发现了第一个可时序调控胚胎后期发育的基因lin-4;2002年,Reinhart等又在线虫C.elegan中发现第二个异时性开关基因let-7. 2001年10月science报道了三个实验室从线虫、果蝇和人体克隆的几十个类似C.elegan的lin-4的小RNA基因,称为microRNA。 植物miRNA从2002年起才有报道,编码植物miRNAs的基因明显不同于其他生物,植物编码miRNA基因的转录产物可能更大,植物的miRNA与互补结构的错配一般也少于动物,所以在进化上也更为保守. miRNA转录产物也是发夹状结构,在RNase酶切后以双链形式存在,最后释放互补链,miRNA成熟.,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号