基因组学课件:微生物基因组学

上传人:wox****ang 文档编号:157234271 上传时间:2020-12-21 格式:PPT 页数:98 大小:4.01MB
返回 下载 相关 举报
基因组学课件:微生物基因组学_第1页
第1页 / 共98页
基因组学课件:微生物基因组学_第2页
第2页 / 共98页
基因组学课件:微生物基因组学_第3页
第3页 / 共98页
基因组学课件:微生物基因组学_第4页
第4页 / 共98页
基因组学课件:微生物基因组学_第5页
第5页 / 共98页
点击查看更多>>
资源描述

《基因组学课件:微生物基因组学》由会员分享,可在线阅读,更多相关《基因组学课件:微生物基因组学(98页珍藏版)》请在金锄头文库上搜索。

1、微生物基因组学,中科院北京基因组研究所,微生物基因组研究概况 微生物基因组的特点 微生物基因组研究的意义,微生物基因组学,微生物基因组研究概况,微生物基因组重要纪事 年限 事件 1994年美国DOE启动MGP 1995年Science发表了第一株细菌-流感嗜血杆 菌全基因组 1995年发表了集胞藻菌株PCC6803的测序和注释 1996年Science发表了第一个完成的古细菌-詹 氏甲烷球菌全基因组序列 1996年酵母基因组序列发表 1997年大肠杆菌K-12基因组序列发表,截至2011年4月24日,NCBI上记录了1534个细菌基因组, 包括了103个古细菌和1431个真细菌, 其中中国科学

2、家完成了44个,研究现况及内容,原核生物基因组的大小 原核生物基因组的编码序列(CDS/ORF) 原核生物染色体结构 GC 含量 重复序列 DNA链组成的非对称性,微生物基因组的特点,微生物基因组的特点,Circular representation of the genome of T. tengcongensis MB4,原核生物基因组的编码序列,占原核生物基因组总序列的90 基因的平均大小为1kb,ORF,原核生物基因组的编码序列 不同生物编码序列的比较,Organism Genome (kb) ORFs ORF size Coding Sequence(%) Buchnera sp 6

3、40 583 988 90 Aquifex aeolicus 1,551 1,512 956 93 Saccharomyces cerevisiae 12,069 6,294 1,092 57 Schizosaccharomyces pombe 14,000 4,820 2,033 70 Caenorhabditis elegans 97,000 19,099 1,311 27 Arabidopsis thaliana 115,428 25,498 460 29 Homo sapiens 3,000,000 30,000 1,340 2,原核生物基因组的编码序列 核生物(高温菌)基因组的内含子

4、,Sulfolobus solfataricus P2: 18个tRNA基因含有单个内含子 一个胱氨酸tRNA基因含有2个内含子 A.pernix tRNA基因中 发现 14个内含子 Staphylothermus marinus和运动脱硫球菌 23S rRNA基因中也发现内含子,染色体结构,大多数原核生物:一条环状闭合双链DNA Brucella suis 1330:两条环状闭合双链DNA 2,107,792 bp (Chr I) 1,207,381bp (Chr II) Vibrio cholerae: 两条环状闭合双链DNA 2,961,146 bp (Chr I) 1,072,314

5、bp(Chr II) Borrelia burgdorferi B31: 910,725 bp ( linear Chromosome) 21 linear and circular plasmids Treponema pallidum:一条环状闭合双链DNA 1,138,006 bp,GC 含量,原核生物基因组GC含量为:16.6-74.9 % 嗜温菌基因组GC含量与 rRNA、tRNA的GC含量成正比 嗜热菌rRNA、tRNA的GC含量与 基因组GC含量不成正比,但与OGT(最适生长温度)成正比 tRNA GC含量总是大于rRNA的GC含量,嗜温菌基因组G + C content (%)

6、,Organism Genome rRNA tRNA Xfas 52.7 53.1 59.8 Tpal 52.8 53.1 57.2 Mlep 57.8 55.7 61.6 Atum 59.4 54.6 58.4 Smel 62.7 54.5 61.5 Mlot 62.7 56.3 60.5 Mtub 65.6 58.0 62.0 Paer 66.6 53.1 60.1 Drad 67.0 56.5 58.8 Ccre 67.2 55.0 61.2 Hbsp 67.9 58.1 62.4 linear regression 0.88 0.80,嗜热菌最适生长温度(OGT)与GC含量的关系,Or

7、ganismOGT() Genome rRNA tRNA Pabyssi 103 0.45 0.670.70 Pyro 98 0.42 0.63 0.71 Aero 95 0.56 0.680.73 Mjan 85 0.31 0.61 0.66 Aquae 85 0.43 0.650.68 Aful 83 0.49 0.63 0.68 Ssol 80 0.36 0.62 0.67 Tmar 80 0.46 0.63 0.65 Tten 75 0.38 0.590.60 Mthe 65 0.50 0.57 0.62 Tvol 60 0.40 0.53 0.61 Tacid 59 0.46 0.5

8、30.61 linear regression 0.01 0.92 0.90,基因组非编码序列的注释,非编码区的注释 各类重复序列 基因表达的调控序列 信号序列等,DNA链组成的非对称性 GC分布不对称 (GC skew) AT分布不对称(AT skew),前导链含有较多的G(A) 而后随链含有较多的C(T) 计算公式为(nG-nC)/(nG+nC) (nA-nT)/(nA+nT) 累计skew (cumulative skew) 用于复制起点和终点的定位,GC skew of T. tengcongensis genome,DNA链组成的非对称性(真细菌) 基因方向性偏好,基因方向性偏好 (

9、gene orientation bias) 先导链上编码的基因总是多于后随链,Jean R.Lobry Microbiology Today Vol 26,DNA链组成的非对称性 码子使用偏好(codon usage bias),先导链和后随链密码子的不同 在先导链,以G或T开头或结尾的密码子显著地多于后随链,常见的有GTG、GCG和GAG 在后随链以C或A开头或结尾的密码子多于先导链,如CTC、GCC、CCC、ATC和ACC,DNA链组成的非对称性 基因密度和密码子使用的差别,高度表达基因: 核蛋白体蛋白基因,与翻译和转录有关的因子基因,分子伴侣基因和与主要的能量代谢相关的基因 大多编码于

10、前导链 通常都有密码子偏好(核蛋白体蛋白基因密码子的第三位多为G ) 快速生长的细菌(大肠杆菌、霍乱弧菌、枯草芽孢杆菌和流感嗜血杆菌) 主要的糖酵解和三羧酸循环基因为高度表达基因 产甲烷菌,与甲烷代谢有关的基因为高度表达基因 高度表达基因: 那些在密码子使用上与一般基因相差很大,与核蛋白体蛋白基因,翻译和转录相关基因,伴侣-降解蛋白基因等在密码子使用上高度相似的基因为高度表达基因。,微生物测序及分析流程图,数据分析软件,序列拼接组装: Newbler, AMOScmp, Velvet, Phred/Phrap/Consed, Oligo 6 复制起始位点: ori-finder + GC sk

11、ew 基因注释: Glimmer, GenemarkS, Prodigal, BLAST 基因起始位点:ZCURVE 翻译起始位点:GS-Finder tRNA: tRNAscan-SE rRNA: RNAmmer Small RNA: Rfam 重复序列: Tandem repeat Finder, IS finder CRISPR序列:CRISPR finder,数据分析软件,Prophages: Prophage finder Virulence-associated factors: VFDB database Signal peptides: SignalP 跨膜结构:TMHMM O

12、peron: OperonDB Genome island: IslandViewer, MobilomeFINDER 致病岛:PAIDB 膜转运蛋白: TCDB 抗菌素抗性基因: ARDB 可变遗传因子: ACLAME 必需基因:DEG database,数据分析软件,Overlap基因、假基因: Mciobial Genome Submission Check 功能注释 : COG, KEGG 进化树: Clustal W, CVTree 比较基因组分析: Mauve, MUMmer, ACT, MicrobesOnline, mGenomeSubtracton, xBASE,Finish

13、ing阶段,Finishing阶段,Finishing阶段,多重PCR结果,引自Tettelin H.等文章,Finishing阶段,短片段文库构建填补二级结构区示意图,摘自Amanda A等文章,Finishing阶段,基于转座子技术来完成重复序列区的测序,摘自Scott E等文章,微生物基因组测序策略-高通量测序技术,454 长reads 测序 Solexa Pair-end测序 组合长reads和短reads测序 Sanger法finish,微生物基因组测序策略,副血链球菌FW213基因组基本特征,副血链球菌FW213基因组基本特征,副血链球菌比对结果,COG分类,COG分类图,JKL编

14、码信息加工和储存的蛋白质的基因;DVTMNUO代表细胞加工和信息处理基因;CGEFHIPQ是与代谢相关的基因;RS为功能未知的基因,代谢途径,代谢途径,728691bp 735072bp,精氨酸操纵子示意图,精氨酸脱亚氨酶(arginine deiminase,arcA), 鸟氨酸氨基甲酰转移酶(ornithine carbamyltransferase,arcB), 氨甲基酶(carbamate kinase,arcC), 逆向运输蛋白 (arginine-ornithine antiporter,arcD), 二肽酶(dipeptidase,arcT)和调控蛋白(regulator,arc

15、R),比较基因组分析,副血链球菌基因组和血链球菌基因组比对的全部MUM点阵图。横坐标,副血链球菌,2171616bp; 纵坐标, 血链球菌。对角线代表可以对齐区域,斜率-1的对角线代表大规模的染色体倒位,比较基因组分析,副血链球菌基因组和其他六株细菌全基因组比对结果图。a,和肺炎链球菌CGSP14比对的结果; b,戈登氏链球菌;c,变异链球菌;d,化脓性链球菌;第e,猪链球菌;f,嗜热链球菌,比较基因组分析,进化分析,毒力基因,基因组小岛(fwislet1),基因组岛(fwisland),抗药性,二元信号转导系统,宏基因组/宏转录组的应用,应用,方法,物种组成分析,2010,Carlotta De Filippo, PNAS,功能特征分析,代

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号