生物信息学实验报告

上传人:cn****1 文档编号:497953018 上传时间:2022-12-18 格式:DOC 页数:10 大小:1.27MB
返回 下载 相关 举报
生物信息学实验报告_第1页
第1页 / 共10页
生物信息学实验报告_第2页
第2页 / 共10页
生物信息学实验报告_第3页
第3页 / 共10页
生物信息学实验报告_第4页
第4页 / 共10页
生物信息学实验报告_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《生物信息学实验报告》由会员分享,可在线阅读,更多相关《生物信息学实验报告(10页珍藏版)》请在金锄头文库上搜索。

1、-生物信息学实验报告:_王思_*:_031040103_指导老师:_宋晓峰_*航空航天大学2013年4月实验一 生物信息数据库的检索一 实验目的:1.了解生物信息学的各大门户以及其中的主要资源。2.了解主要数据库的内容及结构,理解各数据库注释的含义。3.以PubMed为例,学会文献数据库的基本查询检索方法。二 实验内容:(1)国际与国内的生物信息中心国际NCBI、EBI、E*PASy,EMBL、SIB、TIGR以及国内CBI、BioSino的熟悉及内容的了解。核酸序列数据库:genbank/EMBL-bank/DDBJNCBI网址:.ncEBI网址:EMBL网址:.ebi.ac.uk/embl

2、蛋白质序列数据库:Swiss Prot 、E*PASy网址:e*pasy.org/Uniprot网址:.uniprot.org/蛋白质结构数据库:PDB网址:.rcsb.org/pdb/(2)数据库内容、结构与注释的浏览分别读取The spike protein of SARS-Corona Virus在NCBI中的核酸序列、SWISS-PROT蛋白质序列以及PDB蛋白质结构序列,熟悉数据库记录的结构,学会看懂其中的注释。核酸序列:SWISS-PROT蛋白质序列:PDB蛋白质结构序列:其PDB文件见附件SARS-Corona Virus.PDB文件分别读取Heamagglutinin Gene

3、s of H9N2 Subtype Influenza A Viruses(禽流感H9N2亚型HA基因)在NCBI中的核酸序列、SWISS-PROT蛋白质序列以及PDB蛋白质结构序列,熟悉数据库记录的结构,学会看懂其中的注释。核酸序列:SWISS-PROT蛋白质序列PDB蛋白质结构序列其PDB文件见附件H9N2.PDB文件(3)文献信息的查找与管理有效地使用NCBI PubMed提供的各种主要功能,查询并下载相关课题或研究方向的论文文摘与文献全文。查询Influenza A Viruses分子进化研究方向的文章。三 实验要求:(1) 以其中的一个信息中心为例,列举其中的主要资源(数据库、网上分

4、析、生物计算、数据下载等)。以NCBI为例,其主要数据库:BioProject (formerly Genome Project)、Conserved Domain Database (CDD)、Database of Genotypes and Phenotypes (dbGaP)、GenBank、Influenza Virus、Journals in NCBI Databases、MeSH Database、Nucleotide Database、Online Mendelian Inheritance in Animals (OMIA)、Protein Clusters、Protein

5、Databas、PubMed、Reference Sequence (RefSeq)、Structure (Molecular Modeling Database)、Third Party Annotation (TPA) Database、UniGene、Viral Genomes等网上分析:BLAST 、VecScreen 、ORF Finder 、COGnitor等生物计算:数据下载功能如下:(2)能够解释给定序列或基因组数据的含义。(3)检索文献的技巧和效率。实验二 序列多重比对及进化分析一 实验目的:1. 学习序列比对工具BLAST以及ClustalW等的使用,能够对序列数据进行初步

6、的分析。2. 掌握基于DNA序列和蛋白质序列构建系统进化树的常用方法和常用工具。二 实验内容:1. 在GeneBank数据库中,检索10条轮状病毒(Homo sapiens,Rotavirus)VP7基因的DNA序列,并使用CLUSTALW软件对序列进行多重序列比对;检索结果详见电子稿附件VP7文件夹:senquence1.fasta -senquence10.fasta多重序列比对结果:多重序列比对结果详见电子稿附件:senquence.aln文件2. 在GeneBank数据库中检索10条SARS病毒Spike蛋白的氨基酸序列,使用CLUSTAL*软件对这十条序列进行多重序列比对;检索结果详

7、见电子稿附件sara文件夹:s0.fasta s9.fasta多重序列比对结果多重序列比对结果详见电子稿附件sara文件夹: s9.aln3. 使用ClustalW软件或其他软件包构建上述DNA分子系统发生树。系统发生树如下:三 实验要求:1. 提交使用CLUSTAL*及PHYLIP软件进行多重序列比对及构建系统发生树的结果;2. 总结多重序列比对及构建系统发生树的关键事项。选择合适的比对算法,构建系统发生树时适当选择独立关系的分支序列。实验三 蛋白质结构分析及结构预测一 实验目的:1、掌握蛋白质序列检索的操作方法;2、熟悉蛋白质基本性质分析;3、熟悉基于序列同源性分析的蛋白质功能预测,了解基

8、于motif、 结构位点、结构功能域数据库的蛋白质功能预测;4、了解蛋白质结构预测。5. 学会运用结构浏览软件对生物大分子的结构进行观察。二 实验内容:1. 给出实例了解生物大分子结构数据库PDB及MMDB中的记录方式,看懂记录中的内容并会运用Rasmol或3D软件观察蛋白质的三维结构。PDB文件1J4N.pdb的记录方式分析见附录。下图为在Rasmal软件中观察的结果:丝带模型线框模型球棒模型2. 使用Entrez或SRS信息查询系统检索水通道(Aquaporin-1, AQP1)蛋白质序列。AQP1蛋白质序列:MQSGMGWNVLDFWLADGVNSGQGLGIEIIGTLQLVLCVLA

9、TTDRRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK详见附件AQP1.fasta3. 使用BioEdit软件对上述蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析。分子量、氨基酸组成Protein: gi|297307120|ref|NP_001171991.1| aquaporin-1 isoform 4 Homo sapiensLength = 154 amino acidsMolecular Weight

10、= 16676.11 DaltonsAmino Acid Number Mol% Ala A 12 7.79 Cys C 2 1.30 Asp D 12 7.79 Glu E 4 2.60 Phe F 6 3.90 Gly G 18 11.69 His H 3 1.95 Ile I 12 7.79 Lys K 3 1.95 Leu L 18 11.69 Met M 3 1.95 Asn N 6 3.90 Pro P 5 3.25 Gln Q 4 2.60 Arg R 8 5.19 Ser S 11 7.14 Thr T 7 4.55 Val V 12 7.79 Trp W 5 3.25 Tyr

11、 Y 3 1.95疏水性分析:4. 对水通道蛋白质序列进行基于NCBI/Blast软件的蛋白质同源性分析;5. 对水通道蛋白质序列进行motif结构分析;6. 对水通道蛋白质序列进行二级结构和三维结构预测。二级结构预测:三级结构预测:数据库显示结构:三 实验要求:1、提交使用上述软件对人水通道蛋白质序列进行基本性质分析、同源性分析、motif结构分析以及二级结构和三维结构预测的结果;2、相互对比结果,说明产生不同结果的原因,总结进行上述分析所需注意的关键事项。实验四 核酸序列分析一实验目的1、 掌握已知或未知序列接受号的核酸序列检索的基本步骤;2、 掌握使用BioEdit软件进行核酸序列的基本

12、分析;3、 熟悉基于核酸序列比对分析的真核基因结构分析(内含子/外显子分析);二实验原理针对核酸序列的分析就是在核酸序列中寻找基因,找出基因的位置和功能位点的位置,以及标记已知的序列模式等过程。在此过程中,确认一段DNA序列是一个基因需要有多个证据的支持。一般而言,在重复片段频繁出现的区域里,基因编码区和调控区不太可能出现;如果*段DNA片段的假想产物与*个已知的蛋白质或其它基因的产物具有较高序列相似性的话,则这个DNA片段就非常可能属于外显子片段;在一段DNA序列上出现统计上的规律性,即所谓的“密码子偏好性”,也是说明这段DNA是蛋白质编码区的有力证据;其它的证据包括与“模板”序列的模式相匹

13、配、简单序列模式如TATA Bo*等相匹配等。一般而言,确定基因的位置和结构需要多个方法综合运用,而且需要遵循一定的规则:对于真核生物序列,在进行预测之前先要进行重复序列分析,把重复序列标记出来并除去;选用预测程序时要注意程序的物种特异性;要弄清程序适用的是基因组序列还是cDNA序列;很多程序对序列长度也有要求,有的程序只适用于长序列,而对EST这类残缺的序列则不适用。三实验内容1、使用Entrez或SRS信息查询系统检索人瘦素 (leptin) 的mRNA、基因组DNA、外显子等核酸序列,连接提取该序列内容,阅读序列格式的解释,理解其含义;2、使用BioEdit软件对上述核酸序列进行分子质量

14、、碱基组成、碱基分布、序列变换等基本分析,并从BioEdit软件的“help”栏了解该软件的其它功能;DNA molecule: gi|169790920|ref|NM_000230.2| Homo sapiens leptin (LEP), mRNALength = 3444 base pairsMolecular Weight = 1045471.00 Daltons, single strandedMolecular Weight = 2093627.00 Daltons, double strandedG+C content = 49.97%A+T content = 50.03%Nucleotide Number Mol%A 903 26.22 C 801 23.26 G 920 26.71 T 820 23.814、 使用BioEdit软件对人瘦素 (leptin) 的mRNA序列进行可读框架分析;起始密码位置和编码区范围:4、使用NCBI查询系统进行人瘦素 (leptin) 的基因组序列分析。ATGCATTGGGGAACCCTGTGCGGATTCTTGTGGCTTTGGCCCTATCTTTTCTATGTCCAAGCTGT

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号