《《生物信息学》课程期末报告.docx》由会员分享,可在线阅读,更多相关《《生物信息学》课程期末报告.docx(8页珍藏版)》请在金锄头文库上搜索。
1、生物信息学1. 描述NCBI或ExPASy主页结构和主要内容NCBI数据库介绍下面按照检索框上的顺序分别介绍各数据库。Nucleotide该数据库由国际核苷酸序列数据库成员美国国立卫生研究院GenBank、日本DNA数据库(DDBJ)和英国Hinxton Hall的欧洲分子生物学实验室数据库(EMBL)三部分数据组成。这三个组织联合组成国际核苷酸序列数据库协作体,每天交换各自数据库中的新增序列记录实现数据共享。其中的序列数据也通过与基因组序列数据库(GSDB)合作获取;专利序列数据通过与美国专利与商标局、国际专利局合作获取。Genome即基因组数据库,提供了多种基因组、完全染色体、Contig
2、ed序列图谱以及一体化基因物理图谱。Structures即结构数据库或称分子模型数据库(MMDB),包含来自X线晶体学和三维结构的实验数据。MMDB的数据从PDB(Protein Data Bank)获得。NCBI已经将结构数据交叉链接到书目信息、序列数据库和NCBI的Taxonomy中运用NCBI的3D结构浏览器和Cn3D,可以很容易地从Entrez获得分子的分子结构间相互作用的图像。Taxonomy即生物学门类数据库,可以按生物学门类进行检索或浏览其核苷酸序列、蛋白质序列、结构等。PopSet包含研究一个人群、一个种系发生或描述人群变化的一组组联合序列。PopSet既包含核酸序列数据又包含
3、蛋白质序列数据。Entrez 功能强大,在于它的大多数记录可相互链接,既可在同一数据库内链接,也可在数据库之间进行链接。当运用BLAST软件比较某氨基酸或DNA序列与库中其他氨基酸或DNA序列差异即进行相似性检索时,则会涉及到蛋白质库或核苷酸库的库内链接。库间链接发生在核苷酸数据库内的记录与PubMed库中已发表序列的引文间的链接,或蛋白质序列记录与核苷酸序列库中编码它的核苷酸序列间的链接。NCBI数据库检索NCBI数据库的检索方法很简单,在检索框中输入检索词,检索词间默认逻辑关系为AND,检索规则基本同PubMed。可以通过下拉菜单选择记录的显示格式,通常选择GenBank Report格式
4、或FASTA Report格式。当选择GenBank Report格式后,屏幕显示较完整的基因记录,其内容包括:基因位点(Locus)、基因定义(Definition)、基因存取号(Accession)、 核酸编号(NID )、关键词(Keywords)、 来源(Source)、组织分类(Organism)、参考文献(Reference)、 著者(Author)、题目(Title)、期刊Journal)、Medline存取号(Medline)、序列特征(Features)、基因(Gene)、CDS(cDNA)、等位基因(Allele) 对等的肽(Mat-Peptide )、计算碱基数(Base
5、 Count)、原序列(Origin)。而FASTA Report格式仅包括检出序列的简要特征描述。2. SearchthehumanpreproinsulinsequencefromtheNCBIdatabases.Describeyoursearchingprocessandresults.评论:此项目是由组装并取代先前的入口和,并包含其他新的数据。一些序列和功能数据已经改编自洛杉矶洛斯阿拉莫斯序列数据库录入HUMINS1。该基因的直接翻译产物是前胰岛素原。该信号肽促进胰岛素的膜转运前体,并在此过程中被切割掉。在产生的胰岛素原分子,肽链A和B由接合连接肽C,这被认为是在形成的,以帮助需要胰岛素的二硫键。 来自于人类第1到110个前胰岛素原的氨基酸序列,第1到24个氨基酸是信号肽,第25到54个氨基酸是胰岛素原肽B,第55到89个氨基酸是胰岛素原肽C,第90到110个氨基酸是胰岛素原肽A。3.将人,猪,牛,狗,鼠,羊,马,兔的胰岛素制成进化树。4structureofhumanpreproinsulinpositionof-s-s- A链的第六个和第十一个半胱氨酸中的巯基形成二硫键。A链的第七个和B链的第七个半胱氨酸中的巯基形成二硫键。A链的第二十个和B链的第十九个半胱氨酸中的巯基形成二硫键。