文档详情

医学统计学杨超01简介02数据库检索2

壹****1
实名认证
店铺
PPT
6.29MB
约51页
文档ID:588975457
医学统计学杨超01简介02数据库检索2_第1页
1/51

2.3 2.3 基因组基因组数据库数据库收集并收集并贮存各种生物完整基因存各种生物完整基因组染色体的染色体的DNA序列、序列、结构及功能注构及功能注释的数据的数据库主要包括主要包括NCBI的的Genome数据数据库,,EBI的的Genome Reviews数据数据库以及加利福尼以及加利福尼亚大大学圣克学圣克鲁斯分校的斯分校的UCSC基因基因组数据数据库 2.3.1 NCBI2.3.1 NCBI的基因组的基因组数据库数据库http://www.ncbi.nlm.nih.gov/genome该数数据据库目目前前已已收收集集了了10400种种以以上上物物种种的的基基因因组的的完完整整染染色色体体序序列列图谱、、遗传图谱和和物物理理图谱,,分分为古古生生物物、、细菌菌、、真真核核生生物物、、病病毒毒、、类病毒五大病毒五大类群 人人基基因因组组一一号号染染色色体体图图谱谱Map Viewer 2.3.2 EBI2.3.2 EBI的的基因组浏览数据库基因组浏览数据库 2.3.3 UCSC2.3.3 UCSC基因组浏览器基因组浏览器http://genome.ucsc.edu加州大学圣克鲁兹分校基因组数据库加州大学圣克鲁兹分校基因组数据库工具栏工具栏 点点击“Genomes”,,进入入“定位定位”检索方式。

索方式 点点击“Blat”,,进入入“序列比序列比对”检索方式 点点击“Tables”,,进入入“表表单”检索方式 “表表单”检索的参数索的参数选择::a)clade —— 进化分支;化分支;b)genome —— 物种;物种;c)assembly —— 版本;版本;d)group —— 数据数据组织类型,默型,默认为“genes and gene prediction tracks”;;e)track —— 数据数据检索方式,默索方式,默认为“USCS tracks”;;f)table —— 输出数据表,默出数据表,默认为“knownGene”;;g)output format —— 数据数据输出格式;出格式;h)output file —— 输出文件名出文件名点点击“get output”下下载基因基因组数据 2.4 2.4 蛋白质蛋白质序列数据库序列数据库早早期期的的蛋蛋白白质序序列列数数据据库主主要要有有::由由NCBI建建立立的的Protein序序列列数数据据库、、由由美美国国国国家家生生物物医医学学研研究究基基金金会会建建立立的的PIR序序列列数数据据库和和由由瑞瑞士士生生物物信息研究所建立的信息研究所建立的Swiss-Prot序列数据序列数据库。

目目前前,,PIR、、TrEMBL已已与与Swiss-Prot蛋蛋白白质序序列列数数据据库合合并并为UniProtKB蛋蛋白白质序序列列数数据据库 2.4.1 NCBI2.4.1 NCBI蛋白质序列数据库蛋白质序列数据库 2.4.2 UniProtKB2.4.2 UniProtKB蛋白质蛋白质序列数据库序列数据库包含所有已知序列的野生型蛋白包含所有已知序列的野生型蛋白质的信息,其的信息,其核心的蛋白核心的蛋白质序列数据序列数据库为UniProtKB数据数据库中所提供的蛋白中所提供的蛋白质结构与功能信息非常构与功能信息非常全面http://www.uniprot.org/ UniProtKB蛋蛋白白质序序列列数数据据库格格式式文文件件所所包包含含的内容有:的内容有:功能功能名称和分类名称和分类亚细胞定位亚细胞定位病理和生物技术病理和生物技术翻译后加工修饰翻译后加工修饰表达表达相互作用相互作用结构结构家族和结构域家族和结构域序列序列交叉参考交叉参考发表论文发表论文注册信息注册信息杂项杂项相似蛋白质相似蛋白质 注册号注册号标识符标识符人类胰核糖核酸酶的数据库文件人类胰核糖核酸酶的数据库文件 第一部分第一部分——功能功能 第二部分第二部分——名称和分类名称和分类 第三部分第三部分——亚细胞定位亚细胞定位 第四部分第四部分——病理和生物技术病理和生物技术 第五部分第五部分——翻译后加工修饰翻译后加工修饰 第六部分第六部分——表达表达 第七部分第七部分——相互作用相互作用 第八部分第八部分——结构结构 第九部分第九部分——家族和结构域家族和结构域 第十部分第十部分——序列序列 第十一部分第十一部分——交叉参考交叉参考 第十二部分第十二部分——发表论文发表论文 第十三部分第十三部分——注册信息注册信息 第十四部分第十四部分——杂项杂项第十五部分第十五部分——相似蛋白质相似蛋白质 2.5 2.5 结构结构数据库数据库结构构数数据据库收收集集并并贮存存生生物物大大分分子子三三维结构构原原始始测量量数数据据,,其其中中主主要要是是蛋蛋白白质分分子子三三维结构构数据数据库。

生生物物大大分分子子的的三三维结构构数数据据格格式式文文件件可可通通过特特定的定的显示示软件而直件而直观地以地以图形方式表示出来形方式表示出来 2.5.1 2.5.1 蛋白质蛋白质结构数据库结构数据库主要的蛋白主要的蛋白质三三维结构数据构数据库是是PDB((Protein Data Bank)数据)数据库此外,NCBI的的Structure数据数据库((MMDB,,the Molecular Modeling Database)也)也包含包含PDB的全部数据的全部数据生物大分子的三生物大分子的三维结构构X射射线衍射衍射测量数据均以文本文量数据均以文本文件形式件形式贮存,其后存,其后缀为.pdb,可用,可用专门的的软件打开或件打开或显示 2.5.2 2.5.2 三维结构三维结构显示软件显示软件常常用用的的生生物物大大分分子子三三维结构构显示示软件件包包括括::RasMol软件件((Bernstein HJ))和和Cn3D软件件((NCBI))和和Swiss-PdbViewer((SIB)等下下载地址(适用于地址(适用于Windows XP):):http://www.rasmol.org/software/RasMol_2.7.5_Windows_Installer.exeftp://ftp.ncbi.nih.gov/cn3d/Cn3D-4.3.msihttp://spdbv.vital-it.ch/download/binaries/SPDBV_4.10_PC.zip 为了帮助用了帮助用户从浩如烟海的生物从浩如烟海的生物实验数据中数据中获取有用的数据取有用的数据资料,并料,并对数据数据进行科学的分析行科学的分析和和处理,各生物信息数据理,各生物信息数据库系系统均开均开发了一系了一系列的列的实用工具用工具软件,主要的有:件,主要的有:ØGQurey —— NCBI数据数据库检索工具索工具软件;件;ØSRS —— EBI的数据的数据库检索工具索工具软件;件;ØUniProt —— 蛋白蛋白质序列序列检索工具索工具软件。

件2.6 2.6 生物生物数据库的信息检索数据库的信息检索 2.6.1 GQurey2.6.1 GQurey检索工具:检索工具:网址:网址:http://www.ncbi.nlm.nih.gov/gqueryGQurey((以以前前称称为Entrez))是是NCBI开开发的的数数据据库检索索系系统通通过该检索索系系统,,用用户可可对NCBI中中的的数数据据资料料快快速速进行行交交叉叉检索索,,这些些数数据据资料料包包括括核核苷苷酸酸序序列列、、蛋蛋白白质序序列列、、生物大分子生物大分子结构、全基因构、全基因组以及文献摘要以及文献摘要 目前,目前,GQurey链接的数据接的数据库主要有:主要有:①①PubMed:生物医学文献数据:生物医学文献数据库;;②②Nucleotide((GenBank))::核核苷苷酸酸序序列列数数据据库;;③③Protein:蛋白:蛋白质序列数据序列数据库;;④④Structure:生物大分子三:生物大分子三维结构;构;⑤⑤Genome:基因:基因组数据数据库;;⑥⑥PopSet:种群研究数据:种群研究数据资料;料; ⑦⑦OMIM:在:人人类孟德孟德尔遗传学;学;⑧⑧Taxonomy:基因数据:基因数据库中的生物分中的生物分类学;学;⑨⑨UniGene:基因表达和微:基因表达和微阵列数据列数据库;;⑩⑩UniSTS::遗传标志和作志和作图数据数据库。

1.在在浏览器地址器地址栏输入入 http://www.ncbi.nlm.nih.gov/nuccore/核苷酸序列检索步骤核苷酸序列检索步骤 2.在检索框内输入关键词进行检索,必要时可设置在检索框内输入关键词进行检索,必要时可设置“Limits”和和“Advanced” 序序列列检索索系系统((Sequence Retrieval System,,SRS))是是由由Biowisdom公公司司开开发的的生生物物信信息息数数据据库资料料检索索工工具具软件件但但该检索索系系统现已已停停止止服服务用用户可通可通过EMBL-EBI提供的提供的链接接进行行检索2.6.2 SRS2.6.2 SRS检索工具:检索工具: 网址:网址: http://www.ebi.ac.uk/services 2.6.3 BioMart2.6.3 BioMart检索工具检索工具BioMart也是也是EBI中常用的数据中常用的数据库检索工具之一索工具之一该检索工具的特点是可以跨数据索工具的特点是可以跨数据库进行核酸及蛋行核酸及蛋白白质序列的序列的检索利用利用BioMart,可以方便的,可以方便的检索到某一物种全部的索到某一物种全部的或限定范或限定范围的核酸或蛋白的核酸或蛋白质序列、基因序列、基因组位置、位置、表达、表达、结构以及其他注构以及其他注释信息等。

信息等 http://asia.ensembl.org/biomart/martview/ 1.选择数据数据库((database):): 2.选择数据集(数据集(dataset):): 3.设置置“过滤器(器(filters))”:: 4.设置置“属性(属性(attributes))”::5.单击单击“Results”获得检索结果获得检索结果 2.6.4 UniProt2.6.4 UniProt检索检索工具:工具:网址:网址:http://www.uniprot.org/由由NIH提提供供资助助,,由由EBI、、SIB和和PIR三三方方联合合开开发的的主主要要针对UniProtKB蛋蛋白白质序序列列数数据据库的的检索工具索工具软件 课外练习课外练习1.使用使用GQuery,,EMBL-EBI,,BioMart,,UniProt等等检索工具,通索工具,通过关关键词(基因名称或蛋白(基因名称或蛋白质名名称)、注册号(称)、注册号(AC)、)、标识符(符(GI或或ID)等方)等方式式检索一段核酸或蛋白索一段核酸或蛋白质序列2.对检索索结果果进行理解和分析行理解和分析。

下载提示
相似文档
正为您匹配相似的精品文档
相关文档