疟原虫蛋白家族数据库及其生物信息学分析平台的构建

上传人:cjc****537 文档编号:48355753 上传时间:2018-07-14 格式:DOC 页数:41 大小:72.33KB
返回 下载 相关 举报
疟原虫蛋白家族数据库及其生物信息学分析平台的构建_第1页
第1页 / 共41页
疟原虫蛋白家族数据库及其生物信息学分析平台的构建_第2页
第2页 / 共41页
疟原虫蛋白家族数据库及其生物信息学分析平台的构建_第3页
第3页 / 共41页
疟原虫蛋白家族数据库及其生物信息学分析平台的构建_第4页
第4页 / 共41页
疟原虫蛋白家族数据库及其生物信息学分析平台的构建_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《疟原虫蛋白家族数据库及其生物信息学分析平台的构建》由会员分享,可在线阅读,更多相关《疟原虫蛋白家族数据库及其生物信息学分析平台的构建(41页珍藏版)》请在金锄头文库上搜索。

1、药理学专业毕业论文药理学专业毕业论文 精品论文精品论文 疟原虫蛋白家族数据库及其生疟原虫蛋白家族数据库及其生物信息学分析平台的构建物信息学分析平台的构建关键词:疟原虫关键词:疟原虫 蛋白家族数据库蛋白家族数据库 生物信息学生物信息学 分析平台分析平台摘要:目的: 1、为了更好地对疟原虫蛋白家族进行比较基因组学和功能基 因组学方面的研究,构建疟原虫蛋白家族数据库; 2、开发一个功能齐全、 高度整合的生物信息学分析平台,为疟疾研究及相关科研工作者提供良好的数 据分析工具和平台。 方法: 1、对六个现有的疟原虫基因组蛋白序列数据 进行 All-against-All BLAST 搜索,再用 Trib

2、eMCL 软件包中 Mclblastline 程 序进行蛋白家族聚类,再用 PERL 程序提取蛋白家族信息以用于蛋白家族数据库 构建; 2、用疟原虫蛋白序列对 PDB、Swiss-Prot 和 RefSeq 三个数据库进行 BLAST 同源搜索,所得结果分别用 PERL 程序进行提取,以用于构建数据库; 3、用 HMMER 软件包中的 Hmmpfam 程序对 Pfam 数据库进行蛋白结构域搜索,输 出结果用 PERL 程序提取,以用于数据库构建; 4、用 BLAST 序列相似性程序 对 KEGG Ortholog(KO)数据库进行搜索,用 PERL 程序提取输出结果,然后用统 计学方法推测各家

3、族的功能,并对其进行注释; 5、以 Linux 为服务器, MySQL 为数据库管理软件,根据以上各步所得数据设计数据表,采用 BigDump 和 phpMyAdmin 等软件把数据导入数据库,构建成蛋白家族数据库; 6、以 Apache 为网络服务器,使用 Dreamweaver、UltraEdit、Photoshop、Activeperl 等软件,以 PHP、HTML、JavaScript、Ajax、PERL 等语言进行编程构建生物信息学数据分 析平台。 结果: 1、六个疟原虫基因组总共含有 40,273 条蛋白基因序列, 同源聚类分析得到了 8,089 个蛋白家族,总共有 50 种大小的

4、家族,其中最大 家族有 1,107 个成员,最小的家族只有 1 个成员; 2、按家族大小来分,家 族个数最多是 1 个成员的家族,有 3,203 个,其次是 6 个成员的,有 1,094 个,家族大多集中有 12 个成员以下家族大小段,17 个成员以上的家族比较稀 少; 3、按物种基因分布看,P. berghei、P. chabaudi、P. falciparum 三 个物种在各种大小家族中分布比较均匀;P. knowlesi 和 P. vivax 两个物种在 小于 12 个成员的家族中占优势;而 P.yoelii 在多于 12 个成员的家族中相对占 优势; 4、家族大小分别为 98 和 17

5、8 的两个家族中的所有成员都来自 P. falciparum,其中可能存在物种特意性的基因扩增; 5、构建了蛋白家族数 据库 PlasmoGF,并以其为基础构建了功能齐全的生物信息学分析平台 (http:/ BLAST 数据 库搜索、多序列比对、进化树构建等数据操作板块,并开发了数据工作集 Work-Set 作为用户数据存储的容器,并作为各步数据操作的纽带。 结论: 1、成功构建了国际上第一个疟原虫蛋白家族数据库 PlasmoGF,经人工评估, 其数据比较可靠,可作为疟疾研究工作者研究疟原虫蛋白功能的很好的参考资 源; 2、搭建了功能齐全的生物信息学分析平台,为搜索数据库中的蛋白家 族数据并做

6、比较基因组学与功能基因组学研究提供方便,为疟疾研究者研究疟 原虫基因提供了很好工具和平台; 3、本数据库和相应的数据分析平台对疟 疾工作者有很大实用意义,特别为研究者在设计疟原虫药物时寻找合适的靶点 提供很大的帮助。正文内容正文内容目的: 1、为了更好地对疟原虫蛋白家族进行比较基因组学和功能基因 组学方面的研究,构建疟原虫蛋白家族数据库; 2、开发一个功能齐全、高 度整合的生物信息学分析平台,为疟疾研究及相关科研工作者提供良好的数据 分析工具和平台。 方法: 1、对六个现有的疟原虫基因组蛋白序列数据进 行 All-against-All BLAST 搜索,再用 TribeMCL 软件包中 Mc

7、lblastline 程序 进行蛋白家族聚类,再用 PERL 程序提取蛋白家族信息以用于蛋白家族数据库构 建; 2、用疟原虫蛋白序列对 PDB、Swiss-Prot 和 RefSeq 三个数据库进行 BLAST 同源搜索,所得结果分别用 PERL 程序进行提取,以用于构建数据库; 3、用 HMMER 软件包中的 Hmmpfam 程序对 Pfam 数据库进行蛋白结构域搜索,输 出结果用 PERL 程序提取,以用于数据库构建; 4、用 BLAST 序列相似性程序 对 KEGG Ortholog(KO)数据库进行搜索,用 PERL 程序提取输出结果,然后用统 计学方法推测各家族的功能,并对其进行注释

8、; 5、以 Linux 为服务器, MySQL 为数据库管理软件,根据以上各步所得数据设计数据表,采用 BigDump 和 phpMyAdmin 等软件把数据导入数据库,构建成蛋白家族数据库; 6、以 Apache 为网络服务器,使用 Dreamweaver、UltraEdit、Photoshop、Activeperl 等软件,以 PHP、HTML、JavaScript、Ajax、PERL 等语言进行编程构建生物信息学数据分 析平台。 结果: 1、六个疟原虫基因组总共含有 40,273 条蛋白基因序列, 同源聚类分析得到了 8,089 个蛋白家族,总共有 50 种大小的家族,其中最大 家族有

9、1,107 个成员,最小的家族只有 1 个成员; 2、按家族大小来分,家 族个数最多是 1 个成员的家族,有 3,203 个,其次是 6 个成员的,有 1,094 个,家族大多集中有 12 个成员以下家族大小段,17 个成员以上的家族比较稀 少; 3、按物种基因分布看,P. berghei、P. chabaudi、P. falciparum 三 个物种在各种大小家族中分布比较均匀;P. knowlesi 和 P. vivax 两个物种在 小于 12 个成员的家族中占优势;而 P.yoelii 在多于 12 个成员的家族中相对占 优势; 4、家族大小分别为 98 和 178 的两个家族中的所有成

10、员都来自 P. falciparum,其中可能存在物种特意性的基因扩增; 5、构建了蛋白家族数 据库 PlasmoGF,并以其为基础构建了功能齐全的生物信息学分析平台 (http:/ BLAST 数据 库搜索、多序列比对、进化树构建等数据操作板块,并开发了数据工作集 Work-Set 作为用户数据存储的容器,并作为各步数据操作的纽带。 结论: 1、成功构建了国际上第一个疟原虫蛋白家族数据库 PlasmoGF,经人工评估, 其数据比较可靠,可作为疟疾研究工作者研究疟原虫蛋白功能的很好的参考资 源; 2、搭建了功能齐全的生物信息学分析平台,为搜索数据库中的蛋白家 族数据并做比较基因组学与功能基因组

11、学研究提供方便,为疟疾研究者研究疟 原虫基因提供了很好工具和平台; 3、本数据库和相应的数据分析平台对疟 疾工作者有很大实用意义,特别为研究者在设计疟原虫药物时寻找合适的靶点 提供很大的帮助。 目的: 1、为了更好地对疟原虫蛋白家族进行比较基因组学和功能基因组学 方面的研究,构建疟原虫蛋白家族数据库; 2、开发一个功能齐全、高度整 合的生物信息学分析平台,为疟疾研究及相关科研工作者提供良好的数据分析 工具和平台。 方法: 1、对六个现有的疟原虫基因组蛋白序列数据进行All-against-All BLAST 搜索,再用 TribeMCL 软件包中 Mclblastline 程序进 行蛋白家族聚

12、类,再用 PERL 程序提取蛋白家族信息以用于蛋白家族数据库构建;2、用疟原虫蛋白序列对 PDB、Swiss-Prot 和 RefSeq 三个数据库进行 BLAST 同源搜索,所得结果分别用 PERL 程序进行提取,以用于构建数据库; 3、用 HMMER 软件包中的 Hmmpfam 程序对 Pfam 数据库进行蛋白结构域搜索,输出结果 用 PERL 程序提取,以用于数据库构建; 4、用 BLAST 序列相似性程序对 KEGG Ortholog(KO)数据库进行搜索,用 PERL 程序提取输出结果,然后用统计 学方法推测各家族的功能,并对其进行注释; 5、以 Linux 为服务器,MySQL 为

13、数据库管理软件,根据以上各步所得数据设计数据表,采用 BigDump 和 phpMyAdmin 等软件把数据导入数据库,构建成蛋白家族数据库; 6、以 Apache 为网络服务器,使用 Dreamweaver、UltraEdit、Photoshop、Activeperl 等软件,以 PHP、HTML、JavaScript、Ajax、PERL 等语言进行编程构建生物信息学数据分 析平台。 结果: 1、六个疟原虫基因组总共含有 40,273 条蛋白基因序列, 同源聚类分析得到了 8,089 个蛋白家族,总共有 50 种大小的家族,其中最大 家族有 1,107 个成员,最小的家族只有 1 个成员;

14、2、按家族大小来分,家 族个数最多是 1 个成员的家族,有 3,203 个,其次是 6 个成员的,有 1,094 个,家族大多集中有 12 个成员以下家族大小段,17 个成员以上的家族比较稀 少; 3、按物种基因分布看,P. berghei、P. chabaudi、P. falciparum 三 个物种在各种大小家族中分布比较均匀;P. knowlesi 和 P. vivax 两个物种在 小于 12 个成员的家族中占优势;而 P.yoelii 在多于 12 个成员的家族中相对占 优势; 4、家族大小分别为 98 和 178 的两个家族中的所有成员都来自 P. falciparum,其中可能存在

15、物种特意性的基因扩增; 5、构建了蛋白家族数 据库 PlasmoGF,并以其为基础构建了功能齐全的生物信息学分析平台 (http:/ BLAST 数据 库搜索、多序列比对、进化树构建等数据操作板块,并开发了数据工作集 Work-Set 作为用户数据存储的容器,并作为各步数据操作的纽带。 结论: 1、成功构建了国际上第一个疟原虫蛋白家族数据库 PlasmoGF,经人工评估, 其数据比较可靠,可作为疟疾研究工作者研究疟原虫蛋白功能的很好的参考资 源; 2、搭建了功能齐全的生物信息学分析平台,为搜索数据库中的蛋白家 族数据并做比较基因组学与功能基因组学研究提供方便,为疟疾研究者研究疟 原虫基因提供了很好工具和平台; 3、本数据库和相应的数据分析平台对疟 疾工作者有很大实用意义,特别为研究者在设计疟原虫药物时寻找合适的靶点 提供很大的帮助。 目的: 1、为了更好地对疟原虫蛋白家族进行比较基因组学和功能基因组学 方面的研究,构建疟原虫蛋白家族数据库; 2、开发一个功能齐全、高度整 合的生物信息学分析平台,为疟疾研究及相关科研工作者提供良好的数据分析 工具和平台。 方法: 1、对六个现有的疟原虫基因组蛋白序列数据进行 All-against-All BLAST 搜

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 经济/贸易/财会 > 经济学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号