生物信息学高性能计算平台的构建与应用

上传人:mg****85 文档编号:44606050 上传时间:2018-06-14 格式:PDF 页数:76 大小:6.81MB
返回 下载 相关 举报
生物信息学高性能计算平台的构建与应用_第1页
第1页 / 共76页
生物信息学高性能计算平台的构建与应用_第2页
第2页 / 共76页
生物信息学高性能计算平台的构建与应用_第3页
第3页 / 共76页
生物信息学高性能计算平台的构建与应用_第4页
第4页 / 共76页
生物信息学高性能计算平台的构建与应用_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《生物信息学高性能计算平台的构建与应用》由会员分享,可在线阅读,更多相关《生物信息学高性能计算平台的构建与应用(76页珍藏版)》请在金锄头文库上搜索。

1、2012-12-05邹凌云邹凌云Ph.D. 第三军医大学生物信息学中心第三军医大学生物信息学中心 E-mail: http:/第三军医大学生物信息学高第三军医大学生物信息学高 性能计算平台的构建与使用性能计算平台的构建与使用22012-12-05BIC TMMU提纲生物信息中心情况简介生物信息中心情况简介生物信息学平台的构建生物信息学平台的构建数据库检索系统的使用数据库检索系统的使用高性能计算系统的使用高性能计算系统的使用生物信息学分析实例生物信息学分析实例Q IP地址地址:202.202.232.201计算节点计算节点(26台刀片式服务器台刀片式服务器)Blade1: compute-0-

2、0compute-0-9Blade2: compute-1-0compute-1-9Blade3: compute-2-0compute-2-5数据库节点数据库节点:主机名主机名:databaseIP地址地址:202.202.232.202访问域名访问域名:http:/2012-12-05BIC TMMU24平台的并行计算环境平台的并行计算环境MPI( Message Passing Interface)MPICH2 最基本的最基本的MPI,运行简单运行简单,应用广泛应用广泛,效率不高效率不高安装路径安装路径: /opt/mpich2/gnu/bin/openmpi功能强大功能强大、灵活灵活,

3、支持支持infiniband,效率高效率高安装路径安装路径:/opt/openmpi/bin/各计算节点的公共目录各计算节点的公共目录/disk1 和和 /disk2,容量均为容量均为8T2012-12-0525平台的任务管理系统平台的任务管理系统 SGE任务管理系统:自动分配计算资源来运行用户的计算任务Sun Grid Engine (SGE)LSFOpenPBS本平台安装的是SGE用户在进行生物信息学计算之前,需要编写SGE计算脚本 文件,通过提交脚本文件来使用计算资源。2012-12-0526生物信息学平台的使用方式生物信息学平台的使用方式使用方式使用方式通过校园网或互联网的任意计算机远

4、程通过校园网或互联网的任意计算机远程登录使用登录使用前来我校基础部生命科学楼前来我校基础部生命科学楼7楼本地使用楼本地使用272012-12-05BIC TMMU生物信息中心情况简介生物信息中心情况简介生物信息学平台的构建生物信息学平台的构建数据库检索系统的使用数据库检索系统的使用高性能计算系统的使用高性能计算系统的使用生物信息学分析实例生物信息学分析实例Q&A28 国际生物信息数据库的本地化过程国际生物信息数据库的本地化过程下载元数据下载元数据构建检索系统构建检索系统发布数据库发布数据库29已经收录的数据库已经收录的数据库GenbankUniprot KBPDBEMBLRefseqProsi

5、teM R S 检检 索索 系系 统统20多个生物医学相关的多个生物医学相关的 数据库数据库主要数据库每日更新主要数据库每日更新集成集成Blast、ClustalW、 Jmol等分析工具等分析工具可将自己的可将自己的Web-Server 程序程序、数据库发布到互数据库发布到互 联网联网30MRS数据库综合检索系统数据库综合检索系统Entrez The Life Science Search Engine - NCBISRS = Sequence Retrieval System - EBIMRS = Maartens Retrieval System - BIC at TMMUGoogle =

6、 Th best generic search and retrieval system2012-12-05fastLinux x86-64 versionfree31生物信息数据库的使用生物信息数据库的使用231 登录生物信息中登录生物信息中 心主页心主页:http:/从主页进入生物从主页进入生物 信息数据库信息数据库 在检索栏内在检索栏内 通过输入关键通过输入关键 词等方式检索词等方式检索 数据数据 选择所需要选择所需要 的数据库的数据库3233生物信息数据库检索系统生物信息数据库检索系统:一站式检索一站式检索342012-12-05BIC TMMU生物信息中心情况简介生物信息中心情况简介

7、生物信息学平台的构建生物信息学平台的构建数据库检索系统的使用数据库检索系统的使用高性能计算系统的使用高性能计算系统的使用生物信息学分析实例生物信息学分析实例Q&A35高性能计算系统的使用高性能计算系统的使用Linux基础知识1已安装生物信息学软件2用户使用流程3生物信息学实例分析436 1、Linux基础知识基础知识什么是什么是Linux?免费的类免费的类Unix操作系统操作系统,适合适合PC机机、服务器服务器具有具有Unix的全部功能的全部功能,稳定稳定,高效高效,网络性能优异网络性能优异以以Linux为基础的不同的发行版为基础的不同的发行版(Distribution):):Ubuntu:

8、适合初学者适合初学者Debian: Ubuntu的始祖的始祖,适合系统管理员适合系统管理员Fedora: 适合专业开发者适合专业开发者Redhat/CentOS: 适合个人或企业级服务器适合个人或企业级服务器openSUSE:适合个人办公适合个人办公37Linux很难吗很难吗?看起来很复杂看起来很复杂,不知从何下手不知从何下手 实际上上手很快实际上上手很快Linux系统不好用系统不好用 *nux不是用来当桌面的不是用来当桌面的书太多书太多,每本都很厚每本都很厚 推荐推荐OReilly系列系列38Linux系统的主要组成系统的主要组成Linux的内核的内核:内核是系统的核心内核是系统的核心,是运

9、行程序和管理像磁盘和打是运行程序和管理像磁盘和打 印机等硬件设备的核心程序印机等硬件设备的核心程序。Linux SHELL: Shell是系统的用户界面是系统的用户界面,提供了用户与内核进行交提供了用户与内核进行交 互操作的一种接口互操作的一种接口。Linux文件系统文件系统: Linux文件系统是文件存放在磁盘等存储设备上的文件系统是文件存放在磁盘等存储设备上的 组织方法组织方法。Linux能支持多种文件系统能支持多种文件系统,如如EXT2、EXT3、FAT、 VFAT、ISO9660、NFS、SMB等等。Linux应用系统应用系统:标准的标准的Linux系统都有一整套称为应用程序的程序系统

10、都有一整套称为应用程序的程序 集集,包括文本编辑器包括文本编辑器、编程语言编程语言、办公套件办公套件、Internet工具工具、数据数据 库等库等。39Linux命令模式下的基本操作命令命令模式下的基本操作命令ls 或者 ll: 列出当前目录下全部文件相当于DOS下的dircd : 改变当前目录至指定目录例:zoulybig $ cd /disk1/biosoft/mkdir: 建立文件夹例:zoulybig $ mkdir blast-test cp: 拷贝文件命令例: zoulybig $ cp enzyme.dat /disk1/data/pwd: 查看用户当前所在的路径40Linux命

11、令模式下的基本操作命令命令模式下的基本操作命令cat:查看文件内容zoulybig $ cat 1OMB.pdbmore: 逐屏显示文件内容vi:新建文件或编辑文件例:zoulybig $ vi 1OMB.pdbmv: 移动文件或目录rm: 删除文件或目录41Linux下解压缩文件下解压缩文件全能的解压缩命令: tar 例:tar xvfj blast2.2.21.tar.bz2tar xvfz blast2.2.21.tar.gztar xvfz blast2.2.21.taztar xvf blast2.2.21.tar422、平台上已安装的生物信息学软件平台上已安装的生物信息学软件软件类

12、型软件类型软件名称软件名称软件版本软件版本安装路径安装路径说明说明序列相似序列相似 性比较性比较fasta35.4.9/opt/bio*(系统自带系统自带)blast2.2.21/disk1/biosoft(后安装后安装)mpiblast1.5.0/opt/bio并行并行blast *多序列多序列比对比对ClustalW2.0.12/opt/bio*ClustalW-mpi0.15/disk1/biosoft并行并行ClustalW T_coffee8.14/opt/bio*MUSCLE4.0/disk1/biosoft43软件类型软件类型软件名称软件名称软件版本软件版本安装路径安装路径说明说

13、明全基因组全基因组 比较比较Mauve2.3.1/disk1/biosoftGenomeComp1.3/disk1/biosoftMUMmer3.22/disk1/biosoft基因组注基因组注 释和分析释和分析glimmer3.0.2/opt/bio微生物基因预测微生物基因预测*EMBOSS6.1.0/opt/bio综合分析包综合分析包*ncbi6.1-4/opt/bio综合分析包综合分析包*分子进化分子进化 与系统发与系统发 生分析生分析phylip3.69/opt/bio*mrbayes3.1.2/opt/bio*PAML4.4/disk1/biosoft44软件类型软件类型软件名称软件

14、名称软件版本软件版本安装路径安装路径说明说明蛋白质序蛋白质序 列和结构列和结构 分析分析Hmmer2.3.2/opt/bio保守结构域鉴定保守结构域鉴定*DomainFinder2.0.4/disk1/biosoftInterproscan4.6/disk1/biosoftModeller9v9/disk1/biosoft蛋白质结构预测蛋白质结构预测Rasmol2.7.3/disk1/biosoft三维结构观察三维结构观察序列拼接序列拼接 与分析与分析Tigr_Assembler3.0.2/opt/bio*CAP33.0/disk1/biosoftStaden package2.0b6/dis

15、k1/biosoft分子对接分子对接Autodock4.2.1/opt/bio*Autodock_vina4.3/disk1/biosoftDock/Dock_mpi6.4/disk1/biosoft45软件类型软件类型软件名称软件名称软件版本软件版本安装路径安装路径说明说明分子模拟分子模拟gromacs4.0.5/opt/bio*NAMD2.7/disk1/biosoftVMD1.8.6/disk1/biosoft分子网络分子网络 分析分析osprey1.2.0/disk1/biosoft分子网络构建分子网络构建cytoscape2.6.3/disk1/biosoft分子网络可视化分子网络可视化RNA折叠折叠 与非编码与非编码 RNA预测预测mfold3.5/disk1/biosoftunafold3.8/disk1/biosoftmiranda3.3/disk1/biosoftmiRNA作用位点预测作用位点预测其他软件其他软件MatlabR2010a/disk1/biosoftprimer33.0/disk1/biosoft引物设计引物设计46如何在平台上运行一个生物软件如何在平台上运行一个生物软件?安装在/

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号