BioKnow生物信息技术平台

上传人:jiups****uk12 文档编号:45649269 上传时间:2018-06-18 格式:PPT 页数:92 大小:11.55MB
返回 下载 相关 举报
BioKnow生物信息技术平台_第1页
第1页 / 共92页
BioKnow生物信息技术平台_第2页
第2页 / 共92页
BioKnow生物信息技术平台_第3页
第3页 / 共92页
BioKnow生物信息技术平台_第4页
第4页 / 共92页
BioKnow生物信息技术平台_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《BioKnow生物信息技术平台》由会员分享,可在线阅读,更多相关《BioKnow生物信息技术平台(92页珍藏版)》请在金锄头文库上搜索。

1、生物信息集成平台北京百奥知信息科技有限公司 庄永龙 博士 北京市海淀区大钟寺华杰大厦12B6 010-82790315 / 010-82790317大纲数据库建设技术平台方案简介数据服务典型案例生物信息解决方案生物信息学作为一个交叉学科,其衍生的学科包括结构基因组学,功 能基因组学,比较基因组学,蛋白质学,药物基因组学,中药基因组学,肿 瘤基因组学,分子流行病学和环境基因组学,微生物基因组学,植物基 因组学;同时生物信息学作为一个有力的研究工具与手段,在生物、医 学、药学、农学中的应用也越来越广泛。基于我们自主开发的生物信息平台有分子注释系统、生物数据分析系 统、序列功能分析系统,病毒序列

2、综合分析系统、疾病生物信息系统等 。系统功能涉及了基因表达谱分析,代谢网络分析,基因芯片设计和蛋 白质组学数据分析,序列进化分析、序列功能分析等。基于我们的生物 信息系统平台,我们可以提出来了疾病基因组研究、植物基因组研究、 病毒微生物基因组研究中的生物信息学解决方案。新一代高通量测序技术o 近年来,新一代高通量测序技术得到了突飞猛进的发展 ,在此基础上,RNA-seq、sRNA-seq、ChIP-seq也迅速 发展. 与基因芯片技术相比,新测序无需设计探针,能 在全基因组范围内以单碱基分辨率检测和量化转录片段 ,并能应用于基因组图谱尚未完成的物种,具有信噪比 高、分辨率高、应用范围广等优势,

3、正成为研究基因表 达和转录组的重要实验手段. o 新测序为组学的研究带来了高分辨率的海量数据,如何 有效处理和分析这些海量数据成为这一新技术能否带来 新的科学发现的关键,一些生信息学方法与软件也应运 而生. DNA测序技术高通量测序p DNA测序 p RNA测序 p Small RNA测序 p ChIP-seq测序高通量测序-DNA测序序列分析功能分析go功能分析Pathway通路分析蛋白互作分析转录因子分析miRNA分析疾病药物相关分析基因组组装序列变异分析比较基因组分析基因识别及功能预测高通量测序-RNA测序序列分析数据分析功能分析序列比对分析差异基因筛选-显著性分析样本间比较-相关分析g

4、o功能分析Pathway通路分析蛋白互作分析转录因子分析反义转录本miRNA分析疾病药物相关分析可变剪切预测序列变异分析高通量测序-smallRNA测序序列分析数据分析功能分析基因组定位miRNA表达差异分析-显著性分析miRNA家族差异分析-显著性分析miRNA分析Pathway通路分析sRNA分类miRNA分析进化分析 SNP分析 GO功能分析miRNA基因簇分析 miRNA编辑 病毒来源miRNA 自然反义 miRNA 内生siRNA ,siTRNA等高通量测序-ChIP-Seq测序序列分析数据分析功能分析数据过滤Peak分析-显著性分析miRNA家族差异分析-显著性分析GO、COG、K

5、OGPathway通路分析序列比对基因组定位序列motif分析蛋白互作网络分析整体架构人类疾病研究解决方案植物基因组研究解决方案病毒微生物基因组研究解决方案科研 Research制药 Pharmacy医疗 Treatment疾病 Disease科学问题 Problem科学发现 Discovery病历信息 Medical records流行病调查数据 Epidemiological survey data临床试验数据 Clinical Trial动物实验数据Animal trial生化实验数据 Biochemical Experiment芯片实验数据 Microarray data专家知识 Kn

6、owledge公共数据库数据 Public database文献资料 Literature生化指标数据 Biochemical indicators 样本信息 Sample info常规生物信息问题多个系统实验结果 综合分析病例收集 药物临床试验 常规分子生物学实验 PCR实验引物设计 序列比对问题 基因分型问题 蛋白结构分析问题基本统计分析表达谱芯片用PCR实验结果对照 表达谱芯片与miRNA芯片结合 表达谱芯片与SNP芯片分析结合 表达谱与蛋白质组学研究结合 .显著性检验 方差分析 回归分析 相关分析 生存分析 .常规分子生物学实验等: PCR实验 DHPLC 电泳高通量数据分析表达谱数据

7、分析:选择差异表达基因、构 建调控网络、基因marker等; SNP分析:选择与疾病关联的marker; miRNA芯片:基因marker、分类判别等 测序:序列组装、比对、基因分型等新测序 表达谱芯片 SNP芯片 miRNA芯片 测序分析 蛋白质组学研究 代谢组学研究高通量实验+常规实验补充 高通量实验+高通量实验大纲数据库建设技术平台方案简介数据服务典型案例生物 信息 平台医学 数据库平台架构生物信息技术平台用户管理权限管理 安全管理监控管理数据备份异地容灾人员备份标准管理序列数据管理与分析系统百奥知序列管理与分析平台,对库中序列进行包括序列集成功能分析, Blast比对检索、序列批量比对

8、、蛋白翻译、耐药位点变异分析、序列基 因型血清型、表面抗原分析等生物信息相关层次自动分析注释需求。百奥 知信息服务支持功能扩展和结构化定制,能够满足序列信息收集与科研中 的个性化需求,为序列研究中的序列信息收集、标本采集、序列分析等提 供强有力的信息化保障。功能1-基因组浏览GBrowse(Genome Browse)基因组浏览器,用于浏览某一物种 的基因组,包括编码序列,调控序列,EST序列,保守序列,内 含子,外显子,SNP等等。功能2-序列比对分析Blast分析 我们在序列库表下提供蛋白和核酸BLAST检索,方便把未知信息 序列和已知的序列比对,从序列库中找到相似序列,点击链接可 进入详

9、细信息浏览。 高度同源序列搜索(序列质控) 将测序得出的序列放入搜索框,然后对库中的序列进行高度同源 序列搜索,进而来检测此条数据是否被污染。对比对分值较高序 列进行同源多序列比对,提供可视化显示。 进化树构建 对选中的数据库序列数据进行处理,进而构建出所选序列进化树 图功能3-序列批量比对参考序列库 构建研究物种的序列参考库,从NCBI或物种专有的数据库下载基因或cDNA的序列。 并构建BLAST检索 核酸序列 将自己测序所得的序列,经过数据导入或fasta文件导入,选择你要比对基因进行批量 比对(seqtogene)功能4-核酸序列功能分析1.2D structure(二维结构分析):例如

10、: einverted:找出核酸序列的反向重复序列。 2.codon usage(密码子分析):例如:cusp:为 一条核酸序列建立密码子表。 position(成分分析):例如:sirna:找到 mRNA中的siRNA。 4.cpg island(CpG岛分析):例如:cpgplot: 画出核酸序列中的CpG岛。 5.gene finding(基因寻找):例如:getorf:找 到序列中的ORF。 6.motifs(模式分析):例如:fuzznuc:在核酸 序列中寻找某一模式。 7.mutation(突变分析):例如:msbar:制造一 个突变序列。 8.primers(引物分析):例如:e

11、primer3:挑出 PCR引物。 9.profiles(谱分析):例如:profit:用一个简单 的频率矩阵扫描一个或多个序列。 10.repeats(重复序列分析):例如: equicktandem:找到核酸序列中的重复串。 11.restriction(限制性位点分析):例如: recoder:找到序列中的限制性位点。 12.transcription(转录):例如:jaspscan:在 核酸序列中寻找转录因子。 13.translation(翻译):例如:transeq:翻一 个DNA序列。功能5-蛋白序列功能分析1.2D structure(二维结构分 析):例如:garnier:预

12、测蛋 白质的二级结构。 2.3D structure(三维结构分 析):例如:psiphi:计算蛋白 质的psi和phi转角。 3. composition(成分分析) :例如:freak:计算出蛋白质 的残基频率。 4. motifs(模式分析):例如 :antigenic:找到蛋白质的抗 原位点。 5.mutation(突变分析):例 如:msbar:制造一个突变序列 。 6. profiles(谱分析):例如: profit:用一个简单的频率矩阵 扫描一个或多个序列。功能6-序列变异分析通过blast比对等一系列常规算法集成,对测试序列数据通过勾选进行 批量分析,经过运算进而自动生成:基

13、因分型、血清型分型、核酸突变 位点识别、耐药位点识别、耐药分析、核酸序列自动翻译蛋白、抗原表 位分析等结果。功能7-序列片段统计将序列库中的所有序列首先和系统中内置的标准全序列 进行比对,进而将序列分成多个序列组,然后通过检测 类型,功能区及起始和结束位置,对比对后的库进行区 域性检索汇总统计,来发现新的突变类型。功能8-高通量算法集成分析版块算法集成说明 Solexa数据处理SolexaQA HTQC NGS QC BIGpre PIQA FastQC 其他一些脚本用于测序数据不同格式之间的转 换用于Solexa 测序的Reads质量评估以及低质 量Reads过滤; Solexa测序数据的质

14、量控制,包括质量评估 ,序列过滤,和图形化报告的产生; 去除重复序列;RNAseq测序reads定 位MAQ, Bowtie, BWA, ZOOM, ELAND, SOAP2, RazerS, Novoalign, SHRiMP, BFAST, 以及 Mosaik将所有测序读段通过序列映射(mapping) 定位到参考基因组上转录本定量分析rpkm=109*C/NL对每个基因进行定量分析,也可以进一步利 用RPKM/FPKM进行差异表达可变剪切预测, 反义转 录本的寻找, 识别新的转录本Gapipeline,Tophat分析转录本的剪接形式和研究选择性剪接突变信息分析MAQ,BWA利用mapp

15、ing 结果来分析突变信息,基于覆 盖度的统计检验来寻找差异表达的基因预测新的miRNAmiRDeep2通过RNA测序结果的分析来寻找新的miRNA项目实例1-序列比对步骤1选择分析的功 能步骤2 填入自己的序 列,并点击执行步骤3 检索结果步骤4 显示比对详细 结果项目实例2-序列功能分析步骤1 选择序列功能 分析步骤2 输入核酸序列步骤3 选择分析方法步骤4 结果显示项目实例3-序列变异分析步骤1 选择新增 变异分析步骤2 批量序列 综合分析步骤3 序列片段 统计步骤4 单条序列 综合分析步骤5 标准序列 比对生物信息技术平台用户管理权限管理 安全管理监控管理数据备份异地容灾人员备份标准管

16、理高通量数据分析目标o 疾病的发生机理、疾病分型(肿瘤) o 疾病预测诊断分类模型(疾病早中晚期不同) o 疾病靶点,bio-marker发现(基因,蛋白质谱,二维 凝胶,snp(连锁,关联),甲基化位点),染色体 拷贝数,loh o 致病机理研究(pathway,多组学,调控网络) o 药物筛选(从分子水平上研究药物对药物模型的基因表 达的影响) o 药理机制的研究(药物载体的研究,药物代谢) o 基因突变,基因剔除,RNA干扰o 与数据管理相分离,难以追溯实验 o 各研究相对独立,每种实验数据都有相对特 定分析方法 o 分析算法、软件非常多,难以选择,而且往 往有一定区别 o 针对多种数据源的综合分析较为困难 o 面临的问题!生物数据分析系统生物数据分析系统主要包括:1 高通量数据分析,显著性分析、聚类分析、相关分析、 主成分分析;2 SNP分析,Hardy-Weinberg平衡、LD分析、单体型分析;3 医学统计 分析,假设检验、方差分析、分参数检验、生存分析、回归分析等

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号