storm技术分享

上传人:小** 文档编号:55618020 上传时间:2018-10-03 格式:PPT 页数:14 大小:670.49KB
返回 下载 相关 举报
storm技术分享_第1页
第1页 / 共14页
storm技术分享_第2页
第2页 / 共14页
storm技术分享_第3页
第3页 / 共14页
storm技术分享_第4页
第4页 / 共14页
storm技术分享_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《storm技术分享》由会员分享,可在线阅读,更多相关《storm技术分享(14页珍藏版)》请在金锄头文库上搜索。

1、Storm技术分享,大数据,巨量资料,指所涉及资料量规模巨大(Volume、Variety)无法透过目前主流软件工具合理时间(Velocity)内达撷取、管理、处理、并整理成帮助企业经营决策(Variety)更积极目的的资讯,大数据与云计算,分布式实时流式处理系统,流式处理系统(规范且稳定的结构): http:/ 分布式系统(网格,云计算,快速的部署能力和容灾性,方便的扩展) 实时系统(快速的处理能力),典型的场景,日志统计系统: 传统的解决方案: queue+worker实时系统:云统计 问题: 1、部署维护消息队列 2、自动容错机制,进程、机器挂掉自动处理 3、功能扩展性,Storm是什么

2、,分布式实时流式处理系统 流式:提供了一个简单的计算模型和API(类似MapReduce),可以方便的处理不断产生的数据 实时:系统本身的效率很高,处理延迟在毫秒级 水平扩展:通过简单加机器、提高并发数就可以提高整体处理能力 自动容错:自动处理进程、机器挂掉的异常,Storm的位置,几个重要概念:数据输入,Tuple:被处理的数据 Stream:一群消息的集合 Spout:产生数据源的组件,几个重要概念:数据处理,Bolt:接受数据后处理数据的组件 Worker:运行处理组件逻辑的进程 Task:Work中每一个spout/bolt的线程 bolt的角色是处理数据,输入是上游(spout或bolt)的tuple,输出是发往下游(bolt)的tuple;bolt可以有多级,一般最后一级bolt会定期把结果写到外部存储,几个重要概念:组合,Topology:对一个应用的spout、bolt类型、输入输出tuple/stream、关联关系的描述,几个重要概念:集群控制,Nimbus:主控节点。负责分配资源,任务调度,监控集群等 Supervisor:接收任务,启动进程 Zookeeper:协调Nimbus和Supervisor之间的工作,存放公共数据,几个重要概念:集群控制,Storm处理流程,演示:,开发机:220.181.150.112 展示页面: http:/w-:8360/,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号