IT运维分析与海量日志搜索方案

上传人:I*** 文档编号:156357625 上传时间:2020-12-17 格式:PPTX 页数:27 大小:536.24KB
返回 下载 相关 举报
IT运维分析与海量日志搜索方案_第1页
第1页 / 共27页
IT运维分析与海量日志搜索方案_第2页
第2页 / 共27页
IT运维分析与海量日志搜索方案_第3页
第3页 / 共27页
IT运维分析与海量日志搜索方案_第4页
第4页 / 共27页
IT运维分析与海量日志搜索方案_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《IT运维分析与海量日志搜索方案》由会员分享,可在线阅读,更多相关《IT运维分析与海量日志搜索方案(27页珍藏版)》请在金锄头文库上搜索。

1、,IT运维分析与海量日志搜索方案,技术创新,变革未来,提纲,IT 运维分析(IT Operation Analytics) 日志的应用场景 过去及现在的做法 日志搜索引擎 日志易产品介绍,从 IT Operation Management (ITOM) 到 IT Operation Analytics (ITOA) 大数据技术应用于IT运维,通过数据分析提升IT运维效率 可用性监控 应用性能监控 故障根源分析 安全审计 Gartner估计,到2017年15%的大企业会积极使用ITOA;而在2014年这一数字 只有5%,IT 运维分析,机器数据(Machine Data) 日志 通信数据(Wir

2、e Data) 网络抓包,流量分析 代理数据(Agent Data) 在 .NET/Java 字节码里插入代码,统计函数调用、堆栈使用 探针数据(Probe Data) 在各地模拟ICMP ping、HTTP GET请求,对系统进行检测,ITOA的四种数据来源,86%,93%,47%,72%,100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%,machine data(日志),wire data(网络抓包),agent data(插入代码),probe data(模拟检测),ITOA四种数据来源使用占比,机器数据(日志) 日志无所不在 但不同应用输出的日志内

3、容的完整性、可用性不同 通信数据(网络抓包) 网络流量信息全面 但一些事件未必触发网络流量 代理数据(嵌入代码) 代码级精细监控 但侵入性,会带来安全、稳定、性能问题 探针数据(模拟用户请求) 端到端监控 但不是真实用户度量(Real User Measurement),ITOA四种数据来源的比较,带时间戳的机器数据 IT 系统信息 服务器 网络设备 操作系统 应用软件 用户信息 用户行为 业务信息 日志反映的是事实数据 “The Log: What every software engineer should know about real-time datas unifying abstr

4、action”, Jay Kreps, LinkedIn engineer 深度解析LinkedIn大数据平台(,日志:时间序列机器数据,180.150.189.243 - - 15/Apr/2015:00:27:19 +0800 “POST /report HTTP/1.1” 200 21 “https:/ “Mozilla/5.0 (Windows NT 6.1; WOW64; rv:37.0) Gecko/20100101 Firefox/ 37.0” “10.10.33.174” 0.005 0.001 字段: - Client IP: 180.150.189.243 - Timest

5、amp: 15/Apr/2015:00:27:19 +0800 Method: POST URI: /report Version: HTTP/1.1 Status: 200 Bytes: 21 Referrer: User Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:37.0) Gecko/20100101 Firefox/37.0 - X-Forward: 10.10.33.174 Request_time: 0.005 Upstream_request_time:0.001,一条ApacheAccess日志,运维监控 可用性监控 应用性能监

6、控 (APM) 安全审计 安全信息事件管理 (SIEM) 合规审计 发现高级持续威胁 (APT) 用户及业务统计分析,日志的应用场景,日志没有集中处理 登陆每一台服务器,使用脚本命令或程序查看 日志被删除 磁盘满了删日志 黑客删除日志,抹除入侵痕迹 日志只做事后追查 没有实时监控、分析 使用数据库存储日志 无法适应TB级海量日志 数据库的schema无法适应千变万化的日志格式 无法提供全文检索,过去,Hadoop 批处理,不够及时 查询慢 数据离线挖掘,无法做 OLAP (On Line Analytic Processing) Storm/Spark Hadoop/Storm/Spark都只

7、是一个开发框架,不是拿来即用的产品 NoSQL 不支持全文检索,近年,对日志实时搜索、分析 日志实时搜索分析引擎 快 日志从产生到搜索分析出结果只有几秒的延时 大 每天处理 TB 级的日志量 灵活 Google for IT, 可搜索、分析任何日志 Fast Big Data,现在,日志3.0: 实时搜索引擎,需要开发成本 批处理,实时性差 不支持全文检索,固定的schema无法适应 任意日志格式 无法处理大数据量,日志2.0: Hadoop 或 NoSQL,日志1.0: 数据库,实时 灵活 全文检索,日志管理系统的进化,可编程的日志实时搜索分析平台 搜索处理语言 (Search Proces

8、sing Language, SPL) SPL命令用管道符(“|”)串接成脚本程序 在搜索框里写 SPL 脚本,完成复杂的查询、分析 可接入各种来源的数据 日志文件 数据库 恒生电子交易系统二进制日志 企业部署版 SaaS 版 每天500MB日志处理免费,日志易亮点,搜索 告警 统计 事务关联 配置解析规则,识别任何日志 把日志从非结构化数据转换成结构化数据 安全攻击自动识别 开放API,对接第三方系统 高性能、可扩展分布式架构 乐视:100万 EPS (Event Per Second),20TB/天,日志易功能,使用日志易之前 逐台登陆服务器,无法集中查看日志,无法对海量数据进行挖掘、用户

9、行为分析 日志查询方式比较原始,只能 less、grep 和 awk 等常见的 Linux 指令,无法多维度查询(时间段、关 键字、字段值) 无法进行日志的业务逻辑分析和告警 使用日志易之后,接入100多个应用的日志,8TB/天 省去登陆服务器的操作,快速,降低人为登陆服务器误操作引发生产故障 查询条件多维度,提升定位异常原因的效率 可以对日志数据进行数据挖掘、用户行为分析并产生相应的报表,同时还可以针对应用系统健康指数提 前告警,而不是事后补漏,客户案例:某大型综合金融机构,使用场景和解决的问题 分析营业厅业务办理Web请求日志 聚合出每个营业员每项业务的详细操作步骤,对每个步骤操作时长进行

10、告警、统计分析 Search Processing Language 范例 json.url:“/charge/business.ac8on?BMEBusiness=charge.charge&_cntRecTimeFlag=true” | transac8on apache.dimensions.cookie_CURRENT_MENUID startswith=eval(json.ac8on:“ 查 询 ”& 8mestamp30m) endswith=json.ac8on:提交,1.先通过url过滤 出所有缴费业务 日志,2.通过menuid进行分 组聚合,3.将“查询”动作作为 步骤起点,4.默认30分钟内营业员处理完一笔完整业务,5.将“提交”动作作为 步骤结束,客户案例:中移动某省分公司,一笔缴费业 务营业员所 有操作步骤 一目了然 每个步骤所 需要的执行 时间按步骤 顺序排列 网络处理时间,服务器处理时间按步骤顺序排列,客户案例:中移动某省分公司,安全信息与事件管理 终端信息安全事件日志的调查、分析、取证 在各省分公司信息安全事件现场使用 快速排查事件日志保留的证据,为事件取证提供支持,客户案例:国家电网,客户,日志易介绍:总览,日志易介绍:日志结构化,日志易介绍:字段抽取、统计,日志易介绍:搜索,日志易介绍:统计,日志易介绍:告警,日志易介绍:仪表盘,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 云计算/并行计算

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号