企业自动化运维实践

上传人:第*** 文档编号:60837597 上传时间:2018-11-19 格式:PDF 页数:84 大小:9.28MB
返回 下载 相关 举报
企业自动化运维实践_第1页
第1页 / 共84页
企业自动化运维实践_第2页
第2页 / 共84页
企业自动化运维实践_第3页
第3页 / 共84页
企业自动化运维实践_第4页
第4页 / 共84页
企业自动化运维实践_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《企业自动化运维实践》由会员分享,可在线阅读,更多相关《企业自动化运维实践(84页珍藏版)》请在金锄头文库上搜索。

1、 企业自动化运维实践 刘宇 Puppet实战 作者 作者 InfoQ社区编辑 编辑 编辑 Puppet 3 Cookbook 译者 译者 linuxtone.org linuxtone.org 开源爱好者 开源爱好者 关于我 关于我 课程大纲 课程大纲 运维体系中的工具介绍 运维体系中的工具介绍 p 常见开源软件介绍 常见开源软件介绍 运维自动化平台建设 运维自动化平台建设 p 如何建设一个的运维自动化平台 如何建设一个的运维自动化平台 平台规范平台规范 p 无规矩不成方圆无规矩不成方圆 案例案例:如何提升用户点播质量如何提升用户点播质量 p 新浪案例分享新浪案例分享 案例案例:如何提升用户访

2、问质量(移动端如何提升用户访问质量(移动端) p 百度案例分享百度案例分享 互联网企业的指标要求互联网企业的指标要求 p 大家对业务的要求是大家对业务的要求是? 团队建设团队建设 p 人人 Tools 运维体系中的工具介绍 开源工具的分类 开源工具的分类 服务器监控服务器监控 网络监控网络监控 性能监控性能监控 日志管理日志管理 日志分析日志分析 系统安装系统安装 命令执行命令执行 配置管理配置管理 虚拟化虚拟化 云计算云计算 云存储云存储 软件包管理软件包管理 服务自启动服务自启动 DNS管理管理 故障管理故障管理 版本控制版本控制 文档管理 文档管理 1. 监控类 监控类 1.1. Cac

3、ti -Cacti - 基于基于rrdtoolsrrdtools的网络监控工具的网络监控工具 2.2. Munin Munin 网络资源监控工具网络资源监控工具 3.3. Naemon - Naemon - 基于基于NagiosNagios的监控工具的监控工具 4.4. Nagios - Nagios - 服务器服务器、网络网络、性能的监控平台性能的监控平台 5.5. Zabbix PHPZabbix PHP界面操作的监控系统界面操作的监控系统 6.6. Zenoss Zenoss 智能监控软件智能监控软件 7.7. Mrtg - Mrtg - 老牌网络监控工具老牌网络监控工具 8.8. Sm

4、okeping Smokeping 基于基于fpingfping的网络延迟的网络延迟、丢包监控丢包监控 9.9. Graphite Graphite 灵活报表类的监控工具灵活报表类的监控工具 2 2. 系统安装类 系统安装类 1. Kickstart 结合pxe+dhcp+tftp 2. Cobbler 结合pxe+macdhcp+reporsync 3 3. 命令执行类 命令执行类 1. Ansible 基于Python、SSH的命令编排 2. Fabric 基于Python的命令执行工具 3. Saltstack 基于Python的命令执行+配置工具 4. Pssh 基于Python的命令

5、执行工具 5. Shell + expect 自己写 4 4. 配置管理类 配置管理类 1. Puppet 基于Ruby的配置管理工具 2. Chef 基于Ruby的配置管理工具 3. CFEngine -基于C的配置管理工具 5. DNS类 类 1. Bind9 老牌DNS软件 2. PowerDNS - 基于local的DNS管理 6. 日志类 日志类 1. Elasticsearch 结构化日志存储 2. Fluentd 日志采集端 3. Flume 日志采集端 4. Heka 基于Go的日志采集端 5. Logstash 日志采集端 6. Kibana 日志分析展示端 6. 云计算类

6、云计算类 1. CloudStack - 云计算公司分享,方便创建云主机 2. OpenStack 开源最火的云计算方案 7 7. 容器类 容器类 1. Docker 当前最火的轻量级容器 2. OpenVZ Linux上的容器 8 8. 存储类 存储类 1. Ceph 分布式对象和存储的文件系统 2. GlusterFS 分布式网络存储的文件系统 3. HDFS 分布式文件系统,Hadoop底层 4. MooseFS - 网络分布式文件系统 5. MogileFS 应用程序级别的分布式文件系统 9 9. 项目管理类 项目管理类 1. GitLab 基于Ruby编写的类似Github私有化项目

7、管理,使用者多 2. Gogs 基于Go写的项目管理 3. Redmine 基于ruby on rails写项目管理,使用者多 4. Trac 基于Python编写的,当前使用者少 10. 版本控制类 版本控制类 1. Git - 分布式版本控制 2. Subversion 服务端- 客户端的配置,老牌 我是如何关注开源的 我是如何关注开源的 https:/ http:/ http:/ http:/weekly.manong.io/ http:/ platform 运维自动化平台建设 运维自动化平台愿景 运维自动化平台愿景 ?-? M? ? WEB?P? ? ? ? M? M? ? ? ?D?

8、 ?P? M? ? ? ?B? ? ? AC? ? ? ? ? ?I? ?M? ? ? ? ? B ? ? ? /? ? ? ? ? ? ELK Storm 如何做如何做? 几大体系的融合 几大体系的融合 全方位监控系统全方位监控系统:覆盖业务、应用、网络、系统等 方面,做到任何问题,都可直观反馈。对不同应用 等级,做到不同监控策略和报警策略。 自动化工具系统自动化工具系统:对重复的、容易出错的、繁琐的 工作尽可能工具化,通过小的策略组合,完成大的 任务。 配置和管理系统配置和管理系统:对于复杂的配置管理,尽可能we b化、标准化、简单化,有模板定义,有规范遵循。 记录和分析系统记录和分析系统

9、:对发生的问题和数据做记录并 分析,不断的总结、完善和提升。 CMDB的功能与核心 的功能与核心 两大功能 1. 数据存储 2. 开放API 四大核心 1. 自动发现 2. QR码技术 3. 配置/监控/变更联动 4. 流程与文档并行 资产管理资产管理 1. Facter采集信息 2. Puppet上报Master 3. Python读取facts 入库 4. Django读库 全方位监控 全方位监控 根据业务形态,定制化展示 全方位监控 全方位监控 故障及时展示 不要放过任何一条报警 从日志中挖掘 从日志中挖掘 日志统计分析 开始打造平台 开始打造平台 命令执行 命令执行 脚本管理 脚本管理

10、 设计理念 设计理念 1. 自定义脚本 2. 自定义编排任务 3. 根据业务进行脚本分类 4. 标准化、流程化 So. 几乎所有工作都可以采用脚本 来完成 配置管理 配置管理 理念是什么理念是什么? 我们遵循一个理念我们遵循一个理念,能用程能用程 序跑序跑,就不去人操作就不去人操作。 一切皆一切皆SERVICE 业务流程 业务流程 资源申请 CMDB 关联 虚拟机 /云主机 OS初 始化 配置管 理(Puppet ) 关联 应用部署 持续部署或Puppet 关联 关联应 用/测试 集群式关联、自动 化测试 关联 上线 研发及业务双重验收 关联 更多的思考点 更多的思考点 1. 业务回退 2.

11、配置升级 3. 业务扩容 4. 业务下线 5. 多个环境 打包完成? 一刀切? 源源不断的需求? 了解根本需求 了解根本需求 要跳出“死亡循环”其实并不容易,因为处 在这个循环中的人往往认为自己在做正确的 事情听从用户需求、满足用户需求。 但是,正确的动机并不一定会带来好的结果 ,满足了用户对某个特定功能的需求并没有 真正帮他们解决问题。 你所应该做的,就是不断地刨根问底,理解 阻碍产品发展的根本原因是什么。 ITIL 流程与规范 规范 规范 命名规范 主机名 isp-city-group-role-idc- 业务名/任务名/脚本名 action-action(docker-pull-imag

12、e.sh) 打包命名 package-10.2.23.tar.gz 代码规范 研发规范 commit & push (注释) 测试规范 常规上线流程 常规上线流程 上线分类 上线分类 常规改进上线:针对产品的局部或单个模块进行调优和改进,上线由 研发部发起。 Bug修复上线:研发针对产品某个或者某几个bug进行修改后,上线 由研发部发起。(注:Bug定义参见运维部网站系统故障和问题 管理流程) 架构优化上线:针对系统架构进行性能、负载均衡、可靠性、可扩展 性等方面的调优和改进工作,一般不涉及功能上的整改,上线由研发 部发起。 产品/功能上线:新产品的推出或者某个已有产品的新版本推出,上 线由产

13、品策划部发起。 故障处理流程 故障处理流程 服务器规范 服务器规范 备注备注:部署部署Linux VOD系统的分区如下系统的分区如下: 分区大小分区大小: 第一块硬盘安装操作系统第一块硬盘安装操作系统,如下分区如下分区: Swap 4GB /boot 192MB / 第一块硬盘其余容量 第一块硬盘其余容量 其它硬盘其它硬盘,命名为命名为data1 、data2、data3dataN /data1 第二块硬盘 第二块硬盘 /data2 第二块硬盘 第二块硬盘 /dataN 第第N块硬盘 块硬盘 流程与规范 流程与规范 长期制定并修改好相应的流程和规范,操作人员必须严格遵守 case 案例:如何提升用户点 播质量 背景介绍 背景介绍 1. 涉及7个ISP, 60+ IDC 2. 覆盖20个产品线 挑战挑战 1. 网络延迟与抖动 2. 用户网络质量差(比如在下载应用) 3. 机房故障 4. 活动时流量突发 思路 思路 A 建立系统建立系统、网络网络、业务质量监控中心 业务质量监控中心 B 逐步分析逐步分析,每日总结每日总结,每次总结 每次总结 C 加入智能算法加入智能算法,自动化处理 自动化处理 D D 分析反馈分析反馈,随时调整随时调整,保证精确度 保证精确度 从小到大的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 事务文书

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号