it运维与管理高峰论坛演讲.doc

上传人:F****n 文档编号:95588751 上传时间:2019-08-21 格式:DOC 页数:85 大小:45KB
返回 下载 相关 举报
it运维与管理高峰论坛演讲.doc_第1页
第1页 / 共85页
it运维与管理高峰论坛演讲.doc_第2页
第2页 / 共85页
it运维与管理高峰论坛演讲.doc_第3页
第3页 / 共85页
it运维与管理高峰论坛演讲.doc_第4页
第4页 / 共85页
it运维与管理高峰论坛演讲.doc_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《it运维与管理高峰论坛演讲.doc》由会员分享,可在线阅读,更多相关《it运维与管理高峰论坛演讲.doc(85页珍藏版)》请在金锄头文库上搜索。

1、 丨丨全讯网2丨2008IT运维与管理高峰论坛演讲?刘静刘静:非常荣幸今天有机会在这里跟大家一起探讨一IT服务管理的实践。实际上从IT服务管理的发展来看,大家在做各种各样的实践,包括在建设按照ITLI的最佳实际,结合国内的实际情况来建设相关的相关管理流程,而且不断地使这样的管理流程走向更加成熟。即使是这样,我们仍然发现,好象持续在做这些管理流程的一些实施的话,在我们整个的过程当中仍然碰到了困难。比如说我们很难看到一个跟业务相关的视图,比如说我们说在支持IT业务的运维和发展,我们怎么样看到跟IT业务相关视图以及业务的可持续化,是我们很难解决的问题。如何利用自动化的驱动来降低整个的费用,提高服务的

2、提供和整个服务的质量,保证快速地实施。以及面临现在不管是应用环境还是IT自身的架构建设也好,我们面临了不断更新的技术和服务的发展。在面临这样的服务和技术发展的时候,如何进行创新?我们今天的内容就IT服务管理的一些实践跟大家交流。首先,这是大家都很熟悉的Gartner关于IT成熟度的模型,从目前我们国内的用户来讲,大家都处在一些被动式的管理,有一部分用户在于主动式或者是面向服务的管理,或者是第二层次、第三层次做了工作。比如说主动的监控,尝试做一些容量和能力的规划方面的工作。我们来看,从我们最终的IT的管理怎么样去面向IT服务的管理来讲的,IBM的服务管理提出三个主要的思想,第一个主要的思想是怎么

3、样实现一个可视化,这是我们在一开始谈到的问题。如何能够把IT跟我们业务之间的关系,以及对业务之间的支持,我们能够用可视化的方式看到,能够评估、测量,并且能够支持我们日常的运维。第二个方面,我们把它总结为可控化,我们怎么样去了解我们现在所有的IT的资产,在这些IT的资产如何来支持我们日常的运维,以及IT的资产我们如何去对它做一个更重复地使用,和对他进行一个更高效地利用,从而减轻我们的成本和提高我们的服务质量,并且降低在管理过程当中的风险。第三个问题是自动化,在自动化这点上,我们不是说要有什么样的产品,或者是在IT管理建设服务某一个点上实施自动化,帮助我们提高效率。从自动化来讲,不管是可视化、可控

4、化都贯穿在整个管理的过程当中。自动化我们提供流程的自动化怎么实现,包括实现运维我们做自动化的部署、监控,在整个监控的方面,怎么样去实施自动化,来提高我们的生产效率。首先从可视化这个目标来讲,我们需要去洞察业务,我们需要去了解,现在的业务的状态是什么,我们的IT是怎么样去支持我们的业务的,直接能够从我们的IT业务的支持上面看到可交付的目标。从我们的解决方案来讲,我们需要提供实时的视图和实时的dashboard,包括我们从业务合规、运维整个了解现在资产的管理所需要的可用性,以及这个可用性是不是很好地实现了我们的业务目标。在我们的右边是给了大家一些可视化的视图,后面我们就这些可视化的内容进行展开沟通

5、。第二个部门可控化,刚才已经谈到了主要的核心思想是我们怎么样能够提供一个完善的控制,能够去了解到我们的现有的IT资产以及如何对我们的IT资产进行优化的利用。在讲到可控化这部分,大家会想是不是讲我们IT资产的管理,以及从ITLI来讲,更侧重于CMDB这样的管理,从后面整个运维的角度来讲,可控化对IT资产、CMDB的管理,不是在资产本身提供一个高效地利用率、管控也好,实际上对我们的运维过程怎么样实现可视化,怎么样把纷繁复杂的基础架构的事件、问题能够可视化变成业务影响。它在这部分来讲,提供了非常好的业务的技术支持。最后是自动化,将敏捷性融入到我们的运维当中,帮助我们快速地实现运维的目标。刚才我们从I

6、BM服务管理三个比较核心的思想和观点,从我们的实践来讲,大家会想到我们现在面临的是非常复杂的IT的架构。在我们这张图下面,大家可能看到的是在我们下面的这部分,不管是从我们的主机、开放平台、应用、网络、语音、传输等等整个IT的基础架构。这是我们现在面临的,从IT的视角看。从业务视角看的话,我所需要的是一个业务的交付,从银行业来看,我需要的是网上银行能够提供我们所承诺的服务级别,能够在我们用户所期望,业务目标所定义的一些响应时间也好,是在指标之内对我们广大的用户,是对业务的用户提供服务。我们现在IT和业务之间,我们怎么样来建立这种联系,以及怎么样实现运维,这是我们给出的一个实践的模型。在这样实践的

7、模型当中,主要的部分是三个层次,在金字塔模型最上端,是我们的业务所要实施的整个业务的管理。在中间的层次是一个会聚的运维的管理。下面这个层次来讲,是我们熟悉地传统IT的管理领域。我们定义为一个技术的专业领域的管理,包括对应用、网络、主机、安全、开放平台、存储等等的各个支持我们的IT基础架构的整个环境的各个专业领域的管理。我分了两部分探讨,一部分我们会侧重于在讲,根据我们现在运维的环境,我们怎么样在基础架构的层次做技术领域的专业的管理。另外一部分,探讨怎么样面向业务服务的管理。首先,我们从大家非常熟悉的领域开始,面向一个专业技术领域的管理。当我们回到各个专业技术领域,回到网络、应用、存储等等这些领

8、域的时候,我们来看这个领域当中,我们的运维目标是什么。可能作为一个网络部门的领导、员工来讲,我们似乎是说很难去把我们的网络跟业务之间做一个非常好的很一致、完全的对应。因为网络支持着很多的应用的运行,和我们商业的运行,在这样的情况下,我们从我们的运维目标来看,作为我们系统专业的领域,我们的运维目标是什么。在这个地方,我们总结了两个方面的运维目标。首先,运维目标是要保证我们的系统可用性。一谈到可用性,大家会谈到,我们怎么样去实现一个高可用性,我的可用性的能力是什么。这个地方我们定义是我们系统的可用性目标是满足我们的业务要求的。其次从运维的角度来讲,我们有非常重要的目标是在整个系统的生命周期的建设过

9、程当中,如何利用这样科学的数据的分析,来支持整个系统的持续地发展。这是从技术的专业领域来讲的运维目标,从现在不管是国内、国外,大家在技术领域的专业的管理领域里面,大家的一些成功的实践来讲,我们主要分为下面四个方面。第一个方面我们去提供了一个可视化地监控,或者说我们提供了可视化的视图。第二个方面是提供一个很坚固的事件基础,这是非常核心的一部分。参考业务影响关系定义鼓掌分类或级别,以及我们要采取什么措施尽量减轻或者是消除、预防这些能带来的影响。第三个方面是对所专注的这个基础架构领域,它的运行的数据全面的分析,这些分析是我们要定义哪些我们的KPI。这些KPI它的运行的绩效是怎么支撑业务的。第四个是建

10、立流程化的管理平台,支持运维灵活的要求。从这个层次来讲,包括我们跟国内很多的用户来做一些运维方面的工作,在建设的过程当中有很深的体会,有可能你建了非常好的网络管理系统、主机管理系统、存储管理系统或者是其他基础架构的管理子系统。但是会发现,这个系统很难在良性的环境下做持续地更新地满足我们的运维要求。实际上这方面通常存在的问题是我们只是构建这个技术平台,我们并没有去对如何让这个技术平台保证我们的业务目标,实现我们的IT运维目标这方面做相关的制度、流程化的支持,去使这个技术平台如何最大限度地去发挥它的作用。首先是建立一个坚固的事件基础,从技术平台来讲,我们是怎么样能够去众多的基础架构事件当中进行高效

11、地处理。根据我们的经验,在一个类似于一个省的规模的网络当中,即使仅仅是网络的一个专业领域一天的事件量,大概是在几十万条左右。这是我们很多用户一起建设当中做的统计数据,如何让这几十万条的数据发生之后,实际上真正影响到运维、影响到业务事件的氛围并不多。我们怎么样在这些事件当中抽取出对我们业务真正有影响的事件,并对其进行处理。所以这方面我们特别强调如何建立一个坚固事件的基础,在一个平台上,能够以高效地方式对它进行处理。在建立事件基础,事件量非常大,如果所有的事件都原始移过来都不行,这样的话,许多进行事件的自动压缩。我想强调,这样的压缩是不是可以从企业的需求出发做定制,不是说把原来的丢掉了进行压缩。建

12、立坚固事件的基础还有一部分是我们不需要说某个交换机的某个交换端口宕了,我们会进行什么影响,我们从事件分析、关联机制也好,我们需要从最基础的IT事件告诉我们。比如说是某一个营业部发生了中断,这样的信息会比某一个断口出现了端口宕这样的信息。不管是对于IT来讲,怎么判断优先级,以及业务来讲,都要有可视化。从我们的目标来讲,尽可能地采集更多的事件,但是从纷繁复杂的事件进行分析,告诉我们真正跟业务相关联的事件是什么,这些跟业务关联产生的事件,才是我们运维过程当中需要核心地处理和解决的问题。这是第一个方面建立一个坚固的事件基础。第二个方面,我们怎么样从我们各个基础当中做性能的分析支持我们的性能管理、后续的

13、容量规划能力上的管理。这个地方举了两个例子,一个是基于基线的性能分析,不是每一个单次、单点的分析,而是从我们整个的业务历史表现看。比如说金融业来讲,像网银的表现,每周一到星期天,以及每天的Array点到5点,整个的流量变化趋势是不一样的。我们通过基线的分析,我们怎么样去获得优化现在系统的容量,以及现在的系统容量是否能够支持业务不断增长的需要。在性能分析这部分,我们要进行一个预测,我们要从单独的组件,和整个业务应用组件的组合里面,我们分析现在提供的容量和性能是不是能够满足我们整个业务增长的需要。然后大概会在什么点的时候,如果当我们的业务增长到什么规模,我现在的IT基础架构要进行扩容和升级,这样的

14、话,我们做预先的计划,避免当业务的快速增长,而使我们的IT系统造成对业务增长的瓶颈。第三个实践方面来讲,怎么样去了解我们整个的IT的资产包括我们的网络、应用、应用之间的关系等等,包括网络之间的关系,从而对我们整个的IT资产实施控制,并为优化地使用提供一个基础。这是一些例子,关于IT的资产的报表。我们要去了解我们当前的使用率是多少,是不是有闲置的,是不是我们的容量。这部分的话,我们会去协同我们刚才谈到的容量的分析,为我们规划未来IT的服务对业务的支撑能力提供基础。第四个方面,从子系统的管理来讲,是怎么样建立一个流程化的平台,使大家日常运维的工作可以在流程化的平台上来进行一个可效的实施,所有的运维

15、人员都会定义他的运维角色和运维的职责,最后通过流程化的平台去履行他运维上的一些要求。这是一些视图的呈现,下面还有一个视图。在这个地方,前面我们的演讲里面也听到了我们怎么样对一些绩效等等进行考量,现在我们看到的视图,整个故障发生持续状态的实时的视图。我们再回忆一下刚才谈到金字塔的服务模型,刚才我们讲了最基础的一部分,也就是说整个IT专业领域的管理,以及在这个专业领域管理上的运维目标。有两点,一个是怎么样保证整个系统的可控性。第二个是对系统进行评估和分析规划未来的发展。另一方面除了两个运维目标来讲,跟大家分享了一些在国内的建设当中,我们比较多的四个方面的实践,建立一个可视化的视图,以及建立一个非常

16、好的事件的基础,进行性能和容量的分析。最后是说建立流程化的平台保证运维可以在一个企业所要求的一些制度的环境下面进行非常良好地运行。在后面这部分内容里面,我们会讲我们上面的两层。刚才这部分,我们更多地去看怎么样做基础架构的运维,后面来讲,我们偏重于怎么样把基础架构的运维跟我们的业务目标来进行结合,最终为我们的业务来服务。现在大家看到的这张总结的片子,是说我们对整个会聚管理,就刚才中间的这层,实际上当我在讲基础架构的各个专业子系统的管理的时候,大家有一些疑问了,网络只看网络的,系统只看系统的,应用只看应用的,存储只看存储的,谁来看业务,谁来对整个的业务目标负责,以及保证IT运维真正是实现业务目标的,所以我们要做后面的事情。第一步我们所谈到的是做一个会聚的运维管理,在这个管理里面,不管是网络的、存储的、主机的开放平台、系统、应用、语音等等各个环境子系统的数据,实际上是需要送到会聚的平台,由会聚的平台进行处理,最终

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 事务文书

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号