企业如何做IT运维自动化?

企业如何做IT运维自动化?_第1张图片

1.什么是IT运维自动化?

随着信息时期的持续进展,IT运维已经成为IT效劳内涵中重要的组成部份。面对愈来愈复杂的业务,面对愈来愈多样化的用户需求,不断扩展的IT应用需要愈来愈合理的模式来保障IT效劳能灵活便利、平平稳固地持续保障,这种模式中的保障因素确实是IT运维(其他因素是加倍优越的IT架构等)。

从初期的几台效劳器进展到庞大的数据中心,单靠人工已经无法知足在技术、业务、治理等方面的要求,那么标准化、自动化、架构优化、进程优化等降低IT效劳本钱的因素愈来愈被人们所重视。其中,自动化最开始作为代替人工操作为起点的诉求被普遍研究和应用。

IT运维从诞生进展至今,自动化作为其重要属性之一已经不单单只是代替人工操作,更重要的是深层探知和全局分析,关注的是在当前条件下如何实现性能与效劳最优化,同时保障投资收益最大化。自动化对IT运维的阻碍,已经不单单是人与设备之间的关系,已经进展到了面向客户效劳驱动IT运维决策的层面,IT运维团队的组成,也从各级技术人员占大多数进展到业务人员乃至用户占大多数的局面。

因此,IT运维自动化是一组将静态的设备结构转化为依照IT效劳需求动态弹性响应的策略,目的确实是实现IT运维的质量,降低本钱。能够说自动化必然是IT运维最高层面的重要属性之一,而且需要与之配套的一系列软硬件平台环境及体系。

2.传统运维治理方式存在的问题

目前许多企业的IT运维已经实现从人工运维到运算机治理,但延展咨询在同客户的交流中觉察其中很多企业的IT运维治理还只是处在“半自动化”的运维状态。因为这种IT运维仍然是等到IT故障显现后再由运维人员采取相应的补救方法。这些传统式被动、孤立、半自动式的IT运维治理模式常常让IT部门疲惫不堪,要紧表此刻以下三个方面:

(1)运维人员被动、效率低

在IT运维进程中,只有当事件已经发生并已造成业务阻碍时才能觉察和着手处置,这种被动“救火”不但使IT运维人员成天忙碌,也使IT运维本身质量很难提高,致使IT部门和业务部门对IT运维的效劳中意度都不高。目前绝大多数的企业IT运维人员日常大部份时刻和精力是处置一些简单重复的问题,而且由于故障预警机制不完善,往往是故障发生后或报警后才会进行处置,,使到IT运维人员的工作常常是处于被动“救火”的状态,不但事倍功半而且常常会显现恶性连锁反映。

(2)缺乏一套高效的IT运维机制

目前许多企业在IT运维治理进程中缺少自动化的运维治理模式,也没有明确的角色概念和责任划分,使到问题显现后很难快速、准确地找到全然缘故,无法及时地找到相应的人员进行修复和处置,或是在问题找到后缺乏流程化的故障处置机制,而在处置问题时不但欠缺标准化的解决方案,也缺乏全面的跟踪记录。

(3)缺乏高效的IT运维技术工具

随着信息化建设的深切,企业IT系统日趋复杂,林林总总的网络设备、效劳器、中间件、业务系统等让IT运维人员难以从容应付,即便加班加点地爱惜、部署、治理也常常会因设备显现故障而致使业务的中断,严峻阻碍企业的正常运转。显现这些问题部份缘故是企业缺乏事件监控和诊断工具等IT运维技术工具,因为在没有高效的技术工具的支持下故障事件很宝贵到主动、快速处置。

3.运维自动化迫在眉睫

尽管IT运维治理的技术在不断进步,但事实上很多IT运维人员并无真正摆脱出来,缘故在于目前的技术尽管能够获取IT设备、效劳器、网络流量,乃至数据库的警告信息,但成千上万条警告信息堆积在一路更本无法判定问题的本源在哪里。另外,目前许多企业的更新治理绝大多数工作都是手工操作的。即便一个简单的系统变更或更新往往都需要运维人员一一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。而如此的变更和检查操作在IT运维中往往天天都在进行,占用了大量的运维资源。因此,实现运维治理工作的自动化对企业来讲已迫在眉睫。

此刻随着IT运维治理工作的复杂度和难度的大大增加,仅靠过去几个“运维英雄”或“技术大拿”来包打天下已经行不通了,企业开始需要运用专业化、标准化和流程化的手腕来实现运维工作的自动化治理。因为通过自动化监控系统能及时觉察故障隐患,主动的告知用户需要关注的资源,以达到防患于未然。

例如,全天候自动检测与及时报警能实现IT运维的“全天候无人值守”,大大降低IT运维人员的工作负担。而且,通过自动化诊断能最大限度地减少维修时刻,提高效劳质量。因此, 关于愈来愈复杂的IT运维来讲,将纯粹的人工操作变成必然程度的自动化治理是一个重要进展趋势——

第一,IT运维流程自动化能够提高流程的可控性,能够基于业务需求来制定个性化的流程,使企业领导有机缘看见他们的业务流程,对企业流程有一个深刻的分析和明白得,进而改造和优化流程。

第二,IT运维流程的自动化能提高透明度。因为随着业务需求的转变可能会有多个版本显现,手工流程的不透明将会给流程定制和优化带来相当大的困难,而自动化流程能够利用户能够一目了然的看到整个流程的各个节点运转情形,自动化工具潜移默化地提升业务保障能力。

再者,运维系统实行了自动化监控以后,通过工具自动监控对人的工作是一种减负,也是一种降低本钱的表现。

4.运维自动化治理的具体内容

IT运维已经在风风雨雨中走过了十几个春秋,此刻它正以一种全新的姿态摆在咱们眼前--自动化,这是IT技术进展的必然结果。此刻IT系统的复杂性已经客观上要求IT运维必需能够实现数字化、自动化爱惜。

所谓IT运维治理的自动化是指通过将日常IT运维中大量的重复性工作(小到简单的日常检查、配置变更和软件安装,大到整个变更流程的组织调度)由过去的手工执行转为自动化操作,从而减少乃至排除运维中的延迟,实现“零延时”的IT运维。

简单的说,IT运维自动化是指基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发生性能超标或宕机,会触发相关事件和事前概念好的流程,可自动启动故障响应和恢复机制。

自动化工作平台还可帮忙IT运维人员完成日常的重复性工作(如备份、杀毒等),提高IT运维效率。同时,IT运维的自动化还要求能够预测故障、在故障发生前能够报警,让IT运维人员把故障排除在发生前,将所产生损失减到最低。

5.运维自动化的工具

关于企业来讲,要专门关注两类自动化工具:一是IT运维监控和诊断优化工具;二是运维流程自动化工具。这两类工具要紧应用于:

监控自动化,是指对重要的IT设备实施主动式监控,如路由器、互换机、防火墙、机房环境监测设备等;

配置变更检测自动化,是指IT设备配置参数一旦发生转变,将触发变更流程转给相关技术人员进行确认,通过自动检测协助IT运维人员觉察和爱惜配置。

爱惜事件提示自动化,是指通过对IT设备和应用活动的不时监控,当发生异样事件时系统自动启动报警和响应机制,第一事件通知相关责任人。

系统健康检测自动化,是指按期自动地对IT设备硬件和应用系统进行健康巡检,配合IT运维团队实施对系统的健康检查和监控。

爱惜报告生成自动化,是指按期自动的对系统做日记的搜集分析,记录系统运行状况,并通过时期性的监控、分析和总结,按时提供IT运维的可用性、性能、系统资源利用状况分析报告。

6.成立高效IT运维自动化治理的步骤

(1)成立自动化运维治理平台

IT运维自动化治理建设的第一步是要先成立IT运维的自动化监控和治理平台。通过监控工具实现对用户操作标准的约束和对IT资源进行实时监控,包括效劳器、数据库、中间件、存储蓄份、网络、平安、机房、业务应用和客户端等内容,通过自动监控治理平台实现故障或问题综合处置和集中治理。

例如,在自概念周期内进行自动触发完成对IT运维的例行巡检,形成检查报告。包括自动运行爱惜,以完成对系统补丁的同步分发与升级、数据备份、病毒查杀等工作。

(2)成立故障事件自动触发流程,提高故障处置效率

所有IT设备在碰着问题时要会自动报警,不管是系统自动报警仍是利用人员报的故障,应以红色标识显示在运维屏幕上。然后IT运维人员只需要依照相关知识库的数据,一步一步操作就能够够够。

因此,企业需要事前成立自动工单式流程治理,当设备或软件发生异样或超出预警指标时会触发相关的事件,同时触发相关工单处置流程给相关IT运维人员。IT运维人员必需在指按时刻内完成流程所规定的环节与工作,以提高IT运维响应问题的效率。

(3)成立标准的事件跟踪流程,强化运维执行力度

IT运维自动化治理建设时,第一需要成立故障和事件处置跟踪流程,利用表格工具等记录故障及其处置情形,以成立运维日记,并按期回忆从中辨识和觉察问题的线索和本源。事实上许多实践也证明,成立每种事件的标准化处置和跟踪指南,能够减少IT运维操作的随意性和强化运维的执行力度,在专门大程度上可降低故障发生的概率。同时,用户还应能够通过自助效劳台、效劳台等随时追踪该故障请求的处置状态。

(4)设立IT运维关键流程,引入优先处置原那么

设立IT运维关键流程,引入优先处置原那么是指要求CIO概念出IT运维的每一个关键流程,不单单是概念流程是什么,还包括要指出每一个关键流程对企业有什么阻碍和意义。同时,在设置自动化流程时还需要引入优先处置原那么,例行的事按常规处置,专门事件要按优先级顺序处置,也确实是把事件细分为例行事件和例外关键事件。

总之,实现IT运维的自动化治理是指通过将IT运维中日常的、大量的重复性工作自动化,把过去的手工执行转为自动化操作。自动化是IT运维工作的升华,IT运维自动化不单纯是一个爱惜进程,更是一个治理的提升进程,是IT运维的最高层次,也是以后的进展趋势。

你可能感兴趣的:(经验分享)