ITSM 流程落地经验之问题管理

本文来自腾讯蓝鲸智云社区用户: CanWay

在很多 IT 组织中,大家工作的重点往往专注于解决事件,但长期专注于此,会出现疲于应对的现象,例如事件数量居高不下,工程师焦头烂额疲于奔命。长此以往会使问题的数量持续增加,持续未解决的根本原因会导致更多事件。如果 IT 组织希望有效开展问题管理流程,同时兼顾事件管理,那在两者之间需要找到平衡点。

问题管理如何发挥作用

问题管理的唯一目标是识别并消除重复发生事件的根本原因。在无法预防事件的情况下,问题管理力求将发生的事件对业务的影响降至最低。

如果只关注“如何快速找到问题并恢复服务”,那并没有进行问题管理,而是进行了事件管理,事件管理的核心目标是快速恢复服务。而问题管理是一个完全不同的流程,主要分为被动式和主动式两种类型。

被动式问题管理是从事件中被动触发的,许多 IT 组织会对重大事件进行事后审查,当发现存在潜在问题时,就会开展被动式问题管理工作。

主动式问题管理是使用数据趋势和历史信息识别潜在的问题,可以是持续开展服务改进的活动,也可以是适当地使用数据进行分析,甚至简单依靠积累的经验和直觉。

无论是哪种方式,问题管理都需要根据对业务的价值定义优先级。例如使用“业务影响分析”等方法,可以识别出优先解决哪些问题可以给业务带来更高的价值。

不同规模的组织如何构建问题管理

IT 组织构建问题管理应根据 IT 组织的规模大小进行区别化设计,确定一个 IT 组织问题管理流程的模式应该考虑以下几个因素:

  • 运维人员的数量
  • 基础设施的数量
  • 基础设施的稳定性
  • 重复事件的数量<

你可能感兴趣的:(运维,服务器,敏捷流程,容器)