IT服务部署实施要素攻略(至简)

         IT服务部署是IT服务规划设计与IT服务运营阶段的中间环节,在本阶段,要部署人员、技术、资源和过程等各类要素,搭建起合理的管理框架。为便于理解和掌握,本文用概括化、系统化的方法给予总结提炼,希望帮到各位努力的伙伴。

      一、人员要素部署实施

1、通过外部招聘和内部调岗,将人员部署到位。根据项目技术结构、工作量、未来需求等因素,通过外部招聘和内部调岗的方式将人员部署到位。

2、建立培训教材库及知识转移方法。培训教材涵盖技术、管理、工具等方面的内容,定期维护和更新,保证教材的实用性。

      二、资源要素部署实施

主要包括:知识库内容初始化、工具部署相关制度、备件库建立与可用性测试、服务台管理制度的初始化等要点。

1、知识库内容初始化

知识库内容初始化指示表
来源

由信息技术支持工程师提供。

从过往的事件和问题日志中提炼。

审核 依据知识入库审核标准,由专业人员审核内容的正确性和完整性,审核后经批准加入知识库。
发布 指定专业负责审批和知识出入库管理,并负责记录与发布。

2、工具部署、使用手册与相关制度

此处特指:监控工具、过程管理工具、专用工具

(1)工具部署前要做好工具测试,以测试结果作为重要的部署决策依据。(简:事前测试)

(2)工具上线后首先试运行,要计划要试运行周期、试运行目标和结束标准。(简:先试运行)

(3)依据风险级别与影响范围,决策工具部署上线是否采用阶段式部署。(简:分步上线)

(4)与工具相关的知识应用开发团队或工具厂商处有效转移给工具的IT服务团队,包括各类工具的使用手册、使用说明与服务管理制度。(简:知识转移)

3、备件库建立与可用性测试

(1)备件入库前要进行可用性测试。(简:入库前)

(2)备件入库时要登记、赋以标识。(简:入库时)

(3)备件日常管理中,要注意使用登记、核销等账务管理。(简:入库后)

(4)要定期对备件进行检测。(简:定期)

(5)发布备件管理制度,如库房管理制度、备件出入库规范、备件申请流程、备件采购流程等。(简:长期)

4、服务台管理制度的初始化

服务台管理至少包含以下内容:

(1)服务台各岗位的角色与职责。

(2)服务台的主要工作流程。

(3)记录事件与服务请求的具体要求。

(4)事件与服务请求分派的原则。

(5)事件回访的相关规定与要求。

(6)服务台绩效考核标准。

三、技术要素部署实施

主要包括知识转移、应急响应预案的制订与演练、SOP标准操作规范、技术手册发布、搭建测试环境等内容。

1、知识转移

知识库转移的内容指示表
类别 内容
历史运维资料

1、相关工作界面和人中职责说明书。

2、内外部支持信息(开发商、厂商、业务部门、公司内部相关部门)。

基础架构资料

1、系统部署和网络物理拓扑。

2、系统架构说明:软/硬件配置。

3、系统数据备份与恢复操作说明书。

4、系统应急、容灾处理方案(如集群切换和恢复)。

5、系统日常运维操作手册。

应用系统资料

1、应用系统测试报告。

2、应用系统测试手册。

3、应用系统需求和设计文档。

4、应用系统安装配置手册。

5、应用系统说明。

业务

资料

1、业务架构图(业务功能模块在系统中的分布)。

2、业务流程(系统交互、工作流说明、业务功能说明、业务对象说明)。

3、业务场景说明(前台业务高峰说明、后台关键作业时间周期)。

4、业务培训资料。

5、业务运维文档(业务问题FAQ、业务问题诊断)。

2、应急响应预案的制订与演练 

(1)应急预案适用情形

应急预案适用情形
序号 情形
1 自然灾害引发的IT系统重大故障。
2 网络设备、线路故障引发的系统重大故障。
3 电路及机房基础设施导致的系统重大故障。
4 IT系统数据库、系统和存储、中间件故障导致的重大系统性故障。
5 网络攻击、病毒或犯罪等引发的安全事件。
6 应用系统发生重大故障。
7 其它重大突发事件。

(2)应急演练原则

应急演练的原则
原则 描述
结合实际合理定位 结合资源条件确定规模。
着眼实战讲求实效 重视实战能力,及时整改问题。
精心组织确保安全 确保演练参与人员及演练装备设施的安全。
统筹规划厉行节约 以效益为基准。

(3)突发事件等级划分

突发事件等级划分
级别 描述
特别重大突发事件(1级)

20%至60%的核心、关键系统不可用且在24小时无法恢复。

60%以上的核心、关键系统不可用且在12小时无法恢复。

重大突发事件(2级)

20%至60%的核心、关键系统不可用且在12小时无法恢复。

较大突发事件(3级) 关键业务全国性中断,且预计恢复时间大于6小时小于12小时。
其他造成区域性业务中断的故障 区域性业务中断,且恢复时间小于6小时。

(4)组织指挥体系和IT恢复小组

应急组织体系职责表
组织名称 职责
指挥小组 突发事件处理;启动应急预案;保障后勤资源;组织指挥演练。
IT恢复各小组组长 指挥本小组运作;汇总恢复操作数据,并向指挥小组汇报。
机房环境保障组 保障恢复中所需的通信链路通畅 ;恢复电源、空调、门禁等基础环境。
网络恢复组 负责网络恢复。
安全恢复组 负责信息安全事件的恢复。
系统和存储恢复组 完成数据库的恢复和启动,保障数据库正常运行。
中间件恢复组 恢复和启动应用的中间件平台。

(5)应急响应演练流程

应急响应演练流程表
阶段名称 内容
演练启动 指挥办公室通知集合,演练总指挥宣布启动演练活动。

演练

执行

演练指挥与行动:按照既定方案开展应急处置。

演练过程控制:综合应急预案采用桌面演练方式,专项应急预案及现场处置方案采用实战演练方式。

演练记录:采用文字、照片和音像记录全过程。

结束与

终止

结束:演练流程执行完毕。

终止:出现真实突发事件。

评估与

总结

评估:评估组人员分别对各个场景进行演练记录,填写《演练方案实施情况评估表》。

总结:现场总结与事后整体总结。

成果运用

整改发现的问题,修订应急预案,加强教育培训,更新应急装备。

对整改情况监督检查。

文件归档与备案 将演练计划、演练方案、应急预案演练评估报告、应急预案演习报告存档,通常保存6年。

考核与

奖惩

对参与人员进行考核与奖惩。

3、SOP标准操作规范

(1)SOP的作用。SOP的精髓是将细节进行量化。一是将企业积累下来的经验记录在标准文件中,避免因人员更换造成技术流失。二是使操作人员经过短期培训,快速掌握技术。三是树立良好的形象,提高客户满意度。四是推进服务标准化。五是提高技术管理水平。

(2)SOP的编写要点。一是兼顾人力、物力和财务。二是IT服务人员能够看懂。三是效率高,成本低,并识别出关键风险点。四是正式发布前要经过测试和评价。五是要根据业务与技术发展需求,实现快速迭代。

4、技术手册发布

编写各类用于发现与解决问题的技术手册,流程为:

(1)审核。发布前要验证、评价。

(2)存档。采用分级管理的方法,方便检索。

(3)发放。组织培训讲解,确保按手册操作。

5、搭建测试环境

(1)搭建发现与解决问题所需的测试环境。

(2)运用各类测试模拟工具,规避IT服务的潜在缺陷。

四、过程要素部署设计

系统规划与管理师需要将各管理过程正式发布,并进行试运行。为保证平稳发布,需通过必要的管理工具实现过程的电子化。

1、过程与制度发布

(1)将要实现的制度、流程和工具部署上线。(简:部署到位)

(2)将相关人员充分培训到位。(简:培训到位)

(3)建立过程实施保障体系,加强宣传和贯彻力度。(简:执行到位)

2、过程电子化管理和数据初始化

实现电子化管理方式,应重点关注以下4个方面:

(1)过程电子化工具与其它工具互联互通,如呼叫中心系统、集中监控系统。

(2)通过电子化工具提取KPI数据,并形成所需报表。

(3)在电子化工具中实现各个过程与其它管理过程之间的接口。

(4)过程与知识库的关联关系。

完成数据初始化工作,主要包括以下数据:

(1)组织基础信息,如组织结构和运行方式。

(2)人员的基础信息。

(3)过程角色。

(4)客户信息。

(5)历史信息。

(6)其它信息,如事件管理过程提醒时间。

3、体系试运行

体系试运行情况主要通过以下方式检查:

(1)管理目标达成情况。

(2)客户满意度。

(3)服务工具使用效果。系统规划管理师可以根据目标达成情况和客户满意度,对人员培训、体系实施、过程设计、系统调优等方面进行适当调整,以保证向服务运营过程的顺利过度。

你可能感兴趣的:(系统规划与管理师至简版,运维)