新基建 破局大规模数据中心智能化监控运维管理

新冠肺炎疫情,让中国数字化进程按下加速键,中央明确提出要加快5G基建、特高压、城际高速铁路和城际轨道交通、大数据中心、人工智能、工业互联网和新能源汽车充电桩等“七大领域”新型基础设施建设进度,数据中心首次被列入加快建设的条目。

 

疫情让在线服务需求激增,数据成为关键资源,而数据中心信息基础设施承担着数据收集、计算、转化、流通的重要职责。“新基建”加速推进,网络基础设施及网络服务需求大幅增加,数据中心作为底层基础设施将持续增长,扩容及大规模数据中心建设必将加速。

数据中心依靠传统运维已无法满足海量设备的监控及运维管理需求,而数据中心网络安全、高效运行是保障服务的重中之重。北京智和信通技术有限公司自主研发的智和网管平台SugarNMS涵盖网络监控、展示、运维、安管、日志分析、开发扩展等功能,让运维人员告别人脑决策、降低人工失误,从大量繁琐、复杂、耗时、易出错的基础运维工作中解放出来。

智和网管平台SugarNMS是基于机器学习技术与大数据分析的智能化监控运维管理软件,基于机器学习算法,自动发现设备、资源及识别链路,监控网络设备、服务器、虚拟机、中间件、数据库、软件及网络服务等,获得海量的监控数据作为训练数据的基础,通过积累大量故障处理、预测规避以及巡检运维等经验组成智能化运维分析的知识库,把数据变成有价值的信息,从而实现数据中心智能化运维监控需求,替代人脑进行智能决策。

智能运维VS传统运维

一方面,传统IT运维是基于统计、分析、合规的层面,把数据变成了有价值的信息;但传统运维工具采集运维指标维度单一,IT运维人员在使用传统运维工具进行故障诊断时,要同时从多种监控工具中得到不同维度的运维指标,然后再把这些数据在大脑里面相互关联与分析,再依据个人经验判断故障的原因。而基于机器学习的智和网管平台SugarNMS智能监控运维系统则不同于传统运维工具的数据使用方式,智和网管平台SugarNMS把各类设备的运维指标进行汇聚和加工,将设备链路,性能、组件、资源、事件、告警、日志、工单等IT数据统计分析后,以可视化的饼状图、柱状图、折线图、表格、颜色等多种形式的关联展现,从而减少运维人员的故障诊断时间,避免分析过程中的人为失误,大幅度提升了运维人员的故障诊断准确性。处理海量、高速、多样的数据并产生高价值,智能化的监控运维是大规模数据中心的运维管理发展方向。

 

另一方面,传统运维工具通常由不同厂商提供,这就导致企业需要配备很多运维人员来管理不同厂商的运维产品,以保障IT业务支撑。一旦IT系统发生故障,运维工程师们需一同开会讨论,共同推敲故障原因,故障处理时效性大打折扣;除此之外,随着IT技术人员薪酬的持续攀升,IT运维成本随之大幅增加。智和网管平台SugarNMS则显著区别于传统运维工具,它完全不需要大量的运维人员。平台自身可以采集多维度、海量的IT设备数据,只要有少量的熟悉智和网管平台SugarNMS的运维工程师即可实现中大型企业的日常IT支撑保障,由于智和网管平台SugarNMS将海量事件进行了聚合汇总分析,产生故障告警,有利于运维人员更加快速高效的处理现场故障。智和网管平台SugarNMS还支持将故障处理方法固化在软件知识库系统,随着信息量的不断增加,平台做出决策建议,软件平台将向更加智能的自动化运维演进,智能化进行故障止损、修复、规避等操作。

最重要的一点,数据中心不断的演进,其规模复杂度、变更频率非常大,技术更新也非常的快。传统运维工具由于体系架构比较陈旧、采集数据总量和维度又都相对有限,无法应用当下最先进的机器学习或者人工智能算法来快速诊断系统故障。而智和网管平台SugarNMS具备超强的监控能力,汇聚海量多维度的IT数据基础,以机器学习算法为支撑,应用先进的大数据分析技术,对历史数据训练解析,实时智能发现、智能识别、智能监控、智能展示、智能管理以及智能分析异常数据,并进行定位、预测、第一时间故障报警等处理,还能自定义告警和故障解决方案。平台具备扩展能力及二次开发能力,可自定义扩展设备类型及其设备资源,自定义设备模板图,最大可能的支持不同设备类型,实现所有网络设备同步监控运维的需求;也可以扩展功能,如监控设备风扇、电源、温度、电口、网络、光接口的状态等,达到管控万物的目标,7*24小时保障上层的业务可靠高速高效安全的运转,提升运维服务质量和最终用户体验。

 

智能监控运维平台架构解析

北京智和信通作为智能监控运维网络管理解决方案提供商,力求将网络数据提取、日志数据提取、历史数据管理、流数据管理、算法数据提取、文本和NLP文档提取、自动化模型的发现和预测、异常检测、故障分析等能力纳入智和网管平台SugarNMS“国产安全+监控+分析+运维+安管+日志+开发”七大功能模块。

 

智和网管平台SugarNMS赋能数据中心运维人员网络管理全局掌控的能力。自定义智能巡检策略,基于海量的大数据与机器学习算法,实现对网络的定期检查,对设备运行情况进行统计和报表生成,预设时段向指定的邮箱发送巡检报告,定期了解巡检结果,把握IT网络设备整体状况。自动巡检设备策略备份,并可进行对比分析,为数据中心管理网络做出合理建议提供数据支撑。智和网管平台SugarNMS通过可视化监控管理,帮助运维人员直观审视业务运营与IT运维中有效信息,让运维人员有更多的时间和精力专注于数据中心业务和用户体验的提升,让数据中心运维真正走向智能化运营。

北京智和信通始终坚持自主研发与技术创新,为客户提供技术领先的网络管理与安全解决方案。更完善的售后服务,帮助用户提升网络和IT的价值。北京智和信通的客户遍布30多个省份,覆盖军工国防、科研院所、政府、金融、交通、能源、电信、事业单位、企业、教育、医疗、制造等多种领域。了解案例详情请访问智和信通官网网站

你可能感兴趣的:(新基建 破局大规模数据中心智能化监控运维管理)