MapReduce Service更换集群外部时钟源,仅需10步

摘要:MapReduce Service 集群使用NTP进行时钟同步。本文简要介绍了MapReduce Service集群NTP机制及NTP的配置方式。

本文分享自华为云社区《MapReduce Service更换集群外部时钟源》,作者:tangyuxiaobao29。

MapReduce Service 集群NTP机制

MapReduce Service更换集群外部时钟源,仅需10步_第1张图片

1、FusionInsight的主OMS节点向NTP外部时钟源同步

2、所有业务节点向OMS主节点同步

基于上述原理可以看出,实际上整个集群都是最终向NTP时钟源同步的,这样做的最大好处是:无论何时,整个集群内的时钟始终都是与主OMS同步的,至少保证了集群内节点时钟同步。如果外部ntp时钟源没任何问题,那么整个集群也是与外部ntp时钟源同步的!

MapReduce Service 配置NTP服务器实现说明

一、安装FusionInsight Manager阶段配置NTP服务器

FusionInsight Manager安装配置文件install.ini中通过ntp_server_ip参数设置外部NTP时钟服务器IP地址。该参数可选。
当不设置该参数,系统默认使用主管理节点作为NTP服务器。安装后主oms节点ntp状态

集群内非主oms节点ntp状态

当设置该参数且存在多个NTP服务器,需要以英文逗号隔开各IP,如192.168.34.185。安装后主oms节点ntp状态

集群内非主oms节点ntp状态不变

二、安装后更换集群NTP服务器

1、操作场景

安装FusionInsight Manager管理系统后,如果未配置NTP服务器或已配置的NTP不再使用,管理员可以为集群重新指定或者更换新的NTP服务器,使集群从新的NTP时钟源同步时间。

2、对系统的影响

更换NTP服务器是高危操作,更换后集群时间可能将会变化。
更换NTP服务器前NTP服务器与集群当前时间偏差大于150s,则需先停止集群,防止数据丢失。停止集群期间服务无法访问。

3、前提条件

已准备新的NTP服务器并获取IP地址,并设置好集群与新NTP服务器的网络。请确保服务器的NTP服务状态正常,否则将导致操作失败。
IPv4组网的集群只支持配置IPv4网络的外部时钟源,IPv6组网的集群只支持配置IPv6网络的外部时钟源。
如果集群使用IPv4模式,外部时钟源只能用IPv4地址;如果集群使用IPv6模式,外部时钟源只能用IPv6地址。

4、操作步骤

1.登录FusionInsight Manager,查看是否存在未清除的告警

•是,请参见“故障管理”修复告警。告警处理完毕后,执行2。
•否,执行2。

2.使用omm用户分别登录主备管理节点。

3.在主管理节点执行以下命令查看管理平面网关。

cat ${BIGDATA_HOME}/om-server/OMS/workspace/conf/oms-config.ini | grep om_gateway

4.在主备管理节点分别执行ping 管理平面网关,检查节点是否与管理平面网关连通

•是,执行5。
•否,请联系网络管理员修复网络故障,处理完毕后,执行5。

5.在主管理节点执行以下命令,检查集群时间与新的NTP服务器时间偏差。单位为秒。

例如,检查与NTP服务器“192.168.34.185”的时间差,执行ntpdate -d 192.168.34.185,界面显示:

MapReduce Service更换集群外部时钟源,仅需10步_第2张图片

其中0.034136表示时间偏差。正数表示NTP服务器时间比集群当前时间快,负数表示NTP服务器时间比集群当前时间慢。

6.检查时间偏差的绝对值是否超过“150S”。

•是,执行7。
•否,时间偏差的绝对值不超过“150”,以omm用户执行9。

7.确认是否可以停止集群。

•是,停止上层业务并停止集群,然后执行8。
•否,任务结束。

8.确认NTP服务器时间是否比集群当前时间慢

•是,NTP服务器时间慢,停止集群界面显示“操作成功”后需等待,间隔大约为5得到的时间偏差,再以omm用户执行10。
•否,NTP服务器时间快,停止集群界面显示“操作成功”后直接以omm用户执行10。

9.在主管理节点执行以下命令,更换NTP服务器,任务结束。

sh ${BIGDATA_HOME}/om-server/om/bin/tools/modifyntp.sh --ntp_server_ip 192.168.34.185

MapReduce Service更换集群外部时钟源,仅需10步_第3张图片

执行完毕后检查ntp状态

10.在主管理节点执行以下命令,从NTP服务器“192.168.34.185”立即强制同步时间并更换NTP服务器,任务结束。

sh ${BIGDATA_HOME}/om-server/om/bin/tools/modifyntp.sh --ntp_server_ip 192.168.34.185 --force_sync_time
说明
•NTP服务器IP地址不可以设置为集群内节点IP地址,否则可能会导致节点与主备oms节点业务网络断连。
•当前最多允许配置2个NTP服务器以主备方式提供服务,可以用“,”将不同服务器分开
•如果停止了集群,在更换NTP服务器后需要重新启动集群。
•未执行强制同步时间命令时,大约以200ms/h的速率进行时间同步。
•执行强制同步时间命令后,集群节点大约需要5分钟完成时间同步。

 

点击关注,第一时间了解华为云新鲜技术~

你可能感兴趣的:(MapReduce Service更换集群外部时钟源,仅需10步)