【案例分享】MapReduce Service元数据库服务DBservice备实例节点故障

网友投稿 601 2022-05-28

【问题现象】DBservice备实例故障,重启该实例后显示恢复中,然后继续显示故障,具体现象如下所示:

【可能原因】

1、故障实例节点磁盘空间不足;

2、节点网络故障;

3、实例配置文件问题;

4、免密问题;

【过程分析】

1、查看Dbserver的磁盘正常挂载,剩余空间充足。排除磁盘空间不足原因。

2、查看etc/hosts 正常,节点间互相Ping正常。节点间网络正常。

3、查看进程检查日志log,发现浮动ip异常,如下所示:

【案例分享】MapReduce Service元数据库服务DBservice备实例节点故障

4、查看浮动ip日志log,发现脚本传参有问题

5、查看floatip服务端配置文件,配置文件异常

6、导致浮动ip配置文件异常的原因,通常有主备节点网络不通、OMM免密失效、SCP无法正常正常执行等原因,导致主备配置无法同步。

7、经确认主备实例网络正常、SCP操作正常,尝试从主DBservice节点使用omm ssh登录备DBservice节点,登录失败,如下所示:

由上图报错,可以看出是因为OMM密码过期,导致免密失效,主备间同步失败、进而导致实例故障。

解决方案

方案一:使用如下命令延长OMM用户密码有效期(临时规避)

chage -M '天数' omm

方案二:参考如下方式,设置OMM用户免密永久有效

1、打开/etc/shadow文件,删除红框里面的内容,保存退出

删除后如下所示:

2、查看修改后的OMM密码有效期,如下显示never表示永久有效

EI企业智能 FusionInsight

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Elasticsearch 冷热集群架构实战
下一篇:助力万物互联年底小故事(1)
相关文章