balance leader无效

nebula版本:3.2.1
问题描述:三台服务器部署的nebula集群,每台都部署了meta、graphd、storaged服务。其中有一台服务器挂了将近24小时,当修复好服务器重启服务后,执行show hosts发现有一台服务器没有分配到分片leader,如下图所示:

故执行balance leader操作,执行完后查看job状态发现任务很快就完成了,


重新执行show hosts,挂的那台服务器还是未分配到分片leader。

初步分析原因:怀疑是挂的这台服务器上的分片数据还没追上来(挂了将近24小时),所以无法分配到leader,有哪个监控指标可以看到延迟情况吗?应该怎么解决?

通过重启另外的一台服务器的服务,系统自动触发balance达到leader均衡。

1 个赞

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。