nebula版本:3.2.1
问题描述:三台服务器部署的nebula集群,每台都部署了meta、graphd、storaged服务。其中有一台服务器挂了将近24小时,当修复好服务器重启服务后,执行show hosts发现有一台服务器没有分配到分片leader,如下图所示:
故执行balance leader操作,执行完后查看job状态发现任务很快就完成了,
重新执行show hosts,挂的那台服务器还是未分配到分片leader。
初步分析原因:怀疑是挂的这台服务器上的分片数据还没追上来(挂了将近24小时),所以无法分配到leader,有哪个监控指标可以看到延迟情况吗?应该怎么解决?