nebula重启后3个meta节点只起来了一个,另外两个起不来

版本信息:3.2(社区版)
部署方式:分布式
机器配置:3台8C64G
安装方式:RPM
部署角色:每台机器都有一个meta,graphd,storage
问题描述:集群运行着挂了一个graphd,一个meta节点,后面尝试重启集群,使用nebula.service stop all, nebula.service start all 来进行重启,发现graphd和meta节点都起不来,graphd起不来是因为连不上meta,meta起不来日志如下截图:
第一台机器meta日志:


第二台机器meta日志:

第三台机器meta日志:


3台机器的meta配置如下图:
第一台:


第二台:

第三台:

来,把配置信息贴一下

btw,发帖的时候注意看下选的帖子分类,这个帖子是在博客分类下的,我编辑了下它的分类。

好的

meta E_LEADER_LEASE_FAILED

请问呢重启退出了的 meta 还是起不来么?

要周5才有投产窗口,周5我打算一台一台meta来启动,用nebula-metad.service start来一台一台起,因为之前用了nebula.service restart all 的命令来启动,meta是启不来的。想让大伙一起看看是大概什么原因启不来。

请问 restart all 是只执行过一次对么?

是的,restart all每台机执行了一次,然后使用status all发现metad和graphd没启来,第二次使用了stop all,然后start all的方式来启,发现结果一样,metad和graphd启不来。

1 个赞

先别启动graphd。只启动metad试一下

1 个赞

周5才有投产窗口,我也打算先单独一台一台把meta启动,再启graphd

你的meta挂了多久啊(至少得几个小时了) 并且确定只挂了一个吗?
先启动102,然后101或者103其中一个,等都成功之后再把剩下那个再拉起来。
还有个最简单办法 把101或者103的meta数据都覆盖到其他机器上

1 个赞

有什么办法把101或103的数据覆盖到其它机器上呢,直接复制数据文件过去吗?

对,直接把相关 metad 停掉,然后将其他机器 metad 数据文件夹复制过去就行

现在只有02的meta能起来,01和03机器的meta都起不来了,是要把02meta目录的数据复制到01和03吗

是的

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。