- nebula 版本:3.3.0 studio3.5.0
- 部署方式:分布式
- 安装方式:RPM
改了下graph的配置enable_space_level_metrics,然后重启主节点的服务,hosts和原来的图空间都不在了;又在其他节点关闭服务,提示进程不能kill
studio和dashboard都不能连接,提示配置错误
改了下graph的配置enable_space_level_metrics,然后重启主节点的服务,hosts和原来的图空间都不在了;又在其他节点关闭服务,提示进程不能kill
整理一下问题:部署了3台服务器的集群,每个服务各3个。修改过graphd配置以后,只重启主节点以后show hosts看不到原来注册过的storaged,重新注册了,但是目前三台都为offline,尝试去其他两个节点stop 服务,但是返回结果是上图,不能kill
主节点的nebula-graphd.ERROR在重启的时候新建了,其他两个节点的这个文件都被删掉了,没有重建
可以分享一下无法kill的那个metad的日志吗?
无法kill可能是权限问题,sudo解决
info日志里面心跳正常,error日志没有更新
kill服务以后重新执行命令启动服务就可以吗?
请问storaged都offline是为什么呢,我没有改过它的配置,主机本机应该是没问题的,但也是在offline
这个不好说。怀疑storage没有连接上meta而down了。具体可以看看down的那个storaged.INFO。
之前 add 过 hosts 吗?
add 过,之前是完全正常使用的,storaged都在线
可以看下meta addrs吗?nebula-meta.conf配置项里面,以及storage graph里面。
刚刚一刻解决了以上问题
解决:sudo kill了一个子节点的全部服务,以后再show hosts就正常显示了——除了停掉的服务器,其他两台都是ONLINE的。但是现在又有一个问题,查询的时候报错
enable_space_level_metrics改回false,所有问题都解决了
这会是什么原因呢~
这应该只是凑巧。如果因此要挂的话,也应该是graphd挂,这个参数跟storaged没有任何关系。
至于RPC_FAILURE,在这个文档中有详细说明:https://docs.nebula-graph.com.cn/3.3.0/20.appendix/0.FAQ/
此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。