show hosts和nebula.service检测服务状态不一致

  • nebula 版本:3.8.0
  • 部署方式:分布式
  • 安装方式:TAR
  • 是否上生产环境:Y
  • 硬件信息
    • 磁盘 HDD 8*12T
    • CPU 40croe
    • 内存信息 192G
  • 问题的具体描述
    1)在单个节点手动执行nebula.service status all,显示所有服务都在
    2)在 studio上使用show stats一会显示storage处于offline,一会显示online
    我这边是在往这个集群添加数据,发现这个现象后重启过此节点storage,一会又会变成这个样子。这样相当于少了一个storage,是不是添加数据会变慢。在监控见面发现这个节点也在,但是添加的数据量为0,应该是不工作了。请教下这个节点是因为压力大导致的吗?我感觉它在studio是在疯狂的上线,但就是上不上来。

1)图示如下


2)图示如下

storage 的日志看看?
印象中有个 bug 和这个现象是一致的。能否先 stop 下服务,同时用 status 确保服务停止了,再 start 试试

嗯,加载完数据我试下,跑好几天了 :grinning: