创建快照snapshot不成功 Block write failure

  • nebula 版本:3.0.0
  • 部署方式:分布式
  • 安装方式:源码编译
  • 是否为线上版本:Y
  • 硬件信息
    • 磁盘 200G
    • CPU、内存信息 8c
  • 问题的具体描述
    在创建快照时,用了 create snapshot;,但是出现报错如下
-1005:Block write failure!

我查看了graphd-stderr.log文件后
打印信息如下

Block write failure!

我通过show snapshot;方式查看快照信息时,状态都是invalid。

请问这个怎么解决?

是不是没有权限,使用root用户创建试一下?

你是说nebula的root用户吗? 用的就是root用户。 服务器是nebula自己的用户,并且根据3.0.0的文档,已经把/usr/loacal/nebula/data这个文件夹的所属用户改为了nebula。

补充:后用系统root用户连接nebula-console,进行快照创建,依旧出现同样的错误。

创建snapshot的时候,上锁失败了。
你看看meta log和storage log ,贴下报错信息


刚执行了一遍create snapshot 只有以下日志文件发生变动


唯一一个有报错信息的日志,在上图。其他的都是正常的log

rpc 失败了。。。
你看看meta 到那个两个host:ip 是否联通。。。

是通的 我部署的是集群的方式,如果不通,集群应该起不来。 另外防火墙端口我开的是9559 9560 9669 9670 9779 9780。是否有其他端口需要开放?

可以看看 storaged.info 的日志,是否有类似 Send blocking sign error on host 的信息?

日志是这样的:
SendBlockSignProcessor.cpp:16] Receive block sign for space 1, block: 0

下面还有其他相关日志吗?可以完整贴一下

你好,我在10:08 执行了create snapshot操作,现整理相关日志如下




从第一个日志中看是 metad 连不上 storaged 了;发了几个 blocking sign 请求都失败了。

我这边用:telnet 服务器ip 9779
可以连上其他两个节点的stroaged服务

可以在 console 中 show hosts 一下,看 storaged 机器是否已经离线。

并没有 集群都是正常状态
9779 online 三个节点都是
我这边的集群是3meta x 3graph x 3stroage 每个节点都有一个meta 、graph 、stroage

麻烦开发同学及时关注下这个问题,我们系统准备下周上线。

如果网络没有问题的话,并不应出现上述问题。可以再次创建下快照看是否能够成功。

创建很多次都不能成功 需要看一下配置吗

可以贴下 show hosts 的截图。