nebula备份报错E_LIST_CLUSTER_NO_AGENT_FAILURE

  • nebula 版本:v3.4.1
  • 部署方式:分布式
  • 安装方式: Docker/ RPM
  • 是否上生产环境: N
  • 问题的具体描述
    按照官方手册备份,报错E_LIST_CLUSTER_NO_AGENT_FAILURE,具体截图如下:

按照手册执行命令"SHOW HOSTS AGENT",显示如下:

请问原因是否是55服务器有两个agent,如果是,请问如何删除端口号为8888的agent。万分感谢!

用的备份工具时 nebula-br?

@steam 是的,参考的官方手册,具体网址如下

请问该如何解决,或者有其他的备份方式吗

您好,在备份时,需要nebula集群所有节点上都有一个agent online,可以检查下

1 个赞

@kqzh 您好,我目前的问题是53有一个agent online,55有一个agent online,一个agent offline。我想删除这个offline的agent,请问如何删除

您好,目前不支持手动删除offline的agent,默认会在24h后自动删除,如果您想马上删除,可以在meta 的配置文件里面修改 removed_threshold_sec 参数,将默认值调小

@kqzh 非常感谢,刚去看了下,的确offline的自动删除了。但是又有了个新的问题请教,我之前是有三个agent,一个offline,两个online,但是今天看来,两个online的自动offline,也被删除了,请问这是什么原因,谢谢您!

@steam @kqzh

  • 今早查看所有agent都已消失,于是分别在53和55服务器用以下命令启动了agent
./agent --agent="xx.xx.xxx.53:9999" --meta="xx.xx.xxx.xx:9559"
./agent --agent="xx.xx.xxx.55:9999" --meta="xx.xx.xxx.xx:9559"

  • 然后使用以下命令备份
./bin/br backup full --meta "xx.xx.xxx.55:9559" --storage "local:///home/nebula/backup/"

具体报错如下:


这个code官方手册有提到,具体如下

  • 通过studio查看agent,返回如下:

请问朋友,上述操作,哪里出了问题,该如何解决,万分感谢!!!

可以show hosts meta/storage/graph 看看是否所有节点上都存在一个agent

请问 这个问题解决了吗?看了 下,我们问题很像,不过我这边是在一台机器部署的,看日志meta是连接成功 的 。

你有别的日志么?和上面的报错信息一样之外,还是有别的么?

看着错误是一样的

+1,我也遇到了同样的情况,单机部署,日志agent和br都显示连接成功了,执行br备份命令时就会报一样的错误,3.5.0 版本nebula,你们的解决了吗

@srq @充话费送的昵称 目前还未解决,你们的解决了吗,请求官方指导解决

您好,可以show hosts meta/storage/graph 看看是否所有节点上都存在一个online的agent,这个报错一般是因为缺少agent导致的

还没,之前版本你们有成功过吗?我们是刚刚开始使用nebula,其他版本没有用过。

您好,这个意思是每个/storage/graph 也都要启动一个agent吗?
./br backup full --meta <ip_address> --storage <storage_path>
只备份meta也需要启动吗?

graph或者storage所在节点上,如果没有agent,也需要启动一个,备份不止备份meta的数据,storage的数据也会备份

我是单节点在一个测试机上搭建的,节点都在一个机器上,SHOW HOSTS AGENT;也正常,但是执行备份命令的时候就报这个错误