BALANCE DATA REMOVE之后show host依然出现下线节点

你balance remove 节点写错了 19779 这个节点不存在

我的10.82.232.123 storaged配置里面的配置–ws_http_port=19779 ,
那我应该怎么写balance remove 呢

Balance remove 和 HTTP 有什么关系?

看这个 : Storage负载均衡 - Nebula Graph Database 内核手册

你的意思是执行 BALANCE DATA REMOVE 10.82.232.123:9779

建议这个手册改一下,不要上下文的端口写的不一样,很容易给读者造成误导
在show hosts显示的storaged端口是 9779


示例移除Storage服务器中的端口为啥写19779

还有就是配置文件中,确实有2个地方都配置有端口,分别为9779和19779

@RandomJoe 当时为什么会写19779啊。。。难道remove要用http port?

11:43执行BALANCE DATA REMOVE 10.82.232.123:9779 后,发现3个分区失败,此时10.82.232.123机器上storaged进程已经停止,show hosts显示OFFLINE,但是3个分区数据如何做迁移呢


10.82.232.123机器上 nebula-storaged.ERROR如下

更尴尬的是 进入这个异常的space,执行插入操作,失败了


在 10.82.232.121 的graph 节点查看日志nebula-graphd.INFO

和 HTTP 端口没关系

先重启一下 10.82.232.123 然后 重新balance 一下 做一次 recovery

重启 10.82.232.123 storaged节点,之后确实可以插入数据了,但是我的目的是 缩容,下掉10.82.232.123节点,此时无论是 BALANCE DATA REMOVE 10.82.232.123:9779 还是 BALANCE DATA,显示的id都是 最初执行完成的 BALANCE DATA REMOVE的 id 1620877641

之前Balance 任务失败了 但balance 计划被保存了 重新启动一次balance 会继续执行之前失败的任务

有解决办法吗

BALANCE DATA RESET PLAN 清空老的plan 重新balance

重新balance 还原后,再次 remove,还是会有失败的节点 :joy:

测试时碰巧用了这个