snapshot恢复数据失败

liuyu85cn · 2022 年4 月 7 日 08:17

您是 1 个 meta? 然后改完参数之后重启过是吗?

dragon · 2022 年4 月 7 日 08:21

三台机器都启动了meta服务，但是只有leader节点的meta.INFO才会有log日志的更新，其他两台机器的meta.INFO不会一直更新

liuyu85cn · 2022 年4 月 7 日 09:56

看起来像是从一个叫 machineTable 的表里面, 又把那三个机器加回去了.

dragon · 2022 年4 月 7 日 10:02

machineTable？可以操作这个table吗，把一些hosts删除掉

liuyu85cn · 2022 年4 月 7 日 10:03

哦, 内部的表, 应该不好弄. 下个版本应该会修这个.

dragon · 2022 年4 月 7 日 10:06

好吧

liuyu85cn · 2022 年4 月 7 日 10:22

开个 issue 跟踪下, https://github.com/vesoft-inc/nebula/issues/4120

spw · 2022 年4 月 7 日 10:29

我看了一遍相关代码，如果你运行过 “http接口把原来机器ip换成新的机器ip ” 的话，按说是不应该出现删不掉的情况的。所以确实是运行了是么？

dragon · 2022 年4 月 7 日 11:12

确定运行了。
我是启动新集群的meta和graph服务后，启动了studio服务查看nebula的hosts状态（看到的是旧集群集群）；
换了ip之后，启动storage服务，然后使用add hosts添加新集群集群的ip，通过studio看到的就是新集群的机器是online，旧集群机器是offline的

spw · 2022 年4 月 7 日 11:16

可以通过 metadump 来输出下现在 meta 的信息吗？用法：

./meta_dump --path=${META_PATH}/nebula/0/data

meta_dump 在每个 bin 目录下应该有。

dragon · 2022 年4 月 7 日 11:27

Zone Info

hosts info

dragon · 2022 年4 月 7 日 11:29

我这里的studio中间介入会产生影响么
@spw

dragon · 2022 年4 月 7 日 12:39

谢谢啦。需要我做什么么

liuyu85cn · 2022 年4 月 7 日 14:08

不用, 因为后续的 fix pr 就只会跟那个 issue 关联, 这里只是贴一下. 如果您还持续关注这个问题, 可以关注下那个 issue. 当然我们也还没 debug 完, 正在参悟, 嘿嘿

spw · 2022 年4 月 8 日 02:09

你可以：

把 metadump 的 partition 表也贴上来。
试试再 replace 一遍，然后把日志贴上来看看~ 怀疑是 partition replace 成功了，zone 没有成功。

dragon · 2022 年4 月 8 日 02:17

对，partition是成功了

除了zone info， host info中也包含旧集群的ip

dragon · 2022 年4 月 8 日 02:28

第二次repalce会失败：can’t get space prefix=spaces

spw · 2022 年4 月 8 日 02:43

10.142.36.2 这个 ip 是现在的 meta leader 吗？

dragon · 2022 年4 月 8 日 02:51

是的

dragon · 2022 年4 月 8 日 02:58

partition我理解，这里的zone是个什么概念呢