snapshot恢复数据失败

dragon · 2022 年4 月 6 日 04:01

可以查询，但是查到的关系数据没有原集群的多，感觉是少了一些数据

dbacyj · 2022 年4 月 6 日 04:54

那可能是没做好吧，不行重新做一遍看看

dragon · 2022 年4 月 6 日 08:29

这个参数，我设置到nebula-metad.conf里面，改成了一个较短的时间，但是哪些offline的hosts并没有被删除

dragon · 2022 年4 月 6 日 08:42

removed_threshold_sec，这个参数在2.6.0和2.5.1版本的Storage负载均衡都提到过，但是3.0.0版本就没有提到了，会不会是高版本不支持这个参数了呢

dbacyj · 2022 年4 月 6 日 08:44

重启服务了没

dragon · 2022 年4 月 6 日 08:52

重启了meta服务

dbacyj · 2022 年4 月 6 日 10:03

我看了下这个参数还在的，文档里面应该是3.0把balance data功能移除了，所以那部分文档里就看不到了，你show hosts storage看看呢，按道理你这个offline的时间也超过一天了吧

dragon · 2022 年4 月 6 日 11:32

对，balance data功能是删除了。
1、放假前就存在三个offline的机器，我以为使用snapshot备份恢复的时候，哪里出错了，上午又重新用snapshot的数据更新了新集群的meta数据。
2、原来3.0.0版本的meta配置是没有【removed_threshold_sec】这个参数设置的，今天加进去了，设置了60s和15s都没效果

dbacyj · 2022 年4 月 6 日 14:03

不确定是不是个bug，方便的话去github提个issue吧

steam · 2022 年4 月 7 日 04:08

我让存储的同学来瞅瞅，稍等。

liuyu85cn · 2022 年4 月 7 日 04:20

存储的同学看到了也大受震撼, 弱弱地问下, 您这新旧两个集群, 时间是同步的吧?

dragon · 2022 年4 月 7 日 06:21

时间是否同步怎么看呢

dragon · 2022 年4 月 7 日 06:58

是需要设置时区的参数么：–timezone_name=UTC+08:00，新旧集群都没有设置该参数。

liuyu85cn · 2022 年4 月 7 日 07:01

呃, 您就在两台机器上分别打下 date 看看结果?

dragon · 2022 年4 月 7 日 07:16

时间是一样的
Screenshot (2)
集群部署的时候，有个条件是NTP服务同步时间，如果每个机器时间是一样的，就不用管这个NTP同步吧？

liuyu85cn · 2022 年4 月 7 日 07:30

嗯… 那不用管 NTP 了. 那你这个很诡异啊, 我再参悟一下

liuyu85cn · 2022 年4 月 7 日 07:30

meta 有啥报错信息吗?

dragon · 2022 年4 月 7 日 07:37

使用balance leader 命令的时候，meta的报错，Get host info “10.241.141.214”:9779 failed, error: E_KEY_NOT_FOUND，这台机器是老集群中的一台

liuyu85cn · 2022 年4 月 7 日 07:46

新集群每次 show hosts 的时候报错吗?

dragon · 2022 年4 月 7 日 07:51

不报错