snapshot恢复数据失败

可以查询,但是查到的关系数据没有原集群的多,感觉是少了一些数据 :joy:

那可能是没做好吧,不行重新做一遍看看

这个参数,我设置到nebula-metad.conf里面, 改成了一个较短的时间,但是哪些offline的hosts并没有被删除
image

removed_threshold_sec,这个参数在2.6.0和2.5.1版本的Storage负载均衡都提到过,但是3.0.0版本就没有提到了,会不会是高版本不支持这个参数了呢

重启服务了没

重启了meta服务

我看了下这个参数还在的,文档里面应该是3.0把balance data功能移除了,所以那部分文档里就看不到了,你show hosts storage看看呢,按道理你这个offline的时间也超过一天了吧


对,balance data功能是删除了。
1、放假前就存在三个offline的机器,我以为使用snapshot备份恢复的时候,哪里出错了,上午又重新用snapshot的数据更新了新集群的meta数据。
2、原来3.0.0版本的meta配置是没有【removed_threshold_sec】这个参数设置的,今天加进去了,设置了60s和15s都没效果

不确定是不是个bug,方便的话去github提个issue吧

我让存储的同学来瞅瞅,稍等。

存储的同学看到了也大受震撼, 弱弱地问下, 您这新旧两个集群, 时间是同步的吧?

时间是否同步怎么看呢 :joy:

是需要设置时区的参数么:–timezone_name=UTC+08:00, 新旧集群都没有设置该参数。

呃, 您就在两台机器上分别打下 date 看看结果?

时间是一样的
Screenshot (2)
集群部署的时候,有个条件是NTP服务同步时间,如果每个机器时间是一样的,就不用管这个NTP同步吧?

嗯… 那不用管 NTP 了. 那你这个很诡异啊, 我再参悟一下

meta 有啥报错信息吗?


使用balance leader 命令的时候,meta的报错,Get host info “10.241.141.214”:9779 failed, error: E_KEY_NOT_FOUND, 这台机器是老集群中的一台

新集群每次 show hosts 的时候报错吗?

不报错