zzzyr
2
show stats了一下,数据全部丢失了,应该如何恢复数据呢
你说的删除hosts是指修改了配置中的IP吗?
如果没执行DROP HOSTS
那不叫删除hosts,从你执行snapshot的截图来看,是graph服务挂了。
帖子里有一些描述不清晰的地方希望你补充一下:1、删除hosts的操作具体做了什么;2、从帖子后面的描述看来你只是创建snapshot失败后改了config里IP的配置(请补充下是改了所有服务的config还是某个服务的config);3、最后一张log截图出自哪个文件,请贴一下文件名。
最后建议你先检查下3个服务的运行状态。
zzzyr
6
[quote=“zzzyr, post:5, topic:16109, full:true”]
我的操作过程如下:
初始的hosts如下
然后执行了drop hosts “7.192.128.172”:9779,之后的hosts如下,此时一切正常
接着,我修改了配置文件,将nebula-graphd.conf、nebula-metad.conf、nebula-storaged.conf中如下图红色框中的内容全部修改成了绿色框中的内容,即将ip127.0.0.1修改为了7.192.128.172
修改完配置之后,又执行了命令:add hosts 7.192.128.172:9779,此时再查看hosts如下
此时查看log文件nebula-storaged.ERROR,出现了如下错误:
zzzyr
7
最后我又把所有的etc目录下的配置和hosts回复原样,数据就都没有了
你改IP之前drop hosts那一次其实也是合理的(因为一开始没改IP的时候,你不仅加了个无效的hosts,而且是把graph当成storage加进去了)。
其实这个时候,你只要再把3个服务的config里IP改回去,重启服务,然后再DROP HOSTS 7.192.128.172:9779
按理说就恢复回一开始的状态了。
但是现在你说恢复了etc下的配置,是指直接用之前备份的etc目录覆盖了么?还是说把config里hosts改回去。如果只是改回去,再drop掉公网IP的hosts,按理说是可以恢复的。
那你现在连接服务上去再show hosts有哪些节点
现在系统认为127.0.0.1上的storage服务在线的,也有有效的partition,应该是有数据的,可以执行下简单的查询命令看下
zzzyr
13
现在show stats还是0
之前是有0.4亿个entity类型的节点
你之前对etc目录有没有执行过cp之类的覆盖操作,看起来是storage里的data没了
zzzyr
15
这个时候能否用BR工具备份恢复一下呢,或者用checkpoint恢复是否可行呢
有backup过的话是可以用br恢复的,checkpoint我需要再确认下。
你主要要得看下storage的data目录有没有覆盖过
你用的这个ownthink数据集是我们开源过的资料,可以考虑重新import data
zzzyr
19
请问是否有操作指导连接呢,我重新操作一下,十分感谢~
zzzyr
20
BR没有做过backup,data目录下面的storage也没有覆盖过,但是看文件夹的修改时间是有做过改动的,但非人为主动修改
你可以看下storage的data目录体积多大,因为反复drop过hosts,所以很难说是否会对数据造成影响。