关于数据目录更换的问题

nebula 版本:2.6.2
部署方式:分布式
安装方式:RPM
是否为线上版本:N
硬件信息
磁盘:8x12T HDD
-CPU:40核
-内存:192G
问题的具体描述:
假如目前有个磁盘的坏道损坏,能不能直接把当前节点的storage服务停掉,将当前节点数据目录转移到其它磁盘目录上,在启动storage这样保证数据的安全性。我在测试环境操作了一下,发现可以正常启动使用,就是不知道是不是会存在什么隐患。
例如:将/data12/nebula/store换为/data11/nebula1/store



结果:

可以的,这样做没问题

好的。感谢大佬解惑

:thinking: 所以你上一个问题,数据丢失,是因为磁盘坏道引起的么?

确实有一个节点有磁盘坏道,但是设置的是3副本,这个会导致数据丢失吗。目前磁盘坏道对应的storage还起不来。想着通过转移数据目录到其它盘上,可是转移的数据文件有的不完整,我看nebula启动的时候还会校验文件的大小。如果我想启动这个storage,要怎么做呢,需要先将这个节点storage剔除,然后修复磁盘,再加回来吗。
相关报错:




:joy: 上面的小哥是本周 oncall 的研发,@liwenhui 昨天你困惑的那个问题,硬件上存在坏道。

急需小哥老师帮忙解惑 :sob:

可以以一个空目录启动,它会自动通过raft把数据同步过来。

好的,感谢老师,那磁盘坏道会造成数据丢失吗。

目前出现一种情况,就是我把那个磁盘坏道的目录替换成其他目录后,storage成功启动了。但是我执行submit job stat后查看数据量较之前少了一些,并且新添加的数据目录没有同步出数据。这个是不是造成数据丢失的一个原因,可能之前存在坏道没有处理,但是storage服务还在。
目录调整配置:


调整后数据目录:
image
storage可正常启动:

数据量前后对比少了些:
前:

后:

换回原来的目录重启后,虽然storage无法启动,但是数据量恢复了很多。。

你如果创建过快照 snapshot 的话,可以试试恢复到最新的快照。

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。