- nebula 版本:2.6.1
- 部署方式:分布式
- 安装方式:RPM
- 是否为线上版本: Y
- 硬件信息
- 磁盘( 推荐使用 SSD)
- CPU、内存信息 256G内存 48C
- 问题的具体描述
使用studio删除一个space,页面上显示删除完成,但是再底层使用console查询的时候space还存在
使用use space_name 的时候又报错,该space不存在
在studio上查看schema也显示改space不存在
该删除操作已经执行了一个星期了
该删除操作已经执行了一个星期了
space drop 之后,你做过 compaction 吗?
做了一个没有数据的space的compaction,很快就结束了,但是还是存在上述的问题,是否需要做一个有数据的space的compaction
meta 是几副本?
三副本
能提供一下 meta 的 log 吗? 需要改下 meta 的 log 等级. 设置 --v=3
VLOG(3) << "List spaces " << spaceId << ", name " << spaceName;
应该会打印出这样一句.
得重启下 meta, 然后再执行下 show spaces
哦, 有没有可能在别的机器上? 您不是说 meta 有 3 台?
意思是三台都修改日志等级然后执行看是吗?
嗯, 理论上只改 leader 就行, 但是 leader 没准在哪台上.
重启了三台 的metad ,确实有了,并且重启完后发现space恢复正常了,删除掉的space也没有了,请问这个可能是什么原因造成的呢?
我怀疑啊, 可能跟 2.6.1 的一个 raft bug 有关. raft leader 跟 follower 出现不一致了. 然后您的 console 和 studio 还连了不同的 meta server.
这个能再具体描述下吗? 没太看懂.
不对,刚才重启了另外两台的metad,space就好了,现在又把日志等级改回0,重启metad,这个删掉的spaces又出现了,是不是metad的信息没有同步,leader在不同的metad的时候元数据信息不一致,有的有这个space,有的metad节点上没有这个spaces;这个metad的数据能手动同步一下吗?
可以把怀疑有问题的 meta 下面的 data 目录删掉, 然后从另外两台没问题的机器上, 直接 scp 一个 data 目录过来就可以
替换完成,问题修复了,谢谢
问题解决了的话,可以勾选上面 liuyu85cn 的回复为解决方案哈,方便后续遇到相似问题的小伙伴能快速找到答案~谢谢 zq327