查询结果抖动,会出现偶尔查不到的情况。

提问参考模版:

  • nebula 版本:nebula v1.2.0

  • 部署方式(分布式 / 单机 / Docker / DBaaS):Docker

  • 硬件信息

    • 磁盘( 推荐使用 SSD):单节点:5 x 100G云SSD盘,20个结点。
    • CPU、内存信息 :storage:16G x 20结点,graph:8G x 3结点,meta:2G x 3 结点。
  • 问题的具体描述
    同一个查询,查询多次,有时候正常,有时候就会出现Failed,截图如下:
    image

  • 相关的 meta / storage / graph info 日志信息
    graph日志:

发现是请求9.148.185.118结点错误,然后我就去9.148.185.118结点机器上去看,然后发现该结点上的storage完全正常,进程存活,且没有任何INFO日志输出;于是我怀疑是网络的问题,就找K8s的网络负责相关同事请教是什么原因。

同事反馈结果如下:
抓了包看:


发现storage和graph并没有保持连接,graph向storage发送了Fin包以后,连接中止了。
相关运维的同事问我是不是连接池用完了,看起来像是连接池的问题,辛苦排查一下?

这个问题出现的很频繁,已经很严重的影响了我们日常的使用,烦请关注。

1 个赞

这个问题 我遇到过一次 后来重试几次好了 就没有继续跟进了

k8s网络相关的信息能再提供一些吗,比如网络模式,使用的网络插件,方便我们构造场景去尝试复现测试

更新到master 或者拉下这个PR

更新了,但是还是有问题。
主要的问题还是在yield property的时候,会出现"Get neighbors partially failed"的问题。