并发写入和查询情况下Strorage服务进程消失

  • nebula 版本:3.2.1
  • 部署方式: 分布式
  • 安装方式:RPM
  • 是否上生产环境:Y
  • 硬件信息
    • 磁盘:2T
    • CPU:30C
    • 内存:63G

3台上述配置的虚拟服务器组成Nebula集群

  • 问题的具体描述

在并发写入和查询情况下,三台服务器storage服务进程直接消失。

  • Storage服务日志


    只有这一个错误提示,没有关于Storage相关的异常。但是集群中并没有创建名字为1的space。而且这个错误在之前集群正常运行的时候一直都有报。

  • Nebula使用语句

  1. 插入/更新点边语句
    在INSERT/UPDATE语句之前,会执行一次MATCH操作,如果不存在则INSERT,存在则UPDATE
  2. 多模式MATCH
    MATCH a-[e1]->b,b-[e2]->c,d-[e3]->[a]
    WHERE id(a)=‘VID’
    RETURN a,b,c,d,e1,e2,e3

烦请社区大大帮忙分析一下Storage挂的原因,是不是业务并发查询和写入量太大导致Nebula集群扛不住导致的?

另外最后两张图关于服务器CPU和内存信息是采集服务器Nmon信息得到的。想请问下Nebula Dashboard中关于内存是如何计算的,可以看到当时内存中的cached/buffers还是有很多的。

dmesg可以看看是不是因为oom被系统kill掉了

大概率是因为MATCH语句, 3.4版本加强了内存管理, 被kill的概率小了


查看了dmesg。的确是storage服务被操作系统Kill了。
但当时我看服务器上cache/buffer还有很多30多G可用,为什么会被操作系统kill了?

主要是对应的实际物理内存已经到了53G左右了 (图里面)

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。