3.2.0 graphd crash 宕机

  • nebula 版本:3.2.0

  • 部署方式:单机

  • 安装方式: RPM

  • 是否为线上版本:N

  • 硬件信息

    • 磁盘: SSD
    • CPU、内存信息:8CPU,16G
  • 问题的具体描述

  • 使用过程中graphd宕机了,内存显示没有问题

[INFO] nebula-metad(ef6d6a0): Running as 25895, Listening on 9559 
[INFO] nebula-graphd(ef6d6a0): Exited
[INFO] nebula-storaged(ef6d6a0): Running as 26028, Listening on 9779 

急求助,谢谢各位大佬! :sob:
1,帮忙分析下什么原因导致的?
2,dmp文件怎么解析?用通用的windows工具分析报错

可以贴一下, nebula-graphd.ERROR 的日志 和nebula-graphd.INFO 的日志看看

  • dmesg -T|grep nebula
[root@landray-19 ~]# dmesg -T|grep nebula
[五 10月 28 10:28:49 2022] executor-pri3-4[10662]: segfault at 0 ip 0000000001c31d00 sp 00007f9467bf4b58 error 4 in nebula-graphd (deleted)[ef0000+17b1000]
[二 11月  1 09:45:06 2022] executor-pri3-4[26010]: segfault at 0 ip 0000000001c31d00 sp 00007f6077df4b58 error 4 in nebula-graphd[ef0000+17b1000]

你是跑在windows 的docker还是WSL上面的?

nebula是安装在CentOS-7.9上面

大佬,这个有查出是什么原因吗?dmp文件如何解析?

@Lisa 找graph dev看一眼吧

/var/log/message 里面有啥东西嘛?

可以通过这种方式先转化成 core file,然后拿下 core 栈

minidump-2-core bc31e47a-4f1b-43ae-bc4f2197-56a5cf90.dmp > core
gdb /usr/local/nebula/bin/nebula-storaged core
bt

能找到复现的语句吗?我这边没 get 到什么信息

这个还没有找到必现的语句,偶发情况

messages.rar (4.8 KB)

log 我没看出什么问题额。把日志等级调高(–minloglevel=0 --v=4)等下下次 crash。按照我上面贴的指令拿下 core 栈。

minloglevel 默认0 最小日志级别,即不会记录低于这个级别的日志。可选值为0(INFO)、1(WARNING)、2(ERROR)、3(FATAL)。建议在调试时设置为0,生产环境中设置为1。如果设置为4,NebulaGraph 不会记录任何日志。
你的意思是要调整为 0 吗?我们使用的是默认值0

嗯。