3.2.0 graphd crash 宕机

abbydev · 2022 年11 月 1 日 06:29

nebula 版本：3.2.0
部署方式：单机
安装方式： RPM
是否为线上版本：N
硬件信息
- 磁盘: SSD
- CPU、内存信息：8CPU，16G
问题的具体描述
使用过程中graphd宕机了，内存显示没有问题

[INFO] nebula-metad(ef6d6a0): Running as 25895, Listening on 9559 
[INFO] nebula-graphd(ef6d6a0): Exited
[INFO] nebula-storaged(ef6d6a0): Running as 26028, Listening on 9779

dmp文件
6df6842d-b022-438d-d0aa41b6-a4bc7f8d.dmp (1.4 MB)

急求助，谢谢各位大佬！
1，帮忙分析下什么原因导致的？
2，dmp文件怎么解析？用通用的windows工具分析报错

jmq2020 · 2022 年11 月 1 日 09:17

可以贴一下， nebula-graphd.ERROR 的日志和nebula-graphd.INFO 的日志看看

abbydev · 2022 年11 月 2 日 01:44

dmesg -T|grep nebula

[root@landray-19 ~]# dmesg -T|grep nebula
[五 10月 28 10:28:49 2022] executor-pri3-4[10662]: segfault at 0 ip 0000000001c31d00 sp 00007f9467bf4b58 error 4 in nebula-graphd (deleted)[ef0000+17b1000]
[二 11月  1 09:45:06 2022] executor-pri3-4[26010]: segfault at 0 ip 0000000001c31d00 sp 00007f6077df4b58 error 4 in nebula-graphd[ef0000+17b1000]

nebula-graphd.ERROR 的日志和nebula-graphd.INFO 的日志
nebula-graphd.ERROR (5.1 KB)
nebula-graphd.INFO (152.8 KB)

lzy · 2022 年11 月 2 日 07:27

你是跑在windows 的docker还是WSL上面的？

abbydev · 2022 年11 月 8 日 09:43

nebula是安装在CentOS-7.9上面

abbydev · 2022 年11 月 11 日 02:14

大佬，这个有查出是什么原因吗？dmp文件如何解析？

lzy · 2022 年11 月 14 日 11:08

@Lisa 找graph dev看一眼吧

lzy · 2022 年11 月 14 日 11:09

/var/log/message 里面有啥东西嘛？

kyle · 2022 年11 月 16 日 06:02

可以通过这种方式先转化成 core file，然后拿下 core 栈

minidump-2-core bc31e47a-4f1b-43ae-bc4f2197-56a5cf90.dmp > core
gdb /usr/local/nebula/bin/nebula-storaged core
bt

kyle · 2022 年11 月 16 日 06:10

能找到复现的语句吗？我这边没 get 到什么信息

abbydev · 2022 年11 月 17 日 01:54

这个还没有找到必现的语句，偶发情况

abbydev · 2022 年11 月 17 日 02:22

messages.rar (4.8 KB)

kyle · 2022 年11 月 17 日 02:23

log 我没看出什么问题额。把日志等级调高(–minloglevel=0 --v=4)等下下次 crash。按照我上面贴的指令拿下 core 栈。

abbydev · 2022 年11 月 17 日 07:02

minloglevel 默认0 最小日志级别，即不会记录低于这个级别的日志。可选值为0（INFO）、1（WARNING）、2（ERROR）、3（FATAL）。建议在调试时设置为0，生产环境中设置为1。如果设置为4，NebulaGraph 不会记录任何日志。
你的意思是要调整为 0 吗？我们使用的是默认值0

kyle · 2022 年11 月 17 日 07:04

嗯。

system · 2022 年12 月 17 日 07:05

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。