- nebula 版本:3.6.0
- 部署方式:分布式
- 安装方式:TAR包安装
- 是否上生产环境:Y
- 硬件信息
- 存储:1.2T(非SSD)
- CPU:16C
- 内存:64G
- 数量:6台
- 问题的具体描述
nebula-graphd服务挂了,但是在nebula目录下未生成core文件,在logs目录下生成了dmp文件,生产环境为linux环境无法解析dmp文件,也很难把dmp文件带出来,想问下为什么没有生成coredump文件呢,是因为我nebula的安装目录不是默认路径吗?
可以先网上搜下
这个是nebula会自动生成吗?你说的这些默认都是开启的,我看论坛上说是会生成在nebula的安装目录下,这个是需要我手动在/proc/sys/kernel/core_pattern文件里面指定吗?
我看了下,我自己的也是默认配置。
目录权限也都确认了是么。
另外,你说的 graphd 挂掉的现象是怎样的,怎么触发的?
想问下nebula是通过系统级来coredump的吗?如果是调用的系统级的,我可以去问下运维权限问题。
现象就是突然挂掉,看日志的话,挂掉前后存在GraphMemoryExceeded报错,另外dmesg | grep nebula,有越界的错误,怀疑是untracked_reserved_meomory_mb设置的太小导致的,目前只设置了100MB,想问下有影响吗?
目前是有大量查询8k-1w qps,但是因为没有core dump文件,我这边也没法具体定位是啥原因,生成的dmp文件分析不了,我们这边生产管控很严格,很多分析软件都没法安装