nebulaGraph2.0.1用spark 导入数据，中途发现有部分storage节点挂了，这样导入数据回有问题吗

zhengshuai1030 · 2021 年6 月 23 日 07:37

nebulaGraph2.0.1

meta 3 个，stoaged 6 个， graph 6 个，备份3

用spark 导入数据，中途发现有部分storage节点挂了，这样导入数据会有问题吗，后来show hosts ,leader 不平衡，balance 后rebulid索引一直不成功

darionyaphet · 2021 年6 月 23 日 07:46

是不是Spark 并发太高了

darionyaphet · 2021 年6 月 23 日 07:47

Balance Leader 和 Rebuild Index 没什么关系吧
show host 看一下 leader 分配是不是成功了

zhengshuai1030 · 2021 年6 月 23 日 09:10

spark 并发可以的，我导入了好多次都可以的，只是今天导入出现了这个问题

darionyaphet · 2021 年6 月 23 日 09:12

那应该是nebula 集群状态的问题

zhengshuai1030 · 2021 年6 月 23 日 09:14

zhengshuai1030 · 2021 年6 月 24 日 02:17

昨晚导入数据，storage 又有挂调了的，帮看看什么问题

zhengshuai1030 · 2021 年6 月 24 日 02:21

这是storaged 日志，导入时间昨晚18.30 开始，麻烦帮看看什么问题

bright-starry-sky · 2021 年6 月 24 日 02:54

你好，请问有core文件吗？另外，磁盘是SSD吗？

zhengshuai1030 · 2021 年6 月 24 日 03:07

core 什么文件？？是ssd

zhengshuai1030 · 2021 年6 月 24 日 03:12

这个什么问题，可以解决吗，这边在测试中，如果不行这边卸载重新装，这边感觉数据有点乱了，

bright-starry-sky · 2021 年6 月 24 日 03:34

storage挂掉有很多可能，有可能是操作系统的限制，把进程杀掉了；也有可能是OOM了，也有可能是bug导致。一般进程挂掉后，会生成一个core.xxxx的文件，可以通过这个core文件破案。

如果没有生成core文件，执行以下命令后再观察一下，下次挂掉就会有core文件了：
ulimit -c unlimited

如果有core.xxx 文件，执行下边命令查看一下堆栈：
gdb nebula-storaged core.xxx
bt

zhengshuai1030 · 2021 年6 月 24 日 03:41

在那个目录，好像没看到core,这边在导入测试一下。我重新安装了，把问题数据都删除了，看看能个不能重现这个问题

zhengshuai1030 · 2021 年6 月 25 日 01:59

现在我 lookup 语句不加过滤条件查询一下，数据量大了，storaged 就挂了，这是什么原因啊，还有你说的core 在那个文件目录，这边没有找到啊只有logs 文件

bright-starry-sky · 2021 年6 月 25 日 02:02

lookup不加where条件的话，相当于full index scan。是oom了。如果需要统计数量值，建议用stats：
https://docs.nebula-graph.io/2.0/3.ngql-guide/7.general-query-statements/6.show/14.show-stats/

zhengshuai1030 · 2021 年6 月 25 日 02:04

那这个怎么解决啊。如果有用户控制台测试写lookup 语句，没加过滤条件吧storaged 高挂了，那这不是出事故了，生产环境不能随便挂服务的啊

zhengshuai1030 · 2021 年6 月 25 日 02:06

这个问题很严重啊。随便写个语句storaged 就挂了，这个他不稳定了吧，这个你们要加限制控制啊

zhengshuai1030 · 2021 年6 月 25 日 02:18

还有问下，创建索引如果数据量很多，是不是也会ooM 导致storaged 挂掉啊

zhengshuai1030 · 2021 年6 月 25 日 02:51

问下这storaged 的内存在那设置一下，避免OOM，服务器内存64 G 的应该够用的啊，还是你们程序里面设置了初始内存大小啊，这边可以在那个配置文件里面改大一些吗

bright-starry-sky · 2021 年6 月 25 日 07:18

内存控制和limit在开发了