NebulaGraph3.3.0导入报错

studio3.5.0版本。
300万数据620MB cvs文件通过studio本地导入功能导入
第一次导入到NebulaGraph,33秒钟导入完成 (2行读取失败)。
2023/02/07 15:40:58 [ERROR] reader.go:173: Fail to read file(data/upload/test_column.csv) line 38647, error: record on line 38647: wrong number of fields
第二次导入,相同文件,1分56秒99.56%报ErrInternalServer,最后终止导入
ErrMsg: Storage Error: part: 10, error: E_RPC_FAILURE(-3)., ErrCode: -1005
2023/02/07 16:25:02 [INFO] statsmgr.go:89: Done(data/upload/test_column.csv): Time(238.03s), Finished(3000000), Failed(23820), Read Failed(0), Latency AVG(4167us), Batches Req AVG(6014us), Rows AVG(12603.58/s)
第三次导入,相同文件,15分钟导入6.2%速度超慢。虽然没有停止但是日志报错。
ErrMsg: Storage Error: part: 10, error: E_RPC_FAILURE(-3)., ErrCode: -1005
2023/02/07 16:25:02 [INFO] statsmgr.go:89: Done(data/upload/test_column.csv): Time(238.03s), Finished(3000000), Failed(23820), Read Failed(0), Latency AVG(4167us), Batches Req AVG(6014us), Rows AVG(12603.58/s)
有谁知道这是什么问题吗?

看下这个。

根据FAQ没有找到解决的办法,现在使用
SUBMIT JOB STATS;
show stats;
报错
-1005:Job is not finished!

你这两张图不是两个问题么?show stats 报错,你可以看下文档里,说明了 job 要完成之后才能执行 show stats。

这个是说你的数据部分导入失败?

不好意思啊,这个错误其实在导入出现问题后就发生了,现在执行还是这样。

show jobs 看看结果。

再执行下 SUBMIT JOB STATS

把meta重启下再submit试试

1 个赞

重启后问题依旧

2和3的问题原因找到了,是HOST下线了。

HOST为什么会下线啊,日志都看过了,没有发现原因啊?

查询的时候查挂了?断电了?有很多原因啊,你可以把相关的日志贴过来。

不是查询的时候,是导入csv的时候直接下线了,到55%的时候

写挂了?

嗯。这个帖子的2和3的问题就是因为host下线引起的,日志都看了没找到原因,之前导入相同数据只是失败一两条,速度很快,后来就都这样了。

HDD 么?可以试试把写速度降低下。