studio3.5.0版本。
300万数据620MB cvs文件通过studio本地导入功能导入
第一次导入到NebulaGraph,33秒钟导入完成 (2行读取失败)。
2023/02/07 15:40:58 [ERROR] reader.go:173: Fail to read file(data/upload/test_column.csv) line 38647, error: record on line 38647: wrong number of fields
第二次导入,相同文件,1分56秒99.56%报ErrInternalServer,最后终止导入
ErrMsg: Storage Error: part: 10, error: E_RPC_FAILURE(-3)., ErrCode: -1005
2023/02/07 16:25:02 [INFO] statsmgr.go:89: Done(data/upload/test_column.csv): Time(238.03s), Finished(3000000), Failed(23820), Read Failed(0), Latency AVG(4167us), Batches Req AVG(6014us), Rows AVG(12603.58/s)
第三次导入,相同文件,15分钟导入6.2%速度超慢。虽然没有停止但是日志报错。
ErrMsg: Storage Error: part: 10, error: E_RPC_FAILURE(-3)., ErrCode: -1005
2023/02/07 16:25:02 [INFO] statsmgr.go:89: Done(data/upload/test_column.csv): Time(238.03s), Finished(3000000), Failed(23820), Read Failed(0), Latency AVG(4167us), Batches Req AVG(6014us), Rows AVG(12603.58/s)
有谁知道这是什么问题吗?
看下这个。
根据FAQ没有找到解决的办法,现在使用
SUBMIT JOB STATS;
show stats;
报错
-1005:Job is not finished!
你这两张图不是两个问题么?show stats 报错,你可以看下文档里,说明了 job 要完成之后才能执行 show stats。
这个是说你的数据部分导入失败?
不好意思啊,这个错误其实在导入出现问题后就发生了,现在执行还是这样。
show jobs 看看结果。
再执行下 SUBMIT JOB STATS
把meta重启下再submit试试
1 个赞
重启后问题依旧
2和3的问题原因找到了,是HOST下线了。
HOST为什么会下线啊,日志都看过了,没有发现原因啊?
查询的时候查挂了?断电了?有很多原因啊,你可以把相关的日志贴过来。
不是查询的时候,是导入csv的时候直接下线了,到55%的时候
写挂了?
嗯。这个帖子的2和3的问题就是因为host下线引起的,日志都看了没找到原因,之前导入相同数据只是失败一两条,速度很快,后来就都这样了。
HDD 么?可以试试把写速度降低下。