索引删除时间是否会影响数据重新导入

提问参考模版:

  • nebula 版本:2.0-rc1
  • 部署方式(分布式 / 单机 / Docker / DBaaS):单机
  • 问题的具体描述
    1.假设有几个顶点,每个顶点是1000W左右的数据,通过java-client导入nebula,需要先将表上所有索引删除,再对数据导入,最后重建索引。删除索引时间一般是多长,会影响数据导入吗?
    2.涉及多个顶点和关系的多个索引操作,有没有索引的批量操作方法?

重建索引过程中会删除旧索引 不需要单独删除索引

批量索引操作指的是?

不需要删除索引再重建

离线重建索引主要是为了过去无索引数据的索引创建,索引一旦建立,后续导入的数据都自带索引。

IGNORE INDEX 那个代码后来进去了吗

1.最新版本的数据支持在已有索引的tag中导入数据,之前好像看到过效率会下降很多?如果数据量大的情况下比如每个tag 1000W数据,是删除索引后导入再新建索引,还是直接导入比较好?
2.DROP tag是否会删除里面所有点

这个数据量并不大,可以创建好索引后直接导入,无需导入后的rebuild。
另外,如果想删除索引后重新导入数据,无需关心删除索引索引的速度,这个删除过程是在后台的compact自动完成的。导入完毕后,创建的新索引是不同的indexId,对之前的索引没有任何关系,也没有任何影响。

drop tag是会删除与其相关的所有vertex。

另外,最近将要发布的2.0GA版本中,对带索引的数据导入性能做了优化,高并发场景下,导入性能有很大提升。请关注。

我觉得drop index → insert → create index → rebuild虽然繁琐了点,但是时间上可能更快。

浙ICP备20010487号