请问Nebula和 JanusGraph对比，在上亿点、边的批量导入和查询性能方面如何呢？

Horizon · 2020 年6 月 10 日 08:03

JanusGraph也是分布式开源图库，Nebula和它对比如何呢？
如果在上亿点、边，TB级数据量场景下，数据的批量导入（初始和增量）、模糊查询、路径发现的性能如何呢？

yee · 2020 年6 月 10 日 08:40

两者的差异性还是很大的，从存储到架构都是不同的实现，这也导致性能的差异。

nebula 也有一些用户之前是用的 JanusGraph，后面慢慢的迁移到 Nebula Graph 上来，可以参考一篇文章中 Nebula 用户的声音：

数据导入跟具体机器配置有关，在我们的实验环境下，无论是 nebula-importer 还是 spark writer 都能到达 40～50 万条 / s 的速率。

模糊查询目前是通过 index 来实现，匹配的方式要参考我们的具体文档。路径发现算法等都跟数据构图相关，所以没办法笼统回答具体性能。

我们正在做 LDBC 的 benchmark 测试，后续会详细披露各种查询的细节。相信到时能给你更直观的回答。

Horizon · 2020 年6 月 10 日 15:37

非常感谢，目前集群已经搭建好了，准备先测试几千万点边试试

Horizon · 2020 年6 月 11 日 07:27

您好，请问咱们模糊查询用nGQL该怎么实现的呢？我在手册index中好像没有找到。。

yee · 2020 年6 月 11 日 23:25

抱歉，对于 lookup 时通过通配符查找的实现还未完成，现在模糊查询还没支持。如果是string 的 contains 查找，现在可以在 go where 语句中使用。