请问Nebula和 JanusGraph对比,在上亿点、边的批量导入和查询性能方面如何呢?

JanusGraph也是分布式开源图库,Nebula和它对比如何呢?
如果在上亿点、边,TB级数据量场景下,数据的批量导入(初始和增量)、模糊查询、路径发现的性能如何呢?

两者的差异性还是很大的,从存储到架构都是不同的实现,这也导致性能的差异。

nebula 也有一些用户之前是用的 JanusGraph,后面慢慢的迁移到 Nebula Graph 上来,可以参考一篇文章中 Nebula 用户的声音:

数据导入跟具体机器配置有关,在我们的实验环境下,无论是 nebula-importer 还是 spark writer 都能到达 40~50 万条 / s 的速率。

模糊查询目前是通过 index 来实现,匹配的方式要参考我们的具体文档。路径发现算法等都跟数据构图相关,所以没办法笼统回答具体性能。

我们正在做 LDBC 的 benchmark 测试,后续会详细披露各种查询的细节。相信到时能给你更直观的回答。

非常感谢,目前集群已经搭建好了,准备先测试几千万点边试试

2 个赞

您好,请问咱们模糊查询用nGQL该怎么实现的呢?我在手册index中好像没有找到。。

抱歉,对于 lookup 时通过通配符查找的实现还未完成,现在模糊查询还没支持。如果是string 的 contains 查找,现在可以在 go where 语句中使用。