图数据库的性能怎么样

nebula 的导入性能能怎么样,会不会像ibm 封装的janusgraph导入工具一样,对导入机器的内存有很高的要求。
图查询的性能怎么样,在 点数量1亿,边数量2亿的前提下,以一个点为查询起点的时候,大概能查询多少层时会到达瓶颈。

导入性能: https://github.com/vesoft-inc/nebula-exchange/blob/master/bench/exchange-test.md

1 个赞

刚看了这个文档,通过nebula-exchange-2.6.0.jar进行导入数据的性能还不错,内存占用也不高,但是测试样例executors cpu核心数为60C,如果将cpu资源下降到30C,导入性能会不会有大幅度的下降。还有就是导入集群的executors 数是3个,当服务部署的数量也是3时,就意味着我在做大数据量导入的时候会占用所有的集群资源,这个时候去查询图会不会出问题。

  1. 导入和查询会有内存资源的抢占,你可以给导入分配少一点内存,这样问题应该不大。
  2. 导入时如果你使用executors数是3, 这个相当于每个节点只会起一个executor进程,并不会占用所有的集群资源,相反这个配置是最低的。
  3. 我们没有测过30c,但发现使用120c时性能并不比60c高, 所以降低cores并不一定会导致导入性能有大幅下降,要看极限cores是多少。
1 个赞

我建议 如果有能的话测试一下cores的极限是多少。如果入图机器的磁盘不是ssd,性能会大幅度下降么?

会的

有过普通硬盘的测试么,比起ssd,导入性能会下降到原来的一半或者更低么?

没有 我们不建议使用hdd 准备资源 - Nebula Graph Database 手册

好的,那硬盘这里可能要先打上一个 ?了。

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。