NebulaGraph v3.5.0 性能测试报告

shanlai · 2023 年5 月 29 日 05:48

本文系 NebulaGraph 社区版 v3.5.0 的性能测试报告。

在 v3.5.0 版本中，NebulaGraph 优化了相关的 FIND ALL PATH 性能，支持了免索引查询等等功能。具体的 v3.5.0 的 release note 参见：https://discuss.nebula-graph.com.cn/t/topic/13139

而本次性能概述如下：

FIND ALL PATH 的深度性能有大约 50-500% 的提升，其中 1 to 5 steps 大约有 600% 的提升；
Match2HOP_count 的性能有 15% 幅度的提升；
解决 GO 使用属性过滤时，返回结果不正确问题。部分 case（Go1~3 StepEdge、和Go1~3 StepEdge_count）存在小幅度的性能下降；

此外，如果对于深度（10 跳以上）性能有较高诉求，可使用企业版本。

测试环境

服务器和压测机皆为物理机：

测试数据

测试数据采用 LDBC-SNB SF100 数据集，SF100 数据集大小为 100 G，共有 282,386,021 个点以及 1,775,513,185 条边。测试用的图空间分区数为 24，副本数为 3。

关于 LDBC-SNB

关联数据基准委员会（LDBC，Linked Data Benchmark Council），是图（Graph）和 RDF 数据管理的基准指南制定者。社交网路基准（SNB，Social Network Benchmark）是关联数据基准委员会（LDBC）开发的软件基准（Benchmark）之一。关于 LDBC-SNB 数据集，具体请参考以下文档：

LDBC-SNB Specification：https://ldbcouncil.org/ldbc_snb_docs/ldbc-snb-specification.pdf
LDBC-SNB Docs：https://github.com/ldbc/ldbc_snb_docs
LDBC-SNB测试数据集生产工具：https://github.com/ldbc/ldbc_snb_datagen_spark

NebulaGraph Commit

nebula-graphd version d1e2118
nebula-storaged version d1e2118
nebula-metad version d1e2118

测试说明

压测工具使用基于 Go 语言的 k6，具体请参阅 k6 官方网站；客户端使用的是 nebula-go
图表中横坐标轴的 “50_vu”、“100_vu” 等中的 “vu” 表示的是 k6 使用的概念 “virtual user”，即性能测试中的并发数；50_vu 表示 50 个并发用户，100_vu 表示 100 个并发用户，以此类推…
性能基线使用正式发布的 v3.4.0 版本
ResponseTime = Latency（服务端处理时长）+ 网络回传结果时长 + 客户端反序列化结果时长

基线测试

注：下图涉及的词语解释

QPS 即吞吐率
Latency 即服务端耗时
ResponseTime 即客户端耗时
RowSize 即请求返回行数

用例和结果

查询带边属性

GO {} STEP FROM {} OVER KNOWS yield KNOWS.creationDate

一跳·吞吐率

一跳·服务端耗时（ms）

一跳·客户端耗时（ms）

一跳·请求返回行数

二跳·吞吐率

二跳·服务端耗时（ms）

二跳·客户端耗时（ms）

二跳·请求返回行数

三跳·吞吐率

三跳·服务端耗时（ms）

三跳·客户端耗时（ms）

三跳·请求返回行数

查询带目的点属性

GO {} STEP FROM {} OVER KNOWS yield $$.Person.firstName

一跳·吞吐率

一跳·服务端耗时（ms）

一跳·客户端耗时（ms）

一跳·请求返回行数

二跳·吞吐率

二跳·服务端耗时（ms）

二跳·客户端耗时（ms）

二跳·请求返回行数

三跳·吞吐率

三跳·服务端耗时（ms）

三跳·客户端耗时（ms）

三跳·请求返回行数

查询带边属性+目的点属性

GO {} STEP FROM {} OVER KNOWS yield DISTINCT KNOWS.creationDate as t, $$.Person.firstName, $$.Person.lastName, $$.Person.birthday as birth | order by $-.t, $-.birth | limit 10

一跳·吞吐率

一跳·服务端耗时（ms）

一跳·客户端耗时（ms）

二跳·吞吐率

二跳·服务端耗时（ms）

二跳·客户端耗时（ms）

三跳·吞吐率

三跳·服务端耗时（ms）

三跳·客户端耗时（ms）

LOOKUP

LOOKUP ON Person WHERE Person.firstName == '{}' YIELD Person.firstName, Person.lastName, Person.gender, Person.birthday, Person.creationDate, Person.locationIP, Person.browserUsed

LOOKUP·吞吐率

LOOKUP·服务端耗时（ms）

LOOKUP·客户端耗时（ms）

LOOKUP·请求返回行数

FETCH 点

FETCH PROP ON Person {} YIELD Person.firstName, Person.lastName, Person.gender, Person.birthday, Person.creationDate, Person.locationIP, Person.browserUsed

FETCH 点·吞吐率

FETCH 点·服务端耗时（ms）

FETCH 点·客户端耗时（ms）

FETCH 点·请求返回行数

FETCH 边

FETCH PROP ON KNOWS {} -> {} YIELD KNOWS.creationDate

FETCH 边·吞吐率

FETCH 边·服务端耗时（ms）

FETCH 边·客户端耗时（ms）

FETCH 边·请求返回行数

MATCH 索引

MATCH (v:Person) WHERE v.Person.firstName == '{}' RETURN v

MATCH·吞吐率

MATCH·服务端耗时（ms）

MATCH·客户端耗时（ms）

MATCH·请求返回行数

MATCH 一跳

MATCH (v1:Person)-[e:KNOWS]->(v2:Person) WHERE id(v1) == {} RETURN v2

MATCH 一跳·吞吐率

MATCH 一跳·服务端耗时（ms）

MATCH 一跳·客户端耗时（ms）

MATCH 一跳·请求返回行数

MATCH 两跳

MATCH (v1:Person)-[e:KNOWS*2]->(v2:Person) WHERE id(v1) == {} RETURN v2

MATCH 两跳·吞吐率

MATCH 两跳·服务端耗时（ms）

MATCH 两跳·客户端耗时（ms）

MATCH 两跳·请求返回行数

MatchTest1

match (v:Person) where id(v) == {} return count(v.Person.firstName)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MatchTest2

match (v:Person)-[e:KNOWS]-(v2) where id(v) == {} and v2.Person.locationIP != 'yyy' return length(v.Person.browserUsed) + length(v2.Person.gender)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

请求返回行数

MatchTest3

match (v:Person)-[e:KNOWS]-(v2) where id(v) == {} and v2.Person.locationIP != 'yyy' with v, v2 as v3 return length(v.Person.browserUsed) + (v3.Person.gender)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

请求返回行数

MatchTest4

MATCH (m)-[:KNOWS]-(n) WHERE id(m)=={} OPTIONAL MATCH (n)<-[:KNOWS]-(l) RETURN length(m.Person.lastName) AS n1, length(n.Person.lastName) AS n2, l.Person.creationDate AS n3 ORDER BY n1, n2, n3 LIMIT 10

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MatchTest5

MATCH (m)-[:KNOWS]-(n) WHERE id(m)=={} MATCH (n)-[:KNOWS]-(l) WITH m AS x, n AS y, l RETURN x.Person.firstName AS n1, y.Person.firstName AS n2, CASE WHEN l.Person.firstName is not null THEN l.Person.firstName WHEN l.Person.gender is not null THEN l.Person.birthday ELSE 'null' END AS n3 ORDER BY n1, n2, n3 LIMIT 10

吞吐率

服务端耗时（ms）

客户端耗时（ms）

查询带边属性 count

GO {} STEP FROM {} OVER KNOWS yield KNOWS.creationDate | return count(*) ;

一跳·吞吐率

一跳·服务端耗时（ms）

一跳·客户端耗时（ms）

二跳·吞吐率

二跳·服务端耗时（ms）

二跳·客户端耗时（ms）

三跳·吞吐率

三跳·服务端耗时（ms）

三跳·客户端耗时（ms）

查询带目的点属性 count

GO 1 STEP FROM {} OVER KNOWS yield $$.Person.firstName | return count(*)

一跳·吞吐率

一跳·服务端耗时（ms）

一跳·客户端耗时（ms）

二跳·吞吐率

二跳·服务端耗时（ms）

二跳·客户端耗时（ms）

三跳·吞吐率

三跳·服务端耗时（ms）

三跳·客户端耗时（ms）

LOOKUP count

LOOKUP ON Person WHERE Person.firstName == '{}' YIELD Person.firstName | return count(*)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MATCH count

MATCH (v:Person) WHERE v.Person.firstName == '{}' RETURN count(*)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MATCH 一跳 count

MATCH (v1:Person)-[e:KNOWS]->(v2:Person) WHERE id(v1) == {} RETURN count(*)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MATCH 两跳 count

MATCH (v1:Person)-[e:KNOWS*2]->(v2:Person) WHERE id(v1) == {} RETURN count(*)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

插入点

INSERT VERTEX Comment (creationDate, locationIP, browserUsed, content, length) VALUES {}:('{}', '{}', '{}', '{}', {})

吞吐率

服务端耗时（ms）

客户端耗时（ms）

插入边

INSERT EDGE LIKES (creationDate) VALUES {}→{}:('{}')

吞吐率

服务端耗时（ms）

客户端耗时（ms）

插入带索引的点

INSERT VERTEX Person (firstName,lastName,gender,birthday,creationDate,locationIP,browserUsed) VALUES {0}:(\"{1}\", \"{2}\",\"{3}\",\"{4}\",datetime(\"{5}\"), \"{6}\",\"{7}\")

吞吐率

服务端耗时（ms）

客户端耗时（ms）

插入带索引的边

INSERT EDGE WORK_AT (workFrom) VALUES {0}→{1}:({2})

吞吐率

服务端耗时（ms）

客户端耗时（ms）

3.5.0 vs 3.4.0（Baseline）

以下数据选取 P99 值。

查询带边属性

GO {} STEP FROM {} OVER KNOWS yield KNOWS.creationDate

一跳·吞吐率

一跳·服务端耗时（ms）

一跳·客户端耗时（ms）

二跳·吞吐率

二跳·服务端耗时（ms）

二跳·客户端耗时（ms）

三跳·吞吐率

三跳·服务端耗时（ms）

三跳·客户端耗时（ms）

查询带目的点属性

GO {} STEP FROM {} OVER KNOWS yield $$.Person.firstName

一跳·吞吐率

一跳·服务端耗时（ms）

一跳·客户端耗时（ms）

二跳·吞吐率

二跳·服务端耗时（ms）

二跳·客户端耗时（ms）

三跳·吞吐率

三跳·服务端耗时（ms）

三跳·客户端耗时（ms）

查询带边属性+目的点属性

GO {} STEP FROM {} OVER KNOWS yield DISTINCT KNOWS.creationDate as t, $$.Person.firstName, $$.Person.lastName, $$.Person.birthday as birth | order by $-.t, $-.birth | limit 10

一跳·吞吐率

一跳·服务端耗时（ms）

一跳·客户端耗时（ms）

二跳·吞吐率

二跳·服务端耗时（ms）

二跳·客户端耗时（ms）

三跳·吞吐率

三跳·服务端耗时（ms）

三跳·客户端耗时（ms）

LOOKUP

LOOKUP ON Person WHERE Person.firstName == '{}' YIELD Person.firstName, Person.lastName, Person.gender, Person.birthday, Person.creationDate, Person.locationIP, Person.browserUsed

LOOKUP·吞吐率

LOOKUP·服务端耗时（ms）

LOOKUP·客户端耗时（ms）

FETCH 点

FETCH PROP ON Person {} YIELD Person.firstName, Person.lastName, Person.gender, Person.birthday, Person.creationDate, Person.locationIP, Person.browserUsed

FETCH 点·吞吐率

FETCH 点·服务端耗时（ms）

FETCH 点·客户端耗时（ms）

FETCH 边

FETCH PROP ON KNOWS {} -> {} YIELD KNOWS.creationDate

FETCH 边·吞吐率

FETCH 边·服务端耗时（ms）

FETCH 边·客户端耗时（ms）

MATCH 索引

MATCH (v:Person) WHERE v.Person.firstName == '{}' RETURN v

MATCH·吞吐率

MATCH·服务端耗时（ms）

MATCH·客户端耗时（ms）

MATCH 一跳

MATCH (v1:Person)-[e:KNOWS]->(v2:Person) WHERE id(v1) == {} RETURN v2

MATCH 一跳·吞吐率

MATCH 一跳·服务端耗时（ms）

MATCH 一跳·客户端耗时（ms）

MATCH 两跳

MATCH (v1:Person)-[e:KNOWS*2]->(v2:Person) WHERE id(v1) == {} RETURN v2

MATCH 两跳·吞吐率

MATCH 两跳·服务端耗时（ms）

MATCH 两跳·客户端耗时（ms）

MatchTest1

match (v:Person) where id(v) == {} return count(v.Person.firstName)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MatchTest2

match (v:Person)-[e:KNOWS]-(v2) where id(v) == {} and v2.Person.locationIP != 'yyy' return length(v.Person.browserUsed) + length(v2.Person.gender)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MatchTest3

match (v:Person)-[e:KNOWS]-(v2) where id(v) == {} and v2.Person.locationIP != 'yyy' with v, v2 as v3 return length(v.Person.browserUsed) + (v3.Person.gender)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MatchTest4

MATCH (m)-[:KNOWS]-(n) WHERE id(m)=={} OPTIONAL MATCH (n)<-[:KNOWS]-(l) RETURN length(m.Person.lastName) AS n1, length(n.Person.lastName) AS n2, l.Person.creationDate AS n3 ORDER BY n1, n2, n3 LIMIT 10

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MatchTest5

MATCH (m)-[:KNOWS]-(n) WHERE id(m)=={} MATCH (n)-[:KNOWS]-(l) WITH m AS x, n AS y, l RETURN x.Person.firstName AS n1, y.Person.firstName AS n2, CASE WHEN l.Person.firstName is not null THEN l.Person.firstName WHEN l.Person.gender is not null THEN l.Person.birthday ELSE 'null' END AS n3 ORDER BY n1, n2, n3 LIMIT 10

吞吐率

服务端耗时（ms）

客户端耗时（ms）

查询带边属性 count

GO {} STEP FROM {} OVER KNOWS yield KNOWS.creationDate | return count(*) ;

一跳·吞吐率

一跳·服务端耗时（ms）

一跳·客户端耗时（ms）

二跳·吞吐率

二跳·服务端耗时（ms）

二跳·客户端耗时（ms）

三跳·吞吐率

三跳·服务端耗时（ms）

三跳·客户端耗时（ms）

查询带目的点属性 count

GO 1 STEP FROM {} OVER KNOWS yield $$.Person.firstName | return count(*)

一跳·吞吐率

一跳·服务端耗时（ms）

一跳·客户端耗时（ms）

二跳·吞吐率

二跳·服务端耗时（ms）

二跳·客户端耗时（ms）

三跳·吞吐率

三跳·服务端耗时（ms）

三跳·客户端耗时（ms）

LOOKUP count

LOOKUP ON Person WHERE Person.firstName == '{}' YIELD Person.firstName | count(*)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MATCH count

MATCH (v:Person) WHERE v.Person.firstName == '{}' RETURN count(*)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MATCH 一跳 count

MATCH (v1:Person)-[e:KNOWS]->(v2:Person) WHERE id(v1) == {} RETURN count(*)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

MATCH 两跳 count

MATCH (v1:Person)-[e:KNOWS*2]->(v2:Person) WHERE id(v1) == {} RETURN count(*)

吞吐率

服务端耗时（ms）

客户端耗时（ms）

插入点

INSERT VERTEX Comment (creationDate, locationIP, browserUsed, content, length) VALUES {}:('{}', '{}', '{}', '{}', {})

吞吐率

服务端耗时（ms）

客户端耗时（ms）

插入边

INSERT EDGE LIKES (creationDate) VALUES {}→{}:('{}')

吞吐率

服务端耗时（ms）

客户端耗时（ms）

插入带索引的点

INSERT VERTEX Person (firstName,lastName,gender,birthday,creationDate,locationIP,browserUsed) VALUES {0}:(\"{1}\", \"{2}\",\"{3}\",\"{4}\",datetime(\"{5}\"), \"{6}\",\"{7}\")

吞吐率

服务端耗时（ms）

客户端耗时（ms）

插入带索引的边

INSERT EDGE WORK_AT (workFrom) VALUES {0}→{1}:({2})

吞吐率

服务端耗时（ms）

客户端耗时（ms）

监控·服务器状态

192.168.15.8

192.168.15.9

192.168.15.10

压测机 192.168.15.14

谢谢你读完本文 (///▽///)

欢迎你前往 GitHub 体验 NebulaGraph v3.5.0：https://github.com/vesoft-inc/nebula/releases/tag/v3.5.0