大数据量下查询性能优化

wanwenjie · 2023 年10 月 24 日 07:38

机器配置如下：

机器数 12台
磁盘类型普通硬盘
CPU 核数 40C * 12
内存大小 186G * 12
NebulaGraph 版本号 v2.6.2

图空间 schema

数据量，涉及到的数据量大概多少:

查询语句，需要调优的那条语句:

PROFILE go from '51b284301fb9114161cdfd9b39e105d5','55eb83c16b8e9f37569e0a86151afb24','29068789be05e6cc6d0b5839b0ca55fc','bfacdd51ffa9531bb30ada247defb9e6','4cbadbf321054b642accaf625ba940da','8f1c18a3c5ad5ffedd9a37b70680a802','76eb93519c55fe6ef93117e9299af879','b0f7455930fcc96a81f0b976df7a470a','51d5c94dcb9a359a1c065c2c77a1a67f','a1f976a3a80d193e3d265640e8639af1','4032c94176f9f182170b78e57a59bb6c','590592a406787368db036fd74c300270','2029710071a252db82c65b4d3248e091','44abc3a03f7405b5f92bec8b10cf1e88' over contain BIDIRECT where $^.domain.label == 'domain' and $$.report.label=='report' yield $^.domain.label,$^.domain.name,$^.domain.sld,$^.domain.dynamic,$^.domain.is_malicious,$^.domain.is_targeted,$^.domain.malicious_type,$^.domain.malicious_family,$^.domain.apt_group,$^.domain.is_tpd,$^.domain.ti_tags, contain._src, contain._dst, contain._dst as dst, contain._type, contain.ts,contain.label,contain.type, $$.report.label,$$.report.name,$$.report.ts ,contain.ts as ts| order by $-.ts desc,$-.dst desc | limit 0, 20

profile 信息，使用 profile query 语句，参考示例 2：

nebula> PROFILE format="row" SHOW TAGS;

Got 2 rows (time spent 2038/2728 us)

Execution Plan

result.csv (9.6 KB)

wanwenjie · 2023 年10 月 24 日 07:46

补充说明，涉及的数据量大概百亿点边

steam · 2023 年10 月 24 日 07:49

o.o 等等其他人吧，从执行计划看来，计算没有下推（我们好多计算下推的优化是在 3.x 里做的），耗时大的都是在 storage 这块。

wanwenjie · 2023 年10 月 24 日 08:03

计算没有下推这个有什么优化方案不，需要我构建索引吗

steam · 2023 年10 月 24 日 08:14

cc @wey 创建索引有用么？

wanwenjie · 2023 年10 月 25 日 06:05

请问还有没有比较可行的优化方案不

ianhe · 2023 年10 月 26 日 10:20

感觉索引对这种情况没有任何帮助，索引最大的帮助是在定位数据上，比如 match (n:person) where n.person.name=='姚明' return n ，而 go from 可以直接通过 vertex 的 id 定位点，就完全不需要索引。

建议升级一下数据库版本，另外大数据量的在集群之间的网络传输也是需要考虑到的一个问题。

wanwenjie · 2023 年10 月 26 日 10:40

升级到哪个版本可以解决问题呢，而且是在生产环境经过验证的，v3.6.0是否可以

ianhe · 2023 年10 月 26 日 10:51

我们生产用的 3.2.0 的，测试开发用的 3.6.0 的，用着都没问题（主要是生产没问题就懒的升级），所以我觉得升级到 3.6.0 最好

wanwenjie · 2023 年10 月 26 日 11:02

好的，非常感谢

system · 2023 年11 月 25 日 11:03

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。