使用go from 遍历图，深度为1，查询速度很慢，如何优化

Skyter · 2025 年4 月 30 日 09:26

我们查询的这个点数据大概20亿，边大概130亿，且对应字段做了索引。使用下面go from 查询时候，查询时间经常超过100秒，
go from ‘e7762e2f7e8d287a87a82cccecf78462’ over resolve REVERSELY where $^.ip.label == ‘ip’ and $$.domain.label==‘domain’ yield $^.ip.label,$^.ip.name,$^.ip.service_provider,$^.ip.ASN,$^.ip.cdn_vendor,$^.ip.is_idc,$^.ip.is_cdn,$^.ip.is_proxy,$^.ip.is_malicious,$^.ip.is_targeted,$^.ip.malicious_type,$^.ip.malicious_family,$^.ip.apt_group,$^.ip.ti_tags,$^.ip.malicious_ports, resolve._src, resolve._dst, resolve._dst as dst, resolve._type, resolve.count,resolve.first_seen,resolve.last_seen,resolve.type,resolve.label, $$.domain.label,$$.domain.name,$$.domain.sld,$$.domain.dynamic,$$.domain.is_malicious,$$.domain.is_targeted,$$.domain.malicious_type,$$.domain.malicious_family,$$.domain.apt_group,$$.domain.is_tpd,$$.domain.ti_tags ,(resolve.last_seen + toString(resolve._dst)) as last_seen| order by $-.last_seen desc | limit 0, 10

go from 查询会使用索引吗。我如何去提升查询效率，使用的nebula 3.8集群

MuYi-方扬 · 2025 年5 月 5 日 05:40

怀疑是查询涉及到的边的数量比较多，你可以 count 下。
从某个点出发的查询是不会用到索引的

Skyter · 2025 年5 月 5 日 09:48

确实查询出来的结果应该会有几千上万条，然后再limit 10。这样的话，有没有好的解决方案呢

MuYi-方扬 · 2025 年5 月 5 日 09:50

能否用全局截断的配置？

Skyter · 2025 年5 月 5 日 09:51

result.csv (10.0 KB)
这是某一个查询的执行计划，帮忙分析如何解决查询慢的问题，万分感谢

Skyter · 2025 年5 月 5 日 13:24

我看执行耗时时长的在某个节点，这是为什么呢。其他节点耗时并不高。这是expandall的输出。
{
ver: 0, rows: 262, execTime: 2572us, totalTime: 152482982us
graphExpandAllTime+2: 2519(us)
resp[0]: {
“exec”: “152478125(us)”,
“host”: “10.252.145.52:9779”,
“storage_detail”: {
“FilterNode”: “2009(us)”,
“GetNeighborsNode”: “2920(us)”,
“HashJoinNode”: “2006(us)”,
“RelNode”: “2920(us)”,
“SingleEdgeNode”: “1902(us)”,
“TagNode”: “90(us)”
},
“total”: “152479787(us)”
}
}
以下是getvertices的profile 输出：
{
ver: 0, rows: 258, execTime: 3099us, totalTime: 108640388us
total_rpc: 108639715(us)
resp[2]: {
“exec”: “1316(us)”,
“host”: “10.52.19.76:9779”,
“total”: “61735(us)”
}
resp[1]: {
“exec”: “108636359(us)”,
“host”: “10.252.145.52:9779”,
“total”: “108638256(us)”
}
resp[0]: {
“exec”: “2516(us)”,
“host”: “10.52.19.74:9779”,
“total”: “3115(us)”
}
resp[3]: {
“exec”: “907(us)”,
“host”: “10.52.19.75:9779”,
“total”: “1356(us)”
}
resp[4]: {
“exec”: “1730(us)”,
“host”: “10.52.19.77:9779”,
“total”: “2671(us)”
}
} 所有节点负载并不高

MuYi-方扬 · 2025 年5 月 6 日 05:57

看下网络吧。从 IP 来看，这个异常的节点和其他几个节点不在一个网段里，估计网络延时比较高导致

Skyter · 2025 年5 月 6 日 08:13

[root@nebula01 es-ops]# ping 10.52.19.76
PING 10.52.19.76 (10.52.19.76) 56(84) bytes of data.
64 bytes from 10.52.19.76: icmp_seq=1 ttl=59 time=0.085 ms
64 bytes from 10.52.19.76: icmp_seq=2 ttl=59 time=0.085 ms
从ping上来说和其他节点响应时间几乎一样。另外，麻烦请教下，这个52节点应该是主节点吧，一些监控和console等服务都部署在这个节点上（我自认为是主节点）。nebula查询也会从主节点上通过rpc通信吗。还有个问题需要请教下，我show QUERIES 发现，会有大量running 的insert任务堆积，这个可能原因是什么呢