图算法获取底层数据方式

linmm · 2024 年5 月 31 日 05:31

nebula 版本：3.6.0
部署方式：分布式
安装方式：RPM
是否上生产环境：Y
硬件信息
- 磁盘 SSD
- CPU、内存信息 64c 256g

想确认下，百亿规模下，跑图算法是否会对当前图集群的查询有影响
图计算读取数据，是通过底层直接文件获取，还是也是跟查询一样，通过接口获取？

另外，是否支持cypher定义图计算逻辑，有示例吗

MuYi-方扬 · 2024 年5 月 31 日 06:43

是通过底层的查询接口获取的。会对当前集群有影响。

通过 cypher 自定义图计算逻辑要看是多复杂的，不支持 procedure，但是如果你的逻辑不是很复杂的话，可能几条语句可以解决

linmm · 2024 年5 月 31 日 06:48

1 这种影响有多大呢，会导致oom吗，或者阻塞查询，因为当前使用过程中如果遇到类似返回超大数据量，是会导致内存升高，然后graph被kill
2 不会很复杂，类似
match (a)-[r1]-(b:B)-[r2]-(c:C)
where “C” in labels(c) or “D” in labels(c)
with a,count(distinct c) as cnt
where cnt>2 return a
这种简单的过滤或者聚合查询，但是要算全图，通过图算法怎么实现呢

system · 2024 年6 月 30 日 06:49

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。