图算法获取底层数据方式

  • nebula 版本:3.6.0
  • 部署方式:分布式
  • 安装方式:RPM
  • 是否上生产环境:Y
  • 硬件信息
    • 磁盘 SSD
    • CPU、内存信息 64c 256g

想确认下,百亿规模下,跑图算法是否会对当前图集群的查询有影响
图计算读取数据,是通过底层直接文件获取,还是也是跟查询一样,通过接口获取?

另外,是否支持cypher定义图计算逻辑,有示例吗

是通过底层的查询接口获取的。会对当前集群有影响。

通过 cypher 自定义图计算逻辑要看是多复杂的,不支持 procedure,但是如果你的逻辑不是很复杂的话,可能几条语句可以解决

1 这种影响有多大呢,会导致oom吗,或者阻塞查询,因为当前使用过程中如果遇到类似返回超大数据量,是会导致内存升高,然后graph被kill
2 不会很复杂,类似
match (a)-[r1]-(b:B)-[r2]-(c:C)
where “C” in labels(c) or “D” in labels(c)
with a,count(distinct c) as cnt
where cnt>2 return a
这种简单的过滤或者聚合查询,但是要算全图,通过图算法怎么实现呢