关于nebula 连通图算法问题

我的图里大概有4亿多顶点,1.4亿条边。在使用nebula算法包提供的连通图算法,跑连通图。 设置了maxIter为4,此时跑全库连通图算法跑出来的团伙中的顶点,里边的顶点并不能找到边与之关联,有人遇到过这个问题嘛

  1. nebula-algorithm 以及 nebula-graph的版本是多少?
  2. 贴一段你的结果,我瞅瞅。。
  3. ConnectedComponent 跑出来的结果应该是两列,第一列是顶点ID,第二列是社区ID

而且这些顶点并不能连起来,没有边支撑他们两两关联,但还是被分在了一个连通图里

1: 我们用的nebula版本是 2.6.1,nebula-algorithm版本是2.6.2
跑出来的结果是这样的,但其实1087400507_192333000 这个顶点是不存在的,我不知道是不是 spark集群导致的string2Long ,long2String转换失败? 还是因为边的数量过多导致算法结果出错,有1.4亿条边

vertex_id就是顶点id,connect_group_id就是社区id

顶点不存在

也有可能只存在边,猜测 nebula-algo 是扫的边,nebula 允许边存在而边上的点不存在?

我感觉我的spark没有问题,但是没有按预期的去执行

您可以看下我的这个回复

好的,那等 @caton-hpg 帮忙看看哈

好的 谢谢您的回答

浙ICP备20010487号