社区发现算法结果问题

  • nebula 版本:2.5.0
  • 部署方式(分布式 / 单机 / Docker / DBaaS):单机
  • 是否为线上版本: N

1、点类型Person数量为6949,Person与Person之间关系数量大概有10万,现将所有Person点ID获取到后,对每个点进行1到2层廓线,将所有结果合并后做社区发现计算,计算结果 | _id | louvain | 只有29个
问题:这个结果是社区发现团伙个数么,那怎么获取每个点的社区ID呢?

感谢反馈,你用的nebula-algorithm 中louvain的输出结果中只输出了最终的社区编号,最终输出了29个社区,所以你看到结果count只有29. 这个结果是有问题的,在输出的时候应该把社区中节点id都一起输出。

我刚发布了最新的SNAPSHOT版本,你可以把使用的版本号改成2.5-SNAPSHOT,是兼容2.5.0的nebula服务的。最新的结果输出是所有节点id以及每个节点所属的社区id。 也可以看这个pr https://github.com/vesoft-inc/nebula-spark-utils/pull/165

1 个赞

好的,谢谢

你好,我修改版本使用maven更新提示获取不到:
Cannot resolve com.vesoft:nebula-algorithm:2.5-SNAPSHOT
使用2.5.0可以获取到资源

论坛里有很多类似的问题,你可以搜一下,这个maven的配置有关。 SNAPSHOT 不在中央仓库。