你可以用snapshot版本的包,这个结果打印是有问题的, 参考下这个帖子哈
新的包打印结果就是
点id,点所属社区id。
你想把社区id里面包含节点数大于20的社区id找出来可以针对结果这样处理:
val statistic = louvain
.select(AlgoConstants.Louvain_RESULT_COL)
.map(row => (row.get(0).toString, 1))
.rdd
.reduceByKey(_ + _)
.filter(kv=> kv._2>20)