COUNT() 和COUNT(DISTINCT) 性能耗时问题

tudou-sunge · 2021 年6 月 17 日 07:45

用户购买的常见：
用户TAG（user）
商品TAG（prod）
关系：buy
假如。A用户2021-01-01 购买 c商品。则存在rank为20210101 边
存储的数据是用户每天对商品的购买关系。一个人对一个商品每天只有一条线。

下面的查询是按天统计消费的人：一个使用DISTINCT 一个未使用DISTINCT

MATCH (u:user)-[b:buy]->(p:pord) RETURN rank(b),COUNT(m);

MATCH (u:user)-[b:buy]->(p:pord) RETURN rank(b),COUNT(DISTINCT m);

想问一下。使用图数据库DISTINCT 是不是有什么优势？底层有哪些优化？数据量大时加入DISTINCT是不是耗时更多

CPWstatic · 2021 年6 月 18 日 03:56

count distinct会慢一点。如果你对重复数据没要求，不需要distinct。

system · 2021 年7 月 18 日 03:56

该主题在最后一个回复创建后30天后自动关闭。不再允许新的回复。