COUNT() 和COUNT(DISTINCT) 性能耗时问题

用户购买的常见:
用户TAG(user)
商品TAG(prod)
关系:buy
假如。A用户2021-01-01 购买 c商品。 则存在rank为20210101 边
存储的数据是用户每天对商品的购买关系。一个人对一个商品每天只有一条线。

下面的查询是按天统计消费的人:一个使用DISTINCT 一个未使用DISTINCT

MATCH (u:user)-[b:buy]->(p:pord) RETURN rank(b),COUNT(m);

MATCH (u:user)-[b:buy]->(p:pord) RETURN rank(b),COUNT(DISTINCT m);

想问一下。使用图数据库DISTINCT 是不是有什么优势?底层有哪些优化?数据量大时加入DISTINCT是不是耗时更多

count distinct会慢一点。如果你对重复数据没要求,不需要distinct。

该主题在最后一个回复创建后30天后自动关闭。不再允许新的回复。