设置权重是否对查询有影响

我每天有8千万个顶点ID,边为这些ID的连接,我为了保留每天的连接,设置了边权重,数据是每天导入,这样一来边的数量为几百亿,这样一来对我的查询是否有影响。

你说的权重是 rank 吗?

是的 就是把每天连接的边给保留起来,比如 A B两点 昨天形成了一条边,今天又形成了一条边,设置权重把昨天和今天的边都给保留起来

这样边最后累积下来会有几百亿条,对后面是否影响很大

:thinking: 我的理解是会造成数据增多,查询起来会有些慢,但是方便找特定情况下的 AB 关系边。

建议定时清理没用的边,因为边多了,一定会导致查找时性能降低的。如,根据点探索时,会查找这个点的出边,无用边多了,会导致性能降低

但这些边不是无用的边,我们后面就打算用两个点同一条边的连接次数来判断是不是在同一个组内,来达到IDMapping的效果,两点同一条边的连接次数太少了我们会把他给过滤掉

奥,明白了。如果两个点之间的边太多,如几十、百万这种级别,那这种就会形成超级节点。导致很多问题,如果两个点之间边数在千这种量级,相对还好。

两个点同一种边的次数达到万级别应该不会,一般都是一天有一条边,偶尔一天有两条边,就算公司保留两年的数据也才只有1000不到的边,我想问的是这样的一个量级的话对后期的查询的影响大不大??

1000条不到的边,影响可控,问题不大的。

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。