图空间创建时,数据分片数量有什么影响,会影响性能吗?

我的版本是3.0.1,部署的集群。
官方文档建议分片数量是硬盘数量的5倍,这个数量的设置会影响性能吗?

会的

1 个赞

从我的理解来看,分片数量要结合机器性能和机器数量来考虑,影响的主要是存储端拿数据的性能。nebula的数据是根据分片划分来存储的,而分片可以存储在不同的机器上,所以机器越多,每个机器上的分片越少,单个机器上拿数据的延迟就越少,当然,出现网络问题的概率也越高,不过大部分情况下不用考虑这个;其次,在每个机器上拿数据时,可以并发的拿每个分片的数据,所以如果一个机器上分片的数量恰好等于cpu的数量,理论上来说,这些分片可以同时获取,拿数据的时间约等于遍历一个分区的时间。 :thinking:
但是如果机器数量有限,机器核心也有限,多分区和少分区的性能估计差不多,甚至会因为分区增多,造成raft group增多,使得网络压力变大。因为每个raft不是独立的,他们共享pool,一个机器上分区越多,越容易出现排队。这个不确定新版本有没有改 :partying_face:

2 个赞

谢谢您的解答

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。

浙ICP备20010487号