集群部署方案选择

提问参考模版:

  • nebula 版本:3.4.0
  • 部署方式: 分布式
  • 安装方式:RPM
  • 是否上生产环境:Y

原有6台物理机支撑nebula集群,6个storaged节点,6个graphd节点,3个metad节点,目前CPU已达瓶颈,计划扩容增加6台物理机。有两个扩容方案:

  • 新的物理机各部署1个storaged和1个graphd,整体架构为 12个storaged节点,12个graphd节点。
  • 新的物理机仅部署graphd,原有物理机停止graphd服务,整体架构为 6个storaged节点,6个graphd节点,storaged和graphd分离状态。

方案一相当于每个物理机上graphd和storaged各有一个,所以需要进行数据均衡(数据均衡成本很高,有失败的风险)
方案二架构相当于一半物理机只提供storaged服务,一半提供graphd服务

请教一下两个方案哪种更好些?

hi ~ 人工顶一下

@wey @kqzh 求助一下~

CPU 占用主要是 graphd 么?是的话,如果存储 workload 没到瓶颈,可以先仅部署 graphd。

另外,还可以用 3.4.0 引入的 memtracker 对混合部署进程试着做一些内存限制,降低混部 graphd 对 storaged 的影响哈,当然,有条件用 cgroup 肯定更好。

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。