ip连接问题

你好 ,在用spark-connector连接时, 有个meta地址 坏了,连不上 ,但其他的ip地址能用,可是一直报错,怎么样能不删这个ip,又能连上呢

:dotted_line_face: 你也不是第一次提问啊,为啥这次分类选错了。如果发帖选择分类不正确(你之前选了博客我给你改回来了)的话是影响审核通过时间的,参考:关于论坛帖子审核和回复时间的说明(最后更新 2022.12.13)

回题,为啥某个 meta ip 挂了,你们不删除这个 ip 信息呢?是给以后它修复了做准备么?

如果生产环境 突然间挂了个IP地址,又没法删除 ,这样的情景

IP 地址无法访问是需要排查具体问题是什么的,然后解决它,看看是不是机器故障了?路由表错了?有防火墙?端口不可用了?等等等等。一方面如果不能变更IP,那这个问题是一定要解决的,无法回避。另一方面,如果出现了类似这种问题,不去解决的话,它可能会扩大化,影响更多的服务。

目前 NebulaGraph 依赖网络连通正常来保证服务可用。网络连通问题跟 NebulaGraph 本身无关。

我还想问下 如果有多个metaIP地址,只填一个地址 也能存进数库,这和填多个地址有啥区别?

metad 是一个 raft group,一般建议要部署三个节点,其中有一个 leader,其它的是 follower,只能从 leader 进行读写。更多内容参考文档:Meta 服务 - NebulaGraph Database 手册

那我想再问下 如果leader坏了,在选举出新的leader,是通过程序自动判断的吧?就是你写进3个ip,一个坏了 也能保障整个程序运行,如果不能保障整个程序运行 就是网络有问题?

选举是 raft 自己做的,用户不用管。出现任何异常还是要从错误信息开始看,要具体排查。

填多个更鲁棒一些。
首先,你说的对,就算只有一个 meta 地址,即使是 follower 也可以通过它获取真正的 leader;
但是,如果该 meta 地址的机器挂了,那就没办法连到集群了。而如果有多个地址,只要多数以上活着就能正常提供服务。

一个 workaround 是可以先在配置中不填这个 ip 试试。但最好还是要排查下那个 ip 为啥不能用,不然再坏一个集群就不可用了。

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。