3.4.1版本BR集群恢复异常AsyncSocketException: connect failed, type = Socket not open, errno = 111 (Connection refused)

集群环境 单 space 备份正常,但是还原异常
start meta service by agent failed

备份正常

但是还原时报错


bbuzhid不知道是什么问题导致的

storage 的错误日志为:
Log line format: [IWEF]yyyymmdd hh:mm:ss.uuuuuu threadid file:line] msg
E20230526 11:48:20.317646 532976 MetaClient.cpp:772] Send request to “192.168.83.92”:9559, exceed retry limit
E20230526 11:48:20.317970 532976 MetaClient.cpp:773] RpcResponse exception: apache::thrift::transport::TTransportException: Failed to write to remote endpoint. Wrote 0 bytes. AsyncSocketException: AsyncSocketException: connect failed, type = Socket not open, errno = 111 (Connection refused)
E20230526 11:48:20.318109 532927 MetaClient.cpp:112] Heartbeat failed, status:RPC failure in MetaClient: apache::thrift::transport::TTransportException: Failed to write to remote endpoint. Wrote 0 bytes. AsyncSocketException: AsyncSocketException: connect failed, type = Socket not open, errno = 111 (Connection refused)
E20230526 11:48:20.318192 532927 MetaClient.cpp:143] Connect to the MetaServer Failed
E20230526 11:48:20.318233 532927 StorageServer.cpp:231] waitForMetadReady error!
E20230526 11:48:20.318261 532927 StorageDaemon.cpp:180] Storage server start failed

检查了 ulimit -n 是 999999

连不到 meta,能看看 metad 和 meta 所在的 agent 的日志么?

我后来查询出来问题了 问题是由于 我在3台机器上部署了3个meta导致的,当我把两个follower 关闭后 只保留之前的leader节点的 meta服务 我再次备份还原没有问题。

不过,我在想能否把follower节点的数据也备份下来呢,有没有这种方法 我看了文档但是没有找到相关资料。不知道在哪可以找到相关资料或者方法

agent 假设了 host:port 的 host 是一个实体,所以同一个机器上同一类型多个的话,打破了这个假设,一个方法是给不同的 ip / host bind 给不同的 metad