使用Nebula Operator部署Nebula时metad就绪探针没通过


Warning Unhealthy 5s kubelet Readiness probe failed: Get “http://10.233.70.98:19559/status”: dial tcp 10.233.70.98:19559: connect: connection refused

进入metad-0查看日志

E20221027 08:58:01.392832 1 FileUtils.cpp:377] Failed to read the directory “/usr/local/nebula/data/meta/nebula” (2): No such file or directory
E20221027 08:58:01.986590 61 ThriftClientManager-inl.h:70] Failed to resolve address for ‘nebula-metad-1.nebula-metad-headless.bsfit-rgas-parent.svc.cluster.local’: Name or service not known (error=-2): Unknown error -2
E20221027 08:58:01.988584 61 ThriftClientManager-inl.h:70] Failed to resolve address for ‘nebula-metad-2.nebula-metad-headless.bsfit-rgas-parent.svc.cluster.local’: Name or service not known (error=-2): Unknown error -2

麻烦取下meta完整的日志文件



metad pod 详细信息


install就是按照文档正常走的,之前成功部署了一次 昨天换了一个命名空间重新部署就是现在的问题
helm install “${NEBULA_CLUSTER_NAME}” nebula-operator/nebula-cluster
–namespace=“${NEBULA_CLUSTER_NAMESPACE}”
–set nebula.version=v3.1.0
–set nameOverride=${NEBULA_CLUSTER_NAME}
–set nebula.storageClassName=“${STORAGE_CLASS_NAME}”

kubectl -n ${NEBULA_CLUSTER_NAMESPACE} get pvc 看下

看你截图服务应该还在启动阶段,需要把metad的data盘大小调整到2G,metad的pvc记得删除掉,这是配置的问题,已经做了修复

现在部署出现这个问题

这是1.3.0版本的字段,前面你部署的是1.2.0下的配置,如果你是测试用最简单的处理是删除掉1.2.0的cluster,然后helm部署1.3.0的cluster

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。