graphd监控指标存在已删除的space指标,因space名称不符合utf-8版本格式不正确导致nebula-stats-export服务无法正常启动

  • nebula 版本:3.2.1
  • 部署方式:分布式
  • 安装方式:RPM
  • 是否上生产环境:Y
  • 硬件信息
    • 磁盘( 推荐使用 SSD)
    • CPU、内存信息
  • 问题的具体描述

问题描述:graphd监控指标存在已删除的space指标,因space名称不符合utf-8版本格式不正确导致nebula-stats-export服务无法正常启动

问题截图:
graphd异常存在监控指标

以上截图中的space早已不存在

nebula-stats-export 异常启动日志

报错路径:exporter.go调用 prometheus.MustNewConstMetric方法

		ch <- prometheus.MustNewConstMetric(
			prometheus.NewDesc(
				metricName,
				"",
				labels,
				nil,
			),
			prometheus.GaugeValue,
			v,
			labelValues...,
		)

您好,请问使用的stats-exporter版本是多少

使用的是这个版本 nebula-dashboard-3.1.0.x86_64.tar.gz

看起来像是space的字符问题,这样的话,不管space有没有删除,stas-exporter启动都会有问题,可以把graph的enable_space_level_metrics配置关了试试

关了监控是不是得服务重启才能生效尼?

另外为啥会有这种缓存一致性问题尼?这个有在nebula graph哪个版本有修复吗?

是的,更改配置后要重启才能生效

可能是因为有的指标计算的是过去10分钟的值,所以就会再保留一段时间,感觉不属于一致性问题

目前看现象是这几个异常指标项一直都存在,并不会过期。文档上也没有提供可以删除某些监控指标项的命令 :joy:

是的,目前不支持删除部分指标,可以重启服务试试,或者把enable_space_level_metrics配置关了

1 个赞

好吧,感谢大佬