nebula-stats服务启动失败

我只改了ip,没有手动编辑别的内容

可以换成这个格式的配置试试?为本地测了下是没问题的

clusters:
  - name: nebula
    instances:
      - name: metad0
        endpointIP: 10.62.0.52
        endpointPort: 19559
        componentType: metad

好像有人建议用“strings.ToValidUTF8来解决:
“Yea, that seems like something we should sanitize between the kernel and client_golang. We could use strings.ToValidUTF8 to wrap the label values.”

试了,也不行,同样的报错

看来不是配置方面的问题,可以贴下你使用的nebula版本吗,还有storaged的stats → 10.62.0.244:19779/stats

版本:nebula-graph-3.1.0.el7.x86_64.rpm
dashboard版本:nebula-dashboard-1.1.1.x86_64.tar.gz

奇怪的是,这个版本我部署了两套环境(仿真和生产)。生产环境的没问题,这个问题只在仿真环境存在。

可以提供一下storage endportIP: endpointPort/stats的数据吗 类似 10.62.0.244:19779/stats 我怀疑是exporter自动打的一些label值有问题

storage_stat.txt (21.1 KB)

stats是正常的,可以升级下exporter看看,exporter目前是向下兼容的,可以直接用最新版本,nebula-stats-exporter-linux-amd64-v3.1.0

好,我试试

也不行,同样的报错

graphd的stat好像有问题。但是我看乱码的那些space ID,都不是我们添加的space。
graphd_stat.txt (66.6 KB)

把Graphd上的”–enable_space_level_metrics“ 设置为false,stat-exporter就可以启动了; 之前是设置为true。
这是bug吧?

了解,space后面跟的应该是space_name,看起来是字符集问题导致的,你可以先把graphd的config --enable_space_level_metrics 设为false,这样graphd就不会暴露space级别的指标,应该能暂时解决

嗯嗯,是的,可以提供下集群现有的space吗,可以请 @jievince 看看

嗯,我现在就是这么干的。
字符集的问题的话,是要在graphd上设置吗?我看你们这些服务,默认的字符集都是utf8吧?

[root@10-62-0-227 ~]# to_nebula_console

Welcome to Nebula Graph!

(root@nebula) [(none)]> show spaces;
±--------------------------------------------+
| Name |
±--------------------------------------------+
| “sp_stage_10219769125f453ebcb6d62a95503179” |
| “sp_stage_525355fd4b554ab3bcc0f8d98db7d923” |
| “sp_stage_7dc8308b01444cf896294ab8742fa041” |
| “sp_stage_e55bbadeb573474087a21bfd8763ed10” |
| “sp_stage_fd917a43553e479698c9b4aed8590e22” |
±--------------------------------------------+
Got 5 rows (time spent 698/1062 us)

Mon, 29 Aug 2022 15:33:25 CST

执行下SHOW CHARSET 可以看当前字符集

image