找不到cluster.id

nebula 版本:v1-nightly
nebula-console 版本:v1-nightly
部署方式(分布式 / 单机 / Docker / DBaaS):Docker
硬盘:固态硬盘100g
内存:15g
docker-composestorage报错,其他两个没有。
storage报错如下

docker-compose.yaml 官网的,单节点部署,每项只保留一个。

引用

version: '3.4'
services:
  metad0:
    image: vesoft/nebula-metad:nightly
    environment:
      USER: root
      TZ:   "${TZ}"
    command:
      - --meta_server_addrs=172.28.1.1:45500
      - --local_ip=172.28.1.1
      - --ws_ip=172.28.1.1
      - --port=45500
      - --data_path=/data/meta
      - --log_dir=/logs
      - --v=0
      - --minloglevel=0
    healthcheck:
      test: ["CMD", "curl", "-f", "http://172.28.1.1:11000/status"]
      interval: 30s
      timeout: 10s
      retries: 3
      start_period: 20s
    ports:
      - "45500:45500"
      - 11000
      - 11002
    volumes:
      - ./data/meta0:/data/meta
      - ./logs/meta0:/logs
    networks:
      nebula-net:
        ipv4_address: 172.28.1.1
    restart: on-failure
    cap_add:
      - SYS_PTRACE
	  
  storaged0:
    image: vesoft/nebula-storaged:nightly
    environment:
      USER: root
      TZ:   "${TZ}"
    command:
      - --meta_server_addrs=172.28.1.1:45500
      - --local_ip=172.28.2.1
      - --ws_ip=172.28.2.1
      - --port=44500
      - --data_path=/data/storage
      - --log_dir=/logs
      - --v=0
      - --minloglevel=0
    depends_on:
      - metad0
    healthcheck:
      test: ["CMD", "curl", "-f", "http://172.28.2.1:12000/status"]
      interval: 30s
      timeout: 10s
      retries: 3
      start_period: 20s
    ports:
      - "44500:44500"
      - 12000
      - 12002
    volumes:
      - ./data/storage0:/data/storage
      - ./logs/storage0:/logs
    networks:
      nebula-net:
        ipv4_address: 172.28.2.1
    restart: on-failure
    cap_add:
      - SYS_PTRACE

  graphd0:
    image: vesoft/nebula-graphd:nightly
    environment:
      USER: root
      TZ:   "${TZ}"
    command:
      - --meta_server_addrs=172.28.1.1:45500
      - --port=3699
      - --ws_ip=172.28.3.1
      - --log_dir=/logs
      - --v=0
      - --minloglevel=0
    depends_on:
      - metad0
    healthcheck:
      test: ["CMD", "curl", "-f", "http://172.28.3.1:13000/status"]
      interval: 30s
      timeout: 10s
      retries: 3
      start_period: 20s
    ports:
      - "3699:3699"
      - 13000
      - 13002
    volumes:
      - ./logs/graph0:/logs
    networks:
      nebula-net:
        ipv4_address: 172.28.3.1
    restart: on-failure
    cap_add:
      - SYS_PTRACE


networks:
  nebula-net:
    ipam:
      driver: default
      config:
        - subnet: 172.28.0.0/16

之前部署一直是好的,这次就出问题了,重启还是一样的问题,storage里面确实没有cluster.id

cluster id 作用
可以尝试删除安装目录下的data目录再重启服务试一试

1 个赞

删除data下文件重启试试

重新部署了一下,现在报错如下:
meta 启动正常:


storage显示启动正常,实际有报错如下:

graph启动正常,实际报错如下:

一直报heartbeat的错误?

是的,重启,删除镜像重启,都是这个错误,感觉meta有接收到storage的心跳呀

完整的log看一下

看了完整的日志,都启动成功了。
用console插入数据的时候报错
执行INSERT VERTEX ve(id) VALUES 1:(123);

docker-compose.yaml配置的storage如下

引用
storaged0:
image: vesoft/nebula-storaged:nightly
environment:
USER: root
TZ: “${TZ}”
command:
- --meta_server_addrs=172.28.1.1:45500
- --local_ip=172.28.2.1
- --ws_ip=172.28.2.1
- --port=44500
- --data_path=/data/storage
- --log_dir=/logs
- --v=0
- --minloglevel=0
depends_on:
- metad0
healthcheck:
test: [“CMD”, “curl”, “-f”, “http://172.28.2.1:12000/status”]
interval: 30s
timeout: 10s
retries: 3
start_period: 20s
ports:
- “44500:44500”
- 12000
- 12002
volumes:
- ./data/storage0:/data/storage
- ./logs/storage0:/logs
networks:
nebula-net:
ipv4_address: 172.28.2.1
restart: on-failure
cap_add:
- SYS_PTRACE

报错如下

172.19.2.1:44500 是不是有问题,哪里来的呢。

谢谢

麻烦看下楼上的问题,谢谢

检查一下graph和storage的网络连通情况

172.28.2.1 通的,172.19.2.1不通。
不是很清楚172.19.2.1这个ip是哪里来的

image

nebula-console 连接的是哪个地址,看你贴出来的配置不可能请求172.19.2.1

console链接的就是我这台服务器的地址,也不是172.19.2.1。
你看之前报错的截图。storaged0启动在172.28.2.1。但是通过console插入节点之后,报错日志显示请求的地址是172.19.2.1。。。

感觉就是graphd 请求到错误的storage的地址了,这个配置是在哪里可以改吗,我的docker-compose.yaml文件是没有问题的

我把data下面的数据删了,重启容器就好了。。。

1 个赞

console可以直接连接graphd容器172.28.31:3699,或者服务器ip:3699, 或者你可以在部署的服务器上检查docker网络是否有172.19这个网段

把data目录删了不就是删数据嘛…若图库作存储数据的服务的话, 不可行吧. 能否定位到是什么原因