storaged服务无法正常工作

  • nebula 版本:2.6.1
  • 部署方式:单机
  • 安装方式:RPM
  • 是否为线上版本:N
  • 硬件信息
    • 磁盘:2T
    • CPU、内存信息:CPU占用80%;内存一共64G,使用50.42 GB。
  • 问题的具体描述:nebula-storaged(de03025): Exited。如果重启的话,9779端口号在重启时是红色,然后过一会还是Exited,storaged服务无法正常工作。
  • 相关的 meta / storage / graph info 日志信息(尽量使用文本形式方便检索)
    nebula-graphd.ERROR日志:
    E0808 09:35:07.434571 21228 StorageClientBase-inl.h:143] Request to “127.0.0.1”:9779 failed: N6apache6thrift9transport19TTransportExceptionE: AsyncSocketException: connect failed, type = Socket not open, errno = 111 (Connection refused): Connection refused
    E0808 09:35:07.434691 21285 StorageAccessExecutor.h:41] IndexScanExecutor failed, error E_RPC_FAILURE, part 100
    …(ps: 人工手动省略,从part99-part3)
    E0808 09:35:07.435997 21285 StorageAccessExecutor.h:41] IndexScanExecutor failed, error E_RPC_FAILURE, part 2
    E0808 09:35:07.436008 21285 StorageAccessExecutor.h:41] IndexScanExecutor failed, error E_RPC_FAILURE, part 1
    E0808 09:35:07.436023 21285 StorageAccessExecutor.h:124] Storage Error: part: 100, error: E_RPC_FAILURE(-3).
    E0808 09:35:07.436146 21285 QueryInstance.cpp:108] Storage Error: part: 100, error: E_RPC_FAILURE(-3).

能贴一下 storaged 的日志吗?
你贴的 graphd 的日志看起来都是因为 storaged 没有启动起来报的错。所以现在需要定位下,为什么 storaged 启动不起来。

nebula-storaged.INFO (27.9 KB)
日志以上传,请研发大哥帮忙看看,非常感谢。

传错了?这貌似是 schema。


那应该传哪一个呢?

storaged-stderr.log 和 nebula-storaged.INFO(你先前传的应该不对(你先前传的是 27.9KB,图中的是 1011KB),虽然不知道为啥也叫这个名字。)

nebula-storaged.INFO (1010.9 KB)
storaged-stderr.log (92.5 KB)
大哥再帮忙看看呢,谢谢。

看起来有 Too many open files 问题,可以试试:

  1. 检查硬盘空间 df -h
  2. 检查日志目录 /usr/local/nebula/logs/
  3. 修改允许打开的最大文件数 ulimit -n 65536
1 个赞

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。