使用nebula-console查询出错

xjyou · 2022 年5 月 18 日 03:09

环境：
采用三台虚拟机（在一台物理机上），metad, graphd, storaged节点数都为3.
数据量：几十亿条数据。
机器配置：cpu核数：16核；内存：16G；硬盘:1TB。
nebula-console版本与nebula版本一致：v3.0.x。

使用console客户端查询语句如下：

match (v:entity{type:"1030028", value:"14328875954"}) return v

错误如下：

storage Error: part:5, error: E_RPC_FAILURE(-3)

昨天还能查，今天就这样了。
尝试过的解决办法：
1.重启（无效）
2.换另外的查询语句(同样报错)
3.使用show hosts，能够查询，且集群正常。
4.console没有日志，没有办法定位到问题。

steam · 2022 年5 月 18 日 03:11

你们数据量大概多少，你可以 profile 加在 match 语句那边看看。

xjyou · 2022 年5 月 18 日 03:24

数据量大概是13亿节点，8亿的边。好，profile加在 match的前面么，好

steam · 2022 年5 月 18 日 03:43

然后记得把执行计划贴一下

xjyou · 2022 年5 月 18 日 06:04

很奇怪，上午执行语句

match(v) return v limit 1

时候还报错误，下午就可以执行了。
不过，根据属性查询特定节点还是报错，加上profile也是报错。

profile match (v:entity{type:"1030028", value:"14328875954"}) return v
类似storage Error: part:5, error: E_RPC_FAILURE(-3)

steam · 2022 年5 月 18 日 06:12

show hosts 看下服务状态

xjyou · 2022 年5 月 18 日 06:28

状态是正常的，如第一张图所示

CPWstatic · 2022 年5 月 20 日 03:13

在报错的时候，show host看下状态

xjyou · 2022 年5 月 20 日 06:14

storaged服务也没有挂掉。

xjyou · 2022 年5 月 20 日 06:41

过一会后storaged服务全退出了

steam · 2022 年5 月 20 日 06:48

storage 服务起来到退出，之间没有做任何操作吗？有日志吗？

xjyou · 2022 年5 月 20 日 07:28

起来之后，查了一下match(v) return v limit 1。然后报错类似storage Error: part:5, error: E_RPC_FAILURE(-3)，然后show host，状态正常。过几分钟后，再show host，就全部OFFLINE了。
有新增的ERROR级别的metad日志。storaged没有ERROR级别的日志。