LOOKUP和MATCH

Gavingx · 2021 年2 月 2 日 01:31

tom-chensf · 2021 年2 月 2 日 02:27

你用的是2.0什么版本？

min.wu · 2021 年2 月 2 日 02:30

explain 一下呢？

Gavingx · 2021 年2 月 2 日 02:52

不太懂你指的版本是什么意思，是指哪个分支吗？分支是master分支。我是docker-compose按照https://github.com/vesoft-inc/nebula-docker-compose里面的说明部署的

Gavingx · 2021 年2 月 2 日 03:13

yee · 2021 年2 月 2 日 03:17

按道理讲是不应该出现这种情况，因为 LOOKUP 和 MATCH 底层都是使用的相同的接口去查询的索引。看执行计划，IndexScan 的查找索引的方式也是一样。

你能否用 nebula-console 再验证一下呢？如果真的还是这种情况，就需要 @bright-starry-sky 帮忙再仔细分析一下了。

Gavingx · 2021 年2 月 2 日 03:23

我也是觉得很奇怪。

yee · 2021 年2 月 2 日 03:27

你可以用如下两句看看 indexscan 上来的数据是否一致：

> PROFILE LOOKUP ingredients WHERE ingredients.name == "xxx" YIELD ingredients.name
> PROFILE MATCH (v:ingredients) WHERE v.name=="xxx" RETURN v.name

Gavingx · 2021 年2 月 2 日 03:37

是一样的，但是奇怪的是，输出就会有重复的。

yee · 2021 年2 月 2 日 03:45

看样子 IndexScan 返回的结果是重复的，这个还需要 @bright-starry-sky 帮忙分析一下为啥同一份数据有两份索引记录？

MATCH 不重复的一个原因是对相同的 Vertex ID 有去重的操作（Dedup 算子）, LOOKUP 是不去重的。

bright-starry-sky · 2021 年2 月 2 日 03:50

LOOKUP 也有dedup 去重的算子，这是什么时候的nightly-build?

bright-starry-sky · 2021 年2 月 2 日 03:52

这个环境部署的是几个storaged？

Gavingx · 2021 年2 月 2 日 03:59

你是指镜像的版本吗？

Gavingx · 2021 年2 月 2 日 03:59

一台机器，3个storaged

bright-starry-sky · 2021 年2 月 2 日 04:11

猜测是这个vertex同时存在于两个storaged的leader part中，但不知道是什么原因导致了这个问题。先尝试验证一下吧，先删除这个vertex，然后重新insert一下，再查询试试看。

bright-starry-sky · 2021 年2 月 2 日 04:15

1， delete vertex
2, lookup —> 期待没有结果
3，insert vertex
4， lookup —> 期待一条结果

Gavingx · 2021 年2 月 2 日 05:36

根据上面的语句删除了id之后，LOOKUP只能查到1个了，但是我在图探索的时候，输入对应的id，却显示不存在对应的id

bright-starry-sky · 2021 年2 月 2 日 05:46

这样的话，之前的判断是正确的，这个vertex被写到了不应该的storaged part中，另一个正确的part可以正常删除vertex，但这个错误的无法删除，导致查询出了冗余数据。

Gavingx · 2021 年2 月 2 日 05:49

但是为什么图查询的时候查不到对应part的id呢？ nebula没有一套机制是会在不同的storaged part中检查冲突的吗？而且也看不到导入的数据，数据出没出问题我们都没法核对。。

Gavingx · 2021 年2 月 2 日 05:56

而且如果出现了这样的问题，为什么MATCH和LOOKUP 的结果不一样。照上面所说，LOOKUP和MATCH应该是类似的一套检索机制才对，但是出来的结果不一样。如果有了MATCH，为什么要有LOOKUP这个功能，不是有些重复了吗？