全文索引环境如何搭建

https://docs.nebula-graph.com.cn/2.0.1/4.deployment-and-installation/6.deploy-text-based-index/2.deploy-es/
按照文档做了,但是不知道如何验证

https://docs.nebula-graph.com.cn/2.0.1/4.deployment-and-installation/6.deploy-text-based-index/3.deploy-listener/
安装文档做了 ,文档只把IP改了,但是不清楚配置项是啥意思。里面的端口是编者按照自己的电脑配置写的,还是默认就是这样的呢?

强烈建议把全文索引的文档补齐,这个也是2.0的一个亮点啊

最后有一个疑问,我看到文档是这样写的

全文索引的数据是异步写入Elasticsearch集群的,通过Raft listener(简称listener)这个独立进程,从Storage服务获取数据,然后将它们写入Elasticsearch集群。

那这样数据是不是就会冗余了呢,比如1T的的数据,可能就要2-3T来存储。nebula在全文索引里主要起了什么作用呢?

很感谢你的反馈,手册中的描述我们稍后来改进一下,比如配置中的ip:port和命令中的ip:port从哪里来,代表什么等等。
另外,数据冗余的问题是存在的,确实是nebula自己存了一份数据,es也存了一份数据。针对这个问题,我们正在做优化,es中只存储用户需要的数据,降低数据冗余。
目前,nebula集成外部全文引擎(ES)的目的严格来说并不是支持全文索引功能,其仅仅是为了解决nebula自身索引对字符串模糊查询效率慢的问题。因为nebula中无论是data还是index,其存储结构并不适合针对文本的模糊查询或正则查询。

1赞

@lzy 这里有个文档的优化点呢

1赞

哪里,我还没看懂呢。。。

https://docs.nebula-graph.com.cn/2.0/4.deployment-and-installation/6.deploy-text-based-index/3.deploy-listener/
第一节 第一段

1赞

浙ICP备20010487号