使用场景是这样的,我想使用Llama Index从非结构化数据中抽取文本信息构建图谱,但我预先并不知道文本中包含多少实体和关系,如何实现自动化抽取文本信息后将图谱数据写入到nebulaGraph中呢?我看社区给出的相关RAG的教程都是预先定义好nebulaGraph的点和边的schema。
nebulagraph 属于强 schema,因此需要先定义好 schema。
ps:通过非结构化数据抽取出文本信息,我理解,你也需要知道你要抽取出什么才行。而要抽取出的内容,就是 schema 的定义
可以使用llm 抽取出来schema
感谢回答!这对我有些启发,我再想想如何实现~
另外我看官方给出的示例是使用KnowledgeGraphIndex一次性抽取文本中的实体和关系并且得到对应的向量存入到数据库中,但因为我在运行KnowledgeGraphIndex时遇到问题,官方示例无法运行成功,没办法看到实际写入nebula中的存储内容,所以我还想问下:
- nebula可以存储实体和边的向量吗?还是只能存储图,需要结合另外的向量数据库来存储向量?
- 如果我是分步执行:先得到一个知识图谱,再想办法得到实体和关系对应的向量存入到数据库中,nebula有提供单独的接口吗?类似于Neo4jVector.from_existing_graph()的功能
这个问题有人可以帮忙解答吗?谢谢~
社区版不支持存储向量。如果只是存,可以考虑用 string 来替代;但是如果涉及到向量计算,就不行了;
企业版目前向量能力已经基本流程 Ready;