数据库导出问题

提问参考模版:

  • nebula 版本:v.3.1.0
  • 部署方式:单机
  • 安装方式: RPM
  • 是否为线上版本:Y
  • 问题的具体描述:
    我正在调研Nebula Graph的数据导出功能,但是这个功能目前说是只有企业版才能使用,我暂时还没开通企业版,想先看一下Nebula数据导出是什么格式什么内容。能否提供一份导出的json格式的测试数据?

目前只支持导出成csv文件

您好,那您方便提供一份测试数据出的csv文件吗?我想先看看导出来是什么样的。

就是正常的csv文件,逗号分隔
image

不好意思,您发的这个像素太低了,看不清内容。您方便发清晰一点的吗?方便的话,希望您能把点数据和边数据都分享一下,麻烦啦!

目前手头没有现成的,其实就是普通csv文件,不用太纠结

导出的点csv文件内容如下:

_vertexId,col1,col2,col3,col4,col5,col6,col7,col8,col9,col10,col11,col12,col13,col14

1,Tom,tom,10,20,30,40,2021-01-27,2021-01-01T12:10:10,43535232,true,1.0,2.0,10:10:10,POINT(1 2)

导出的边csv文件数据如下:

_srcId,_dstId,_rank,col1,col2,col3,col4,col5,col6,col7,col8,col9,col10,col11,col12,col13,col14

1,2,0,Tom,tom,10,20,30,40,2021-01-27,2021-01-01T12:10:10,43535232,true,1.0,2.0,10:10:10,POINT(1 2)

其中col1,col2等是在nebula中定义的属性名字,他们的数据类型如下:

CREATE TAG IF NOT EXISTS person(col1 string, col2 fixed_string(8), col3 int8, col4 int16, col5 int32, col6 int64, col7 date, col8 datetime, col9 timestamp, col10 bool, col11 double, col12 float, col13 time, col14 geography);
2 个赞

十分感谢!数据内容的格式我现在弄懂了,请问这个数据类型是以什么格式导出的呢?

https://zh.wikipedia.org/wiki/逗号分隔值

CSV,就是你看到的文本格式,行是一行,列间用逗号分割

嗯嗯,数据内容的格式我已经明白了,现在对数据类型以什么格式导出比较困惑,谢谢您!

vertecies.csv (179 Bytes)

因为是文本的,非二进制,所以你看到的也是文件格式本身。如附件,还是你指的格式是什么其他的问题,我没理解。

请教一下您,点表/边表是分别仅有一张,还是多张?(即,不同类型的点是存储在同一个点表里吗)如果不同类型的点存储在同一点表里,不对应的属性是空值吗?(比如person点和software点都存在同一点表的话,software是不具备生日这个属性的,那它在这一属性下面是给空值吗?)

按照 tag, edge type 是单独的文件,每一个类型的这样schema 对应一个文件哈, @nicole 可以纠正我如果有错误,她的例子里给的就是一个 tag,和一个 edge type 的文件的前两行

1 个赞

好的,我明白了,十分感谢!!

1 个赞

一个edge、tag 分别一个csv文件。
数据类型不导出,自己可以通过show create tag xxx来查看存储。

1 个赞

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。

浙ICP备20010487号