NebulaGraph in 2019:It's Worth the Effort

Nebula-in-2019

一分钟 2019

这年,是 21 世纪第 2 个 10 年的最后 1 年,也是 NebulaGraph 诞生年,在 2019 年 5 月,我们开源了,和国内外的图数据库爱好者们分享了我们对图数据库的想法,有了自己的图数据库社区,NebulaGraph 团队也由最开始的 4 人团队发展到了现在 30 人的规模,在社区和团队的努力下,NebulaGraph 经历了从 0 到 1 的过程,从 alpha 到 v1.0.0-rc2 我们一直在变得更好。

硬核 2019

有人问:为什么要走开源路线

作为一个企业级产品,NebulaGraph 一开始就选择了走开源路线是很多企业不会走的路,这是我们的原因。

graph-database-growing-trending

DB-Engines 告诉我们,开源数据库增长得快,考虑到数据库漫长的历史,开源数据库才是新出现的 DB 的主流方式。所以对于 NebulaGraph 来说,采用开源这条路是非常正常的。

分布式图数据库是一个全新的技术领域,采用开源的方式,能够更加容易让这个新技术渗透到潜在的客户,更快建立起图数据库的生态环境,开源大幅降低爱好者和客户的试用和获取成本,可以更快的迭代和完善产品。此外,开源项目没有国界,国际化发展可以更容易。

又有人问:为何要自研图数据库

graph-database-growing-trending

由于社交网络、支付网络的兴起,网络(图)的基础设施得到了极大的刺激和发展。但是即使到目前为止,市面上并没有很好的图数据库产品。特别是在 OLTP 这块,主要产品的表现其实都不够好,是不能支撑 5G 时代的大数据量访问的。

还有人问:你们的数据库又有什么亮点,为何采用存储、计算分离的方式

存储计算分离是个很热的话题。我们将存储模块和 Query Engine 层分开主要有以下考虑。

  1. 成本的原因。存储和计算对计算机资源要求不一样,存储依赖 I/O,计算对 CPU 和内存的要求更高,业务在不同的应用或者发展时期,需要不同的存储空间和计算能力配比,存储和计算的耦合会使得机器的选型会比较复杂,存储计算分离的架构,使得 storage 的 scale out/in 更容易。
  2. 存储层抽象出来可以给计算带来新的选择,比如对接 Pregel,Spark GraphX 这些计算引擎。通常来说,图计算对于存储的要求是吞吐量优先的,而在线查询是时延优先的。通过把存储层分离出来,不管是开发(做 QoS )还是运维(单独集群部署)的时候,都会更容易一些。
  3. 在云计算场景下,能实现真正的弹性计算。

有人说:开源六个多月,你们产品进展一如初衷吗?

这是 NebulaGraph 2019 取得产品成绩,我们发布了 4 个版本,从零开始,到现在支持 Index、Spark 等社区伙伴密切关注的功能点。

产品发布线:

  • 2019.05 alpha:分布式、真正高可用性的开源图数据库 NebulaGraph 亮相
  • 2019.08 beta
    • 快速编译
    • 操作简单、易部署的 NebulaGraph 集群
    • 在一致性协议 raft 中加入了 learner 角色
  • 2019.11
    • v1.0.0-rc1:生态不断完善,可直接导入 csv 数据
    • v1.0.0-rc2:多种语言客户端

没有人问:2019 年,NebulaGraph 社区做了什么

这是我们的答案:

  • 这一年我们是开源企业,从五月份开始,NebulaGraph 上了 2 次 GitHub Trending,获得了 1,610 个 star、252 个 Fork 和 726 个 Commit(截止到 2019.12.17)。
  • 这一年我们是好的合作伙伴,从 5 月开始,我们和 20+ 国内大厂一块实践、优化 NebulaGraph,将这些 PoC 进行落地上线,未来的一年我们也会同其他的图数据库爱好者详细分享这一年的实践心得。
  • 这一年我们是技术博客主,从六月份开始,我们活跃在各大技术社区、论坛分享我们对图数据库和 NebulaGraph 的思考,在知乎、开源中国等地方我们分享了 40+ 篇文章,包括了 NebulaGraph 架构系列及 Nebula 模块设计实践等内容,和 80,000 + 读者交流了图数据库技术。
  • 这一年我们是 Vloger,从十一月开始,200+ Youtube、Bilibili 用户通过我们的视频开启了他们的图数据库之旅。
  • 这一年我们是参会者,从十月开始,我们出现在了 QCon、COSCon 等国内顶级技术峰会,并分享了一个《大规模分布式图数据库设计思考和实践》的主题演讲,和数百名图爱好者进行了线下交流。
  • 这一年我们也是主办方,从七月开始,nMeetup(Nebula 的线下沙龙)在北上杭成功举办,100+ 的社区小伙伴在会上和我们交流技术。
  • 这一年我们也是采访对象,36kr、开源社对 NebulaGraph 技术团队进行了报道。
  • 这一年,我们是 a slow walker, but never walk back.

未来可期 2020

这是 NebulaGraph 的 2020 年目标:

  • 产品
    • 正式 1.0 GA
    • 在超过 100 个场景落地
    • NebulaGraph 2.0
      • 兼容 OpenCypher,支持优化器
      • 支持事务与多种 OLAP 框架
    • 支持图形化界面,支持 SaaS 部署
  • 社区
    • 10+ 场线上直播 & 线上问答
    • 50+ 场线下交流

这是 NebulaGraph 的 2020 目标,但不止是这些,在未来的一年,我们会更多倾听社区小伙伴的声音,和你们一块努力建设美好的图数据世界。

It’s Worth the Effort,我们只要坚持做正确的事情,分享会带来连锁反应,社区会慢慢给我们反馈,感谢 2019 和我们相伴成长的你,我们 2020 继续共同前行。

星云·小剧场

为什么给图数据库取名 Nebula ?

Nebula 是星云的意思,很大嘛,也是漫威宇宙里面漂亮的星云小姐姐。对了,Nebula的发音是:[ˈnɛbjələ]。

nebula

The Sombrero Galaxy in Infrared – 红外线下的草帽星系

这个漂浮的环有星系那么大。事实上,它是一个星系——或者至少是其中一个的一部分:上镜的草帽星系,是邻近的室女座星系团中最大的星系之一。草帽星系,也被称为 M104,跨度约 5 万光年,距离地球 2800 万光年。在室女座方向可以用小型望远镜看到 M104。

资料来源 | Robert Nemiroff (MTU) & Jerry Bonnell (UMCP), Phillip Newman (NASA);
图片来源 | Astronomy Picture of the Day | 2019 January 1


这是一个从原来 https://nebula-graph.com.cn/posts/nebula-graph-in-2019/ 中分离出来的主题