2022 年你一定得读的图应用实践案例TOP 5

在前面的《你不能错过的 2022 年产品动态》中我们了解内核和云的年度进展,这些内核的新功能是如何运行在具体的业务场景的呢?2022 年,NebulaGraph 社区一共收到了来自百度爱番番、腾讯音乐、企查查、中科大脑、途家、众安金融、泰康在线、BIGO、智联招聘、58 同城、苏宁、携程金融、智联招聘、青藤云等多家企业的案例分享,内容覆盖了金融、租赁、出行、安全、信息服务等行业的案例实践。他们中有用 NebulaGraph 来处理数据治理问题的,也有用在社交推荐、风控反欺诈上的,从知识图谱到图机器学习,结合多种技术让他们的业务虎虎生威。

案例速览

这里收录了 2022 年社区收到的用户案例分享,简单罗列下:

这里我们选择了社区用户比较喜欢的 TOP 5 案例和大家分析一下。

图的完美应用场景——企查查

企查查是企查查科技有限公司旗下的一款企业信用查询工具,旨在为用户提供快速查询企业工商信息、法院判决信息、关联企业信息、法律诉讼、失信信息、被执行人信息、知识产权信息、公司新闻、企业年报等服务。

为更好地展现企业之间的法律诉讼、风险信息、股权信息、董监高法等信息,他们抽取结构化/非结构化的企业数据构建企业知识图谱为用户提供真实可靠的服务

在文章《NebulaGraph 在企查查的应用》中,企查查团队开篇述说了现有的图数据库不能伴随业务增长,需要一个读写性能良好,分布式的图数据库作支撑。凭借活跃的社区、资料易查、读写性能极佳、查询性能优良 NebulaGraph 通过了企查查团队的调研,完成业务适配开发后在多条业务线上接入 NebulaGraph 应用图技术。

除了将 NebulaGraph 应用到企查查经典业务,例如:寻找任意两个或者多个实体(公司或者人)之间的关系,关系包括不限于董监高法,控股,历史董监高法,历史控股。企查查研发团队还对图系统进行了相关优化,主要集中于数据导入和服务的故障发现。在数据导入方面,他们采用了 hive table -> csv -> nebula server -> importer 的方式进行全量的导入,进而提升性能。在服务故障发现部分,他们对整个系统进行了指标监控,重点检测诸如 nebula_metad_heartbeat_latency_us_avg_60nebula_graphd_num_slow_queries_rate_60 > 60 查询性能指标。

知识图谱搞定智能化——腾讯音乐

近年随着大数据的蓬勃发展,各类 C 端 App 的用户数据激增,各家互联网公司在其下应用中针对用户的数据进行了个性化的推荐。而腾讯音乐为了让他们的搜索更加智能化,采用了知识图谱来实现定制化推荐。

在文章《腾讯音乐知识图谱搜索实践》 中,腾讯音乐的研发人员先是讲述了他们的应用场景:

  • 复杂搜索需求实现,比如:查询周杰伦男女对唱的歌曲;
  • 搜索结果的相关推荐,比如:你搜索周华健,可以通过关联信息推荐出李宗盛;
  • 基于知识计算给出答案,比如:刘德华 90 年代的创作的歌曲。

针对上述应用场景,腾讯音乐在图数据库选型方面侧重了 1 度邻居(跟点直接相连的点)、2 度邻居、共同邻居等查询性能。在选中 NebulaGraph 之后,他们针对业务进行了在线和离线系统开发:

线上图

离线图

最终,采用图数据的腾讯音乐很好地把专家经验智能融入图谱。通过图数据技术实现的知识库,增强了检索、推荐、可视化等功能。

数据安全加固——青藤云

青藤云安全是一家主机安全独角兽公司,当前主要业务重点之一是云原生应用安全,目前主营的是主机万相 / 容器蜂巢产品,累计支持 800 万 Agent。

安全领域一直是技术信息敏感区域,在 NebulaGraph 社区之前有深信服的图应用实践,由于信息敏感当时只是在深圳场 meetup 同大家做了线下交流。这次青藤云通过文稿的方式,在文章《基于图的下一代入侵检测系统》中揭开了安全领域图应用的神秘面纱,抛砖引玉和大家分享了图是如何协助实现入侵检测的。

相比较传统的检测架构,加入图技术的检测原理框架多了关联引擎模块,主要用来实现图关联和溯源。因为在安全领域,一般来说是以安全规则为先,命中既定的安全规则则判断为一种警告行为,需要采取对应的应对措施。而新加入的关联引擎,则能关联起多起告警,综合判断当前攻击是否有效。除了简单叙述了图技术在入侵检测中的实践,文中也简明地科普了图在安全领域相关的海外应用。

金融风控好帮手——携程金融

携程金融自 2017 年 9 月成立,在金融和风控业务中,有多种场景需要对图关系网络进行分析和实时查询,传统关系型数据库难以保证此类场景下的关联性能,且实现复杂性高,离线关联耗时过长,因此对图数据库的需求日益增加。

在文章《百亿节点,毫秒级延迟,携程金融基于 NebulaGraph 的大规模图应用实践》中,携程金融图平台开发人员下先是带大家了解下国内外的主流图数据库,再从图的应用场景切入讲述了相关的图应用,最后落点于携程金融的图平台建设。

同上面的腾讯音乐类似,为了应对各类图应用场景,几经迭代,携程金融的图平台架构包括了离线图、线上图、全量校验等模块,来满足实时检索离线分析数据同步与校验等功能。在文中的内部案例分析中,携程金融的研发人员讲述了他们是如何处理数据血缘、风控、反欺诈等业务问题的

除了详细的业务场景分析、实现方案分享之外,本文还分享了携程金融对图平台进行的相关优化,包括社区用户一直关心的 Java 连接池问题。此外,为了满足实时场景 2 跳查询 P95 15 ms 需求,携程金融采用了写性能换取读性能的方案保障查询速率。

运维也要软硬兼施——苏宁集团

运维知识图谱构建相对于其他领域的知识图谱构建而言,具有天然的优势,网络设备固有的拓扑结构、系统应用的调用关系可以快速的构成软硬件知识图谱中的实体和关系。历史的告警数据蕴含着大量的相关、因果关系,使用因果发现算法,也可以有效的构建告警知识图谱。基于知识图谱上的权重进行路径搜索,可以给出根因的传播路径,便于运维人员快速的做出干预决策。

在文章《苏宁基于 NebulaGraph 构建知识图谱的大规模告警收敛和根因定位实践》中,来自苏宁集团的工程师讲述了他们是如何通过 CMDB、调用链等数据构建软硬件知识图谱,在此基础上通过历史告警数据构建告警知识图谱,并最终应用知识图谱进行告警收敛和根因定位。

架构图

流程图

在具体的实践过程中,苏宁集团的研发人员经历了“基于交叉熵的告警聚类”到“基于 GRANO 算法的根因定位”的时代,最后实现了第三个运维方案“基于运维知识图谱的告警收敛和根因定位”(上图的架构)。为了应对 6k+ 业务线、均值 10w 峰值 20w 告警,苏宁工程师们构建了软硬件知识图谱、CMDB 数据、调用链 / 物理设备网络连接数,并用 NetworkX 对图谱们进行合并,对接上 NebulaGraph 的可视化产品 NebulaGraph Studio,实现了实时查看数据状态。

不只是应对业务,还有运维和代码

上面的 5 篇案例都解决了一个或是多个应用问题,尤其是最后一个案例是苏宁集团的整个业务线的运维治理问题。而下面这篇文章则是携程内部运维工程师贡献的他们针对《信息图谱在携程酒店的应用》 中提到的业务后续的运维和系统优化,不妨也阅读一下或许能 get 新的优化姿势:

除了运维实践之外,2022 年社区用户 Wey 也贡献了 4 篇相关的应用实践,重点是每篇都有源代码——可谓是拿来即用:


谢谢你读完本文 (///▽///)

如果你想查看所有的 NebulaGraph 用户案例,可以关注 NebulaGraph 公众号后发送关键词【案例】即可查看。