北京站 nMeetUp 议题回顾+PPT|互联网行业如何解锁图数据库业务价值?

背景:computer:

大数据+AI 时代,图数据库凭借强大的数据关系处理能力,成为各行业的技术焦点。

6 月 28 日, nMeetup 在北京成功举办,5 位 NebulaGraph 社区用户从图数据库架构革新(关系模型重构)、运维提效(故障根因定位)、Graph+AI (GraphRAG)、业务赋能(广告精准营销与数据治理)角度全方位印证:图数据库已成为企业解锁数据关联价值的核心基础设施。

PPT 获取:link:

因部分分享内容仅限线下交流,故本场 nMeetUp 不提供直播回放。

议题回顾:page_facing_up:

某金融证券公司张潇 :《关系型数据库没有“关系”?论图数据库如何重构人际关系的存储逻辑》

(一)背景痛点

关系型数据库无语义描述能力,无法直观表达关系的强度、类型等属性;3 度以上关联查询需多层 JOIN,性能呈指数级下降,在社交网络分析、金融风控等实时场景难以满足业务需求。

(二)NebulaGraph 解决方案

  • 存储重构 :采用属性图模型,将人/物作为点,关系作为边,实现关系的“显示存储”。
  • 查询革新 :通过图遍历替代复杂 JOIN,支持复杂关系实时探索(如“ 5 度关键人脉挖掘”)

(三)NebulaGraph 的应用场景

  • 社交网络分析
  1. 合规检测:识别洗钱或黑产团伙(设备/IP/账号关联)
  2. 人际关系分析:关键节点挖掘(高净值客户识别)
  • 金融风控实时
  1. 反欺诈:闭环交易检测(A→B→C→A 路径分析)
  2. 知识图谱构建:企业股权穿透(多层持股关系可视化)
  • Graph+AI
  1. GraphRAG:知识图谱增强大模型推理
  2. Text2GQL:自然语言转查询语句

BOSS 直聘万佳飞 -《基于 NebulaGraph 构建异常调用,实现根因定位》

(一)背景痛点

传统运维面临三大难题,使监控、日志、事件、trace 无法形成合力:

  • 数据割裂 :日志、监控、链路数据孤立,缺乏统一视图;
  • 人工依赖 :根因定位靠经验,跨团队协作效率低;
  • 影响扩散 :故障定界慢,MTTR(平均修复时间)长。

(二)图数据库选型

图数据库选 Neo4j 还是 NebulaGraph?Boss 直聘的选型对比如下。

(三)NebulaGraph 解决方案

  • 全域故障定位系统

1. 数据融合

整合链路追踪(Trace)、系统指标(Metrics)、日志(Logs)三大数据源,构建统一的全链路异常拓扑图,发现多个真子图分散出现在图结构中,每个子图都有“风暴中心”。

2. 图算法驱动定位

采用 PageRank 算法动态计算节点故障权重:

  • 计算:Rank 值由节点出入度、链路错误数、事件进行加权计算
  • 输出:Rank 值最高的 TopN 故障节点(即 “风景眼”)

3. 关联分析

通过图关系划分关联队列(直接故障节点)与非关联队列(间接影响节点),精准缩小排查范围。

  • 应用示例

根因:该图描述了由于网络设备 A 端口故障,影响了主机,进而影响了应用 auth-service.

影响:进而链式传递影响了数个应用,风暴眼位 auth-service. 根因位网络设备 A.

(四)业务收益

利用 NebulaGraph 将复杂的业务故障定位问题转化为图计算问题,快速定位故障根因。

  • 故障发现阶段 :平均收敛时间 20s
  • 故障处理阶段 :平均响应时间 40s
  • 故障恢复阶段 :平均响应时间 2min

中科数睿张哲源 - 《大模型与 NebulaGraph 结合的知识库搭建》

(一)背景痛点

中科数睿希望构建高效、智能的知识库系统,实现知识共享,提升组织决策能力和创新能力。但依赖传统 RAG,存在知识碎片化等问题,如:领导想知道某部门本周完成的工作,只能检索部分员工的工作事项。

(二)NebulaGraph 解决方案

NebulaGraph 提出了将图数据库与 RAG 结合的想法,并向 LlamaIndex 提了第一个 PR,将 KG-RAG 转变为 GraphRAG. 通过构建知识图谱,将实体及其关系表示为图结构,在检索阶段利用图遍历获取相关子图,提供更丰富的上下文信息供 LLM 生成答案。

中科数睿基于 NebulaGraph,对大模型进行了微调,实现了企业级问答系统。

  • 动态链路规划
  1. 对 DeepSeek 等大模型做轻量指令微调,加入“反思-预估” prompt:2. 模型先估计问题复杂度 c,再用规则 N=f(C) 决定要展开的思考链(Chain-of-Thought) 长度
  • 占位符式调用

训练模型在理到 function_call / 外部 MCP 服务时,以 §FUNC i§ 等占位符输出,并返回参数草稿

阿里妈妈承开(宋铭涛) - 《NebulaGraph 在阿里妈妈营销场景的应用实践》

(一)背景

阿里妈妈营销引擎团队深耕广告领域,依托淘宝和全网海量的用户行为数据,不断完善和构建一套基于阿里大数据,可以支持广告主实时进行投放策略智能洞察分析、定向投放目标用户、优化投放效果的交互式分析系统。

“同款商品”识别因算法误差产生异常点:

  • 传统聚类方法置信度低,无法关联商品间隐藏关系;
  • 海量商品数据关联分析性能瓶颈突出。

(二)NebulaGraph 解决方案

  • 同款商品异常点检测

1. 图模型设计

  • 商品作为
  • 同款关系作为 :商品之间是否为同款,已经对应的 score,后续可以添加图像相似度等信息
  1. K-hop 子图查询
  • 输入:待预测的 pair输出:k-hop 子图(主要关注 1-hop 和 2-hop)和子图节点的 feature

(三)技术实现

  • NebulaGraph 在阿里妈妈的架构

  • 数据 Bulk-load 方案

利用离线 ODPS 资源构造图数据内部的二进制文件,之后利用图数据库的封装的 RocksDB 的 ingest 函数操作 load 构造的二进制文件,以实现批量大数据导入图数据库。


(四)未来规划

阿里妈妈团队有对 RocksDB 和其他 kv 数据库进行二次开发,未来希望与 NebulaGraph 结合,以 PR 的方式贡献社区。

京东物流李世豪-《NebulaGraph 在京东物流一站式分析平台 UData 的探索与实践》

(一)背景

京东物流作为中国领先的供应链解决方案提供商,每天需要处理海量、多源、异构的业务数据,每月做数总耗时高达百万小时,面临做数耗时长、数据来源多、需求变化快等业务痛点,亟须对海量数据进行高效管理。

(二)数据库选型

图数据库天然适配复杂数据关系场景,拥有活跃的开发者社区,并且 NebulaGraph 提供专属查询语言 nGQL,对比 Mysql, nGQL 简洁高效,极大提升了语句的可维护性,代码量降低 80%,京东物流基于上述原因,选择使用 NebulaGraph.

(二)NebulaGraph 解决方案及业务收益

在 UData(京东物流数据一站式分析平台)落地 NebulaGraph 后,实现了以下业务收益:

  • 集群路由与缓存优化
  1. 引入冷热数据分离策略,高频访问的“热数据”优先缓存,查询延迟降低 60%.

  2. 通过物化视图预计算相似节点(如用户-资源关联路径),加速报表生成。

  • 查询性能提升
  1. 优化 WHERELIMIT 等子句的执行计划,结合索引减少全图扫描。

  2. 监控集群状态,动态调整资源分配,避免热点瓶颈。

  • 典型场景应用

1. 血缘分析 :快速追溯指标来源,定位数据异常根因。

2. 权限校验 :实时判断用户是否有权访问某资源,响应时间<100ms.

3. 数据成果 :整体查询性能提升 5 倍,复杂血缘分析任务从分钟级降至秒级。



致谢:heart:

特别感谢张潇老师、中科数睿、BOSS 直聘、阿里妈妈、京东物流以及 AdventureX、中关村创业大街的大力支持~

1 个赞