背景
大数据+AI 时代,图数据库凭借强大的数据关系处理能力,成为各行业的技术焦点。
6 月 28 日, nMeetup 在北京成功举办,5 位 NebulaGraph 社区用户从图数据库架构革新(关系模型重构)、运维提效(故障根因定位)、Graph+AI (GraphRAG)、业务赋能(广告精准营销与数据治理)角度全方位印证:图数据库已成为企业解锁数据关联价值的核心基础设施。
PPT 获取
因部分分享内容仅限线下交流,故本场 nMeetUp 不提供直播回放。
议题回顾
某金融证券公司张潇 :《关系型数据库没有“关系”?论图数据库如何重构人际关系的存储逻辑》
(一)背景痛点
关系型数据库无语义描述能力,无法直观表达关系的强度、类型等属性;3 度以上关联查询需多层 JOIN,性能呈指数级下降,在社交网络分析、金融风控等实时场景难以满足业务需求。
(二)NebulaGraph 解决方案
- 存储重构 :采用属性图模型,将人/物作为点,关系作为边,实现关系的“显示存储”。
- 查询革新 :通过图遍历替代复杂 JOIN,支持复杂关系实时探索(如“ 5 度关键人脉挖掘”)
(三)NebulaGraph 的应用场景
- 社交网络分析
- 合规检测:识别洗钱或黑产团伙(设备/IP/账号关联)
- 人际关系分析:关键节点挖掘(高净值客户识别)
- 金融风控实时
- 反欺诈:闭环交易检测(A→B→C→A 路径分析)
- 知识图谱构建:企业股权穿透(多层持股关系可视化)
- Graph+AI
- GraphRAG:知识图谱增强大模型推理
- Text2GQL:自然语言转查询语句
BOSS 直聘万佳飞 -《基于 NebulaGraph 构建异常调用,实现根因定位》
(一)背景痛点
传统运维面临三大难题,使监控、日志、事件、trace 无法形成合力:
- 数据割裂 :日志、监控、链路数据孤立,缺乏统一视图;
- 人工依赖 :根因定位靠经验,跨团队协作效率低;
- 影响扩散 :故障定界慢,MTTR(平均修复时间)长。
(二)图数据库选型
图数据库选 Neo4j 还是 NebulaGraph?Boss 直聘的选型对比如下。
(三)NebulaGraph 解决方案
- 全域故障定位系统
1. 数据融合
整合链路追踪(Trace)、系统指标(Metrics)、日志(Logs)三大数据源,构建统一的全链路异常拓扑图,发现多个真子图分散出现在图结构中,每个子图都有“风暴中心”。
2. 图算法驱动定位
采用 PageRank 算法动态计算节点故障权重:
- 计算:Rank 值由节点出入度、链路错误数、事件进行加权计算
- 输出:Rank 值最高的 TopN 故障节点(即 “风景眼”)
3. 关联分析
通过图关系划分关联队列(直接故障节点)与非关联队列(间接影响节点),精准缩小排查范围。
- 应用示例
根因:该图描述了由于网络设备 A 端口故障,影响了主机,进而影响了应用 auth-service.
影响:进而链式传递影响了数个应用,风暴眼位 auth-service. 根因位网络设备 A.
(四)业务收益
利用 NebulaGraph 将复杂的业务故障定位问题转化为图计算问题,快速定位故障根因。
- 故障发现阶段 :平均收敛时间 20s
- 故障处理阶段 :平均响应时间 40s
- 故障恢复阶段 :平均响应时间 2min
中科数睿张哲源 - 《大模型与 NebulaGraph 结合的知识库搭建》
(一)背景痛点
中科数睿希望构建高效、智能的知识库系统,实现知识共享,提升组织决策能力和创新能力。但依赖传统 RAG,存在知识碎片化等问题,如:领导想知道某部门本周完成的工作,只能检索部分员工的工作事项。
(二)NebulaGraph 解决方案
NebulaGraph 提出了将图数据库与 RAG 结合的想法,并向 LlamaIndex 提了第一个 PR,将 KG-RAG 转变为 GraphRAG. 通过构建知识图谱,将实体及其关系表示为图结构,在检索阶段利用图遍历获取相关子图,提供更丰富的上下文信息供 LLM 生成答案。
中科数睿基于 NebulaGraph,对大模型进行了微调,实现了企业级问答系统。
- 动态链路规划
- 对 DeepSeek 等大模型做轻量指令微调,加入“反思-预估” prompt:2. 模型先估计问题复杂度 c,再用规则 N=f(C) 决定要展开的思考链(Chain-of-Thought) 长度
- 占位符式调用
训练模型在理到 function_call / 外部 MCP 服务时,以 §FUNC i§ 等占位符输出,并返回参数草稿
阿里妈妈承开(宋铭涛) - 《NebulaGraph 在阿里妈妈营销场景的应用实践》
(一)背景
阿里妈妈营销引擎团队深耕广告领域,依托淘宝和全网海量的用户行为数据,不断完善和构建一套基于阿里大数据,可以支持广告主实时进行投放策略智能洞察分析、定向投放目标用户、优化投放效果的交互式分析系统。
“同款商品”识别因算法误差产生异常点:
- 传统聚类方法置信度低,无法关联商品间隐藏关系;
- 海量商品数据关联分析性能瓶颈突出。
(二)NebulaGraph 解决方案
- 同款商品异常点检测
1. 图模型设计
- 商品作为点
- 同款关系作为边 :商品之间是否为同款,已经对应的 score,后续可以添加图像相似度等信息
- K-hop 子图查询
- 输入:待预测的 pair输出:k-hop 子图(主要关注 1-hop 和 2-hop)和子图节点的 feature
(三)技术实现
- NebulaGraph 在阿里妈妈的架构
- 数据 Bulk-load 方案
利用离线 ODPS 资源构造图数据内部的二进制文件,之后利用图数据库的封装的 RocksDB 的 ingest 函数操作 load 构造的二进制文件,以实现批量大数据导入图数据库。
(四)未来规划
阿里妈妈团队有对 RocksDB 和其他 kv 数据库进行二次开发,未来希望与 NebulaGraph 结合,以 PR 的方式贡献社区。
京东物流李世豪-《NebulaGraph 在京东物流一站式分析平台 UData 的探索与实践》
(一)背景
京东物流作为中国领先的供应链解决方案提供商,每天需要处理海量、多源、异构的业务数据,每月做数总耗时高达百万小时,面临做数耗时长、数据来源多、需求变化快等业务痛点,亟须对海量数据进行高效管理。
(二)数据库选型
图数据库天然适配复杂数据关系场景,拥有活跃的开发者社区,并且 NebulaGraph 提供专属查询语言 nGQL,对比 Mysql, nGQL 简洁高效,极大提升了语句的可维护性,代码量降低 80%,京东物流基于上述原因,选择使用 NebulaGraph.
(二)NebulaGraph 解决方案及业务收益
在 UData(京东物流数据一站式分析平台)落地 NebulaGraph 后,实现了以下业务收益:
- 集群路由与缓存优化
-
引入冷热数据分离策略,高频访问的“热数据”优先缓存,查询延迟降低 60%.
-
通过物化视图预计算相似节点(如用户-资源关联路径),加速报表生成。
- 查询性能提升
-
优化
WHERE
、LIMIT
等子句的执行计划,结合索引减少全图扫描。 -
监控集群状态,动态调整资源分配,避免热点瓶颈。
- 典型场景应用
1. 血缘分析 :快速追溯指标来源,定位数据异常根因。
2. 权限校验 :实时判断用户是否有权访问某资源,响应时间<100ms.
3. 数据成果 :整体查询性能提升 5 倍,复杂血缘分析任务从分钟级降至秒级。
致谢
特别感谢张潇老师、中科数睿、BOSS 直聘、阿里妈妈、京东物流以及 AdventureX、中关村创业大街的大力支持~