北京站 nMeetUp 议题回顾+PPT｜互联网行业如何解锁图数据库业务价值？

飞天小女警 · 2025 年7 月 1 日 07:44

背景

大数据+AI 时代，图数据库凭借强大的数据关系处理能力，成为各行业的技术焦点。

6 月 28 日， nMeetup 在北京成功举办，5 位 NebulaGraph 社区用户从图数据库架构革新（关系模型重构）、运维提效（故障根因定位）、Graph+AI （GraphRAG）、业务赋能（广告精准营销与数据治理）角度全方位印证：图数据库已成为企业解锁数据关联价值的核心基础设施。

PPT 获取

因部分分享内容仅限线下交流，故本场 nMeetUp 不提供直播回放。

议题回顾

某金融证券公司张潇：《关系型数据库没有“关系”？论图数据库如何重构人际关系的存储逻辑》

（一）背景痛点

关系型数据库无语义描述能力，无法直观表达关系的强度、类型等属性；3 度以上关联查询需多层 JOIN，性能呈指数级下降，在社交网络分析、金融风控等实时场景难以满足业务需求。

（二）NebulaGraph 解决方案

存储重构 ：采用属性图模型，将人/物作为点，关系作为边，实现关系的“显示存储”。
查询革新 ：通过图遍历替代复杂 JOIN，支持复杂关系实时探索（如“ 5 度关键人脉挖掘”）

（三）NebulaGraph 的应用场景

社交网络分析

合规检测：识别洗钱或黑产团伙（设备/IP/账号关联）
人际关系分析：关键节点挖掘（高净值客户识别）

金融风控实时

反欺诈：闭环交易检测（A→B→C→A 路径分析）
知识图谱构建：企业股权穿透（多层持股关系可视化）

Graph+AI

GraphRAG：知识图谱增强大模型推理
Text2GQL：自然语言转查询语句

BOSS 直聘万佳飞 -《基于 NebulaGraph 构建异常调用，实现根因定位》

（一）背景痛点

传统运维面临三大难题，使监控、日志、事件、trace 无法形成合力：

数据割裂 ：日志、监控、链路数据孤立，缺乏统一视图；
人工依赖 ：根因定位靠经验，跨团队协作效率低；
影响扩散 ：故障定界慢，MTTR（平均修复时间）长。

（二）图数据库选型

图数据库选 Neo4j 还是 NebulaGraph？Boss 直聘的选型对比如下。

（三）NebulaGraph 解决方案

全域故障定位系统

1. 数据融合

整合链路追踪（Trace）、系统指标（Metrics）、日志（Logs）三大数据源，构建统一的全链路异常拓扑图，发现多个真子图分散出现在图结构中，每个子图都有“风暴中心”。

2. 图算法驱动定位

采用 PageRank 算法动态计算节点故障权重：

计算：Rank 值由节点出入度、链路错误数、事件进行加权计算
输出：Rank 值最高的 TopN 故障节点（即 “风景眼”）

3. 关联分析

通过图关系划分关联队列（直接故障节点）与非关联队列（间接影响节点），精准缩小排查范围。

应用示例

根因：该图描述了由于网络设备 A 端口故障，影响了主机，进而影响了应用 auth-service.

影响：进而链式传递影响了数个应用，风暴眼位 auth-service. 根因位网络设备 A.

（四）业务收益

利用 NebulaGraph 将复杂的业务故障定位问题转化为图计算问题，快速定位故障根因。

故障发现阶段 ：平均收敛时间 20s
故障处理阶段 ：平均响应时间 40s
故障恢复阶段 ：平均响应时间 2min

中科数睿张哲源 - 《大模型与 NebulaGraph 结合的知识库搭建》

（一）背景痛点

中科数睿希望构建高效、智能的知识库系统，实现知识共享，提升组织决策能力和创新能力。但依赖传统 RAG，存在知识碎片化等问题，如：领导想知道某部门本周完成的工作，只能检索部分员工的工作事项。

（二）NebulaGraph 解决方案

NebulaGraph 提出了将图数据库与 RAG 结合的想法，并向 LlamaIndex 提了第一个 PR，将 KG-RAG 转变为 GraphRAG. 通过构建知识图谱，将实体及其关系表示为图结构，在检索阶段利用图遍历获取相关子图，提供更丰富的上下文信息供 LLM 生成答案。

中科数睿基于 NebulaGraph，对大模型进行了微调，实现了企业级问答系统。

动态链路规划

对 DeepSeek 等大模型做轻量指令微调，加入“反思-预估” prompt:2. 模型先估计问题复杂度 c，再用规则 N=f(C) 决定要展开的思考链(Chain-of-Thought) 长度

占位符式调用

训练模型在理到 function_call / 外部 MCP 服务时，以 §FUNC i§ 等占位符输出，并返回参数草稿

阿里妈妈承开（宋铭涛） - 《NebulaGraph 在阿里妈妈营销场景的应用实践》

（一）背景

阿里妈妈营销引擎团队深耕广告领域，依托淘宝和全网海量的用户行为数据，不断完善和构建一套基于阿里大数据，可以支持广告主实时进行投放策略智能洞察分析、定向投放目标用户、优化投放效果的交互式分析系统。

“同款商品”识别因算法误差产生异常点：

传统聚类方法置信度低，无法关联商品间隐藏关系；
海量商品数据关联分析性能瓶颈突出。

（二）NebulaGraph 解决方案

同款商品异常点检测

1. 图模型设计

商品作为点
同款关系作为边：商品之间是否为同款，已经对应的 score，后续可以添加图像相似度等信息

K-hop 子图查询

输入：待预测的 pair输出：k-hop 子图（主要关注 1-hop 和 2-hop）和子图节点的 feature

（三）技术实现

NebulaGraph 在阿里妈妈的架构

数据 Bulk-load 方案

利用离线 ODPS 资源构造图数据内部的二进制文件，之后利用图数据库的封装的 RocksDB 的 ingest 函数操作 load 构造的二进制文件，以实现批量大数据导入图数据库。

（四）未来规划

阿里妈妈团队有对 RocksDB 和其他 kv 数据库进行二次开发，未来希望与 NebulaGraph 结合，以 PR 的方式贡献社区。

京东物流李世豪-《NebulaGraph 在京东物流一站式分析平台 UData 的探索与实践》

（一）背景

京东物流作为中国领先的供应链解决方案提供商，每天需要处理海量、多源、异构的业务数据，每月做数总耗时高达百万小时，面临做数耗时长、数据来源多、需求变化快等业务痛点，亟须对海量数据进行高效管理。

（二）数据库选型

图数据库天然适配复杂数据关系场景，拥有活跃的开发者社区，并且 NebulaGraph 提供专属查询语言 nGQL，对比 Mysql, nGQL 简洁高效，极大提升了语句的可维护性，代码量降低 80%，京东物流基于上述原因，选择使用 NebulaGraph.

（二）NebulaGraph 解决方案及业务收益

在 UData（京东物流数据一站式分析平台）落地 NebulaGraph 后，实现了以下业务收益：

集群路由与缓存优化

引入冷热数据分离策略，高频访问的“热数据”优先缓存，查询延迟降低 60%.
通过物化视图预计算相似节点（如用户-资源关联路径），加速报表生成。

查询性能提升

优化 WHERE 、LIMIT 等子句的执行计划，结合索引减少全图扫描。
监控集群状态，动态调整资源分配，避免热点瓶颈。

典型场景应用

1. 血缘分析 ：快速追溯指标来源，定位数据异常根因。

2. 权限校验 ：实时判断用户是否有权访问某资源，响应时间<100ms.

3. 数据成果 ：整体查询性能提升 5 倍，复杂血缘分析任务从分钟级降至秒级。

致谢

特别感谢张潇老师、中科数睿、BOSS 直聘、阿里妈妈、京东物流以及 AdventureX、中关村创业大街的大力支持～