百度图数据库的技术剖析和应用实践

阅读数:230 2019 年 9 月 14 日 16:52

百度图数据库的技术剖析和应用实践

ArchSummit 深圳 2018 大会上,李玉明讲师做了《百度图数据库的技术剖析和应用实践》主题演讲,主要内容如下。

演讲简介

互联网和信息技术渗透到各行各业生产海量的数据,人们逐渐开始关注数据的内在关联,这在知识图谱、推荐引擎、金融风控、公共安全和智能运维等场景中尤其显得重要。如何在海量的数据中发现有价值的关联信息是一大挑战,于是图数据库技术应运而生,专注于处理关联数据,并在近几年飞速发展。

百度自主研发的原生图数据系统(BGraph),在百度的知识图谱系统中应用和实践多年,支撑数以亿计的实体并支撑数以万计的查询 QPS,用于知识问答、搜索推荐和知识推理等。

本主题主要和大家分享我们图数据库的设计和实践经验,包括原生的图存储和图计算技术,针对图的存储和查询的性能优化,分布式集群技术和高可用技术方案等。

演讲提纲

  1. 为什么需要图数据库
    • 各行业的应用场景,需要分析数据关联获取商业价值
    • SQL 数据库 vs 图数据库
  2. 图数据库的技术挑战
    • 图数据库的技术挑战:局部性差,规模大,分片难等
    • 业界的图数据库以及特点
  3. 图数据库的系统架构
    • 图数据库的核心目标
    • 原生的图存储和计算
    • 支持全文检索的必要性
    • 高可用的分布式集群架构
  4. 应用于实践经验
    • 在百度知识图谱的应用
    • 批量导入 vs 流式写入的权衡
    • 分而治之
    • 性能!性能!
    • 访问控制和系统防御
    • 思考与展望

听众受益

  • 了解图数据库的发展方向和技术挑战
  • 了解知识图谱和企业风控等图数据库的需求
  • 学习和了解分布式系统的架构理念与设计
  • 大规模分布式系统的实践经验

讲师介绍

李玉明

百度云 数据库资深架构师

2008 年中科院硕士毕业后在 IBM 中国研发中心从事数据库 DB2 内核引擎的研发工作。2014 年加入百度,构建了大规模时序数据的分布式存储系统,承载百度运维十亿级指标、日均万亿级数据点的写入存储和查询。当前负责百度云商业图数据库项目,重点关注高性能企业级数据库的系统设计。

百度图数据库的技术剖析和应用实践

百度图数据库的技术剖析和应用实践

百度图数据库的技术剖析和应用实践

百度图数据库的技术剖析和应用实践

百度图数据库的技术剖析和应用实践

百度图数据库的技术剖析和应用实践

百度图数据库的技术剖析和应用实践

百度图数据库的技术剖析和应用实践

百度图数据库的技术剖析和应用实践

百度图数据库的技术剖析和应用实践

完整演讲 PPT 下载链接

https://archsummit.infoq.cn/2018/shenzhen/schedule

评论

发布