阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

图数据库赛道兴起,看 NebulaGraph 如何打造差异化!

  • 2022-08-25
    北京
  • 本文字数:2948 字

    阅读完需:约 10 分钟

图数据库赛道兴起,看NebulaGraph如何打造差异化!

5G、物联网、AI 等新兴技术的不断发展,不仅让数据量急剧攀升,同时也使得数据的关联变得复杂化,而传统的关系型数据库往往无法承接这些变化。相比之下,图数据库在处理关联关系上的性能则更具有优势,也能够深挖数据之间的关联性,释放数据的潜在价值。

 

为了深入了解图数据库的发展趋势与落地情况,InfoQ 记者有幸在 2022 ArchSummit全球架构师峰会北京站 上,采访了 NebulaGraph CTO 于新林老师。

 

以下是视频采访的全部内容,为方便读者查看,视频下方也附上了文字内容。

 

00:00 / 00:00
    1.0x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    InfoQ:近年来,我们看到越来越多的公司开始进军图数据库领域,对于厂商自身而言,如何才能打出差异化?

     

    于新林:在考虑差异化之前,我们首先要考虑客户需要什么,我们解决了客户哪方面的问题,然后再考虑如何做好,给客户提供更大的价值。当我们在服务好客户的时候,差异化如何体现呢?

     

    目前来看,我们的图数据库产品 NebulaGraph 的几个关键词是:开源、分布式、OLTP+OLAP、计算存储分离、处理超大规模数据、高性能。对于杭州悦数科技有限公司来说,做好产品,服务好客户就是我们打出的差异化:NebulaGraph 稳定性好,原生分布式,并且可以支持大规模海量数据。

     

    另外,作为一家坚持开源的图数据库厂商,我们一直保持服务好用户的初心,给客户提供更优质的服务。在前期的 POC 阶段,我们可以跟客户一起理清他们的数据模型,帮助客户写一些数据上的语句,让他们更好地使用图数据库。上线以后,我们会快速地响应客户的问题以及持续地给客户提供升级、运维的一整套服务。

     

    InfoQ:对于企业而言,又该如何结合自身业务选择最适合自己的图数据库产品?或者说,选择一款图数据库需要从哪几个维度去考虑?

     

    于新林:我感觉企业要想选图数据库主要从以下几个方面出发:

     

    首先,要看业务的场景,如果你的业务是偏线上实时交易的,那就需要选择 OLTP 能力比较强的图数据库,如果你的场景是偏图计算和分析的,可能要选一款偏 OLAP 的,亦或者两种场景都需要,那就选择混合的;

     

    其次,要考虑图数据库的稳定性,如果不稳,其实业务都无法开展。另外就是性能因素,这款图数据库产品的并发情况、响应时间等等;此外,由于图数据库中有大量数据是从外部导入的,因此,也需要考虑海量数据的导入性能和时间是否满足业务需求。最后,当我们选择图数据库厂商时,也需要考虑服务持久化的问题。

     

    InfoQ:据 Gartner 预言,图数据库很快约占到数据库领域 10%市场。从您的观察来看,图技术的落地情况达到了怎样的阶段?

     

    于新林:图技术是一个快速发展的方向,是否占 10%我没法准确感受。我能感受到的是:起风了。从目前市场来看,客户对图相关接受度越来越高,购买、使用图数据库的客户越来越多,这基于两个方面:一方面得益于技术的成熟,另一方面是客户的认知和对图的需求逐渐攀升。图技术相关领域其实蛮广泛的,图计算、分析、存储、渲染、展示、图+AI 以及各种各样基于图的业务应用,如社交、防疫、供应链、知识图谱等。我们最近也发布了几个联合方案:金融反欺诈、智能投研平台、智能运维,通过这些方案,让我们能更好地配合合作伙伴的业务,推动生态的健康发展。

     

    InfoQ:与传统关系型数据库相比,图数据库虽然可以从海量数据中挖掘数据的关联,但据了解,目前市面上的图数据库产品还很难满足快速实时导入数据。能否请您介绍下,目前图数据还存在哪些局限性?

     

    于新林:从我们目前接触客户来看,客户对快速实时导入确实是刚需,我们这方面能力相对还好,目前感觉不是瓶颈。我现在一个基本的感受是:图技术,相对于关系型数据库来说属于新兴技术,可能对于很多国内用户来说对还比较陌生,但其实这项技术在海外已经盛行了几十年,包括 NASA、ebay、airbnb 在内的大小企业都在使用图数据库来解决通信、 互联网、电子商务、社交网络和物联网等场景下的数据问题。近几年,图数据技术在国内也逐渐开始火热,NebulaGraph 也逐渐被腾讯、美团、京东、360 数科、微众银行、小红书、知乎、快手、BOSS 直聘等许多知名企业采用。

     

    虽然现在国内图数据库行业还不够成熟,标准也不完全统一,但同时我们也欣喜地看到国内互联网大厂、以及像 NebulaGraph 这样的专业厂商,正在努力构建一个成熟完善、用户友好的生态。相信假以时日,我们能够让更多用户低门槛地使用各种图探索工具,感受图算法的快捷高效、更生动地感受到“图”数据的直观性和处理关联数据的强大能力。

     

    InfoQ:面对行业的痛点问题,NebulaGraph 做了哪些迭代和优化?

     

    于新林:客户目前的一些痛点问题主要还是在稳定性、性能、大数据、高可用、实效性以及数据导入性能等。针对这些痛点,我们通过产品的一个个迭代和版本逐步解决。

     

    举例来讲,为了解决稳定性问题,我们加大了测试的投入,包括功能测试、长期稳定测试、极限压力测试、混沌测试等等;为了解决高可用问题,我们做了很多功能,包括快速扩缩容、数据 balance、备份恢复、集群间复制等等。通过一次次迭代和优化,能在最短时间内解决客户的痛点问题,也尽快建立起和客户之间的信任关系,客户会更放心的使用我们的产品。

     

    InfoQ:在 NebulaGraph 数据库支持下,已经解决了哪些企业的问题,能否分享几个成功的案例?

     

    于新林:官网上有很多这样的案例,这些都是客户贡献的案例说明,比较客观一些。我分享两个:我们有家客户是偏政府的,他们最大的特点就是数据量特别大,而且数据量在持续地增长,点在千亿级别、边在万亿级别,他们的数据需要定期导入。最大的诉求是分布式、支持海量数据、快速响应时间以及很高的导入速度。刚好我们的产品能比较好地满足他们的需求,所以两边能很快地配合进行 POC、验证、上线,现在已经持续稳定跑了很久。

     

    另一个是微众银行在数据血缘方案中,引入了 NebulaGraph 作为大数据平台的图数据基础。主要看中了快速导入大规模数据、低时延的实时计算,可以很好地帮助微众银行生成一份数据地图,以快速发现数据问题、定位和分析以及解决问题,帮助业务开展。

     

    InfoQ:在 2021 年 AS 的专访中,您提到了 NebulaGraph 接下来的三个计划,分别是 NebulaGraph 上云,加大对 AP 领域的投入,以及把图的计算和图的分析以 SaaS 化的服务形式搬上云。想了解下,目前的进展如何,是否有达到团队的预期?

     

    于新林:目前相关工作在持续开展,NebulaGraph 上云这部分是开展比较快的一部分。目前我们已经和多家云厂商在紧密的合作,包括 Azure、阿里云、AWS、Gcp、华为云等等。目前产品已经在部分云厂商上线了,国内在阿里云已经上线,大家可以免费试用。

     

    AP 领域也在有序推进,相对进展没有这么快,当前主要把 AP 和 TP 产品做了整合,主要解决了客户易用性问题,让客户更加方便地使用图数据库和图计算的能力。SaaS 是我们未来要做的事,但目前还不是重点,现阶段我们还是会更关注底层数据库的性能和最佳用户体验。还是要集中优势兵力把当前这个产品打磨好,本身这些产品也是为将来 SaaS 服务的一个根基,可能会到明年左右开始发力 SaaS 服务。当然了,考虑到终端用户的实际使用需求,NebulaGraph 也正在与一些 ISV 和 SI 企业积极合作,这些生态伙伴中不乏有多年垂直领域行业经验的解决方案提供商,通过提供图数据库底座能力给到他们来实现面向用户的方案,便于终端用户部署落地。

     

    InfoQ:谢谢于老师接受采访,也期待 NebulaGraph 在接下来有更大的突破。

    2022-08-25 14:422238

    评论

    发布
    暂无评论
    发现更多内容

    未签订劳动合同的CTO | 法庭上的 CTO(17)

    赵新龙

    CTO 法庭上的CTO

    直播中不可缺少的一环-rtmp直播推流

    anyRTC开发者

    音视频 WebRTC CDN RTC RTMP

    anonymous匿名者场外交易系统APP软件开发

    系统开发

    星域母子币系统软件开发|星域母子币APP开发

    系统开发

    股东变员工,所以不发工资?| 法庭上的CTO(18)

    赵新龙

    CTO 法庭上的CTO

    犯“走私罪”的CTO | 法庭上的CTO(19)

    赵新龙

    CTO 法庭上的CTO

    计算机网络简述

    lee

    计算机网络 网络协议 网络

    为什么要TDD(测试驱动开发)

    sherlockq

    敏捷开发 TDD 极限编程

    从一个模糊词查询需求的处理方案讨论到一种极速匹配方案的实现

    行如风

    模糊匹配 双数组trie树 ahocorasick ac自动机 黑名单过滤

    英特尔力邀150家产业大咖推动Evo严苛认证,打造PC界的奥斯卡

    E科讯

    抢先体验全新升级版Eternal Wallet!

    Geek_c610c0

    数字货币 数字货币钱包开发

    移动生态盘点与HMS生态解析

    华章IT

    华为 Android Studio 移动开发 HMS

    “盗窃”公司源代码被开除的CTO | 法庭上的CTO(20)

    赵新龙

    CTO 法庭上的CTO

    人工智能不过尔尔,基于Python3深度学习库Keras/TensorFlow打造属于自己的聊天机器人(ChatRobot)

    刘悦的技术博客

    人工智能 tensorflow chatbot 聊天机器人 keras

    智慧仓储管理系统,是否能解决购物狂欢节后新一轮爆仓危机?

    一只数据鲸鱼

    物联网 数据可视化 智慧物流 智慧仓储

    重磅|中国PostgreSQL分会与腾讯云战略合作协议签订

    PostgreSQLChina

    数据库 postgresql 软件 开源社区

    Spring 源码学习 11:invokeBeanFactoryPostProcessors

    程序员小航

    Java spring 源码 源码阅读

    像用户一样测试:打破知识的诅咒

    QualityFocus

    测试 软件质量 可用性 用户体验

    深入浅出 ZooKeeper

    vivo互联网技术

    zookeeper 分布式 ZAB

    快速接入 | 从 0 到 1 构建语音聊天室

    拍乐云Pano

    音视频 RTC 实时语音 语音聊天室 语聊房

    云视频技术领军人赵加雨:如何提升在线教育课堂互动体验

    拍乐云Pano

    音视频 在线教育 RTC 互动课堂 白板

    重学JS | 数组遍历的7种方法及兼容性处理(polyfill)

    梁龙先森

    大前端 编程语言

    生产环境全链路压测建设历程 21:某快递 A 股上市公司的生产压测案例之基于测试流量的混沌工程(故障演练)

    数列科技杨德华

    全链路压测 七日更

    英特尔赵宏:从硬件创新到平台突破,PC的未来非常值得期待

    E科讯

    盘点 2020 | 10 天开发前台系统技术系列

    老魚

    CSS 大前端 全栈 js 盘点2020

    混合用工、被拖欠工资的 CTO | 法庭上的 CTO(16)

    赵新龙

    CTO 法庭上的CTO

    什么是浮点数?

    Kaito

    计算机基础 浮点数

    从MongoID的生成讨论分布式唯一ID生成方案

    行如风

    雪花算法 分布式ID 全局唯一ID 流星算法

    九环智能合约开发

    V19927655815

    APP开发

    如何基于 SDK 快速开发一款IoT App 控制智能灯(iOS 版)

    IoT云工坊

    ios App 物联网 IoT sdk

    为什么说rollup比webpack更适合打包库

    fengxianqi

    大前端 Rollup webpack

    图数据库赛道兴起,看NebulaGraph如何打造差异化!_数据库_郑思宇_InfoQ精选文章