阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

图数据库赛道兴起,看 NebulaGraph 如何打造差异化!

  • 2022-08-25
    北京
  • 本文字数:2948 字

    阅读完需:约 10 分钟

图数据库赛道兴起,看NebulaGraph如何打造差异化!

5G、物联网、AI 等新兴技术的不断发展,不仅让数据量急剧攀升,同时也使得数据的关联变得复杂化,而传统的关系型数据库往往无法承接这些变化。相比之下,图数据库在处理关联关系上的性能则更具有优势,也能够深挖数据之间的关联性,释放数据的潜在价值。

 

为了深入了解图数据库的发展趋势与落地情况,InfoQ 记者有幸在 2022 ArchSummit全球架构师峰会北京站 上,采访了 NebulaGraph CTO 于新林老师。

 

以下是视频采访的全部内容,为方便读者查看,视频下方也附上了文字内容。

 

00:00 / 00:00
    1.0x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    InfoQ:近年来,我们看到越来越多的公司开始进军图数据库领域,对于厂商自身而言,如何才能打出差异化?

     

    于新林:在考虑差异化之前,我们首先要考虑客户需要什么,我们解决了客户哪方面的问题,然后再考虑如何做好,给客户提供更大的价值。当我们在服务好客户的时候,差异化如何体现呢?

     

    目前来看,我们的图数据库产品 NebulaGraph 的几个关键词是:开源、分布式、OLTP+OLAP、计算存储分离、处理超大规模数据、高性能。对于杭州悦数科技有限公司来说,做好产品,服务好客户就是我们打出的差异化:NebulaGraph 稳定性好,原生分布式,并且可以支持大规模海量数据。

     

    另外,作为一家坚持开源的图数据库厂商,我们一直保持服务好用户的初心,给客户提供更优质的服务。在前期的 POC 阶段,我们可以跟客户一起理清他们的数据模型,帮助客户写一些数据上的语句,让他们更好地使用图数据库。上线以后,我们会快速地响应客户的问题以及持续地给客户提供升级、运维的一整套服务。

     

    InfoQ:对于企业而言,又该如何结合自身业务选择最适合自己的图数据库产品?或者说,选择一款图数据库需要从哪几个维度去考虑?

     

    于新林:我感觉企业要想选图数据库主要从以下几个方面出发:

     

    首先,要看业务的场景,如果你的业务是偏线上实时交易的,那就需要选择 OLTP 能力比较强的图数据库,如果你的场景是偏图计算和分析的,可能要选一款偏 OLAP 的,亦或者两种场景都需要,那就选择混合的;

     

    其次,要考虑图数据库的稳定性,如果不稳,其实业务都无法开展。另外就是性能因素,这款图数据库产品的并发情况、响应时间等等;此外,由于图数据库中有大量数据是从外部导入的,因此,也需要考虑海量数据的导入性能和时间是否满足业务需求。最后,当我们选择图数据库厂商时,也需要考虑服务持久化的问题。

     

    InfoQ:据 Gartner 预言,图数据库很快约占到数据库领域 10%市场。从您的观察来看,图技术的落地情况达到了怎样的阶段?

     

    于新林:图技术是一个快速发展的方向,是否占 10%我没法准确感受。我能感受到的是:起风了。从目前市场来看,客户对图相关接受度越来越高,购买、使用图数据库的客户越来越多,这基于两个方面:一方面得益于技术的成熟,另一方面是客户的认知和对图的需求逐渐攀升。图技术相关领域其实蛮广泛的,图计算、分析、存储、渲染、展示、图+AI 以及各种各样基于图的业务应用,如社交、防疫、供应链、知识图谱等。我们最近也发布了几个联合方案:金融反欺诈、智能投研平台、智能运维,通过这些方案,让我们能更好地配合合作伙伴的业务,推动生态的健康发展。

     

    InfoQ:与传统关系型数据库相比,图数据库虽然可以从海量数据中挖掘数据的关联,但据了解,目前市面上的图数据库产品还很难满足快速实时导入数据。能否请您介绍下,目前图数据还存在哪些局限性?

     

    于新林:从我们目前接触客户来看,客户对快速实时导入确实是刚需,我们这方面能力相对还好,目前感觉不是瓶颈。我现在一个基本的感受是:图技术,相对于关系型数据库来说属于新兴技术,可能对于很多国内用户来说对还比较陌生,但其实这项技术在海外已经盛行了几十年,包括 NASA、ebay、airbnb 在内的大小企业都在使用图数据库来解决通信、 互联网、电子商务、社交网络和物联网等场景下的数据问题。近几年,图数据技术在国内也逐渐开始火热,NebulaGraph 也逐渐被腾讯、美团、京东、360 数科、微众银行、小红书、知乎、快手、BOSS 直聘等许多知名企业采用。

     

    虽然现在国内图数据库行业还不够成熟,标准也不完全统一,但同时我们也欣喜地看到国内互联网大厂、以及像 NebulaGraph 这样的专业厂商,正在努力构建一个成熟完善、用户友好的生态。相信假以时日,我们能够让更多用户低门槛地使用各种图探索工具,感受图算法的快捷高效、更生动地感受到“图”数据的直观性和处理关联数据的强大能力。

     

    InfoQ:面对行业的痛点问题,NebulaGraph 做了哪些迭代和优化?

     

    于新林:客户目前的一些痛点问题主要还是在稳定性、性能、大数据、高可用、实效性以及数据导入性能等。针对这些痛点,我们通过产品的一个个迭代和版本逐步解决。

     

    举例来讲,为了解决稳定性问题,我们加大了测试的投入,包括功能测试、长期稳定测试、极限压力测试、混沌测试等等;为了解决高可用问题,我们做了很多功能,包括快速扩缩容、数据 balance、备份恢复、集群间复制等等。通过一次次迭代和优化,能在最短时间内解决客户的痛点问题,也尽快建立起和客户之间的信任关系,客户会更放心的使用我们的产品。

     

    InfoQ:在 NebulaGraph 数据库支持下,已经解决了哪些企业的问题,能否分享几个成功的案例?

     

    于新林:官网上有很多这样的案例,这些都是客户贡献的案例说明,比较客观一些。我分享两个:我们有家客户是偏政府的,他们最大的特点就是数据量特别大,而且数据量在持续地增长,点在千亿级别、边在万亿级别,他们的数据需要定期导入。最大的诉求是分布式、支持海量数据、快速响应时间以及很高的导入速度。刚好我们的产品能比较好地满足他们的需求,所以两边能很快地配合进行 POC、验证、上线,现在已经持续稳定跑了很久。

     

    另一个是微众银行在数据血缘方案中,引入了 NebulaGraph 作为大数据平台的图数据基础。主要看中了快速导入大规模数据、低时延的实时计算,可以很好地帮助微众银行生成一份数据地图,以快速发现数据问题、定位和分析以及解决问题,帮助业务开展。

     

    InfoQ:在 2021 年 AS 的专访中,您提到了 NebulaGraph 接下来的三个计划,分别是 NebulaGraph 上云,加大对 AP 领域的投入,以及把图的计算和图的分析以 SaaS 化的服务形式搬上云。想了解下,目前的进展如何,是否有达到团队的预期?

     

    于新林:目前相关工作在持续开展,NebulaGraph 上云这部分是开展比较快的一部分。目前我们已经和多家云厂商在紧密的合作,包括 Azure、阿里云、AWS、Gcp、华为云等等。目前产品已经在部分云厂商上线了,国内在阿里云已经上线,大家可以免费试用。

     

    AP 领域也在有序推进,相对进展没有这么快,当前主要把 AP 和 TP 产品做了整合,主要解决了客户易用性问题,让客户更加方便地使用图数据库和图计算的能力。SaaS 是我们未来要做的事,但目前还不是重点,现阶段我们还是会更关注底层数据库的性能和最佳用户体验。还是要集中优势兵力把当前这个产品打磨好,本身这些产品也是为将来 SaaS 服务的一个根基,可能会到明年左右开始发力 SaaS 服务。当然了,考虑到终端用户的实际使用需求,NebulaGraph 也正在与一些 ISV 和 SI 企业积极合作,这些生态伙伴中不乏有多年垂直领域行业经验的解决方案提供商,通过提供图数据库底座能力给到他们来实现面向用户的方案,便于终端用户部署落地。

     

    InfoQ:谢谢于老师接受采访,也期待 NebulaGraph 在接下来有更大的突破。

    2022-08-25 14:422235

    评论

    发布
    暂无评论
    发现更多内容

    基于知识图谱的电影知识问答系统:训练TF-IDF 向量算法和朴素贝叶斯分类器、在 Neo4j 中查询

    汀丶人工智能

    人工智能 自然语言处理 深度学习 知识图谱 智能问答

    IPQ5018 +QCN9074/QCN6122/QCN6102 high-performance IIOT -2.4G/5G/6G-most comprehensive wifi6

    wifi6-yiyi

    5G wifi6 QCN9074 6G

    IPQ5018 SoC with QCN9074 VS QCN6122|IIOT Wifi6 solution|Wallys

    wallyslilly

    ipq5018

    新华网专访 | 用友网络:中国企业“出海”要有全球视野 需构建数智化全球人才供应链

    用友BIP

    人力资源 中企出海

    统一技术底座助力医疗机构数智化转型

    用友BIP

    数智底座 技术底座

    消费品行业全面预算管理领先实践

    用友BIP

    全面预算

    C++ 测试框架 GoogleTest 初学者入门篇

    不在线第一只蜗牛

    编程 测试框架 C++

    ChatGPT搭建AI网站实战

    快乐非自愿限量之名

    网站开发 ChatGPT

    华为云MetaStudio全新升级,盘古数字人大模型助力数字人自由

    华为云开发者联盟

    人工智能 华为云 数字人 华为云开发者联盟 企业号 7 月 PK 榜

    HiveSQL 迁移 FlinkSQL 在快手的实践

    Apache Flink

    大数据 flink 实时计算

    数据安全没保证?GaussDB(for Redis)为你保驾护航

    华为云开发者联盟

    数据库 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

    ScaleBit 与 NFTScan 达成安全生态合作伙伴关系

    NFT Research

    安全 NFT\

    数据孤岛、系统林立,这些顽疾瓴羊想要全搞定

    ToB行业头条

    24款好用的电脑画图软件推荐,总有一款适合你!

    彭宏豪95

    效率工具 软件 流程图 画图软件 绘图工具

    秒验丨 REST API:手机号码置换接口

    MobTech袤博科技

    大数据 前端 后端

    用友iuap:最懂企业级技术,更懂企业级业务

    用友BIP

    国产替代

    衡阳等保测评中心地址在哪里?电话多少?

    行云管家

    等保 等级保护 等保测评 衡阳

    如何评价MyBatis-Flex框架

    酱紫的小白兔

    AIGC时代:未来已来

    EquatorCoco

    人工智能 AIGC

    万字详解 | Java 函数式编程

    不在线第一只蜗牛

    函数式编程 java 编程

    Linux和Windows系统下安装深度学习框架所需支持:Anaconda、Paddlepaddle、Paddlenlp、pytorch,含GPU、CPU版本详细安装过程

    汀丶人工智能

    人工智能 paddle Anaconda 深度学习框架 PyTorch

    从大数据到AI,华为云存储加速企业大模型快速应用

    华为云开发者联盟

    云计算 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

    首个!AI开发者创作激励计划开启,有成长、有收入

    飞桨PaddlePaddle

    人工智能 百度 paddle 飞桨 百度飞桨

    成就数智企业,用友助力中国企业迈向高质量发展

    用友BIP

    国产替代

    大咖论道,大模型时代软件研发效率革命

    华为云开发者联盟

    人工智能 华为云 华为云开发者联盟 企业号 7 月 PK 榜

    领域知识图谱的医生推荐系统:利用BERT+CRF+BiLSTM的医疗实体识别,建立医学知识图谱,建立知识问答系统

    汀丶人工智能

    人工智能 自然语言处理 深度学习 知识图谱 智能问答

    柏睿数据:以自主可控的智能算力引擎服务数据产业创新发展

    新消费日报

    DPO 直接偏好优化:跳过复杂的对抗学习,语言模型本来就会奖励算法

    Zilliz

    AIGC LLM RLHF

    我和敏捷有点缘

    ShineScrum捷行

    敏捷教练

    深入解读:多人语音聊天室源码开发搭建社交分享功能

    山东布谷科技

    软件开发 语音聊天室 源码搭建 语音聊天源码 语音聊天

    克服 ClickHouse 运维难题:ByteHouse 水平扩容功能上线

    字节跳动数据平台

    云原生 数仓 bytehouse 企业号 7 月 PK 榜

    图数据库赛道兴起,看NebulaGraph如何打造差异化!_数据库_郑思宇_InfoQ精选文章