写点什么

华为云全自研图引擎——在 AI 领域做好自己

  • 2020-03-25
  • 本文字数:1755 字

    阅读完需:约 6 分钟

华为云全自研图引擎——在AI领域做好自己

如果我们不做自主研发,我们一样可以过的很滋润,然而负重前行的远方只为了一小个可能,独立自主,将一切掌握在自己手中,而这一切的过程归纳总结起来唯“创新”二字而已。


把握不落后于人的资本,就是看清冉冉升起的趋势,最后一往无前。



DB-engines 对于数据库类型流行度排名

进阶的 AI——21 世纪图数据的回春

图论:技术圈都在讲的“图”到底是啥,首先你要知道图论,图是图论的主要研究对象。图是由若干给定的顶点及连接两顶点的边所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系。顶点用于代表事物,连接两顶点的边则用于表示两个事物间具有这种关系。


图的结构非常多样,可以分为同构图,有向图/无向图,权重图/无权图,稠密图/稀疏图,连通图/连通分量等等。



多样的图结构在表现丰富数据关系方面具有非常强大的优势,其两点之间的边也表示两节点之间的各种丰富多样的关系或者潜在关系。(朋友,家人,消费,运输,负债,高低频,重要程度,受好评度,压力等等一切物理世界的关系)。因此图后来也被用于作为关系分析和挖掘潜在关系的最优载体。


“传统数据库与图数据库的博弈早就已经存在,然而真正做出选择的是适者生存”


我们来看看图数据库:



传统数据库想要发现数据内部的潜在关系,调用次数将会比一般情况下多接近 10 倍,甚至完全无法用数据库表示这些联系,一旦新增一个类型又需要重新设计,开发过程将极其复杂。


在 1 千万点,1 亿边这样的规模下,基于关系数据的 3 跳以上查询通过传统数据库查询,性能完全无法满足查询需求。

华为云图引擎 VS 传统数据库

2 跳查询下,传统关系数据库,反应时间:0.016s,图引擎 0.017s,返回记录条数 231579 条,3 跳之下,传统关系数据库 23.589s,图引擎 0.779s,1031115 条,5 跳之下,图引擎 1.474s,返回记录条数 1230000 条,传统数据库如何:臣妾做不到啊!



这是因为,传统数据库的查询数据依赖性非常强,在各个点之间需要交换大量的数据,其分析流程需要反复迭代,很难实现真正的并行,而图数据结构支持遍历查询,读写快,无需多次重复交换数据,真正实现图形并行。在图计算领域,如果把传统数据结构比作大炮坦克,图数据结构就是高达。


“这些分析都能用在哪儿,能创造价值才是王道,否则只是一个概念优势”


别急,我们先来看看用于关系分析的基础算法有哪些:


  • 戴克斯特拉算法(D.A)

  • 克鲁斯卡尔算法(K.A)

  • 普里姆算法(P.A)

  • 拓扑排序算法(TSA)

  • 关键路径算法(CPA)

  • 广度优先搜索算法(BFS)

  • 深度优先搜索算法(DFS)


“这些都用来干嘛,能解决什么问题呢?”


问得好,很多情况下是为了进行图的遍历搜索,计算最小生成树,计算最短路径,子图相关问题,此外还能处理染色,路径问题,网络流与匹配,覆盖问题等等逻辑和实际性问题。


“图数据库的核心价值是在现实场景中驱动计算效率“


图应用场景:


图在现实场景中的应用非常广泛比如路径规划,城市交通,航空航天,GPS 导航,网络工程,电子电路,航班预订,信号塔频率规划等等,物流网利用最短路径提高客座率,降低出车量的规划。实际生产中,可以参考以下成功案例:如广联达使用图引擎发现项目风险,社交网络中使用关系分析挖掘进行好友推荐,商品推荐使用图来提高商品推荐精准率。



以上共性,当业务需求只要涉及到路径优化,关系数据的分析和挖掘,都能见到图的应用实践。


可为何过去一直小众的图突然变得那么热门,并且覆盖了这么多领域。这是因为大数据 2.0 时代,所有企业面临的是指数级爆炸的信息量,如果不提升数据的使用效率和处理效率,那么就等于在这个数据驱动的时代放弃了这一动力,继续使用人力车与燃油车赛跑。而图数据对新时代需求的高契合度和社会各界对于这种数据结构的高度认可也造就了如今图在当前技术界爆发式的热度。

这是华为云自己的 AI

直到 2018 年,华为累计获得专利授权 74307 件,华为图引擎服务集成自研图引擎内核 Eywa,全自主研发,内含有多项专利,安全可靠,不禁售,提供了从底层图存储和管理、核心的高性能计算引擎,到面向上层的图分析、图查询这样一整套解决方案。向用户、开发者和 ISV 提供全开放的快速建模、高效计算的能力,提升图分析与计算的质效和速度。


我们一直在创新的道路上徐徐前行,昨天,今天,明天并没有什么区别。


本文转载自 华为云产品与解决方案 公众号。


原文链接:https://mp.weixin.qq.com/s/Kj-4ZKl3yzx9pYfVZw4wIQ


2020-03-25 17:531273

评论

发布
暂无评论
发现更多内容

私藏干货分享:关于企业架构中如何进行平台化

金松(李博源)

企业架构 数据架构 业务架构 大数据平台 平台

C#/VB.NET 使用插件将HTML转为PDF

在下毛毛雨

C# html .net PDF

一场分销裂变活动,不止是发发朋友圈这么简单!

CRMEB

等保2.0密码要求是什么?法律依据有哪些?

行云管家

网络安全 等保 等保2.0

Drive to APasS!使用明道云管理F1赛事

明道云

牛客java选择题每日打卡Day4

京与旧铺

6月月更

关于接口测试自动化的总结与思考

阿里巴巴云原生

阿里云 接口 性能压测 PTS 阿里云云原生

浅谈软件研发的复杂性与效能提升之道

思码逸研发效能

研发效能

巧用redis实现点赞功能,它不比mysql香吗?

阿Q说代码

MySQL 数据库 redis 点赞

海量数据!秒级分析!Flink+Doris构建实时数仓方案

领创集团Advance Intelligence Group

数据 Doris flink sql 平台

易周金融 | Q1手机银行活跃用户规模6.5亿;理财子公司布局新兴领域

易观分析

金融 手机银行

秒云荣获《2022爱分析 · IT运维厂商全景报告》智能运维AIOps市场代表厂商

MIAOYUN

云原生 智能运维 IT运维 智能运维AIOps

实力总结四类Bean注入Spring的方式

阿Q说代码

Java 注解 spring源码 bean注入

阅读别人的代码,是一种怎样的体验

阿Q说代码

程序人生 阅读代码 阅读建议 阅读感受

Pisa-Proxy 之 SQL 解析实践

SphereEx

数据库 SQL语句 SphereEx

Substrate 源码追新导读 4月第2周技术更新: 以太坊地址转换, BEEFY协议等

彭亚伦

rust Substrate 波卡生态

好用到爆!GitHub 星标 32.5k+的命令行软件管理神器,功能真心强大!

沉默王二

Java macos GitHub

开源二三事|ShardingSphere 与 Database Mesh 之间不得不说的那些事

SphereEx

数据库 SphereEx Apache ShardingSphere Database Mesh Pisanix

NFT双币质押流动性挖矿dapp合约定制

开发微hkkf5566

PostgreSQL 15新版本特性解读(含直播问答、PPT资料汇总)

墨天轮

数据库 postgresql

直播app运营模式有哪几种,我们该选择什么样的模式?

开源直播系统源码

软件开发 直播源码 带货直播

鸿蒙发力!HDD杭州站·线下沙龙邀您共建生态

最新动态

DevOps 如何帮助前端提升研发效率?

飞算JavaAI开发助手

基于 Nebula Graph 构建百亿关系知识图谱实践

NebulaGraph

知识图谱 Nebula Graph

centos7防火墙完整操作命令,值得的收藏

迷彩

Linux 运维 Centos 7 防火墙 6月月更

熊市慢慢,Bit.Store提供稳定Staking产品助你穿越牛熊

股市老人

字节跳动埋点数据流建设与治理实践

字节跳动数据平台

字节跳动 数据治理 数据流 埋点治理 数据研发

java培训redis集群原理详解

@零度

redis java培训

TiDB 6.0:让 TSO 更高效丨TiDB Book Rush

PingCAP

TiDB

等保三级密码复杂度是多少?多久更换一次?

行云管家

堡垒机 等级保护 过等保 等保2.0

华为云全自研图引擎——在AI领域做好自己_AI&大模型_华为云产品与解决方案_InfoQ精选文章