写点什么

华为云全自研图引擎——在 AI 领域做好自己

  • 2020-03-25
  • 本文字数:1755 字

    阅读完需:约 6 分钟

华为云全自研图引擎——在AI领域做好自己

如果我们不做自主研发,我们一样可以过的很滋润,然而负重前行的远方只为了一小个可能,独立自主,将一切掌握在自己手中,而这一切的过程归纳总结起来唯“创新”二字而已。


把握不落后于人的资本,就是看清冉冉升起的趋势,最后一往无前。



DB-engines 对于数据库类型流行度排名

进阶的 AI——21 世纪图数据的回春

图论:技术圈都在讲的“图”到底是啥,首先你要知道图论,图是图论的主要研究对象。图是由若干给定的顶点及连接两顶点的边所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系。顶点用于代表事物,连接两顶点的边则用于表示两个事物间具有这种关系。


图的结构非常多样,可以分为同构图,有向图/无向图,权重图/无权图,稠密图/稀疏图,连通图/连通分量等等。



多样的图结构在表现丰富数据关系方面具有非常强大的优势,其两点之间的边也表示两节点之间的各种丰富多样的关系或者潜在关系。(朋友,家人,消费,运输,负债,高低频,重要程度,受好评度,压力等等一切物理世界的关系)。因此图后来也被用于作为关系分析和挖掘潜在关系的最优载体。


“传统数据库与图数据库的博弈早就已经存在,然而真正做出选择的是适者生存”


我们来看看图数据库:



传统数据库想要发现数据内部的潜在关系,调用次数将会比一般情况下多接近 10 倍,甚至完全无法用数据库表示这些联系,一旦新增一个类型又需要重新设计,开发过程将极其复杂。


在 1 千万点,1 亿边这样的规模下,基于关系数据的 3 跳以上查询通过传统数据库查询,性能完全无法满足查询需求。

华为云图引擎 VS 传统数据库

2 跳查询下,传统关系数据库,反应时间:0.016s,图引擎 0.017s,返回记录条数 231579 条,3 跳之下,传统关系数据库 23.589s,图引擎 0.779s,1031115 条,5 跳之下,图引擎 1.474s,返回记录条数 1230000 条,传统数据库如何:臣妾做不到啊!



这是因为,传统数据库的查询数据依赖性非常强,在各个点之间需要交换大量的数据,其分析流程需要反复迭代,很难实现真正的并行,而图数据结构支持遍历查询,读写快,无需多次重复交换数据,真正实现图形并行。在图计算领域,如果把传统数据结构比作大炮坦克,图数据结构就是高达。


“这些分析都能用在哪儿,能创造价值才是王道,否则只是一个概念优势”


别急,我们先来看看用于关系分析的基础算法有哪些:


  • 戴克斯特拉算法(D.A)

  • 克鲁斯卡尔算法(K.A)

  • 普里姆算法(P.A)

  • 拓扑排序算法(TSA)

  • 关键路径算法(CPA)

  • 广度优先搜索算法(BFS)

  • 深度优先搜索算法(DFS)


“这些都用来干嘛,能解决什么问题呢?”


问得好,很多情况下是为了进行图的遍历搜索,计算最小生成树,计算最短路径,子图相关问题,此外还能处理染色,路径问题,网络流与匹配,覆盖问题等等逻辑和实际性问题。


“图数据库的核心价值是在现实场景中驱动计算效率“


图应用场景:


图在现实场景中的应用非常广泛比如路径规划,城市交通,航空航天,GPS 导航,网络工程,电子电路,航班预订,信号塔频率规划等等,物流网利用最短路径提高客座率,降低出车量的规划。实际生产中,可以参考以下成功案例:如广联达使用图引擎发现项目风险,社交网络中使用关系分析挖掘进行好友推荐,商品推荐使用图来提高商品推荐精准率。



以上共性,当业务需求只要涉及到路径优化,关系数据的分析和挖掘,都能见到图的应用实践。


可为何过去一直小众的图突然变得那么热门,并且覆盖了这么多领域。这是因为大数据 2.0 时代,所有企业面临的是指数级爆炸的信息量,如果不提升数据的使用效率和处理效率,那么就等于在这个数据驱动的时代放弃了这一动力,继续使用人力车与燃油车赛跑。而图数据对新时代需求的高契合度和社会各界对于这种数据结构的高度认可也造就了如今图在当前技术界爆发式的热度。

这是华为云自己的 AI

直到 2018 年,华为累计获得专利授权 74307 件,华为图引擎服务集成自研图引擎内核 Eywa,全自主研发,内含有多项专利,安全可靠,不禁售,提供了从底层图存储和管理、核心的高性能计算引擎,到面向上层的图分析、图查询这样一整套解决方案。向用户、开发者和 ISV 提供全开放的快速建模、高效计算的能力,提升图分析与计算的质效和速度。


我们一直在创新的道路上徐徐前行,昨天,今天,明天并没有什么区别。


本文转载自 华为云产品与解决方案 公众号。


原文链接:https://mp.weixin.qq.com/s/Kj-4ZKl3yzx9pYfVZw4wIQ


2020-03-25 17:531259

评论

发布
暂无评论
发现更多内容

困扰一周的奇葩bug:重复相似代码多,导致单片机程序跑飞

不脱发的程序猿

28天写作 硬件设计 嵌入式软件 单片机 3月日更

异步机制和CPU架构对 Redis 性能的影响

escray

redis 学习 极客时间 3月日更 Redis 核心技术与实战

网络连接之协议栈

Kylin

协议栈 3月日更 21天挑战 网络连接

QCon全球软件开发大会:推动创新,实现技术落地

博文视点Broadview

华为云PB级数据库GaussDB(for Redis)揭秘第六期:Feed流场景中的应用

华为云开发者联盟

数据库 redis 华为云 GaussDB Feed流

Gas费用持续攀升!NA公链NAC公链如何破解高额Gas费用的困局?

区块链第一资讯

区块链六大应用场景,推动政府信息化发展

13828808769

区块链+ #区块链#

Datadog 能成为最大的云监控厂商吗

睿象云

运维 运维平台 Datadog 云监控

智慧公安信息化管理系统,重点人员管控系统的搭建

13828808769

智慧交通

​Autonomous Dream Works的独创力杰作EGGNetwork EFTalk

币圈那点事

初识Golang之声明函数

Kylin

3月日更 21天挑战 Go 语言

基于深度学习的两种信源信道联合编码

华为云开发者联盟

深度学习 通信 编码 信源编码 信道编码

推荐 2 款必备的 Django 开发神器

星安果

Python django Web 后端

电子证照上链--助推智慧政务

13530558032

分布式锁的实现方案

360技术

设计与思考,关于资源和生命周期

程序员架构进阶

设计实践 生命周期 28天写作 3月日更 池化技术

通俗讲解分布式锁,看完不懂算我输

Java小咖秀

Java 分布式 多线程 并发

Rust从0到1-基础概念-数据类型

rust 数据类型

【LeetCode】删除排序链表中的重复元素 IIJava题解

Albert

算法 LeetCode 3月日更

如何正确使用Python临时文件

华为云开发者联盟

Python 安全 临时文件 tempfile 库函数

Golang号称最快的Json解析器速度可达5623ns/op

happlyfox

学习 3月日更 Go 语言

Python基础之:Python中的模块

程序那些事

Python Python3 程序那些事

区块链中药溯源--区块链为中医药溯源认证

13530558032

力扣(LeetCode)刷题,简单题(第13期)

不脱发的程序猿

面试 LeetCode 28天写作 算法面经 3月日更

搞懂 ZooKeeper 集群的数据同步

HelloGitHub

Java zookeeper ZooKeeper原理

一段java代码执行旅程

华为云开发者联盟

JVM class 指令 java代码 java栈

Worktile 前端工程化之路

PingCode研发中心

大前端

主数据建设的挑战与发展

EAWorld

能源绿色管控:天然气站启动数字化转型,工业企业该如何突围?

一只数据鲸鱼

物联网 数据可视化 智慧城市 能源管理 天然气

区块链BaaS应用平台搭建,助力企业运用区块链解决业务问题

13828808769

区块链 区块链+ 区块链发展 #区块链#

低代码是什么?低代码价值主要体现在哪?

优秀

低代码

华为云全自研图引擎——在AI领域做好自己_AI&大模型_华为云产品与解决方案_InfoQ精选文章