写点什么

华为云全自研图引擎——在 AI 领域做好自己

  • 2020-03-25
  • 本文字数:1755 字

    阅读完需:约 6 分钟

华为云全自研图引擎——在AI领域做好自己

如果我们不做自主研发,我们一样可以过的很滋润,然而负重前行的远方只为了一小个可能,独立自主,将一切掌握在自己手中,而这一切的过程归纳总结起来唯“创新”二字而已。


把握不落后于人的资本,就是看清冉冉升起的趋势,最后一往无前。



DB-engines 对于数据库类型流行度排名

进阶的 AI——21 世纪图数据的回春

图论:技术圈都在讲的“图”到底是啥,首先你要知道图论,图是图论的主要研究对象。图是由若干给定的顶点及连接两顶点的边所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系。顶点用于代表事物,连接两顶点的边则用于表示两个事物间具有这种关系。


图的结构非常多样,可以分为同构图,有向图/无向图,权重图/无权图,稠密图/稀疏图,连通图/连通分量等等。



多样的图结构在表现丰富数据关系方面具有非常强大的优势,其两点之间的边也表示两节点之间的各种丰富多样的关系或者潜在关系。(朋友,家人,消费,运输,负债,高低频,重要程度,受好评度,压力等等一切物理世界的关系)。因此图后来也被用于作为关系分析和挖掘潜在关系的最优载体。


“传统数据库与图数据库的博弈早就已经存在,然而真正做出选择的是适者生存”


我们来看看图数据库:



传统数据库想要发现数据内部的潜在关系,调用次数将会比一般情况下多接近 10 倍,甚至完全无法用数据库表示这些联系,一旦新增一个类型又需要重新设计,开发过程将极其复杂。


在 1 千万点,1 亿边这样的规模下,基于关系数据的 3 跳以上查询通过传统数据库查询,性能完全无法满足查询需求。

华为云图引擎 VS 传统数据库

2 跳查询下,传统关系数据库,反应时间:0.016s,图引擎 0.017s,返回记录条数 231579 条,3 跳之下,传统关系数据库 23.589s,图引擎 0.779s,1031115 条,5 跳之下,图引擎 1.474s,返回记录条数 1230000 条,传统数据库如何:臣妾做不到啊!



这是因为,传统数据库的查询数据依赖性非常强,在各个点之间需要交换大量的数据,其分析流程需要反复迭代,很难实现真正的并行,而图数据结构支持遍历查询,读写快,无需多次重复交换数据,真正实现图形并行。在图计算领域,如果把传统数据结构比作大炮坦克,图数据结构就是高达。


“这些分析都能用在哪儿,能创造价值才是王道,否则只是一个概念优势”


别急,我们先来看看用于关系分析的基础算法有哪些:


  • 戴克斯特拉算法(D.A)

  • 克鲁斯卡尔算法(K.A)

  • 普里姆算法(P.A)

  • 拓扑排序算法(TSA)

  • 关键路径算法(CPA)

  • 广度优先搜索算法(BFS)

  • 深度优先搜索算法(DFS)


“这些都用来干嘛,能解决什么问题呢?”


问得好,很多情况下是为了进行图的遍历搜索,计算最小生成树,计算最短路径,子图相关问题,此外还能处理染色,路径问题,网络流与匹配,覆盖问题等等逻辑和实际性问题。


“图数据库的核心价值是在现实场景中驱动计算效率“


图应用场景:


图在现实场景中的应用非常广泛比如路径规划,城市交通,航空航天,GPS 导航,网络工程,电子电路,航班预订,信号塔频率规划等等,物流网利用最短路径提高客座率,降低出车量的规划。实际生产中,可以参考以下成功案例:如广联达使用图引擎发现项目风险,社交网络中使用关系分析挖掘进行好友推荐,商品推荐使用图来提高商品推荐精准率。



以上共性,当业务需求只要涉及到路径优化,关系数据的分析和挖掘,都能见到图的应用实践。


可为何过去一直小众的图突然变得那么热门,并且覆盖了这么多领域。这是因为大数据 2.0 时代,所有企业面临的是指数级爆炸的信息量,如果不提升数据的使用效率和处理效率,那么就等于在这个数据驱动的时代放弃了这一动力,继续使用人力车与燃油车赛跑。而图数据对新时代需求的高契合度和社会各界对于这种数据结构的高度认可也造就了如今图在当前技术界爆发式的热度。

这是华为云自己的 AI

直到 2018 年,华为累计获得专利授权 74307 件,华为图引擎服务集成自研图引擎内核 Eywa,全自主研发,内含有多项专利,安全可靠,不禁售,提供了从底层图存储和管理、核心的高性能计算引擎,到面向上层的图分析、图查询这样一整套解决方案。向用户、开发者和 ISV 提供全开放的快速建模、高效计算的能力,提升图分析与计算的质效和速度。


我们一直在创新的道路上徐徐前行,昨天,今天,明天并没有什么区别。


本文转载自 华为云产品与解决方案 公众号。


原文链接:https://mp.weixin.qq.com/s/Kj-4ZKl3yzx9pYfVZw4wIQ


2020-03-25 17:531206

评论

发布
暂无评论
发现更多内容

碎碎念之「卡马克的反脆弱想法生成系统」

Justin

心理学 创意 28天写作 反脆弱

网络出口究竟选择防火墙,还是路由器?

产品经理训练营笔记-产品思维和产品意识(上)

.nil?

产品经理训练营

张小龙:视频号是什么?| 视频号 28 天 (16)

赵新龙

28天写作

【并发编程的艺术】详解指令重排序与数据依赖

程序员架构进阶

架构 并发 Java内存模型 28天写作

2020出行之变(二):新能源汽车的拥挤牌桌

脑极体

一顿午饭的现实思考

石君

28天写作 择业

机器学习笔记之:监督学习

Nydia

如何快速提升自己的能力?高效学习让你更出类拔萃。

一笑

学习方法 28天写作

核酸检测:让我明白AQS原理

叫练

AQS 共享锁 独占锁 可中断 条件队列

重学JS | 通过无限循环动画案例理解CSS3动画与JS动画

梁龙先森

面试 大前端 编程语言 28天写作

Spring Boot 中集成 Shiro

武哥聊编程

Java springboot SpringBoot 2 shiro 28天写作

如果公司要招一个人代替你

哈撒啦岛

产品经理训练营

2021最新总结一个90后 双非本末 5面蚂蚁 如何拿到年薪60W+?

比伯

Java 编程 程序员 架构 面试

解密阿里线上问题诊断工具Arthas和jvm-sandbox

比伯

Java 编程 架构 面试 计算机

项目管理系列(9)- 从 0 到 1 搭建 PMO(二)

Ian哥

28天写作

四个策略,三个“坑”,读《架构师也不写代码》有感

李忠良

28天写作

我是这样使用极客时间APP的

熊斌

极客时间 28天写作

html容器以及CSS概述

程序员的时光

程序员 七日更 28天写作

28天瞎写的第二百二十七天:跨年夜的故事

树上

28天写作

Java 程序经验小结:编程更好的使用泛型以替代原生态类型

后台技术汇

28天写作

GNUCash

lidaobing

GNUCash 28天写作 四柱结算法 复式记账

当情绪生病?就嫁接一段新的记忆「幻想短篇 16/28」

道伟

28天写作

2021开启数据结构与算法的学习之旅

Nick

学习 flag 新年计划

架构师训练营第九周课后作业

万有引力

Elasticsearch Document 的 _version 元数据

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试

登录微软账号的Windows电脑如何远程?

BigYoung

微软 Windows 10 远程登录

认识产品经理-产品JD作业

Weiyung

原来Canal也可以做HA!

大数据老哥

【CSS】格仔背景

德育处主任

html css3 大前端 CSS小技巧 28天写作

项目管理系列(9)- 项目分析与报告

Ian哥

28天写作

华为云全自研图引擎——在AI领域做好自己_AI&大模型_华为云产品与解决方案_InfoQ精选文章