速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

华为发布业界首款 AI-Native 数据库,挑动了谁的神经?

  • 2019-05-16
  • 本文字数:2538 字

    阅读完需:约 8 分钟

华为发布业界首款AI-Native数据库,挑动了谁的神经?

2019 年 5 月 15 日,华为在北京举办分布式数据库及存储新品发布会,重点发布了两款产品:业界首创的 AI Native 分布式数据库 GaussDB 和分布式存储产品 FusionStorage 8.0。其中,GaussDB 在发布之前就备受国内外媒体关注,不少媒体曾在文章中提及此举将对数据库老兵 Oracle 构成影响。

业界首个 AI-Native 数据库 GaussDB

传统企业数据处理以结构化数据为主,数据库+BI 应用为主要模式。智能时代,数据爆炸式增长,数据库系统规模越来越大,数据处理从结构化数据向结构化+非结构化的多样性数据处理转变,传统的人工维护方式将面临巨大挑战。因此,华为重定义数据库架构,将 AI 技术引入数据库,大幅提升数据库自动化管理和优化能力。


据介绍,GaussDB 是业界首款 AI-Native 数据库,也是业界第一款支持 ARM 的企业级数据库。其有两大创新:一是首次将人工智能技术融入分布式数据库的全生命周期,实现自运维、自管理、自调优、故障自诊断和自愈。在交易、分析和混合负载场景下,基于最优化理论,首创基于深度强化学习的自调优算法,调优性能比业界提升 60%以上;二是通过异构计算创新框架充分发挥 X86、ARM、GPU、NPU 多种算力优势,在华为实验室采用权威标准测试集 TPC-DS 进行测试的情况下,其性能比业界提升 50%,排名第一。


根据了解,AI-Native 数据库分为五个等级:


1、AI Advised,利用外挂 AI 引擎给出数据库优化建议,减少数据库管理员的负担;


2、AI Assisted,数据库内置 AI 引擎,实现在线辅助优化,提升数据库管理效率;


3、AI Enhanced,一方面将 AI 植入数据库内核组件、核心算法和数据结构,实现数据库自优化;


4、AI Assembled,实现数据库自愈并最优化 AI;


5、AI Designed,通过 AI 技术实现数据库的设计、验证、开发,达到全场景智能和普惠 AI 的目的。


现场,华为通过案例演示了 AI-Native 数据库 GaussDB 的强悍性能,比如在 OLAP 分析场景和 OLTP 事务场景下,使用 AI-Native 智能调优模式平均比其他自动调优方法性能提升 68%,比 DBA 调优提升 54%。


华为提出的 AI-Native 数据库,除了用 AI 理念重构数据库内核和算法之外,还考虑了如何在通用计算摩尔定律濒临失效的情况下,利用 GPU、NPU 等 AI 芯片算力来大幅提升 AI 算法的性能。


目前,GaussDB 支持本地部署、私有云、公有云等多种场景。在华为云上,GaussDB 为金融、互联网、物流、教育、汽车等行业客户提供全功能、高性能的云上数据仓库服务。这也是华为发布会的很大不同,产品发布的那一刻基本已经成功落地实践。

华为的 AI 能力

对于华为的 AI 能力,想必不少开发者都有所耳闻。在去年的HUAWEI CONNECT 2018大会上,华为就曾推出 ModelArts 全流程平台,可以让开发者更快地上手 AI、更快地加速模型训练和部署;更懂开发者的视觉 AI 应用开发平台 HiLens,搭载昇腾 310,因而可提供了强大的算力和存储空间,满足了较大的图像处理运算需求,甚至实现 1 秒百帧的处理能力及毫秒级人脸检测;离线的开发套件 Atlas 200,方便开发者在离线状态下研究和开发。


众所周知,华为有一个“传说中的”2012 实验室,是华为探索未来科技无人区的主战部队。此前,InfoQ 曾受邀参观了其中的诺亚方舟实验室,这是华为 AI 研发中心,展示的亮点为“人工智能能力演示”,如智慧终端的计算视觉、语音助手、推荐搜索;智慧企业的供应链大脑、问答系统等;热技术实验室则聚焦高集成封装、高密空冷、高效液冷/相变,展示器件低热阻、仿生散热器、相变液冷、声学降噪材料、流场可视化测试等技术。而此次发布的 GaussDB,就是在 2012 实验室领导下开发的。


在 AI 领域,华为一直坚持从芯片开始往上做到应用框架,基本覆盖了人工智能的所有方向,换句话说,就是支持人工智能全栈全场景。截止 2019 年 3 月底,华为云共发布有 59 个服务,160+的功能。这很好得解释了为什么华为有能力开发业界首款 AI-Native 数据库 GaussDB,并获得如此高的性能提升。

为什么是云?

如华为方面所言,GaussDB 运行在云平台之上。其实,这个消息本身并不是很令人惊讶,即便是地位还算稳固的 Oracle 近年也一直在遵守云优先的策略,即功能更新会优先在云平台进行,这也可以理解为云业务拉新的一种手段。


传统的数据库体系结构已有 30 多年的历史,专为本地部署,本地存储和单机数据库实例而设计和优化,此后很长一段时间内,该体系结构未针对公有云环境进行优化。在公有云环境下,计算和存储通过网络分离以支持多租户数据库实例并 scale out 向两端扩展;并不要求单个节点的高可靠性。


举例来说,假设一个本地数据库的每个数据库实例都有本地存储,为了支持高可用性,通常部署一个备实例并使用数据库内部复制机制将数据库日志(MySQL binlog)发送到备实例重建数据库副本。目前,大多数云厂商都采用类似机制来支持云数据库高可用性。但是,这种内部复制机制并没有利用云存储已经通过存储层复制提供的可靠性,这导致大量存储和带宽浪费。实际上,备数据库实例可以通过云存储与主实例共享数据,不仅可以节省磁盘空间和带宽,还可以为云数据库服务提供快速 RTO。


很明显,在将传统数据库迁移上云时,需要重新设计和优化数据库系统。过去几年,主要云供应商,比如 AWS,已经做了部分工作。预计未来几年,更多云和数据库供应商将遵循这一趋势,构建某种形式的云原生数据库技术。此外,Gartner 预测,到 2019 年,90%的云数据库架构将支持计算和存储分离。


因此,根据云平台设计并提供 AI-Native 数据库 GaussDB 显然是目前最合适的方式。过去几年,华为一直在努力发展云计算业务,主要是为数据中心提供服务器和其他设备,但该公司的研发实验室也在研究企业软件产品。根据华为年度报告显示,去年其企业业务部门(包括面向企业客户的服务器和其他产品)收入增长 24%,至约 110 亿美元,约占该公司 1,060 亿美元总收入的 10%。


据了解,这也不是华为云第一次在云平台对数据库进行探索。自 2016 年 6 月起,华为共发布了 4 大类共 13 个数据库服务。其中,多模数据库 GeminiDB 可以通过一种服务满足多个数据库需要。


此前,华为云自研的关系型数据库 Taurus 也曾公开亮相。作为华为云自研的最新一代云原生分布式数据库,Taurus 完全兼容 MySQL 8.0,采用计算与存储分离、日志即数据的架构设计,支持 1 写 15 读,性能达到原生 MySQL 的 7 倍。


2019-05-16 08:3011621
用户头像
赵钰莹 极客邦科技 总编辑

发布了 883 篇内容, 共 646.0 次阅读, 收获喜欢 2679 次。

关注

评论 2 条评论

发布
用户头像
非常值得关注的一点:该数据库是在2012实验室领导下开发的,也说明该实验室不仅仅是有硬件,也有很多软件方向的前沿研究
2019-05-16 14:46
回复
用户头像
听着霸气侧漏啊,观望详后续情如何
2019-05-16 10:43
回复
没有更多了
发现更多内容

微信红包封面,2021年为啥突然火了?

架构精进之路

春节 微信红包封面 商业洞察

给hugo博客添加评论功能

远鹏

Hugo 静态博客 utterances

今日笔记

Nydia

ElasticSearch.03 - 基本原理

insight

elasticsearch 2月春节不断更

第一次异地过年有感

石君

思考 情感

翻译:《实用的Python编程》01_05_Lists

codists

人工智能 后端 python 爬虫 列表 数据结构与算法

C语言第三方库Melon开箱即用之词法分析器使用

码哥比特

c c++ Linux 后端 框架

写公号大半年,看看我都收获了些啥

架构精进之路

技术 总结 微信公众号 成长笔记

1.开篇(听说你还在艰难的啃react源码)

全栈潇晨

React React Hooks react源码

2.react心智模型(来来来,让大脑有react思维吧)

全栈潇晨

React React Hooks react源码

数据量大读写缓慢如何优化(5)【读缓存】

我爱娃哈哈😍

redis 缓存 架构设计实战 缓存设计

消息队列Kafka:入门基础

正向成长

kafka

1480. 一维数组的动态和

小马哥

算法 七日更

【LeetCode】数组拆分Java题解

Albert

算法 LeetCode 2月春节不断更

程序员成长第五篇:如何选择城市工作?

石云升

程序员 2月春节不断更 选择城市

IDEA插件:快速删除Java代码中的注释

xiaoxi666

Java 代码注释 JavaParser

诊所数字化:诊所老板为什么拒绝预约制?

boshi

数字化转型 医院 七日更

揭秘登上2021春晚舞台的黑科技-XR技术

架构精进之路

黑科技 vr 春晚 XR MR

深度讲解背包问题:面试中每五道动态规划就有一道是背包模型 ...

宫水三叶的刷题日记

深度思考 面试 LeetCode 动态规划 数据结构与算法

春节快过腻了?不妨关心下太空探索

脑极体

gradle中的增量构建

程序那些事

maven Gradle 程序那些事 构建工具

3.Fiber(我是在内存中的dom)

全栈潇晨

React React Hooks react源码

开发利器——C语言必备实用第三方库

码哥比特

c c++ Linux 后端 框架

13. 如果自己写的 Python 程序出错了,怎么办?

梦想橡皮擦

python 爬虫 2月春节不断更

日记 2021年2月17日(周三)

Changing Lin

2月春节不断更

EternalWallet为您提供快速、便捷、低价的国际汇款服务

Geek_c610c0

【活动回顾】4步2小时,搭建爆火的语音聊天室

ZEGO即构

【STM32】PWM 输出 (标准库)

AXYZdong

硬件 stm32 2月春节不断更

这是我的第一次JavaScript初级技巧

我是哪吒

JavaScript 学习 程序员 大前端 2月春节不断更

C语言实用第三方库Melon开箱即用之多线程模型

码哥比特

c c++ Linux 后端 框架

第四章作业-编写一个用例文档

秦挺

华为发布业界首款AI-Native数据库,挑动了谁的神经?
_服务革新_赵钰莹_InfoQ精选文章