最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

华为发布业界首款 AI-Native 数据库,挑动了谁的神经?

  • 2019-05-16
  • 本文字数:2538 字

    阅读完需:约 8 分钟

华为发布业界首款AI-Native数据库,挑动了谁的神经?

2019 年 5 月 15 日,华为在北京举办分布式数据库及存储新品发布会,重点发布了两款产品:业界首创的 AI Native 分布式数据库 GaussDB 和分布式存储产品 FusionStorage 8.0。其中,GaussDB 在发布之前就备受国内外媒体关注,不少媒体曾在文章中提及此举将对数据库老兵 Oracle 构成影响。

业界首个 AI-Native 数据库 GaussDB

传统企业数据处理以结构化数据为主,数据库+BI 应用为主要模式。智能时代,数据爆炸式增长,数据库系统规模越来越大,数据处理从结构化数据向结构化+非结构化的多样性数据处理转变,传统的人工维护方式将面临巨大挑战。因此,华为重定义数据库架构,将 AI 技术引入数据库,大幅提升数据库自动化管理和优化能力。


据介绍,GaussDB 是业界首款 AI-Native 数据库,也是业界第一款支持 ARM 的企业级数据库。其有两大创新:一是首次将人工智能技术融入分布式数据库的全生命周期,实现自运维、自管理、自调优、故障自诊断和自愈。在交易、分析和混合负载场景下,基于最优化理论,首创基于深度强化学习的自调优算法,调优性能比业界提升 60%以上;二是通过异构计算创新框架充分发挥 X86、ARM、GPU、NPU 多种算力优势,在华为实验室采用权威标准测试集 TPC-DS 进行测试的情况下,其性能比业界提升 50%,排名第一。


根据了解,AI-Native 数据库分为五个等级:


1、AI Advised,利用外挂 AI 引擎给出数据库优化建议,减少数据库管理员的负担;


2、AI Assisted,数据库内置 AI 引擎,实现在线辅助优化,提升数据库管理效率;


3、AI Enhanced,一方面将 AI 植入数据库内核组件、核心算法和数据结构,实现数据库自优化;


4、AI Assembled,实现数据库自愈并最优化 AI;


5、AI Designed,通过 AI 技术实现数据库的设计、验证、开发,达到全场景智能和普惠 AI 的目的。


现场,华为通过案例演示了 AI-Native 数据库 GaussDB 的强悍性能,比如在 OLAP 分析场景和 OLTP 事务场景下,使用 AI-Native 智能调优模式平均比其他自动调优方法性能提升 68%,比 DBA 调优提升 54%。


华为提出的 AI-Native 数据库,除了用 AI 理念重构数据库内核和算法之外,还考虑了如何在通用计算摩尔定律濒临失效的情况下,利用 GPU、NPU 等 AI 芯片算力来大幅提升 AI 算法的性能。


目前,GaussDB 支持本地部署、私有云、公有云等多种场景。在华为云上,GaussDB 为金融、互联网、物流、教育、汽车等行业客户提供全功能、高性能的云上数据仓库服务。这也是华为发布会的很大不同,产品发布的那一刻基本已经成功落地实践。

华为的 AI 能力

对于华为的 AI 能力,想必不少开发者都有所耳闻。在去年的HUAWEI CONNECT 2018大会上,华为就曾推出 ModelArts 全流程平台,可以让开发者更快地上手 AI、更快地加速模型训练和部署;更懂开发者的视觉 AI 应用开发平台 HiLens,搭载昇腾 310,因而可提供了强大的算力和存储空间,满足了较大的图像处理运算需求,甚至实现 1 秒百帧的处理能力及毫秒级人脸检测;离线的开发套件 Atlas 200,方便开发者在离线状态下研究和开发。


众所周知,华为有一个“传说中的”2012 实验室,是华为探索未来科技无人区的主战部队。此前,InfoQ 曾受邀参观了其中的诺亚方舟实验室,这是华为 AI 研发中心,展示的亮点为“人工智能能力演示”,如智慧终端的计算视觉、语音助手、推荐搜索;智慧企业的供应链大脑、问答系统等;热技术实验室则聚焦高集成封装、高密空冷、高效液冷/相变,展示器件低热阻、仿生散热器、相变液冷、声学降噪材料、流场可视化测试等技术。而此次发布的 GaussDB,就是在 2012 实验室领导下开发的。


在 AI 领域,华为一直坚持从芯片开始往上做到应用框架,基本覆盖了人工智能的所有方向,换句话说,就是支持人工智能全栈全场景。截止 2019 年 3 月底,华为云共发布有 59 个服务,160+的功能。这很好得解释了为什么华为有能力开发业界首款 AI-Native 数据库 GaussDB,并获得如此高的性能提升。

为什么是云?

如华为方面所言,GaussDB 运行在云平台之上。其实,这个消息本身并不是很令人惊讶,即便是地位还算稳固的 Oracle 近年也一直在遵守云优先的策略,即功能更新会优先在云平台进行,这也可以理解为云业务拉新的一种手段。


传统的数据库体系结构已有 30 多年的历史,专为本地部署,本地存储和单机数据库实例而设计和优化,此后很长一段时间内,该体系结构未针对公有云环境进行优化。在公有云环境下,计算和存储通过网络分离以支持多租户数据库实例并 scale out 向两端扩展;并不要求单个节点的高可靠性。


举例来说,假设一个本地数据库的每个数据库实例都有本地存储,为了支持高可用性,通常部署一个备实例并使用数据库内部复制机制将数据库日志(MySQL binlog)发送到备实例重建数据库副本。目前,大多数云厂商都采用类似机制来支持云数据库高可用性。但是,这种内部复制机制并没有利用云存储已经通过存储层复制提供的可靠性,这导致大量存储和带宽浪费。实际上,备数据库实例可以通过云存储与主实例共享数据,不仅可以节省磁盘空间和带宽,还可以为云数据库服务提供快速 RTO。


很明显,在将传统数据库迁移上云时,需要重新设计和优化数据库系统。过去几年,主要云供应商,比如 AWS,已经做了部分工作。预计未来几年,更多云和数据库供应商将遵循这一趋势,构建某种形式的云原生数据库技术。此外,Gartner 预测,到 2019 年,90%的云数据库架构将支持计算和存储分离。


因此,根据云平台设计并提供 AI-Native 数据库 GaussDB 显然是目前最合适的方式。过去几年,华为一直在努力发展云计算业务,主要是为数据中心提供服务器和其他设备,但该公司的研发实验室也在研究企业软件产品。根据华为年度报告显示,去年其企业业务部门(包括面向企业客户的服务器和其他产品)收入增长 24%,至约 110 亿美元,约占该公司 1,060 亿美元总收入的 10%。


据了解,这也不是华为云第一次在云平台对数据库进行探索。自 2016 年 6 月起,华为共发布了 4 大类共 13 个数据库服务。其中,多模数据库 GeminiDB 可以通过一种服务满足多个数据库需要。


此前,华为云自研的关系型数据库 Taurus 也曾公开亮相。作为华为云自研的最新一代云原生分布式数据库,Taurus 完全兼容 MySQL 8.0,采用计算与存储分离、日志即数据的架构设计,支持 1 写 15 读,性能达到原生 MySQL 的 7 倍。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-05-16 08:3011195
用户头像
赵钰莹 InfoQ 主编

发布了 874 篇内容, 共 604.6 次阅读, 收获喜欢 2671 次。

关注

评论 2 条评论

发布
用户头像
非常值得关注的一点:该数据库是在2012实验室领导下开发的,也说明该实验室不仅仅是有硬件,也有很多软件方向的前沿研究
2019-05-16 14:46
回复
用户头像
听着霸气侧漏啊,观望详后续情如何
2019-05-16 10:43
回复
没有更多了
发现更多内容

一图看懂CodeArts Governance 三大特性,带你玩转开源治理服务

华为云PaaS服务小智

云计算 软件开发 华为云

下载安装Ipa Guard

雪奈椰子

如何借助CDC快速实现实时数据传输?

RestCloud

数据同步 ETL CDC

Postman 调试 WebSocket 接口完整指南

Liam

Postman websocket 接口调试 测试工具 API 测试

Java基础面试题【七】线程池

派大星

Java 面试题

什么是 Merge Queue,为什么要使用它?

高端章鱼哥

merge 合并队列

广交会场外蹭热度 第六届广州五金交易会如期召开!

Geek_2d6073

枚举探秘:Java中的神奇力量!

互联网工科生

枚举 java

Trino容错模式深度测评与思考

华为云开发者联盟

大数据 后端 华为云 华为云开发者联盟 交互式分析

漱玉平民大药房:多元化药店变革的前夜

TiDB 社区干货传送门

mac软件推荐:CAD迷你看图中文版

胖墩儿不胖y

Mac软件 cad软件 CAD看图工具

基于知识图谱建模、全文检索的智能知识管理库(源码)

金陵老街

java

百度飞桨AI4S亮相全国动力学设计与反问题研讨会,助力汽车底盘智能设计

飞桨PaddlePaddle

深度学习 AI for Science

TiDB 7.4 发版:正式兼容 MySQL 8.0

TiDB 社区干货传送门

深度学习应用开发示例之像素分割

矩视智能

深度学习 像素分割

打造次世代分析型数据库(六):如何从零实现向量化引擎

腾讯云大数据

数据库

使用eBPF加速阿里云服务网格ASM

阿里巴巴云原生

阿里云 云原生 服务网格

TiDB v7.4.0 版本上线啦!看看有没有你想要的功能上线啦!

TiDB 社区干货传送门

测试过程效率的提升和演变

老张

软件测试 研发效能 质量保障

OpenHarmony社区运营报告(2023年9月)

OpenHarmony开发者

MySQL的index merge(索引合并)导致数据库死锁分析与解决方案 | 京东云技术团队

京东科技开发者

MySQL 数据库 索引 企业号10月PK榜

TiDB x 安能物流丨打造一栈式物流数据平台

TiDB 社区干货传送门

TiDB x Bolt丨超强可扩展性与弹性助力超 1 亿用户畅享出行服务

TiDB 社区干货传送门

企业如何选择安全又稳定的文件传输协议

镭速

大文件传输 文件传输协议

七个 LLM 的狼人杀之夜;马斯克的星链残骸会“砸死人”?OpenAI 安全漏洞曝光丨RTE开发者日报 Vol.66

声网

可完全替代FTP的文件传输工具大集合

镭速

文件传输工具 替代FTP FTP传输文件

如何开发区块链应用程序:分步指南

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 链游开发 NFT开发

TiDB x Catalyst丨秒级洞悉数据价值,TiDB 帮助“客户成功 SaaS 厂商”提升用户体验

TiDB 社区干货传送门

IPQ8074 Industrial Router with QCN9074/QCN9024 WiFi Network Card - Excellent performance and comprehensive coverage

wifi6-yiyi

QCN9074 IPQ8074

浅析斐波那契数列在代码中的应用

emanjusaka

Java 后端

软件测试/测试开发丨Postman实战练习 学习笔记

测试人

Python 软件测试 测试开发

华为发布业界首款AI-Native数据库,挑动了谁的神经?
_服务革新_赵钰莹_InfoQ精选文章