写点什么

迅速 get 华为云深度学习“黑科技”

2020 年 4 月 07 日

迅速get华为云深度学习“黑科技”

近日,由华为云举办的 Deep Learning Meetup 活动在华为杭州研究所举行。来自爱罗智能公司、杭州电子科技大学、华为云 EI 产品部等相关业界专家与现场听众,围绕深度学习技术的发展方向和领域应用等话题一起展开了深入交流与讨论。其中华为云 EI 专家给现场观众带来了《华为云深度学习服务介绍及实践》的主题演讲,那么,华为云深度学习平台究竟有哪些黑科技呢?现场干货满满,快来和我一起先睹为快~



华为云 EI 专家现场讲解华为云 EI 黑科技


多年积累 助力用户降低深度学习训练门槛

随着深度学习应用的不断推广,各行各业的用户都希望能够利用深度学习技术来解决实际场景问题。但是,深度学习模型训练需要具备一定的深度学习技术和编程能力,使得很多用户虽有满腔模型训练之志,却不得不败在深度学习的技术门槛上。


因此,如何让不会深度学习编程的用户,同样能够完成深度学习模型训练和模型应用,就是深度学习应用推广所面临的一个重大挑战。华为云的深度学习服务,使用迁移学习技术,将华为针对多个典型客户场景,所训练出的高性能的深度学习模型,预置在华为云深度学习服务中。行业用户在训练自己的行业模型时,只需要使用华为云深度学习服务,用自己的行业数据对预置模型进行重新训练,即可得到自己所需的行业模型。这整个操作过程只需 2 步操作即可完成,用户不必具备任何深度学习技术和编程基础。目前,华为云深度学习服务已经内置了包括提供图像分类、物体检测等在内的几十种 CNN/RNN 神经网络算法模型,方便用户进行便捷模型训练。


破除分布式编程壁垒 分布式训练不再是难题

在实际应用中,由于深度学习的网络层复杂、训练数据规模庞大,训练时间非常长,因此通常采用分布式计算来减少训练时间。但是,分布式开发本身就具有一定的技术门槛,很多用户并不具备分布式开发能力。因此,如何解决用户对单机代码的分布式改造是深度学习应用推广所面临的另一个重大挑战。


华为云深度学习服务,提供了自研的的 MoXing 高层库。用户在使用 MoXing 库进行模型开发时,只需聚焦业务逻辑代码实现,无需关心分布式和单机版的问题。一套代码既可以运行在单机模式,也可运行在分布式模式,这样就解决了不会分布式编程,却需要进行分布式训练的难题。同时,MoXing 库完全兼容 TensorFlow、MXNet、Keras 等主流开源库,给用户提供多的选择。


GPU 集群加速 降低分布式训练时间

使用 MoXIng 高层库解决分布式编程问题后,还需要解决分布式训练线性加速比的问题。由于深度学习需要使用海量数据来进行模型训练,因此通常需要使用 GPU 集群来进行分布式训练。但是,开源的分布式训练框架,在保证模型收敛的情况下,最大集群规模只支持 10 块 GPU。这意味着在进行数据运算时,即时使用更多的 GPU,计算效果也只相当于 10 块 GPU 的能力。


华为云深度学习服务,基于系统软硬件结合方案,搭载华为云的云容器引擎 CCE、GPU 高性能计算、对象存储服务(OBS)、高性能网络等能力,并通过混合并行、梯度压缩、卷积加速、EASGD 等技术加快模型训练速度。使得在 1000 块 GPU 的大规模集群中,分布式训练线性加速比也能够达到 0.8,大大降低集群分布式训练时间。


一个平台适用不同类型用户

对于深度学习的用户群而言,不同的用户,需求也不一样。对于初级用户而言,最好在界面上拖拖拽拽,点几下鼠标就完成深度学习训练。而对于骨灰级的用户,就是越自由,越开放越好,这样才能吸引骨灰级用户的关注与使用,满足高级用户的定制化需求。


华为云深度学习服务充分考虑到了用户的差异性,针对不同用户的需求,提供不同的开发环境。当前华为云深度学习服务将用户群分为从初级到骨灰级 5 个等级,针对不同等级的需求,华为深度学习服务提供不同的开发环境。例如:对于初级用户,提供了预置模型重训练功能,无需任何深度学习知识;对于入门级用户,MoXing 库提供了多种模型的接口,提供给用户使用;对于骨灰级用户,则提供了完全开放的开发环境,用户可自由选择开发方式,真正实现随需选择、自由定制,一个平台满足所有用户的诉求。


除了这些黑科技外,华为云深度学习服务还在平台管理、模型压缩、二次开发 API 等方面做了很多优化。基于此,用户可以借力华为云深度学习服务,降低深度学习训练和使用的难度。后续,华为云深度学习服务还会继续上线更多黑科技,帮助企业用户快速进入探索智能世界的轨道。


本文转载自华为云产品与解决方案公众号。


原文链接:https://mp.weixin.qq.com/s/5H9D3Wz8VOTTsAIW40v5ag


2020 年 4 月 07 日 17:20307

评论

发布
暂无评论
发现更多内容

JVM系列之:JIT中的Virtual Call接口

程序那些事

Java JVM JIT

你不是说你会Aop吗?

Java旅途

计算机网络基础(十二)---网络层-外部网关路由协议

书旅

计算机网络 网络 协议栈 BGP

设计模式

张明森

企业玩转DevOps转型:由弱到强,只需7步

华为云开发者社区

DevOps 软件工程 组织转型 软件开发 华为云

阿里巴巴《Java 开发手册》—嵩山版发布,附下载链接!

程序员生活志

Java 学习 阿里巴巴 手册

从0到1搭建大数据平台之数据采集系统

数据社

大数据 数据采集

从0到1搭建大数据平台之调度系统

数据社

大数据 工作流调度

MySQL 的 crash-safe 原理解析

vivo互联网技术

MySQL 数据库 开源项目

3行!仅3行代码就能抓取B站(弹幕、评论、用户)数据

华为云开发者社区

数据 B站 代码 词云图 API

简述 JVM 垃圾回收原理

一叶知秋

week 9 作业

Geek_2e7dd7

两万字长文50+张趣图带你领悟网络编程的内功心法

arthinking

网络协议 TCP/IP

ARTS-WEEK9

一周思进

ElasticSearch笔记

石刻掌纹

聚焦智慧城市生活服务,百度携手贝塔智能按下“加速键”

百度大脑

人工智能 人脸识别 AR 百度大脑 智慧城市

如何从0到1搭建大数据平台

数据社

大数据 中台

从0到1搭建大数据平台之计算存储系统

数据社

大数据 中台 计算引擎

区块链标准化很重要吗?

CECBC区块链专委会

区块链 区块链规范

全国首个市场监管区块链电子取证平台正式上线

CECBC区块链专委会

区块链

手把手教你实现自定义Spring Boot的 Starter

java金融

Java spring 程序员 Spring Boot starte

100% 展示 MySQL 语句执行的神器-Optimizer Trace

程序员历小冰

MySQL

成功的9大步骤:从手动测试转为自动化测试

陈琦

测试 自动化测试

Flink x Zeppelin ,Hive Streaming 实战解析

Apache Flink

flink hive Zeppelin

自主管理——对人性的假设

zhongzhq

自主管理 组织

LeetCode 328. Odd Even Linked List

liu_liu

算法 LeetCode

分布式环境下,我想要一致性

架构师修行之路

分布式 分布式系统 架构师 CAP

week 9 学习总结

Geek_2e7dd7

redis-port支持前缀迁移

心平气和

redis redis-port

LeetCode题解:70. 爬楼梯,DP遍历,变量缓存结果,JavaScript,详细注释

Lee Chen

LeetCode 前端进阶训练营

什么样的服务器适合做APP?

德胜网络-阳

迅速get华为云深度学习“黑科技”-InfoQ