【大咖分享】AI 大模型时代,架构师有哪些机遇和挑战? 了解详情
写点什么

达芬奇密码:昇腾芯片的前世今生

  • 2020-02-15
  • 本文字数:851 字

    阅读完需:约 3 分钟

达芬奇密码:昇腾芯片的前世今生

AICon 北京 2019 大会上,王晓雷讲师做了《达芬奇密码:昇腾芯片的前世今生》主题演讲,主要内容如下。


演讲简介


作为当前计算密度最大的单芯片,昇腾 910 芯片依照着华为公司“全栈全场景”的智能战略,仍旧采用了与去年发布的昇腾 310 一样的达芬奇架构。众所周知,在深度学习领域,从框架到模型,从 API 到库都是高度定制化的。这一自研架构在带来更强的算力与更好的能效比的同时,在逐步优化使用体验并建立用户生态的过程中,也遇到了不少困难和挑战。


本次分享将尝试回答下面几个问题:


  1. 为什么人工智能专用芯片具有强大的算力和能效比?

  2. 达芬奇架构的加速原理是什么样子的?

  3. 如果想要针对某种特定架构优化我的算法,使其达到性能最优,我可以采取什么策略?


在过去一年逐步完善人工智能芯片解决方案的具体实践中,我们也总结出了一些经验。本次演讲结合理论与实践,以深度学习中最常用的卷积算子优化为例,希望能够为大家在网络优化的道路上带来一些启发和帮助。


内容大纲


一、商业价值=数据+算法+算力


二、计算芯片加速理论


GPU


TPU


三、典型智能计算芯片加速原理


计算单元


存储系统


控制单元


指令集设计


四、加速实战:卷积算子


基于矩阵计算单元的矩阵运算


卷积算子参数定义和数据排布方式


输入特征图数据的格式转换


分块矩阵相乘


性能分析


五、总结


深度学习性能提升小秘诀


人工智能芯片的发展趋势


听众受益点


  1. 技术上,结合硬件架构的发展趋势,通过对算法加速理论的讲解,帮助算法开发人员理解人工智能算法的加速原理,把握算法和硬件的发展趋势。

  2. 业务上,将算法加速理论与硬件架构相结合,逐点解析卷积算子的实现,帮助听众掌握针对特定领域架构芯片的算法优化方法。


讲师介绍


王晓雷,华为海思图灵智能算法专家。


王晓雷是海思图灵智能算法专家,在推荐系统、人机交互、多模态对话管理方向有丰富项目经验。曾为金融、零售、汽车等行业多家五百强公司提供算法咨询服务,致力于为企业量身打造端到端智能解决方案。目前专注于昇腾处理器的解决方案设计与生态建设。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2019/beijing/schedule


2020-02-15 17:06564

评论

发布
暂无评论
发现更多内容

在线编码、格式转换

人生如梦

React 在线格式化 在线编码 转码工具

DevOps实践中的“道法术器”

阿泽🧸

DevOps 9月月更

阻碍【程序员职业发展】的 5 个“绊脚石”

掘金安东尼

程序员 前端 9月月更

TCP/IP参考模型

StackOverflow

编程 计算机网络 9月月更

数据治理(十四):Ranger同步Linux用户

Lansonli

数据治理 数据安全 9月月更

AQS 阻塞队列机制源码分享

new life

AQS

VUE v-for 循环的 2 个使用

HoneyMoose

AQS 条件队列机制源码分享

new life

AQS

为什么需要微服务

穿过生命散发芬芳

微服务 9月月更

ATDD的小妙用

Bruce Talk

敏捷开发 随笔 Agile

Spring @PostMapping 能在 URL 中带有参数吗

HoneyMoose

redis 缓存

想要飞的猪

redis 淘汰策略 redis缓存过期

【Nacos云原生】阅读源码第一步,本地启动Nacos

石臻臻的杂货铺

云原生 nacos 9月月更

Lombok、JUnit——开发工具插件

胖虎不秃头

maven java; 9月月更

HTTPS TLS 1.2

懒时小窝

https HTTP

Maven——自动化构建工具

胖虎不秃头

Web java; 9月月更

【C语言】字符函数&字符串函数&内存函数(下)[进阶篇_复习专用]

Dream-Y.ocean

c c++ 9月月更

树莓派部署Elasticsearch6集群

程序员欣宸

elasticsearch 9月月更

Python 教程之变量(3)—— 全局变量和局部变量

海拥(haiyong.site)

Python 9月月更

2022-09-11:arr是一个可能包含重复元素的整数数组,我们将这个数组分割成几个“块”, 并将这些块分别进行排序。之后再连接起来,使得连接的结果和按升序排序后的原数组相同。 我们最多能将数组分成

福大大架构师每日一题

算法 rust 福大大

开始思考吧

吴京

学习 思考 思想

【iOS逆向】某不知名App越狱检测

小陈

iOS逆向

VUE v-for 数据引用

HoneyMoose

【C语言深度剖析】深入理解字符数组和字符串数组

Albert Edison

C语言 9月月更 strlen 字符数组 字符串数组

太赞了,使用应用魔方 AppCube,我没有写一行代码就开发出了一款投票微信小程序

wljslmz

微信小程序 低代码开发 AppCube 9月月更

架构师的十八般武艺:架构边界

agnostic

架构边界

分布式锁

想要飞的猪

分布式锁 redis分布式锁 zookeeper分布式锁

B-Tree索引

急需上岸的小谢

9月月更

Moment.js 如何对时间进行比较获得不同的天数

HoneyMoose

【JavaWeb】Filter系列——过滤器有什么用,如何编写?Filter过滤器的设计模式

胖虎不秃头

java; 过滤器 9月月更

如何刻意练习-中秋读书随笔

刘旭东

刻意练习

  • 扫码加入 InfoQ 开发者交流群
达芬奇密码:昇腾芯片的前世今生_AICon_王晓雷_InfoQ精选文章