东亚银行、岚图汽车带你解锁 AIGC 时代的数字化人才培养各赛道新模式! 了解详情
写点什么

中科院计算所陈云霁:未来我们有没有可能做一个通用的智能处理器?

  • 2019-09-20
  • 本文字数:3241 字

    阅读完需:约 11 分钟

中科院计算所陈云霁:未来我们有没有可能做一个通用的智能处理器?


9 月 18 日上午,智源研究院研究方向“智能体系架构与芯片”发布会在北大科技园正式召开。会上,中科院计算所智能处理器中心主任、智源首席科学家陈云霁老师就“智能体系架构与芯片”发布主题报告。


陈云霁老师在报告中指出:智能计算系统相关技术具有战略意义,但在目前依旧处于不成熟阶段;智能体系架构和芯片是探索智能计算系统的学科方向,现在正面临着整机、编程、芯片、方法四个关键研究问题。另外,在本次报告的最后,陈云霁老师还对“智能体系架构与芯片”研究方向提出了新设想——做通用型智能处理器,全面支持不同的智能算法。

智能计算系统具有重要意义

智能计算系统是智能的核心物质载体,如果智能时代到来,上层建筑的发展必然会是基于智能计算系统技术的成熟。陈云霁老师称:中国现在正处于信息时代向智能时代“进化”的拐点,智能计算系统的研究具有战略性意义。


  1. 智能计算系统是智能产业发展的源动力


在工业时代,电力是所有工作的核心。同样,进入到智能时代,智能计算系统会像工业时代的电力一样,作为智能业务的基石,推动整个产业的发展。不管智慧云、智慧城市、智能机器人、智能驾驶、智能金融、智能医疗、智能教育等等,背后需要智能计算系统提供的算力。


  1. 智能计算系统是基础研究发展的源动力


在很多传统的科学方向,不管是数学、物理、天文、生物等等,都开始在大量的运用人工智能技术,所以有一种看法:科学研究正在进行一种新的智能革命。在过去,科学研究主要有三个手段,逻辑推理、实验、模拟,而智能则可能成为第四个科学研究的手段。基础科学研究的背后需要智能计算系统提供算力作为支撑。


2019 年 6 月份普林斯顿大学团队用深度神经网络的方法,对整个宇宙的演进进行模拟,在国际上产生了非常大的反响。


  1. 智能计算系统是智能科学发展的源动力


对于未来构建的智能计算系统,它的算力越大,某种意义上对智能本质的理解就会越加得深入。


陈云霁老师说道:“我记得我们所长问过我一个问题,未来如果有一天我们拥有无限计算能力的时候,人工智能应该往哪个方向发展?“


通用人工智能或许可以被称作是 AI 技术的“珠穆朗玛峰”,当二三十年后探索通用人工智能时,强大的计算能力必不可少,所以不管从产业、从研究,包括从智能本身,提供算力的智能计算系统都是源动力。

尚未成熟的事实

智能计算系统虽然非常重要,但是就目前而言,它的技术还没有完全成熟,这里面有诸多的问题,比如智能计算系统的能效。


Green AI 是一个新观点,它要求智能向绿色的方向发展,至少不耗废太多的电。AlphGo,一盘棋需要好几千度的电,这样看来,即使它赢了棋,在能耗方面依旧是短板。有人预测,到 2025 年人工智能的耗电量将占全世界耗电量的 10%。如果人工智能的研究不考虑能耗问题,“智能改变生活”或许会沦为空谈。

四个关键研究问题

除了明确智能计算智能系统的重要性,陈云霁老师还表示:智源将从方法、芯片、编程和系统四个层次,研究高效的智能计算体系结构,并探索多种类型的芯片实现。研究内容包括开源智能芯片设计方法、类脑智能芯片设计、机器学习芯片设计、可重构智能芯片设计、智能计算编程编译方法、智能控制系统设计以及智能超算系统构建。


整机:智能云端与终端

云、终端的问题与挑战:


  • 张量运算具有重要应用,往往以稀疏张量问题形式存在。

  • 现有机器学习平台在稀疏张量的运算方面效率很低。

  • 开发高性能稀疏张量算子库需要高昂开发成本。

  • 控制功能在智能终端中无处不在。

  • 输入参数固定,控制任务单一。

  • 智能终端的核心是“小脑”。


解决技术思路:


  • 面向大规模图计算平台,实现高性能稀疏张量运算:

  • 稀疏张量及运算的编程抽象和领域语言。

  • 面向 GPU 单卡的代码生成与性能优化。

  • 面向多 GPU 卡的代码生成与性能优化。

  • 内核融合方法:

  • 融合一个计算图中的节点所对应的内核函数。

  • 通过一次函数调用完成所有计算。

  • 降低平台调度和内核启动开销。

编程:智能计算编程编译

问题与挑战:


  • 现有深度学习模型的编译过程是与体系结构无关的图变换和优化。

  • 现有类脑计算的网络建模/编译等工具链软件普遍存在功能需求与实现方式紧耦合,缺乏自动化建模支持手段等瓶颈问题,制约了开发效率的提升。

  • 近年来出现的深度学习框架与类脑神经网络集成的研究工作尚处在初步阶段,没有针对网络特点进行多层次优化。

芯片:最适合智能处理的芯片架构

最适合智能处理的芯片架构应该是什么样子?目前的智能处理芯片大致可分为以下四种:


  1. 类脑智能芯片


类脑芯片不采用经典的冯·诺依曼架构, 而是基于神经形态架构设计,以 IBM Truenorth 为代表。 IBM 研究人员将存储单元作为突触、计算单元作为神经元、传输单元作为轴突搭建了神经芯片的原型。由于神经突触要求权重可变且要有记忆功能, IBM 采用与 CMOS 工艺兼容的相变非挥发存储器(PCM)的技术,实验性地实现了新型突触,加快了商业化进程。


  1. 机器学习芯片


机器学习芯片基于机器学习算法,通常可分为 ASIC、GPU、FPGA 等不同的技术方向。像寒武纪的 MLU 系列、华为海思的昇腾系列、英伟达的 GPU 等都是典型的机器学习芯片。但是有一点需要说明的是,这种机器学习芯片大多数为同构的深度学习处理器,而且一款智能处理器只对应一类智能算法。


  1. 可重构智能芯片


可重构芯片具备软件、硬件双编程的特性,硬件架构和功能随软件变化而实时动态变化,因而又被称为软件定义芯片。可重构芯片的出现打通了“应用定义软件、软件定义芯片”进而实现“应用定义芯片”这一人们长期追求的通道,而广泛的适应性也使其成为替代专用集成电路、可编程器件和经典处理器的有力竞争者。


注:可重构智能芯片不是 FPGA。两者最大的区别在于,可重构智能芯片具有软件硬件都可以编程、混合粒度、芯片的硬件功能随软件的变化而变化等特性。


  1. 时间序列神经网络芯片


世界上大量的信息同时具有时间和空间特性,时间顺序是数据样本中重要的信息。循环神经网络 RNN 和长短期记忆神经网络 LSTM 都具有时间信息综合能力。而时间序列神经网络芯片则主要是基于这两种算法模型而设计的 AI 芯片。

方法:科学的智能芯片设计方法

智能时代,新的计算模式带来了面向新兴计算模式和新兴子领域的专用智能芯片微架构的敏捷设计需求。开源芯片和敏捷设计成为国际竞争的重点,美国 DARPA 的电子复兴计划在积极资助开源硬件和敏捷开发相关的研究。


智源将持续关注智能设计、敏捷开发、设计重用的 IDEA/CRAFT/CHIPS 项目、以及关注开源硬件、软件定义硬件、定制系统的 POSH/SDH/DSSOC 项目。


另外,计算和存储分离带来了“冯·诺伊曼瓶颈”——经典计算机体系结构的基础科学问题,导致存储器速度远低于处理器。为形成科学的智能芯片设计方法,需要在集成开源 IP、开源 EDA 工具链、FPGA 仿真验证、系统软件设配技术等方面持续深耕。

智源将要做什么?

一款智能处理器对应一类智能算法,是现在智能芯片产业的现状,但面对复杂的应用环境,单一的智能处理器显然是不足够的。在本次发布会上,陈云霁老师提出了智源关于智能芯片的新设想:未来我们有没有可能做一个通用的智能处理器?


与现在大多数同构的深度学习处理器不同,通用智能处理器旨在集成多个异构智能处理单元,分别处理不同的任务。就像人的大脑一样,学习、感知、记忆、抽象、联想等都能去做,而且高效的完成各种任务。另外通用智能处理器中的多个异构智能处理单元,通过异构并行,还可以组合完成更复杂的智能功能。


如神经网络、贝叶斯网络、逻辑求解器、知识图谱等主流人工智能模型,在某种条件下可以抽象成图或树,这就说明“图的处理”或许可以算作研究通用智能处理器的一个方向。陈云霁老师在本次报告的最后,还提出了“从算法共性范式出发,探索更广阔的人工智能算法共性,进而找到智能处理单元的统一抽象、交互和编程”的解决方案。


注:北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)是落实“北京智源行动计划”的重要举措,在科技部和北京市委市政府的指导和支持下,由北京市科委和海淀区政府推动,依托北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京人工智能领域优势单位共建的新型研发机构。


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-09-20 15:072462
用户头像
张之栋 前InfoQ编辑

发布了 91 篇内容, 共 46.3 次阅读, 收获喜欢 159 次。

关注

评论

发布
暂无评论
发现更多内容

火山引擎 DataLeap 构建Data Catalog系统的实践(一):背景与调研思路

字节跳动数据平台

算法复杂度介绍

宁静知行者

算法

手把手带你搭建企业低成本万能架构

EquatorCoco

架构 软件架构 低成本

大模型加速学科升级,飞桨赋能北邮“X+大模型”特色小学期

飞桨PaddlePaddle

人工智能 百度 paddle 百度飞桨

第九届“互联网+”大赛产业赛道百度命题正式公布!57道命题,等你揭榜!

飞桨PaddlePaddle

人工智能 百度

扫光动效在移动端应用实践

百度Geek说

动效 移动端 企业号 7 月 PK 榜

如何用Java校验SQL语句的合法性?有这5种解决方案

高端章鱼哥

Java sql

POCO库的安装与基础知识说明

二哈侠

合作、参与、让开源更易用 | 亚马逊的开源文化

亚马逊云科技 (Amazon Web Services)

云计算

揭秘元宇宙背后的最炫科技风

华为云PaaS服务小智

云计算 华为云 元宇宙

inBuilder今日分享丨系统集成系列之异构接入

inBuilder低代码平台

集成

华为开发者大会2023(Cloud):华为云邀您共话开源

华为云开源

开源 云原生 HDC.Cloud

时序数据库 TDengine 与 DBeaver 达成合作,生态系统再壮大

爱倒腾的程序员

涛思数据 tdengine 时序数据库

如何自动化测试你的接口?—— Rest Assured

不在线第一只蜗牛

自动化 自动化测试 API

高性能存储SIG月度动态:io_uring支持nvme直通,DSMS完成开发测试

OpenAnolis小助手

开源 io_uring 高性能存储 anck 龙蜥sig

Flink-Learning 实战营在升级!更多精美好礼等你来!

Apache Flink

大数据 flink 实时计算

组合框架:融合创新技术,实现一次编码多平台运行

FinFish

flutter 跨端开发 小程序容器 跨端框架 跨端应用开发

多项目管理难在哪,多项目同时进行该如何做好进度管理?

优秀

项目管理 项目进度管理

代码随想录训练营 Day06 - 哈希表(上)

jjn0703

SQL 优化(四):如何使用 join

hungxy

2023 MWC上海:移动云勇担新基建国家队 引领算网新趋势

Geek_2d6073

软件DevOps云化发展的趋势 【课程限时免费】

华为云PaaS服务小智

云计算 DevOps 云原生 华为云 华为开发者大会2023

和鲸科技 ModelWhale 入选北京市人工智能行业赋能典型案例(2023)丨2023全球数字经济大会人工智能高峰论坛

ModelWhale

人工智能 AI 数字化 大模型 论坛

数据挖掘18大算法实现以及其他相关经典DM算法:决策分类,聚类,链接挖掘,关联挖掘,模式挖掘。图算法,搜索算法等

汀丶人工智能

人工智能 数据挖掘 机器学习 深度学习 决策树

追击策略?微软云服务器业务2022年规模少于亚马逊AWS一半

B Impact

一篇文章带你上手性能测试框架K6

QE_LAB

自动化测试框架 测试自动化 #性能测试

谁是家居智能化时代“头号玩家”? 小度全屋智能将登陆中国建博会

新消费日报

用ChatGPT搞定K8s!

互联网工科生

k8s kubernetes 运维 ChatGPT

通过容器化实现前端微服务化架构设计

FinFish

小程序容器 小程序化 小程序技术 前端服务化

营销SaaS SemRush 2.9 亿美元年收入的五个经营数据分析

B Impact

2023-07-03:讲一讲Redis缓存的数据一致性问题和处理方案。

福大大架构师每日一题

redis 底层原理 福大大架构师每日一题

中科院计算所陈云霁:未来我们有没有可能做一个通用的智能处理器?_AI&大模型_张之栋_InfoQ精选文章