2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

智源研究院理事长张宏江:大模型就是下一个 AI 的基础平台丨智源大会

  • 2021-06-02
  • 本文字数:1287 字

    阅读完需:约 4 分钟

智源研究院理事长张宏江:大模型就是下一个AI的基础平台丨智源大会

2021 年 6 月 1 日,由北京智源人工智能研究院主办的2021 北京智源大会在中关村国家自主创新示范区会议中心开幕,会期三天。智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动,本文为 InfoQ 记者带来的现场报道。


以下内容根据演讲速记进行整理,未经本人确认。


下面由我来介绍智源对大规模智能模型发展的思考,以及在这方面的布局。


人工智能历经符号 AI、感知智能两代的发展,现在已进入由“数据-知识”双轮驱动的第三代人工智能。


第三代人工智能的核心思路是推进数据统计与知识推理融合,以及脑认知机理融合的计算,从认知的角度实现通用人工智能。


在这个方向上,“大模型+大算力”是迈向通用人工智能的一条可行路径。国际上,OpenAI 正是通过制造通用机器人和使用自然语言的聊天机器人,实现其通用人工智能发展战略。这个战略在去年有一个非常好的落地,就是去年 5 月发布的 GPT-3 模型,参数达 1700 亿;今年 1 月发布 DALL·E 模型具有强大的“文本-图像”生成能力。


从这个途径上来看,大模型对于人工智能具有重大意义,在于未来将基于大模型形成类似于电网的变革性产业基础设施。AI 大模型相当于过去一百年前开始普及的“发电厂”,它将把数据,也就是“燃料”,转换成智能的能力,转化成驱动各种 AI 的能力。如果将大模型和所有的 AI 应用相连接,将会为所有用户提供统一的智能能力,全社会形成一个智能能力生产和使用的网络,即“智网”。所以,大模型就是下一个 AI 的基础平台。


智源研究院作为 AI 基础建设的先行者,从去年 10 月份开始启动超大规模智能模型研发工作。今年 3 月 20 日,我们发布了中国首个超大规模智能模型“悟道 1.0”,取得了多项领域领先的突破。包括中文、多模态、认知、蛋白质预测在内的系列模型,取得了多项国际领先的 AI 技术突破,实现了我国在超大规模预训练技术上的并跑。


在研发“悟道”的过程中,很重要的一点是,改变了过去小团队的模式,我们用系统的方法做 AI 建立有目标的大团队,以问题为导,探索出最好的解决方案,这一块其实也是人工智能发展到今天的一个在模式上的转变。我们过去更多的强调是小范围的突破,今天人工智能走出实验室,从算法到技术,从小模型到大模型,这也是我们智源过去一年多的重点,就是如何把北京市,把全国 AI 研发的力量整合到一块,形成一个大兵团进剿的模式,把算力整合到一块,也是去年工作的重点。


在这里,悟道团队由智源研究院的学术副院长唐杰教授领衔,100 多位科研骨干共同参与的“悟道”团队,启动大规模智能模型研发工作,形成了人工智能的特战团队。经过一年多的努力,我们看到了一系列的成果,也就是今天发布的 2.0,就是阶段性的发布,相信我们未来还会有一系列的发布。今天我想重点要说的是 2.0 的一系列突破,真正推动了大模型作为 AI 的这样一个基础平台。


“悟道”2.0 智能模型系统将构建“大模型、大平台、大生态”:一是以“大规模”“高精度”“高效率”为发展目标,持续研发大模型;二是围绕大模型研发,构建大规模算力平台,支撑“信息”“生命”“物理”领域的大模型研发,我们希望通过大模型、大平台,能够和更多的工业运用者进行合作;三是通过示范应用搭建、API 开放、开源社区等,构建大模型生态。

2021-06-02 15:482456

评论

发布
暂无评论
发现更多内容

《零基础》MySQL 连接的使用(二十),springcloud开发教程

Java 程序员 后端

【DM】达梦数据库中的物理备份与还原,java程序设计项目教程眭碧霞第四章答案

Java 程序员 后端

《重构 改善既有代码的设计 3》代码的可理解性应该是我们虔诚追求的目标

Java 程序员 后端

《菜菜的机器学习sklearn课堂》逻辑回归,java教程百度云最新版

Java 程序员 后端

【C语言基础系列】C语言分支结构,java反射原理面试

Java 程序员 后端

【Java 异常】try-catch,mysql菜鸟入门系列

Java 程序员 后端

《大型数据库技术》MySQL的进阶开发技巧,java基础知识重点总结pdf

Java 程序员 后端

【C语言】指针总结,Java程序员如何有效提升学习效率

Java 程序员 后端

【DM】DMSQL程序的基本操作,下载量瞬秒百万

Java 程序员 后端

【DM】教你用JDBC连接达梦数据库并进行增删改查,java项目百度网盘

Java 程序员 后端

【Docker 1】入门,nginx架构移植

Java 程序员 后端

“一学就会”微服务的架构模式,一名毕业三年的女程序媛面试头条经验

Java 程序员 后端

《JVM系列》 第五章 -- 堆空间与对象分配,springboot项目分层架构

Java 程序员 后端

《Spring实战》读书笔记-第3章 高级装配,全网最具深度的三次握手、四次挥手讲解

Java 程序员 后端

“情商比智商重要”,java面试代码题

Java 程序员 后端

【C语言】动态内存分配,nginx调优与监控

Java 程序员 后端

【DM】达梦DEM WEB管理器的搭建,mybatis基本工作原理

Java 程序员 后端

【Java从0到架构师】JDBC,Java多态实现原理解析

Java 程序员 后端

【Java从0到架构师】Spring - 复杂对象,java的多线程的底层原理

Java 程序员 后端

【Java从0到架构师】Spring - 生命周期,mysql教程入门到精通pdf

Java 程序员 后端

ICCV 2021人脸鉴伪比赛全赛道冠军!AI反诈这块,百度算是弄明白了

科技热闻

“数组&方法”常见知识分解,简述java编译原理

Java 程序员 后端

“打工人”都在用的邮件使用规范,入职3个月的Java程序员面临转正

Java 程序员 后端

“穷苦乡村”小伙就得安于现状,你掌握了多少?

Java 程序员 后端

一文带你理解TDengine中的缓存技术

TDengine

数据库 tdengine 后端

“ShardingCore”是如何针对分表下的分页进行优化的,深入理解linux内核架构

Java 程序员 后端

《零基础》MySQL 安装(二),java高级程序设计作业系统

Java 程序员 后端

「JVM 系列」- JVM的类加载机制,java常用面试题和答案

Java 程序员 后端

【Java从0到架构师】Spring - 整合 MyBatis,大厂Mysql高频面试题

Java 程序员 后端

【Java后端】2020年最新阿里,java中级面试题库weixin

Java 程序员 后端

《零基础》MySQL GROUP BY 语句(十九),java并发编程实战pdf百度云

Java 程序员 后端

智源研究院理事长张宏江:大模型就是下一个AI的基础平台丨智源大会_服务革新_InfoQ编辑部_InfoQ精选文章