如何 0 成本启动全员 AI 技能提升?戳> 了解详情
写点什么

信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破

  • 2024-12-13
    北京
  • 本文字数:1550 字

    阅读完需:约 5 分钟

大小:792.75K时长:04:30
信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破

近日,中国信息通信研究院(简称“中国信通院”)对外发布《人工智能发展报告(2024 年)》。


报告指出,基础模型保持快速演进态势,重点突破多模态和复杂推理能力。语言大模型能力多维度持续进化,主要体现在上下文窗口长度扩展、海量信息压缩与知识密度提升、MoE 架构融合以及通过引入强化学习算法优化推理能力。其中,推理侧改进成为近期热点,规模定律适用范围从预训练向后训练和推理延伸。多模态大模型探索交叉模态融合处理,由早期子任务模型组合转向端到端跨模态统一特征表示,实现原生多模支持。


此外,随着国产深度学习框架技术能力不断完善,百度飞桨等国产框架正快速崛起,基于国产框架的行业解决方案向垂直领域快速渗透。未来,人工智能逐步进入大规模赋能新型工业化阶段,国产深度学习框架将迎来新一轮发展机遇,继续加强渗透。


深度学习框架是支撑大模型技术创新的核心工具,对大模型技术发展至关重要。它通过提供高效开发环境、灵活扩展机制、模型复用与共享功能,以及分布式训练与推理能力,极大简化复杂算法的开发、优化和实际应用过程,显著降低大模型开发门槛,提高设计、训练和部署深度学习模型的效率。以百度文心大模型为例,通过与飞桨框架协同优化,其推理性能提升了百余倍。中国互联网络信息中心(CNNIC)不久前发布的《生成式人工智能应用发展报告(2024)》也强调,深度学习框架已成为生成式人工智能的迭代关键。


2022 年以来,大模型行业飞速发展,全球大模型厂商的模型矩阵不断扩充完善。信通院报告指出,在 Scaling Law 驱动下,大模型支持模态已逐步从自然语言处理拓展到多模态理解和生成等场景。2024 年,大模型推理理解能力跃迁,并开始探索垂类领域应用落地。



语言、视觉和多模态三类基础模型布局

截取自中国信息通信研究院《人工智能发展报告(2024 年)》


在大模型技术快速迭代的要求下,大规模分布式训练正成为框架发展的新发力点,百度飞桨所采纳的集成分布式能力的一体化通用发展路径,是这一进程中的重要路线之一。作为中国首个自主研发、功能丰富、开源开放的深度学习平台,百度飞桨框架原生支持超大规模分布式训练能力,推出端到端自适应分布式训练技术,实现了低成本自动并行开发、最优并行策略自动选择和异步流水调度,突破了模型结构和硬件环境多样导致的分布式训练策略开发复杂、训练性能调优难的技术瓶颈。公开数据显示,截至 2024 年 11 月,百度飞桨文心开发者数量已达 1808 万,服务了 43 万家企业,创建了 101 万个模型。


此外,2024 年大模型应用也迎来了爆发。相较于传统应用开发,智能应用开发的门槛大幅降低。

 

报告认为,一方面,大模型服务化供给加速了智能技术的普惠化落地,Agent、RAG 等框架成为常用 AI 应用开发框架;另一方面,大模型应用开发工具趋于平台化,不仅整合了必要的开发工具、框架与服务,还极大地简化了从模型调用到应用部署的全过程,为开发者提供了高效、便捷的创新环境。例如,百度智能云千帆 AppBuilder 面向不同开发能力的用户和开发场景,分别以零代码态、低代码态、代码态的产品形态,帮助开发者构建 AI 原生应用。


报告指出,工程化技术是人工智能从实验室走向生产环境的关键桥梁,大模型开发及应用工具链的快速发展,标志着人工智能工程化进入了新阶段。开发工具链加速大模型技术的迭代,显著提升了训练效率,降低了推理成本。应用工具链则拓展了大模型应用范围,增强了系统的扩展性,降低了应用门槛。


展望未来,信通院报告表示,引入强化学习等技术来增强大模型能力仍是近期技术演进的重点方向,多模态模型、智能体有望加速突破。随着人工智能赋能新型工业化向纵深发展,人工智能在实体经济中的应用场景将进一步拓展,加速向生产制造环节渗透,加速迈向全方位、深层次智能化转型升级新阶段。

 

完整报告可查看:

http://www.caict.ac.cn/kxyj/qwfb/bps/202412/t20241210_647283.htm

2024-12-13 15:0210159

评论

发布
暂无评论
发现更多内容

阿里,快手,拼多多等7家大厂Java面试真题,Java开发面经分享

Java 程序员 后端

与springcloud整合的框架源码读取入口

Java 编程 架构 微服务

ECMAScript 2021(ES12)新特性简介

程序那些事

JavaScript ecmascript 程序那些事 ES12

汽车智能座舱中 显示屏市场战略趋势分析 上篇

SOA开发者

软件定义汽车

开便利店可以实现财富自由吗?

石头IT视角

CSS 轻松制作 SVG 动画

devpoint

css3 SVG 9月日更

堡垒机作用之事后审计详细讲解-行云管家

行云管家

运维 网络安全 运维审计 事后审计

揭秘TDSQL-A分布式执行框架:解放OLAP关联分析查询性能瓶颈

腾讯云数据库

数据库 tdsql

Percolator模型及其在TiKV中的实现

vivo互联网技术

数据库 Percolator 分布式,

测试开发之前端篇-CSS层叠式样式表

禅道项目管理

CSS html

为什么不推荐Python初学者直接看项目源码

Felix

Python 编程 开发 Programing 阅读代码

37 手游基于 Flink CDC + Hudi 湖仓一体方案实践

Apache Flink

大数据 flink

干货帖 | TDSQL-A核心架构揭秘

腾讯云数据库

数据库 tdsql

阿里,快手,拼多多等7家大厂Java面试真题,Java面试题高级

Java 程序员 后端

对Python爬虫编写者充满诱惑的网站,《可爱图片网》,瞧人这网站名字起的

梦想橡皮擦

9月日更

Linux用户密码管理

在即

9月日更

一部好看过武侠小说的热血互联网史!

博文视点Broadview

mydumper备份工具介绍与使用

Simon

MySQL

深入解读TDSQL-C的内核关键技术

腾讯云数据库

数据库 tdsql

阿里巴巴发布“限量版”Java零基础宝典,万字Java技术类校招面试题汇总

Java 程序员 后端

阿里巴巴Java方向面试题汇总(含答案),为什么数据库会丢失数据

Java 程序员 后端

腾讯云分布式数据库TDSQL再获认可

腾讯云数据库

数据库 tdsql

Shell:Lite OS在线调试工具知多少

华为云开发者联盟

Shell 操作系统 Lite OS 在线调试 命令函数

阿里,快手,拼多多等7家大厂Java面试真题,Java笔试题及答案详解

Java 程序员 后端

FunTester框架Redis性能测试之list操作

FunTester

redis 性能测试 测试框架 压力测试 FunTester

主机安全是什么意思?安全体检包含哪些方面?

行云管家

运维 服务器 主机 主机安全 安全体检

论亚马逊QLDB与腾讯TDSQL架构与功能

腾讯云数据库

数据库 tdsql

TDSQL-C 数据库架构

腾讯云数据库

数据库 tdsql

阿里巴巴发布“限量版”Java零基础宝典,38岁的中年失业者怎么活下去

Java 程序员 后端

乘着汽车智能化的浪潮,“汽车人”的职业方向选择(三)

SOA开发者

软件定义汽车 车载控制单元

为什么说腾讯云TDSQL是金融行业的“杀手锏”级应用?

腾讯云数据库

数据库 tdsql

信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破_AI&大模型_褚杏娟_InfoQ精选文章