写点什么

信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破

  • 2024-12-13
    北京
  • 本文字数:1550 字

    阅读完需:约 5 分钟

大小:792.75K时长:04:30
信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破

近日,中国信息通信研究院(简称“中国信通院”)对外发布《人工智能发展报告(2024 年)》。


报告指出,基础模型保持快速演进态势,重点突破多模态和复杂推理能力。语言大模型能力多维度持续进化,主要体现在上下文窗口长度扩展、海量信息压缩与知识密度提升、MoE 架构融合以及通过引入强化学习算法优化推理能力。其中,推理侧改进成为近期热点,规模定律适用范围从预训练向后训练和推理延伸。多模态大模型探索交叉模态融合处理,由早期子任务模型组合转向端到端跨模态统一特征表示,实现原生多模支持。


此外,随着国产深度学习框架技术能力不断完善,百度飞桨等国产框架正快速崛起,基于国产框架的行业解决方案向垂直领域快速渗透。未来,人工智能逐步进入大规模赋能新型工业化阶段,国产深度学习框架将迎来新一轮发展机遇,继续加强渗透。


深度学习框架是支撑大模型技术创新的核心工具,对大模型技术发展至关重要。它通过提供高效开发环境、灵活扩展机制、模型复用与共享功能,以及分布式训练与推理能力,极大简化复杂算法的开发、优化和实际应用过程,显著降低大模型开发门槛,提高设计、训练和部署深度学习模型的效率。以百度文心大模型为例,通过与飞桨框架协同优化,其推理性能提升了百余倍。中国互联网络信息中心(CNNIC)不久前发布的《生成式人工智能应用发展报告(2024)》也强调,深度学习框架已成为生成式人工智能的迭代关键。


2022 年以来,大模型行业飞速发展,全球大模型厂商的模型矩阵不断扩充完善。信通院报告指出,在 Scaling Law 驱动下,大模型支持模态已逐步从自然语言处理拓展到多模态理解和生成等场景。2024 年,大模型推理理解能力跃迁,并开始探索垂类领域应用落地。



语言、视觉和多模态三类基础模型布局

截取自中国信息通信研究院《人工智能发展报告(2024 年)》


在大模型技术快速迭代的要求下,大规模分布式训练正成为框架发展的新发力点,百度飞桨所采纳的集成分布式能力的一体化通用发展路径,是这一进程中的重要路线之一。作为中国首个自主研发、功能丰富、开源开放的深度学习平台,百度飞桨框架原生支持超大规模分布式训练能力,推出端到端自适应分布式训练技术,实现了低成本自动并行开发、最优并行策略自动选择和异步流水调度,突破了模型结构和硬件环境多样导致的分布式训练策略开发复杂、训练性能调优难的技术瓶颈。公开数据显示,截至 2024 年 11 月,百度飞桨文心开发者数量已达 1808 万,服务了 43 万家企业,创建了 101 万个模型。


此外,2024 年大模型应用也迎来了爆发。相较于传统应用开发,智能应用开发的门槛大幅降低。

 

报告认为,一方面,大模型服务化供给加速了智能技术的普惠化落地,Agent、RAG 等框架成为常用 AI 应用开发框架;另一方面,大模型应用开发工具趋于平台化,不仅整合了必要的开发工具、框架与服务,还极大地简化了从模型调用到应用部署的全过程,为开发者提供了高效、便捷的创新环境。例如,百度智能云千帆 AppBuilder 面向不同开发能力的用户和开发场景,分别以零代码态、低代码态、代码态的产品形态,帮助开发者构建 AI 原生应用。


报告指出,工程化技术是人工智能从实验室走向生产环境的关键桥梁,大模型开发及应用工具链的快速发展,标志着人工智能工程化进入了新阶段。开发工具链加速大模型技术的迭代,显著提升了训练效率,降低了推理成本。应用工具链则拓展了大模型应用范围,增强了系统的扩展性,降低了应用门槛。


展望未来,信通院报告表示,引入强化学习等技术来增强大模型能力仍是近期技术演进的重点方向,多模态模型、智能体有望加速突破。随着人工智能赋能新型工业化向纵深发展,人工智能在实体经济中的应用场景将进一步拓展,加速向生产制造环节渗透,加速迈向全方位、深层次智能化转型升级新阶段。

 

完整报告可查看:

http://www.caict.ac.cn/kxyj/qwfb/bps/202412/t20241210_647283.htm

2024-12-13 15:028591

评论

发布
暂无评论
发现更多内容

骏彩竞猜分布式解决方案之路

TiDB 社区干货传送门

安装 & 部署

传统行业数据架构发展变化

TiDB 社区干货传送门

数据库架构选型

DR Auto-Sync 搭建和计划内切换操作手册

TiDB 社区干货传送门

ticdc没报错,tso却不变的奇怪现象

TiDB 社区干货传送门

数据库调优之硬件

TiDB 社区干货传送门

性能调优

使用SPM固定执行计划

TiDB 社区干货传送门

高并发请求下 TiDB 集群的业务无损升级

TiDB 社区干货传送门

TiDB 在 Cisco Webex 架构中的部署和应用

TiDB 社区干货传送门

【考试指南】TiDB 5.0认证指南之PCTA PCTP

TiDB 社区干货传送门

TiDB 底层架构

悲观锁模式下 TiDB 与其他数据库在 RC 及 RR 隔离级别的行为对比

TiDB 社区干货传送门

TPC-H 下 TiFlash 的扩展性测试报告 - v5.1.0

TiDB 社区干货传送门

版本测评 性能测评

【备考指南】新版 PingCAP PCTP 认证考试

TiDB 社区干货传送门

TiDB 如何获取集群创建时间

TiDB 社区干货传送门

实践案例 TiDB 底层架构

TiDB体系结构

TiDB 社区干货传送门

TiDB 底层架构

dm-V1.0.5使用汇总

TiDB 社区干货传送门

管理与运维

【白皮书】TiDelta,一款简单易用的 TiDB 性能对比 Web 工具。

TiDB 社区干货传送门

TiSpark 2.4.1(Spark 2.4.5)到TiSpark 2.5.0(Spark 3.0.X/3.1.X)迁移实践

TiDB 社区干货传送门

实践案例

记一次简单的Oracle离线数据迁移至TiDB过程

TiDB 社区干货传送门

TiSpark On Kubernetes实践

TiDB 社区干货传送门

实践案例

记一次TiDB的临时救场

TiDB 社区干货传送门

实践案例

TiDB 运维基础操作脑图

TiDB 社区干货传送门

在CentOS7上进行TiDB/PD/TIKV编译分享

TiDB 社区干货传送门

实践案例 安装 & 部署

用 Gravity 实现 MongoDB 到 TiDB 的数据复制

TiDB 社区干货传送门

TiDB 元信息管理方式

TiDB 社区干货传送门

TiDB 底层架构

一言难尽的Prometheus监控实践

TiDB 社区干货传送门

实践案例

大事务的处理方式对比

TiDB 社区干货传送门

实践案例

TiDB 5.4 发版丨新功能解读

TiDB 社区干货传送门

TiDB Binlog 支持 Oracle 目标库功能用户手册

TiDB 社区干货传送门

迁移

TiDB 悲观事务模式和Mysql的表象区别

TiDB 社区干货传送门

TiCDC 4.0.15 初体验

TiDB 社区干货传送门

实践案例

TiDB 如何在 LVS FULL NAT 模式下显示客户端真实 IP

TiDB 社区干货传送门

实践案例

信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破_AI&大模型_褚杏娟_InfoQ精选文章