2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破

  • 2024-12-13
    北京
  • 本文字数:1550 字

    阅读完需:约 5 分钟

大小:792.75K时长:04:30
信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破

近日,中国信息通信研究院(简称“中国信通院”)对外发布《人工智能发展报告(2024 年)》。


报告指出,基础模型保持快速演进态势,重点突破多模态和复杂推理能力。语言大模型能力多维度持续进化,主要体现在上下文窗口长度扩展、海量信息压缩与知识密度提升、MoE 架构融合以及通过引入强化学习算法优化推理能力。其中,推理侧改进成为近期热点,规模定律适用范围从预训练向后训练和推理延伸。多模态大模型探索交叉模态融合处理,由早期子任务模型组合转向端到端跨模态统一特征表示,实现原生多模支持。


此外,随着国产深度学习框架技术能力不断完善,百度飞桨等国产框架正快速崛起,基于国产框架的行业解决方案向垂直领域快速渗透。未来,人工智能逐步进入大规模赋能新型工业化阶段,国产深度学习框架将迎来新一轮发展机遇,继续加强渗透。


深度学习框架是支撑大模型技术创新的核心工具,对大模型技术发展至关重要。它通过提供高效开发环境、灵活扩展机制、模型复用与共享功能,以及分布式训练与推理能力,极大简化复杂算法的开发、优化和实际应用过程,显著降低大模型开发门槛,提高设计、训练和部署深度学习模型的效率。以百度文心大模型为例,通过与飞桨框架协同优化,其推理性能提升了百余倍。中国互联网络信息中心(CNNIC)不久前发布的《生成式人工智能应用发展报告(2024)》也强调,深度学习框架已成为生成式人工智能的迭代关键。


2022 年以来,大模型行业飞速发展,全球大模型厂商的模型矩阵不断扩充完善。信通院报告指出,在 Scaling Law 驱动下,大模型支持模态已逐步从自然语言处理拓展到多模态理解和生成等场景。2024 年,大模型推理理解能力跃迁,并开始探索垂类领域应用落地。



语言、视觉和多模态三类基础模型布局

截取自中国信息通信研究院《人工智能发展报告(2024 年)》


在大模型技术快速迭代的要求下,大规模分布式训练正成为框架发展的新发力点,百度飞桨所采纳的集成分布式能力的一体化通用发展路径,是这一进程中的重要路线之一。作为中国首个自主研发、功能丰富、开源开放的深度学习平台,百度飞桨框架原生支持超大规模分布式训练能力,推出端到端自适应分布式训练技术,实现了低成本自动并行开发、最优并行策略自动选择和异步流水调度,突破了模型结构和硬件环境多样导致的分布式训练策略开发复杂、训练性能调优难的技术瓶颈。公开数据显示,截至 2024 年 11 月,百度飞桨文心开发者数量已达 1808 万,服务了 43 万家企业,创建了 101 万个模型。


此外,2024 年大模型应用也迎来了爆发。相较于传统应用开发,智能应用开发的门槛大幅降低。

 

报告认为,一方面,大模型服务化供给加速了智能技术的普惠化落地,Agent、RAG 等框架成为常用 AI 应用开发框架;另一方面,大模型应用开发工具趋于平台化,不仅整合了必要的开发工具、框架与服务,还极大地简化了从模型调用到应用部署的全过程,为开发者提供了高效、便捷的创新环境。例如,百度智能云千帆 AppBuilder 面向不同开发能力的用户和开发场景,分别以零代码态、低代码态、代码态的产品形态,帮助开发者构建 AI 原生应用。


报告指出,工程化技术是人工智能从实验室走向生产环境的关键桥梁,大模型开发及应用工具链的快速发展,标志着人工智能工程化进入了新阶段。开发工具链加速大模型技术的迭代,显著提升了训练效率,降低了推理成本。应用工具链则拓展了大模型应用范围,增强了系统的扩展性,降低了应用门槛。


展望未来,信通院报告表示,引入强化学习等技术来增强大模型能力仍是近期技术演进的重点方向,多模态模型、智能体有望加速突破。随着人工智能赋能新型工业化向纵深发展,人工智能在实体经济中的应用场景将进一步拓展,加速向生产制造环节渗透,加速迈向全方位、深层次智能化转型升级新阶段。

 

完整报告可查看:

http://www.caict.ac.cn/kxyj/qwfb/bps/202412/t20241210_647283.htm

2024-12-13 15:0210282

评论

发布
暂无评论
发现更多内容

详细的网站定制步骤有哪些?

源字节1号

网站开发 软件定制

从0到1落地电商小程序之微服务设计

晨亮

「架构实战营」

你的“数学潜意识”原来可以被唤醒!

博文视点Broadview

Java AOT之GraalVM native image介绍以及简单长连接服务实践

BUG侦探

GraalVM java aot native image

TDesign React Starter 发布

TDesign

恒源云(GpuShare)_租卡怎么选?看这一篇就够了!

恒源云

人工智能 GPU服务器

治理有精度,AI赋智加强城市精细化管理

百度大脑

自动化知识图谱表示:从三元组到子图

第四范式开发者社区

人工智能 自动化 知识图谱

网络安全入门5天速成教程: WEB安全渗透攻防技术

网络安全学海

网络安全 安全 信息安全 渗透测试 WEB安全

Python 的排序方法 sort 和 sorted 的区别

AlwaysBeta

Python

手把手教你从Apk中取出算法

奋飞安全

android 安全 java

浅谈信息熵在数字体验监控领域的应用

博睿数据

产品升级|1-2月合刊:多款重磅产品来袭

百度大脑

地狱开局的2022,穿好你的安全铠甲

脑极体

Nginx限速模块初探

喀拉峻

nginx

Kubernetes中API的不同版本, Alpha, Beta, Stable 都是什么?

工程师薛昭君

Kubernetes API

windows下C与C++执行cmd命令并实时获取输出

DS小龙哥

3月月更

弱监督语义分割:从图像级标注快进到像素级预测

网易云信

安全

提升客户服务体验的技巧

小炮

客户服务 SaaS平台

企业如何挖掘知识“金矿”?这本白皮书讲得够透彻!

百度大脑

AI+遥感智能解译,赋能智慧城市规划革新

百度大脑

项目管理标准化的武林秘籍

大智若愚

团队管理 项目管理 标准化 软技能 标准框架

错误码设计思考

木小风

Java 架构 错误码

Apache ShardingSphere 5.1.0 执行引擎性能优化揭秘

SphereEx

数据库 ShardingSphere SphereEx apache 社区

Go 中的空白标识符(下划线)

宇宙之一粟

Go 语言 3月月更

【愚公系列】2022年03月 Docker容器 Kafka集群的搭建

愚公搬代码

3月月更

从建好到用好,阿里云原生微服务生态的演进

阿里巴巴云原生

客户画像赋能百度推广生态实践

百度Geek说

前端 后端

加快云原生技术转型, 智能调度登陆华为云DevOps: 增速,节源

华为云开发者联盟

软件 DevOps 代码托管 智能调度 华为云DevOps

ABAP 文件上/下载

Jasen Ye

upload abap download template GRAPHICS

无监控不运维—浅述各种监控方案使用场景

穿过生命散发芬芳

3月月更

信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破_AI&大模型_褚杏娟_InfoQ精选文章