写点什么

信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破

  • 2024-12-13
    北京
  • 本文字数:1550 字

    阅读完需:约 5 分钟

大小:792.75K时长:04:30
信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破

近日,中国信息通信研究院(简称“中国信通院”)对外发布《人工智能发展报告(2024 年)》。


报告指出,基础模型保持快速演进态势,重点突破多模态和复杂推理能力。语言大模型能力多维度持续进化,主要体现在上下文窗口长度扩展、海量信息压缩与知识密度提升、MoE 架构融合以及通过引入强化学习算法优化推理能力。其中,推理侧改进成为近期热点,规模定律适用范围从预训练向后训练和推理延伸。多模态大模型探索交叉模态融合处理,由早期子任务模型组合转向端到端跨模态统一特征表示,实现原生多模支持。


此外,随着国产深度学习框架技术能力不断完善,百度飞桨等国产框架正快速崛起,基于国产框架的行业解决方案向垂直领域快速渗透。未来,人工智能逐步进入大规模赋能新型工业化阶段,国产深度学习框架将迎来新一轮发展机遇,继续加强渗透。


深度学习框架是支撑大模型技术创新的核心工具,对大模型技术发展至关重要。它通过提供高效开发环境、灵活扩展机制、模型复用与共享功能,以及分布式训练与推理能力,极大简化复杂算法的开发、优化和实际应用过程,显著降低大模型开发门槛,提高设计、训练和部署深度学习模型的效率。以百度文心大模型为例,通过与飞桨框架协同优化,其推理性能提升了百余倍。中国互联网络信息中心(CNNIC)不久前发布的《生成式人工智能应用发展报告(2024)》也强调,深度学习框架已成为生成式人工智能的迭代关键。


2022 年以来,大模型行业飞速发展,全球大模型厂商的模型矩阵不断扩充完善。信通院报告指出,在 Scaling Law 驱动下,大模型支持模态已逐步从自然语言处理拓展到多模态理解和生成等场景。2024 年,大模型推理理解能力跃迁,并开始探索垂类领域应用落地。



语言、视觉和多模态三类基础模型布局

截取自中国信息通信研究院《人工智能发展报告(2024 年)》


在大模型技术快速迭代的要求下,大规模分布式训练正成为框架发展的新发力点,百度飞桨所采纳的集成分布式能力的一体化通用发展路径,是这一进程中的重要路线之一。作为中国首个自主研发、功能丰富、开源开放的深度学习平台,百度飞桨框架原生支持超大规模分布式训练能力,推出端到端自适应分布式训练技术,实现了低成本自动并行开发、最优并行策略自动选择和异步流水调度,突破了模型结构和硬件环境多样导致的分布式训练策略开发复杂、训练性能调优难的技术瓶颈。公开数据显示,截至 2024 年 11 月,百度飞桨文心开发者数量已达 1808 万,服务了 43 万家企业,创建了 101 万个模型。


此外,2024 年大模型应用也迎来了爆发。相较于传统应用开发,智能应用开发的门槛大幅降低。

 

报告认为,一方面,大模型服务化供给加速了智能技术的普惠化落地,Agent、RAG 等框架成为常用 AI 应用开发框架;另一方面,大模型应用开发工具趋于平台化,不仅整合了必要的开发工具、框架与服务,还极大地简化了从模型调用到应用部署的全过程,为开发者提供了高效、便捷的创新环境。例如,百度智能云千帆 AppBuilder 面向不同开发能力的用户和开发场景,分别以零代码态、低代码态、代码态的产品形态,帮助开发者构建 AI 原生应用。


报告指出,工程化技术是人工智能从实验室走向生产环境的关键桥梁,大模型开发及应用工具链的快速发展,标志着人工智能工程化进入了新阶段。开发工具链加速大模型技术的迭代,显著提升了训练效率,降低了推理成本。应用工具链则拓展了大模型应用范围,增强了系统的扩展性,降低了应用门槛。


展望未来,信通院报告表示,引入强化学习等技术来增强大模型能力仍是近期技术演进的重点方向,多模态模型、智能体有望加速突破。随着人工智能赋能新型工业化向纵深发展,人工智能在实体经济中的应用场景将进一步拓展,加速向生产制造环节渗透,加速迈向全方位、深层次智能化转型升级新阶段。

 

完整报告可查看:

http://www.caict.ac.cn/kxyj/qwfb/bps/202412/t20241210_647283.htm

2024-12-13 15:029988

评论

发布
暂无评论
发现更多内容

大模型 RAG 进阶实战营 毕业总结

gigifrog

跨境卖家必看!2025年1688API新功能解锁全球供应链

tbapi

1688商品详情接口 1688商品列表接口 1688API 1688寻源通API

《HarmonyOSNext教育应用性能飞跃:ArkTS长列表优化5大实战指南》

Turing_010

Selenium — Playwright 自动化测试框架

测试人

大数据-17 Flume 分布式日志收集 实时采集引擎 Source Channel Sink 串行复制负载均衡

武子康

大数据 hadoop flume

如何测试DNS解析状态是否正常?

国科云

项目管理利器:甘特图的全面解析与应用指南

敏捷开发

甘特图 #项目管理

AI进行时,AlphaGPT引领法律服务新时代

科技汇

spss是什么软件,SPSS主要用来做什么的 ? SPSS数据分析软件介绍 spss个人版和企业版区别

阿拉灯神丁

mac数据分析统计软件 spss数据统计 IBM SPSS Statistics中文 spss统计软件

利用 Amazon Bedrock 构建高效 SEO 内容生成系统:从流量挖掘到智能创作

亚马逊云科技 (Amazon Web Services)

时序数据库 TDengine × Power BI:高频数据也能秒级响应

TDengine

数据库 tdengine 时序数据库

别划走!选择无代码平台的10个理由!

积木链小链

数字化转型 无代码 无代码平台

仅32B,昆仑万维开源「自主代码智能体模型Skywork-SWE-32B」,拿下代码开源SOTA

新消费日报

Golang基础笔记二之字符串及其操作

Hunter熊

golang 字符串 字符串处理

时序数据库 TDengine 通过麒麟全系列兼容性认证,稳了!

TDengine

数据库 tdengine 时序数据库

黑龙江腾讯云:科技赋能,助力龙江新发展

等保测评

短短一年,是什么让移动AI颠覆想象?

脑极体

AI

鸿蒙运动项目开发:封装超级好用的 RCP 网络库(下)—— 实战应用

王二蛋和他的张大花

时序数据库 TDengine 助力华锐 D5 平台实现“三连降”:查询快了,机器少了,成本也低了

TDengine

数据库 tdengine 时序数据库

企业放弃TeamViewer转投贝锐向日葵企业版:性能价格向日葵均有优势

科技热闻

《HarmonyOSNext性能飞跃秘籍:响应优化0.1秒生死线必备指南》

Turing_010

VKProxy新增速率限制功能

八苦-瞿昙

智慧园区系统(源码+文档+讲解+演示)

深圳亥时科技

AI教育APP的开发

北京木奇移动技术有限公司

AI教育 软件外包公司 AI英语学习

从API测试看企业系统性落地AI的鸿沟

思码逸研发效能

研发效能 智能测试 API 测试 研发效能管理 思码逸

什么是数字化创新?数字化创新能给企业带来什么好处?

优秀

数字化 数字化创新 数字化赋能升级

1688商品列表API接口全解析:从关键词搜索到分页处理方案

tbapi

1688商品列表接口 关键词搜索1688商品接口 1688API 1688数据采集

时序数据库 TDengine x Kepware:解决你最头疼的“设备接入”问题

TDengine

数据库 tdengine 时序数据库

二级等保

等保测评

MySQL派生表查询大数据量无结果问题分析与解决

GreatSQL

合合信息发布业内首个AI Agent跨平台云资源智能管理终端

合合技术团队

人工智能 大数据 算法

信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破_AI&大模型_褚杏娟_InfoQ精选文章