写点什么

信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破

  • 2024-12-13
    北京
  • 本文字数:1550 字

    阅读完需:约 5 分钟

大小:792.75K时长:04:30
信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破

近日,中国信息通信研究院(简称“中国信通院”)对外发布《人工智能发展报告(2024 年)》。


报告指出,基础模型保持快速演进态势,重点突破多模态和复杂推理能力。语言大模型能力多维度持续进化,主要体现在上下文窗口长度扩展、海量信息压缩与知识密度提升、MoE 架构融合以及通过引入强化学习算法优化推理能力。其中,推理侧改进成为近期热点,规模定律适用范围从预训练向后训练和推理延伸。多模态大模型探索交叉模态融合处理,由早期子任务模型组合转向端到端跨模态统一特征表示,实现原生多模支持。


此外,随着国产深度学习框架技术能力不断完善,百度飞桨等国产框架正快速崛起,基于国产框架的行业解决方案向垂直领域快速渗透。未来,人工智能逐步进入大规模赋能新型工业化阶段,国产深度学习框架将迎来新一轮发展机遇,继续加强渗透。


深度学习框架是支撑大模型技术创新的核心工具,对大模型技术发展至关重要。它通过提供高效开发环境、灵活扩展机制、模型复用与共享功能,以及分布式训练与推理能力,极大简化复杂算法的开发、优化和实际应用过程,显著降低大模型开发门槛,提高设计、训练和部署深度学习模型的效率。以百度文心大模型为例,通过与飞桨框架协同优化,其推理性能提升了百余倍。中国互联网络信息中心(CNNIC)不久前发布的《生成式人工智能应用发展报告(2024)》也强调,深度学习框架已成为生成式人工智能的迭代关键。


2022 年以来,大模型行业飞速发展,全球大模型厂商的模型矩阵不断扩充完善。信通院报告指出,在 Scaling Law 驱动下,大模型支持模态已逐步从自然语言处理拓展到多模态理解和生成等场景。2024 年,大模型推理理解能力跃迁,并开始探索垂类领域应用落地。



语言、视觉和多模态三类基础模型布局

截取自中国信息通信研究院《人工智能发展报告(2024 年)》


在大模型技术快速迭代的要求下,大规模分布式训练正成为框架发展的新发力点,百度飞桨所采纳的集成分布式能力的一体化通用发展路径,是这一进程中的重要路线之一。作为中国首个自主研发、功能丰富、开源开放的深度学习平台,百度飞桨框架原生支持超大规模分布式训练能力,推出端到端自适应分布式训练技术,实现了低成本自动并行开发、最优并行策略自动选择和异步流水调度,突破了模型结构和硬件环境多样导致的分布式训练策略开发复杂、训练性能调优难的技术瓶颈。公开数据显示,截至 2024 年 11 月,百度飞桨文心开发者数量已达 1808 万,服务了 43 万家企业,创建了 101 万个模型。


此外,2024 年大模型应用也迎来了爆发。相较于传统应用开发,智能应用开发的门槛大幅降低。

 

报告认为,一方面,大模型服务化供给加速了智能技术的普惠化落地,Agent、RAG 等框架成为常用 AI 应用开发框架;另一方面,大模型应用开发工具趋于平台化,不仅整合了必要的开发工具、框架与服务,还极大地简化了从模型调用到应用部署的全过程,为开发者提供了高效、便捷的创新环境。例如,百度智能云千帆 AppBuilder 面向不同开发能力的用户和开发场景,分别以零代码态、低代码态、代码态的产品形态,帮助开发者构建 AI 原生应用。


报告指出,工程化技术是人工智能从实验室走向生产环境的关键桥梁,大模型开发及应用工具链的快速发展,标志着人工智能工程化进入了新阶段。开发工具链加速大模型技术的迭代,显著提升了训练效率,降低了推理成本。应用工具链则拓展了大模型应用范围,增强了系统的扩展性,降低了应用门槛。


展望未来,信通院报告表示,引入强化学习等技术来增强大模型能力仍是近期技术演进的重点方向,多模态模型、智能体有望加速突破。随着人工智能赋能新型工业化向纵深发展,人工智能在实体经济中的应用场景将进一步拓展,加速向生产制造环节渗透,加速迈向全方位、深层次智能化转型升级新阶段。

 

完整报告可查看:

http://www.caict.ac.cn/kxyj/qwfb/bps/202412/t20241210_647283.htm

2024-12-13 15:029932

评论

发布
暂无评论
发现更多内容

带你掌握二进制SCA检测工具的短板及应对措施

华为云开发者联盟

测试 二进制 漏洞 二进制SCA检测

更快的Maven来了,我的天,速度提升了8倍!

王磊

PassJava 开源 (八) :Spring Cloud 整合 Nacos配置中心

悟空聊架构

nacos 28天写作 passjava 悟空聊架构 12月日更

技术职场主题线上沙龙|程序员百万年薪进阶指南

智联卓聘

职场成长 Java技术提升 技术职场 百万年薪

云图说|ModelArts Pro:让AI开发更简单

华为云开发者联盟

AI 华为云 ModelArts Pro 云图说

梦想总是要有的 - 工作20年程序员的2021年度总结

万俊峰Kevin

程序员 微服务 年终总结 年度总结 Go 语言

网易有道 | REDIS 云原生实战

有道技术团队

redis

聊聊 Kafka: Consumer 源码解析之 Rebalance 机制

老周聊架构

签约计划第二季

如何强化应用安全能力,全面拦截 Log4j 漏洞攻击

阿里巴巴云原生

阿里云 云原生 安全 log4j

前端开发:基于移动端的Vue项目的Loading使用

三掌柜

28t 28天写作 12月日更

数据编织趋势探秘

Kafka中文社区

常回家看看

Tiger

28天写作

读写锁ReentranReadWriteLock源码分析

Ayue、

读写锁 lock

分析内部运行机制,教你解决Redis性能问题

华为云开发者联盟

数据库 redis 缓存 GaussDB(for Redis) 结构化存储

【转】java开发之SpringBoot数据校验机制

@零度

Spring Boot JAVA开发

架构训练营 - 模块八

Geek_9de3de

架构实战营

电子书网站推荐

坚果

28天写作 12月日更

书单 | 这6本书,带你轻松学习自动化办公

博文视点Broadview

某俄罗斯小哥,竟靠一个服务器软件直接封神?

沉默王二

nginx

给弟弟的信第25封|这个世界有上帝吗?

大菠萝

28天写作

开源 Serverless 里程碑:Knative 1.0 来了

阿里巴巴云原生

阿里云 开源 Serverless 云原生 Knative

架构实战营模块七作业

孙志强

架构实战营

“积木拼装”,HarmonyOS弹性部署大揭秘!|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

SpringBoot2 API接口签名实现

编程江湖

springboot

单体应用与微应用典型架构比对

编程江湖

架构

Vue学习的4个实用的Javascript技巧

编程江湖

VUE 3.0 源码

php项目使用xdebug远程调试

try catch

php 调试 Xdebug

中电科技加入龙蜥社区,助力开源生态建设

OpenAnolis小助手

开源社区 龙蜥社区

如何让 Spring Security 「少管闲事」

mzlogin

Java spring spring security

DevTools 实现原理与性能分析实战

vivo互联网技术

chrome 前端 Web

今天谈谈用户故事地图,不是用户故事

华为云开发者联盟

DevOps 敏捷 开发 用户故事 用户故事地图

信通院最新报告:国产深度学习框架迅速崛起,智能体有望加速突破_AI&大模型_褚杏娟_InfoQ精选文章