写点什么

从大模型到智能体:50+ 头部企业的 AI 进化实践

  • 2025-06-30
    北京
  • 本文字数:5546 字

    阅读完需:约 18 分钟

大小:2.80M时长:16:19
从大模型到智能体:50+ 头部企业的 AI 进化实践

6 月 27-28 日,2025 年 AICon 全球人工智能开发与应用大会在北京成功举办。本次大会汇聚了来自 IDEA 研究院、Linux Foundation、腾讯云、硅基流动、 阿里云智能集团、百度、来也科技、DaoCloud 道客、腾讯、58 同城、货拉拉、阿里巴巴达摩院、数巅科技、中电金信研究院、智象未来、同程旅行、京东、Alluxio、字节跳动、网易游戏、阿里巴巴、BISHENG、Google Cloud、云鼎科技 、作业帮、小米、京东零售、AI 师傅、华为、广发银行、Dify.AI、Rokid、 ThinkAny & MCP.so、百度地图、清程极智、ANP 开源技术社区、上海交通大学、 Agently.tech、深思考人工智能、新希望金科、美图、句子互动、马上消费、安克创新、网易有道、蚂蚁集团、数势科技、eBay、声智科技、Zilliz 、格灵深瞳、北银金科、火星电波、声网等 50 余家顶尖科技企业、学术机构及开源社区的专家代表,围绕 AI Agent、多模态应用、大模型推理性能优化 等前沿技术,探讨 AI 在 软件研发、数据分析、业务运营、智能硬件 等场景的落地实践以及未来发展趋势。


以下为本次大会的核心内容回顾:

极客邦科技在 AI 应用落地的思考与布局


极客邦科技创始人 & CEO 霍太稳从行业研究、内容生产、人才培养到创新创业支持的全方位服务体系展开分享了极客邦科技 AI 应用落地的布局



他首先介绍了极客邦最新发布的两个报告,一个是《中国大模型落地应用研究报告 2025》,大模型发展历经技术酝酿期、合规投入期,现处价值落地期,场景应用扩散期。数据显示 2023 年 12.3% 的大模型产品消失,2024 年新增 65%,影像创作赛道竞争激烈但市场吸引力强,金融和汽车领域因数据治理成熟成为大模型落地的领先行业。另一个是《AI 应用出海:开拓全球市场的实战指南》,该白皮书由 InfoQ 极客传媒、GMI Cloud 和 Linkloud 主要出品,由 Xmind、小影科技和上市企业代表万兴科技联合出品。针对企业出海过程中会遇到的市场选择、产品定价、产品运营、法律合规、基础设施建设等诸多问题给出了建议。


在内容生产方面,极客邦科技推出了为极客时间 VIP 用户定制的 《重构 AI 时代竞争力 | 致程序员:AI 百问百答》 手册,涵盖智能体、多模态、AI 编程等方向的最新进展和职业发展新方向。无论是焦虑技术迭代太快影响职业方向的,还是正带着团队做 AI 的项目,但是不知道怎么去落地的,里面都有相应的解法,帮助技术人少走一些弯路。


在企业 AI 人才培养方面,即将推出 AI Agent 开发与应用能力·培养项目,针对企业 Agent 从知识助手进阶到业务引擎、最终实现多 Agent 协同的进化路径,双轨培养能够以低代码搭建场景 Agent 的业务人才,与开发复杂系统 Agent 的技术人才,助力企业突破 AI 应用瓶颈,迈向智能协同。


此外,极客邦还发布了 AGICamp 社区,一个聚焦“好用的 AI 应用”社区,为开发者和用户提供发布和寻找 真实、实用、体验好的产品平台,首批加入的 AI 应用包括:Ai 好记、DeepPath 时踪、remio、ClackyAI、DeepChat、XGrowing、慧听牛、Lemon AI、AI 高考通、小火炉播客、SwiftAgent、SteamData、灵心巧手等。同时发起 AI Venture Studio 联盟,并携手 ITEC 朝阳国际人才创业大会,致力于打造完善的 AI 应用生态,为创业者提供多维能力和资源支持。


最后霍太稳总结到:极客邦希望以内容为火把,社区为土壤,人才为桥梁,与各方携手在 AI 应用落地浪潮中共筑有烟火气的 AI 未来。

5 大主题演讲:开拓 AI 技术发展的宏观视野


在 6 月 27 日上午的主题演讲环节,来自不同领域的行业翘楚分享了他们的最新研究成果与深刻见解。

张磊:从检测到通用感知:构建空间智能的基础与未来


IDEA 研究院计算机视觉与机器人研究中心讲席科学家张磊博士围绕「从检测到通用感知:构建空间智能的基础」发表了主题演讲。他首先指出,视觉感知是人和物理世界交互的核心能力,一个正常人的视觉信息占全部感觉信息的 70% 以上,50% 以上的大脑皮层被用来处理视觉信息。在自然语言理解出现之前,人机交互依赖于编程,而如今 GPT 等技术让机器可通过自然语言指令执行任务,但机器与环境的交互仍离不开视觉和行动能力。在物体检测领域,过去 20 多年经历了三个里程碑式的发展:2001 年的人脸检测算法,推动了相机人脸对焦等应用;2015 年基于神经网络的 Faster R-CNN 算法,助力智能驾驶产业发展;2020 年把 Transformer 引入视觉领域的 Detection Transformer 算法,是创新度很高的工作,但存在训练收敛慢、性能不及卷积神经网络等问题,其团队通过 DINO 系列工作解决了这些问题,使模型性能达到检测领域 SOTA。



随后他又以 GPT O3 识别美国国旗星星数量的例子,说明了大模型在视觉理解上存在幻觉问题,缺乏细颗粒度的视觉理解能力。他还对比了语言原生和视觉原生模型架构,前者的自回归结构适合语言的一维序列形式,后者采用并行解码更适合图像,且视觉原生架构具有平移不变性等优势。其团队在 IDEA 研究院计算机视觉与机器人研究中心开展多项研究工作,如 DAB-DETR、DN-DETR、到 DINO 等系列算法改进,推动了检测领域发展,从闭集检测走向开集检测,通过语言提示和视觉提示实现通用检测,解决了传统检测模型只能检测固定类别、难以适应新类别的问题。


此外,他还介绍了其团队在通用感知和空间智能方面的探索,他认为空间智能的核心是首先准确感知环境中的物体,进而理解它们的属性和 3D 结构,这种基础能力才能真正支撑具身智能的应用。目前该领域尚无统一定义,其团队通过 Deep Data Space 平台提供了实践路径,用户可体验关键词检测、复杂语义描述检测等功能,这些技术正在推动空间智能从研究探索走向实用化。

Mark Collier:AI 原生时代的基础设施与开源发展


作为 Linux 基金会 AI 与基础设施总经理,Mark Collier 分享的主题是“Training, Inference, Agents: Beyond Apps in the AI-Native World”,他在演讲中引用了谷歌和微软的数据,指出 30% 的新代码是 AI 生成的,这表明 AI 正在改变软件开发的格局。强调了 AI 原生时代基础设施的重要性,以及开源在推动 AI 发展中的关键作用。他指出,AI 的发展重心已转移,谷歌 2025 年 4 月处理的 token 数量较一年前增长了 50 倍,达到 480 万亿,推理规模远超训练,而下一波浪潮将是自主代理,它们将串联起每项任务的数千次调用。



他将 AI 原生计算分为三个支柱:训练、推理和代理。在训练方面,他提到了 PyTorch、DeepSpeed 等工具,并强调了标准化和可重复性的重要性。在推理方面,他认为这是 AI 进入市场的关键,但目前这一领域还不够成熟,存在许多挑战,如成本、效率、延迟等。


他预测未来基础设施将自我演化、自治,训练是连续的。强调了开源 AI 的重要性,以 Deep Seek 为例,其开源改变了人们对开源 AI 的看法,证明了开源在技术变革中的持久性。他还提到,OpenAI 也宣布将发布开源模型,这表明开源社区的开放性和创新性。他认为开源社区是解决复杂问题的最佳方式。他提到了“4 开”原则,即开放设计、开放社区、开放治理和开放代码,并呼吁大家积极参与开源社区,通过社区的力量,可以确保 AI 技术的开放性和全球可访问性,共同推动 AI 原生时代的发展。

黄世飞 & 程彬:腾讯云助力产业智能化转型,构建原生一体化 Data + AI 平台


腾讯云副总裁、腾讯云大数据产品负责人黄世飞在线上致辞视频中谈到了腾讯云在推动产业智能化转型中的实践和思考。他指出,尽管全球 AI 发展路径各有侧重,但挑战相似,关键在于如何将 AI 落地为生产力,实现智能化跃迁。


腾讯云通过构建多模态数据湖,让 AI 能够理解非结构化数据,唤醒企业沉睡的知识;打造智能生产线,实现数据与 AI 的无缝流转,提升创新效率;确保数据处理的高性能和高质量,让 AI 决策更可信可靠。此外,腾讯云还推出了 ChatBI,让业务人员通过自然语言就能完成数据分析,极大地简化了数据交互方式,让数据和智能深度融合。



腾讯云大数据基础产品总经理程彬也在会议现场分享了「Data+AI 下一代数智平台建设」,他强调,未来数据平台应从被动数据仓库变为主动“知识母体”,满足大模型时代需求。平台建设需解决普惠化、敏捷化和智能化问题,让数据智能触手可及。腾讯云新一代数据智能平台,底层有统一存储与元数据服务,中间层有统一调度与计算能力,上层有数据分析 AI 应用改变人机交互模式,实现数据处理普适化。未来,腾讯云将在生态开放、AI 能力融合和支持能力优化上持续演进。



最后,在 Gartner 高科技与电信行业总经理 Cindy Sun、腾讯云大数据基础产品总经理程彬、云鼎科技副总经理魏明、 CSIG 分析师机构合作负责人胡明、极客邦科技创始人 & CEO 霍太稳等多位重磅嘉宾的共同见证下,腾讯云发布了《 Data + AI ,下一代数智平台建设指南》白皮书,为更多企业提供智能化转型的参考。AI 决定了产业跃迁的速度,而数据则决定了企业能达到的最终高度。

袁进辉:AI Native Cloud 构建与展望


大模型能力突飞猛进解锁了更多应用创新机会,随之而来的 AI 推理需求大爆发也让 AI Native Cloud 的构建空前重要。硅基流动创始人 & CEO 袁进辉分享了「AI-Native Cloud 构建之路与展望」,他先介绍了行业背景,指出大语言模型及生成式 AI 的发展促使云基础设施与 AI 技术栈重塑,催生新需求与产品形态,如写作翻译应用、知识库检索、推理模型等,且模型应用部署的低成本、可扩展性成焦点,同时国内面临算力供应链问题。基于此,AI Native Cloud 出现且面临独特挑战。



硅基流动做了多项工作。一是与华为合作,基于华为 CloudMatrix 384 硬件基础设施,实现首个第三方 DeepSeek 稳定服务,该硬件通过多芯片互联弥补单芯片不足,采用池化思想整合资源,支持对等架构完成大规模 DeepSeek 分布式服务,还针对专家并行通信等需求,实现高效 All to All 通信,根据 NPU 特长分工计算与通信,支持国内开发者更好使用多元化算力及提升算力利用效率,解决国内特有的算力焦虑,提高硬件利用率。


其次他着重介绍了大模型 API 服务平台,上线了 100 多个模型,他提到这可能是国内外最全的一个平台了,几乎什么模型在上面都能找到,支持快速调用和微调,日均处理千亿 token,从去年 6 月到现在有几百万的注册用户,降低了开发者的应用开发门槛。


他还分享了云端多模态工作流 BizyAir,支持无 GPU 用户共享算力,开发者可以将 ComfyUI 本地工作流迁移至云端,像在使用本地的 ComfyUI  一样去完成它的设计和开发工作,让成本效率显著提升。


袁进辉强调,AI Native Cloud 需从硬件到软件全栈创新,最后他还宣布了硅基流动的品牌升级,并推出全球站,提供全方位 AI 产品服务,旨在加速 AGI 普惠,助力全球开发者及出海企业更高效使用 AI 能力。

丁宇(叔同):从 Copilot 到 Agent:AI 编程的范式革新


阿里云智能集团研发副总裁丁宇(叔同) 则是介绍了「从 Copilot 到 Agent:AI 编程的范式革新」,他提到,AI Coding 已成为大模型落地最成功的场景,全球 62% 的开发者正在使用相关工具,中国仅为 30%,仍有巨大提升空间。


模型能力进步推动了 AI 编程产品快速发展,他在演讲中分享了阿里云通过三阶段布局推动 AI 编程革新:第一阶段解决辅助编码问题,以插件方式落地;第二阶段走向 IDE 阶段,提供更多上下文信息,融合工程感知能力,通过语义理解优化生成质量;第三阶段走向云端远端任务,解决更多业务需求。针对企业落地挑战,阿里云提供了安全合规的解决方案,包括数据加密、零信任架构和漏洞防护等。目前,通义灵码插件下载量达 1700 万,企业用户代码采纳率超 32%, 通义千问是开源领域下载量最大、使用广泛的模型,企业实际使用效果良好。



他指出,随着模型能力的进步,AI 编程工具从早期的代码补全(Copilot)逐步演进到任务级编程(Agent),未来 80% 的需求可能由 AI 自主完成,Agent 模式将成为主流,成为 AI 编程的核心范式,能够处理更复杂的开发需求,如缺陷修复、架构升级等。他认为未来 AI 编程将推动三端(IDE、Terminal、浏览器)融合云端异步任务成为主流,大幅提升开发效率和体验,加速 AGI 时代的到来。

14 大技术专场催生 50+ 值得关注的标杆案例


大会的两天日程中,我们精心设计了十余个技术专场,全面覆盖了当前 AI 领域最前沿的技术方向和最具实践价值的应用场景,如:多模态实践与应用、大模型助力研发的实战经验、AI 在业务运营中的深度落地、大模型时代的数据处理与分析、AI Agents 能力构建与全球推理加速、Data+AI:下一代数智平台的最佳实践、端侧智能与联合推理、AI Agent 构建与多场景实践、大模型推理性能优化、AI 变革下的工程师、AI 基础设施与生态构建、AI 在金融领域的应用和趋势探索、LLM 产品的投产落地、AI 驱动的智能硬件创新,这些专场内容既有前沿技术探讨,又有落地实践分享,既有技术架构解析,又有具体场景解决方案,每个专场都吸引了大量与会者,现场座无虚席,充分展现了行业从业者对 AI 技术发展的热切关注。






13 家共创伙伴鼎力共筑交流学习栈台


除了聆听行业专家的精彩演讲,腾讯云、Google Cloud、穿扬科技、百道数据、数势科技、GMI Cloud、蚂蚁开源、博瑞通盛、矩阵起源、硅基流动、TRAE、北银金科、声网 这 13 家共创伙伴的鼎力相助也是大会的一大亮点。他们在大会现场设立了特色展区,向与会者们展示了他们在 AI 领域的前沿技术和创新应用产品。与会者们穿梭于各个展区之间,与共创伙伴的代表们深入交流,探讨着各自关心的话题。在这里,技术不再是冰冷的代码和数据,而是变成了一个个鲜活的故事和生动的案例。在这里,每一个声音都被倾听,每一个观点都被尊重。














结语


AICon 北京 2025 已落下帷幕,许多与会者表示,通过参加本次大会,他们不仅了解到了 AI 的最新技术动态和发展趋势,还结识了许多志同道合的朋友,收获颇丰,期待这些前沿思想和技术火花能持续推动行业创新。同时,我们也期待着下一站 AICon 深圳再次相聚,8 月 22-23 日,让我们一起共同见证 AI 领域的更多精彩瞬间。


2025-06-30 16:54292

评论

发布
暂无评论

模块2-朋友圈的架构设计

Geek_cb2b43

与 Python 之父聊天:更快的 Python!

Python猫

Python

14道MyBatis面试题总结,看完你还敢说懂MyBatis吗?

Java 程序员 后端

2020年最新蚂蚁金服 Java 高级岗2000+面试通关秘籍,就这水平

Java 程序员 后端

2021最新总结:1万字Java并发编程最新面试题合集【含答案 建议收藏

Java 程序员 后端

10个人9个答错,另外1个只对一半:数据库的锁

Java 程序员 后端

1篇文章全面总结2020年Java面试知识,掌握这些你也能进大厂!

Java 程序员 后端

2020年IT运维市场大前景到底怎么样,一举拿下腾讯美团滴滴offer

Java 程序员 后端

2021先定个小目标?搞清楚MyCat分片的两种拆分方法和分片规则!

Java 程序员 后端

2021年九月最新Java面试必背八股文,338道最新大厂架构面试题

Java 程序员 后端

“元宇宙”火出圈,不仅是区块链与科技圈,小说里也出现了

区块链日报

区块链 人工智能 facebook vr 元宇宙

区块链日报网元宇宙频道正式上线

区块链日报

架构实战营课程总结

子豪sirius

架构实战营

1000页神仙文档,连阿里P8面试官都说太详细了,面面俱到!搞懂这些直接P6+

Java 程序员 后端

100道 IT名企前端面试真题(1),java面试中经常被问到的问题

Java 程序员 后端

133道Java面试题及答案(面试必看),2021年Java面试心得

Java 程序员 后端

最新!阿里发布第四版Spring Cloud Alibaba全彩版手册

Java 架构 面试 微服务 阿里

1年半经验,2本学历,Curd背景,干货精讲

Java 程序员 后端

职场高效协作手册

刘华Kenneth

效率 职场 沟通

2021先定个小目标?搞清楚MyCat分片的两种拆分方法和分片规则!(1)

Java 程序员 后端

2021想进大厂?高手面经送给你:Java基础笔记

Java 程序员 后端

2021阿里大牛最新发布:Java高频面试题和核心技术(已涨薪6K

Java 程序员 后端

10个人9个答错,另外1个只对一半:数据库的锁(1)

Java 程序员 后端

15张图搞定MySQL InnoDB工作原理,kafka视频分析

Java 程序员 后端

2021最新成功收获字节(Java后端开发)意向书

Java 程序员 后端

2021最新金三银四面经:166位粉丝面试大厂经验总结(附面试真题

Java 程序员 后端

100道 IT名企前端面试真题,【面试必备】

Java 程序员 后端

2020年Java篇:蚂蚁金服、拼多多,小米java面试几轮

Java 程序员 后端

SpringCloud+Boot2+Docker+ES打造45K+Star的微服务项目,附教程

Java 程序员 Spring Cloud

15道常考SpringBoot面试题整理,java资源百度云盘

Java 程序员 后端

2021毕业的Java应届生,面试需要掌握哪些技能,才能收割offer

Java 程序员 后端

从大模型到智能体:50+ 头部企业的 AI 进化实践_AI&大模型_Kitty_InfoQ精选文章