写点什么

沈向洋拆解 AI 五大演进维度:AI 发展既要 “登珠峰” 也要 “修公路”,灵巧手是人类在 AI 面前最后尊严

  • 2025-11-22
    北京
  • 本文字数:4494 字

    阅读完需:约 15 分钟

大小:2.32M时长:13:31
沈向洋拆解AI五大演进维度:AI发展既要 “登珠峰” 也要 “修公路”,灵巧手是人类在AI面前最后尊严

2025 年 11 月 22 日,一年一度的 IDEA 大会在深圳福田会展中心如期举行。这场由 IDEA 研究院创院理事长、美国国家工程院外籍院士沈向洋发起的人工智能盛会,汇聚产学研企界领袖,深度探讨 AI 发展、AI Agent、具身智能、低空经济等前沿议题。


沈向洋在开场便对中美 AI 发展差距问题给出鲜明观点:AI 发展有两个核心维度,一是“攀登珠峰",以巨额投入追求性能顶尖的最强模型;二是“修建公路",让技术适配更多场景、惠及更多用户,实现规模化落地应用。他强调道,“任何事情都需要走自己的发展之路,AI 的发展也不例外”,而这也是 IDEA 在深圳五年深耕的核心逻辑。


沈向洋以近 3 小时的主题演讲,系统拆解智能演进的五维框架,同步发布多项重磅成果,为行业勾勒出技术从实验室走向产业的清晰路径。

AI 演进五维框架:算力算法数据之外,交互与载体成关键


谈及 AI 发展的核心要素,沈向洋提出突破传统认知的“五维框架"——在广为人知的算力、算法、数据之外,必须加入“交互"与“载体"两个维度,才能完整理解智能的进化脉络。


1. 算法范式:从 Transformer 到自主学习,回归经典找新机遇


算法是 AI 发展的核心引擎,其演进呈现三阶段特征:监督学习构筑基础表达与生成能力,强化学习引入因果逻辑与执行能力,自主学习则迈向高层认知突破。技术层面,从 2017 年谷歌 Transformer 架构问世,到 OpenAI GPT 系列预训练技术颠覆行业,再到 2024 年 o1 模型推理能力爆发、DeepSeek 推动开源大模型发展,持续拓展智能边界。沈向洋强调,未来算法创新可回归经典理论,如维纳《控制论》中的思想,强化学习背后的数学原理正源自控制论的最优控制理论,蕴藏着自主学习的巨大想象空间。

2. 智能载体:从虚拟抽象到物理具身,AI 迈向“改变世界"


AI 载体的进化遵循“从抽象到具体、从虚拟到物理"的路径:早期以语言模型为核心,逐步拓展到覆盖声音、图像、视频乃至 4D 内容的多模态模型;在此基础上,融入物理世界规律的“世界模型"成为新方向;当世界模型落地到机器人、自动驾驶车辆、飞行器等物理实体时,便形成具身模型。“从载体维度看,AI 正从‘理解世界'走向‘改变世界'。"沈向洋表示,这也是 IDEA 在多模态与具身智能领域持续深耕的核心原因。

3. 交互范式:从被动响应到主动执行,人机关系重构


过去七八十年,人机交互历经命令行、图形界面、互联网搜索、推荐系统的迭代,AI 的出现带来自然语言与多模态交互变革。早期大模型类似“被动搜索",问一句答一句;近年的推理模型则实现“循环迭代",像科研活动般持续对话推理。沈向洋提出“探索世界应 Search less, research more“的理念,认为未来 AI 将更多主动提出问题、执行任务,但关键决策仍需人类把控,确保行为不偏离安全边界。

4. 计算架构:GPU 成“基础设施",专用芯片与新型架构破局高能耗


2006 年起,GPU 从游戏设备发展为通用并行计算系统,先后支撑“挖矿"与大模型训练,如今已成为 AI 基础设施。但当前算力需求呈现新变化:推理需求远超训练,端侧芯片与强化学习专用芯片需求激增——前者需低功耗、高吞吐,后者需支持高速交互与大规模并行。面对 GPU 高能耗现状,沈向洋打趣道:“黄仁勋每天醒来都在笑,整个世界的人都在给他捐钱。"他指出,未来光子、量子、类脑计算等新型架构,有望在特定领域实现性能跃升,缓解算力成本压力。

5. 数据维度:静态语料不够用,动态反馈成“新刚需"


在智能演进的不同阶段,数据扮演截然不同的角色:模拟世界阶段是“静态教材",探索世界阶段是“动态反馈",归纳世界阶段则是“验证假设的证据"。沈向洋用“骑自行车"作比:“光看书永远学不会骑自行车,AI 转向强化学习、探索世界时,需要的是带反馈的动态数据。"IDEA 孵化的 DataArc 团队推出 SynData 开源框架,针对阿拉伯语等小语种语料稀缺问题(仅为英文的 1/100),将相关研发代码从 2000 行精简至 50 行,成为数据创新的典型案例。

重磅成果密集发布:金融大模型、GPU 渲染器齐亮相,MoonBit SDK 下月开源


围绕“五维框架",沈向洋现场发布一系列从实验室走向产业的创新成果,覆盖数据、模型、工具链等关键领域。

1. Quant 5.0 金融大模型:时间序列底座支撑投资、风控、模拟


针对金融领域核心痛点,IDEA 推出基于金融时间序列的 Quant 5.0 底座大模型。该模型依托 1.56 亿条全球金融时间序列(34 万 T 数据)训练,可支撑三类关键任务:预测未来收益与走势,辅助投资决策;为交易所、监管机构及投资机构提供风控能力;开展市场模拟与压力测试,助力监管决策。其在中证 1000 指数增强场景中实现 30%超额收益、2%最大回撤(夏普率达 6),且可轻松迁移至不同市场、资产类别及交易策略,通过 Agent 实现自动化部署。从 2021 年 ideaGraph 金融行为知识图谱到 2023 年 Alpha-GPT 投资智能体,IDEA 在金融 AI 领域已形成五年持续迭代的技术体系。

2. GPU 原生渲染引擎:效率提升数百倍,获头部影视团队验证



影视工业长期受限于 CPU 渲染低效率,IDEA 团队打造的 GPU 原生渲染引擎,成为国内首个工业级 AI 驱动渲染解决方案。在保证高质量渲染效果的前提下,其效率较传统渲染器提升数十至数百倍,兼容 Maya 等主流动画特效建模软件,无需改变现有工作流。目前已与《流浪地球》视效制作方 More VFX、《哪吒》系列出品方光线动画、源初动漫等达成合作,支撑多部影视作品全片渲染,实现"数月工作量一天完成"的行业突破。

3. MoonBit:AI 时代新编程语言,下月开源多语言 Agent SDK



作为 IDEA 自研的 AI 时代编程语言,MoonBit 已从多后端支持语言,演进为涵盖 AI 原生工具集的全栈工具链,覆盖 WebAssembly 边缘计算、C/LLVM 系统编程、JavaScript 前端开发等全场景,构建起开发者工具链与智能体开发生态一体化平台。今年推出的 MoonBit Pilot,是全球首个语言原生的智能体开发环境,可智能辅助生成工具包。沈向洋透露,下月将正式开源 MoonBit Agent SDK,支持多种编程语言。目前其社区用户已达十万级规模,全球贡献代码超 1000 万行,生态库约 3000 个,进入北大、清华等高校课程并实现北美商业化落地。

AI Agent 重塑四层生态:从超级个体到科学创新,生产关系大变革


2025 年被视为 AI Agent 创新爆发元年,盖茨曾预言其将引发“自键入命令到点击图标以来最大的计算革命"。沈向洋从个体、公司、治理、创新四个层面,拆解其深层影响。


1. 个体层面:“超级个体"崛起,组织关系重构


AI Agent 带来生产力飞跃,“一个人+一堆 AI Agent"即可成为“超级个体",完成过去一个团队的工作——IDEA 设计师仅凭平面设计背景,借助 AI 工具独立完成时尚品牌广告片全流程制作。这种变革直接推动生产关系重构,成为超级个体的关键在于是否愿意学习运用 AI Agent。沈向洋调侃,未来 CEO 可能从“Chief Executive Officer"转变为“Chief Entertaining Officer",个体与组织的关系将被重新定义。

2. 企业层面:KAIROS 决策智能体落地,打造决策闭环


沈向洋判断,未来更多企业将成为“AI Native 公司",全流程围绕 AI 重构。IDEA 推出的 KAIROS 决策智能体,通过三大能力构建“决策-执行-反馈"闭环:借助通用大模型理解企业数据与经验,精准解读业务需求;针对复杂决策提供端到端优化方案;通过自动编程实现模型自适应演变,降低维护成本。该智能体已与美的合作落地集装箱装载优化项目,实现装载率与研发效率双提升,多环节联合优化场景效益增长达 40%,并拓展至欧洲、东南亚业务线。


3. 政府治理层面:经济超脑 2.0 落地南山,效率提升 10-30 倍


在政府治理中,统计部门长期面临“找数据、整材料、写报告"的低效困境。IDEA 去年发布的“经济超脑 1.0"已能看懂数据、理解逻辑,今年升级的 2.0 版本实现全流程自动化分析。依托 Agents 驱动的智能框架,其可关联模糊需求与业务指标、自动拆解宏观分析任务,效率提升 10-30 倍。目前该系统已在深圳市南山区统计局试点,为工业发展分析、重点企业监测等提供智能化决策支持。

4. 科学创新层面:Mozi 药物平台问世,45 分钟完成帕金森病药物设计



AI Agent 对科学创新的推动是沈向洋最为看重的价值。IDEA 发布的 Mozi 药物计算发现平台,以“Agent+Toolbox"模式,结合多智能体架构与自动化流程,破解传统药物早期计算中的工具误导、研发黑箱等痛点。以帕金森病药物设计为例,传统流程需 36 个月,而 Mozi 平台仅需 45 分钟即可完成靶点选择、分子设计、安全过滤、报告生成全流程,交付符合临床一期质量的药物分子候选物。

具身智能攻坚“灵巧手",三大新中心夯实技术落地优势


具身智能是本次大会焦点议题,沈向洋提到,特斯拉因人形机器人手部技术难题缩减生产计划,足以证明“灵巧手"是具身智能领域的“珠峰级难题"。“人手既能搬箱子,也能穿针引线,这种'魔法'源于 27 个自由度与 2.7 万个触觉传感器,灵巧手是人类在 AI 面前最后的尊严。"

1. 赛事与技术双驱动,破解具身智能落地难题


为推动灵巧手技术实用化,IDEA 举办国内首个“灵巧手+即时配送"专项赛事,以真实场景为赛题,覆盖取包裹、拆包裹、按电梯等末端配送全环节。同时发布 DINO-X Grasp 视觉大模型,实现世界开集 2D 认知、物体级抓取位姿预测与 3D 形状感知,为具身智能提供“更强大脑"。该模型已应用于招商局集团多场景检测、美团无人机障碍物识别等实际业务,孵化的初创公司视启未来完成近亿元天使轮融资。


2. 三大新中心落地,构建具身智能生态


过去一年,IDEA 围绕具身智能成立三大核心机构:与腾讯共建的福田实验室,推出 Tairos 具身智能开放平台;国际先进技术应用推进中心,聚焦 AI、具身智能、低空经济的产业转化;深港高等研究交流中心(SHARE),依托深港资源搭建跨学科合作平台。沈向洋强调,黄仁勋曾表示“具身智能是粤港澳大湾区非凡的机遇",这些机构将进一步夯实技术落地与产业协同的核心优势。

低空经济发布 OpenSILAS 2.0,从“监视"到“引导"升级



在低空经济领域,沈向洋团队发布 OpenSILAS 2.0,实现从 1.0“监视飞行"到 2.0“引导飞行"的跨越。该系统通过可进化框架覆盖“规划—运行—监管—服务"全环节,依据城市与空域复杂度提供分级化、模块化方案。针对有人机与无人机高度基准不一致的冲突问题,同步发布“低空多元高度基站"(高度盒子),并联合民航局制定行业标准。与 UCloud 合作的“低空一体机",将低空系统从“项目式建设"转为“产品化交付",为各地因地制宜发展低空经济提供便捷方案。大会同时发布《低空经济白皮书 4.0(通导监网络之路)》,并宣布 OpenSILAS 创新联合体新增 15 家成员企业。

结语:技术突破与场景落地双向赋能,AI 落地进入深水区


沈向洋在演讲结尾总结道,智能演进的五大维度正加速迭代,交互与载体持续重塑人机边界,AI 已从“问一句答一句"的工具,逐步升级为与人类协同推理、共创知识的长期伙伴。IDEA 五年深耕的实践,本质是技术突破与场景落地的双向奔赴——从 SynData 框架解决小语种数据稀缺痛点,到 Quant 5.0 在金融场景实现收益与风控双提升;从 AI Agent 重构企业决策与科研流程,到具身智能攻坚“灵巧手"等行业硬骨头,再到 OpenSILAS 2.0 搭建低空经济标准化体系,每一步探索都紧扣“技术可用、产业能用"的核心目标。


当前 AI 行业正从“单点创新"迈向“体系化落地"的深水区,无论是“攀登珠峰"式的前沿技术攻关,还是“修建公路"式的规模化应用推广,核心都在于以场景需求为锚点,让技术真正解决行业实际问题。随着开源生态的完善、跨机构协作的深化,AI 将在更多垂直领域实现价值闭环,为产业升级提供实实在在的技术驱动力。

2025-11-22 22:275862
用户头像
蔡芳芳 InfoQ 总编辑

发布了 851 篇内容, 共 627.8 次阅读, 收获喜欢 2826 次。

关注

评论

发布
暂无评论

【Vue2.x 源码学习】第七篇 - 阶段性梳理

Brave

源码 vue2 6月日更

公安警情研判分析系统搭建,警情可视化指挥调度

智能家居弱电布线设计注意事项

不脱发的程序猿

智能家居 弱点布线

【LeetCode】汉明距离Java题解

Albert

算法 LeetCode 6月日更

Service worker 的概念和用法

编程三昧

大前端 ServiceWorker

分布式管理员zookeeper

卢卡多多

zookeeper CAP 6月日更

如何看懂常用原理图符号、如何阅读原理图

不脱发的程序猿

电路设计 原理图符号 阅读原理图

深度分享丨如何使用微细分仪打造金融场景下的战术级客户分群

索信达控股

大数据 金融科技 用户细分 客户数据平台 客户画像

react源码解析8.render阶段

全栈潇晨

React react源码

企业管理软件开发新模式:抛开旧思维,轻松做系统

雯雯写代码

软件开发 企业管理

Bzz云算力挖矿app开发,Bzz分币系统搭建

百度Geek们教你怎样成为复盘高手

百度Geek说

云图说|OLAP开源引擎的一匹黑马,MRS集群组件之ClickHouse

华为云开发者联盟

Clickhouse MRS 华为云 云图说 OLAP开源引擎

让JavaScript在WebAssembly上快速运行

代码先生

JIT webassembly WASI

如何合并K个有序链表

Skysper

算法

【Flutter 专题】126 图解自定义两侧对齐 ACETabBar 标签导航栏

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

Java 并发编程—— Exchanger

Antway

6月日更

不看绝对血亏!跳槽面试大厂被拒,2021最新版!

欢喜学安卓

android 程序员 面试 移动开发

Go timer 是如何被调度的?

HHFCodeRv

Go 语言

独热编码&词向量

Qien Z.

nlp 6月日更 独热编码 词向量 句子向量

MySQL next-key lock 加锁范围总结

程序员小航

MySQL 索引 锁机制

真香!SpringBoot+SpringCloud Alibaba全套脑图+学习笔记+大厂面试题

Java架构追梦

Java 架构 微服务 springboot SpringCloud

双向链表,还能这么实现

实力程序员

阿里云,让「服务」成为一种先进生产力

ToB行业头条

云计算 阿里云

视频监控系统供电方式及选择方法

不脱发的程序猿

视频监控系统 供电方式 智能监控

读深入ES6记[一]

蛋先生DX

ES6 6月日更

Chia奇亚挖矿app开发|系统搭建

開發I3O6O643Zq7

挖矿 #区块链# IPFS怎么挖矿 Chia奇亚挖矿

安卓内存监控悬浮窗,算法题+JVM,知识点总结+面试题解析

欢喜学安卓

android 程序员 面试 移动开发

数仓建设之路(一)

undefined

沈向洋拆解AI五大演进维度:AI发展既要 “登珠峰” 也要 “修公路”,灵巧手是人类在AI面前最后尊严_生成式 AI_蔡芳芳_InfoQ精选文章