写点什么

沈向洋拆解 AI 五大演进维度:AI 发展既要 “登珠峰” 也要 “修公路”,灵巧手是人类在 AI 面前最后尊严

  • 2025-11-22
    北京
  • 本文字数:4494 字

    阅读完需:约 15 分钟

大小:2.32M时长:13:31
沈向洋拆解AI五大演进维度:AI发展既要 “登珠峰” 也要 “修公路”,灵巧手是人类在AI面前最后尊严

2025 年 11 月 22 日,一年一度的 IDEA 大会在深圳福田会展中心如期举行。这场由 IDEA 研究院创院理事长、美国国家工程院外籍院士沈向洋发起的人工智能盛会,汇聚产学研企界领袖,深度探讨 AI 发展、AI Agent、具身智能、低空经济等前沿议题。


沈向洋在开场便对中美 AI 发展差距问题给出鲜明观点:AI 发展有两个核心维度,一是“攀登珠峰",以巨额投入追求性能顶尖的最强模型;二是“修建公路",让技术适配更多场景、惠及更多用户,实现规模化落地应用。他强调道,“任何事情都需要走自己的发展之路,AI 的发展也不例外”,而这也是 IDEA 在深圳五年深耕的核心逻辑。


沈向洋以近 3 小时的主题演讲,系统拆解智能演进的五维框架,同步发布多项重磅成果,为行业勾勒出技术从实验室走向产业的清晰路径。

AI 演进五维框架:算力算法数据之外,交互与载体成关键


谈及 AI 发展的核心要素,沈向洋提出突破传统认知的“五维框架"——在广为人知的算力、算法、数据之外,必须加入“交互"与“载体"两个维度,才能完整理解智能的进化脉络。


1. 算法范式:从 Transformer 到自主学习,回归经典找新机遇


算法是 AI 发展的核心引擎,其演进呈现三阶段特征:监督学习构筑基础表达与生成能力,强化学习引入因果逻辑与执行能力,自主学习则迈向高层认知突破。技术层面,从 2017 年谷歌 Transformer 架构问世,到 OpenAI GPT 系列预训练技术颠覆行业,再到 2024 年 o1 模型推理能力爆发、DeepSeek 推动开源大模型发展,持续拓展智能边界。沈向洋强调,未来算法创新可回归经典理论,如维纳《控制论》中的思想,强化学习背后的数学原理正源自控制论的最优控制理论,蕴藏着自主学习的巨大想象空间。

2. 智能载体:从虚拟抽象到物理具身,AI 迈向“改变世界"


AI 载体的进化遵循“从抽象到具体、从虚拟到物理"的路径:早期以语言模型为核心,逐步拓展到覆盖声音、图像、视频乃至 4D 内容的多模态模型;在此基础上,融入物理世界规律的“世界模型"成为新方向;当世界模型落地到机器人、自动驾驶车辆、飞行器等物理实体时,便形成具身模型。“从载体维度看,AI 正从‘理解世界'走向‘改变世界'。"沈向洋表示,这也是 IDEA 在多模态与具身智能领域持续深耕的核心原因。

3. 交互范式:从被动响应到主动执行,人机关系重构


过去七八十年,人机交互历经命令行、图形界面、互联网搜索、推荐系统的迭代,AI 的出现带来自然语言与多模态交互变革。早期大模型类似“被动搜索",问一句答一句;近年的推理模型则实现“循环迭代",像科研活动般持续对话推理。沈向洋提出“探索世界应 Search less, research more“的理念,认为未来 AI 将更多主动提出问题、执行任务,但关键决策仍需人类把控,确保行为不偏离安全边界。

4. 计算架构:GPU 成“基础设施",专用芯片与新型架构破局高能耗


2006 年起,GPU 从游戏设备发展为通用并行计算系统,先后支撑“挖矿"与大模型训练,如今已成为 AI 基础设施。但当前算力需求呈现新变化:推理需求远超训练,端侧芯片与强化学习专用芯片需求激增——前者需低功耗、高吞吐,后者需支持高速交互与大规模并行。面对 GPU 高能耗现状,沈向洋打趣道:“黄仁勋每天醒来都在笑,整个世界的人都在给他捐钱。"他指出,未来光子、量子、类脑计算等新型架构,有望在特定领域实现性能跃升,缓解算力成本压力。

5. 数据维度:静态语料不够用,动态反馈成“新刚需"


在智能演进的不同阶段,数据扮演截然不同的角色:模拟世界阶段是“静态教材",探索世界阶段是“动态反馈",归纳世界阶段则是“验证假设的证据"。沈向洋用“骑自行车"作比:“光看书永远学不会骑自行车,AI 转向强化学习、探索世界时,需要的是带反馈的动态数据。"IDEA 孵化的 DataArc 团队推出 SynData 开源框架,针对阿拉伯语等小语种语料稀缺问题(仅为英文的 1/100),将相关研发代码从 2000 行精简至 50 行,成为数据创新的典型案例。

重磅成果密集发布:金融大模型、GPU 渲染器齐亮相,MoonBit SDK 下月开源


围绕“五维框架",沈向洋现场发布一系列从实验室走向产业的创新成果,覆盖数据、模型、工具链等关键领域。

1. Quant 5.0 金融大模型:时间序列底座支撑投资、风控、模拟


针对金融领域核心痛点,IDEA 推出基于金融时间序列的 Quant 5.0 底座大模型。该模型依托 1.56 亿条全球金融时间序列(34 万 T 数据)训练,可支撑三类关键任务:预测未来收益与走势,辅助投资决策;为交易所、监管机构及投资机构提供风控能力;开展市场模拟与压力测试,助力监管决策。其在中证 1000 指数增强场景中实现 30%超额收益、2%最大回撤(夏普率达 6),且可轻松迁移至不同市场、资产类别及交易策略,通过 Agent 实现自动化部署。从 2021 年 ideaGraph 金融行为知识图谱到 2023 年 Alpha-GPT 投资智能体,IDEA 在金融 AI 领域已形成五年持续迭代的技术体系。

2. GPU 原生渲染引擎:效率提升数百倍,获头部影视团队验证



影视工业长期受限于 CPU 渲染低效率,IDEA 团队打造的 GPU 原生渲染引擎,成为国内首个工业级 AI 驱动渲染解决方案。在保证高质量渲染效果的前提下,其效率较传统渲染器提升数十至数百倍,兼容 Maya 等主流动画特效建模软件,无需改变现有工作流。目前已与《流浪地球》视效制作方 More VFX、《哪吒》系列出品方光线动画、源初动漫等达成合作,支撑多部影视作品全片渲染,实现"数月工作量一天完成"的行业突破。

3. MoonBit:AI 时代新编程语言,下月开源多语言 Agent SDK



作为 IDEA 自研的 AI 时代编程语言,MoonBit 已从多后端支持语言,演进为涵盖 AI 原生工具集的全栈工具链,覆盖 WebAssembly 边缘计算、C/LLVM 系统编程、JavaScript 前端开发等全场景,构建起开发者工具链与智能体开发生态一体化平台。今年推出的 MoonBit Pilot,是全球首个语言原生的智能体开发环境,可智能辅助生成工具包。沈向洋透露,下月将正式开源 MoonBit Agent SDK,支持多种编程语言。目前其社区用户已达十万级规模,全球贡献代码超 1000 万行,生态库约 3000 个,进入北大、清华等高校课程并实现北美商业化落地。

AI Agent 重塑四层生态:从超级个体到科学创新,生产关系大变革


2025 年被视为 AI Agent 创新爆发元年,盖茨曾预言其将引发“自键入命令到点击图标以来最大的计算革命"。沈向洋从个体、公司、治理、创新四个层面,拆解其深层影响。


1. 个体层面:“超级个体"崛起,组织关系重构


AI Agent 带来生产力飞跃,“一个人+一堆 AI Agent"即可成为“超级个体",完成过去一个团队的工作——IDEA 设计师仅凭平面设计背景,借助 AI 工具独立完成时尚品牌广告片全流程制作。这种变革直接推动生产关系重构,成为超级个体的关键在于是否愿意学习运用 AI Agent。沈向洋调侃,未来 CEO 可能从“Chief Executive Officer"转变为“Chief Entertaining Officer",个体与组织的关系将被重新定义。

2. 企业层面:KAIROS 决策智能体落地,打造决策闭环


沈向洋判断,未来更多企业将成为“AI Native 公司",全流程围绕 AI 重构。IDEA 推出的 KAIROS 决策智能体,通过三大能力构建“决策-执行-反馈"闭环:借助通用大模型理解企业数据与经验,精准解读业务需求;针对复杂决策提供端到端优化方案;通过自动编程实现模型自适应演变,降低维护成本。该智能体已与美的合作落地集装箱装载优化项目,实现装载率与研发效率双提升,多环节联合优化场景效益增长达 40%,并拓展至欧洲、东南亚业务线。


3. 政府治理层面:经济超脑 2.0 落地南山,效率提升 10-30 倍


在政府治理中,统计部门长期面临“找数据、整材料、写报告"的低效困境。IDEA 去年发布的“经济超脑 1.0"已能看懂数据、理解逻辑,今年升级的 2.0 版本实现全流程自动化分析。依托 Agents 驱动的智能框架,其可关联模糊需求与业务指标、自动拆解宏观分析任务,效率提升 10-30 倍。目前该系统已在深圳市南山区统计局试点,为工业发展分析、重点企业监测等提供智能化决策支持。

4. 科学创新层面:Mozi 药物平台问世,45 分钟完成帕金森病药物设计



AI Agent 对科学创新的推动是沈向洋最为看重的价值。IDEA 发布的 Mozi 药物计算发现平台,以“Agent+Toolbox"模式,结合多智能体架构与自动化流程,破解传统药物早期计算中的工具误导、研发黑箱等痛点。以帕金森病药物设计为例,传统流程需 36 个月,而 Mozi 平台仅需 45 分钟即可完成靶点选择、分子设计、安全过滤、报告生成全流程,交付符合临床一期质量的药物分子候选物。

具身智能攻坚“灵巧手",三大新中心夯实技术落地优势


具身智能是本次大会焦点议题,沈向洋提到,特斯拉因人形机器人手部技术难题缩减生产计划,足以证明“灵巧手"是具身智能领域的“珠峰级难题"。“人手既能搬箱子,也能穿针引线,这种'魔法'源于 27 个自由度与 2.7 万个触觉传感器,灵巧手是人类在 AI 面前最后的尊严。"

1. 赛事与技术双驱动,破解具身智能落地难题


为推动灵巧手技术实用化,IDEA 举办国内首个“灵巧手+即时配送"专项赛事,以真实场景为赛题,覆盖取包裹、拆包裹、按电梯等末端配送全环节。同时发布 DINO-X Grasp 视觉大模型,实现世界开集 2D 认知、物体级抓取位姿预测与 3D 形状感知,为具身智能提供“更强大脑"。该模型已应用于招商局集团多场景检测、美团无人机障碍物识别等实际业务,孵化的初创公司视启未来完成近亿元天使轮融资。


2. 三大新中心落地,构建具身智能生态


过去一年,IDEA 围绕具身智能成立三大核心机构:与腾讯共建的福田实验室,推出 Tairos 具身智能开放平台;国际先进技术应用推进中心,聚焦 AI、具身智能、低空经济的产业转化;深港高等研究交流中心(SHARE),依托深港资源搭建跨学科合作平台。沈向洋强调,黄仁勋曾表示“具身智能是粤港澳大湾区非凡的机遇",这些机构将进一步夯实技术落地与产业协同的核心优势。

低空经济发布 OpenSILAS 2.0,从“监视"到“引导"升级



在低空经济领域,沈向洋团队发布 OpenSILAS 2.0,实现从 1.0“监视飞行"到 2.0“引导飞行"的跨越。该系统通过可进化框架覆盖“规划—运行—监管—服务"全环节,依据城市与空域复杂度提供分级化、模块化方案。针对有人机与无人机高度基准不一致的冲突问题,同步发布“低空多元高度基站"(高度盒子),并联合民航局制定行业标准。与 UCloud 合作的“低空一体机",将低空系统从“项目式建设"转为“产品化交付",为各地因地制宜发展低空经济提供便捷方案。大会同时发布《低空经济白皮书 4.0(通导监网络之路)》,并宣布 OpenSILAS 创新联合体新增 15 家成员企业。

结语:技术突破与场景落地双向赋能,AI 落地进入深水区


沈向洋在演讲结尾总结道,智能演进的五大维度正加速迭代,交互与载体持续重塑人机边界,AI 已从“问一句答一句"的工具,逐步升级为与人类协同推理、共创知识的长期伙伴。IDEA 五年深耕的实践,本质是技术突破与场景落地的双向奔赴——从 SynData 框架解决小语种数据稀缺痛点,到 Quant 5.0 在金融场景实现收益与风控双提升;从 AI Agent 重构企业决策与科研流程,到具身智能攻坚“灵巧手"等行业硬骨头,再到 OpenSILAS 2.0 搭建低空经济标准化体系,每一步探索都紧扣“技术可用、产业能用"的核心目标。


当前 AI 行业正从“单点创新"迈向“体系化落地"的深水区,无论是“攀登珠峰"式的前沿技术攻关,还是“修建公路"式的规模化应用推广,核心都在于以场景需求为锚点,让技术真正解决行业实际问题。随着开源生态的完善、跨机构协作的深化,AI 将在更多垂直领域实现价值闭环,为产业升级提供实实在在的技术驱动力。

2025-11-22 22:278
用户头像
蔡芳芳 InfoQ 总编辑

发布了 820 篇内容, 共 622.5 次阅读, 收获喜欢 2823 次。

关注

评论

发布
暂无评论

开发者空间安装ODBC驱动,编写应用程序操作GaussDB数据库

华为云开发者联盟

数据库 华为云 Gauss DB ODBC 华为开发者空间

大数据-51 Redis 分布式锁到哨兵机制:一文掌握Redis高可用架构

武子康

Java redis 大数据 缓存 分布式

AI英语口语练习APP的开发

北京木奇移动技术有限公司

软件外包公司 AI英语学习 AI英语

算法赋能再升级!非凸底仓增强算法全面上线江海证券

非凸科技

深度剖析 RocketMQ 5.0 之架构解析:云原生架构如何支撑多元化场景?

Apache RocketMQ

RocketMQ 云原生 消息队列

海外版“JoyLinker”来了!全家桶套件免费开放!

BeeWorks

即时通讯 IM 私有化部署

基于模型蒸馏的大模型文案生成最佳实践

阿里云大数据AI技术

人工智能 大数据 大模型 大语言模型 大模型蒸馏

CTE查询数据量过大导致MySQL 8.0发生CORE问题解析

GreatSQL

哈尔滨三级等保建设:从规划到落地的关键步骤

等保测评

即时通讯:BeeWorks私有化方案重塑企业沟通方式

BeeWorks

即时通讯 IM 私有化部署

预制菜加工预制菜加工厂智能化生产管理MES系统全面解决方案厂智能化生产管理MES系统全面解决方案

万界星空科技

mes 预制菜加工 预制菜工厂 预制菜生产管理 食品加工MES

深度剖析 RocketMQ 5.0 之事件驱动:云时代的事件驱动有啥不同?

Apache RocketMQ

RocketMQ 云原生 消息队列 事件总线Eventbridge

Apache RocketMQ ACL 2.0 全新升级

Apache RocketMQ

RocketMQ 云原生 消息队列

提示注入2.0:混合AI威胁下的新型网络安全挑战

qife122

网络安全 提示注入

构建编程智能体一年实践的经验教训分享

Baihai IDP

程序员 AI AI Agent 编程智能体

微店商品详情API指南

tbapi

微店API 微店商品数据采集 微店商品详情API

基于YOLOv8的交通车辆(12种常见车型)实时检测系统识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!

申公豹

yolov8

生产管理系统赋能烟草行业:激活高效生产新动能

中烟创新

Apache RocketMQ 创新论文被软件工程顶会 FM 2024 录用

Apache RocketMQ

深度剖析 RocketMQ 5.0 之消息进阶:如何支撑复杂业务消息场景?

Apache RocketMQ

RocketMQ 云原生 消息队列

区块链预付卡APP的运营策略

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

区块链预付卡APP的上线流程

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

深度剖析 RocketMQ 5.0 之 IoT 消息:物联网需要什么样的消息技术?

Apache RocketMQ

RocketMQ 云原生 物联网 IoT 消息队列

中烟创新推出“小快轻准”应用产品,助力中小企业数字化转型

中烟创新

企业为什么需要私有化部署的IM软件?

BeeWorks

即时通讯 IM 私有化部署

1688图片搜索商品API指南

tbapi

1688API接口 1688拍立淘接口 1688图片搜索API 1688拍立淘api

RocketMQ 打破锁性能瓶颈之道

Apache RocketMQ

云原生 消息队列

基于 Apache RocketMQ 的 ApsaraMQ Serverless 架构升级

Apache RocketMQ

云原生 事件驱动 消息队列

开赛 | KWDB 核心贡献挑战赛,30万奖金池等你来瓜分!

KaiwuDB

哈尔滨二级等保测评:关注重点与实施要点

等保测评

经典MCP服务器漏洞如何威胁您的整个AI代理系统

qife122

SQL注入 漏洞挖掘

沈向洋拆解AI五大演进维度:AI发展既要 “登珠峰” 也要 “修公路”,灵巧手是人类在AI面前最后尊严_生成式 AI_蔡芳芳_InfoQ精选文章