写点什么

沈向洋拆解 AI 五大演进维度:AI 发展既要 “登珠峰” 也要 “修公路”,灵巧手是人类在 AI 面前最后尊严

  • 2025-11-22
    北京
  • 本文字数:4494 字

    阅读完需:约 15 分钟

大小:2.32M时长:13:31
沈向洋拆解AI五大演进维度:AI发展既要 “登珠峰” 也要 “修公路”,灵巧手是人类在AI面前最后尊严

2025 年 11 月 22 日,一年一度的 IDEA 大会在深圳福田会展中心如期举行。这场由 IDEA 研究院创院理事长、美国国家工程院外籍院士沈向洋发起的人工智能盛会,汇聚产学研企界领袖,深度探讨 AI 发展、AI Agent、具身智能、低空经济等前沿议题。


沈向洋在开场便对中美 AI 发展差距问题给出鲜明观点:AI 发展有两个核心维度,一是“攀登珠峰",以巨额投入追求性能顶尖的最强模型;二是“修建公路",让技术适配更多场景、惠及更多用户,实现规模化落地应用。他强调道,“任何事情都需要走自己的发展之路,AI 的发展也不例外”,而这也是 IDEA 在深圳五年深耕的核心逻辑。


沈向洋以近 3 小时的主题演讲,系统拆解智能演进的五维框架,同步发布多项重磅成果,为行业勾勒出技术从实验室走向产业的清晰路径。

AI 演进五维框架:算力算法数据之外,交互与载体成关键


谈及 AI 发展的核心要素,沈向洋提出突破传统认知的“五维框架"——在广为人知的算力、算法、数据之外,必须加入“交互"与“载体"两个维度,才能完整理解智能的进化脉络。


1. 算法范式:从 Transformer 到自主学习,回归经典找新机遇


算法是 AI 发展的核心引擎,其演进呈现三阶段特征:监督学习构筑基础表达与生成能力,强化学习引入因果逻辑与执行能力,自主学习则迈向高层认知突破。技术层面,从 2017 年谷歌 Transformer 架构问世,到 OpenAI GPT 系列预训练技术颠覆行业,再到 2024 年 o1 模型推理能力爆发、DeepSeek 推动开源大模型发展,持续拓展智能边界。沈向洋强调,未来算法创新可回归经典理论,如维纳《控制论》中的思想,强化学习背后的数学原理正源自控制论的最优控制理论,蕴藏着自主学习的巨大想象空间。

2. 智能载体:从虚拟抽象到物理具身,AI 迈向“改变世界"


AI 载体的进化遵循“从抽象到具体、从虚拟到物理"的路径:早期以语言模型为核心,逐步拓展到覆盖声音、图像、视频乃至 4D 内容的多模态模型;在此基础上,融入物理世界规律的“世界模型"成为新方向;当世界模型落地到机器人、自动驾驶车辆、飞行器等物理实体时,便形成具身模型。“从载体维度看,AI 正从‘理解世界'走向‘改变世界'。"沈向洋表示,这也是 IDEA 在多模态与具身智能领域持续深耕的核心原因。

3. 交互范式:从被动响应到主动执行,人机关系重构


过去七八十年,人机交互历经命令行、图形界面、互联网搜索、推荐系统的迭代,AI 的出现带来自然语言与多模态交互变革。早期大模型类似“被动搜索",问一句答一句;近年的推理模型则实现“循环迭代",像科研活动般持续对话推理。沈向洋提出“探索世界应 Search less, research more“的理念,认为未来 AI 将更多主动提出问题、执行任务,但关键决策仍需人类把控,确保行为不偏离安全边界。

4. 计算架构:GPU 成“基础设施",专用芯片与新型架构破局高能耗


2006 年起,GPU 从游戏设备发展为通用并行计算系统,先后支撑“挖矿"与大模型训练,如今已成为 AI 基础设施。但当前算力需求呈现新变化:推理需求远超训练,端侧芯片与强化学习专用芯片需求激增——前者需低功耗、高吞吐,后者需支持高速交互与大规模并行。面对 GPU 高能耗现状,沈向洋打趣道:“黄仁勋每天醒来都在笑,整个世界的人都在给他捐钱。"他指出,未来光子、量子、类脑计算等新型架构,有望在特定领域实现性能跃升,缓解算力成本压力。

5. 数据维度:静态语料不够用,动态反馈成“新刚需"


在智能演进的不同阶段,数据扮演截然不同的角色:模拟世界阶段是“静态教材",探索世界阶段是“动态反馈",归纳世界阶段则是“验证假设的证据"。沈向洋用“骑自行车"作比:“光看书永远学不会骑自行车,AI 转向强化学习、探索世界时,需要的是带反馈的动态数据。"IDEA 孵化的 DataArc 团队推出 SynData 开源框架,针对阿拉伯语等小语种语料稀缺问题(仅为英文的 1/100),将相关研发代码从 2000 行精简至 50 行,成为数据创新的典型案例。

重磅成果密集发布:金融大模型、GPU 渲染器齐亮相,MoonBit SDK 下月开源


围绕“五维框架",沈向洋现场发布一系列从实验室走向产业的创新成果,覆盖数据、模型、工具链等关键领域。

1. Quant 5.0 金融大模型:时间序列底座支撑投资、风控、模拟


针对金融领域核心痛点,IDEA 推出基于金融时间序列的 Quant 5.0 底座大模型。该模型依托 1.56 亿条全球金融时间序列(34 万 T 数据)训练,可支撑三类关键任务:预测未来收益与走势,辅助投资决策;为交易所、监管机构及投资机构提供风控能力;开展市场模拟与压力测试,助力监管决策。其在中证 1000 指数增强场景中实现 30%超额收益、2%最大回撤(夏普率达 6),且可轻松迁移至不同市场、资产类别及交易策略,通过 Agent 实现自动化部署。从 2021 年 ideaGraph 金融行为知识图谱到 2023 年 Alpha-GPT 投资智能体,IDEA 在金融 AI 领域已形成五年持续迭代的技术体系。

2. GPU 原生渲染引擎:效率提升数百倍,获头部影视团队验证



影视工业长期受限于 CPU 渲染低效率,IDEA 团队打造的 GPU 原生渲染引擎,成为国内首个工业级 AI 驱动渲染解决方案。在保证高质量渲染效果的前提下,其效率较传统渲染器提升数十至数百倍,兼容 Maya 等主流动画特效建模软件,无需改变现有工作流。目前已与《流浪地球》视效制作方 More VFX、《哪吒》系列出品方光线动画、源初动漫等达成合作,支撑多部影视作品全片渲染,实现"数月工作量一天完成"的行业突破。

3. MoonBit:AI 时代新编程语言,下月开源多语言 Agent SDK



作为 IDEA 自研的 AI 时代编程语言,MoonBit 已从多后端支持语言,演进为涵盖 AI 原生工具集的全栈工具链,覆盖 WebAssembly 边缘计算、C/LLVM 系统编程、JavaScript 前端开发等全场景,构建起开发者工具链与智能体开发生态一体化平台。今年推出的 MoonBit Pilot,是全球首个语言原生的智能体开发环境,可智能辅助生成工具包。沈向洋透露,下月将正式开源 MoonBit Agent SDK,支持多种编程语言。目前其社区用户已达十万级规模,全球贡献代码超 1000 万行,生态库约 3000 个,进入北大、清华等高校课程并实现北美商业化落地。

AI Agent 重塑四层生态:从超级个体到科学创新,生产关系大变革


2025 年被视为 AI Agent 创新爆发元年,盖茨曾预言其将引发“自键入命令到点击图标以来最大的计算革命"。沈向洋从个体、公司、治理、创新四个层面,拆解其深层影响。


1. 个体层面:“超级个体"崛起,组织关系重构


AI Agent 带来生产力飞跃,“一个人+一堆 AI Agent"即可成为“超级个体",完成过去一个团队的工作——IDEA 设计师仅凭平面设计背景,借助 AI 工具独立完成时尚品牌广告片全流程制作。这种变革直接推动生产关系重构,成为超级个体的关键在于是否愿意学习运用 AI Agent。沈向洋调侃,未来 CEO 可能从“Chief Executive Officer"转变为“Chief Entertaining Officer",个体与组织的关系将被重新定义。

2. 企业层面:KAIROS 决策智能体落地,打造决策闭环


沈向洋判断,未来更多企业将成为“AI Native 公司",全流程围绕 AI 重构。IDEA 推出的 KAIROS 决策智能体,通过三大能力构建“决策-执行-反馈"闭环:借助通用大模型理解企业数据与经验,精准解读业务需求;针对复杂决策提供端到端优化方案;通过自动编程实现模型自适应演变,降低维护成本。该智能体已与美的合作落地集装箱装载优化项目,实现装载率与研发效率双提升,多环节联合优化场景效益增长达 40%,并拓展至欧洲、东南亚业务线。


3. 政府治理层面:经济超脑 2.0 落地南山,效率提升 10-30 倍


在政府治理中,统计部门长期面临“找数据、整材料、写报告"的低效困境。IDEA 去年发布的“经济超脑 1.0"已能看懂数据、理解逻辑,今年升级的 2.0 版本实现全流程自动化分析。依托 Agents 驱动的智能框架,其可关联模糊需求与业务指标、自动拆解宏观分析任务,效率提升 10-30 倍。目前该系统已在深圳市南山区统计局试点,为工业发展分析、重点企业监测等提供智能化决策支持。

4. 科学创新层面:Mozi 药物平台问世,45 分钟完成帕金森病药物设计



AI Agent 对科学创新的推动是沈向洋最为看重的价值。IDEA 发布的 Mozi 药物计算发现平台,以“Agent+Toolbox"模式,结合多智能体架构与自动化流程,破解传统药物早期计算中的工具误导、研发黑箱等痛点。以帕金森病药物设计为例,传统流程需 36 个月,而 Mozi 平台仅需 45 分钟即可完成靶点选择、分子设计、安全过滤、报告生成全流程,交付符合临床一期质量的药物分子候选物。

具身智能攻坚“灵巧手",三大新中心夯实技术落地优势


具身智能是本次大会焦点议题,沈向洋提到,特斯拉因人形机器人手部技术难题缩减生产计划,足以证明“灵巧手"是具身智能领域的“珠峰级难题"。“人手既能搬箱子,也能穿针引线,这种'魔法'源于 27 个自由度与 2.7 万个触觉传感器,灵巧手是人类在 AI 面前最后的尊严。"

1. 赛事与技术双驱动,破解具身智能落地难题


为推动灵巧手技术实用化,IDEA 举办国内首个“灵巧手+即时配送"专项赛事,以真实场景为赛题,覆盖取包裹、拆包裹、按电梯等末端配送全环节。同时发布 DINO-X Grasp 视觉大模型,实现世界开集 2D 认知、物体级抓取位姿预测与 3D 形状感知,为具身智能提供“更强大脑"。该模型已应用于招商局集团多场景检测、美团无人机障碍物识别等实际业务,孵化的初创公司视启未来完成近亿元天使轮融资。


2. 三大新中心落地,构建具身智能生态


过去一年,IDEA 围绕具身智能成立三大核心机构:与腾讯共建的福田实验室,推出 Tairos 具身智能开放平台;国际先进技术应用推进中心,聚焦 AI、具身智能、低空经济的产业转化;深港高等研究交流中心(SHARE),依托深港资源搭建跨学科合作平台。沈向洋强调,黄仁勋曾表示“具身智能是粤港澳大湾区非凡的机遇",这些机构将进一步夯实技术落地与产业协同的核心优势。

低空经济发布 OpenSILAS 2.0,从“监视"到“引导"升级



在低空经济领域,沈向洋团队发布 OpenSILAS 2.0,实现从 1.0“监视飞行"到 2.0“引导飞行"的跨越。该系统通过可进化框架覆盖“规划—运行—监管—服务"全环节,依据城市与空域复杂度提供分级化、模块化方案。针对有人机与无人机高度基准不一致的冲突问题,同步发布“低空多元高度基站"(高度盒子),并联合民航局制定行业标准。与 UCloud 合作的“低空一体机",将低空系统从“项目式建设"转为“产品化交付",为各地因地制宜发展低空经济提供便捷方案。大会同时发布《低空经济白皮书 4.0(通导监网络之路)》,并宣布 OpenSILAS 创新联合体新增 15 家成员企业。

结语:技术突破与场景落地双向赋能,AI 落地进入深水区


沈向洋在演讲结尾总结道,智能演进的五大维度正加速迭代,交互与载体持续重塑人机边界,AI 已从“问一句答一句"的工具,逐步升级为与人类协同推理、共创知识的长期伙伴。IDEA 五年深耕的实践,本质是技术突破与场景落地的双向奔赴——从 SynData 框架解决小语种数据稀缺痛点,到 Quant 5.0 在金融场景实现收益与风控双提升;从 AI Agent 重构企业决策与科研流程,到具身智能攻坚“灵巧手"等行业硬骨头,再到 OpenSILAS 2.0 搭建低空经济标准化体系,每一步探索都紧扣“技术可用、产业能用"的核心目标。


当前 AI 行业正从“单点创新"迈向“体系化落地"的深水区,无论是“攀登珠峰"式的前沿技术攻关,还是“修建公路"式的规模化应用推广,核心都在于以场景需求为锚点,让技术真正解决行业实际问题。随着开源生态的完善、跨机构协作的深化,AI 将在更多垂直领域实现价值闭环,为产业升级提供实实在在的技术驱动力。

2025-11-22 22:275937
用户头像
蔡芳芳 InfoQ 总编辑

发布了 851 篇内容, 共 629.4 次阅读, 收获喜欢 2826 次。

关注

评论

发布
暂无评论

模块二作业-分析微信朋友圈的高性能复杂度

Geek_e3a35c

10 万字节Spring Boot +redis详细面试笔记(带完整目录)免费分享

钟奕礼

程序员 Java 面试 Java、 java 编程

惊喜来袭!阿里内部Java开发成长手册(2022纯享版)开源

程序知音

Java 阿里 java面试 后端技术 Java面试八股文

【喜报】OpenCloudOS 荣获2022 中国技术力量年度榜单「十大开源新锐项目」

腾源会

开源 opencloudOS

大数据培训后的就业因素有哪些

小谷哥

前端开发培训机构有什么推荐?

小谷哥

Databend in 2022

Databend

我坦白→低代码功能我有,SQL练习题、数据可视化、数据填充助你高效

非喵鱼

sql 低代码 可视化 eCharts 数据库·

开源全球公司贡献 49 名,涛思数据荣登 2022 中国开发者影响力年度榜单

TDengine

tdengine 时序数据库

一个深度学习框架的年度报告

MegEngineBot

深度学习 年终总结 MegEngine

建信信托真的可靠吗?投资者含泪控诉

鳄鱼视界

女生通过java编程学习好找工作吗?

小谷哥

【从零开始学爬虫】采集全国历史天气数据

前嗅大数据

数据采集 爬虫软件 爬虫教程 爬虫入门 爬虫入门教程

公司刚来的阿里p8,看完我构建的springboot框架,甩给我一份文档

钟奕礼

程序员 Java 面试 Java、 java 编程

蚂蚁金服Java研发岗二面:说说HashMap 中的容量与扩容实现

钟奕礼

程序员 Java 面试 Java、 java 编程

恭喜 KubeVela 获得中国开源云联盟 2022 “优秀开源项目”

阿里巴巴云原生

阿里云 开源 云原生 KubeVela

大数据培训学习有前途吗?

小谷哥

对标阿里P7:高并发+Nginx+微服务+消息中间件+Netty+Redis+MySQL

程序知音

Java 数据库 JVM 高并发 后端技术

读书|我的2022年度阅读推荐

MavenTalker

推荐书单

MonographDB获得IT168“2022年度创新产品奖”

极客天地

2022年最全大厂面试真题解析:java集合+spring+并发编程+MyBatis

钟奕礼

程序员 Java 面试 Java、 java 编程

华为云CDN,助力安全企业下载服务,更好提升用户体验

路过的憨憨

华为云CDN提升网站响应速度,让下载快人一步

路过的憨憨

Flink Shuffle 3.0: Vision, Roadmap and Progress

Apache Flink

大数据 flink 实时计算

备受企业青睐的华为云CDN优势到底在哪?

路过的憨憨

编程培训后程序员怎么提升自身开发水平?

小谷哥

华为云CDN加速服务,引领企业数字化发展潮流!

路过的憨憨

既要速度与激情,也要稳定和安全,华为云CDN让你速度和安全兼得

路过的憨憨

数据报告 | 美国民众健康状况和医疗需求研究报告

前嗅大数据

大数据 数据分析 数据报告

沈向洋拆解AI五大演进维度:AI发展既要 “登珠峰” 也要 “修公路”,灵巧手是人类在AI面前最后尊严_生成式 AI_蔡芳芳_InfoQ精选文章