沈向洋拆解AI五大演进维度：AI发展既要 “登珠峰” 也要 “修公路”，灵巧手是人类在AI面前最后尊严

2025 年 11 月 22 日，一年一度的 IDEA 大会在深圳福田会展中心如期举行。这场由 IDEA 研究院创院理事长、美国国家工程院外籍院士沈向洋发起的人工智能盛会，汇聚产学研企界领袖，深度探讨 AI 发展、AI Agent、具身智能、低空经济等前沿议题。

沈向洋在开场便对中美 AI 发展差距问题给出鲜明观点：AI 发展有两个核心维度，一是“攀登珠峰"，以巨额投入追求性能顶尖的最强模型；二是“修建公路"，让技术适配更多场景、惠及更多用户，实现规模化落地应用。他强调道，“任何事情都需要走自己的发展之路，AI 的发展也不例外”，而这也是 IDEA 在深圳五年深耕的核心逻辑。

沈向洋以近 3 小时的主题演讲，系统拆解智能演进的五维框架，同步发布多项重磅成果，为行业勾勒出技术从实验室走向产业的清晰路径。

AI 演进五维框架：算力算法数据之外，交互与载体成关键

谈及 AI 发展的核心要素，沈向洋提出突破传统认知的“五维框架"——在广为人知的算力、算法、数据之外，必须加入“交互"与“载体"两个维度，才能完整理解智能的进化脉络。

1. 算法范式：从 Transformer 到自主学习，回归经典找新机遇

算法是 AI 发展的核心引擎，其演进呈现三阶段特征：监督学习构筑基础表达与生成能力，强化学习引入因果逻辑与执行能力，自主学习则迈向高层认知突破。技术层面，从 2017 年谷歌 Transformer 架构问世，到 OpenAI GPT 系列预训练技术颠覆行业，再到 2024 年 o1 模型推理能力爆发、DeepSeek 推动开源大模型发展，持续拓展智能边界。沈向洋强调，未来算法创新可回归经典理论，如维纳《控制论》中的思想，强化学习背后的数学原理正源自控制论的最优控制理论，蕴藏着自主学习的巨大想象空间。

2. 智能载体：从虚拟抽象到物理具身，AI 迈向“改变世界"

AI 载体的进化遵循“从抽象到具体、从虚拟到物理"的路径：早期以语言模型为核心，逐步拓展到覆盖声音、图像、视频乃至 4D 内容的多模态模型；在此基础上，融入物理世界规律的“世界模型"成为新方向；当世界模型落地到机器人、自动驾驶车辆、飞行器等物理实体时，便形成具身模型。“从载体维度看，AI 正从‘理解世界'走向‘改变世界'。"沈向洋表示，这也是 IDEA 在多模态与具身智能领域持续深耕的核心原因。

3. 交互范式：从被动响应到主动执行，人机关系重构

过去七八十年，人机交互历经命令行、图形界面、互联网搜索、推荐系统的迭代，AI 的出现带来自然语言与多模态交互变革。早期大模型类似“被动搜索"，问一句答一句；近年的推理模型则实现“循环迭代"，像科研活动般持续对话推理。沈向洋提出“探索世界应 Search less, research more“的理念，认为未来 AI 将更多主动提出问题、执行任务，但关键决策仍需人类把控，确保行为不偏离安全边界。

4. 计算架构：GPU 成“基础设施"，专用芯片与新型架构破局高能耗

2006 年起，GPU 从游戏设备发展为通用并行计算系统，先后支撑“挖矿"与大模型训练，如今已成为 AI 基础设施。但当前算力需求呈现新变化：推理需求远超训练，端侧芯片与强化学习专用芯片需求激增——前者需低功耗、高吞吐，后者需支持高速交互与大规模并行。面对 GPU 高能耗现状，沈向洋打趣道：“黄仁勋每天醒来都在笑，整个世界的人都在给他捐钱。"他指出，未来光子、量子、类脑计算等新型架构，有望在特定领域实现性能跃升，缓解算力成本压力。

5. 数据维度：静态语料不够用，动态反馈成“新刚需"

在智能演进的不同阶段，数据扮演截然不同的角色：模拟世界阶段是“静态教材"，探索世界阶段是“动态反馈"，归纳世界阶段则是“验证假设的证据"。沈向洋用“骑自行车"作比：“光看书永远学不会骑自行车，AI 转向强化学习、探索世界时，需要的是带反馈的动态数据。"IDEA 孵化的 DataArc 团队推出 SynData 开源框架，针对阿拉伯语等小语种语料稀缺问题（仅为英文的 1/100），将相关研发代码从 2000 行精简至 50 行，成为数据创新的典型案例。

重磅成果密集发布：金融大模型、GPU 渲染器齐亮相，MoonBit SDK 下月开源

围绕“五维框架"，沈向洋现场发布一系列从实验室走向产业的创新成果，覆盖数据、模型、工具链等关键领域。

1. Quant 5.0 金融大模型：时间序列底座支撑投资、风控、模拟

针对金融领域核心痛点，IDEA 推出基于金融时间序列的 Quant 5.0 底座大模型。该模型依托 1.56 亿条全球金融时间序列（34 万 T 数据）训练，可支撑三类关键任务：预测未来收益与走势，辅助投资决策；为交易所、监管机构及投资机构提供风控能力；开展市场模拟与压力测试，助力监管决策。其在中证 1000 指数增强场景中实现 30%超额收益、2%最大回撤（夏普率达 6），且可轻松迁移至不同市场、资产类别及交易策略，通过 Agent 实现自动化部署。从 2021 年 ideaGraph 金融行为知识图谱到 2023 年 Alpha-GPT 投资智能体，IDEA 在金融 AI 领域已形成五年持续迭代的技术体系。

2. GPU 原生渲染引擎：效率提升数百倍，获头部影视团队验证

影视工业长期受限于 CPU 渲染低效率，IDEA 团队打造的 GPU 原生渲染引擎，成为国内首个工业级 AI 驱动渲染解决方案。在保证高质量渲染效果的前提下，其效率较传统渲染器提升数十至数百倍，兼容 Maya 等主流动画特效建模软件，无需改变现有工作流。目前已与《流浪地球》视效制作方 More VFX、《哪吒》系列出品方光线动画、源初动漫等达成合作，支撑多部影视作品全片渲染，实现"数月工作量一天完成"的行业突破。

3. MoonBit：AI 时代新编程语言，下月开源多语言 Agent SDK

作为 IDEA 自研的 AI 时代编程语言，MoonBit 已从多后端支持语言，演进为涵盖 AI 原生工具集的全栈工具链，覆盖 WebAssembly 边缘计算、C/LLVM 系统编程、JavaScript 前端开发等全场景，构建起开发者工具链与智能体开发生态一体化平台。今年推出的 MoonBit Pilot，是全球首个语言原生的智能体开发环境，可智能辅助生成工具包。沈向洋透露，下月将正式开源 MoonBit Agent SDK，支持多种编程语言。目前其社区用户已达十万级规模，全球贡献代码超 1000 万行，生态库约 3000 个，进入北大、清华等高校课程并实现北美商业化落地。

AI Agent 重塑四层生态：从超级个体到科学创新，生产关系大变革

2025 年被视为 AI Agent 创新爆发元年，盖茨曾预言其将引发“自键入命令到点击图标以来最大的计算革命"。沈向洋从个体、公司、治理、创新四个层面，拆解其深层影响。

1. 个体层面：“超级个体"崛起，组织关系重构

AI Agent 带来生产力飞跃，“一个人+一堆 AI Agent"即可成为“超级个体"，完成过去一个团队的工作——IDEA 设计师仅凭平面设计背景，借助 AI 工具独立完成时尚品牌广告片全流程制作。这种变革直接推动生产关系重构，成为超级个体的关键在于是否愿意学习运用 AI Agent。沈向洋调侃，未来 CEO 可能从“Chief Executive Officer"转变为“Chief Entertaining Officer"，个体与组织的关系将被重新定义。

2. 企业层面：KAIROS 决策智能体落地，打造决策闭环

沈向洋判断，未来更多企业将成为“AI Native 公司"，全流程围绕 AI 重构。IDEA 推出的 KAIROS 决策智能体，通过三大能力构建“决策-执行-反馈"闭环：借助通用大模型理解企业数据与经验，精准解读业务需求；针对复杂决策提供端到端优化方案；通过自动编程实现模型自适应演变，降低维护成本。该智能体已与美的合作落地集装箱装载优化项目，实现装载率与研发效率双提升，多环节联合优化场景效益增长达 40%，并拓展至欧洲、东南亚业务线。

3. 政府治理层面：经济超脑 2.0 落地南山，效率提升 10-30 倍

在政府治理中，统计部门长期面临“找数据、整材料、写报告"的低效困境。IDEA 去年发布的“经济超脑 1.0"已能看懂数据、理解逻辑，今年升级的 2.0 版本实现全流程自动化分析。依托 Agents 驱动的智能框架，其可关联模糊需求与业务指标、自动拆解宏观分析任务，效率提升 10-30 倍。目前该系统已在深圳市南山区统计局试点，为工业发展分析、重点企业监测等提供智能化决策支持。

4. 科学创新层面：Mozi 药物平台问世，45 分钟完成帕金森病药物设计

AI Agent 对科学创新的推动是沈向洋最为看重的价值。IDEA 发布的 Mozi 药物计算发现平台，以“Agent+Toolbox"模式，结合多智能体架构与自动化流程，破解传统药物早期计算中的工具误导、研发黑箱等痛点。以帕金森病药物设计为例，传统流程需 36 个月，而 Mozi 平台仅需 45 分钟即可完成靶点选择、分子设计、安全过滤、报告生成全流程，交付符合临床一期质量的药物分子候选物。

具身智能攻坚“灵巧手"，三大新中心夯实技术落地优势

具身智能是本次大会焦点议题，沈向洋提到，特斯拉因人形机器人手部技术难题缩减生产计划，足以证明“灵巧手"是具身智能领域的“珠峰级难题"。“人手既能搬箱子，也能穿针引线，这种'魔法'源于 27 个自由度与 2.7 万个触觉传感器，灵巧手是人类在 AI 面前最后的尊严。"

1. 赛事与技术双驱动，破解具身智能落地难题

为推动灵巧手技术实用化，IDEA 举办国内首个“灵巧手+即时配送"专项赛事，以真实场景为赛题，覆盖取包裹、拆包裹、按电梯等末端配送全环节。同时发布 DINO-X Grasp 视觉大模型，实现世界开集 2D 认知、物体级抓取位姿预测与 3D 形状感知，为具身智能提供“更强大脑"。该模型已应用于招商局集团多场景检测、美团无人机障碍物识别等实际业务，孵化的初创公司视启未来完成近亿元天使轮融资。

2. 三大新中心落地，构建具身智能生态

过去一年，IDEA 围绕具身智能成立三大核心机构：与腾讯共建的福田实验室，推出 Tairos 具身智能开放平台；国际先进技术应用推进中心，聚焦 AI、具身智能、低空经济的产业转化；深港高等研究交流中心（SHARE），依托深港资源搭建跨学科合作平台。沈向洋强调，黄仁勋曾表示“具身智能是粤港澳大湾区非凡的机遇"，这些机构将进一步夯实技术落地与产业协同的核心优势。

低空经济发布 OpenSILAS 2.0，从“监视"到“引导"升级

在低空经济领域，沈向洋团队发布 OpenSILAS 2.0，实现从 1.0“监视飞行"到 2.0“引导飞行"的跨越。该系统通过可进化框架覆盖“规划—运行—监管—服务"全环节，依据城市与空域复杂度提供分级化、模块化方案。针对有人机与无人机高度基准不一致的冲突问题，同步发布“低空多元高度基站"（高度盒子），并联合民航局制定行业标准。与 UCloud 合作的“低空一体机"，将低空系统从“项目式建设"转为“产品化交付"，为各地因地制宜发展低空经济提供便捷方案。大会同时发布《低空经济白皮书 4.0（通导监网络之路）》，并宣布 OpenSILAS 创新联合体新增 15 家成员企业。

结语：技术突破与场景落地双向赋能，AI 落地进入深水区

沈向洋在演讲结尾总结道，智能演进的五大维度正加速迭代，交互与载体持续重塑人机边界，AI 已从“问一句答一句"的工具，逐步升级为与人类协同推理、共创知识的长期伙伴。IDEA 五年深耕的实践，本质是技术突破与场景落地的双向奔赴——从 SynData 框架解决小语种数据稀缺痛点，到 Quant 5.0 在金融场景实现收益与风控双提升；从 AI Agent 重构企业决策与科研流程，到具身智能攻坚“灵巧手"等行业硬骨头，再到 OpenSILAS 2.0 搭建低空经济标准化体系，每一步探索都紧扣“技术可用、产业能用"的核心目标。

当前 AI 行业正从“单点创新"迈向“体系化落地"的深水区，无论是“攀登珠峰"式的前沿技术攻关，还是“修建公路"式的规模化应用推广，核心都在于以场景需求为锚点，让技术真正解决行业实际问题。随着开源生态的完善、跨机构协作的深化，AI 将在更多垂直领域实现价值闭环，为产业升级提供实实在在的技术驱动力。

创作场景

沈向洋拆解 AI 五大演进维度：AI 发展既要 “登珠峰” 也要 “修公路”，灵巧手是人类在 AI 面前最后尊严