
2025 年 11 月 22 日,一年一度的 IDEA 大会在深圳福田会展中心如期举行。这场由 IDEA 研究院创院理事长、美国国家工程院外籍院士沈向洋发起的人工智能盛会,汇聚产学研企界领袖,深度探讨 AI 发展、AI Agent、具身智能、低空经济等前沿议题。
沈向洋在开场便对中美 AI 发展差距问题给出鲜明观点:AI 发展有两个核心维度,一是“攀登珠峰",以巨额投入追求性能顶尖的最强模型;二是“修建公路",让技术适配更多场景、惠及更多用户,实现规模化落地应用。他强调道,“任何事情都需要走自己的发展之路,AI 的发展也不例外”,而这也是 IDEA 在深圳五年深耕的核心逻辑。
沈向洋以近 3 小时的主题演讲,系统拆解智能演进的五维框架,同步发布多项重磅成果,为行业勾勒出技术从实验室走向产业的清晰路径。
AI 演进五维框架:算力算法数据之外,交互与载体成关键
谈及 AI 发展的核心要素,沈向洋提出突破传统认知的“五维框架"——在广为人知的算力、算法、数据之外,必须加入“交互"与“载体"两个维度,才能完整理解智能的进化脉络。
1. 算法范式:从 Transformer 到自主学习,回归经典找新机遇
算法是 AI 发展的核心引擎,其演进呈现三阶段特征:监督学习构筑基础表达与生成能力,强化学习引入因果逻辑与执行能力,自主学习则迈向高层认知突破。技术层面,从 2017 年谷歌 Transformer 架构问世,到 OpenAI GPT 系列预训练技术颠覆行业,再到 2024 年 o1 模型推理能力爆发、DeepSeek 推动开源大模型发展,持续拓展智能边界。沈向洋强调,未来算法创新可回归经典理论,如维纳《控制论》中的思想,强化学习背后的数学原理正源自控制论的最优控制理论,蕴藏着自主学习的巨大想象空间。
2. 智能载体:从虚拟抽象到物理具身,AI 迈向“改变世界"
AI 载体的进化遵循“从抽象到具体、从虚拟到物理"的路径:早期以语言模型为核心,逐步拓展到覆盖声音、图像、视频乃至 4D 内容的多模态模型;在此基础上,融入物理世界规律的“世界模型"成为新方向;当世界模型落地到机器人、自动驾驶车辆、飞行器等物理实体时,便形成具身模型。“从载体维度看,AI 正从‘理解世界'走向‘改变世界'。"沈向洋表示,这也是 IDEA 在多模态与具身智能领域持续深耕的核心原因。
3. 交互范式:从被动响应到主动执行,人机关系重构
过去七八十年,人机交互历经命令行、图形界面、互联网搜索、推荐系统的迭代,AI 的出现带来自然语言与多模态交互变革。早期大模型类似“被动搜索",问一句答一句;近年的推理模型则实现“循环迭代",像科研活动般持续对话推理。沈向洋提出“探索世界应 Search less, research more“的理念,认为未来 AI 将更多主动提出问题、执行任务,但关键决策仍需人类把控,确保行为不偏离安全边界。
4. 计算架构:GPU 成“基础设施",专用芯片与新型架构破局高能耗
2006 年起,GPU 从游戏设备发展为通用并行计算系统,先后支撑“挖矿"与大模型训练,如今已成为 AI 基础设施。但当前算力需求呈现新变化:推理需求远超训练,端侧芯片与强化学习专用芯片需求激增——前者需低功耗、高吞吐,后者需支持高速交互与大规模并行。面对 GPU 高能耗现状,沈向洋打趣道:“黄仁勋每天醒来都在笑,整个世界的人都在给他捐钱。"他指出,未来光子、量子、类脑计算等新型架构,有望在特定领域实现性能跃升,缓解算力成本压力。
5. 数据维度:静态语料不够用,动态反馈成“新刚需"
在智能演进的不同阶段,数据扮演截然不同的角色:模拟世界阶段是“静态教材",探索世界阶段是“动态反馈",归纳世界阶段则是“验证假设的证据"。沈向洋用“骑自行车"作比:“光看书永远学不会骑自行车,AI 转向强化学习、探索世界时,需要的是带反馈的动态数据。"IDEA 孵化的 DataArc 团队推出 SynData 开源框架,针对阿拉伯语等小语种语料稀缺问题(仅为英文的 1/100),将相关研发代码从 2000 行精简至 50 行,成为数据创新的典型案例。
重磅成果密集发布:金融大模型、GPU 渲染器齐亮相,MoonBit SDK 下月开源
围绕“五维框架",沈向洋现场发布一系列从实验室走向产业的创新成果,覆盖数据、模型、工具链等关键领域。
1. Quant 5.0 金融大模型:时间序列底座支撑投资、风控、模拟
针对金融领域核心痛点,IDEA 推出基于金融时间序列的 Quant 5.0 底座大模型。该模型依托 1.56 亿条全球金融时间序列(34 万 T 数据)训练,可支撑三类关键任务:预测未来收益与走势,辅助投资决策;为交易所、监管机构及投资机构提供风控能力;开展市场模拟与压力测试,助力监管决策。其在中证 1000 指数增强场景中实现 30%超额收益、2%最大回撤(夏普率达 6),且可轻松迁移至不同市场、资产类别及交易策略,通过 Agent 实现自动化部署。从 2021 年 ideaGraph 金融行为知识图谱到 2023 年 Alpha-GPT 投资智能体,IDEA 在金融 AI 领域已形成五年持续迭代的技术体系。
2. GPU 原生渲染引擎:效率提升数百倍,获头部影视团队验证
影视工业长期受限于 CPU 渲染低效率,IDEA 团队打造的 GPU 原生渲染引擎,成为国内首个工业级 AI 驱动渲染解决方案。在保证高质量渲染效果的前提下,其效率较传统渲染器提升数十至数百倍,兼容 Maya 等主流动画特效建模软件,无需改变现有工作流。目前已与《流浪地球》视效制作方 More VFX、《哪吒》系列出品方光线动画、源初动漫等达成合作,支撑多部影视作品全片渲染,实现"数月工作量一天完成"的行业突破。
3. MoonBit:AI 时代新编程语言,下月开源多语言 Agent SDK
作为 IDEA 自研的 AI 时代编程语言,MoonBit 已从多后端支持语言,演进为涵盖 AI 原生工具集的全栈工具链,覆盖 WebAssembly 边缘计算、C/LLVM 系统编程、JavaScript 前端开发等全场景,构建起开发者工具链与智能体开发生态一体化平台。今年推出的 MoonBit Pilot,是全球首个语言原生的智能体开发环境,可智能辅助生成工具包。沈向洋透露,下月将正式开源 MoonBit Agent SDK,支持多种编程语言。目前其社区用户已达十万级规模,全球贡献代码超 1000 万行,生态库约 3000 个,进入北大、清华等高校课程并实现北美商业化落地。
AI Agent 重塑四层生态:从超级个体到科学创新,生产关系大变革
2025 年被视为 AI Agent 创新爆发元年,盖茨曾预言其将引发“自键入命令到点击图标以来最大的计算革命"。沈向洋从个体、公司、治理、创新四个层面,拆解其深层影响。
1. 个体层面:“超级个体"崛起,组织关系重构
AI Agent 带来生产力飞跃,“一个人+一堆 AI Agent"即可成为“超级个体",完成过去一个团队的工作——IDEA 设计师仅凭平面设计背景,借助 AI 工具独立完成时尚品牌广告片全流程制作。这种变革直接推动生产关系重构,成为超级个体的关键在于是否愿意学习运用 AI Agent。沈向洋调侃,未来 CEO 可能从“Chief Executive Officer"转变为“Chief Entertaining Officer",个体与组织的关系将被重新定义。
2. 企业层面:KAIROS 决策智能体落地,打造决策闭环
沈向洋判断,未来更多企业将成为“AI Native 公司",全流程围绕 AI 重构。IDEA 推出的 KAIROS 决策智能体,通过三大能力构建“决策-执行-反馈"闭环:借助通用大模型理解企业数据与经验,精准解读业务需求;针对复杂决策提供端到端优化方案;通过自动编程实现模型自适应演变,降低维护成本。该智能体已与美的合作落地集装箱装载优化项目,实现装载率与研发效率双提升,多环节联合优化场景效益增长达 40%,并拓展至欧洲、东南亚业务线。
3. 政府治理层面:经济超脑 2.0 落地南山,效率提升 10-30 倍
在政府治理中,统计部门长期面临“找数据、整材料、写报告"的低效困境。IDEA 去年发布的“经济超脑 1.0"已能看懂数据、理解逻辑,今年升级的 2.0 版本实现全流程自动化分析。依托 Agents 驱动的智能框架,其可关联模糊需求与业务指标、自动拆解宏观分析任务,效率提升 10-30 倍。目前该系统已在深圳市南山区统计局试点,为工业发展分析、重点企业监测等提供智能化决策支持。
4. 科学创新层面:Mozi 药物平台问世,45 分钟完成帕金森病药物设计
AI Agent 对科学创新的推动是沈向洋最为看重的价值。IDEA 发布的 Mozi 药物计算发现平台,以“Agent+Toolbox"模式,结合多智能体架构与自动化流程,破解传统药物早期计算中的工具误导、研发黑箱等痛点。以帕金森病药物设计为例,传统流程需 36 个月,而 Mozi 平台仅需 45 分钟即可完成靶点选择、分子设计、安全过滤、报告生成全流程,交付符合临床一期质量的药物分子候选物。
具身智能攻坚“灵巧手",三大新中心夯实技术落地优势
具身智能是本次大会焦点议题,沈向洋提到,特斯拉因人形机器人手部技术难题缩减生产计划,足以证明“灵巧手"是具身智能领域的“珠峰级难题"。“人手既能搬箱子,也能穿针引线,这种'魔法'源于 27 个自由度与 2.7 万个触觉传感器,灵巧手是人类在 AI 面前最后的尊严。"
1. 赛事与技术双驱动,破解具身智能落地难题
为推动灵巧手技术实用化,IDEA 举办国内首个“灵巧手+即时配送"专项赛事,以真实场景为赛题,覆盖取包裹、拆包裹、按电梯等末端配送全环节。同时发布 DINO-X Grasp 视觉大模型,实现世界开集 2D 认知、物体级抓取位姿预测与 3D 形状感知,为具身智能提供“更强大脑"。该模型已应用于招商局集团多场景检测、美团无人机障碍物识别等实际业务,孵化的初创公司视启未来完成近亿元天使轮融资。
2. 三大新中心落地,构建具身智能生态
过去一年,IDEA 围绕具身智能成立三大核心机构:与腾讯共建的福田实验室,推出 Tairos 具身智能开放平台;国际先进技术应用推进中心,聚焦 AI、具身智能、低空经济的产业转化;深港高等研究交流中心(SHARE),依托深港资源搭建跨学科合作平台。沈向洋强调,黄仁勋曾表示“具身智能是粤港澳大湾区非凡的机遇",这些机构将进一步夯实技术落地与产业协同的核心优势。
低空经济发布 OpenSILAS 2.0,从“监视"到“引导"升级
在低空经济领域,沈向洋团队发布 OpenSILAS 2.0,实现从 1.0“监视飞行"到 2.0“引导飞行"的跨越。该系统通过可进化框架覆盖“规划—运行—监管—服务"全环节,依据城市与空域复杂度提供分级化、模块化方案。针对有人机与无人机高度基准不一致的冲突问题,同步发布“低空多元高度基站"(高度盒子),并联合民航局制定行业标准。与 UCloud 合作的“低空一体机",将低空系统从“项目式建设"转为“产品化交付",为各地因地制宜发展低空经济提供便捷方案。大会同时发布《低空经济白皮书 4.0(通导监网络之路)》,并宣布 OpenSILAS 创新联合体新增 15 家成员企业。
结语:技术突破与场景落地双向赋能,AI 落地进入深水区
沈向洋在演讲结尾总结道,智能演进的五大维度正加速迭代,交互与载体持续重塑人机边界,AI 已从“问一句答一句"的工具,逐步升级为与人类协同推理、共创知识的长期伙伴。IDEA 五年深耕的实践,本质是技术突破与场景落地的双向奔赴——从 SynData 框架解决小语种数据稀缺痛点,到 Quant 5.0 在金融场景实现收益与风控双提升;从 AI Agent 重构企业决策与科研流程,到具身智能攻坚“灵巧手"等行业硬骨头,再到 OpenSILAS 2.0 搭建低空经济标准化体系,每一步探索都紧扣“技术可用、产业能用"的核心目标。
当前 AI 行业正从“单点创新"迈向“体系化落地"的深水区,无论是“攀登珠峰"式的前沿技术攻关,还是“修建公路"式的规模化应用推广,核心都在于以场景需求为锚点,让技术真正解决行业实际问题。随着开源生态的完善、跨机构协作的深化,AI 将在更多垂直领域实现价值闭环,为产业升级提供实实在在的技术驱动力。







评论