写点什么

阶跃星辰姜大昕:要实现 AGI,“万亿参数”和“多模融合”缺一不可

  • 2024-07-06
    北京
  • 本文字数:1133 字

    阅读完需:约 4 分钟

大小:581.81K时长:03:18
阶跃星辰姜大昕:要实现AGI,“万亿参数”和“多模融合”缺一不可

阶跃星辰姜大昕:要实现 AGI,“万亿参数”和“多模融合”缺一不可


近日,在世界智能人工大会 WAIC 启明创投·创业与投资论坛上,阶跃星辰创始人、CEO 姜大昕博士发表了主题为《攀登 AGI 的路径与实践:万亿参数和多模融合》的演讲,分享了对于大模型发展现状与趋势的观察与思考。



阶跃星辰创始人、CEO 姜大昕博士发表演讲


在演讲中,姜大昕重点阐述了一个核心观点:探索 AGI 路径,“Scaling Law”和“多模态”是相辅相成、缺一不可的两个方向。两者齐头并进,最终到达 AGI。

Scaling Law 仍处于陡峭区间,万亿参数是基本出发点


近年来,GPT 系列模型的演进,客观上验证了 Scaling Law 的有效性。模型参数量决定模型能力的上限。从模型效果看,参数量增大确实带来了性能上的飞跃。虽然业内围绕“Scaling Law 还能走多远”尚未形成共识,但阶跃星辰认为,参数量接下来再提高一个数量级是依然成立的。Scaling Law 目前依然奏效,模型性能仍然在随着参数量、数据量和计算量的增加呈幂次方增长。在此发展过程中,万亿参数量已经成为一个基本的入门门槛。



正是基于这样的认知,阶跃星辰很早便启动了万亿参数模型的训练。从千亿到万亿,模型的参数规模提升了一个量级,难度也提升了十倍以上。为此,阶跃星辰加大资源投入,尤其在系统和算法上积极探索,最终走通了万亿参数 MoE 大模型训练的道路。在 WAIC 2024 上,阶跃星辰发布了全新的 Step-2 万亿参数语言大模型正式版。根据从逻辑推理、世界知识、数学和编程等多个维度进行的权威测试,Step-2 模型能力都已全面接近国际主流模型,在部分测试集甚至实现了超越。


多模态是构建世界模型的基础能力,将走向理解与生成的统一


在不断攀登 Scaling Law 的同时,阶跃星辰也强调,多模态是构建世界模型的基础能力,是通向 AGI 的必经之路。从算法角度看,世界模型的演进会分为三个阶段:


第一阶段是模拟物理世界;


第二阶段是通过具身智能和物理世界交互,主动探索物理世界;


第三阶段是通过发展系统能力,发现新的物理规律,归纳物理世界。



从模拟世界,到探索世界,再到归纳世界,多模态是贯穿这三个阶段的基本能力。目前,全球科技巨头正在积极探索并布局多模融合的路径,多模态大模型研发的脚步正越走越快。然而,多模态领域目前存在的问题是,视觉的理解模型和生成模型是分开发展的。其造成的结果就是理解模型的理解能力强而生成能力弱,或者生成模型的生成能力强而理解能力弱。因此,多模态大模型接下来面临的一项关键挑战,就是能否将理解和生成统一在一个模型里。


目前,阶跃星辰正在朝着这个方向努力,并取得了一些阶段性的进展。在 WAIC 2024 上,新升级的 Step-1.5V 千亿参数多模态大模型性能大幅提升,具备更出色的视频理解能力;新发布的 Step-1X 图像生成大模型,则是阶跃星辰首次推出多模态生成大模型。

2024-07-06 18:025289
用户头像
李冬梅 加V:busulishang4668

发布了 1021 篇内容, 共 635.5 次阅读, 收获喜欢 1189 次。

关注

评论

发布
暂无评论
发现更多内容

聆听三位开发者的故事:从破到立,00 后开发者的 Web3 创业“变形计”

TinTinLand

AIGC 新浪潮|Story CN meetups 将于 1 月 10-14 日举办!

TinTinLand

Proxifier for Mac(全局代理客户端)

Mac相关知识分享

Sketch for mac(专业矢量绘图设计软件)中文版

Mac相关知识分享

云上一键部署 DeepSeek-V3 模型,阿里云PAI Model Gallery 最佳实践

阿里云大数据AI技术

人工智能 API 强化学习 LLM PAI

还不会 Cert Manager 自动签发证书?一文掌握

北京好雨科技有限公司

Kubernetes rainbond 云原生‘’ 企业号 2025年1月PK榜

预测市场平台 Aegis:Al Agent + Web3,为预测市场提供新的动力

股市老人

Final Cut Pro X for Mac(fcpx视频剪辑)中文版

Mac相关知识分享

AICon演讲实录 | 谢皓:AI Agent 在边缘云的探索与实践

火山引擎边缘云

边缘计算 智能硬件 AI 大底座 Agents 边缘智能

App Uninstaller for Mac(mac软件卸载工具)中文版

Mac相关知识分享

Navicat Premium 15 for Mac(数据库开发工具)

Mac相关知识分享

📢 2025 First LOOK! CnosDB 新版本 2.4.3.1 发布 📢

CnosDB

AI rust 物联网 时序数据库 CnosDB

微服务架构中的服务注册与发现有哪些?Zookeeper、Eureka、Nacos、Consul 都有什么区别,实现原理是什么?

码哥字节

微服务 注册中心

成为敏捷引领者,Scrum中文网PSM课程助你成就ScrumMaster之路

爱吃鱼的小雨

Scrum 敏捷开发 ScrumMaster认证 敏捷培训 PSM

NineData云原生智能数据管理平台新功能发布|2024年12月版

NineData

oracle DevOps Package 存储过程 NineData

Data For AI:2025年数据集成技术趋势预测

白鲸开源

数据同步 数据集成 数据管道

某讯面试中常见的Java集合面试题

王中阳Go

Java 集合 面试问题 后端】

Lightroom Classic 2021 for mac(LRC 2021大师版)

Mac相关知识分享

架构提效的矛盾和矛盾的主要方面

京东零售技术

2024数据库编程大赛冠军挑战赛,5位选手用DuckDB和Doris挑战成功

NineData

sql Doris NineData 云数据库技术 数据库编程大赛

TON 生态增长实战四城巡回压轴站—— 深圳站即将启动

TinTinLand

《CPython Internals》阅读笔记:p61-p75

codists

CPython Internals

联发科技携手Cocos:推动端侧生成式 AI,为游戏开发注入新动力

科技范儿

【A/B实验常见问题】实验异常值应该如何处理?

京东零售技术

AI 技术在英语学习中的主要应用

北京木奇移动技术有限公司

英语学习 AI教育 软件外包公司

怎么制作情绪板?10个情绪板案例盘点!

职场工具箱

设计 设计师 在线白板 办公软件 可视化展示

Starknet Bounty 活动倒计时 48H!赶快报名,加入开发实战之旅

TinTinLand

Mythical Games: 通过 Polkadot 革新游戏与数字资产所有权

One Block Community

AI 代理碎片化格局下,哪些具体赛道及项目值得关注

TechubNews

去中心化金融 #人工智能

某讯面试中常见的Java多线程面试题

王中阳Go

Java 多线程 面试问题 后端】

Keka for Mac(mac压缩解压软件)中文版

Mac相关知识分享

阶跃星辰姜大昕:要实现AGI,“万亿参数”和“多模融合”缺一不可_生成式 AI_李冬梅_InfoQ精选文章