大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

达摩院损失 AI“大将”,预训练大模型 M6 技术负责人杨红霞离职

  • 2022-10-12
    北京
  • 本文字数:1377 字

    阅读完需:约 5 分钟

达摩院损失AI“大将”,预训练大模型M6技术负责人杨红霞离职

阿里达摩院损失 AI“大将”。


日前,据 Tech 星球报道,阿里达摩院大模型带头人杨红霞已于 9 月初离职。InfoQ 发现,杨红霞于不久前注销了钉钉账号。

全球最大 AI 预训练模型 M6 背后的技术负责人


杨红霞博士是超大规模多模态预训练模型 M6 的技术负责人。


M6,英文全称是 MultiModality-to-MultiModality Multitask Mega-transformer,6 个 M,简称 M6。


顾名思义,M6 大模型主打多模态、多任务能力,其目标是打造全球领先的具有通用性的人工智能大模型。


2021 年 3 月,达摩院发布了国内首个千亿参数多模态大模型 M6,引发海外关注。OpenAI 前政策主管 Jack Clark 公开点评道:“这个模型的规模和设计都非常惊人。这看起来像是众多中国的 AI 研究组织逐渐发展壮大的一种表现。”


2021 年 11 月,阿里 M6 宣布升级至万亿参数,并在全球范围内首次大幅降低了万亿参数超大模型训练能耗,更加符合业界对低碳、高效训练 AI 大模型的需求。


据悉,通过一系列突破性的技术创新,达摩院团队仅使用 480 卡 V100 32G GPU,即训练出了规模达人类神经元 10 倍的万亿参数多模态大模型 M6,与英伟达、谷歌等海外公司实现万亿参数规模相比,能耗降低超八成、效率提升约 11 倍。


这一技术突破将极大降低万亿模型训练门槛,让大模型研究和工业化落地进入更加普惠的时代。


针对此次升级,达摩院资深算法专家杨红霞曾表示,“接下来,M6 团队将继续把低碳 AI 做到极致,推进应用进一步落地,并探索对通用大模型的理论研究。”


以下为 M6 发展历程:


  • 2021 年 1 月 —— M6 百亿参数模型达成,国内首个百亿规模多模态大模型

  • 2021 年 2 月 —— M6 千亿参数模型达成,国内首个千亿规模多模态大模型

  • 2021 年 5 月 —— M6 万亿参数模型达成,全球范围内首次大幅降低了万亿参数超大模型训练能耗,且成为国内首个实现商业化落地的多模态大模型

AI 项目落地难?


据报道,杨红霞此次离职是因为个人家庭原因。


Tech 星球的报道中称,此番杨红霞离职,被认为是达摩院对一些难以落地的商业化项目进行调整。一位阿里云内部人士透露,“达摩院很多项目都是远看很牛,近看难以落地”,虽然二者都在云与科技,但是达摩院的项目与业务产研隔的较远,也很少和云服务一起对外售卖。所以达摩院每个项目的落地应用和商业化程度,很多是个谜。


去年 5 月,阿里宣布 AI 大模型首次商用,M6 成为国内首个实现商业化落地的多模态大模型。经过一段时间的试用,M6 作为 AI 助理设计师正式上岗阿里新制造平台犀牛智造,通过结合潮流趋势进行快速设计、试穿效果模拟,有望大幅缩短快时尚新款服饰设计周期。M6 还已应用于支付宝、淘宝等平台,参与跨模态搜索、文案撰写、图片设计等工作。


此前,阿里一直强调,达摩院不用有盈利压力。但 2022 年,互联网企业普遍降本增效,达摩院也进行了诸多调整。在杨红霞之前,阿里集团副总裁、阿里云研究院副院长肖利华,达摩院副院长金榕等都已相继离开阿里。


杨红霞是 AI 领域杰出的人工智能科学家。资料显示,杨红霞 2007 年本科毕业于南开大学,获统计学学士学位。其后她去往美国杜克大学统计科学系攻读博士学位,师从 David Dunson 教授。杨红霞拥有顶级论文 40 余篇。曾任 IBM Watson 研究员、Yahoo!主任数据科学家等职。她曾带领团队获 2019 世界人工智能大会最高奖卓越人工智能引领者(Super AI Leader,简称 SAIL 奖),曾获 2022 年福布斯中国科技女性 50 强的荣誉,获得 2020 年国家科学技术进步奖二等奖。

2022-10-12 12:075055
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 574.6 次阅读, 收获喜欢 1981 次。

关注

评论

发布
暂无评论
发现更多内容

搭建企业镜像仓库~Harbor

蜗牛也是牛

带你全面了解Gateway

好程序员IT教育

Spring Cloud Gateway SpringCloud Gateway

Go语言—基本输入输出包的使用

良猿

Go golang 后端 11月月更

豆瓣评分9.8!阿里内部的分布式架构手册让多少人突破了瓶颈?

程序知音

Java 分布式 java架构 java架构师 后端技术

如何在大促中做好系统高可用

阿里巴巴云原生

阿里云 微服务 高可用 云原生网关

Docker安装minio(CentOS7)

蜗牛也是牛

STL迭代器失效问题

Maybe_fl

直播预告|全闪文件存储在 AI 大数据领域的前沿应用

焱融科技

云计算 分布式系统 高性能 文件存储 全闪存储

面向智慧城市的GIS框架

tjn

GIS 可视化 11月月更

系统运维利器,百万服务器运维实战总结!一文了解最新版SysAK|龙蜥技术

OpenAnolis小助手

Linux 开源 运维 龙蜥社区 SysAK

5 分钟教你搭建「视频动作分类」系统

Zilliz

人工智能 计算机视觉 Towhee 视频动作分类

Milvus 编译环境演进

Zilliz

c++ Python Milvus cmake 编译环境

启科量子 QuSprout 正式开源

启科量子开发者官方号

开源 量子计算 量子编程

【简历优化】如何写好项目的亮点难点?项目经历怎么写最好?

王中阳Go

高效工作 学习方法 面试 简历模板 11月月更

web前端培训学习需要注意什么

小谷哥

专为实时而生 — GreptimeDB 现已在 GitHub 正式开源

Greptime 格睿科技

开源 分布式 云原生 时序数据库 存算分离

数据挖掘、机器学习、深度学习的区别

九章云极DataCanvas

数据挖掘 机器学习 深度学习

OpenI启智社区2022年度优秀项目及开发者申报通知

OpenI启智社区

开源社区 优秀项目 优秀开发者 OpenI启智社区

华为新机到手升级HarmonyOS 3,畅享多设备高效互联协同

极客天地

量化交易炒币机器人开发合约策略

薇電13242772558

量化策略

鼎医信息加入PolarDB开源数据库社区

阿里云数据库开源

阿里云 polarDB PolarDB-X 阿里云数据库 PolarDB for PostgreSQL

惊艳华为PocketS发布会! 杰美特旗下高端品牌决色推出首款“月光宝壳”

科技热闻

【高并发全彩版小册】阿里内部大佬用7部分讲懂!百亿级高并发系统

程序知音

Java 高并发 java架构 后端技术 高并发架构

JAVA concurrency -- AQS 源码详解

骑牛上青山

Java 源码

阿里内部高并发核心编程笔记:多线程、锁、JMM、JUC、设计模式

程序知音

高并发 java架构 后端技术 高并发架构

大数据培训学习后,就业不好就业

小谷哥

web前端培训上海学习好吗

小谷哥

java学习后该怎么培养自主学习能力

小谷哥

哪些前端学习方法对小白比较有用?

小谷哥

eBPF 实践 -- 网络可观测

观测云

微博评论高可用高性能计算架构设计

Jack

架构实战训练营9期

达摩院损失AI“大将”,预训练大模型M6技术负责人杨红霞离职_AI&大模型_刘燕_InfoQ精选文章