「ArchSummit·深圳」人工智能如何促进工业和制造领域的智能化转型? >>> 了解详情
写点什么

达摩院损失 AI“大将”,预训练大模型 M6 技术负责人杨红霞离职

  • 2022-10-12
    北京
  • 本文字数:1377 字

    阅读完需:约 5 分钟

达摩院损失AI“大将”,预训练大模型M6技术负责人杨红霞离职

阿里达摩院损失 AI“大将”。


日前,据 Tech 星球报道,阿里达摩院大模型带头人杨红霞已于 9 月初离职。InfoQ 发现,杨红霞于不久前注销了钉钉账号。

全球最大 AI 预训练模型 M6 背后的技术负责人


杨红霞博士是超大规模多模态预训练模型 M6 的技术负责人。


M6,英文全称是 MultiModality-to-MultiModality Multitask Mega-transformer,6 个 M,简称 M6。


顾名思义,M6 大模型主打多模态、多任务能力,其目标是打造全球领先的具有通用性的人工智能大模型。


2021 年 3 月,达摩院发布了国内首个千亿参数多模态大模型 M6,引发海外关注。OpenAI 前政策主管 Jack Clark 公开点评道:“这个模型的规模和设计都非常惊人。这看起来像是众多中国的 AI 研究组织逐渐发展壮大的一种表现。”


2021 年 11 月,阿里 M6 宣布升级至万亿参数,并在全球范围内首次大幅降低了万亿参数超大模型训练能耗,更加符合业界对低碳、高效训练 AI 大模型的需求。


据悉,通过一系列突破性的技术创新,达摩院团队仅使用 480 卡 V100 32G GPU,即训练出了规模达人类神经元 10 倍的万亿参数多模态大模型 M6,与英伟达、谷歌等海外公司实现万亿参数规模相比,能耗降低超八成、效率提升约 11 倍。


这一技术突破将极大降低万亿模型训练门槛,让大模型研究和工业化落地进入更加普惠的时代。


针对此次升级,达摩院资深算法专家杨红霞曾表示,“接下来,M6 团队将继续把低碳 AI 做到极致,推进应用进一步落地,并探索对通用大模型的理论研究。”


以下为 M6 发展历程:


  • 2021 年 1 月 —— M6 百亿参数模型达成,国内首个百亿规模多模态大模型

  • 2021 年 2 月 —— M6 千亿参数模型达成,国内首个千亿规模多模态大模型

  • 2021 年 5 月 —— M6 万亿参数模型达成,全球范围内首次大幅降低了万亿参数超大模型训练能耗,且成为国内首个实现商业化落地的多模态大模型

AI 项目落地难?


据报道,杨红霞此次离职是因为个人家庭原因。


Tech 星球的报道中称,此番杨红霞离职,被认为是达摩院对一些难以落地的商业化项目进行调整。一位阿里云内部人士透露,“达摩院很多项目都是远看很牛,近看难以落地”,虽然二者都在云与科技,但是达摩院的项目与业务产研隔的较远,也很少和云服务一起对外售卖。所以达摩院每个项目的落地应用和商业化程度,很多是个谜。


去年 5 月,阿里宣布 AI 大模型首次商用,M6 成为国内首个实现商业化落地的多模态大模型。经过一段时间的试用,M6 作为 AI 助理设计师正式上岗阿里新制造平台犀牛智造,通过结合潮流趋势进行快速设计、试穿效果模拟,有望大幅缩短快时尚新款服饰设计周期。M6 还已应用于支付宝、淘宝等平台,参与跨模态搜索、文案撰写、图片设计等工作。


此前,阿里一直强调,达摩院不用有盈利压力。但 2022 年,互联网企业普遍降本增效,达摩院也进行了诸多调整。在杨红霞之前,阿里集团副总裁、阿里云研究院副院长肖利华,达摩院副院长金榕等都已相继离开阿里。


杨红霞是 AI 领域杰出的人工智能科学家。资料显示,杨红霞 2007 年本科毕业于南开大学,获统计学学士学位。其后她去往美国杜克大学统计科学系攻读博士学位,师从 David Dunson 教授。杨红霞拥有顶级论文 40 余篇。曾任 IBM Watson 研究员、Yahoo!主任数据科学家等职。她曾带领团队获 2019 世界人工智能大会最高奖卓越人工智能引领者(Super AI Leader,简称 SAIL 奖),曾获 2022 年福布斯中国科技女性 50 强的荣誉,获得 2020 年国家科学技术进步奖二等奖。

2022-10-12 12:074506
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 485.3 次阅读, 收获喜欢 1962 次。

关注

评论

发布
暂无评论
发现更多内容

C盘内存杀手,原来是这款出人意料的被闲置的软件|iTunes

彭宏豪95

效率 工具 4月日更 iTunes

如何通过openLooKeng更高效访问HBase?

openLooKeng

Java 大数据 Bigdata MySQL 高可用

排查dubbo接口重复注销问题,我发现了一个巧妙的设计

捉虫大师

dubbo

云信技术系列课 | RTC 系统音频弱网对抗技术发展与实践

网易云信

WebRTC 音频

【XXX高校】软件IT专业学生(恋爱观)调查问卷

洛神灬殇

调查报告 大学生 恋爱

资讯|WebRTC M90 更新

网易云信

WebRTC

Jcenter 停止服务,说一说我们的迁移方案

Antway

android maven Gradle

生命中的无奈

小天同学

读书 读后感 生命 4月日更

获取chrome80谷歌浏览器存储的指定网站Cookie数据方法详解

老猿Python

Python chrome 爬虫 Cookie

浪潮云再次入围央采2021年云计算服务采购名单

浪潮云

云计算

被遗弃的 Vector 和 Stack

Kori Lin

Java

SCA工具:开源安全威胁一手掌控

华为云开发者联盟

开源 安全 测试 SCA 软件成分分析

智能小车系列-动力系统(ezPWM)

波叽波叽啵😮一口盐汽水喷死你

pwm ezPWM PWM信号

微信小程序登录流程详解

frank-say

百度智能云成中国跳水队独家AI合作伙伴圆梦东京!

百度大脑

百度智能云

智能小车系列-串口设置

波叽波叽啵😮一口盐汽水喷死你

串口 树莓派串口 ttyAMA0

特斯拉行车数据被篡改?专家称车企很难自证清白,保留“数据指纹”的区块链技术在路上

CECBC

指纹

ArrayList 与 LinkedList 底层结构

Kori Lin

Java

IT 专业高校大学生就业方向状况调查问卷

架构精进之路

调查报告 4月日更 InfoQ 写作平台 1 周年

软件 IT 专业的高校学生有关在线课程的问卷调查

程序员历小冰

容器 & 服务: 扩容(二)

程序员架构进阶

Kubernetes 28天写作 弹性扩容 4月日更

2021高校IT专业大学生就业意向调查问卷

黑马腾云

面向软件 IT 专业的高校大学生课余时间自学情况调查

xiezhr

大学生日常 IT 高校学院 问卷调查

Linux 上 定时备份postgresql 数据库

Yang

数据库 postgresql

基于Kubernetes Operator的网易数帆生产级云原生中间件实践

网易数帆

架构 Kubernetes 云原生 operator 中间件

音视频编解码--编码参数CRF

Fenngton

ffmpeg 视频编解码 视频压缩 码率控制 CRF

赋能制造产业智能化转型 百度大脑开放日福州解密

百度大脑

百度大脑 开放日 智能化

如何从 0 到 1 开发 PyFlink API 作业

Apache Flink

flink pyflink python 3.5+

UT之最后一测

好好学习,天天向上

LeetCode题解:151. 翻转字符串里的单词,栈,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

最新、最全、最详细的 Git 学习笔记总结(2021最新版)

民工哥

后端 Git Submodule linux运维 代码管理

达摩院损失AI“大将”,预训练大模型M6技术负责人杨红霞离职_AI&大模型_刘燕_InfoQ精选文章