NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

达摩院损失 AI“大将”,预训练大模型 M6 技术负责人杨红霞离职

  • 2022-10-12
    北京
  • 本文字数:1377 字

    阅读完需:约 5 分钟

达摩院损失AI“大将”,预训练大模型M6技术负责人杨红霞离职

阿里达摩院损失 AI“大将”。


日前,据 Tech 星球报道,阿里达摩院大模型带头人杨红霞已于 9 月初离职。InfoQ 发现,杨红霞于不久前注销了钉钉账号。

全球最大 AI 预训练模型 M6 背后的技术负责人


杨红霞博士是超大规模多模态预训练模型 M6 的技术负责人。


M6,英文全称是 MultiModality-to-MultiModality Multitask Mega-transformer,6 个 M,简称 M6。


顾名思义,M6 大模型主打多模态、多任务能力,其目标是打造全球领先的具有通用性的人工智能大模型。


2021 年 3 月,达摩院发布了国内首个千亿参数多模态大模型 M6,引发海外关注。OpenAI 前政策主管 Jack Clark 公开点评道:“这个模型的规模和设计都非常惊人。这看起来像是众多中国的 AI 研究组织逐渐发展壮大的一种表现。”


2021 年 11 月,阿里 M6 宣布升级至万亿参数,并在全球范围内首次大幅降低了万亿参数超大模型训练能耗,更加符合业界对低碳、高效训练 AI 大模型的需求。


据悉,通过一系列突破性的技术创新,达摩院团队仅使用 480 卡 V100 32G GPU,即训练出了规模达人类神经元 10 倍的万亿参数多模态大模型 M6,与英伟达、谷歌等海外公司实现万亿参数规模相比,能耗降低超八成、效率提升约 11 倍。


这一技术突破将极大降低万亿模型训练门槛,让大模型研究和工业化落地进入更加普惠的时代。


针对此次升级,达摩院资深算法专家杨红霞曾表示,“接下来,M6 团队将继续把低碳 AI 做到极致,推进应用进一步落地,并探索对通用大模型的理论研究。”


以下为 M6 发展历程:


  • 2021 年 1 月 —— M6 百亿参数模型达成,国内首个百亿规模多模态大模型

  • 2021 年 2 月 —— M6 千亿参数模型达成,国内首个千亿规模多模态大模型

  • 2021 年 5 月 —— M6 万亿参数模型达成,全球范围内首次大幅降低了万亿参数超大模型训练能耗,且成为国内首个实现商业化落地的多模态大模型

AI 项目落地难?


据报道,杨红霞此次离职是因为个人家庭原因。


Tech 星球的报道中称,此番杨红霞离职,被认为是达摩院对一些难以落地的商业化项目进行调整。一位阿里云内部人士透露,“达摩院很多项目都是远看很牛,近看难以落地”,虽然二者都在云与科技,但是达摩院的项目与业务产研隔的较远,也很少和云服务一起对外售卖。所以达摩院每个项目的落地应用和商业化程度,很多是个谜。


去年 5 月,阿里宣布 AI 大模型首次商用,M6 成为国内首个实现商业化落地的多模态大模型。经过一段时间的试用,M6 作为 AI 助理设计师正式上岗阿里新制造平台犀牛智造,通过结合潮流趋势进行快速设计、试穿效果模拟,有望大幅缩短快时尚新款服饰设计周期。M6 还已应用于支付宝、淘宝等平台,参与跨模态搜索、文案撰写、图片设计等工作。


此前,阿里一直强调,达摩院不用有盈利压力。但 2022 年,互联网企业普遍降本增效,达摩院也进行了诸多调整。在杨红霞之前,阿里集团副总裁、阿里云研究院副院长肖利华,达摩院副院长金榕等都已相继离开阿里。


杨红霞是 AI 领域杰出的人工智能科学家。资料显示,杨红霞 2007 年本科毕业于南开大学,获统计学学士学位。其后她去往美国杜克大学统计科学系攻读博士学位,师从 David Dunson 教授。杨红霞拥有顶级论文 40 余篇。曾任 IBM Watson 研究员、Yahoo!主任数据科学家等职。她曾带领团队获 2019 世界人工智能大会最高奖卓越人工智能引领者(Super AI Leader,简称 SAIL 奖),曾获 2022 年福布斯中国科技女性 50 强的荣誉,获得 2020 年国家科学技术进步奖二等奖。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2022-10-12 12:074547
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 493.8 次阅读, 收获喜欢 1967 次。

关注

评论

发布
暂无评论
发现更多内容

前端如何低门槛开发iOS、Android、小程序多端应用

YonBuilder低代码开发平台

TDSQL | HTAP系统的问题与主义之争

腾讯云数据库

数据库 tdsql

Java 处理表格,真的很爽!

程序员鱼皮

Java

使用ABAP代码返回S/4HANA Material上维护的Attachment明细

Jerry Wang

SAP S/4HANA 11月日更 Material

WeTest.net全球能力开放:锻造高品质产品,构建全球竞争力

WeTest

人脸识别实战:使用Python OpenCV 和深度学习进行人脸识别

AI浩

人脸识别

金融级数据库新坐标:腾讯云TDSQL发布全自研新敏态引擎

腾讯云数据库

数据库 tdsql

供应链安全隐患迫在眉睫,2021年全球APT攻击暗藏何种趋势?

科技热闻

保持清洁的Git提交记录,三招就够了

Geek_1df311

Java 开源 架构 git 学习

Docker心经

卫先生

Python 编译器 编译器远程连接docker docker常用命令 docker总结

第四范式x英特尔“AI应用与异构内存编程挑战赛”圆满收官

第四范式开发者社区

如果你正在准备面试TCP,看这一篇就够了

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

前端避坑指南丨辛辛苦苦开发的APP竟然被判定为简单网页打包?

YonBuilder低代码开发平台

这一次,飞书改变「飞书」

ToB行业头条

热爱代码且发量惊人,一名反“内卷”研发工程师的日常

尔达Erda

程序员 开发者 技术人生 成长笔记

恒源云(GPUSHARE)_教你如何团队合作搞算力!

恒源云

人工智能 深度学习 云算力

大咖说·未来组织的底层逻辑

大咖说

云计算

图文并茂!你管这破玩意儿叫TCP?

热爱java的分享家

Java TCP 程序人生 编程语言 经验分享

Alibaba 新产 SpringCloud Aliababa(全彩第四版)开源

Geek_1df311

Java 编程 架构 微服务

打造数字化软件工厂 —— 一站式 DevOps 平台全景解读

CODING DevOps

DevOps 研发管理 CODING

TDSQL | 数据异常的本质和价值详解

腾讯云数据库

数据库 tdsql

秀出新天际的SpringBoot笔记,让开发像搭积木一样简单

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

Go语言学习查缺补漏ing Day4

Regan Yue

Go 语言 11月日更

混沌工程:分布式系统稳定性的“疫苗”

中原银行

微服务 云原生 混沌工程

Flux 源码之reactor 核心原理及概述

漫游指南

reactor Flux

太顶了!华为高工用一份423页的网络协议笔记把计算机网络讲清了

热爱java的分享家

Java 面试 程序人生 网络协议 经验分享

什么是色彩心理学?

坚果

心理学 11月日更

欢迎 Apache ShardingSphere 社区海外新晋 Committer!

SphereEx

开源社区 ShardingSphere SphereEx Committer

TDengine助力顺丰科技大数据监控改造

TDengine

tdengine 时序数据库

如何使用SAP CRM Marketing Survey创建一个市场问卷调查

Jerry Wang

SAP abap 11月日更 Survey

业务流程建模,你真的做对了吗

明道云

达摩院损失AI“大将”,预训练大模型M6技术负责人杨红霞离职_AI&大模型_刘燕_InfoQ精选文章