写点什么

达摩院损失 AI“大将”,预训练大模型 M6 技术负责人杨红霞离职

  • 2022-10-12
    北京
  • 本文字数:1377 字

    阅读完需:约 5 分钟

达摩院损失AI“大将”,预训练大模型M6技术负责人杨红霞离职

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

阿里达摩院损失 AI“大将”。


日前,据 Tech 星球报道,阿里达摩院大模型带头人杨红霞已于 9 月初离职。InfoQ 发现,杨红霞于不久前注销了钉钉账号。

全球最大 AI 预训练模型 M6 背后的技术负责人


杨红霞博士是超大规模多模态预训练模型 M6 的技术负责人。


M6,英文全称是 MultiModality-to-MultiModality Multitask Mega-transformer,6 个 M,简称 M6。


顾名思义,M6 大模型主打多模态、多任务能力,其目标是打造全球领先的具有通用性的人工智能大模型。


2021 年 3 月,达摩院发布了国内首个千亿参数多模态大模型 M6,引发海外关注。OpenAI 前政策主管 Jack Clark 公开点评道:“这个模型的规模和设计都非常惊人。这看起来像是众多中国的 AI 研究组织逐渐发展壮大的一种表现。”


2021 年 11 月,阿里 M6 宣布升级至万亿参数,并在全球范围内首次大幅降低了万亿参数超大模型训练能耗,更加符合业界对低碳、高效训练 AI 大模型的需求。


据悉,通过一系列突破性的技术创新,达摩院团队仅使用 480 卡 V100 32G GPU,即训练出了规模达人类神经元 10 倍的万亿参数多模态大模型 M6,与英伟达、谷歌等海外公司实现万亿参数规模相比,能耗降低超八成、效率提升约 11 倍。


这一技术突破将极大降低万亿模型训练门槛,让大模型研究和工业化落地进入更加普惠的时代。


针对此次升级,达摩院资深算法专家杨红霞曾表示,“接下来,M6 团队将继续把低碳 AI 做到极致,推进应用进一步落地,并探索对通用大模型的理论研究。”


以下为 M6 发展历程:


  • 2021 年 1 月 —— M6 百亿参数模型达成,国内首个百亿规模多模态大模型

  • 2021 年 2 月 —— M6 千亿参数模型达成,国内首个千亿规模多模态大模型

  • 2021 年 5 月 —— M6 万亿参数模型达成,全球范围内首次大幅降低了万亿参数超大模型训练能耗,且成为国内首个实现商业化落地的多模态大模型

AI 项目落地难?


据报道,杨红霞此次离职是因为个人家庭原因。


Tech 星球的报道中称,此番杨红霞离职,被认为是达摩院对一些难以落地的商业化项目进行调整。一位阿里云内部人士透露,“达摩院很多项目都是远看很牛,近看难以落地”,虽然二者都在云与科技,但是达摩院的项目与业务产研隔的较远,也很少和云服务一起对外售卖。所以达摩院每个项目的落地应用和商业化程度,很多是个谜。


去年 5 月,阿里宣布 AI 大模型首次商用,M6 成为国内首个实现商业化落地的多模态大模型。经过一段时间的试用,M6 作为 AI 助理设计师正式上岗阿里新制造平台犀牛智造,通过结合潮流趋势进行快速设计、试穿效果模拟,有望大幅缩短快时尚新款服饰设计周期。M6 还已应用于支付宝、淘宝等平台,参与跨模态搜索、文案撰写、图片设计等工作。


此前,阿里一直强调,达摩院不用有盈利压力。但 2022 年,互联网企业普遍降本增效,达摩院也进行了诸多调整。在杨红霞之前,阿里集团副总裁、阿里云研究院副院长肖利华,达摩院副院长金榕等都已相继离开阿里。


杨红霞是 AI 领域杰出的人工智能科学家。资料显示,杨红霞 2007 年本科毕业于南开大学,获统计学学士学位。其后她去往美国杜克大学统计科学系攻读博士学位,师从 David Dunson 教授。杨红霞拥有顶级论文 40 余篇。曾任 IBM Watson 研究员、Yahoo!主任数据科学家等职。她曾带领团队获 2019 世界人工智能大会最高奖卓越人工智能引领者(Super AI Leader,简称 SAIL 奖),曾获 2022 年福布斯中国科技女性 50 强的荣誉,获得 2020 年国家科学技术进步奖二等奖。

公众号推荐:

AIGC 技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话 30 位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选 10 余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

2022-10-12 12:074610
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 505.6 次阅读, 收获喜欢 1970 次。

关注

评论

发布
暂无评论
发现更多内容

AirServer正式版Mac7.2.7屏幕软件下载

茶色酒

AirServer AirServer2023

为什么 APISIX Ingress 是比 Ingress NGINX 更好的选择?

API7.ai 技术团队

APISIX Ingress Controller Kubernetes Serverless NGINX Ingress Controller

Python对txt进行读写操作

代码的路

Python

软件测试/测试开发丨如何从 0 开始学 Python 自动化测试开发(一)

测试人

Python 软件测试 自动化测试 测试开发

Python将二维数组输出为图片

代码的路

Python

数据可视化图表系列解析——漏斗图

Data 探险实验室

数据分析 可视化 数据可视化 图表 可视化数据

工业5.0:为何是下一个10年的制造业关键性变革方向?

PreMaint

工业4.0 智能制造

啥玩意儿?一个计时模块要做2天?

为自己带盐

dotnetcore

未来软件开发主流模式——低代码开发

力软低代码开发平台

Sentinel Go-毫秒级统计数据结构揭秘

阿里巴巴中间件

Go 阿里云 云原生 Sentienl

软件测试/测试开发 | 一文搞定 Appium 环境配置

测试人

软件测试 自动化测试 测试开发 appium app自动化测试

平安健康 Dubbo 3 升级、迁移和验证之路

阿里巴巴中间件

阿里云 云原生 dubbo

房价危机:疫情后时代席卷全球的新变局|数据报告

前嗅大数据

数据分析 数据采集 爬虫案例 爬虫工具 房价

I see you!「2022 龙蜥社区优秀贡献者」正式启动

OpenAnolis小助手

开源 龙蜥社区 2022 奖项 优秀贡献者

软件测试/测试开发丨从 0 开始学 Python 自动化测试开发(二):环境搭建

测试人

Python 软件测试 自动化测试 测试开发

Github 标星 41.6K!Alibaba内网Java性能调优实战(全彩小册开源)

架构师之道

Java 程序员 架构 面试

pip安装'torch'出现PackageNotFoundError报错解决办法

代码的路

Python

TiDB 底层存储结构 LSM 树原理介绍

C++后台开发

数据结构 后端开发 LSM树 TiDB

Python将图片输出为二维数组并保存到txt中

代码的路

Python

秒云荣获四川省创新型中小企业认定

MIAOYUN

创新型中小企业 2022创新型中小企业 四川省创新型中小企业 科技型中小企业

Redux与前端表格施展“组合拳”,实现大屏展示应用的交互增强

葡萄城技术团队

Python中LSTM回归神经网络的时间序列预测

代码的路

Python

pip安装更换镜像

代码的路

Python.

高性能网络SIG月度动态:virtio新设备进入virtio规范、smc新特性IPC性能比tcp提升88% | 龙蜥SIG

OpenAnolis小助手

操作系统 高性能网络 龙蜥社区 sig virtio

PyTorch的简单实现

代码的路

Python PyTorch

NFTScan 与 Afflux 孵化器达成战略合作伙伴,共同促进 Web3 生态发展!

NFT Research

NFT

4种LED显示屏箱体连接方式

Dylan

LED LED显示屏 户外LED显示屏

基于 APISIX 的服务网格方案 Amesh 积极开发中!

API7.ai 技术团队

Service Mesh Service Mesh 服务网格 服务网格 APISIX

新一代云原生日志架构 - Loggie的设计与实践

网易数帆

开源 云原生 日志 Loggie 企业号 1 月 PK 榜

这可能是Feign调用可重试的最佳方案了

JAVA旭阳

Java spring

如何通过Java应用程序添加或删除 PDF 中的附件

在下毛毛雨

PDF Java’ 添加注释

达摩院损失AI“大将”,预训练大模型M6技术负责人杨红霞离职_AI&大模型_刘燕_InfoQ精选文章