NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

参数是 ChatGPT 的近 6 倍!英特尔公布 AI 大模型 Aurora genAI,具备 1 万亿参数

  • 2023-05-25
    北京
  • 本文字数:1967 字

    阅读完需:约 6 分钟

参数是ChatGPT的近6倍!英特尔公布AI大模型Aurora genAI,具备1万亿参数

模型参数越大就越好吗?

英特尔公布 AI 大模型 Aurora genAI,具备 1 万亿参数


wccftech 报道,英特尔近日公布了旗下生成式 AI 大模型 Aurora genAI


据悉,Aurora genAI 参数量高达 1 万亿,其开发依赖于 Megatron 和 DeepSpeed 框架,这些结构增强了模型的强度和容量。而 ChatGPT 模型参数量是 1750 亿,这也意味着,Aurora genAI 的参数量是ChatGPT 的近 6 倍


据悉,Aurora genAI 模型是英特尔是与阿贡国家实验室和 HPE 合作开发的,它是一个纯粹以科学为中心的生成式 AI 模型,将被用于各类科学应用,包括分子和材料设计、乃至涵盖数百万来源的综合知识素材,据此为系统生物学、高分子化学、能源材料、气候科学和宇宙学等提供值得探索的实验设计思路。这些模型还将用于加速癌症及其他疾病的相关生物过程的识别速度,并为药物设计提供靶点建议。


除了科研之外,Aurora genAI 还具有在自然语言处理、机器翻译、图像识别、语音识别、金融建模等商业领域的应用潜力。


阿贡实验室副主任 Rick Stevens 介绍称,“这个项目希望充分利用 Aurora 超级计算机的全部潜力,为能源部各实验室的下游科学研究和其他跨机构合作计划提供资源。”


根据介绍,Aurora genAI 模型将由生物学、化学、材料科学、物理学、医学等学科的常规文本、代码、科学文本和结构化数据训练而成。阿贡实验室正带头组织国际合作以推进该项目,参与方包括英特尔、HPE、能源部各下辖实验室、美国及其他国际性高校、非营利组织,以及 RIKEN 等国际合作伙伴。


Aurora genAI 模型将运行在英特尔为阿拉贡国家实验室开发的 Aurora 超算上,其性能达到了 200 亿亿次,是当前 TOP500 超算冠军 Frontier 的 2 倍。近日,英特尔和阿贡国家实验室还公布了 Aurora 的安装进度、系统规格和早期性能测试结果:


  • 英特尔已完成 Aurora 超级计算机 1 万多块刀片服务器的交付。

  • Aurora 的完整系统采用 HPE Cray EX 超算架构,将拥有 63744 个 GPU 和 21248 个 CPU,辅以 1024 个 DAOS 存储节点。Aurora 还将配备 HPE Slingshot 高性能以太网络。

  • 早期性能结果显示,Aurora 超算系统在实际科学和工程负载上具有领先性能,性能表现比 AMD MI250 GPU 高出 2 倍,在 QMCPACK 量子力学应用程序上的性能比 H100 提高 20%,且能够在数百个节点上保持近线性的算力扩展。作为 ChaGPT 的有力竞争者,Aurora genAI 的公布预示着 AI 大模型赛道又迎来了新的重磅玩家,并极有可能在未来对各种科学领域产生重大影响。不过目前,Aurora genAI 更像是处于概念阶段,英特尔的目标是到 2024 年完成 Aurora genAI 模型的构建。


对于英特尔的万亿参数 AI 大模型 Aurora genAI,有网友表示:“我不相信仅仅增加参数数量就能改进模型,我认为我们不应该发布新闻稿追逐增加参数数量。我在研究中还发现,较大的模型通常不会表现得更好,但由于不负责任的营销,这变得越来越难以向非技术人员解释。如果我们对这些营销放任不管,我们会让很多人失望,并降低大家对 AI 未来增长潜力的信心——我们不想要另一个 AI 寒冬。训练这些大型模型会产生巨大的环境成本,而且理解、使用和控制这些非常大的模型(即使作为研究人员)也变得更加困难。”

AI 军备竞赛进入“万亿参数模型”对抗时代?


近几年,随着 AI 大模型赛道持续升温,越来越多的科技巨头加入进来,并不断打破参数规模记录。


2021 年 1 月,谷歌大脑团队重磅推出超级语言模型 Switch Transformer,该模型有 1.6 万亿个参数,是当时规模最大的 NLP 模型。同年 6 月,智源研究院发布悟道 2.0,该系统参数数量已超过 1.75 万亿,是当时全球最大的大规模智能模型系统。同年 11 月,阿里达摩院发布多模态大模型 M6,其参数已从万亿跃迁至 10 万亿,是当时全球最大的 AI 预训练模型。


有分析指出,中美 AI 军备竞赛的核心战场正是万亿级预训练模型。打造千万亿参数规模的预训练模型是人类的一个超级工程,可能会对国家甚至人类社会产生重大影响。


那么,模型参数越大就越好吗?


鹏城实验室网络智能部云计算所副所长相洋曾在接受 InfoQ 采访时指出:


我们最初见到的一些模型是几万个参数,后来就到了几亿、几十亿、百亿、千亿,还有可能上万亿。目前从事实来说,的确是模型越大数据越多,且质量越好,带来的性能是越高的。但是我个人认为,这个提升曲线可能会有一个瓶颈期,到了瓶颈或者平台期的时候,它的上升速度可能就会缓慢,或者说基本就达到稳定了。就目前而言,可能我们还没有到达平台期。所以说,“模型参数越大越好”这个说法在一定程度上是成立的。


但是,判断一个大模型是否优秀,不能只看参数,还要看实际表现。模型得出来的任务效果好,我们就可以认为这个模型是个好模型。参数不是问题,当机器无论是在存储还是计算能力都足够强的时候,大模型也可以变成小模型。


此外,还要考虑模型的可解释能力,以及是否容易受噪声的攻击。如果该模型有一定的解释能力,那这个模型就是一个好模型;如果该模型不易被噪声数据或是其他因素影响的话,那这个模型也是一个好模型。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-05-25 14:004412

评论

发布
暂无评论
发现更多内容

7 个非常实用的 Shell 拿来就用脚本实例!

JackTian

Linux 编程 Shell 脚本语言 运维工程师

Rust从0到1-结构体-定义和实例化

rust struct 结构体

CSS实现动画环绕下划线效果

Sakura

4月日更

架构实战营模块一作业

sandy

面试笔记(二)线程池连环炮

U2647

Thread 4月日更

BBK智能合约系统开发|BBK智能合约APP软件开发

系统开发

情指勤一体化指挥调度平台建设,重点人员管理平台

【Java 试题】AQS解析

程序员架构进阶

AQS Java源码 28天写作 4月日更

这6个浏览器插件,让你的浏览器大为不同。

彭宏豪95

chrome 浏览器 插件 chrome扩展 4月日更

拍乐云 x 扬帆出海 x LiveCloud:音视频出海专家干货分享

拍乐云Pano

flutter ios android WebRTC RTC

区块链BaaS平台的搭建,底层BaaS服务平台的开发

13828808769

行业资讯 产品资讯

架构实战营模块 1 作业

Geek_2b52aa

架构实战营

架构训练营

架构训练营

假期后来一波干货:一文理清JVM和GC

比伯

Java 程序员 架构 JVM 计算机

你在备战“字节”时一定需要这个,程序员进大厂指南+算法已开源

Java架构师迁哥

平面设计之PS(前序)

空城机

PhotoShop ps 4月日更

牛比特小矿工系统开发|牛比特小矿工软件APP开发

系统开发

Spring Boot + RabbitMQ实现订单过期自动取消功能

Lonely Sufferer

RabbitMQ springboot

企业为何开始选择使用成品训练数据集?

澳鹏Appen

人工智能 机器学习 大数据 数据集 数据流

手起刀落,连斩获阿里(四面)+字节(四面)+美团(三面)三家一线大厂Offer!

Java架构追梦

Java 架构 面试

区块链商品溯源平台搭建及防伪溯源解决方案

13828808769

商品溯源

对于数据,科技小白提出了灵魂三问:从哪儿来?到哪儿去?能干什么?

华为云开发者联盟

人工智能 安全 数据 数据采集 网络人工智能

书单|互联网企业面试案头书之运营篇

博文视点Broadview

人生苦短,我用Python之小游戏

Bob

开发者 Python 游戏编程 4月日更 -python

超低功耗LoRa无线通信应用实践

不脱发的程序猿

物联网 无线通信 4月日更 LoRa 无线通信模组

Crash 游戏是公平的吗?

飞亚科技

MUSO挖矿系统开发

飞亚科技

教你一个著名的流行数据格式:Python JSON

华为云开发者联盟

Python 数据 Python JSON JSON序列化 半结构化数据

有了这个框架,平台开发谁还手敲代码?

华为云开发者联盟

华为云 智慧园区 MainPortal 统一门户 HDC2021

「架构实战营」模块一作业

between

架构实战营

3d导航栏

赫鲁小夫

4月日更

参数是ChatGPT的近6倍!英特尔公布AI大模型Aurora genAI,具备1万亿参数_文化 & 方法_凌敏_InfoQ精选文章