【ArchSummit架构师峰会】精华内容上线75%,AI大模型中台从理念到实践的探索!>>> 了解详情
写点什么

英伟达入局 AI 大模型“战场”:发布两项全新大型语言模型,推动 AI 和数字生物的发展

  • 2022-09-23
    北京
  • 本文字数:1152 字

    阅读完需:约 4 分钟

英伟达入局AI大模型“战场”:发布两项全新大型语言模型,推动AI和数字生物的发展

当地时间 9 月 20 日,NVIDIA 宣布发布两项全新大型语言模型(LLM)云 AI 服务——NVIDIA NeMo 大型语言模型服务NVIDIA BioNeMo LLM 服务。使开发者能够轻松调整 LLM 并部署定制的 AI 应用程序,其可用于内容生成、文本摘要、聊天机器人、代码开发,以及蛋白质结构和生物分子特性预测等。


NVIDIA NeMo LLM 服可提供一条快速路径,以便自定义和使用在多个框架上训练的大型语言模型。开发者可以在私有云和公有云上使用 NeMo LLM 部署企业 AI 应用,还可以通过云 API 体验 Megatron 530B(大型语言模型之一),也可以通过 LLM 服务开展实验。


NVIDIA BioNeMo 服务是云应用程序编程接口(API),它可以将 LLM 用例扩展到语言以外的科学应用中,加快制药和生物技术公司的药物研发速度。


NVIDIA 创始人兼首席执行官黄仁勋表示: “大型语言模型具有改变每个行业的潜力。通过对基础模型进行调整,可将 LLM 的力量带给数百万的开发者,让他们无需重新构建庞大的模型,即可创建各种语言服务并推动科学发现。”

NeMo LLM 通过提示学习提高准确性,加快部署速度


借助 NeMo LLM 服务,开发者可以使用自己的训练数据定制基础模型——从 30 亿个参数到世界上最大的 LLM 之一 Megatron 530B。与从头开始训练模型所需的数周或数月相比,该过程只需几分钟到几小时。

 

提示学习是使用一种名为 P-tuning 的技术来定制模型,使开发者只需使用几百个示例就能快速定制最初需要使用数十亿个数据点训练的基础模型。定制流程生成任务专属的提示标记,这些标记会与基础模型相结合,为特定用例提供更高的准确性和更相关的响应。

 

开发者可以使用同一模型定制多个用例并生成许多不同的 Prompt Token。游乐场功能提供可以轻松实验并与模型互动的无代码选项,进一步提高了 LLM 对行业特定用例的有效性和可及性。

 

一旦准备好部署,经过调整的模型即可在云实例、本地系统上或通过 API 运行。

BioNeMo LLM 使研究人员能够充分利用大规模模型的力量


BioNeMo LLM 服务包括两个用于化学和生物学应用的新 BioNeMo 语言模型。该服务提供蛋白质、DNA 和生物化学数据方面的支持,帮助研究人员发现生物序列中的模式和洞察。

 

BioNeMo 使研究人员能够利用包含数十亿个参数的模型来扩大研究范围。这些大型模型可以储存更多关于蛋白质结构、基因间进化关系的信息,甚至可以生成用于治疗的新型生物分子。


除了调整基础模型之外,LLM 服务还提供通过云 API 使用现成和定制模型的选项。

     

这让开发者可以访问包括 Megatron 530B 在内的各种预训练 LLM,以及使用 NVIDIA NeMo Megatron 框架创建的 T5 和 GPT-3 模型。NVIDIA NeMo Megatron 框架现已进入公测阶段,可支持各种应用和多语言服务需求。     

 

汽车、计算、教育、医疗、电信等行业的领导者正在使用 NeMo Megatron 为客户提供中文、英语、韩语、瑞典语等语言的服务。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2022-09-23 16:354075

评论

发布
暂无评论
发现更多内容

项目延期了,怎么办?

石云升

项目管理 28天写作 职场经验 管理经验 3月日更

LeetCode题解:91. 解码方法,动态规划(优化),JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

大作业

LouisN

融云清空历史消息 Android 端

融云 RongCloud

sdk

Hamcrest

insight

单元测试 3月日更

阿里大师口述:让你可以在简历上写精通SpringBoot

编程 架构 springboot

唠一唠融云的消息扩展功能

融云 RongCloud

sdk

Android 端如何添加自定义表情

融云 RongCloud

IM

假期无聊冰河开发了一款国民级游戏!

冰河

Java 游戏

php的一些漏洞梳理

依旧廖凯

28天写作 3月日更

markdown如何插入图片、音频、视频?

xiezhr

markdown markdown语法 音频

金三银四跳槽阿里必备:分布式/高并发/Redis,不看我真的怕你后悔

比伯

Java 编程 架构 面试 程序人生

短网址服务设计整理

程序员架构进阶

架构 设计实践 28天写作 实操案例 3月日更

5 分钟部署一个 OIDC 服务并对接 nightingale

冯骐

CAS Nightingale 认证授权 OIDC Apereo

算命、运气和其他「Day 24」

道伟

28天写作

存量用户运营企业微信的“用户端小程序”优化方案

vivo互联网技术

小程序 微信 性能优化 大前端 企业微信

京东数科面试真题:常见的 IO 模型有哪些?Java 中的 BIO、NIO、AIO 有啥区别?

Java 架构 面试

一卷河图赋太虚:HMS Core CG kit与移动游戏新可能

脑极体

像这样操作 Python 列表,能让你的代码更优雅 | pythonic 小技巧

AlwaysBeta

Python

yum安装Nginx全流程指南

happlyfox

28天写作 3月日更

Nginx配置静态文件服务从入门到精通

happlyfox

28天写作 3月日更

容器or虚拟机?

xcbeyond

Docker 容器 3月日更 专业术语

美丽的数学学习笔记(1)

方勇(gopher)

产品经理训练营 - 大作业

joelhy

产品经理训练营

诊所数字化:医疗机构常见的系统整理

boshi

医院 医疗 七日更

产品训练营 第四周作业

万顷湖天碧

算法攻关-climbing-stairs(O(n))_70

小诚信驿站

刘晓成 小诚信驿站 28天写作 算法攻关

融云即时通讯SDK集成 -- 定制UI(二) ——添加自定义表情库

融云 RongCloud

融云 IM SDK 集成 --- 刷新会话界面和会话列表界面

融云 RongCloud

IM

融云即时通讯SDK集成 -- 通知检查

融云 RongCloud

即时通讯

Wireshark 数据包分析学习笔记 Day13

穿过生命散发芬芳

Wireshark 数据包分析 3月日更

英伟达入局AI大模型“战场”:发布两项全新大型语言模型,推动AI和数字生物的发展_语言 & 开发_李冬梅_InfoQ精选文章