阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

英伟达入局 AI 大模型“战场”:发布两项全新大型语言模型,推动 AI 和数字生物的发展

  • 2022-09-23
    北京
  • 本文字数:1152 字

    阅读完需:约 4 分钟

英伟达入局AI大模型“战场”:发布两项全新大型语言模型,推动AI和数字生物的发展

当地时间 9 月 20 日,NVIDIA 宣布发布两项全新大型语言模型(LLM)云 AI 服务——NVIDIA NeMo 大型语言模型服务NVIDIA BioNeMo LLM 服务。使开发者能够轻松调整 LLM 并部署定制的 AI 应用程序,其可用于内容生成、文本摘要、聊天机器人、代码开发,以及蛋白质结构和生物分子特性预测等。


NVIDIA NeMo LLM 服可提供一条快速路径,以便自定义和使用在多个框架上训练的大型语言模型。开发者可以在私有云和公有云上使用 NeMo LLM 部署企业 AI 应用,还可以通过云 API 体验 Megatron 530B(大型语言模型之一),也可以通过 LLM 服务开展实验。


NVIDIA BioNeMo 服务是云应用程序编程接口(API),它可以将 LLM 用例扩展到语言以外的科学应用中,加快制药和生物技术公司的药物研发速度。


NVIDIA 创始人兼首席执行官黄仁勋表示: “大型语言模型具有改变每个行业的潜力。通过对基础模型进行调整,可将 LLM 的力量带给数百万的开发者,让他们无需重新构建庞大的模型,即可创建各种语言服务并推动科学发现。”

NeMo LLM 通过提示学习提高准确性,加快部署速度


借助 NeMo LLM 服务,开发者可以使用自己的训练数据定制基础模型——从 30 亿个参数到世界上最大的 LLM 之一 Megatron 530B。与从头开始训练模型所需的数周或数月相比,该过程只需几分钟到几小时。

 

提示学习是使用一种名为 P-tuning 的技术来定制模型,使开发者只需使用几百个示例就能快速定制最初需要使用数十亿个数据点训练的基础模型。定制流程生成任务专属的提示标记,这些标记会与基础模型相结合,为特定用例提供更高的准确性和更相关的响应。

 

开发者可以使用同一模型定制多个用例并生成许多不同的 Prompt Token。游乐场功能提供可以轻松实验并与模型互动的无代码选项,进一步提高了 LLM 对行业特定用例的有效性和可及性。

 

一旦准备好部署,经过调整的模型即可在云实例、本地系统上或通过 API 运行。

BioNeMo LLM 使研究人员能够充分利用大规模模型的力量


BioNeMo LLM 服务包括两个用于化学和生物学应用的新 BioNeMo 语言模型。该服务提供蛋白质、DNA 和生物化学数据方面的支持,帮助研究人员发现生物序列中的模式和洞察。

 

BioNeMo 使研究人员能够利用包含数十亿个参数的模型来扩大研究范围。这些大型模型可以储存更多关于蛋白质结构、基因间进化关系的信息,甚至可以生成用于治疗的新型生物分子。


除了调整基础模型之外,LLM 服务还提供通过云 API 使用现成和定制模型的选项。

     

这让开发者可以访问包括 Megatron 530B 在内的各种预训练 LLM,以及使用 NVIDIA NeMo Megatron 框架创建的 T5 和 GPT-3 模型。NVIDIA NeMo Megatron 框架现已进入公测阶段,可支持各种应用和多语言服务需求。     

 

汽车、计算、教育、医疗、电信等行业的领导者正在使用 NeMo Megatron 为客户提供中文、英语、韩语、瑞典语等语言的服务。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2022-09-23 16:354122

评论

发布
暂无评论
发现更多内容

从外包跳槽到大厂,我用了55天成功逆袭。

Java 程序员 架构 面试

【epoll】epoll多路复用和Reactor设计思想

Linux服务器开发

后端 网络编程 C/C++ epoll Linux服务器开发

造车潮

ES_her0

5月日更

【签约计划】试用期规则

InfoQ写作社区官方

签约计划 热门活动

API网关才是大势所趋?SpringCloud Gateway保姆级入门教程

Zhendong

Java spring API 网关

数据挖掘从入门到放弃(七):TensorFlow和keras实现线性回归LinearRegression

数据社

机器学习 5月日更

520,珍惜眼前人

数据社

520 520单身福利 520 单身福利

Dubbo 延迟与粘滞连接

青年IT男

dubbo

数据预处理&特征工程

Qien Z.

Python 5月日更

父母为什么催婚,而你又在逃避什么

小天同学

婚姻 爱情 5月日更

博睿数据多点开花,数据链DNA加速走进金融、医疗、政企行业

博睿数据

数据链DNA

NetCore配置文件使用全过程

happlyfox

520单身福利

破茧成蝶,如何用数据之力重塑您的业务?| 云途专栏

亚马逊云科技 (Amazon Web Services)

全面隔绝虚拟货币暴涨暴跌风险

CECBC

SWOT分析模型

石云升

创业 战略 职场经验 5月日更

亚马逊云科技宣布在上海设立生命健康行业数字化赋能中心

亚马逊云科技 (Amazon Web Services)

Flink的广播变量

大数据技术指南

大数据 flink 5月日更

为什么“放弃”?

Nydia

学习

写给大神

小梨蕊

情人节 520单身福利 520 单身福利

发布两小时,Github访问量破百万,阿里内部首次公布的 Java10W 字面经有多强?

Java 程序员 架构 面试

区块链技术在数字农业领域的应用挑战

CECBC

ArrayList vs LinkedList

ltc

ArrayList linkedlist

夺魁!亚马逊云科技荣膺中国数据管理解决方案领导者!

亚马逊云科技 (Amazon Web Services)

架构学习笔记:复杂度来源

风翱

5月日更 架构复杂度

产品思维

lenka

5月日更

5分钟速读之Rust权威指南(六)

wzx

rust

一款开源小工具,提升K8S资源管理幸福感!

Rancher

【偶尔一道ctf】xctf adword mobile easy-apk

Thrash

线程与线程池的那些事之线程篇

秦怀杂货店

Java 线程 多线程 进程 并发

高性能 JavaScriptの笔记(四)

空城机

JavaScript 大前端 5月日更

医疗数字化:区块链或成最强辅助

CECBC

医疗

英伟达入局AI大模型“战场”:发布两项全新大型语言模型,推动AI和数字生物的发展_语言 & 开发_李冬梅_InfoQ精选文章