亮网络解锁器,解锁网络数据的无限可能 了解详情
写点什么

Gemini 演示视频“翻车”后,谷歌接连放大招:向云客户免费提供 Gemini Pro,还推出 AI 代码辅助工具,集成 25 家公司数据集

  • 2023-12-14
    北京
  • 本文字数:3055 字

    阅读完需:约 10 分钟

大小:1.43M时长:08:21
Gemini演示视频“翻车”后,谷歌接连放大招:向云客户免费提供Gemini Pro,还推出AI代码辅助工具,集成25家公司数据集

上周,谷歌公布了该公司有史以来体量最大、功能最强的 AI 模型 Gemini,这也是谷歌在推动 AI 实际落地过程中的重要一步。Gemini 模型共分为三个版本:Ultra 版、Pro 版与 Nano 版。谷歌已经开始在自家产品组合中引入 Gemini:从 Pixel 8 Pro 开始,Gemni Nano 将正式登陆 Android 系统;而经过专门微调的 Gemini Pro 则即将现身 Google Bard。

 

12 月 13 日,谷歌在其云平台上推出了一系列 AI 模型以供用户体验并实际应用:包括向开发者和企业开放 Gemini Pro、面向开发者和安全运营的 Duet AI、图像生成 Imagen 2 以及用于医疗保健场景的 MedLM。

谷歌正式开放 Gemini Pro

 

Gemini 属于完整的内容生成模型家族,据称采用了谷歌迄今为止最强大的大语言模型架构。在此之前,微软和包括谷歌在内的各家云服务及商业 IT 巨头纷纷在自家产品中引入所谓机器学习增强功能。而从目前的态势来看,这股潮流很可能会延续 2023 年全年,并在 2024 和 2025 年继续成为核心趋势。

 

Gemini 提供多种参数规模,其中 Nano 版最小、面向设备端工作负载;Pro 版居中;而体量最大的 Ultra 版则负责处理后端服务器上的高强度工作负载。

 

12 月 13 日,谷歌开始向开发者和企业开放 Gemini Pro,供其根据自有用例进行构建。据悉,谷歌将在未来几周到几个月内持续收集用户反馈,并据此对模型做进一步微调。明年初,在经过进一步微调、安全测试并收集来自合作伙伴的宝贵反馈之后,谷歌将正式推出 Gemini Ultra——这也是谷歌旗下体量最大、功能最强、可执行高度复杂任务的顶尖模型。谷歌还计划将 Gemini 引入更多开发者平台,包括 Chrome 和 Firebase。

 

关于 Gemini Pro 更多详细信息:

 

  • Gemini Pro 在各类研究性基准测试中的性能表现,优于其他同等体量的大语言模型。

  • 当前版本提供 32K 文本上下文窗口,后续版本的上下文窗口还将进一步扩大。

  • Gemini Pro 将在一定时段内提供免费使用,最终定价也将具有竞争力。

  • 它提供一系列功能:函数调用、嵌入、语义检索、自定义知识背景以及聊天功能等。

  • 它支持全球 180 多个国家和地区的 38 种语言。

  • 在当前版本中,Gemini Pro 接受文本作为输入,并可生成文本输出。谷歌此次还发布了专用的 Gemini Pro Vision 多模态端点,可接受文本和图像作为输入,并据此输出文本响应。

  • Gemini Pro 提供的 SDK 将帮助用户构建出可在任何地方运行的应用程序。Python、Android(Kotlin)、Node.js、Swift 和 JavaScript 均在支持之列。

 

Gemini Pro 的 SDK 可帮助用户构建出可在任何地方运行的应用程序

 

目前,Gemini Pro 的首个版本现可通过 Gemini API 进行访问:开发者可以使用此远程接口在 Gemini Pro 上构建自己的聊天机器人应用,还可以认真设计提示词并提交自有数据以对模型做出微调,再将其接入其他 API,借此在特定任务之上获得更好的处理能力与功能选项。如果希望在自己的应用程序中引入自然语言界面,Gemini Pro 应该会是个好选择,且使用体验与 OpenAI 的 ChatGPT 等同类产品基本一致。

Google AI Studio:速度最快的 Gemini 构建选项

 

谷歌还发布了一款基于 Web 的免费开发者工具——Google AI Studio,可帮助用户快速设计提示词,而后获取 API 密钥以用于应用程序开发。开发者可以使用谷歌账户登录 Google AI Studio 并享受免费配额,免费部分每分钟可接收 60 条请求,数量达到其他同类免费产品的 20 倍。准备就绪之后,只需单击“获取代码”即可将生成结果转移至指定的 IDE,也可以使用 Android Studio、Colab 或者 Project IDX 中提供的各种快速入门模板。为了帮助谷歌提高产品质量,在用户使用免费配额时,经过培训的审核人员可能会访问 API 及 Google AI Studio 上的输入和输出。谷歌表示,谷歌账户及 API 密钥中的身份信息均经过脱敏处理。

在 Google Cloud 使用 Vertex AI 进行构建

 

如果需要全托管 AI 平台,开发者也可以轻松从 Google AI Studio 转向 Vertex AI。后者允许通过全面的数据控制来自定义 Gemini,且充分享受 Google Cloud 提供的企业安全、隐私、数据治理与合规性保障。

 

借助 Vertex AI,同样可以访问 Gemini 模型,并能够:

 

  • 使用自有企业数据微调及蒸馏 Gemini,立足底层对模型进行增强,使其包含最新信息和扩展以获取实际功能。

  • 在低代码/无代码环境中构建 Gemini 支持的搜索和对话 agent,包括支持检索增强生成(RAG)、混合搜索、嵌入、对话 playbook 等。

  • 安心进行应用部署。谷歌不会利用 Google Cloud 上的客户输入或输出数据训练 Gemini 模型,相关数据与 IP 将始终归客户所有。

 

目前,开发者可以通过 Google AI Studio 免费访问 Gemini Pro 与 Gemini Pro Vision,每分钟最多支持 60 条请求,可以满足大部分应用开发需要。Vertex AI 计划于明年发布正式版本,在此之前开发者同样能以每分钟 60 条请求的方式访问 Gemini 基础模型。未来,Google AI Studio 与 Vertex AI 将以每 1000 字符/1 张图片为单位收取费用。


面向开发者和安全运营的 Duet AI

 

谷歌此次还正式公布了 Duet AI for Developers。这是一项聊天机器人服务,旨在提高程序员群体的工作效率。很明显,这就是目前常见的编程助手产品。根据谷歌的介绍,它能与各种 IDE 配合使用,并尝试在开发者输入过程中自动补全源代码、回答编码查询问题、帮助排除故障,并就如何使用 MongoDB、Crowdstrike 等第三方软件提供操作指导。

 

谷歌副总裁 Gabe Monroy 解释道,“例如,使用 MongoDB 编写代码的开发人员可以询问 Duet AI for Developers,“请按地理位置筛选过去 30 天内消费额超过 50 美元的客户订单,再计算各地区的总收入”。之后,Duet AI for Developers 就会使用 MongoDB 中的产品信息提供代码建议并完成任务。如此一来,开发人员的构建速度将得到显著提升。”

 

据悉,目前已经有超过 25 家供应商与谷歌合作,确保自家产品能够顺畅对接 Duet AI for Developers。

 

在未来几周内,负责为 Duet AI 服务提供支持的大语言模型也将全面升级为 Gemini。这项开发者服务计划免费开放至 2024 年 1 月 12 日。此外,Duet AI in Security Operations 这次也正式开放,这款聊天机器人将帮助处理基础设施保护、网络日志分析等查询任务。

图像生成 Imagen 2 模型与用于医疗保健场景的 MedLM 模型

 

本次,谷歌还更新了 Vertex AI 以引入 Imagen 2 模型。据介绍,这款文本到图像工具由 Google DeepMind 工程师开发而成,其最新版本已经能够生成极为逼真的图片并准确响应文本要求,大大降低了品牌宣传门槛。此外,Imagen 2 还能生成注释并回答与图像内容有关的问题。

 

社交应用 Snapchat、图形设计平台 Canva 以及图片库网站 Shutterstock 都在使用 Imagen。而且 Imagen 2 模型生成的所有图像都将包含人眼不可见的 SynthID 数字水印,可通过计算检测来判断该图像是否为 AI 合成。

 

此外,谷歌还推出了 MedLM,这是一个面向医疗保健用例的大语言模型家族。其中的两套模型均基于谷歌自家的 Med-PaLM 2 系列。其中较大、更强的模型专为较复杂的任务而设计,例如筛选学术论文及技术文档以提供潜在的新药研发线索;另一套模型则负责处理比较简单的杂务,例如总结医患对话和回应常见的医疗咨询问题。

 

MedLM 模型的早期采用者包括 HCA Healthcare 诊所、药物设计企业 BenchSci,以及埃森哲与德勤等。

 

谷歌表示,未来几周,MedLM 模型将正式入驻谷歌的开放 Model Garden,后续还将有更多基于 Gemini 的模型被纳入 MedLM 家族以提供更多功能。

 

参考链接:

https://blog.google/technology/ai/google-gemini-pro-imagen-duet-ai-update/

https://blog.google/technology/ai/gemini-api-developers-cloud/

https://www.theregister.com/2023/12/13/google_gemini_duet_ai/

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-12-14 14:006792

评论

发布
暂无评论

SQL ALTER TABLE 语句- 灵活修改表结构和数据类型

小万哥

MySQL 数据库 sql 程序员 后端开发

【Android】深入Binder拦截

iofomo

android 拦截器 binder

喜报!MIAOYUN入选成都高新区“瞪羚企业”

MIAOYUN

云计算 MIAOYUN 瞪羚企业 成都高新梯度培育企业 企业资质

金义中央大道通车│三思智慧综合杆&道路照明系统方案点亮23公里智慧公路

电子信息发烧客

论架构师的关注点:专业向下·业务向上

凌晞

企业架构 架构设计 业务架构

走心推荐!10款能让你的企业管理事半功倍的咨询软件。

彭宏豪95

科技 在线白板 咨询 在线协作 效率软件

IT外包的三种模式

Ogcloud

外包 IT 外包公司 外包项目 IT 运维

果然!低代码是程序员接私活的隐藏福利

伤感汤姆布利柏

程序员 低代码 接私活

Native Drawing开发指导,实现HarmonyOS基本图形和字体的绘制

HarmonyOS开发者

HarmonyOS

写作训练营打卡1--最喜欢的极客时间作者

Avril

跨界-我今年最难的一件事

学渣汪在央企打怪升级

wing一款轻量快捷的团队开发工具

iofomo

Python 跨平台 开发工具

英特尔李映:开源开放是软件生态开拓进取的原动力

E科讯

2023 Flink Forward Asia 参会指南来啦!

Apache Flink

大数据 flink

GPU在元宇宙中的作用—元宇宙云端解决方案

3DCAT实时渲染

元宇宙 实时渲染

Groovy StringBuilder类踩坑

FunTester

多邻国还是流利说

escray

技术人写作 21 天技术人写作行动营 21 天

我的2023年度关键词:迎接不一样的挑战,充实自我

智趣匠

#技术人的2023总结

ERP和MES的区别与联系,这篇接地气的文章终于讲明白了!

优秀

MES系统 mes ERP系统 mes和erp区别

AI文生视频或将为出海营销打开竞争新维度

新消费日报

Databend 如何利用 GPT-4 进行质量保证

Databend

深度|低代码开发平台和微服务架构的优势与挑战

codebee

DDD 低代码 微服务、

一文读懂AQS的前世今生

是月月啊2023

Java 面试题

JDK1.8 ConcurrentHashMap 核心源码(面试重点)

是月月啊2023

区块链软件开发:浏览区块链开发平台

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

耗时三年开源的H5商城,强烈推荐

越长大越悲伤

Java 开源 springboot

🎉开发者的福音:TinyVue 组件库文档大优化!类型更详细,描述更清晰!

Kagol

开源 Vue 前端 UI组件库

另一种学习 Linux kernel 的方式 —— UML

袁世超

UML Linux Kenel

亚马逊云科技 -- AIGC时代的数椐基础设施

追风少年

Amazon

使用 Kubernetes Agent Server 实现 GitOps

极狐GitLab

Kubernetes DevOps gitlab gitops workflow

[译]你需要知道的CSS属性isolation

南城FE

CSS 前端 布局

Gemini演示视频“翻车”后,谷歌接连放大招:向云客户免费提供Gemini Pro,还推出AI代码辅助工具,集成25家公司数据集_Google_凌敏_InfoQ精选文章