阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

OpenAI 又赢麻了!谷歌 DeepMind 创始人刚称 Gemini 能碾压 GPT-4,OpenAI 的挖人大计就出炉了

  • 2023-06-29
    北京
  • 本文字数:3164 字

    阅读完需:约 10 分钟

OpenAI 又赢麻了!谷歌 DeepMind 创始人刚称 Gemini 能碾压 GPT-4,OpenAI 的挖人大计就出炉了

谷歌在上个月的开发者大会上公布了一系列 AI 新项目,当时首次亮相的 Gemini 曾受到不少嘲讽。但近日,DeepMind 联合创始人兼 CEO Demis Hassabis 自曝,工程师们正在使用 AlphaGo 的技术来开发 Gemini,其强大程度有望超越 OpenAI 的当家花旦 ChatGPT。

 

在 AlphaGo 的加持下,Gemini 瞬间备受关注。在 2016 年,谷歌 DeepMind 人工智能实验室打造的 AlphaGo 程序成功击败围棋世界冠军,写下了 AI 发展史上的一页新篇章。

 

仍在开发当中的 DeepMind Gemini 是一套专门处理文本的大语言模型,其本质与 ChatGPT 家族的 GPT-4 相似。根据此前的介绍,Gemini 一开始就以多模式、高效的工具和 API 集成为目标而创建,旨在支持未来的创新,例如内存和规划。经过微调和严格的安全测试后,Gemini 将提供各种尺寸和功能。

 

现在,Hassabis 表示,他的团队将 GPT 技术与 AlphaGo 的特性加以结合,希望赋予系统规划和解决问题的新能力。“从宏观来讲,大家可以把 Gemini 理解为结合了 AlphaGo 系统优势与大模型令人惊叹的语言能力。我们还做出了其他非常有趣的创新。”

 

之前谷歌开发者大会上,谷歌 CEO Sundar Pichai 也说道,“虽然还为时过早,但我们已经看到了之前型号中未曾见过的、令人印象深刻的多模式功能。”

 

DeepMind:下一代大模型碾压 GPT-4

 

要训练出 OpenAI GPT-4 这样的大语言模型,研究人员需要将书籍、网页和其他来源处的大量精选文本输入到 Transformer 机器学习软件当中。模型会利用训练数据中表现出的模式,熟练预测一段文本之后应该出现的一个个字母和单词。这种简单的文本预测机制在回答问题、生成自然语言/代码方面被证明拥有强大的潜力空间。

 

要进一步开发 ChatGPT 及类似功能的语言模型,DeepMind 认为还有另一个重要的附加步骤,就是使用基于人类对 AI 模型答案做出的反馈,进而借助强化学习提高其性能。DeepMind 在强化学习方面的丰富经验,也许能让研究人员为 Gemini 赋予更多新颖能力。

 

AlphaGo 基于 DeepMind 首创的强化学习技术。这项技术要求 AI 模型在问题之上反复尝试并接收关于性能的反馈,据此设计接下来将要采取的行动(例如围棋或电子游戏),从而让软件一步步学会解决棘手问题。它还采用所谓“树搜索”方法,以探索并记住棋盘上可能采取的各种动作。如果这一思路能够帮助语言模型迎来下一次重大飞跃,则新 AI 或能在互联网和计算机上执行更多种类的任务。

 

Hassabis 和他的团队也许还会利用 AI 领域的其他思路继续增强大语言模型。DeepMind 研究人员的关注领域涵盖机器人、神经科学等诸多方向。本周早些时候,该公司展示了一种算法,能够学习借助不同类型的机械手臂完成操作任务。

 

人们普遍认为,跟人类和其他动物一样,AI 的能力提升也需要从现实世界中学习客观经验。一部分 AI 专家相信,语言模型的最大限制就是只能通过文本以间接方式了解世界。

 

Hassabis 坦言,Gemini 目前仍在开发当中,且整个过程需要几个月时间,成本则在数千万到数亿美元之间。OpenAI 公司 CEO Sam Altman 曾有 4 月表示,GPT-4 的开发成本超过了 1 亿美元。

 

Hassabis 的任务就是加快谷歌的 AI 开发进度,同时管理种种未知的潜在风险。最近一段时间,语言模型的快速进步已经令 AI 专家(包括部分算法专家)感到担忧,害怕这项技术被恶意滥用或者变得难以控制。某些内部技术人士甚至呼吁暂停开发更强大的算法,避免匆忙之中造成重大威胁。

 

Hassabis 认为,AI 技术的确拥有巨大的潜在助益,例如在健康或气候等领域推动科学发现,所以人类探索 AI 的脚步绝不能停止。但他也强调,强制叫停研究明显脱离实际,基本没有可行性。“只要处置得当,AI 将成为有史以来对人类最有益的技术成果。我们必须有勇气去追求这样的关键成果。”

 

这也不是说 Hassabis 在一味强调快速开发 AI 技术。DeepMind 早在 ChatGPT 出现之前,就一直在探索 AI 可能带来的各种风险。该公司联合创始人之一 Shane Legg 多年来一直领导一支内部“AI 安全”小组。Hassabis 上个月与其他备受瞩目的 AI 领袖一道签署了一份声明,警告称 AI 也许有一天会引发与核战争或全球流行病相当的严峻风险。

 

Hassabis 强调,目前最大的挑战之一就是确定更强的 AI 具体会带来哪些风险。他解释道,“我认为 AI 领域需要在评估测试等方面开展更多研究——这已经是一项非常紧迫的任务”,用以确定新 AI 模型的能力和可控性。为此,DeepMind 可能会逐步向外部科学家开放自己的系统。“希望学术界能够尽早接触到这些前沿模型。”如果此观点得到落实,也许有助于解决科技巨头以外的 AI 专家被排除在最新研究之外的担忧。

 

那我们究竟要不要为 AI 大爆发这样一个未来而担忧?Hassabis 安慰道,其实没人真能确定 AI 会不会成为一种重大威胁。但他相信,如果 AI 研究继续以目前的速度推进,那业界确实没什么时间制定相应的保障措施。“我能切身观察到我们在构建 Gemini 时的一步步进展,相信这些成果都将发挥预期当中的作用。”

 

OpenAI:入驻 DeepMind 大本营

 

自从 ChatGPT 去年惊艳亮相以来,谷歌很快推出了自己的聊天机器人 Bard,并将生成式 AI 技术应用至搜索引擎及其他众多产品当中。为了增强 AI 研究力度,谷歌公司还于 4 月将 Hassabis 领导的 DeepMind 部门与谷歌另一 AI 实验室 Brain 合并,建立起一个新的谷歌 DeepMind。Hassabis 表示,新团队将汇聚双方最近一段时间为奠定 AI 基础所积蓄的强大力量。“纵观我们在 AI 领域的进展,就会发现 80%到 90%的成果都来自这两支队伍。过去十年间,双方也都取得过辉煌的成就。”

 

Hassabis 本人曾经凭借 AlphaGo 掀起过一波 AI 热潮。所以面对如今这轮技术巨头争相投入的 AI 淘金之风,他显得颇有经验。但另一方面,其竞争对手 OpenAI 的扩张脚步也在继续。

 

几乎在同一时间,OpenAI 宣布,将在伦敦开设其第一个国际办事处。OpenAI 首席执行官 Sam Altman 表示,当 OpenAI 伦敦办事处将专注于提升“研究和工程能力”,同时平衡与“当地社区和政策制定者”的合作。

 

值得注意的是,伦敦是谷歌最大的人工智能研究部门 DeepMind 的长期总部基地。鉴于伦敦拥有著名的大学和丰富的学术历史,伦敦也是数据科学人才的源泉。OpenAI 这次海外扩张,将与谷歌在同一个城市近距离竞技。

 

自 2015 年成立以来,OpenAI 一直没有扩展到旧金山总部以外的地方。Altman 在一份声明中表示,这次扩张是一次吸引世界级人才的机会。据报道,Altman 也提出将波兰和法国作为该办事处的替代选择。其中,法国也被视为人工智能领域的领导者,谷歌Meta 都在巴黎设立了人工智能实验室

 

此时,正值 OpenAI 致力于创造利润之际。运行人工智能基础设施并不便宜,半导体研究公司 Semianalysis 层估计OpenAI 每天的成本约为 700,000 美元。考虑到这一点,英国的企业税比美国和其他欧洲国家低。

 

广义上讲,伦敦也正在成为人工智能初创企业蓬勃发展的中心。根据最近的一份报告,截至 2021 年,伦敦有超过 1,300 家人工智能公司,就风投资金而言,伦敦也是英国资金最多的城市。

 

对于 OpenAI 等大量投资人工智能的科技公司来说,伦敦也有很重要的政治地位,这些公司试图说服英国管理机构对人工智能进行宽松的监管。

 

在最近的一次游说之旅中,Altman 出现在伦敦大学学院,并呼吁“平衡”监管。Altman 威胁称,如果公司无法满足欧盟目前正准备出台的新人工智能(AI)立法规定,OpenAI 可能会“停止在欧盟的运营”。据悉,该法案是人工智能行业第一套综合法规之一。后来,Altman收回了这些评论。

 

有趣的是,DeepMind 创始人中的 Demis Hassabis 和 ShaneLegg 就是相识于伦敦大学学院生命科学系的盖茨比计算神经科学小组。

 

如今,OpenAI 在伦敦的办事处正在大量招聘,涉及各类研发、政策安全等岗位,是否会引发人才流动还未可知。但可以预见,OpenAI 与 谷歌 DeepMind 之间的竞争将会愈发激烈。

 

参考链接:

https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/

https://techcrunch.com/2023/06/28/openai-brings-the-competition-to-deepminds-doorstep-with-new-london-office/

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-06-29 14:167125

评论

发布
暂无评论
发现更多内容

话题讨论 | 2020年你有什么推荐的书

soolaugust

话题讨论

什么是工作流?工作流有什么作用?怎样配置工作流程?

Marilyn

敏捷开发 工作流

Seata是什么?一文了解其实现原理

vivo互联网技术

分布式 分布式事务 分布式架构

第十一周 安全稳定总结

蓝黑

极客大学架构师训练营

基于区块链技术落地应用开发-食品溯源

13828808769

《写给大忙人看的JAVA核心技术》.pdf

田维常

电子书

阿里巴巴内部秘密培养的“Java架构师养成计划”图谱曝光,全是干货!

Java架构追梦

Java 学习 架构 面试 阿里巴巴人才培养计划

源码深度解析 Handler 机制及应用

vivo互联网技术

android 客户端开发

话题讨论 | 作为开发你是如何阅读源码的?

程序员小航

话题讨论

花火交易所APP软件系统开发(现成)

系统开发

云计算领域-杨明越加入InfoQ协作平台

杨明越

第十一周 安全稳定作业

蓝黑

极客大学架构师训练营

线程上下文切换,这些是你需要掌握的

田维常

系统上下文

年薪百万offer从何入手?这份“通关面试手册”带你轻松碾压字节面试官

比伯

Java 编程 架构 面试 计算机

话题讨论 | 程序员摸鱼的时候都喜欢干些什么

soolaugust

话题讨论

手撸一个在线css三角形生成器

徐小夕

CSS css3 大前端 CSS小技巧

架构师训练营第 1 期第 11 周总结

owl

极客大学架构师训练营

App自动化《元素定位方式、元素操作、混合应用、分层设计、代码方式执行Pytest 命令》

清菡软件测试

App

架构师训练营第 1 期第 11 周作业

owl

极客大学架构师训练营

智慧公安情报指挥合成作战管控平台开发

t13823115967

智慧公安情报研判系统开发 智慧公安 合成作战管控平台

阿里云Lindorm与Intel、OSIsoft共建IT & OT超融合工业数据云

许力

数据库 大数据 IoT 工业互联网 工业物联网

教你用Python自制拼图小游戏,轻松搞定熊孩子

华为云开发者联盟

Python 游戏 拼图

数据资产管理平台规划概要

马踏飞机747

大数据 数据治理 数据资产

话题讨论 | go、php 、java、python、cpp谁才能成为后端的主流

sinsy

Java c++ php 话题讨论 Go 语言

探秘密码学:深入了解对称加密与密钥协商技术

京东科技开发者

网络安全 密码学

话题讨论 | 深入浅出Linux内存管理,图解物理内存和虚拟内存

程序员柠檬

话题讨论

第七周总结

小兵

突破容量极限:TiDB 的海量数据“无感扩容”秘籍

京东科技开发者

分布式数据库 #TiDB

我是程序员,我用这种方式铭记历史

kokohuang

Hexo GitHub Pages python 爬虫 中国历史 铭记历史

低成本快速上链 智臻链开放联盟网络正式对外开放

京东科技开发者

区块链 京东

公安情报研判管控分析平台建设解决方案

t13823115967

智慧公安情报研判系统开发 智慧公安 情报研判管控分析平台

OpenAI 又赢麻了!谷歌 DeepMind 创始人刚称 Gemini 能碾压 GPT-4,OpenAI 的挖人大计就出炉了_Google_褚杏娟_InfoQ精选文章