【ArchSummit 】国内外100+顶尖专家齐聚 ,AI、云原生、数智化全面囊括! 了解详情
写点什么

斯坦福 15 张图揭示最新 AI 动态:开源风评又“被害”,谷歌、OpenAI 争当基础模型“劳模”

  • 2024-04-18
    北京
  • 本文字数:3020 字

    阅读完需:约 10 分钟

大小:1.54M时长:08:57
斯坦福15张图揭示最新 AI 动态:开源风评又“被害”,谷歌、OpenAI争当基础模型“劳模”

6 月 14 - 15 日 ArchSummit 全球架构师峰会·深圳,深度探索大模型时代软件架构最佳设计。

整理|华卫

 

“十年前,全世界最好的人工智能系统都无法以人类水平对图像中的物体进行分类。人工智能在语言理解方面困难重重,更无法破解数学领域。如今,人工智能系统在标准基准上的表现已广泛超过人类。”

 

今年,斯坦福 HAI 研究所的人工智能指数报告如期而至。据 AI Index 联合总监 Ray Perrault 介绍,2023 年人工智能领域进展迅猛,科技公司正在竞相构建相关产品,GPT-4、Gemini 和 Claude 3 等先进工具带来令人印象深刻的多模态功能,正越来越多地被公众使用;但当前的人工智能技术仍存在重大问题,如无法可靠处理事实、进行复杂推理以及结论解释。

 

在长达 393 页的《2024 人工智能指数报告》中,斯坦福 HAI 研究所不仅更广泛地涵盖基本趋势,如人工智能的技术进步、公众对技术的看法以及围绕其发展的地缘政治动态,还详细分析了比以往更多的原始数据。

 

其中,下面 15 张图表反映了整个 AI 领域 2023 年的状况和 2024 年的态势。

 

1. 生成式 AI 投资激增

 

虽然去年人工智能的私人投资下降、全球对人工智能的总体投资连续第二年下降,但生成式 AI 领域的私人投资激增,比 2022 年增长了近八倍,达到 252 亿美元。并且,大部分对生成式 AI 的私人投资都发生在美国。



报告的主编 Nestor Maslej 表示,“去年的资本形势代表了人们对生成式 AI 的反应,无论是在政策和公众舆论上,还是行业投资中。”

 

2. 谷歌在基础模型竞赛中占据主导地位

 

2023 年,工业界产生了 51 个著名的机器学习模型,而学术界仅贡献了 15 个。其中,谷歌在 发布的基础模型数量最多。



科技公司发布基础模型既是为了推动先进技术向前发展,也是为了给开发人员提供构建产品和服务的基础。自 2019 年以来,谷歌一直在发布基础模型方面处于领先地位,OpenAI 次之。

 

3. 封闭模型优于开源模型

 

目前,人工智能领域的热门争论之一是基础模型应该是开源的还是封闭的,一些人认为开源模型是危险的,而另一些人表示是开源模型推动了创新。该报告并没有对其进行权衡,而是着眼于各自的发布趋势和基准表现。

 

2023 年全球发布的新大型语言模型数量比上一年翻了一番,在发布的 149 个基础模型中,98 个是开源的,23 个通过 API 提供部分访问,28 个是封闭的。虽然三分之二是开源的,但性能最高的模型来自拥有封闭系统的行业参与者。在许多常用的基准测试中,封闭模型的表现优于开源模型。



4. 基础模型变得超级昂贵

 

培训一个大模型需要多深的财力?据报告显示,AI 模型训练成本随着时间的推移急剧增加,如今先进 AI 模型的训练成本已达到了前所未有的水平。其中,OpenAI 的 GPT-4 和谷歌的 Gemini Ultra 分别需要 7800 万美元和 1.91 亿美元的训练成本。



有趣的是,谷歌 2017 年发布的 Transformer 模型引入了支撑当今几乎所有大型语言模型的架构,其训练成本仅为 930 美元。

 

5. 大量释放碳足迹

 

训练 AI 模型对环境的影响不可忽视,虽然推理的每次查询排放可能相对较低,但当模型每天被查询数千次甚至数百万次时,总影响足以超过训练。

 

并且,由于模型规模、数据中心能源效率和能源电网的碳强度等因素,不同模型的碳排放数据差异很大。例如,Meta 的 Llama 2 70B 模型释放了约 291.2 吨碳,这几乎是一名旅客从纽约到旧金山往返航班上碳排放量的 291 倍,是普通美国人一年总碳排放量的 16 倍。然而,Llama 2 的碳排放量仍低于 OpenAI 的 GPT-3 训练期间释放的 502 吨。

 


6. 美国在基础模型方面处于领先地位

 

2023 年,全球大多数基础模型来自美国(109 个),其次是中国(20 个)和英国。自 2019 年以来,美国在发布的基础模型数量和被认为是重大技术进步的人工智能系统数量都处于领先地位。此外,报告指出,中国在授予的人工智能专利和工业机器人的安装中处于领先地位。



7.工业界的博士浓度更高

 

新晋的人工智能博士毕业后选择在哪里工作?据报告中强调,进入工业界的人工智能博士毕业生越来越多。2011 年,工业界(40.9%)和学术界(41.6%)的就业比例还大致相同。到 2022 年,毕业后选择加入工业界的比例就大得多,达到 70.7%。但在过去五年中,进入政府职位的人工智能博士毕业生比例一直相对较低,稳定在 0.7%左右。



8. 报考人员的多样性增加

 

与高等教育 CS 的趋势类似,AP CS 考生的种族多样性正在增加。虽然白人学生仍然是最大的群体,但随着时间的推移,亚裔、西班牙裔/拉丁裔/拉丁裔和黑人/非裔美国学生参加 AP CS 考试的人数有所增加。

 


9. 财报电话会议中的提及次数增加

 

在过去的一年里,在财富 500 强公司财报电话会议上提到人工智能的人数显著增加。2023 年,有 394 次财报电话会议提到了人工智能(占所有财富 500 强公司的近 80%),高于 2022 年的 266 次。自 2018 年以来,《财富》500 强财报电话会议中提及 AI 的次数几乎翻了一番。



而在所有财报电话会议中,最常被提及的主题是生成式 AI,占所有财报电话会议的 19.7%,其次是人工智能投资、人工智能能力扩展和人工智能增长计划(15.2%),最后是公司/品牌人工智能(7.6%)。

 

10. 成本下降,收入增加

 

报告表明,人工智能切实帮助企业提高了利润,有 42%的受访者表示他们看到了成本的降低,59%的受访者声称收入增加了,而这反映了工作效率的提高和工人生产力的提高。



此外,不同领域的多项研究表明,人工智能使工人能够更快地完成任务并产生更高质量的工作,但人工智能对低技能工人的帮助大于对高技能工人的帮助。还有一些研究警告说,在没有适当监督的情况下使用人工智能会导致性能下降。

 

11. 企业感知到风险

 

该报告对 1000 家收入至少为 5 亿美元的公司进行了一项全球调查,以了解企业如何看待负责任的 AI。结果显示,隐私和数据治理被认为是全球最大的风险,而公平性(通常以算法偏见为讨论)仍未在大多数公司中得到认可。目前,企业正在对其感知到的风险采取行动:各地区的大多数组织已经实施了至少一项负责任的人工智能措施来应对相关风险。



12. 人工智能并没有完全打败人类

 

近年来,人工智能系统在一系列任务上的表现都超过了人类,包括图像分类、视觉推理和英语理解方面的一些基准。然而,它在更复杂的任务上落后了,比如竞赛级的数学、视觉常识推理和规划。

 


13. 缺乏对人工智能的标准化评估

 

其最新研究表明,负责任的人工智能报告严重缺乏标准化。例如,OpenAI、Google 和 Anthropic 在内的领先开发人员主要根据不同的负责任的 AI 基准测试他们的模型,这种做法使系统地比较顶级人工智能模型的风险和局限性变得困难。

 


14. 法律既促进又限制人工智能

 

2016 年至 2023 年期间,有 33 个国家至少通过了一项与人工智能相关的法律,其中大部分行动发生在美国和欧洲。在此期间,总共通过了 148 项与人工智能相关的法案,归类为旨在增强一个国家人工智能能力的扩张性法律和限制人工智能应用和使用的限制性法律。虽然许多法案都在推动人工智能的发展,但限制性立法是全球趋势。

 


15.公众对人工智能更加焦虑

 

在 lpsos 的一项调查中,2023 年有 52%的人表示对人工智能产品和服务感到紧张,比 2022 年上升了 13 个百分点;现在有三分之二的人预计人工智能将在未来几年内深刻改变他们的日常生活。此外,报告指出,不同人群之间的观点存在显著差异,年轻人更倾向于对人工智能将如何改变他们的生活持乐观态度。

 


有趣的是,很多对于人工智能的悲观情绪来自西方发达国家。而印度尼西亚和泰国等地的受访者表示,他们预计人工智能的好处将大于其危害。

 

参考链接:

https://spectrum.ieee.org/ai-index-2024

https://hai.stanford.edu/research/ai-index-report

https://aiindex.stanford.edu/report/

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-04-18 10:415668

评论 1 条评论

发布
用户头像
你要不要看看你发的东西能不能正常显示

2024-04-25 09:25 · 北京
回复
没有更多了

ECMAScript 2023新增特性

数新网络官方账号

Mac软件推荐:ZBrush v2023.2.2中文激活版+可用补丁

mac大玩家j

数字雕刻软件 绘画工具 Mac软件推荐

多款国产服务器、操作系统与摩斯隐私计算完成兼容性互认

科技热闻

用友BIP重磅升级,发布新品:用友BIP|商业网络

用友BIP

2023全球商业创新大会

【专家观点】数智化组织模型大力驱动全球化

用友BIP

从头到尾说一次 Spring 事务管理(器) | 京东云技术团队

京东科技开发者

spring spring事务管理 事务管理 企业号 8 月 PK 榜

小灯塔系列-中小企业数字化转型系列研究——BI测评报告

向量智库

基于开源IM即时通讯框架MobileIMSDK:RainbowChat-iOS端v7.0版已发布

JackJiang

网络编程 即时通讯 即时通讯IM

MongoDB中国用户大会北京站及深圳站火热报名中

Geek_2d6073

昨晚做梦面试官问我三色标记算法

Java随想录

Java JVM

我的心血全在这了,这种方式讲@Async原理,你别再不懂Spring了

java易二三

Java spring 程序员 计算机

【腾讯云 TDSQL-C Serverless 产品体验】 使用 Python 向 TDSQL-C 添加读取数据 实现词云图

全栈若城

Python 腾讯云 Serverless 词云图 tdsql

科技新秀巅峰决战,百度商业AI技术创新大赛圆满收官

百度Geek说

人工智能 企业号 8 月 PK 榜

一文搞懂MySQL 数据库 MongoDB

java易二三

Java MySQL 数据库 程序员 计算机

优化重复冗余代码的8种方式

java易二三

Java 编程 程序员 计算机

千万级数据深分页查询SQL性能优化实践 | 京东云技术团队

京东科技开发者

MySQL 性能优化 sql 分页查询 企业号 8 月 PK 榜

蓝易云:python使用HTTP教程。

百度搜索:蓝易云

Python Linux HTTP requests urllib

使用秘籍|如何实现图数据库 NebulaGraph 的高效建模、快速导入、性能优化

NebulaGraph

图数据库 NebulaGraph

一次性搞清楚,Java并发编程在各主流框架中的应用,保证看懂

java易二三

Java spring 程序员 计算机

pycharm pro v2023.2最新中文+激活码安装

胖墩儿不胖y

代码编辑器 代码编辑 编辑代码 代码编辑工具

途牛科技与火山引擎数智平台合作 打造企业大数据系统“降本”新范式

字节跳动数据平台

大数据 云服务 企业号 8 月 PK 榜 数据支持

企业数字化转型,财务规划与分析(FP&A)团队应该如何应对

智达方通

数字化转型 智达方通EPM 财务规划与分析

GC面临的困境,JVM是如何解决跨代引用的?

Java随想录

Java JVM

龙蜥白皮书精选:云原生混部资源隔离技术

OpenAnolis小助手

开源 云原生 白皮书 内核 龙蜥社区

“产业应用创新奖2023”启动征集

飞桨PaddlePaddle

人工智能 百度飞桨 文心大模型

库存预占架构升级方案设计-交易库存中心 | 京东物流技术团队

京东科技开发者

架构设计 库存系统 架构升级 企业号 8 月 PK 榜

带你读论文丨S&P2019 HOLMES Real-time APT Detection

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 8 月 PK 榜

蓝易云:云服务器和专用服务器之间的区别?

百度搜索:蓝易云

云计算 服务器 云服务器 ECS 专用服务器

当小白遇到FullGC | 京东云技术团队

京东科技开发者

企业号 8 月 PK 榜 Full GC TP99

大规模块存储 EC 系统构建

Baidu AICLOUD

分布式存储 块存储 纠删码

阿里云大语言模型(LLM)实战训练营,火热开营中!

阿里云大数据AI技术

LLM模型

斯坦福15张图揭示最新 AI 动态:开源风评又“被害”,谷歌、OpenAI争当基础模型“劳模”_AI&大模型_华卫_InfoQ精选文章