2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

斯坦福 15 张图揭示最新 AI 动态:开源风评又“被害”,谷歌、OpenAI 争当基础模型“劳模”

  • 2024-04-18
    北京
  • 本文字数:3020 字

    阅读完需:约 10 分钟

大小:1.54M时长:08:57
斯坦福15张图揭示最新 AI 动态:开源风评又“被害”,谷歌、OpenAI争当基础模型“劳模”

整理|华卫

 

“十年前,全世界最好的人工智能系统都无法以人类水平对图像中的物体进行分类。人工智能在语言理解方面困难重重,更无法破解数学领域。如今,人工智能系统在标准基准上的表现已广泛超过人类。”

 

今年,斯坦福 HAI 研究所的人工智能指数报告如期而至。据 AI Index 联合总监 Ray Perrault 介绍,2023 年人工智能领域进展迅猛,科技公司正在竞相构建相关产品,GPT-4、Gemini 和 Claude 3 等先进工具带来令人印象深刻的多模态功能,正越来越多地被公众使用;但当前的人工智能技术仍存在重大问题,如无法可靠处理事实、进行复杂推理以及结论解释。

 

在长达 393 页的《2024 人工智能指数报告》中,斯坦福 HAI 研究所不仅更广泛地涵盖基本趋势,如人工智能的技术进步、公众对技术的看法以及围绕其发展的地缘政治动态,还详细分析了比以往更多的原始数据。

 

其中,下面 15 张图表反映了整个 AI 领域 2023 年的状况和 2024 年的态势。

 

1. 生成式 AI 投资激增

 

虽然去年人工智能的私人投资下降、全球对人工智能的总体投资连续第二年下降,但生成式 AI 领域的私人投资激增,比 2022 年增长了近八倍,达到 252 亿美元。并且,大部分对生成式 AI 的私人投资都发生在美国。



报告的主编 Nestor Maslej 表示,“去年的资本形势代表了人们对生成式 AI 的反应,无论是在政策和公众舆论上,还是行业投资中。”

 

2. 谷歌在基础模型竞赛中占据主导地位

 

2023 年,工业界产生了 51 个著名的机器学习模型,而学术界仅贡献了 15 个。其中,谷歌在 发布的基础模型数量最多。



科技公司发布基础模型既是为了推动先进技术向前发展,也是为了给开发人员提供构建产品和服务的基础。自 2019 年以来,谷歌一直在发布基础模型方面处于领先地位,OpenAI 次之。

 

3. 封闭模型优于开源模型

 

目前,人工智能领域的热门争论之一是基础模型应该是开源的还是封闭的,一些人认为开源模型是危险的,而另一些人表示是开源模型推动了创新。该报告并没有对其进行权衡,而是着眼于各自的发布趋势和基准表现。

 

2023 年全球发布的新大型语言模型数量比上一年翻了一番,在发布的 149 个基础模型中,98 个是开源的,23 个通过 API 提供部分访问,28 个是封闭的。虽然三分之二是开源的,但性能最高的模型来自拥有封闭系统的行业参与者。在许多常用的基准测试中,封闭模型的表现优于开源模型。



4. 基础模型变得超级昂贵

 

培训一个大模型需要多深的财力?据报告显示,AI 模型训练成本随着时间的推移急剧增加,如今先进 AI 模型的训练成本已达到了前所未有的水平。其中,OpenAI 的 GPT-4 和谷歌的 Gemini Ultra 分别需要 7800 万美元和 1.91 亿美元的训练成本。



有趣的是,谷歌 2017 年发布的 Transformer 模型引入了支撑当今几乎所有大型语言模型的架构,其训练成本仅为 930 美元。

 

5. 大量释放碳足迹

 

训练 AI 模型对环境的影响不可忽视,虽然推理的每次查询排放可能相对较低,但当模型每天被查询数千次甚至数百万次时,总影响足以超过训练。

 

并且,由于模型规模、数据中心能源效率和能源电网的碳强度等因素,不同模型的碳排放数据差异很大。例如,Meta 的 Llama 2 70B 模型释放了约 291.2 吨碳,这几乎是一名旅客从纽约到旧金山往返航班上碳排放量的 291 倍,是普通美国人一年总碳排放量的 16 倍。然而,Llama 2 的碳排放量仍低于 OpenAI 的 GPT-3 训练期间释放的 502 吨。

 


6. 美国在基础模型方面处于领先地位

 

2023 年,全球大多数基础模型来自美国(109 个),其次是中国(20 个)和英国。自 2019 年以来,美国在发布的基础模型数量和被认为是重大技术进步的人工智能系统数量都处于领先地位。此外,报告指出,中国在授予的人工智能专利和工业机器人的安装中处于领先地位。



7.工业界的博士浓度更高

 

新晋的人工智能博士毕业后选择在哪里工作?据报告中强调,进入工业界的人工智能博士毕业生越来越多。2011 年,工业界(40.9%)和学术界(41.6%)的就业比例还大致相同。到 2022 年,毕业后选择加入工业界的比例就大得多,达到 70.7%。但在过去五年中,进入政府职位的人工智能博士毕业生比例一直相对较低,稳定在 0.7%左右。



8. 报考人员的多样性增加

 

与高等教育 CS 的趋势类似,AP CS 考生的种族多样性正在增加。虽然白人学生仍然是最大的群体,但随着时间的推移,亚裔、西班牙裔/拉丁裔/拉丁裔和黑人/非裔美国学生参加 AP CS 考试的人数有所增加。

 


9. 财报电话会议中的提及次数增加

 

在过去的一年里,在财富 500 强公司财报电话会议上提到人工智能的人数显著增加。2023 年,有 394 次财报电话会议提到了人工智能(占所有财富 500 强公司的近 80%),高于 2022 年的 266 次。自 2018 年以来,《财富》500 强财报电话会议中提及 AI 的次数几乎翻了一番。



而在所有财报电话会议中,最常被提及的主题是生成式 AI,占所有财报电话会议的 19.7%,其次是人工智能投资、人工智能能力扩展和人工智能增长计划(15.2%),最后是公司/品牌人工智能(7.6%)。

 

10. 成本下降,收入增加

 

报告表明,人工智能切实帮助企业提高了利润,有 42%的受访者表示他们看到了成本的降低,59%的受访者声称收入增加了,而这反映了工作效率的提高和工人生产力的提高。



此外,不同领域的多项研究表明,人工智能使工人能够更快地完成任务并产生更高质量的工作,但人工智能对低技能工人的帮助大于对高技能工人的帮助。还有一些研究警告说,在没有适当监督的情况下使用人工智能会导致性能下降。

 

11. 企业感知到风险

 

该报告对 1000 家收入至少为 5 亿美元的公司进行了一项全球调查,以了解企业如何看待负责任的 AI。结果显示,隐私和数据治理被认为是全球最大的风险,而公平性(通常以算法偏见为讨论)仍未在大多数公司中得到认可。目前,企业正在对其感知到的风险采取行动:各地区的大多数组织已经实施了至少一项负责任的人工智能措施来应对相关风险。



12. 人工智能并没有完全打败人类

 

近年来,人工智能系统在一系列任务上的表现都超过了人类,包括图像分类、视觉推理和英语理解方面的一些基准。然而,它在更复杂的任务上落后了,比如竞赛级的数学、视觉常识推理和规划。

 


13. 缺乏对人工智能的标准化评估

 

其最新研究表明,负责任的人工智能报告严重缺乏标准化。例如,OpenAI、Google 和 Anthropic 在内的领先开发人员主要根据不同的负责任的 AI 基准测试他们的模型,这种做法使系统地比较顶级人工智能模型的风险和局限性变得困难。

 


14. 法律既促进又限制人工智能

 

2016 年至 2023 年期间,有 33 个国家至少通过了一项与人工智能相关的法律,其中大部分行动发生在美国和欧洲。在此期间,总共通过了 148 项与人工智能相关的法案,归类为旨在增强一个国家人工智能能力的扩张性法律和限制人工智能应用和使用的限制性法律。虽然许多法案都在推动人工智能的发展,但限制性立法是全球趋势。

 


15.公众对人工智能更加焦虑

 

在 lpsos 的一项调查中,2023 年有 52%的人表示对人工智能产品和服务感到紧张,比 2022 年上升了 13 个百分点;现在有三分之二的人预计人工智能将在未来几年内深刻改变他们的日常生活。此外,报告指出,不同人群之间的观点存在显著差异,年轻人更倾向于对人工智能将如何改变他们的生活持乐观态度。

 


有趣的是,很多对于人工智能的悲观情绪来自西方发达国家。而印度尼西亚和泰国等地的受访者表示,他们预计人工智能的好处将大于其危害。

 

参考链接:

https://spectrum.ieee.org/ai-index-2024

https://hai.stanford.edu/research/ai-index-report

https://aiindex.stanford.edu/report/

2024-04-18 10:416643

评论 1 条评论

发布
用户头像
你要不要看看你发的东西能不能正常显示

2024-04-25 09:25 · 北京
回复
没有更多了
发现更多内容

即时通讯技即时通讯技术文集(第8期):移动端弱网优化系列 [共14篇]

JackJiang

颜色的认识与使用(大屏颜色/仪表板报告设计)

Data 探险实验室

大屏配色 颜色 可视化颜色 配色搭配

BSN-DDC基础网络详解(三):注册门户账号和业务开通(2)

BSN研习社

BSN-DDC

2023年关于身份安全的4 个预测

HummerCloud

Serverless Kubernetes的思考与征程

阿里技术

Kubernetes Serverless

ChatGPT“狂飙”出圈,快来分享你眼中的ChatGPT吧!

InfoQ写作社区官方

热门活动 ChatGPT

中移链结合CA证书实现节点准入控制

BSN研习社

英方软件加入龙蜥社区,联手夯实数字基础设施坚实底座

OpenAnolis小助手

开源 数据复制 英方软件 龙蜥社区 CLA

云数据库 TiDB 入门级别的体验

TiDB 社区干货传送门

6.x 实践

Jmeter安装配置详细教程

Jmeter 性能测试 接口测试

Python基础知识入门(一)

漫步桔田

打造江西数智产业高地,百度飞桨人工智能产业赋能中心落户南昌青山湖

飞桨PaddlePaddle

飞桨 PaddlePaddle

Pycharm+PyQt5+Python3.5开发环境配置(详细教程)

Python pycharm 环境安装 PyQt PyQt5

春季3月 · CSPO认证周末班【提前报名特惠】“价值交付课程” | 全国招生

ShineScrum

产品经理 PO Product Owner 产品负责人 产品愿景

Flink CDC+Kafka 加速业务实时化

Apache Flink

大数据 flink 实时计算

爆肝!《Java权威面试指南(阿里版)》,冲击“金三银四”有望了

程序知音

Java java面试 java架构 后端技术 Java面试八股文

春季3月 · CSM认证周末班【提前报名特惠】“全球金牌课程”CST导师亲授

ShineScrum

ScrumMaster CSM

一文详解 Netty 组件

京东科技开发者

Java 架构 Netty nio 企业号 2 月 PK 榜

最佳实践|用腾讯云智能文字识别实现网约车信息管理

牵着蜗牛去散步

人工智能 腾讯云 腾讯 最佳实践 文字识别

互联网企业如何进行数字化转型?业务需求迭代频繁的应对之策!

优秀

数字化转型 互联网行业

DevEco Studio 3.1 Beta1版本发布——新增六大关键特性,开发更高效

HarmonyOS开发者

HarmonyOS

云数据库TiDB免费试用初体验

TiDB 社区干货传送门

社区活动 6.x 实践

“四维一体”,银行数据使用安全新姿势|盾见

极盾科技

数据安全

龙蜥开发者说:为爱发电!当一个龙蜥社区打包 Contributor 是怎样的体验?| 第16期

OpenAnolis小助手

Linux 开源 rpm 龙蜥社区 贡献

前端监控之性能与异常

京东科技开发者

监控 服务端 页面 企业号 2 月 PK 榜 js代码

EasyNLP集成K-Global Pointer算法,支持中文信息抽取

阿里云大数据AI技术

人工智能 深度学习 信息抽取 算法模型 企业号 2 月 PK 榜

手把手教你为基于Netty的IM生成自签名SSL/TLS证书

JackJiang

集度汽车 Flink on native k8s 的应用与实践

Apache Flink

大数据 flink 实时计算

测试角色在项目各阶段的项目管理tips

京东科技开发者

项目管理 测试 测试 单元测试 企业号 2 月 PK 榜

斯坦福15张图揭示最新 AI 动态:开源风评又“被害”,谷歌、OpenAI争当基础模型“劳模”_AI&大模型_华卫_InfoQ精选文章